数千年分のデータをたった2年で作り出す時代
「有史時代」とは、文字が成立し、文献資料によって歴史事象を検証することが可能な時代を指すわけですが、それは人類がデータに触れてきた歴史なのかもしれません。15世紀に入り、ヨハネス・グーテンベルクが活版印刷を発明してから、ニュースや書籍などの「データ」の流通速度は劇的に高まり、同時にデータ量は飛躍的に増加していったのでしょう。
それにしても、近年のデータ量の増加はこれまでの歴史を振り返ってみてもさらに群を抜くものだと実感します。NIH(National Institute of Health)、NSF(National Science Foundation)によると、2003年、2004年の2年間に作成されたデータは有史以来に人類が作成してきたデータ量を超えたという調査結果があるそうです。
数千年にも渡って人類が作り出してきたデータ量を、その中身の質は一旦無視して量だけで計れば、現代の私達はたった2年程で作り出したことになります。また、そのデータ量の増加は留まることを知りません。
ブログやTwitter、Facebookなどのソーシャルメディアが台頭することによって個人それぞれが筆を取る時代になり、データ量は増加してきています。
こういった新たなデータも発生してきましたが、現在、企業を取り巻くデータとはどのようなものなのでしょうか。
3つの切り口でデータを分類する
企業を取り巻くデータはいくつかの切り口で見ていくことができます。
①定型データ、非定型データ
②社内のデータ、社外のデータ
③マスターデータ、トランザクションデータ
①定型データ、非定型データ
定型データは「構造化データ(Stractured data)」とも呼ばれています。名前の通り、構造化されたデータです。商品名、商品番号、商品カテゴリー、単価、数量など、データベースに登録されているレコードデータなどを指します。
一方の非定型データは「非構造化データ」とも呼ばれています。Wordなどで作成した文書ファイル、eメール、PowerPointで作成されたプレゼンテーションのファイル、PDFファイルなどがこれにあたります。また、画像、動画、音声なども非定型データです。
例えば、ある店舗のある商品の本日の売上を知りたいとします。構造データとして、店名、商品名、日付、数量、単価があれば、すぐに中身を解釈して結果を知ることができるでしょう。一方で、営業日報としてWordの文章でそれらが記載してあったとしても、中身を読んで解釈しないとわからないはずです。それらの、中身を見ないとわからないタイプのデータが非定型データとも考えられます。
②社内のデータ、社外のデータ
社内のデータか、社外のデータかはすぐに判別がつくでしょうあ。おもな社外データとしては、マーケットりさーーちのデータや経済データ、政府や自治体が所有するデータなどがあります。また、最近では、TwitterやFacebookなどのソーシャルメディアも社外データになります。
先の非定型データで少し見てみましょう。
例えば、ある消費者が商品に不満を持ち、クレームを言っていたとしてます。これがおk-ルセンターに問い合わせて来たクレーム情報であれば、社内データとして、音声もしくはテキストに変換して蓄積することが可能になります。
eメールへのクレーム、自社Webサイトへの問い合わせ欄に記載された内容なども同様に社内に蓄積することが可能です。
また、セールスパーソンが顧客から直接クレームを受けても、きちんと営業日報に記載されれば社内データとして蓄積されます。
これらは活用する際には、すぐに取り出し難いデータではありますが、それでも社内に蓄積されている社内データです。
一方でクレームがブログやTwitterなどに書かれた場合は、通常は企業側がそれらのデータをすぐには自社に取り込むことができません。
近年ではそれらを安易に取り込むツールもできてきましたので、データを収集することは可能ですが、それらは社外データという位置づけになります。
③マスターデータ、トランザクションデータ
最後にマスターデータとトランザクションデータです。
企業で取り扱われる定型データは、マスターデータとトランザクションデータに区分することができます。
マスターデータは企業が社内向けや業務向けなどで構築する情報システムで、製品や顧客や会計など多くのデータベースで共通の、基本的な情報となる固定的なデータです。その代表的なものが、「商品マスタ」「顧客マスタ」「社員マスタ」などのデータです。
例えば、「商品マスタ」であれば、自社で販売している1つひとつの商品の名称や製品番号、スペック、価格などの基本的な情報がまとまめられています。
一方でトランザクションデータは伝票だと考えればよいでしょう。何かの取引が発生するたびに、次々更新されていくデータになります。例えば商取引においては、取引明細の中身だと思ってください。取引の顧客、年月日、商品、価格、数量、店名などが記載されていきます。
誰が、いつ、何を、いくらで、何個、どこで買ったのか、などがデータとして記載されたものがトランザクションデータになります。
ビッグデータの定義に関してより詳細にお知りになりたい場合はこちらを
会社を強くする ビッグデータ活用入門 基本知識から分析の実践まで
連載:ビッグデータ活用入門のエッセンスをご紹介 エントリー一覧
- ビッグデータ活用のケイパビリティ
- データサイエンティストのスキル
- データアーティストのスキル
- 企業を取り巻くさまざまなデータ ※本記事※
- ビッグデータとは
- ギックスの考えるビッグデータとは
- 競争力強化にビッグデータを織り込む
- 大きなPDS/小さなPD(CA)∞サイクルを回す
- ビッグデータ活用が普及するわけ
- ビッグデータ活用事例(1/12)流行予測
- ビッグデータ活用事例(2/12)価格予測
- ビッグデータ活用事例(3/12)情報共有による効率化
- ビッグデータ活用事例(4/12)商品開発
- ビッグデータ活用事例(5/12)経営管理領域
- ビッグデータ活用事例(6/12)インフラストラクチャ領域
- ビッグデータ活用事例(7/12)R&D領域
- ビッグデータ活用事例(8/12)製造・物流領域
- ビッグデータ活用事例(9/12)マーケティング・販売領域(認知系)
- ビッグデータ活用事例(10/12)マーケティング・販売領域(初回購買系)
- ビッグデータ活用事例(11/12)マーケティング・販売領域(再購買系)
- ビッグデータ活用事例(12/12)アフターサービス