ビッグデータの4タイプ
「ビッグデータ」とは何者かを考えていきましょう。世の中の「ビッグデータ」という言葉の使われ方から、その定義は大きく4つに分けられることがわかります。
1.単純にデータ量が大きいと述べているもの
2.データの種類を述べているもの
3.データの特徴を述べているもの
4.ビッグデータを使った分析全般の取り組みを概念としてビッグデータと呼んでいるもの
ひとつずつ見ていきましょう。
1. 単純にデータ量が大きいと述べているもの
既存の概念を超えるような膨大なデータをビッグデータと呼んでいるケースです。
例えば、アメリカの調査会社であるガートナーのマーヴ・エイドリアン氏によれば、ビッグデータは、「一般的に使われているハードウェア環境とソフトウェア・ツールでは、ユーザー層が許容できる時間内にキャプチャ、管理処理できないデータ」であり、マッキンゼーグローバルインスティテュートでは、「ビッグデータとは典型的なデータベースソフトウェアのキャプチャ、格納、管理、分析能力を超えるサイズを持つデータセットのことである」と見解を示しています。
2. データの種類を述べているもの
一方、近年ではアナリティクス(分析)やビッグデータに力を入れている アクセンチュアではデータの種類という観点でビッグデータの説明しています。
(1)内部データと言われる企業が自社で保有するデータ
①「マスターデータ」と「トランザクションデータ」を組み合わせたもの
顧客情報や製品情報や販売店の情報などがこれに当たります。
②「チャネル・インタラクションデータ」
オンラインやコールセンターへの顧客対話・問い合わせなど、顧客とのインターフェースやチャネルを介して連携されるデータなど。 また、M2Mセンサーデータ、スマートメーターなどから得られる予測監視系情報など。
(2)外部データと言われる企業外で発生するデータ
③「ソーシャルデータ」
ソーシャルメディアへの書き込み、モバイルやGPSの顧客行動情報など。
④「マクロ経済・公的データ」
マクロ経済データや政府や自治体が所有するデータなど。
3. データの特徴を述べているもの
私が2011~2012年にIBMに所属していた時代は「ビッグデータって何ですか?」と問われたら、「でかくて、早くて、ややこしいデータです。」と答えていました。
現在は4Vですが、実質的に意味のあるVolume(容量)、Variety(種類)、Velocity(頻度・スピード)を分かりやすく「でかくて、早くて、ややこしいデータ」と説明していたわけです。
IBMの説明によると、2.5EB(エクサバイト)もの大量データが日々生成されており、現代に存在するデータの90%はこの2年以内に生成されたとしています。
そのビッグデータに関しては4つの特徴を説明しています。
(1)容量 (Volume)
ビッグデータの特長はその容量の巨大さです。企業内外にはデータが溢れており、数テラバイトから数ペタバイトにも及びます。
(2)種類 (Variety)
ビッグデータは企業システムで通常扱っているような構造化データであるとは限りません。テキスト、音声、ビデオ、クリックストリーム、ログファイル等のさまざまな種類の非構造化データも存在し、これらのデータをビジネスに活用する動きが世界中で広がってきています。
(3)頻度・スピード(Velocity)
今この瞬間にも、ものすごい頻度でICタグやセンサーからデータが生成されています。昨今の変化の著しい市場環境では、これらのデータによりリアルタイムに対応することが求められてきています。
(4)正確さ(Veracity)
データの矛盾、あいまいさによる不確実性、近似値を積み重ねた不正確さなどを排除して、本当に信頼できるデータによる意思決定が重要です。
4. ビッグデータを使った分析全般の取り組みを概念としてビッグデータと呼んでいるもの
最後は少し概念論として説明しているものになります。
「ビッグデータの正体」(講談社)の著者であるビクター・マイヤー・=ショーンベルガー氏やケネス・クキエ氏は、ビッグデータからもたらされる効能に焦点を当てて説明しています。
「ビッグデータとは、小規模ではなしえないことを大きな規模で実行し、新たな知の創出や価値の創出によって、市場、組織、さらには市民と行政の関係などを変えること。」
また、「ビッグデータの衝撃」(東洋経済新報社)の著者城田真琴氏は、データの特徴と共に、それらを活用していく事を含めて包含的にビッグデータと定義しています。
「ビッグデータとは、3V(Volume/Variety/Velocity)の面で管理が困難なデータ、および、それらを蓄積・処理・分析するための技術、さらにそれらのデータを分析し、有用な意味や洞察を引き出せる人材や組織を含む包括的な概念である。」
最近経営者の方々から「我が社もビッグデータをやっていこう」という言葉が聞かれます。この「ビッグデータをやっていこう」には、これに近い意味合いが含まれているのではないでしょうか。
ビッグデータとは、通常ではハンドリングできない程の大量データであるとも考えられ、また通称ビッグデータと言われている物は4つのデータの種類があり、またそのビッグデータには4つの特徴があり、そしてそれらを活用して行く取り組み自体を包含して述べている、ということになります。
以上の4つをまとめると下記の図1のようになります。
図1:世の中のビッグデータの定義
ビッグデータの定義に関してより詳細にお知りになりたい場合はこちらを
会社を強くする ビッグデータ活用入門 基本知識から分析の実践まで
連載:ビッグデータ活用入門のエッセンスをご紹介 エントリー一覧
- ビッグデータ活用のケイパビリティ
- データサイエンティストのスキル
- データアーティストのスキル
- 企業を取り巻くさまざまなデータ
- ビッグデータとは ※本記事※
- ギックスの考えるビッグデータとは
- 競争力強化にビッグデータを織り込む
- 大きなPDS/小さなPD(CA)∞サイクルを回す
- ビッグデータ活用が普及するわけ
- ビッグデータ活用事例(1/12)流行予測
- ビッグデータ活用事例(2/12)価格予測
- ビッグデータ活用事例(3/12)情報共有による効率化
- ビッグデータ活用事例(4/12)商品開発
- ビッグデータ活用事例(5/12)経営管理領域
- ビッグデータ活用事例(6/12)インフラストラクチャ領域
- ビッグデータ活用事例(7/12)R&D領域
- ビッグデータ活用事例(8/12)製造・物流領域
- ビッグデータ活用事例(9/12)マーケティング・販売領域(認知系)
- ビッグデータ活用事例(10/12)マーケティング・販売領域(初回購買系)
- ビッグデータ活用事例(11/12)マーケティング・販売領域(再購買系)
- ビッグデータ活用事例(12/12)アフターサービス