最強のビッグデータ戦略
3冊目は500ページ近くに及ぶ大作「最強のビッグデータ戦略」をご紹介します。
この本におけるビッグデータの定義
作中で、下記2つの文献を引用し、ビックデータの定義としています。(P.33)
- ガートナーのマーヴ・エイドリアン氏
「ビッグデータは、一般的に使われているハードウェア環境とソフトウェア・ツールでは、ユーザー層が許容できる時間内にキャプチャ、管理、処理できないデータ」 - マッキンゼーグローバルインスティテュート
「ビッグデータとは典型的なデータベースソフトウェアのキャプチャ、格納、管理、分析能力を超えるサイズを持つデータセットのことである」
要はデータ量が多いだけでなく、複雑性、多様性、格納が追いつかない程のデータ生成頻度を併せ持つということです。
加えて、テクノロジーやツールが日進月歩で進化する今日においては、今日のビッグデータが明日のビッグデータとは言えないともしています。
そう考えると、データ量がxxテラバイト、テキストデータや画像等の非構造化データが云々といった現在のビッグデータも数年後には私達の想像を超えるものまで内包しているかもしれませんね。
どんな時にこの本を活用するか
「ビッグデータを用いる際に何を準備すべきか」を知りたい時に私ならこの本を活用します。
もちろんビッグデータの説明や活用事例などは盛り込まれていますが、例えば、こんな人にオススメします。
- IT部署関連で「”ビッグデータ”ってよく聞くし、そろそろ抑えておくか」という人
インフラ、ADSといったデータの仕込み、モデル定義、アナリティクス、レポーティングといった項目をテクノロジー、プロセス、メソッドといった観点+これまでの経緯を踏まえながら出版当時の最新動向の紹介をしています。ITに知見がある方が読めば、テクノロジーとアナリティクスを紐づけて理解することができる構成になっています。 - 経営企画部などで「ビッグデータを活用した事業を展開することになったんだけど、まず何から考えるべきなんだろう」という人
必要な人材の定義、チーム構成、直面しがちな課題とその対処方法などが紹介されています。
他の書籍ではチームの立ち上げ方やどんなチーム構成で、どのようなマネージャーが必要かというところまでは言及されていないので興味深いですね。
アナリティクス分野で不足しているタレントを補うには、「高収入をちらつかせるだけでなく、彼らの仕事を尊重し、社会的にどんな影響を与えるかを伝えることが重要」という言われてもなかなか実行が難しいことも記されていますが、立ち上げをイメージするには十分な内容だと思います。
(ここまで書いてくれるなら、あとは予算感まで書いてくれれば完璧だったんだですが、さすがにそこまでは書いてません。)
この書籍で印象に残ったこと
アナリティクスは個ではなく、チームの力。というのがこの本のメッセージのひとつでもあります。
近頃よく耳にする「データサイエンティスト」という言葉を聞くと、どうしても個の力をイメージしてしまいますが、データサイエンティストでさえアナリティクスチームの一員でしかなく、優秀なマネージャーやメンバーがいて初めて成り立つとしています。確かに、事業の内容を考え、自社のデータが活用できるか判断し、適切な分析環境を構築し、分析をまわしながら、適切な打ち手を考え、繰り返し実行していく。これを一人でこなせるスーパーマンみたいな人ってなかなかいないですよね。
アナリティクスだけにスポットを当てるのではなく、その前後(事業内容の立案、打ち手の実行など)のことまで考えた組織設計が必要なんだと改めて実感させられました。