より実態に即したカタチで再度、体系化。
1年前の2013年11月~2014年1月にギックスのビックデータ分析体系を9回に渡る連載形式で紹介しました。その連載以降も、ギックスではより多くの業界に関わるさまざまな種類の分析業務を実施しており、広範囲にマーケティングに関するビッグデータ分析の知見を蓄積しています。その蓄積された知見をより汎用的に利用できるようということで、2014年10月のタイミングで、ギックスのビックデータ分析体系を見直しました。本日から、その更新されたギックスのビックデータ分析体系、すなわちギックスの【ビックデータ分析体系2.0】を紹介していきたいと思います。
1回目の本日は分析体系の更新で、変更されたポイントについて紹介します。
前回と今回のビックデータ分析体系の比較
まず1年前のギックスのビッグデータ分析体系の連載で紹介したビックデータ分析体系はこちらになります。
この旧分析体系を今回のギックスのビックデータ分析体系2.0では以下のように更新しました。
2つを比較してみていただけると一目瞭然ですが、更新版の分析体系では「実施する業務」として記載している業務の項目数を大きく増やしました。これは、今回の分析体系図ではマーケティングに関するデータ分析で”実施しうる業務” をできるだけ網羅的かつ具体的に記載するようにしたからです。今回の分析体系図は、弊社で実施している分析業務を棚卸しし、それを構造化して分析体制図の適切な位置にプロットするという手順を踏んで作成されています。
これまで実施した個別のマーケティングに関する分析で実施した業務を帰納的に集めたので、ここに記載した業務の全て実施する分析というものは存在しませんが、分析の目的やデータの状態に合わせて、この分析体系図の中から具体的な業務をいくつかピックアップして組み合わせると、大抵のマーケティング分析は実施できるという網羅性はあるかと思います。読者の皆様には、分析業務のプロセス設計時に作業内容の抜け漏れがないかのチェックリストとしてこの分析体系図を活用していただければと思います。
また、前回は「構想部分」を水色、「分析部分」を黄色という色分けしていたギックスの分析体系は、今回からは『DA領域(=データアーティスト領域)』、『DS領域(=データサイエンティスト領域)』という呼び方に変更して分析プロセスを色分けしました。データアーティストとデータサイエンティストの定義についてはコチラの記事を参照ください。
分析体系の更新にあたって考慮したことやこぼれ話をご紹介
今回の分析体系を更新するにあたって、上述したように、弊社の分析業務を棚卸しました。またそれと同時に、様々な文献にあたったり、専門家と議論することにより、改めて分析業務の統計的な意味合いや言葉の定義を再考しました。例えば、統計学と弊社特有の分析手法の2次属性付けの関係性、データマイニング型分析と仮説検証型分析の違い、各種数理モデリングの特徴などは十分に検討しました。この連載では、それらの分析体系の更新にあたって考慮したことの中から、皆様にお伝えし役立てていただきたい内容をピックアップして紹介していこうと考えております。
次回はデータマイニングの標準プロセスであるCRISP-DMとギックス分析プロセスの違いから、データマイニング型分析と仮説検証型分析の相違の考察を紹介したいと思います。