もう一歩踏み込みたい方は「モデリング」を学ぼう|ギックスのビッグデータ分析体系 ⑥

  • f
  • t
  • p
  • h
  • l
eyecatch_bigdataanalysis

分析の花形のモデリング

前回の第5回までで、「ビジネスの理解」「データの準備・理解」「2次属性の作成」「セグメントの特徴把握」というビックデータ分析を試みる際に、まず実施すべき一連の流れをご紹介しました。ここまでのプロセスは数学的にみると加減乗除だけで実施できる当たり前のプロセスです。しかしこのプロセスを企画部の皆様がトランザクションデータを手元に置いて企画部が実施できるということが昨今のテクノロジーの進歩の恩恵だと考えており、これでけでも有益な示唆がでることが多いので、ぜひトライしてみていただきたいと思っております。そこはギックスの分析体系をお話するにあたって何度も強調したいポイントになります。

一方で、本日ご紹介するモデリングは、昨今のはやりの統計的手法や、アルゴリズムなどを駆使して、人間ではなかなか気づかないような関係性を、データの中から発掘していこうという取り組みです。過去の莫大なデータの中から特定のパターンを見つけて学習し、将来の予測につなげようというような取組もここには含まれます。ギックスの分析体系の図では以下の赤枠の部分に相当します。

 

本日はマーケティング分野で使われるモデリングという取り組みのうち、①マーケットバスケット分析、②ロジスティック回帰式によるスコアリング、③ニューラルネットワークによる判別の3つのテーマについて簡単に紹介するようにします。

今回の連載はギックスの分析体系をお伝えするのが目的なので、各手法について、どういう狙いでどういう手法で分析するかという概念だけをお伝えします。ただこのように短い文章で概念だけお伝えしても、分析でこれらの手法にかかわった人にしか内容は理解しにくいかと思います。今後別連載で各々の手法を事例を交えて説明していくことを考えていますので、各手法の詳細な中身をそちらをお待ちください。本日は大体どういうものかという概念を理解いただければと思います。

①    マーケットバスケット分析

POSデータやトランザクションデータを利用して、「一緒に買われる商品」の組み合わせを発見する探索的データ分析で、商品の関係性(=相関)が強いものを選択する「アソシエーションルール」を発掘していくものです。ある商品Aを買った人は、商品Bも買っていますというアマゾンや楽天でのおススメメッセージを見られた方も多いと思いますが、その元にある分析がマーケットバスケット分析です。商品数が多いと莫大な計算量が発生するので、効率的に分析するための手法としてアプリオリアルゴリズムなどが開発されています。

関連記事→POSデータでマーケットバスケット分析の実践 with R | 第1回 マーケットバスケット分析とは?

②    スコアリング

スコアリングとは、個々の見込み顧客が持つ、自社への価値を予測し、その価値に準じて点数化することです。歴史的に適用分野を見ると、医学分野⇒金融分野ときて、近年マーケティング領域でも利用が進んできています。マーケテイング領域での定石的な使い方としては、スコアリングの高いものから順番に並べ、基準となるコア以上の人にDMやEmailなどで働きかけを行います。スコアリングの統計モデルは線形判別分析とロジスティック回帰分析の2種類が主流でですが、ロジスティック回帰のほうが、分析結果を確率で表現できるため、主流となってきています。(判別式は確率ではなく2値での表現)

③    ニューラルネットワーク

ニューラルネットワーク は一種の統計モデルであり,非線形な多項ロジスティックモデルと考えてもよいと言われています。目的が過去のデータを「学習」して、「予測」することにあるという点が大きな特徴になります。一般的にロジスティック回帰分析、判別分析と比較して、交互作用を考慮している分、判別率が高くなるのが利点ですが、学習されたモデルの中身がブラックボックス(人間では理解できないもの)になっているので、モデルを適用する際の説明ロジックが難しくなるという特徴があります。

 

  1. PC上で数千万件データを手軽に扱える時代がやってきた
  2. CRISP-DMをマーケティング領域へ適用させる
  3. ビジネスへのインパクトを「常に」念頭に置こう
  4. 2次属性を理解しよう
  5. クロス集計で「セグメント間の違い」を見出せ
  6. もう一歩踏み込みたい方は「モデリング」を学ぼう(今回)
  7. 大規模投資の前のトライ&エラーが重要
  8. Quick Startのための分析ツールとは
  9. Quick Startのための分析インフラとは

 

  • f
  • t
  • p
  • h
  • l