メディア掲載のお知らせ:『会社を強くする ビッグデータ活用入門』がflierに掲載されました

  • f
  • t
  • p
  • h
  • l
eyecatch_news

書籍要約サービス「flier」に、ギックスの著書が紹介されました

弊社代表取締役CEO網野知博による『会社を強くする ビッグデータ活用入門 基本知識から分析の実践まで』がFlierに掲載されました。(※flierについてはコチラ

flierでの掲載内容を以下に、ご紹介します。また、本記事最下段より、当記事のPDFもダウンロード可能ですので、”flierのサンプル”としてご覧いただければと思います。 ※flier様より掲載許可を頂いております※

推奨ポイント

今やブームともいえるビッグデータ活用。(著者の網野氏は否定しているが)「データサイエンティストは 21 世紀で最もセクシーな職業」とまで言われるだけあって、ものすごいことが起こっているような気もするが、一体どんな変化が起こっているのか、漠然としたイメージに留まっている方も多いだろう。

そのような方々に本書は根本的な問いを投げかける。

そもそも「ビッグかリトルかというのは本来、どらでも良いのでは?」

というものだ。確かに以前からデータ分析や統計解析という分野は存在していたし、これまでとは全く異なる変化が起きているというわけではない。コンピューター科学の進化に伴って、記憶容量・処理速度・通信速度が格段に改善したことにより、扱えるデータの対象やボリュームが増えた、ということに過ぎない。

例えばFacebook の投稿や Twitter のつぶやきという非構造化データ、リアルタイムで収集されるセンサーからのデータ、膨大な購買・顧客属性データを根拠としたリコメンデーションなどは、近年になって急拡大しているデータの一例だ。

本書によれば、こうしたデータを分析する手法の多くは、過去にも考えられていた切りでの分析の延長上にすぎない。であるならば、ビッグデータという想像上の化け物に怯えるのではなく、自らが主体者としてビッグデータを活用しようではないか。そしてそのためには、統計学的な専門性以上にビジネスセンスそのものが必要になってくる。本書は、世のビジネスパーソンにとって、ビッグデータ分析に向かう勇気が得られる良書である(大賀)

重要ポイント

  • ビジネス的な効果の高いビッグデータ活用を志向 するならば、「儲け話のメカニズム」や「キードライバー」をあらかじめ、まとめておくことが肝要である。
  • ビッグデータと呼ばれるものは下記4つの特徴が ある。
  1. 容量:数テラバイト~数ペタバイトと巨大である
  2. 種類:通常の構造化データ以外のテキスト音声、ビデオなどを含む
  3. 頻度・スピード:リアルタイムで生成されるデータに対応している
  4. 正確さ:データの矛盾や不確実性を排除した信頼できるデータ
  • データ分析のためのツール選定時には下記3つの ポイントを押さえるべきである

1.事業企画部署で投資できる安価なツール(減価償却費にならないSaaSなど)
2.事業企画部署でも活用できる簡易なツール
3.試行錯誤ができるサクサク動くツール

ハイライト

ビッグデータ活用の為の基礎知識

ビッグデータとリトルデータのエピソード

本書はまず、著者である網野氏が携わったビッグデータ活用プロジェクト事例の面白いエピ ソードから幕を開ける。

ビッグデータを活用したあるプロジェクトで、ビッグなボリュームのデータではなく、リトルなデータで事業の高度化に有効な活用方法が創出された。

これは投資額も抑えられ効果も得られる、ビジネス的に捉えれば「めでたしめでたし」となるハッピーエンドに違いない。

しかし、そのプロジェクトのクライアント側担当者は、 「情報システム担当役員(CIO)からはビッグデータ活用のプロジェクトを行えと言われた。そ れなのに、ビッグデータと言えない程度のデータでは上司に説明がつかない」と言うのだ。つまり、その担当者が求めているのは、 「ビッグなデータを 活用した美談や自慢話」 であり、本来求められるはずの「経営上の効果」ではないのである。

この事例を読み、私はいかにもコンサルティングの現場でありがちな、担当者の経営的視点の欠如であると感じた。このケースではクライアント内部での政治的な事情がそう言わせているのであろう。ビッグデータ活用は手段であるべきなのに、目的になってしまっている現状をよく表している。

ビッグデータはどのように活用すべきなのか。本書にはその活用例や方法がふんだんに盛り込まれている。 

企業を取り巻くデータ

企業を取り巻くデータは3つの切り口で整理することができる。

①定型データ、非定型データ、非提携データ:
定型データは「構造化データ」とも呼ばれ、商品名、商品、番号、 単価、 数量等のデータベースに登録されているレコードデータである。一方で、非定型データは「非構造化データ」とも呼ばれ、 文書ファイル、 eメール、PDFファイル、画像、動画、音声などが該当する。

②社内のデータ、 社外のデータ:
社内のデータは業務に伴い発生する、クレーム情報や営業日報等の日常で蓄積されるものであり、社外のデータはマーケットリサーチデータや経済データ、政府・自治体のデータが伝統的なもので、更にTwitterやFacebooなどのソーシャルメディアも含まれる。

③マスタデータ、トランザクションデータ:
マスタデータは製品や顧客や会計など多くのデータベースで共通の、基本的な情報となる固定的なデータであり、 「商品マスタ」 「顧客マスタ」 「社員マスタ」などが含まれる。一方で、トランザクションデータは伝票だと捉えればよく、 「取引明細」 などが該当する。

ビッグデータの4つの特徴

そのようなデータの中で、IBMによればビッグデータと呼ばれるものは4つの特徴があるという

①容量(Volume)
数テラバイトから数ペタバイトにも及ぶデータ量の巨大さが特徴。

②種類(Variety)
構造化データだけでなく、テキスト、音声、ビデオ、クリックストリーム、ログファイル等の様々な非構造データの存在に注目すべきである。

③頻度 ・ スピード(Velocity)

ICタグやセンサーから得ら れるようなリアルタイム性の高いデータが多い。

④正確さ(Veracity)
データの矛盾、あいまいさ等を排除して、信頼できるデータとすることが重要。

すなわち、一般的な概念であれば、分析が極めて困難なデータが対象になると捉えられがちであるが、著者の認識では次のように一般論とは異なっていることが興味深い。

「分析して成果を出すために活用できるデータなら何でもOK」である点

「ビジネス上で成果が出る分析であれば、どんな分析でもOK」である点

これらこそ、経営者としてデータに向かう正常なマインドセットであり、ビッグかリトルかの分類は劣後されるべきなのだ。ビッグデータ活用とは、分析の範囲を広げているに過ぎないのだから。

儲け話のメカニズムとキードライバー

ビッグデータ活用の前段として必要なのは、 「儲け話のメカニズム」や「キードライバー」をまとめることである。

例えば、通信会社は通信履歴や顧客の属性データなど大量データを保有している。彼らは自社の事業構造が、新規顧客の獲得に時間やコストがかかり、顧客の継続利用が収益の源泉であると認識している。

つまり通信会社の 「儲け話のメカニズム」では顧客の継続率が「キードライバー」となるので、優良顧客の離脱防止に対して、大量データを活用してきたのである。儲け話のメカニズムとキードライバーに応じて、どのようなビッグデータ活用が有効なのかが根本的に異なるので、まずそこを抑えなければビジネス的な効果は望めないと言えるのである。

分析ツール選び方

ツールの選び方データ分析のためのツール選定には3つのポイントが存在する。

1.事業企画部署で投資できる安価なツール(減価償却費に   ならないSaaSなど)
比較的安価ですぐに始められるツールであれば、無料のオープンソースのものから、月額数万円から数十万円で納まるSaaS/ASPのものが有効な選択肢だ。

2.事業企画部署でも活用できる簡易なツール
リレーショナルデータベースやSQL、プログラミング言語の知識がほとんど求められないツールであれば、事業企画部署でも活用できる。

3.試行錯誤ができるサクサク動くツール
分析は仮説検証を繰り返すことから、試行錯誤で手戻りが何度も発生するのが常である。同じ分析に20分かかるのと、1分で終わるのとでは、試行錯誤の繰り返し回数が大きく異なるのである。そのため、サクサクと分析することが可能なツールが望まれる。

具体的なツールとして比較的簡易なものから紹介すると、データの整形、属性情報の紐づけ、簡易的な概要分析、クロス集計が可能なものでは「AktblitzⅡS」「SOFIT Super REALISM」。また簡易的に大量データのクロス集計やグラフ化が可能で、 「エクセルユーザーならだれでも使えるツール」と謳っている「Tableau」も有効なツールである。本格的なツールとしては、アマゾンが提供している「RedShift」があり、簡単なSQLを書く必要があるものの、SaaS型であることから、初期投資が不要で使用分のみの支払で利用できる。

分析の実践

データ分析のステップ


データ分析は6つのステップに分けられる。

Step1データ収集

Step2データ格納・確認・前処理

Step3分析方針検討

Step4データ加工(2次属性データ作成)

Step5データ分析(Step3から5は繰り返し)

Step6レポート

本書では各ステップで詳しい補足説明がされているが、ここでは分析の質を左右する分析方針検討についてのみ補足した次のような分析軸を選ぶことが肝要である。

誰が・・・顧客軸でまとめる

何を・・・商品/サービス軸でまとめる

どこから・・・営業マン軸でまとめる、流通店/卸軸でまとめる、チャネルでまとめる

いつ・・・時間/曜日軸でまとめる

なぜ・・・キャンペーン軸でまとめる

これらの軸を参考に、分析結果を踏まえて更に試行錯誤を繰り返すような、実行しながら考えるというスタンスを取るべきだ。

デシル分析とRFM分析

客軸で分析する際に、顧客の優良度を計っていく王道である、デシル分析、RFM分析を紹介する。

デシル分析は、購買金額に応じて顧客を上位から均等に10等分して、購買金額が多い順から「デシル1」 「デシル2」 ・ ・ ・と名づける。この分析により、それぞれのセグメンテーションがもたらす購買金額がわかり、全体像の把握とともに具体的な営業施策を導きやすくなるものだ。

RFM分析は、顧客の優良度を計る分析手法である。

R(Recency:最新購買日)どのくらい最近購入しているか

F(Frequency:累計購買回数)どのくらいの頻度で買っているか

M(Monetary:累計購買金額)いくら使っているか

古典的な分析であるRFM分析は、自社の顧客の優良度を計るためにシンプルに「R」 「F」「M」 の3軸だけでセグメンテーションしているが、実は顧客の優良度を計るにはこの3軸だけでも十分に有用である。

自社にとっての優良顧客とはRFMで見た際にどのような顧客なのか?

その優良顧客により自社の収益はどの程度もたらされているのか?

その優良顧客はどのような特徴があるのか?

その優良顧客を増やしていくにはどのような取り組みが考えられるのか?

これらの問いに答えるための有効な示唆が得られることだろう。

リコメンデーションの4つのアプローチ

データ分析の中で、直接的に購買につながるものとして、リコメンデーションは重要であり、そのニーズは強い。ここではリコメンデーションのアプローチを4つに分類して紹介する。

①    売れ筋をリコメンド
これは「顧客の嗜好や購買に対する価値観」などは全く見ていないが、売れている商品をおすすめすると実際に買ってもらえることが多いという事実に基づく。店舗での売れ筋ランキング等にもあるように、王道ではあるものの意味のある取り組みである。

②    人間が考える合理的なリコメンド
統計解析を必要としないが実際は人間が考える合理的なリコメンドは有効だ。例えば、「三国志」を買った人は「戦国時代」に興味を持つ、プリンターを買った人は「トナー」や「印刷用紙」を買うかもしれないというものだ。

③    物を見てリコメンド(バスケット分析)
買われた商品だけに注目し、この商品を買った人はこの商品を買っている、という関連性を見ていくやり方である。商品間の共起性を定義して提示する方法とも言える。

④    物と人を見てレコメンド

④顧客の購買(行動)データ等をもとに人と人の類似性を定義し、その顧客と似た人を特定の上、顧客自身が購買していない商品をリコメンドするアプローチである。

本書で紹介されたのは、例えビッグデータであったとしても有効な、 「加減乗除」でできる範囲の分析を主としている。本来データ量がビッグかリトルかは本質的な問いではなく、事業企画部署の担当者こそ分析すべきものなのである。本書の内容をきっかけとして、データ量に怯えることなく、自分事としてのビッグデータ活用に挑戦していただきたい。

注:本書は「ビッグデータ活用入門」 という題名の通り、 ビッグデータへの取り組み方に土地勘のない多くのビジネスパーソンに向けた入門書であり、バズワードとも言えるビッグデータを理解する良書である。ハイライトでは紹介しきれていない多くのビッグデータ活用事例や、今後のビッグデータ活用を議論するディスカッション等も掲載されている。読者の皆様には、是非本書を一読いただいた上で、ビッグデータを扱うデータサイエンティストへの一歩を踏み出されることを願う。

  • f
  • t
  • p
  • h
  • l