第1章:スピードを求める人のためのデータ分析術|勝手に読み解く「データ活用実践教室」:分析は短サイクルで何回も
- TAG : graffe | グラーフの本棚 | データ活用実践教室を読んでみた
- POSTED : 2015.03.30 14:30
f t p h l
本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
”応用編”なので、初心者の方は注意が必要
本連載では、日経BP社より出版された「トップデータサイエンティストが教えるデータ活用実践教室」を、勝手に読み解いていきます。
今回は、ソフトバンク・テクノロジー高橋威知朗氏による第1章「スピードを求める人のためのデータ分析術」を取り上げます。
要約:鍵は「外部データ」と「感覚データ」
この章では「スピード」を重視した場合のテクニックが語られます。
就職したてのころ、分析経験の浅い私はある勘違いをしていた。「時間をかけて、正しいデータを集め、正しい分析をすることが重要だ」と思っていたのだ。この考えは間違っていた。
(中略)
では、どうすれば良いのか。スピードとパッションである。スピードとは分析結果を出す「速さ」。パッションとはアクション(意思決定や具体的な行動)をする人「思い」。スピードのない分析はタイミングを逃し、パッションの無い分析はアクションを起こせない。つまり、正しいデータで田足井分析をしても、スピードとパッションが無いデータ分析は活かされず失敗に終わる。
スピードとパッションのある分析をするにはどうすれば良いのか。その解は「外部データ×感覚データ」のコラボレーションにある。
リアルなビジネスの現場において、分析は「スピードとパッション」が必要で、それには「外部データ×感覚データ」を使うべきだ、と述べられているわけですね。
組織においては「プレーヤー」「関係」「データ」「データを基にした連携行動」「3Aサイクル」の5つに気を付ける
その上で、組織体制・分析の進め方・データの3つの観点でテクニックが語られるのですが、まず、組織については5ステップに分けて考えるべしと説かれます。即ち、
- まず、分析部門、営業部門、顧客などの「プレーヤー」(意思決定主体)を定義し、
- プレーヤー同士の「関係」(要求を出すのか、なんらかの情報を提供するのか、など)を明らかにする
- その上で、そこに流れる「データ」すなわち、”売上情報”や”経営の意思”や”新商品の説明”などを方向に注意しながら決める
- さらに、そのデータを用いて、どういう「連携行動」を取るのかを明確化する。なんらかの意思決定をするのか、なんらかのリアクションを返すのかなどだ
- それらを「3Aサイクル」すなわち、調整(adjust)、行動(action)、評価(assess)を行って、正しく運用できているか確認し、修正すべきところは修正していく
という流れで行えば、組織体制は構築できるというわけです。
分析は「短時間にそこそこのデータ分析」を「何回も」
つづいての分析の進め方については、2つの事柄が語られます。
- 扱っているデータが「インフォーメーション」と「インテリジェンス」に分けられ、後者は”アクションに結び付くデータ」と知るべき。そしいて、分析とはインフォメーションからインテリジェンスを生み出す行為である
- 分析は「時間をかけて高品質×1回」よりも「短時間でそこそこのデータ分析×複数回」であるべき
これは、コンサルティング業界でいうところの「Quick&Dirty」という思想に近いですね。本書内では、そのためにPPDCA(Problem→Plan→Data→Analysis→Conclusion→Ploblem(2周目))サイクルという考え方を使うべきだと述べられますが、そのあたりは原典に当たっていただければと思います。
スピード重視の鍵は「外部データ×感覚データ」
そして、最後にデータのお話です。
- 分析対象となるのは「内部データ」「外部データ」「感覚データ」の3種類。3つを組み合わせることが大切。
- 特に、感覚データ(意思決定者や分析者の頭の中にある感覚値をデータ化したもの)が、殆ど使われていない
この感覚データの活用が、ひとつの肝になる、と著者は述べます。
「外部データ×感覚データ」で方向性を見極めて、「内部データで検証」しろ
著者の見解として、内部データ分析には時間がかかる上に”過去の集積”であるために、「外部データ(市況データ、官庁統計等)」と「感覚データ」で”未来志向の分析”を行って、仮説を出した後に、内部データで検証すべきだ、としている。
また、クロス分析のじゅうたん爆撃になることは、時間・工数の無駄であり、それを回避するために統計手法を活用して、ポイントを絞ることが重要だ。
解説:果たして、内部データ分析は”難しくて時間がかかるのか”?
本章は、分析のスタンスとして、非常に正しく、素晴らしいことを記述しています。本章に従って分析をすることで、確かに、素早く結論にたどり着けることと思います。
しかしながら、本章は「内容的に、かなり高度なこと」を言っています。少なくとも分析の初級レベル(できれば中級レベル)に達した人でないと難しいでしょう。つまり、これは”応用編”なので、「分析【初心者】」は、このやり方では挫折するおそれがあると思うのです。
基礎の基礎は「内部データで現状把握」から
関連記事:カタいデータとやわらかいデータでも述べましたが、初心者は「内部データ且つ定量データ」すなわち「カタいデータ」を”ある程度”分析することから着手すべきだと思います。
そして、そのデータは、高橋氏の述べたとおり”過去の集積”で【あるが故】に”今の自分の立ち位置”を教えてくれます。今回ご紹介したデータ活用実践教室は、ある程度分析をこなせる人たちに向けて書かれているのだと思いますが、本当の初心者の方は、いきなり走ろうとするのではなく、「立つところ・歩くところ」から始めるべきでしょう。
とはいえ、時間をかけない工夫が必要なのは事実
その一方で、高橋氏の述べたように、内部データを分析しようとすると時間や手間がかかるのも事実です。データフォーマットがぐちゃぐちゃだったり、項目名がシステムごとにバラバラだったりして、なかなか分析に着手できない(大量の工数をデータクレンジングに費やしてしまう)ことも多いでしょう。
そういった問題を解決するために、世の中にBIツールがあるハズなのですが、残念ながら「勝手になんでもやってくれる」仕組みはありませんので、実際に内部データを分析しようとするとお困りの方も多いのだろうと推察します。
そういう課題を解決できるツールが、最近は少しずつ世の中にでてきました。代表的なものが、Microsoft PowerBIですね。基本思想としては、エクセルを拡張したものですが、一般の事業会社の企画部門が”まず、手始めに何かしら分析してみる”ということを可能にした、画期的なツールだと思います。また、株式会社ギックスが提供する「データビジュアライズサービス”graffe/グラーフ”」も、この「時間と手間を掛けずに、内部データを分析したい」という要求を満たすために設計されています。
これらのサービスをうまく活用することで、「内部データ分析から、はじめる」ということも可能な時代になってきています。データ分析の【初心者】だと思われる方は、ぜひ、これらのサービスを検討すべきです。これによって、「内部データで、短サイクルに、難解も分析する」ということが可能となるのですから。
トップデータサイエンティストが教える データ活用実践教室
f t p h l