clock2014.07.22 01:39
SERVICE
home

(1) ビジネスサイドから読み解く|ギックスの本棚/戦略的データサイエンス入門 ~ビジネスに活かすコンセプトとテクニック~ (O’REILLY/オライリー)

AUTHOR :  田中 耕比古

データサイエンティストと一緒に働く人は「読まないとダメ」

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

本日は「戦略的データサイエンス入門」を、ビジネスサイド(弊社の定義で言うところの”マーケティング・ストラテジスト” および ”データ・アーティスト”の視点)で読み解きます。※アナリティクスサイド=”データサイエンティスト”の視点からの読解も、後日、公開する予定ですので、そちらも合わせてお読みいただければ幸いです。

本書の概要

本書の裏表紙より引用します。

ビッグデータ時代ともいわれる昨今においては、膨大なデータをビジネスの枠組みの中に組み込んで活用することが重要課題となっています。つまり、データ収集を行ってビジネスの全体像を把握し、適切なデータ分析を行って正確な予測をしたうえでビジネス戦略を決めることが求められています。本書は、データをビジネスに活かすために身につけておくべき基本的な考え方と、データマイニングやモデリングの根底に存在するコンセプトについて、体系的に解説しています。データサイエンスの重要性とその威力を学べる一冊です。

僕なりに、もう少し噛み砕くと、本書のメインテーマは「”ビジネスに役立てる”というゴールを設定した上で、データをどのように取り扱うかを考える」に尽きる、ということになると思います。

想定読者

「はじめに」において、本書の想定読者は下記のように設定されています。

  • データサイエンティストと一緒に働き、データサイエンス関連のプロジェクトを管理しているか、あるいは、データサイエンスベンチャー企業に投資しているビジネスパーソン
  • データサイエンスを使ったソリューションを開発することを考えている開発者
  • 意欲的なデータサイエンティスト

今回の記事では、冒頭に申し上げた通り、一番上の「 データサイエンティストと一緒に働き、データサイエンス関連のプロジェクトを管理しているか、あるいは、データサイエンスベンチャー企業に投資しているビジネスパーソン」の視点で、本書を読み進めていきます。

ビジネスに役立てる とは

本書では、「ビジネスにおけるデータサイエンスの主な利用目的は、意思決定の支援(p.36)」であると語られます。そして、具体的な「ビジネス視点の例」が数多くでてきます。いくつか、取り上げてみましょう。

2004年のハリケーン・フランシスの事例について:

ハリケーンの進路では水のまとめ買いをする人が増えるという予測出れば、それは意味のある予測とも言えます。ただし、ハリケーンの進路上の人が水をまとめ買いするなど当然のことのようにも思えます。ではなぜあえてデータサイエンスのアプローチを必要とするのでしょうか。データサイエンスを使って、ハリケーンによる売り上げ増加量を分析で斬れば、各店舗の在庫を適正化できるのです。

シングルモルトウィスキーの分析について:

この章では類似するシングルモルトウィスキーを発見するために類似度指標を使うことについて説明してきました。しかし、そもそもなぜ類似するウィスキーのクラスタを発見したいのでしょうか。

(中略)

興味の対象はスコッチウィスキーにあるので、味覚によって分けられるグループを理解したいと思うはずです。なぜならば自分達の「ビジネス」を理解し、それによってより良い製品やサービスの提供につなげたいからです。たとえば、裕福な人が大勢済む地域の中で小さなお店を経営していると考えてみましょう。そしてビジネス戦略の一環として、シングルモルトスコッチウィスキーのために足を運ぶ場所としての評判を得たいと考えます。店舗のスペースと商品に投資する余裕が限られているので、膨大なウィスキーセレクションを保有することは不可能です。しかしながら、広くて多様なコレクションを保有する戦略を選びたいところです。もしシングルモルトウィスキーを味覚によってグルーピングする方法を理解していれば、たとえば、それぞれの味覚のグループから有名なものと逆にあまり知られていないものを選択する戦略を取れます。あるいは高価なものと手ごろな値段のものを選択する戦略も取れるでしょう。いずれの戦略も根本には、味覚でウィスキーをグルーピングすることについての良い理解があります。

寄付金の最大化を目標とするケースについて:

ここでも解決したいビジネス上の問題に注目してみることが、解決への近道かもしれません。なぜなら、対象のビジネスに精通した人にとっては、問題に対する解はむしろ明白であることも多いためです。ここで最大化したいのは、寄付金の利益です。つまり、コストを考慮したネットを最大化したいという事です。

(中略)

繰り返しになりますが、この章の基本コンセプトに従うことで、試行を構造化し、データ分析ソリューションをエンジニアリングできるようになります。

これらは、それぞれ1章、6章、11章から引用していますが、いずれも共通して「ビジネス視点において、何が目指すべきゴールなの?」ということを問いかけています。この視点はビジネスサイドから見ると当たり前のことなのですが、データ分析を生業とする人からは忘れられがちな側面です。

データサイエンティストはビジネス視点を兼ね備えているべき、というのが本来の(=アメリカでの)定義なのですが、日本においては「統計の専門家」「分析ツールやデータベースを使いこなせる人」などもデータサイエンティストと名乗っているのが実態です。そのため、この「ビジネス視点が重要」という部分を非常に強調している所こそが、僕が、本書をお勧めしたい最大の理由となります。(関連記事:データアーティストとは何か

※ 本書のp.21で「データマイニングにおける大半の作業においては、分析担当者の創造性やビジネス知識、経験に裏打ちされた判断力が必要となります」と語られます。この能力が、先述した「日本における”データエンティスト”」に不足しがちなのではないか、という危機感を我々=ギックスは持っており、その課題認識から敢えて「(狭義の)データサイエンティスト」と切り分けた「データアーティスト」という用語を定義し、提唱しています。

ビジネスサイドの人は「1章」と「13章」をまず読もう

では、既にビジネス視点を持った人は、本書のどの部分を読めばよいのでしょうか。実は「すべて読んだ方が良い」というのが正直なところです。(理由は後述します)

しかし、非常に忙しい皆さんのために、敢えて優先度をつけるならば、今すぐ読んでおくべきは「1章|はじめに:データ分析思考」「13章|データサイエンスとビジネス戦略」だと思います。この2章を合計しても、40ページほどですので、入手した当日に読んでしまってください。

その後、「14章|おわりに」を読み、それから、「2章|ビジネス問題とデータサイエンスが提供するソリューション」「3章|予測モデリング:相関から教師アリセグメンテーションへ」と読み進めるのが良いでしょう。

1章と13章で、ビジネスとデータの関係性および「データサイエンティストと共に働く」ということについて、一通り理解できると思います。そして、14章でその考え方は補強され、具体的なイメージを抱くことができるハズです。そして、第2章を読むことで「データサイエンス」とは、具体的にどういう事をおこなうことなのか、についての全体像を掴むことができます。ここまでは「日本語が読めるならだれでもスムーズに理解できる内容」です。

そして、3章は、少しだけ専門的な用語がでてきます。エントロピー、情報利得、分類木などの用語がでてきますが、これらも「できるだけわかりやすく」説明されているなと感じますので、門外漢だという方でも大丈夫だと思います。この章で、データサイエンスの基本コンセプトを知ることができます。

4章から12章は、様々な分析の考え方、基本知識を、具体的な例と共に紹介してくれます。4章~12章を読み切るのは、時間がかかっても構いません。しかし、きちんと通読して「知識として押さえておく」ことが非常に重要です。 その際に第2章でつかんだ全体感と、頭の中で照らし合わせることができれば尚良いでしょう。

そして、無事、本書を通読した暁には、いったいどうなるのか。14章のクロージングより一節を引用します。

もしこの本を読んでいるあなたが(略)ビジネス上の関係者である場合は(略)この本のコンセプトに加えてあなた固有のビジネス知識、そしてデータシステムに関する知識により、80%かそれ以上のデータサイエンスを理解することが可能になるでしょう。これはあなたのビジネスを生産的にするのに十分なレベルであると考えられます。

データサイエンスの基本原理→自社/自部門の状況を知る→改善

上述した「最初に読むべき章」のひとつである13章では、非常に多くの有益な事柄が語られます。いくつか抜粋して列挙します。(要約の為、quate表記としません)

  • 経営陣はデータ分析が、意思決定の根本だと理解せねばならない
  • そのために、経営陣はデータサイエンティストを育み、活躍させるための「企業文化」を創る必要がある
  • そうしないと、データサイエンティストは他社へ流出してしまう
  • 自社でデータサイエンティストを活用するために、経営陣がデータサイエンスの基本原理を正しく理解する必要がある
  • そして、自社が「どれくらいデータサイエンスに習熟しているのか」を自己診断して、改善していくことが重要

非常に大まかですが、このようなことが読み取れます。もちろん「経営陣」は「部門長」や「チームリーダー」であっても同じことです。大きな投資が必要になると上申が必要になることもあるでしょうが、出来る事から始めれば良いのです。(関連記事:会社を強くするビッグデータ活用入門【書籍内容紹介】

本書を読めば、上記ポイントのなかで最も重要な「データサイエンスの基本原理を押さえる」こと及び「企業文化の想像のためにどうすればよいか」の概略は押さえられることでしょう。

そこに追加で必要なのが、自社の診断です。僕が前職(IBM)時代に監訳した「ホワイトペーパー|アナリティクス」広がる格差(日本IBM 公式サイトへのリンク)」でも、診断の重要性が説かれていますが、この部分を怠っては前に進めません。自社の「アナリティクス・スキル」、そして「そのスキルを活用する=意思決定にデータ分析を活かすことのできる土壌」の状況をできるだけ正確に把握して、次なるアクションを見定めることも、ビジネスサイドの人間の重要な役割です。

本書をしっかりと読み込み、データサイエンティストとのコミュニケーションを円滑にしながら、13章・14章の内容を実践していけば、「データ分析」を「ビジネス上の効果」に結びつけられることと思います。というわけで、やること(=本書を買う+その通りやっていく)が決まったからには、あとは実践あるのみです。頑張りましょう!

 

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック

 

SERVICE