Microsoft Power BI 導入レポート:導入の全体像 ~要件にあわせて「お手軽」か「本格」かを選ぼう~
- TAG : Microsoft_Power_BI活用術 | Tech & Science | データアーティスト | ビッグデータ分析
- POSTED : 2014.03.24 18:12
f t p h l
目次
Microsoft Power BIの導入は「お手軽」と「本格」の2種類ある
今回は、Microsoft Power BIの導入についてご紹介します。
「分析要件」に応じたPower BIの”導入形態”を紹介いただく
前回の記事で、お伝えした通り、Power BIを弊社の分析ツールとして導入するにあたって、早速マイクロソフト社の技術担当の方にご来社いただいて弊社の分析要件にあわせて「どのようにPower BIを導入していけばよいか」をご紹介いただきました。
導入風景:
弊社では、最終的には、データアーティストの武器として「Power BIをフルに使っていく」ことをゴールと設定しています。しかし、そのためには、まずは、その前段(即ち、データアーティストが使う前の段階)として、「如何にデータサイエンティスト、マーケティングテクノロジストが環境を整えていくべきか」を明確にするところから着手します。
尚、前提として共有させていただきますと、弊社の主要な分析要件としては、以下の2つの分析を常時回す必要があります。
- 月当たり2,000万件程度のトランザクションデータを月単位での分析のみならず、25ヶ月分(2年+1ヵ月)のデータ(=5億件)を一気に分析したい。
- 1~2億件程度のテキストデータのバッチ処理結果を分析・ビジュアライズしたい。
上記1については、ローカルPCにcsv形式で保存された5億件超のデータを、Power BIで分析・レポート化する。2については、Amazon Web Services(AWS)のクラウド上のRedshiftでバッチ処理を行い、その結果をPower BIに取り込んでレポート化したいと考えています。
では、弊社の分析要件に対しては、Power BIをどのように設定していくのがよいのでしょうか。(参考として、Power BIのコンポーネント群をご紹介します。)
参考:Power BI のコンポーネント群
(出所:http://www.microsoft.com/ja-jp/server-cloud/solutions/big-data.aspx)
Power BIの導入形態 お手軽ベーシック導入と本格導入(オンプレ/クラウド)
今回、マイクロソフトのエンジニアの方からは、以下の3種類の導入形態をご紹介いただきました。
1.お手軽ベーシック導入
まず1の『お手軽ベーシック導入』は、Office365 もしくは、Office 2013 Professional PlusをPCにインストールするだけです。それだけで、インターネット上のオープンデータや様々なデータベースのデータを Excel へ簡単に取り込む「Power Query」、インメモリによる高速な分析処理、また、数百万行を超える膨大なデータの高速な多次元分析ができる「Power Pivot」、ビジュアルかつインタラクティブなレポートを作成できる「Power View」、地図上に地域分析データをプロットできる「Power Map」が使えるようになるとのことです。
データ処理に関しては、Office365/Office 2013 Professional PlusをインストールしたPCのメモリーに依存するとのことですが、弊社が分析用に用意している環境(OS:Windows 8 64bit、CPU:Core-i7(3.5GHz)、メモリー32GBのPC)では、2,000万件程度のデータは簡単に回るだろうとのことでした。
今後、使用感を検証し、記事化していきます。
2.本格導入
次に2の『本格導入』ですが、こちらはSQLサーバーを導入することになります。この場合は、どこにSQLサーバーをどこに導入するか、すなわち、A. オンプレ上/B.クラウド上の2つのオプションがあります。どちらに導入した場合でも、分析端末のメモリーボリュームに縛られなくなりますので、より大規模データに対して、データ処理とビジュアライズができるようになります。またサーバー上に常時インメモリーDBを展開しておくことが可能になるため、毎回のデータの読み込みの手間がかからなくなるとのことでした。更に「Data Mining」と呼ばれるアソシエーション分析や決定木などの統計モデルを作成できる機能はSQLサーバーに付属している機能であるため、本格導入すると実行可能になります。
クラウドのみの機能 「Power Q&A」
ここまでは、SQLサーバーをオンプレ上、クラウド上のどちらに導入しても違いはありませんが、クラウド上でインストールた場合のみ使える機能が一つあります。それが「Power Q&A」と呼ばれるブラウザーから自然言語検索で分析結果を抽出する機能です。これはクラウド上にSQLサーバーを立てることで実現可能です。(これが弊社の網野が「Power BIはデータアーティストの武器だ」と大騒ぎしている機能ですね。)
導入形態の選び方は?
このように、大きく2つの(細かくは3つの)導入形態がありますが、本日話を伺った限りでは、1の『お手軽ベーシック導入』は事業企画部署、現業・現場の皆様が簡単に導入・活用するのに適していると思います。一方、2 の『本格導入』については、Microsoft社の助けをかりてながら、ある程度技術に精通した人が設定・運用をしていく必要がありそうです。
弊社は、分析要件ややりたいことに鑑み、2の本格導入を実施します。しかしながら、読者の皆様には、1の『お手軽ベーシック導入』だけでよいという方もいらっしゃるかもしれませんので、今後は、1『お手軽ベーシック導入』 ⇒ 2『本格導入』というステップを踏みながら導入・試行を進めていき、その都度、導入過程や導入後のパフォーマンス、場合によっては操作方法などについて継続的にレポートしていきます。
本特集の記事一覧はコチラから
f t p h l