Microsoft Power BI 活用レポート:Power Viewを使ってみた① ~多次元構造データをサクサクとビジュアライズ
- TAG : Microsoft_Power_BI活用術 | Tech & Science | ビッグデータ分析
- POSTED : 2014.04.22 09:12
f t p h l
目次
Power Viewは「負荷を感じさせない速度」が特徴
本特集では、Poiwer BIの導入・活用についてレポートしています。今回はPower BIファミリーの一つのコンポーネントである、「Power View」で何ができるのか、どのように利用できるのかについて、具体例を交えながら紹介していきます。
多次元データを高速にビジュアライズできる
「Power Viewってどこがすごいのか端的に教えて?」と問われたならば、私は、下記2つであると答えます。
-
多次元データをさまざまな切り口でビジュアライズできる
-
100万件を超えるデータでも、反応速度が速く試行錯誤が容易にできる
Power Viewをうまく使えば、「仮説が正しいかどうかの検証」や「想定していなかった事実の発見」が可能です。反応速度が速いため、検証結果を踏まえて「新たな仮説」を立て、その検証を進めるという”試行錯誤の繰り返し”ができるわけです。
具体的な使い方としては、例えば、顧客データをセグメント分けし、それぞれの差異の把握をしたい、と言うような場合に非常に有用です。
Power Viewで”購買時間帯”毎の「顧客の違い」をみる
では、具体的にPower Viewで何ができるかを、分析手順に沿って、図や動画を交えながら紹介していきます。
用意したデータは小売業のダミーデータです。
- データボリューム:220万レコード(通常のエクセル上限の100万レコードを大きく超えるボリュームです)
- データ内容:会員データと購買データの集計を結合
- データ項目:”会員ID”、”日付”、”購買時間”、”購買時間帯カテゴリー”、”購買商品カテゴリー”、”購買価格”、”性別”、”年代” の8項目
このデータを用いて、”購買時間帯カテゴリー”、すなわち「①午前購買(9:00-12:00の購買)」「②午後1購買(12:00-15:00の購買)」「③午後2購買(15:00-18:00の購買)」「④夜購買(18:00-21:00の購買)」によって、顧客の特徴がどう違うのかを見ることにしました。
1. データの読み込み
まずPower BIファミリーの中の『Power Pivot』でデータを読み込ませます。読み込み完了後に、メニューバーの『挿入』から『Power View』を選びます。
すると、Power Pivotで読み込んだデータが、自動的にPower View上にロードされた状態になっています。そのため、すぐにPower Viewで操作を開始できます。このあたりに関しても、Power PivotとPower Viewが非常にスムーズに連携されていると感じます。同じPower BIファミリーであることの利点ですね。非常に使いやすいです。
2.セグメントごとの特徴把握
では、Power Viewで、購買時間帯カテゴリー毎に、顧客の購買行動にどのような特徴があるかを分析していきます。具体的には、購買時間帯ごとの購買傾向が、①時系列、②性別・年代、③商品カテゴリーという切り口でどう違うのかを確認していきます。
1.購買時間帯ごとの購買傾向の差異 ~時系列
まず時系列による変化です。日付と売上でグラフを作成したあと、購買時間帯のカテゴリーをドロップ&ドラッグするだけで購買時間帯による日付別の購買傾向のグラフを作成することができます。
[youtube]https://www.youtube.com/watch?v=HXwP1Q1RGDM&feature[/youtube]
このようにドロップ&ドラッグの繰り返しでグラフが完成していきます。売上のピークが立っている日付が購買時間帯によって異なるのは明らかです。周期性があり、曜日によって購買傾向が違うということは言えそうですが、購買時間帯によってピークの曜日がずれている原因は何か、深堀りしたくなりますね。
2.購買時間帯ごとの購買傾向の差異 ~性別・年代
次に購買時間帯ごとに、性別・年代で購買傾向がどのように違うかを見てみましょう。これも年代⇒性別⇒売上と順にデータをドロップ&ドラッグしたうえで積上げ横棒グラフを作ります。そのグラフの上に、時間帯をドロップ&ドラッグすると、購買時間帯ごとのグラフが完成します。
[youtube]https://www.youtube.com/watch?v=xvBCbb6naeA&feature[/youtube]
午前中から午後の早い時間にかけては30代~40代女性の主婦層の購買が目立ちますが、午後の遅い時間になると10代の購買が増え、夜の時間帯には、20代~30代の男性の購買が増えるということが見て取れます。
3.購買時間帯ごとの購買傾向の差異 ~商品カテゴリー
最後に購買時間帯ごとに、購買商品カテゴリーがどのように違うかを見ましょう。商品カテゴリー⇒売上とデータをドロップ&ドラッグして積上げ横棒グラフを作ります。そのグラフの上に時間帯をドロップ&ドラッグです。
[youtube]https://www.youtube.com/watch?v=0lWInriyg8M&feature[/youtube]
このようにさっとビジュアライズしてしまうと、午後の遅い時間帯に菓子類の購買が増え、夜の時間帯には飲料系の購買が増えるという傾向を即座に捉えることができます。
とにかく反応速度が速い
動画をみていただけるとわかると思いますが、反応速度が非常に速いです。裏側で220万件のデータの集計処理が行われており、さらにそれを動的にビジュアライズして、このスピード感なのは驚きです。操作も感覚的で非常に簡単です。このスピード感・操作感ですと、Power Viewは、弊社で頻繁に実施する仮説検証の試行錯誤プロセスには大いに役立つと感じています。
では他のBIツールと比して、Power Viewはどう位置づけられるのでしょうか?
次回は弊社で主力ツールとして重宝しているTableau(関連記事一覧)との比較で、Power Viewのできること・できないことを明らかにしていきます。
本特集の記事一覧はコチラから
f t p h l