本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
目次
技術は進歩しても最後は分析者にかかっている
近年、データ分析のツールやサービスなどが、毎週のように発表され、ホームページや雑誌、ニュースなどで大きく取り上げられています。しかし、これらの最新テクノロジーは、実際にどれだけデータ分析に役立っているのでしょうか? ちょっと考えてみないと思います。
流行に流されてませんか?
最近のデータ分析のツールやサービスには、”クラウド”や”ビッグデータ”、”オープンデータ”などの最新のテクノロジーに対応した物が多く発表されています。そして、これらの最新のテクノロジーを使うことで最新のデータ分析を行って、新たな発見ができるように思っていませんか?
もちろん、これらの最新のテクノロジーを使うことで分析方法の選択肢が増えることはありますが、必要ないテクノロジーを導入してもデータ分析には役に立ちません。例えば、クラウドに対応したツールを導入しても、Excelに収まるような小規模なデータ分析ではクラウドの機能を使わない事があります。
最新のテクノロジーを使うとき、本当にその機能が必要かを考え導入する必要があります。
データ分析の処理能力に踊らされていませんか?
最新のツールやサービスの紹介には「従来では1,000億件のデータ処理に3日間掛かっていた処理が、1時間で行えます」や「1,000億件以上のデータからお客様に最適なデータを判断して、提供します」のような処理能力をアピールしている物が多いです。これらを導入することでデータ分析時間が短縮できると思ってませんか?
これらのデータ分析の処理能力をアピールしたツールやサービスには、特定したデータ形式やアウトプットに特化した物が多くあります。例えばビックデータ処理で有名なHadoop技術を導入したサービスでは、Hadoopの並列処理の特性を生かしたテキストマイニング(文章から特定の単語を抜き出す)処理や名寄せ処理などには特化しています。しかし、処理結果同士の比較や外部データとの連結を行う場合は、他のツールの機能が必要になる場合があります。その結果、改善範囲が部分的な機能だけに留まり、トータルでのデータ分析時間があまり変わらない場合があります。
レポートの斬新さに目を引かれていませんか?
一昔前ではグラフなどのレポート作成はExcelなどを使っていましたが、最近では様々なBIツールが発表され、Tableauのような多機能な物からPower BIのような無償のものまであります。これらのBIツールを作成することで、地図上にグラフを表示したり、3次元でグラフ表示するなど多彩なレポートを作成することができます。しかし、これらの斬新なレポートは必要あるのでしょうか?
斬新なレポートは、目を引かれるため、報告を受ける相手の反応は良いことが多いです。しかし、相手に分析した結果は、伝わっているのでしょうか? 例えば店舗の売上を地図上のグラフ表示するようなレポートの場合、店舗の数が多ければ地図上で地域ごとの売上の比較を行えますが、店舗数が少なければ地域の比較ではなく店舗の比較が主になるため、地図上のグラフ表示するメリットがなくなります。
レポートの目的は、相手に何を使えたいかです。目的に合わせたグラフなどを選び、必要に応じて複数のグラフをダッシュボード機能を使って並べるなどの工夫が必要になります。
テクノロジーは”考えるチカラ”がないと威力を発揮できない
最新のテクノロジーを使えば、データ分析の分析方法の幅を広げたり、作業時間の短縮、新たな分析結果の発見に繋げることができます。しかし、これらのテクノロジーを使うのは分析者です。分析者は、データ分析の「目的」を考え、その時に最適なテクノロジーを選択する必要があります。そうしなければ、最新のテクノロジーが宝の持ち腐れになり、最後には導入したコストだけが残る未来が待っています。