本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
目次
覆水盆に返らず! 一度失ったデータは取り戻せない。データ分析の前にデータ蓄積を考えよう
データ分析の対象となるデータは、DBに登録された売上実績などのトランザクションだけとは限りません。今までデータ分析を行っていなかったデータも分析の対象にすることで新たな発見へ繋げることができます。しかし、多くの企業は、データの価値に気付かず、削除していることが多いようです。
ログは障害対応やアクセス監視だけじゃない! 行動分析の貴重なデータです
多くのシステムでは、システムへのログイン、クリックや画面遷移などの情報をログとしてファイルやDBに登録しています。これらのログは、システム障害発生時に原因を探す情報になったり、不正アクセスや不正利用が無かったかの監視のために使用されます。そして、これらのログデータは、非常にボリュームがあるため、一定期間保存後、定期的に削除を行う事がありました。
近年、DBや分析技術の進歩により、今まで捨てられていたログデータを行動分析などで活用されてきています。例えば、ECサイトの売上情報だけでは、利用者の購入品からしか分析が行えません。しかし、アクセスログにはECサイト内の閲覧ページの情報が記録されていますので、利用者の購入商品以外の興味のある商品を分析することができます。これらの興味のある商品を分析し、販売促進活動の材料にすることができます。
ステータス情報は”今”だけでなく”いつ変わったか”が重要
顧客情報には、ユーザー情報として誕生日や性別、住所などの個人情報以外にメールマガジン購読の有無や会員ランクなどのステータス情報が登録されています。これらのステータス情報を変更する場合は、過去の情報に新しい情報が上書きされ、過去の情報は失われます。これは、システム的には、無駄がなく、顧客情報も最新の情報であるため正しい処理です。
しかし、データ分析では、最新のステータスだけでなく、ステータスが変わったタイミングを分析することがあります。例えば、メールマガジン購読が、「有」から「無」に変わったのは、何が原因か? 直前にメールマガジンを大量に送信してなかったか? などのデータ分析は、メールマガジン購読の有無のステータス情報を履歴管理していないと分析できません。
ステータス情報を履歴管理するのは、システムの大改修になる可能性はありますが、定期的にステータスのスナップショット(その時の状況)をバックアップするなどすれば、システムの大改修にはならないと思います。
データを溜めることは難しいことではない
昔は、パソコンの記憶容量が小さく、大量データを保存するためにコストが掛かっていました。しかし、クラウドストレージ、クラウドDBなどにより、安価で大量データを保存できるようになってきています。そのため、データを捨てる時代は終わりました。これからはデータを溜めて活用する時代です。