2次属性データとクロス集計で事業構造分析を行う

  • f
  • t
  • p
  • h
  • l
eyecatch_book_introduction

2次属性データとクロス集計は最強の組み合わせである

ビッグデータブームはデータが大量に発生し始めている事に加えて、その大量に発生したデータを処理する環境が整ってきたからにほかなりません。個人的には、ビッグデータに注力してもよいと考えるきっかけとしては、近年の圧倒的なテクノロジーの進歩によって、非常に安価で、そして簡易な仕組みで、もの凄く大量なデータを処理、分析できるようになったことにあると考えています。ストレージ、ハードウェアやCPU、ソフトウェア、それこそ5、6年前であればこちらの要件を満たすものを一通り取り揃えようとすると数億円程度かかってしまうというな状況でした。今だと大げさに言えば、数百万の投資で同じことができるようになりました。AWSファミリー群などのクラウドを使えば月数万円からでも大量データを分析できます。つまり、大量のデータ分析は大金持ちの大企業でしかできなかった時代から、うまく最新のテクノロジーを使いこなせればお金をあまりかけられない企業でも活用できる環境になったと言えます。

Excelで普段使っている機能で億行超えのデータを処理できたら嬉しいですよね?

事業企画部門の方々でExcelのピポッドを使ったことがない人はいないのではないでしょうか?ピポッド、つまりクロス集計はデータを分析する人に取っては決して避けられない手法になります。Excelでは数万行で処理速度が相当遅くなるので、大量データをExcelでバリバリとクロス集計する気にはなりませんが、テクノロジーの進歩により数億行単位のデータでも、クロス集計的なものをバリバリと行えるツールが出てきました。そのため、何をどのようにクロス集計させるか、と言うところに知恵を絞れば、見たいこと、知りたいこと、気になっている仮説などをどんどん証明していくことができます。

弊社では事業戦略なりプランなりを作るには当然ながら現状把握から行いますが、その現状を把握するために事業構造分析を実施しています。またの名を「地図作り」とも言っております。事業構造の見える化、「地図作り」が最初の状況把握になるのですが、極力生に近いデータ、トランザクションデータを手元において、様々なメッシュで分析をして事業構造を明らかにしていきます。事業構造を理解することを突き詰めていくと、高度なことを言っているように聞こえるかもしれませんが、やっていることはクロス集計だけとも言えます。言い換えれば、単純に見えるかもしれませんが、クロス集計の組み合わせで自分達が注力する分野や伸ばすべき観点はどこなのかなどの多くの気づきを得ることができます。

クロス集計の肝は2次属性データ

すると事業構造分析を行うには、何をクロスの軸として分析していくのか、ということが重要になります。この切り口に知恵が必要です。この切り口をより戦略的な方向に持って行くために「2次属性データ」と言う存在が必要になります。単純な顧客軸、商品軸では見えない事業構造を明らかにするための考え方です。

では「2次属性データ」とはなんでしょうか。非常に簡単に言うと、「人間が解釈して後から付与したその人やその商品の特徴となる属性データ」ということになります。人間が解釈して後から付与する属性と言うと分かりにくいですが、最もポピュラーに知られている例をあげていきます。RFM分析と言うものを知らない人はいないと思います。そのRFM分析ですが、オーソドックスなケースでは顧客毎にRecency、Frequency、Monetaryの各項目に1〜5のスコアをつけているわけです。最近来たとか、何度も来たとか、たくさん買ったなどに関してあるラインで閾値(しきいち)を設け、その閾値に対してスコアをつけています。これが言ってみれば2次属性データの付与と言うことです。網野さんはRでは5、Fでは3、Mでは3などの「2次属性データ」を付与しているのです。また、RFMの条件から顧客の優良度をはかり、各顧客に優良度のラベルを貼っていくことも2次属性データになります。つまり人間が解釈して(場合によっては統計的な閾値を活用して)、後から付与したその人やその商品の特徴となる属性データが2次属性データになります。

2次属性データの活用例

2次属性データを顧客に付与する例を見て行きましょう。あるスーパーでバーゲンハンターによる自社の売上への影響を見たいとします。

  • 自社の売り上げや利益はバーゲンハンターと言われる「セール狙い派」にどの程度占められているのか?
  • 「セール狙い派」はどのような商品を多く買っているのか?
  • 「非セール派」は全顧客のうちどの程度の割合を占めており、彼らによりどの程度の売り上げや利益が占められているのか?
  •  「セール狙い派」「非セール派」の購買行動に特徴があるのか?
  • 「セール狙い派」「非セール派」はどの時間帯にくるのか?
  • 「セール狙い派」「非セール派」はどのような商品を買うのか?
  • 「セール狙い派」「非セール派」の来店頻度に特徴はあるのか?

そのようなものを見るために、そもそも誰が「セール派」なのかを把握することが必要になります。このようなケースでは、購買点数あたりのセール品の購入割合や購買金額あたりのセール品の購入割合などを算出することで、セール派か否かの2次属性データを付与することができます。

同様に、ECであれば送料無料にこだわって一定額を注文してくれる「送料無料派」による売り上げ、利益の占める割合なども捉えることもできます。購買件数あたりの送料無料購買の割合といった閾値を作って、2次属性データを付けることで「送料無料派」など、○○派を見て行くことができます。こういった後から人間が解釈してつけた属性データを「2次属性データ」と言っています。

こういった2次属性データを知恵を使って付与していくことにより、ビビットな戦略立案に寄与する事業構造分析を実施することができます。ただし、2次属性データはそれこそ何億パターンでも作って行くことが可能なので、まずは自分達の事業構造を理解した上で、どういう2次属性データを付与すべきか検討することが必要です。

少し複雑な2次属性データを活用した事業構造分析

我々はトランザクションデータから2次属性データを作り、その2次属性データを活用して事業構造分析を行うことで、アイデアひとつで様々な地図を書いていくことができると考えています。

スーパーの例で考えてみます。通称ID-POSと呼ばれるPOSデータと会員が紐づいているデータがあれば、お客さんの優良度に応じて、売上構成比や商品カテゴリ毎の売上構成比を算出していると思います。ただ、せっかくID-POSがあるならRecency、Frequency、Monetaryの視点から見た優良度だけではもったいないです。購買されたカテゴリや品目、来店頻度などによって、自分達の店が「メインのスーパーマーケット」として使われているのか、ある特定のカテゴリや商品だけが買われている「特定利用のスーパーマーケット」なのか、完全に足りない商品だけを補う「アドホック利用のスーパーマーケット」なのかなどを類推することができます。自分達の店が顧客にどういう使われ方をしていて、今はどういった顧客が売り上げに寄与してくれているのかということを事業構造として知ることができます。

経営者は「自分達のスーパーはメインで使われている」もしくは「メインで利用してもらいたい」と思いたいのはわかりますが、まず現状を正しく見ることから始める必要があります。その結果として、「メインのスーパーとして使ってくれている顧客で、売上の6割を上げるんだ」というアスピレーションがあるのであれば、それに沿った戦略を立てればいいと思います。

一方、「特定利用」のお客さんが個別カテゴリーの商品を買いに来てくれることが多かったとします。利用のされ方を見ると、結果的に各カテゴリー特化の顧客の集合体として総合スーパーとして成り立っているんだということがわかれば、カテゴリー毎に尖った商品を置いていけばいいという考え方もあります。こういった地図を作ることで、どの方向に向かうべきかの議論ができるようになります。

関連図書:

関連記事:
  • f
  • t
  • p
  • h
  • l