「一人当たり」はどんな「一人」であるかに要注意|クロス集計の落とし穴
- TAG : graffe | POS分析 | クロス集計の落とし穴 | データ分析のお作法
- POSTED : 2015.06.03 08:59
f t p h l
本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
目次
それぞれの母集団を理解しておけば、「一人当たり」に惑わされない
「人」が登場するデータ分析では、「一人当たり○○」という指標が登場します。特にID-POS分析など「人」に紐づいた分析では、「一人当たり○○」という指標は非常に重要になります。この「一人当たり」ですが、気をつけなければならないことがあります。それは、「一人当たり」の母数が何であるかです。
色々な「一人当たり」がある
例えば、クレジットカードの利用履歴分析で考えてみましょう。
クレジットカード利用履歴分析では、「一人当たり利用額」という指標が重要な指標の一つです。
これは、ある期間(例えば1年間)にカード会員一人当たりでいくらの利用があったか、という指標になります。
カード会社では、会員にいかに多く使ってもらうかが重要な施策になるので、「一人当たり利用額」という指標がKPIの一つになるわけです。
さて、この「一人当たり利用額」ですが、この「一人」はどういったカード会員のことを指しているのでしょうか。
少なくとも次の3通りが考えられます。
- 全会員(カードを保有している会員)
- 有効会員(会員のうち、利用可能なカードを保有している会員。「利用可能」とは、紛失や引き落としエラーなどによりカードが使えない状況でない、という意味)
- アクティブ会員(期間内に1度以上のカード利用があった会員)
カードを利用した会員のみで一人当たりの利用額を求めた方がよいのか、それともカードを利用していない会員も含めた方が良いのかは、ケースごとに異なるでしょう。
カテゴリ別に集計された「一人当たり」の値は特に注意が必要
POSデータ分析などでは、あるカテゴリでどれだけの利用(売り上げ)があったかという分析は頻繁に行うと思います。クレジットカード利用履歴分析においてもそうで、どういったカテゴリ(百貨店、飲食店、トラベルなど)でどれくらいの利用があったかという分析は行うべき分析の一つです。
この分析においても、「一人当たり利用額」という指標は重要になってきます。ある期間内に当該カテゴリで一人当たりいくらの利用があったか、という値です。
ここでの「一人」についても、上で示した「全会員」「有効会員」「アクティブ会員」の可能性が考えられるわけですが、カテゴリごとの値では「アクティブ会員」というのは、2つの考え方ができます。
- 期間内に(どのカテゴリでもいいから)一度以上のカード利用があった会員
- 期間内に当該カテゴリで一度以上のカード利用があった会員
この2つの「アクティブ会員」についても、どちらがより正しいというわけでもなく、どちらも意味のある値です。1のアクティブ会員は、期間内にどのカテゴリでもよいから1度以上の利用があった会員が、全カテゴリの利用額のうち当該カテゴリでいくらくらい使っているのかを把握するのに便利です。
一方の2のアクティブ会員は、該当カテゴリを利用した会員の中での値なので、当該カテゴリを利用するとなったら、一人当たりいくらくらい利用するのかを把握できます利用していることが前提なので、カテゴリの利用率を考慮しなくてもよいということです。
このように非常に紛らわしいですが、誤解を生まないように1の会員と2の会員は明確に区別する必要があります。なお弊社では、2のアクティブ会員のことを「カテゴリアクティブ会員」と呼んで、1とは区別するようにしています。
一人当たりの平均値は同じ「一人」で比較する
これまで見てきたように「一人当たり」と言っても、「一人」には様々な意味があるので要注意です。特に、「一人当たり」の値を比較する際には、「一人」が同じものを指しているか確認が必要です。
例えば、男性の一人当たりの平均値と女性の一人当たりの平均値を比べる際に、前者は男性全員の一人当たりの値で、後者は女性のうち一度でも利用があった「アクティブ会員」の平均値だったとしたら、この両者を比較することに意味がありません。全会員同士、アクティブ会員同士で比較する必要があります。
このように「一人当たり」という言葉は紛らわしいので、資料にする際には、注釈を付けるなどして、どういった「一人」当たりの値なのかを明確にした方が良いでしょう。
【連載:クロス集計の落とし穴】
- ダブりのある集合の計算には気を付ける
- 「全体の平均」と「平均の平均」は違う
- 「一人当たり」はどんな「一人」であるかに要注意 (本編)
- 具体例:「足せる平均値」と「足せない平均値」
【連載、検証:エクセルでどこまでビックデータ分析ができるのか?】
f t p h l