Amazonのサイズ感レビューの信頼性ってどうなの?:インプットデータの”バイアス(偏り)”を理解しよう|ニュースななめ斬りbyギックス
- TAG : Garbage in Big “X” Out | thinkaholic|シンカホリック | ななめ斬り
- POSTED : 2015.07.14 08:55
f t p h l
Amazonのサイズ感レビューには”バイアス”がかかっている
本日は、最近、Amazonのアパレル商品の紹介ページに追加されている「サイズ感」レビューに関して考察していきます。
Amazonは”サイズ感”をレビューから切り出した
アパレルを買うときに「サイズ感」は気になりますよね。だからwebで服は買えない、という方も大勢いらっしゃることと思います。
しかし、web通販の雄であるAmazonは、それにも敢然と立ち向かいます。
とっても便利な感じがする。
先日、Amazonでこの商品を購入しました。サイコバニー。ウサギのドクロマークが可愛いブランドです。
(サイコバニー)Psycho Bunny 迷彩別地ポロシャツ M5S03 18 ネイビー M
通常、僕は(このブランドに限らず)Mサイズを購入するのですが、本当にそのサイズで大丈夫だろうか?と不安になります。そこで、Amazonが最近導入した「サイズ感」が参考になります。
拡大すると、↓こんな感じ。61%の人が「小さめ」と答えています。
さらに、マウスオーバーすると、その内訳も表示されます。”ちょうどいい”が5件、”やや小さい”が7件。”やや大きい”および”とても大きい”がいないので、きっとぴったりフィット~少し小さめサイズなんだろうな、と想像がつきます。
ちなみに、「やや小さい」ならイケるだろう、と思ってMサイズを購入した僕は、到着したのを着てみて「やっぱりちょっと小さいな」と思ったので、”やや小さい”に投稿しました。(笑)
尚、僕が購入した時点では、”やや小さい”が5、”ちょうどいい”が5だったと思います。僕が2色購入して、どちらも”やや小さい”に投稿した結果が上記だろうと思いますので、皆さんには、是非、僕の屍を超えていって頂きたいと思います。いずれにしても、これはしっかりとデータが溜まって行けば、非常に使える指標になりそうな予感がします。
しかし、落とし穴もある。
続いて、コチラを買おうと思います。
先ほどと同様、サイズ感を見ると、52%のひとが”ちょうどいい”と答えています。
内訳をみると、小さいに偏っていることがわかりますが、”ちょうどいい”が圧倒的に最多だなと分かります。中には、”やや大きい”もいます。
ということで、「普段と同じサイズ(=ちょうどいいサイズ)」を買おうとしたら・・・・はい、失敗です。これが、落とし穴です。
個別のレビューをちゃんと見てみると・・・
何が失敗なのか? それは、「個別のレビュー内容」を見ると分かります。
なんと、「あらかじめ小さめだという理解のもとに、大きめを購入してちょうど良かった」と答えているのです。
ちょうどよい / 通常、27.5-28.0ですが、28.5にしました。すこし大きめにしてちょうどよかったです。
あるいは
サイズ注意 / 普段履いているサイズより2つ上のサイズを買いました。ちょうど良いサイズです。
ということです。
これが「バイアス」です。
先ほどのポロシャツの場合は「データが溜まれば情報精度が上がるだろう」と思ったわけですが、このシューズの場合には「情報が溜まっていく過程で、すでに集まっている情報によって購買行動が変わり、その結果として”自分の判断結果に対する評価”と”商品サイズに対する評価”が混ざってしまった」ということになっているわけです。Amazonとしては、後者(商品サイズの評価)をしてもらいたかったのに、”自分の判断結果に対する評価”というノイズがガッツリ混入してしまっているわけですね。
というわけで、賢明な僕は、しっかり「1サイズ大きめ」を購入しました。
で、届いたのは「ほんとうにジャストサイズ」でした。学習してるね!僕! ただ、悩ましいのは、この場合の僕のレビューは”ちょうどいい”が正解なのか、”やや小さい”が正解なのか、です。まぢ困る。
人の回答には、常にバイアスがかかる
人が何かを考えて、何かを答える際には、ほぼ確実に「バイアス」がかかっています。
まず、ひとつはパネルの偏りの問題があります。アンケートがwebアンケートだとしたら、パネルそのものがその時点で偏っている可能性が高いですよね。あるいは、ソーシャルリスニングで、twitterデータを使うときも同じ話。twitterが世界の縮図と言ってよい場合とダメな場合がありますよね。もっと分かりやすい例でいえば、全国の老人ホームで”好きな食べ物”をアンケート調査して「日本人が一番好きな食べ物は羊羹で、2番目はお饅頭です!」って言われても、納得感無いよねってことです。これは、皆さんしっかり認識しているので、かなり厳密に排除する(もしくは意識する)傾向にあります。
もう一つの問題が、今回のAmazonのレビューで起こった「何に対する質問に答えているのか?」のズレです。これは「アンケート設計」の問題でもあります。冗談とも本当ともつかない話ですが、ある宗教団体が主催しているアンケートの話があります。
問:「(教祖の名前)が、神だということを、あなたは知っていましたか?」
選択肢: 1. 知っていた 2.いま知った
これは、画期的ですね。「知らない」という選択肢が無いわけです。ただ、アンケートとして考えると残念ながら失敗です。こうなってしまうと、これ以降のすべての質問は、「その教祖は神である」という前提で進むことになります。それは、「神ではないだろう」と思っている人の意見が”ねじ曲がってしまう”ことになります。これがバイアスです。(具体的に言えば、「その教祖が癌を治す力があると思いますか?」という問いがあった場合に、「治せない」を選んだ人が「神だと思っているが、さすがに癌は治せないだろう」という意味で答えているのか、「そもそも、神ならぬ存在なので、癌どころか虫歯や風邪も治せるわけがない」という意味で答えているのか、ということになるわけです。)
自分でアンケート設計から分析まで一気通貫で行う場合には、これに起因するミスは起こりにくいのですが(もちろん、設計経験の浅い人がやると、十分起こりえますのでご注意くださいね)、他社や前任者が実施したアンケートの「結果」だけを利用して分析を行う場合には、細心の注意を払うべきポイントとなります。
分析するときに「バイアス」をどう扱うかを決めよう
このことから言えるのは、「分析する際には、そのインプットデータに、どういうバイアスがかかっているのか?をしっかり理解しておきましょうね」ということです。
バイアスを排除するのは難しいです。それを完全に排除したければ、センサーデータを用いるのが一番良いでしょう。センサーデータは、ノイズとなる要素が少ない、非常にきれいなデータ=分析に適したデータです。とはいえ、すべての事象をセンサーデータだけで理解・解釈することは不可能です。そうすると、人の考えや嗜好を理解したくなるわけで、その際にはどうしても「デプスインタビュー」や「アンケート」などの調査手法を使う必要が出てきます。そういう場合には「バイアスがある前提」で、どのように分析するかを考えないといけません。
今回のAmazonのサイズ感レビューの場合であれば、打ち手は2つでしょう。
- バイアスの排除:問いを以下のように変更して、聞きたいことを明確にする。⇒「同種の製品と比べたサイズ感を教えてください(例:通常25.5cmを購入する方が、26.5cmでちょうど良かった場合は、やや小さい/小さい をお選びください)」
- バイアスの把握:商品レビューコメントの中の表現で、サイズに関わる用語(小さい・大きい・ちょうどいい 等)を抽出し、それが、サイズに関する評価結果と比較し、傾向を探る。(評価結果は丁度いい だが 「小さい」「ちいさめ」などがレビューコメントに多い場合には、アンケート結果になんらかのバイアスがかかっている危険性が高い)
今回の場合、打ち手1によって、ほとんどの問題は解決すると思いますが、念のため、打ち手2をダブルチェックの手法として用意しておけば万全でしょうね。
ということで、なんらかの調査結果をそのまま鵜呑みにするのではなく、一歩踏み込んで情報を”理解”することが重要だ、というお話でした。
f t p h l