【”考え方”を考える】因果の「方向」を考える|相関関係と因果関係は別物です
- TAG : Strategy & Art | データアーティスト | 思考の型
- POSTED : 2014.12.08 09:08
f t p h l
因果関係は「原因」と「結果」
本日は、「因果関係」について考えてみたいと思います。
相関関係と因果関係の違い
相関と因果については、よく混同されるようで、世の中には多くの解説記事があります。wikipediaから引用します。
相関関係があるだけでは因果関係があるとは断定できず、因果関係の前提に過ぎない。「相関関係は因果関係を含意しない (Correlation does not imply causation)」は、科学や統計学で使われる語句で、2つの変数の相関が自動的に一方がもう一方の原因を意味するというわけではないことを強調したものである(もちろん、そのような関係がある場合を完全に否定するものではない)。全く逆の言葉である「相関関係は因果関係を証明する (correlation proves causation)」は誤謬であり、同時に発生した2つの事象に因果関係を主張するものである。このような誤謬は虚偽の原因の誤謬(英: false cause)と呼ばれる(ラテン語では “cum hoc ergo propter hoc”、直訳すると「それとともに、そしてそれ故に」)。前後即因果の誤謬は、2つの事象に順序関係があることが前提であり、「虚偽の原因の誤謬」の一種である。
出所:wikipedia
要するに、「AとBが同時に起こる」とか「Aが増えたらBが増える(あるいは減る)」というようなことがあるのが【相関関係】ですが、それだけで【因果関係】があるとは言えないよということです。その一方で、相関関係がないと、因果関係がない、とも言えます。「相関関係は、因果関係の前提」ということですね。
因果関係とは、相関関係にある複数の物事が、「原因」と「結果」という関係性にある、という場合を示すわけですね。
因果関係は「方向」が大切
先日、テレビを見ていたところ、コンビニおにぎりで一番売れるのは「シーチキンマヨネーズ」である。という話がありました。これは、10年近く続く事象で、しかも、コンビニチェーンを横断的に起こっており、コンビニ界の常識のひとつだと思います。この話を見ていると、テレビ番組の出演者が「美味しいもんね」とか「人気なんだー」とかいう感想を述べてらっしゃいました。
しかし、この事象から「シーチキンマヨネーズおにぎりが、大人気である」というのは妥当なのでしょうか。
シーチキンマヨネーズおにぎりが「一番」売れる理由
シーチキンマヨネーズおにぎりが1番売れているのはなぜなのでしょうか。いくつか理由を考えてみましょう。
- 美味しくて、人気だから
- チェーンごとの味のばらつきが少ないから(素材も味付けも似てくる)
- 安いから(だいたい100円で、最低価格商品です)
- 店頭に並んでいるから
とりあえず、4つ挙げてみました。ひとつめが、出演者の皆さんの感想と同じですね。ふたつめは、少し違った切り口ですが、安定していて選びやすいから「人気がある」ということなので、1と同じようなものです。また、3もそうですね。
しかし、最後の「店頭に並んでいるから」は、なかなか曲者です。
コンビニは「棚に並んでいるものしか売れない」
コンビニという業態は「店頭に陳列されているものしか売れない」わけです。そして、フランチャイズ方式のため、オーナーの意向が、店頭に並ぶ商品に色濃く出ます。そして、おにぎりのような「消費期限の短い商品」は、常に廃棄リスクをどの程度許容するか、という判断を迫られます。
そうすると「安定的に売れる商品」を置く、という方向にインセンティブが働きます。たとえば、(ほぼ)毎週、投入される新商品には当たり外れがありますので、売れ残りリスクが大きいわけです。
シーチキンおにぎりは、10年以上も「安定的に売れ続けている商品」です。オーナーからしてみれば「コレを置かずして、何を置くのか」ということになるでしょう。その結果、シーチキンおにぎりを多めに仕入れて店頭に並べ、他の商品は比較的少なく店頭に並べることになります。
おにぎりはどんどん売れていきますので、一定時間が過ぎると、在庫切れの商品が出始めます。しかし、多めに仕入れられたシーチキンおにぎりは、比較的長い期間、在庫が存在し続けることでしょう。
お昼時などが過ぎた14時~15時ごろ。あるいは、深夜のコンビニに行くと、おにぎり棚はスカスカです。そんな時に、棚に残っているおにぎりがあれば、それが何であれ、手に取る人がいるでしょう。つまり「棚にあれば、売れる(可能性が高い)」のです。
売上データは「結果」
コンビニにおいては似たような話はよくあります。たとえば、「寒くなるとおでんが売れる」「暑くなると冷やし中華が売れる」というようなものは、おにぎりの話と同様に信ぴょう性を疑いたくなります。つまり、「寒くなるとおでんを陳列するから売れる」だったり「暑くなると冷やし中華を陳列するから売れる」だったりするのではないか、ということです。(暑くなるとアイスが売れる、ならば、基本的に常に陳列されている商品ですので、そうなのかもしれないな、と思います。)
あるいは、時間帯で考えたときに「肉まん」や「から揚げ」などの”良く売れる時間帯”があったとしても同様です。その時間帯に「よく売れるから並べている」のか「並べているから売れる」だけなのか。
今回のケースにおいては、売上データは「結果」です。「原因」にはなりえません。その時間・あるいはその条件下に良く売れた”から”、人気がある商品だ、という解釈をするのは危険です。なぜ売れたのか、という「原因」を探るという姿勢が重要です。
ビッグデータの時代と言われる昨今、様々なデータを入手できるようになってきています。それらを見る際に「相関しているのか、単なる偶然なのか」の見極めが重要なのは言うまでもありませんが、さらにその先の「因果」を考えるにあたり、「このデータから、何を読み解きたいのか」というところに着目して「因果の方向性」を見定めることが大切です。
f t p h l