リフト値とは:その事象が、どれだけ「持ち上がっているか」を考える指標|データ分析用語を解説
f t p h l
本記事は、株式会社ギックスの運営していた分析情報サイト graffe/グラーフ より移設されました(2019/7/1)
リフト値が高い=その物事が”起こりやすい”
以前、「バスケット分析とは|データ分析用語を解説」という記事を書きました。
この記事中にもある通り、バスケット分析は「頻繁に購入される商品の組合せ」を見つけるための分析手法です。この組合せを見つける際に重要となる指標が「リフト値」という指標です。今回は、この「リフト値」について解説していきたいと思います。
リフト値とは
リフト値とは、バスケット分析における重要な指標の一つであり、ある商品xの購買が他の商品yの購買とどの程度相関しているかを示す指標です。英単語”lift”は「持ち上げる」という意味であり、リフト値は商品xの購買が商品yの購買をどの程度”持ち上げる”か(促進させるか)を示す指標であると言えます。リフト値が大きければ大きいほど、商品xの購買が商品yの購買を”持ち上げて”います。
この「リフト値(Lift)」という指標は、「支持度(support)」と「確信度(confidence)」という指標とともに説明されます。
すべてのトランザクション(購買履歴)のうち商品xと商品yがともに購買されている割合を「支持度」といい、商品xの購買したときに、さらに商品yを購買する確率を「確信度」といいます。
「支持度」「確信度」をそれぞれ式に表わすと次のようになります。
そして、この「確信度」を商品yを含むトランザクションの件数で割ったものが、「リフト値」になります。
この式は、次のようになります。
この式から「リフト値」は、「xが買われたときにyも買われる確率」を「全体でyが買われる確率」で割ったものである、と考えることができます。
リフト値の考え方はバスケット分析以外にも応用できる
「リフト値」は「xが買われたときにyも買われる確率」を「全体でyが買われる確率」で割ったものであると書きましたが、これを一般化すると次のようになります。
「リフト値」は、「条件Xのときの事象Yの割合」
つまり、「リフト値が高い」ということは条件Xのときに事象Yが起こりやすいということを示しています。このように一般化すると「リフト値」の考え方は「バスケット分析」以外でも活用できます。これについては、次回以降の記事「”リフト値”をバスケット分析以外で活用する」で書いていきたいと思います。
【リフト値関連記事】
f t p h l