回帰分析とその応用⑤ ~非線形回帰分析
- TAG : Tech & Science | ビッグデータ分析 | 回帰分析とその応用
- POSTED : 2014.05.16 08:58
f t p h l
各種回帰分析の実施方法を解説
本連載では、回帰分析の実施方法について、5日間に渡り説明してまいります。第5回目の本日は、非線形回帰式として、トービットモデルと二乗項や交互作用項の追加したモデルを紹介します。
トービット・モデル
トービット・モデルとは、回帰分析の一種で、説明変数がある一定値までは被説明変数が常に0の値を取るが、説明変数がある「しきい値」を超えると、説明変数に比例して被説明変数が増加するような関係を分析する時に使われる手法です。下図に、散布図とトービット・モデルの直線を示しましたので、図からイメージをしていただければと思います。
図 トービット・モデルのイメージ
(出所:豊田秀樹編著(2012)『回帰分析入門-Rで学ぶ最新データ解析-』(東京図書)p.77を一部加工)
トービット・モデルは、もともと、経済学の分野で資産データの分析に使われていました。資産額と所得との関係を考えていただければわかりやすいかと思います。既に引退された高齢者を除けば、多くの場合、所得が一定額以下の場合には資産額は0の値を取り、所得が一定額以上になると、所得に比例して資産額が増大していくと考えられます。このような関係を分析するために開発されたのが、トービット・モデルです。もちろん、資産だけではなく、自然界では気温と積雪量の関係といったように、さまざまな場合に応用可能です。
マーケティング分野でも、特定のプロダクトの購入金額を被説明変数にした分析を行う場合、説明変数がある「しきい値」を超えるまでは購入金額が0で、「しきい値」を超えたら購入金額が説明変数に比例するような事例というものは多く考えられることから、今後はマーケティング分野においても、多く使われる分析手法になると筆者は考えています。
具体的な分析方法については割愛させていただきますが、かつては経済統計解析専用のソフトが必要でしたが、現在では、Rのパッケージを使えば、簡単に分析を行うことができます。そういう意味でも、トービット・モデルは今後、多く使われていくのではないかと思います。
その他の非線形回帰式 ~二乗項や交互作用項の追加
回帰分析には、これまでの連載で解説した線形単回帰分析、線形重回帰分析、ロジスティック回帰分析や、先ほど解説したトービット・モデルだけではなく、非常に多くの種類があります。もちろん、すべてを解説することはできないので、線形回帰分析における、ちょっとした工夫についてだけ、ご紹介したいと思います。
線形回帰分析は、説明変数と被説明変数が比例関係にある場合に用いられますが、説明変数が大きくなると、被説明変数が比例関係よりもどんどん大きくなっていく場合があります。こういう場合には、線形回帰分析の応用として、二乗項を加えることがあります。
これを数式でモデル化すると、
Y= b1X+b2X2+b0
という形になります。
また、2つの説明変数に「交互作用」がある場合、交互作用項を加えるという方法があります。「交互作用」とは、ある2つの説明変数が同時に高い場合に限り、2つの説明変数を足した効果より遙かに大きな効果があるような場合のことです。例えば、「東京都在住」の「F1層」(20~34歳女性)で、全地域・年齢層と比較して売れている商品があった場合に、普通の線形回帰分析では、「東京都在住」の方に売れている度合いと、「F1層」の方に売れている度合いを「足したもの」が「東京都在住」の「F1層」で売れている度合いとなります。しかし、「東京都在住」かつ「F1層」についてのみ、売れている度合いが「足したもの」より遙かに大きい場合、これを、「交互作用」といい、回帰分析の場合、2つの変数を「掛けたもの」をモデルに投入することがあります。これを、「交互作用項」といいます。なお、「交互作用」については、拙連載「ビッグデータ分析の留意点」第3回を併せてご参照ください。
これを数式でモデル化すると
Y= b1X1+b2X2+b3X1X2+b0
という形になります。
回帰分析の利用の心得:結果は因果ではなく相関
ここまで、回帰分析のさまざまな手法についてご紹介してまいりましたが、一般的には「回帰分析で結果が出た」から、因果関係があるというわけではありません。回帰分析はあくまで変数間に「関係がある」ということを示しているだけで、それが「因果関係」とみなせるかどうかは、分析結果をどのように解釈するかにかかってくるということが、よく言われています。ただし、マーケティング分野の場合には、実際には財・サービスの購入・利用などを被説明変数にすることが多いかと思いますので、比較的、因果関係につながりやすいのではないかと思います。しかしながら、どのような説明変数を用いると、施策につながる発見が得られるかとか、これまで気づかなったような興味深い発見が得られるかといった点につきましては、分析者のセンスや経験に委ねられる部分が非常に大きいです。
とはいえ、それほど構えて考える必要はありません。本連載でご紹介した手法は、いずれもPC上で簡単にできることばかりですので、まずはデータに触れてみるところから、気軽に初めてみてはいかがでしょうか。
- 回帰分析とその応用① ~回帰分析は何のために行うのか?
- 回帰分析とその応用② ~重回帰分析
- 回帰分析とその応用③ ~ロジスティック回帰分析
- 回帰分析とその応用④ ~スコアリング
- 回帰分析とその応用⑤ ~非線形回帰分析(今回)
関連記事一覧はコチラから
【当記事は、ギックス統計アドバイザーの中西規之が執筆しました。】
中西 規之(なかにし のりゆき)
ギックス統計アドバイザー。公益財団法人日本都市センター研究室
f t p h l