各種回帰分析の実施方法を解説
本連載では、回帰分析の実施方法について、本日から5日間に渡り説明してまいります。第一回目は、回帰分析の目的、実施例および回帰分析の種類についての解説です。
回帰分析は何のために行うのか?
そもそも、回帰分析は何のために行うのでしょうか?一般論でいえば、いろいろな回答が考えられるかと思いますが、マーケティング分野において端的にいえば、「『結果』に対する『原因』を推測する」ことにあるのではないかと思います。言葉で説明してもわかりにくいかと思いますので、具体例を挙げてみましょう。
たとえば、下の表のように、ある会社のある年度について、月ごとの「広告宣伝費」と「来店者数」のデータがあったとします。この時、表からの目視でも「広告宣伝費をかけた月は、来店者数が多くなるのではないか」という傾向が読み取れるかと思います。この時、「来店者数」と「広告宣伝費」の2つの数値の関係を定量的に分析するのが、回帰分析です。
表 広告宣伝費と来店者数
(出所:柏木吉基(2012)『明日から使えるシンプル統計学』(技術評論社)p.124)
回帰分析をやってみよう
ここで、実際に回帰分析を行ってみます。厳密に言えば、「線形単回帰分析」ですが、回帰分析の種類については、後ほど説明します。
図 回帰分析のイメージ
回帰分析(線形単回帰分析)を簡単に言えば、「原因=広告宣伝費」(説明変数)を横軸に、「結果=来店者数」(被説明変数)を縦軸にとった散布図を作り、2つの変数が比例関係にある場合に、最も当てはまりの良い直線を引く作業といえます。この直線の「引き方」は数学的に計算するのですが、第2回で説明いたします。なお、ここまではExcelで簡単にできますので、詳細は前記文献をご参照下さい。
図で示したように、回帰分析(線形単回帰分析)の結果は、
Y=0.525X+3080
といったように、
Y= b1X+b0
という一次関数の数式で表現できます。この式が、回帰分析の基本になります。
数式で表現するメリットは何かというと、「予測」が可能になるということです。この例でいえば、広告宣伝費を千円増やすごとに、0.525人来店者数が増える、すなわち、広告宣伝費を一万円増やすごとに、約5人来店者が増えるということがわかります。また、その月の広告宣伝費の予算がわかれば、数式の「x」の部分に代入することにより、来店者数を「予測」することができることになります。
回帰分析の種類
ここで説明した「回帰分析」は、「線形単回帰分析」という、回帰分析の最もシンプルな形です。「線形」というのは、説明変数と被説明変数の関係を「直線」(一次関数)で当てはめることを意味しており、「単」回帰分析というのは、説明変数が一つの場合のことです。回帰分析のモデルが複雑になると、説明変数が一つでなく、複数になり、場合によっては何十という場合もあります。このような回帰分析のことを、「重回帰分析」といいます。また、被説明変数が、「来店者数」のような数値ではなく、あるサービスを利用しているか、していないかという、「1-0」の場合もあります。この場合、線形回帰分析を用いず、「ロジスティック回帰分析」というモデルを用います。
今後の本連載の紹介内容
次回以降は、各回帰分析の説明やその使い方について、以下の順に説明してまいります。
-
重回帰分析
-
ロジスティック回帰分析
-
ロジスティック回帰分析の応用事例としての「スコアリング」
-
非線形回帰分析
- 回帰分析とその応用① ~回帰分析は何のために行うのか?(今回)
- 回帰分析とその応用② ~重回帰分析
- 回帰分析とその応用③ ~ロジスティック回帰分析
- 回帰分析とその応用④ ~スコアリング
- 回帰分析とその応用⑤ ~非線形回帰分析
関連記事一覧はコチラから
【当記事は、ギックス統計アドバイザーの中西規之が執筆しました。】
中西 規之(なかにし のりゆき)
ギックス統計アドバイザー。公益財団法人日本都市センター研究室