2014年

8月

18日

データ分析の勧めⅢ(ちょっぴり統計分析~相関と回帰の紹介~)~Excelを使って自社の業務データを整理・分析してみよう! その2

第2回 回帰分析に触れてみよう

 

 第1回の相関分析の説明で、女子大生の身長、体重、3サイズ、男性の身長で一番相関が高いのが体重とウェストの関係でした。改めてその散布図を見てみます。

        図2-1(体重とウェスト 手で描いた近似直線付き)
        図2-1(体重とウェスト 手で描いた近似直線付き)

 

 体重が増えるとウェストも増加するという関係(相関)の深さは相関係数Rが0.73もあることから、かなり高いということが前回の説明で分かりました。では仮に体重が70kgになったらウェストは何cmになるのだろう、ということを数値で予測してみましょう。このように相関関係から具体的な数値予測をすることを回帰分析と言い、今回はこの回帰分析についてExcelの使い方も合わせて見ていきます。

 図2-1ではプロットされている点の傾向から近似的な直線を引いてみました。この線上の数値でいうと体重70kgの人のウェストは72cm位になりそうです。しかし、この線は大体このくらいの傾斜かな、といった程度で「エイヤッ」と手で引いたものですが、回帰分析ではこのような個人差を無くし、相関係数を求めた算法で y=ax+b という関係式を導き出して正確な近似線を導き出していきます(第1回でもそうでしたが、具多的な計算方法は相関、回帰とも統計学のテキストに詳しく述べられていますので、興味のある方は是非チャレンジしてみて下さい)。

 

 回帰分析を数学的に説明すると次のようになります。

 1つの基準変数を1つ以上の説明変数から予測するときに用いられる。たとえば、商店街を訪れた人の数によって小売店の売上を予測する場合は、来街者数が説明変数で、売上が基準変数である。両者の関係は「原因と結果」のように考えられることが多い。すなわち、従属変数と独立変数の関係式で分析する。回帰分析から得られる予測式を回帰式という。また、説明変数が1つの場合を単回帰分析、2つ以上の場合を重回帰分析とよんで区別する。(流通用語辞典から)

 

 回帰分析は図2-1のような直線だけではなく多項式の曲線にも対応していますが、今回は回帰直線にだけ注目して検討していきます。散布図のバラつきに y=ax+b の式を導き出して近似直線を引き、この線上の値を予測値とすることで、ビジネス上で使う「予測」の入口を覗いてみましょう。

 

次のページへ   近似値を見つけていきます

1  

「いいね!」ボタンを押していただくと、最新情報をお届けできます。

 フィードの購読もできます。

 (NEWS,BLOGのみ)

連載ブログ 

 大人気3rdシリーズ

 

公益財団法人にいがた産業創造機構

産業創造グループ

情報戦略チーム

TEL 025-246-0069

Mail  kns@nico.or.jp