2014年

8月

18日

データ分析の勧めⅢ(ちょっぴり統計分析~相関と回帰の紹介~)~Excelを使って自社の業務データを整理・分析してみよう! その2(P3)

 

 ここで、余談ですが、大辞林に以下の解説があります。

相関:二つのものの間に関連があること。互いに影響し合うこと。 

回帰:一周して元に戻ること。

「相関」は漢字の意味としても、第1回でも考えてきたことと同じだと思うのですが、「回帰」は元に戻るという意味で普段は「鮭の母川回帰」や「原点への回帰」などという使用例を目にします。ところが統計学では関係を数式で表し、予測に利用するのに「回帰」と呼んでいるのは何故でしょう。実は使い初めに原因があったのです。ここでは雑学としてちょっとご紹介してみましょう。

  回帰分析という統計学の用語は、およそ100年前イギリス人統計学者フランシス・ゴルトン卿の研究に由来しています。ゴルトン卿は、親の身長とその子供の身長を比較して、非常に身長の高い親を持つ子の身長は、親より低いという傾向がみられる一方で、非常に身長が低い親を持つ子の身長は、親よりも高い傾向があることを見出しました。つまり、非常に身長が高いかまたは低い親の子の身長は、その母集団(データが所属するグループ)の平均身長に「回帰」する傾向がある、という傾向を見出しました。この時に回帰分析算法を利用したので、以来、この分析手法のことを、ゴルドン卿の身長の平均値への「回帰」と関係が無いにも関わらず、「回帰分析」と呼ばれることとなった、とのことです。ちなみに、相関係数が非常に低いとこの傾向があり、「平均回帰」とも呼ばれているそうですが、ビジネス面では、どの程度伸びが期待できるのか、逆に下がってしまうなどの傾向を予測する必要があるので、相関が強くなければ予測の価値は無いようです。

 

 以上この2回で、散布図からお互いの数値に関係がありそうだとか、関係が無いのではという感覚で対応していたものを、より確かなものにするために相関分析を使って関係を求め、関係が強そうなら回帰分析を行うことで予測値が算出できる、というところまでを見てきました。この後は具体的なビジネス利用の事例を紹介して、統計分析のビジネス利用入門としていきます。

まず、相関係数を求めてみます。そこで、たとえば相関係数が0.5以上だったら相関があるとして予測値を求めるために、散布図グラフから近似直線と近似式を求めます。近似式から予測値を計算して実際の値と比較し、この程度の誤差ならば予測値として採用しよう、またはいやできない、ということを関係者で話し合い今後のビジネスに利用するのです。次回は具体的なビジネス上のモデル、得意先別の売上高と取扱品目数に相関があるのか、あるのであれば取扱品目数から売上高を予測して今後の販売戦略をどのようにするのかを検討していきます。

 

NICO情報戦略チーム 星野

 

 

前ページ      3

「いいね!」ボタンを押していただくと、最新情報をお届けできます。

 フィードの購読もできます。

 (NEWS,BLOGのみ)

連載ブログ 

 大人気3rdシリーズ

 

公益財団法人にいがた産業創造機構

産業創造グループ

情報戦略チーム

TEL 025-246-0069

Mail  kns@nico.or.jp