2014年

8月

06日

データ分析の勧めⅢ(ちょっぴり統計分析~相関と回帰の紹介~)~Excelを使って自社の業務データを整理・分析してみよう! その1(P3)

 

 ここからはデータ分析機能を使って女子大生のデータ項目それぞれの相関関係を調べていきましょう。

 

①まず図1-1の女子大生のデータシートを開き、データタブのデータ分析をクリックすると下記のような「データ分析」メニュー画面が表示されますので、ここから「相関」の機能を選択します。

 

②「相関」ダイアログが表示されますので、入力範囲(ここではB1からG201)、「先頭行をラベルとして使用」の選択、出力先を同じシートのI1にセットしてOKボタンをクリックします。

 

下記のようにB列からG列までのそれぞれの相関関係が表で示されます。

 

 

 いかがでしょか。ここで表示された相関係数が「1」に近い項目の間柄は相関が強く、「0」に近づくほど関係は薄れます。一つの目安としては,相関係数Rの大きさ(絶対値)と相関の程度の表現の対応関係は以下のように考えれば良いといわれています。

  相関係数 相関の強さ  
   1.0  ≧|R|≧  0.7   高い相関がある  
   0.7  ≧|R|≧  0.5    やや高い相関がある  
   0.5  ≧|R|≧  0.4  中程度の相関がある  
   0.4  ≧|R|≧  0.3  ある程度の相関がある     
   0.3  ≧|R|≧  0.2  弱い相関がある  
   0.2  ≧|R|≧  0.0  ほとんど相関がない  

(相関係数を統計学では「R」で表します)

 

 この表をもとに相関分析した結果を評価すると、一番高い相関係数を示しているのは体重とウェストでR=0.73、次が体重とヒップでR=0.66、さらに体重とバストでR=0.55、体重と身長も同じR=0.55となっています。体重と3サイズの関係はかなり強いものがあるようですが、特に体重とウェストの関係は高い相関があるようで、若い女性ならずとも気になるところです。

 散布図でも相関があるかどうかはっきりしなかった自分の身長と結婚したい男性の身長の関係ですが、R=0.41ですから中程度には相関がありそうですが、先に示した3つの散布図のなかでは一番低い相関係数となっております。

 

 以上のように相関係数は2つの変数の相関すなわち類似した関係を示す数値ですが、これをベースに、体重が○○Kgになったらウェストは○○cmになる、という予測式を作成して具体的に予測数値を算出する方法として回帰分析という手法がありますが、次回はこの回帰分析の使い方を説明してから、相関と回帰の具体的なビジネス利用へと話を進めていきたいと思います。

 

NICO情報戦略チーム 星野

 

 

前ページ      3

「いいね!」ボタンを押していただくと、最新情報をお届けできます。

 フィードの購読もできます。

 (NEWS,BLOGのみ)

連載ブログ 

 大人気3rdシリーズ

 

公益財団法人にいがた産業創造機構

産業創造グループ

情報戦略チーム

TEL 025-246-0069

Mail  kns@nico.or.jp