2014年

8月

06日

データ分析の勧めⅢ(ちょっぴり統計分析~相関と回帰の紹介~)~Excelを使って自社の業務データを整理・分析してみよう! その1

第1回 相関分析に触れてみよう

 

 前回のⅡのシリーズ冒頭で、「当シリーズはデータ分析とは言いながらあえて統計処理には触れません」と宣言して、ヒストグラム(データの分布を棒グラフで表したもの)と、過去にも何度か紹介した散布図を使ってデータ群の区分をして、「分ける」ことでデータに意味付けをすることについて説明をしました。これはこれで好評だったのですが、ビジネスに役立つ易しい統計処理方法を教えて欲しいというご要望がありましたので、ビジネスに役立つ統計分析の代表として相関と回帰分析を取り上げ、具体的な事例を使って少しでも役立つ分析手法を提示したいと思います。

 

 「統計分析って予想でしょう」などと言われるので、「せめて予測と言って」と混ぜっ返すのですが、予想は「これから起こることについて考えをめぐらし,おしはかること」、予測は「将来の出来事や状態を前もっておしはかること」と辞書(大辞林)に同じように書いてあり、予想は「予想が的中する」「競馬の勝ちを予想する」、一方、予測は「米の収穫高を予測する」と使用例がありました。予測は数字を絡めて具体的な数値を見つけ出すことのようで、ここでは統計処理を使った予測とは、「あるデータに基づいて、未来における実現すると考えられる特定の変数の値を想定することをいう」とでも定義しておき、統計分析による予測の一端を学んでみましょう。

 

 ということでまずは相関からで、相関関係があると言うと、2つのデータの間に何らかの法則がある関係のことを言います。「a が増えるとb も増える。x が増えるとy が減る」という関係です。2つのデータの間で、一方のデータが変化すると、他方もそれに応じて変化する関係を統計的に分析することを相関分析と言います。相関関係は、一方が増加すると、他も増加する正の相関関係と、一方が増加すると他は減少する負の相関関係があります。

 

 ここで、理解を深めるために具体的な事例により相関を見ていきましょう。データは「データ分析の勧めⅡ」の第1回目に示しました女子大生の身長、体重、3サイズ、結婚したい男性の身長まで載せた明細データです(このデータは日本女子大学数学科の某研究室のもので1982年発刊の「総計学の基礎」というテキストに載っていたものだということが分かりました)。

 

図1-1(Ⅱの1図1-3より)

 

 このデータを使って身長と体重、体重とウェスト、自分の身長と結婚したい男性の身長の3組について散布図を作って関係がありそうかどうか概要を見てみます。

 

図1-2(身長と体重、体重とウェスト、結婚したい男性身長と自分の身長)

 

 いかがでしょうか。身長と体重、体重とウェスト、自分の身長と結婚したい男性の身長、それぞれの関係の度合いをどのように感じたでしょうか。散布図から見る限り、一番関係が強そうなのは体重とウェストのようですね。自分の身長と男性の身長はバラつきが大きいようで、身長が高いから相手も高く、低いから相手も低いとはならないようです。

「いいね!」ボタンを押していただくと、最新情報をお届けできます。

 フィードの購読もできます。

 (NEWS,BLOGのみ)

連載ブログ 

 大人気3rdシリーズ

 

公益財団法人にいがた産業創造機構

産業創造グループ

情報戦略チーム

TEL 025-246-0069

Mail  kns@nico.or.jp