2014年

8月

18日

データ分析の勧めⅢ(ちょっぴり統計分析~相関と回帰の紹介~)~Excelを使って自社の業務データを整理・分析してみよう! その2(P2)

 

 では早速、図2-1の近似式を見つけていきます。Excelでは多様な方法があり、前回使った「データ分析」機能も使えるのですが、今回は散布図グラフから直接見つけ出す方法で近似式を設定して、近似直線をグラフ上に描いていきます。

 

① 体重-ウェスト散布図グラフのXY軸にプロットした点をクリックして選択された印 

 (下図ではプロット点を小さな丸が四方を囲んでいる)が出たら、右クリックをして機

 能メニューの画面を出します。この機能で「近似曲線の追加」をクリックします。

 

②シートの右端に「近似曲線の書式設定」というダイアログ(入力画面)が表示されるの

 で、「線形近似」、「グラフに数式を表示する」、「グラフにR-2乗値を表示する」に

 チェックを入れます。

 

③散布図グラフに近似直線(回帰直線)と近似式、R-2乗値が表示されます。

 

 ここでR-2乗値を決定係数と呼びますが、これは相関係数を2乗したものです。2乗することで±の方向(右肩上がりか下がりか)を無くして、関係の強弱だけを示したもので基本的には同じ数値です。

R=0.73421   R-2=0.73421×0.73421≒0.5391

ここで表された近似式 y = 0.3516x + 43.804 を使って予測値を算出します。

 

 このシートでは予測値と実際値の差異も算出して誤差の大きさ(誤差率)をチェックし、予測値の精度を具体的に見ています。

 先ほどの70kgでの予測値は68.4cmになり、「エイヤッ」で線を引いて予測した72cmよりはかなり少なめです(ウェストで4cmは大きいですよね)。サンプルの中に実際に70kgの人がいたのですが、この人のウェスト寸法は70cmでした。予測値との誤差率は2.26%です。このくらいですと予測値の精度もかなり高いと見ても良いのではないでしょか。以降はこの手法を使ってビジネスでの使い方を検討していきます。

 

次のページ  余談ですが・・・

 2 

 

「いいね!」ボタンを押していただくと、最新情報をお届けできます。

 フィードの購読もできます。

 (NEWS,BLOGのみ)

連載ブログ 

 大人気3rdシリーズ

 

公益財団法人にいがた産業創造機構

産業創造グループ

情報戦略チーム

TEL 025-246-0069

Mail  kns@nico.or.jp