2014年

1月

16日

データ分析の勧めⅡ ~Excelを使って自社の業務データを整理・分析してみよう!~ その1

第1回 ヒストグラムを作成しよう①(ヒストグラムの考え方)

    分けて考える

当シリーズはデータ分析とは言いながら、あえて統計処理に触れてきませんでした。一番の理由はExcelのデータ分析ツールや統計関数の使いこなしのためには統計学の知識が必要なことです。多変量解析などの高度なものだけでなく、標準偏差や確率など普段耳にする統計用語も避けてきました。統計学の知識が未熟なままで結果を求めても、その数値の正確な意味や使い方の判断があいまいになると考えたからです。

 

また、難しいことを言うと、ビジネス上でのデータ分析は相関を重視し因子は後から考える、という傾向がありました。相関とは「二つのものの間に関連があること、互いに影響し合うこと」であり、因子は「物事を成り立たせる原因となる各要素」のことで、まずはデータ間の関わりを見て傾向を読み取ってとりあえず対応し、どうしてそうなったのかという要因は後で考えるということです。最近はビッグデータやその扱いを担当するデータサイエンティストの重用など、統計学の専門家がビジネスデータの分析を行う傾向が顕著になってきて、相関だけでなく因子分析も同時に進めて効果的な対応が早くなっていると言われます。しかしそれは中小企業ではおいそれと出来ないことで、まずは手に入る明細データの集計・整理から入って傾向を掴むことから始めよう、というのが前回ご説明した「データ分析の勧め」でした。

 

今回も統計処理ではなくデータの集計・整理を中心に、「分ける」ということに重きを置いて統計の知識が無くてもできる「データ分析」を行っていきます。

 

前置きが長くなりましたが、タイトルにいきなりヒストグラムという言葉が入っていて、これはもろに統計学の項目です。日本語では「度数分布」といい、数値の集まりがあったとき、どんな値がどれくらいあるかを図1-1のように棒グラフにしたものを言います。

 

図1-1(ある大学の研究室の女子大生200人の身長を3cm刻みの区間で集計整理)
図1-1(ある大学の研究室の女子大生200人の身長を3cm刻みの区間で集計整理)

この時、棒を立てる1つ1つの場所を区間と言い、各区間に入る数値の個数を「度数」と言います。どの区間に、どれだけの度数があるか、全体の様子を「度数分布」と言い、ヒストグラムとは度数分布を棒グラフにしたもの、ということです。

 

簡単なようですが、Excelのデータ分析ツールの「ヒストグラム」という機能を使うと以下のようなものになります。

図1-2 分析ツールによるヒストグラム作成例
図1-2 分析ツールによるヒストグラム作成例

いかがでしょうか。ちょっとやっかいなのはデータ区間を自分で設定しなければならないことですし、ちょっと馴染みのない言葉も出てきて取っ付きにくくないですか。でも良く見ると明細データの各区間での集合値の棒グラフですよね。これを、統計処理などと構えずに、ピボットテーブルで簡単に作ってしまおう、というご紹介なのです。

 

 次ページ  ヒストグラムは何に役立つ?
  1     2     3     次ページ>>  

「いいね!」ボタンを押していただくと、最新情報をお届けできます。

 フィードの購読もできます。

 (NEWS,BLOGのみ)

連載ブログ 

 大人気3rdシリーズ

 

公益財団法人にいがた産業創造機構

産業創造グループ

情報戦略チーム

TEL 025-246-0069

Mail  kns@nico.or.jp