|
|
 |
 |
マーケティングリサーチ研究会

研究会で使用している良書紹介
■ 要約レジュメ
■ はじめての統計学
鳥居泰彦 日本経済新聞社
第1章 統計学はどのような学問か
1.1 統計学とは何か
統計学は大量のデータの中に存在する法則性を扱う分析方法
「統計学」(statistics)とは下記4つに分類される
(1)統計学史(history of statistics)
(2)記述統計学(descriptive statistics)
標本論(sample theory)
標本調査論(sample survey)
統計処理(data processing)
統計的記述(statistical description)等の方法論のこと
(3)推測統計学(statistical inference)
推計学、統計的方法(stastistical method)ともいう
(4)応用 application
経済への応用は、経済統計と計量経済学(econometrics)
1.2 統計学の考え方の基礎
(1)すべての統計的現象(統計学の分析対象となる現象)は、確率分布をする
(2)全ての統計的現象は、母集団(その現象全体)を観察する代わりに標本(母集団の一部分)を観察して、それをもとに母集団の特性を推測して分析する
1.3 統計学の分析概念(その1)−確率と確率分布―
分布(distribution)
「分布する」:ある現象が大小さまざまの大きさで起こること
度数 or 頻度(frequency):観測値が何回観測されたかをカウントしたもの
度数分布表
柱状分布(histogramヒストグラム)
度数分布図 or 確率分布図
絶対度数(絶対頻度):観測された度数そのもの
相対度数(相対頻度):全体に対する割合(比)
確率(probability):ある現象が起こる確かさの程度を割合であらわしたもの統計分析ではパーセントを使わず、割合(比)を使う
確率分布
相対頻度
すべての統計的減少は確率分布をする
確率分布の一つ一つの確率は、どれも0と1の間の値である
0≦P(Xk)≦1
確率分布の一つ一つの確率をすべて加えると必ず1になる
1.4 統計学の分析概念(その2)−母集団と標本―
母集団:ある現象の、あらゆる観測値の集合
無限母集団:母集団の大きさは無限である⇔有限母集団
有限母集団にせよ、無限母集団にせよ、実際に全てを観測することは不可能なの で、その一部を観測する。この一部分の観測データを「標本」(sample)という →標本から得られる情報をもとに母集団の性質を推測する
標本抽出(sampling):標本を観測すること
1.5 標本抽出
標本は母集団の性質をよく表すものであること
そのためには偏りのない標本抽出をすること
無作為抽出or 無作為標本抽出(random sampling):どのような基準から見ても 、偏りのない標本を選ぶ方法
無作為標本(random sample):無作為抽出された標本
観測データ表
標本の数(number of sample)
母集団の要素(element of population):一つ一つの母集団データ
要素番号→母集団のエレメントが100あれば01〜98、99、00と100を00番と読みか えることにより、2桁の要素番号で間に合う
乱数表(random number table):0、1、2・・・9の数字が完全に同じ確率で無作為 に配列してある数表のこと「一様乱数表」「矩形乱数表」ともいう
乱数表はどこから使い始めてもよい。右方向でも左方向でも上でも下でも好きな方向に乱数を拾っていけば「無作為な」数を拾いつづけることができる
復元抽出法:同じ数を何度でも採用する方法
非復元抽出法:同じ数は使わずに捨てる方法
有限母集団から復元抽出をすると、無限母集団からの標本抽出に近い標本が得られる
単純抽出法(単純無作為抽出法、あるいは単純任意抽出法)⇔層化抽出法
1.6 階級分けしたデータの作り方
生のデータ(raw data)⇔階級別データあるいは階級データ(classified data)
観測データ表:生のデータを表にしたもの
度数分布表:級別データを表にしたもの
分布の幅(R:range)=最大値(max.)−最小値(min.)
階級間隔(級間隔)class interval
階級の数(級の数)number of classes
境界値(class boundary):一つ一つの級の境目の値
階級値(class mark):境界と境界の中間、すなわち各級の中央の値 補論 演算についての補習
演算には論理計算と数値計算がある
論理計算:計算のステップを式と記号で書いたもの。計算の内容を理解したり公式で表したりする為に必要
数値計算:実際に数値(データ)を使って計算する
Σ「シグマ」:「合計計算をする」あるいは「合計計算をした結果」 合計欄は正確にΣXi
第2章 標本分布の特性値
2.1 いろいろな形の分布
分布の位置は、中心的傾向の特性値でとらえる:平均、中央値、最頻値 分布の広がりは、変動の特性値でとらえる:分散、標準偏差、変動係数、分布の歪み
歪みの無い分布=偏りの無い分布、釣鐘型=ベルシェイプ
右に歪んでいる分布=プラス方向に非対称=正の非対称=逆Jシェイプ 左に歪んでいる分布=-方向に非対称=負の非対称=Jシェイプ
分布の頂上(ピーク)の形による違い
頂上が平らな分布=矩形分布=一様分布
単峰分布=ユニ・モーダル分布(uni-modal distribution)
双峰分布=バイ・モーダル分布(bi-modal distribution)
多峰分布=マルチ・モーダル分布(multi-modal distribution)
2.2 分布の特性値
分布の特性値:分布の特徴を示す統計的指標のこと
中心的傾向(central tendency)の特徴
中央値(別名:中位数median):分布をちょうど2等分する値
最頻値(別名:並数mode):最も度数が高いところ
平均(別名:平均値mean or avarage or sample mean)=標本平均
変動(variation)の特性値
偏差(deviation):平均からの乖離
分散(variance)=標本分散
標準偏差(SD:standard deviation)=標本標準偏差
標準偏差は観測データと同じ単位
変動係数(coefficeint of variation)
標準偏差を平均で割ったもの
標準偏差が平均の何倍であるかを表す
異なる標本の変動を比較するのに有効
第3章 確立と確率分布
3.1 このテーマの重要性
3.2 確率
ある事象(event)が起こる確率は、P( )=0.XXXXXXという式で表す
さらに一般化「ある現象が起こる確率はpである」
P(E)= p
小文字のpは具体的にいくらの値であるかわからないが、一定の確率値であることを表すときに用いられる
・古典的確率(理論的確率)
・経験的確率(統計的確率):同一条件の下で、試行(実験)の回数を増やして いくと、ある事象が起こる確率は一定の値に近づく
ある事象Eが起こる確率=ある事象Eが起こる度数÷考えられる全ての度数
事象が起こる確率=P(E)
事象Eが起こる度数=n(E)
全ての度数=N
P(E)=n(E)/N
階乗(factorial、ファクトリアル、記号は!)
順列(Permutation、パーミュテーション、記号はnPr)
組み合わせ(Combination、コンビネーション、記号はnCr)
順序はどうでもよいから選ばれる選ばれ方
n人が並ぶ並び方(=n人中n人の順列)
n人中r人の順列
n人中r人を選ぶ組み合わせ
3.3 確率変数と確率分布
確率変数:確率分布に従って起こる変数のこと
離散型確率変数(不連続確率変数)→離散型確率分布
連続的確率変数→連続型確率分布
離散型確率変数:変数の値が数で表せるもの(サイコロの目、男女の性別を1、2など数字で区別する場合)
連続的確率変数:測定尺度をいくらでも細かくできる変数は、全て連続的変数
(人間の身長など)
3.4 二項分布
3.5 ポアソン分布
第4章 一様分布と正規分布
4.1 一様分布
4.2 正規分布
第5章 標本平均の分布と母平均の推定
5.1 統計的有意性
5.2 標本平均の分布
5.3 母平均の推定
第6章 t分布と母平均の推定
6.1 t分布(Studentのt分布)
6.2 母平均の推定(母標準偏差が未知で、小標本の場合)
6.3 母平均の推定(母標準偏差が未知で、大標本の場合)
6.4 母平均の推定のまとめ
6.5 母平均の推定に必要な標本のサイズ
第7章 x2分布と母標準偏差の推定
7.1 x2分布(カイ二乗分布)
7.2 母標準偏差の推定
7.3 母数の推定の方法のまとめ
第8章 仮説検定
8.1 統計的仮説検定の考え方
仮説の検証(proof of hypothesis):仮説を立ててそれを証明すること
→統計学では仮説検定(test of hypothesis)もしくは統計的仮説検定と呼ばれる
仮説検定が必要な場合
1.主張すべき理論や主張すべき事柄をはっきりとらえることが困難な場合→主張すべき理論や主張すべき事柄に対立する仮説を立てて、その仮説の検定を行い、それが肯定されない限りは、もとの主張すべき理論や主張すべ き事柄を正しいと考える
2.主張すべき理論や主張すべき事柄をはっきりとらえることができる場合→ 主張すべき理論や主張すべき事柄を仮説とし、それを裏付けることができたならば、その主張すべき理論や主張すべき事柄を正しいと考える
仮説検定の手順
1.仮説を設定する 帰無仮説と対立仮説
8.2 母平均に関する仮説検定―対立仮説が不等式の場合―
8.3 応用
第9章 相関分析
9.1 相関関係と相関分析
9.2 単純相関関係数の計算(Raw dataのケース)
9.3 単純相関関係係数の計算(Classified dataのケース)
第10章 回帰分析
10.1 回帰分析の概要
10.2 OLS(最小二乗法)
10.3 Classified dataのOLS
10.4 もっと詳しい回帰分析―回帰係数の有意性の検定―
|
|