手軽にt検定の結果だけを得たい人のためのMicrosoft Excelを使った方法です.
Excelの[データ分析]機能を使うので[ファイル][オプション][アドイン]から[分析ツール]を設定しておいてください. バージョンによって操作方法は異なるかもしれません. ここではExcel 2010を使用しています. Excelがない場合は, LibreOfficeの表計算ソフトcalcでも似たような機能があります. 値を変えながらの再計算ではこちらの方が便利かもしれません.
データ(母集団が正規分布に従うものとする)
・比較データに対応有り → 対応のあるt検定
・比較データに対応無し → 等分散性のチェック(F検定)
└ 等 分 散 → 等分散のt検定
└ 不等分散 → ウェルチのt検定(不等分散のt検定)
どの場合の検定も流れは同じで, 以下の t値 と p値 の算出方法が異なるだけです.
① 帰無仮説 H0, 対立仮説 H1, 有意水準α(境界確率)を設定する.
② t値(検定統計量)または p値(検定確率値)を求める.
③ p < α ならば H0 を棄却し H1 を採用する. または, t分布表などから求めた値から, t が棄却域に入っていたら H0 を棄却し H1 を採用する.
以下, 例題では「比較データに対応無し」の場合を扱かっています.
サンプルデータ
No |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
グループA |
99 |
105 |
90 |
126 |
99 |
115 |
99 |
112 |
118 |
109 |
グループB |
90 |
104 |
98 |
91 |
105 |
95 |
102 |
91 |
まずt検定に入る前に「F検定(等分散性の検定)」で2標本の母分散が等しいかどうか検定します.
・Excelの[データタブ]→[データ分析]→[F 検定: 2 標本を使った分散の検定分析]を選択.
・有意水準(α)5%で適当な位置に出力.
うまくいけば, 以下のような結果がえられます. 面倒な計算はすべてやってくれます.
F-検定: 2 標本を使った分散の検定 |
グループA |
グループB |
|
平均 |
107.2 |
97 |
分散 |
117.73 |
37.71 |
観測数 |
10 |
8 |
自由度 |
9 |
7 |
観測された分散比 |
3.12 |
|
P(F<=f) 片側 |
0.07 |
|
F 境界値 片側 |
3.68 |
いろんな項目がありますが, 注目するのはp値だけです.(P(F<=f) 片側 の項目)
母分散の検定に入ります.
帰無仮説:「2標本の母分散は等しい」
対立仮説:「2標本の母分散は等しくない」
とすると, 表中のp値から p > 0.05なので帰無仮説は棄却できません.
不本意ではありますが帰無仮説を採用しないと次に進まないので帰無仮説を採用します.
よって, グループAとグループBの母分散は等しいとします.
以下, 等分散のt検定に入ります. ここからが本題です.
・Excelの[データタブ]→[データ分析]→[t 検定: 等分散を仮定した 2 標本による検定]を選択.
・有意水準(α)5%で適当な位置に出力.
うまくいけば, 以下のような結果がえられます. 面倒な計算はすべてやってくれます.
t-検定: 等分散を仮定した2標本による検定 |
グループA |
グループB |
|
平均 |
107.2 |
97 |
分散 |
117.73 |
37.71 |
観測数 |
10 |
8 |
プールされた分散 |
82.73 |
|
仮説平均との差異 |
0 |
|
自由度 |
16 |
|
t |
2.36 |
|
P(T <= t) 片側 |
0.02 |
|
t 境界値 片側 |
1.75 |
|
P(T <= t) 両側 |
0.03 |
|
t 境界値 両側 |
2.12 |
注目するのはp値だけです.(P(T < = f) 片側(両側) の項目)
t検定に入ります.
帰無仮説:「2標本の母平均は等しい」
対立仮説:「2標本の母平均は等しくない」
とすると, 表中のp値から片側両側ともに p < 0.05 なので帰無仮説を棄却し対立仮説を採用することにします.
よって, グループAとグループBの2標本の母平均は等しくない と結論します.
サンプルデータ
No |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
グループA |
118 |
101 |
122 |
74 |
120 |
89 |
23 |
4 |
139 |
90 |
グループB |
82 |
107 |
108 |
88 |
79 |
82 |
92 |
113 |
例1と同様にまず「F検定(等分散性の検定)」を行います.
・Excelの[データタブ]→[データ分析]→[F 検定: 2 標本を使った分散の検定分析]を選択.
・有意水準(α)5%で適当な位置に出力.
以下のような結果がえられます.
F-検定: 2 標本を使った分散の検定 |
グループA |
グループB |
|
平均 |
88 |
93.875 |
分散 |
1925.7778 |
182.6964 |
観測数 |
10 |
8 |
自由度 |
9 |
7 |
観測された分散比 |
10.5409 |
|
P(F<=f) 片側 |
0.0026 |
|
F 境界値 片側 |
3.6767 |
注目するのはp値だけです.(P(F<=f) 片側 の項目)
母分散の検定に入ります.
帰無仮説:「2標本の母分散は等しい」
対立仮説:「2標本の母分散は等しくない」
とすると, 表中のp値から p < 0.05なので帰無仮説を棄却し対立仮説を採用します.
よって, グループAとグループBの母分散は等しくないとします.
以下, 不等分散のt検定(ウェルチのt検定)に入ります. ここからが本題です.
・Excelの[データタブ]→[データ分析]→[t 検定: 分散が等しくないと仮定した 2 標本による検定]を選択.
・有意水準(α)5%で適当な位置に出力.
以下のような結果がえられます.
t-検定: 分散が等しくないと仮定した2標本による検定 |
グループA |
グループB |
|
平均 |
88 |
93.875 |
分散 |
1925.7778 |
182.6964 |
観測数 |
10 |
8 |
仮説平均との差異 |
0 |
|
自由度 |
11 |
|
t |
-0.4003 |
|
P(T <= t) 片側 |
0.3483 |
|
t 境界値 片側 |
1.7959 |
|
P(T <= t) 両側 |
0.6966 |
|
t 境界値 両側 |
2.201 |
注目するのはp値だけです.(P(T < = f) 片側(両側) の項目)
t検定に入ります.
帰無仮説:「2標本の母平均は等しい」
対立仮説:「2標本の母平均は等しくない」
とすると, 表中のp値から片側両側ともに p > 0.05なので帰無仮説は棄却できません.
よって, グループAとグループBの「2標本の母平均は等しい」は誤っているとはいえない(何もわからない) と結論します.
*帰無仮説が棄却できない場合の最終的な結論はデータの性質や周りの状況でいろいろ考えられます.
*グループAのNo.8の値4は, 他のデータと比較すると本来は捨てるべき値かもしれませんが, 外した場合でも結果は同じとなりました.(p値は増える)