ベスパライフ

日記・備忘録。ベスパもってないです。

検定とはなんぞや

検定についての備忘録。「Excelでできる統計解析」という本を参考にした。

検定とは

ある農園では、収穫したりんごの平均の重さが250gであった。もっと大きいりんごを収穫したいと考え、肥料Aを使って栽培した。翌年、収穫したりんごの平均の重さは255gになった。
前年とくらべてりんごの重さが平均5g増加したが、これは肥料Aの効果と言っていいのか?
「肥料Aには効果があった」という仮説と、「肥料Aには効果がなかった」という二つの仮説を立てて、どちらが正しいか統計的に検証する。それが検定。

帰無仮説と対立仮説

肥料Aを与えたことによってりんごの平均の重さがμになったとする。
肥料Aに効果があればμ>250となる。
肥料Aに効果がなければμ=250となる。
前者を対立仮説(H_0)、後者を帰無仮説(H_1)と呼ぶ。
また別の対立仮説として、μ≠250とも書ける。
どうやら「>」や「≠」で記述する仮説を対立仮説、「=」で記述すると帰無仮説になるらしい。

両側検定と片側検定

上記のように対立仮説は状況によって書き方が変わる。書き方が変われば、検定の方法も変わる。大きく分けて「両側検定」と「片側検定」がある。

従来のりんごの平均の重さをμ_0、肥料Aを与えた後のりんごの平均の重さをμとすると、「肥料Aはりんごに影響を与えたか」を調べるための帰無仮説H_0と対立仮説H_1は次のように書ける。

H_0:μ=μ_0H_1:μ≠μ_0

また、「肥料Aはりんごの成長を促進したか」を調べるための帰無仮説H_0と対立仮説H_1は次のように書ける。

H_0:μ=μ_0H_1:μ>μ_0

このように、対立仮説H_1が「≠」で記述されるときを両側検定と呼び、「>」で記述するときを片側検定と呼ぶ。

検定の手順

仮説をたてる

帰無仮説と対立仮説を立てる。対立仮説は両側検定か片側検定のどちらを使うかも考慮する。

両側検定を使うシーンとしては、「影響があったか」や、「変化があったか」といった、2つの値に差があるかどうかを調べるときに使う。

片側検定を使うシーンとしては、「値が大きく(小さく)なったか」といった、影響によって大きくなったのか小さくなったのかを調べるときに使う。

検定統計量を求める。

どの値を検定に使うかを決める。りんごの例で言うと平均値を使っている。ここで使われる統計量のことを検定統計量と呼ぶ。

検定統計量から採択/棄却を判断する

検定統計量は標本から計算されるので、確率変数になっている。よって検定統計量は何らかの確率分布に従っている。

標本から検定統計量を計算した結果、その値が確率分布の中央らへんになっていれば、「十分に起こりえる」として、帰無仮説は棄却されない。
りんごの例で言うと、帰無仮説が棄却されない場合、「肥料Aを与えたあとも平均の重さが変化したとは言えない」ということが示される。

一方、値が確率分布の端っこにある場合、「別の集団からの検定統計量がありそう」ということで、帰無仮説は棄却される。
りんごの例で言うと、「肥料Aを与えた後は、平均の重さに変化がないとはいえない」ということが示される。

有意水準

検定では検定統計量を算出して、その値が確率分布のどの位置にあるかで帰無仮説が棄却されるかされないかを決定する。
この「確立分布のどの位置にあるか」というのを判断するラインを有意水準と呼ぶ。
「検定統計量が端から2.5%以内の確率の範囲に位置したら、帰無仮説を棄却する」というように決められる。有意水準を境目として、帰無仮説が棄却される領域を棄却域、採択する領域を採択域と呼ぶ。

有意水準5%で両側検定をする場合、確立分布の両側2.5%ずつを境目とする。
有意水準5%で片側検定をする場合、確立分布の片側5%を境目とする。

だいたい有意水準は5%だが、1%でする場合もあるらしい。