分散分析1(一元配置分散分析)

分散分析とは

  2群間の平均の差を検定するにはt検定を用いました。分散分析では、3群間以上の平均の差を検定することができます。分散分析は論文でよく見られます。分散分析の手法による表現の違いで、ANOVA(Analysis of Variance)やGLM(General Linear Model:一般線形モデル)やONEWAY(一元配置分散分析)などがありますが、すべて分散分析に分類されます。

 分散分析の考え方は、田中ら(1989)によると次のように説明されています。まず、2条件A・Bの平均の有意差検定を考えるとき、分散分析では、条件Aと条件Bのデータを同一の母集団からの標本と見なしておきます(帰無仮説)。この母集団の真の値の推定値として、条件Aと条件Bの「平均の平均」を求め、これを大平均と呼びます。分散分析は、この大平均からのズレに注目します。

 上図で、条件Aに所属するデータ1個(●)の、大平均からのズレ@に注目すると、ズレ@はズレAとズレBの2つの部分に分解されることが分かります。このズレAは、このデータが所属する条件Aの中心(XバーA)がそこまで移動したので、それにつれてデータが一緒に移動した量となります。それに対してズレBは、なんの影響で生じたのかよくわからないので、このデータに加わった偶然の影響とみます。したがって、次のような式が成り立ちます。

 @データの大平均からのズレ = A平均の差の影響によって生じたズレ + B偶然の影響によって生じたズレ

 分散分析は、このようなズレの分解を全データについて行います。そして、データのズレ(データの値)を支配したのは、平均の差の影響力(A)なのか、それとも偶然の影響力(B)なのかを比較します。もし、Aの影響力が大きければ、平均の差は文字どおり偶然以上である(有意差がある)ことになります。

 このとき、ズレを表す統計量として分散(ズレの値を二乗したもの)を用います。なぜなら、ズレの値は正と負の両方があるからです。このように、ズレを分散に換算して分解しようとするので、「分散の分解」すなわち分散分析と呼ばれます。

  上の例はデータに対応がない場合(独立したサンプル)の2条件の比較の場合を取りあげています。分散分析では、データに対応がある場合や、3個以上の平均の比較や「2条件×2条件」 のような交差した比較も分析することができます。それぞれ計算方法も少しずつ異なります。 

  被験者間計画 被験者内計画
1要因 一元配置分散分析 一般線形モデル(反復測定)
2要因 一般線形モデル(1変量)

 要因(Factor)とは、データの値を変化させる原因のことで、人為的な条件設定による「実験要因」を意味します。

 水準(Level)とは、要因を構成する条件のことです。1要因は最低でも2水準以上で構成されます。

 独立変数とは、要因または水準を表し、従属変数とはデータの値のことです。

  たとえば、ある商品の売上額は、天気(晴れ・くもり・雨)と曜日(平日・休日)で影響されるかを調べる場合、天気と曜日は要因となり、天気には3水準、曜日には2水準が割り当てられることになります。この天気や曜日が独立変数で、売上額が従属変数となります。

 

 まずは、一元配置分散分析について詳しく見ていきましょう。

 

仮説1:英語の成績は体調で差がある

 帰無仮説:英語の成績は体調で差がない

 使用するデータ:data10

 

例題1:英語1に与える体調の影響を分析しましょう。

操作手順

1.「分析」-「平均の比較」-「一元配置分散分析」をクリックして表示される「一元配置分散分析」ダイアログボックスで、「従属変数リスト」に「 英語1」、「因子」に「体調」を 入力します。

2.「その後の検定」ボタンをクリックして表示される「一元配置分散分析:その後の多重比較」ダイアログボックスで、「Tukey の b」 (テューキー)にチェックをし、[続行]ボタンをクリックします。

3.[OK]ボタンをクリックします。

 

結果の読み方

1.「分散分析」の出力結果欄で、F値、自由度、有意確率の数字を読み取ります。この例では、F値が21.299、自由度が338、有意確率が.000と読み取れます。この有意確率はp<.001ですから、この4つの平均値のどこかに有意差があるとみなせます。

2.分散分析で有意であった場合(5%未満)のみ、「その後の検定」の「等質サブグループ」の表をみます。 すると、各平均点が表示され、それらが3グループに分類されていることがわかります。同じグループに属しているものは有意差がなかったもので、異なるグループに属しているもの同士には有意差があります。このことから、「絶不調」と「不調」の間には有意差がなく1グループと分類され、「好調」や「絶好調」のそれぞれの組み合わせ間で有意差があることがわかります。 同様に、「好調」と「絶好調」の間にも有意差があります。

レポート記述例

 英語1における体調の影響を分析するために分散分析を行った。その結果、体調の効果は有意であった(F(3,38)=21.299 ,p<.001)。Tukey bを用いた多重比較によれば、「絶好調」と「好調」と「不調・絶不調」の間に有意差があり、体調が良いと英語1の成績が良いことが分かった。

注:分散分析の結果は、「F(グループ間の自由度,グループ内の自由度)=F値」という書式で表現されています。

引用文献:

・田中敏・山際勇一郎著 1989 「ユーザーのための教育・心理統計と実験計画法」 (教育出版)