Читайте также:
|
|
Рассмотрим применение методов множественного сравнения с использованием данных примера 13.1. Применим метод Шеффе для парного сравнения средних и метод контрастов для сравнения третьего уровня фактора с двумя другими его уровнями.
Повторим все операции, которые мы совершали для проведения однофак-торного AN OVA:
1. Выбираем Analyze > Compare means > One Way ANOVA...
2. В открывшемся окне диалога выделяем и переносим из левого окна пе
ременные при помощи кнопки >: зависимую переменную (prod) в правое
верхнее окно (Dependent List); переменную, соответствующую фактору (f 1), —
в правое нижнее окно (Factor). Нажимаем Options... В открывшемся окне диа
лога отмечаем флажком: Descriptive (Описательные статистики), Homogeneity
of variance test (Тест однородности дисперсии), Means plot (График средних
значений). Нажимаем Continue (Продолжить).
ЧАСТЬ П. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
Для парного сравнения среднихвокне диалога One way ANOVA дополнительно нажимаем кнопку Post Нос... (Постфактум, то есть после отклонения Но). В открывшемся окне диалога отмечаем флажком необходимый нам метод сравнения: Scheffe (Шеффе) (при желании можно было бы выбрать и другие методы, в частности те, применение которых не требует однородности дисперсии сравниваемых выборок). Нажимаем Continue (Продолжить).
Для применения метода контрастов в окне диалога One way ANOVA дополнительно нажимаем кнопку Contrasts... (Контрасты...). В открывшемся окне диалога отмечаем флажком Polynomial (Полином) и последовательно задаем коэффициенты полинома для контраста. Последовательность коэффициентов должна соответствовать последовательности уровней фактора (от меньшего к большему). Сумма коэффициентов должна быть равна 0. Вводим в окне Coefficients (Коэффициенты) сначала 1, нажимаем Add (Добавить), затем 1, снова Add, затем — 2 и Add. В окне ниже увидим значения коэффициентов и ниже — их сумму (Coefficient Total: 0.00). Если сумма равна 0, значит коэффициенты назначены верно. После этого можно составить другой контраст, для чего следует нажать клавишу Next (Следующий). После назначения контрастов нажимаем Continue (Продолжить). Нажимаем ОК.
3. Получаем результаты.
Дополнительно к тем результатам, которые были описаны для одномерного ANOVA, получим следующие результаты:
А) Коэффициенты контраста:
Contrast Coefficients
Contrast | Fl | ||
1.00 | 2.00 | 3.00 | |
- 2 |
В) Результаты статистической проверки контраста: Contrast Tests
Contrast | Value of | Std. | t | df | Sig.(2- | ||
Contrast | Error | tailed) | |||||
VOSPR Assume | -6.0000 | 1.73205 | -3.464 | .005 | |||
equal | |||||||
variances | |||||||
Does not | -6.0000 | 1.73205 | -3.464 | 8.000 | .009 | ||
assume | |||||||
equal | |||||||
variances |
Столбец Contrast показывает номер контраста (1): их будет столько, сколько было введено (в данном случае он один). Value of Contrast (Значение контраста) — разность, статистическая значимость которой проверяется. Std. Error — стандартная ошибка контраста, t — значение /-критерия, df — число степеней свободы, Sig. —/ьуровень значимости контраста. Первая строчка таблицы дает результаты контраста для случая, когда диспер-
ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)
сии сравниваемых групп (уровней) однородны, а вторая — для случая неоднородности дисперсий по критерию Ливена.
Получены те же результаты, что и при вычислении «вручную» (пример 13.3). По результатам можно сделать вывод о статистически достоверно более высокой продуктивности воспроизведения слов при третьем условии, по сравнению с двумя другими условиями.
С) Результаты парных сравнений средних значений по методу Шеффе:
Post Hoc Tests Multiple Comparisons Dependent Variable: VOSPR Scheffe
(I) Fl | (J) Fl | Mean Difference (I-J) | Std. Error | -Sig. | 95% Confidence Interval | |
Lower Bound | Upper Bound | |||||
1.00 | 2.00 | -2.0000 | 1.00000 | .178 | -4.7876 | .7876 |
3.00 | -4.0000 (*) | 1.00000 | .006 | -6.7876 | -1.2124 | |
2.00 | 1.00 | 2.0000 | 1.00000 | .178 | -.7876 | 4.7876 |
3.00 | -2.0000 | 1.00000 | .178 | -4.7876 | .7876 | |
3.00 | 1.00 | 4.0000 (*) | 1.00000 | .006 | 1.2124 | 6.7876 |
2.00 | 2.0000 | 1.00000 | .178 | -.7876 | 4.7876 |
* The mean difference is significant at the.05 level.
Также, как и для вычислений «вручную» (пример 13.2), получено статистически значимое различие между уровнями 1 и 3 (S ig. = 0,006).
Дополнительно выдаются результаты проверки однородности дисперсии для сравниваемых выборок:
Homogeneous Subsets
VOSPR
Scheffe
Fl | N | Subset for alpha =.05 | |
1.00 | 5.0000 | ||
2.00 | 7.0000 | 7.0000 | |
3.00 | 9.0000 | ||
Sig. | .178 | .178 |
Means for groups in homogeneous subsets are displayed. a Uses Harmonic Mean Sample Size = 5.000.
Результаты демонстрируют отсутствие статистически достоверных различий дисперсий 1 и 2 (Sig. = 0,17 8), 2 и 3(Sig. = 0,17 8) выборок, что убеждает в корректности парных сравнений средних значений.
ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
МНОГОФАКТОРНЫЙ ANOVA
Многофакторный ANOVA предназначен для изучения влияния нескольких факторов (независимых переменных) на зависимую переменную и часто обозначается в соответствии с количеством факторов и числом их градаций. Например, обозначение ANOVA 3x2x2 свидетельствует о трехфакторном ANOVA (число градаций: первого фактора — 3, второго фактора — 2, третьего фактора — 2), который применяется для сравнения 12 групп (условий) (так как 3x2x2 = 12).
Принципиально этот метод не отличается от однофакторного ANOVA. Однако он позволяет оценивать не только влияние (главные эффекты) каждого фактора в отдельности, но и взаимодействие факторов: зависимость влияния одних факторов от уровней других факторов. Возможность изучать взаимодействие факторов — главное преимущество многофакторного ANOVA, которое позволяет получать зачастую наиболее интересные результаты исследования.
С целью облегчения изложения материала в качестве основного варианта многофакторного ANOVA мы сначала рассмотрим двухфакторный его вариант (2-Way ANOVA), а затем сделаем необходимые дополнения в отношении большего количества факторов.
Структура исходных данных (2-факторный ANOVA). Для каждого объекта (испытуемого) выборки измерено значение зависимой переменной (Y), а также определена его принадлежность к одной из градаций (уровней) одного фактора (Хх) и к одной из градаций (уровней) другого фактора (Х2). Таблица исходных данных для компьютерной обработки включает две номинативные переменные, соответствующие факторам, и одну метрическую (зависимую) переменную:
№ объектов | Хх (Фактор I) | Х2 (Фактор 2) | ^(Зависимая переменная) |
N |
Модель для данных может быть представлена в виде дисперсионного комплекса ~ таблицы, строки которой соответствуют градациям (уровням) одного фактора: 1, 2,...,/, ...,к; а столбцы — уровням другого фактора: 1, 2,...,/,..., /. Количество ячеек дисперсионного комплекса равно kxl и соответствует количеству разных групп объектов (испытуемых). Каждая ячейка с номером ij характеризуется своим сочетанием уровней факторов, численностью объектов Пу и средним значением зависимой переменной Му. Например, дисперсионный комплекс для ANOVA 2x3:
ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)
Фактор А | Фактор В | |||
Мп | Мп | М13 | мм | |
Мп | М22 | м1г | мА2 | |
мп | мт | мю | м |
Математическая модель двухфакторного ANOVA, как и в однофакторном случае, предполагает выделение двух основных частей вариации зависимой переменной: внутригрупповой, обусловленной случайными причинами, и межгрупповой, обусловленной влиянием факторов. В межгрупповой изменчивости, в свою очередь, выделяются три ее составляющие:
□ влияние (главный эффект) 1-го фактора;
П влияние (главный эффект) 2-го фактора;
П взаимодействие факторов.
Соответственно, двухфакторный ANOVA включает в себя проверку трех гипотез: а) о главном эффекте 1-го фактора; б) о главном эффекте 2-го фактора; в) о взаимодействии факторов.
Проблема взаимодействия факторов, которая обеспечивает уникальность и незаменимость многофакторного ANOVA, заслуживает отдельного рассмотрения. Понятие взаимодействия двух независимых факторов было введено основателем дисперсионного анализа Р. Фишером для обозначения ситуации, когда влияние одного фактора на зависимую переменную проявляется по-разному на разных уровнях другого фактора.
ПРИМЕР 13.4 (Солсо Р., МакЛин М. К., с. 58-59)__________________________
Студентам колледжа предложили написать сочинение в поддержку закона о самоуправлении, противниками которого все они являлись. Испытуемым либо давали задание написать такое сочинение (условие без выбора), либо предлагали самим выбирать — писать или не писать (условие с выбором) (фактор А: 2 уровня). Кроме того, половине испытуемых в каждой из групп платили по 0,5$, а другой половине — 2,5$ за написание этого сочинения (фактор В: 2 уровня). В каждую из 4-х групп случайно отбиралось по 10 студентов. Зависимой переменной являлась степень изменения отношения студентов к закону о самоуправлении после написания сочинения. Средние значения изменения отношения для различных групп:
Фактор А | Фактор В | Средние | |
0,5$ (1) | 2,5$ (2) | ||
Нет выбора (1) | -0,05 | +0,63 | 0,29 |
Свободный выбор (2) | +1,25 | -0,07 | 0,59 |
Средние: | 0,6 | 0,28 | 0,44 |
Результаты (рис. 13.1) демонстрируют взаимодействие факторов: размер вознаграждения (фактор В) по-разному влияет на изменение отношения — в зависимости от наличия или отсутствия свободного выбора (фактор А).
Рис. 13.1. График средних значений изменения отношения к закону о самоуправлении (к данным примера 13.4)
В условиях отсутствия выбора отношение испытуемых к закону о самоуправлении улучшилось в случае большего вознаграждения; в условиях же свободного выбора наблюдалась обратная картина: более хорошее отношение продемонстрировали те, кто получил меньшее вознаграждение.
ПРИМЕР 13.5_____________________________________________________________________
Предположим, изучается влияние на успешность группового решения задачи численности группы и наличия или отсутствия лидера в группе. Зависимая переменная — время решения задачи в минутах. Фактор А — размер группы, три градации: 1 — 2—3 человека; 2 — 5—7 человек; 3—10-15 человек. Фактор В — наличие лидера: 1 — есть; 2 — нет. В качестве объектов выступают группы. В зависимости от стиля лидерства, сложности задания и других причин, которые не учитываются, можно было бы получить разные эффекты взаимодействия факторов численности группы и наличия лидерства (рис. 13.2). График 1 демонстрирует сильное взаимодействие факторов (группы большей численности более эффективны, если в них есть лидер, а группы малой численности — при отсутствии лидера), а график 3 — более слабое взаимодействие (наличие лидера играет роль лишь в группах большой численности). Графики 2 и 4 соответствуют ситуации отсутствия взаимодействия.
ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)
Рис. 13.2. Графики средних значений успешности группового решения задачи
(к данным примера 13.5)
Приведенные примеры демонстрируют эффективность визуального анализа графиков средних значений: если линии, соответствующие разным уровням одного из факторов, не параллельны, то можно предполагать наличие взаимодействия факторов. Однако окончательное заключение об этом можно сделать только при статистическом подтверждении гипотезы о взаимодействии по результатам ANOVA. Таким образом, графики средних значений особенно полезны для интерпретации обнаруженного статистически достоверного взаимодействия факторов.
Исходные предположения многофакторного ANOVA: распределение зависимой переменной в сравниваемых генеральных совокупностях (соответствующих ячейкам дисперсионнго комплекса) характеризуется нормальным законом и одинаковыми дисперсиями. Выборки в каждой ячейке являются случайными и независимыми.
Ограничения: если выборки (ячейки) заметно различаются по численности и их дисперсии различаются статистически достоверно, то метод неприменим. Число наблюдений в каждой ячейке не должно быть меньше 2 (желательно — не менее 5). Проверка допустимости применения ANOVA сводится к про-
ЧАСТЬ П. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
верке однородности дисперсии в сравниваемых выборках в случае, если они заметно различаются по численности. Для проверки однородности дисперсии применяется критерий Ливена (Levene's Test of Homogeneity ofVariances).
Дополнительно возможны множественные сравнения средних значений, позволяющие сделать вывод о том, как различаются друг от друга средние значения, соответствующие разным градациям факторов.
Общая схема двух- (и более) факторного ANOVA принципиально не отличается от однофакторного случая и определяется выделением в общей изменчивости зависимой переменной (SStol) ее внутригрупповой (случайной, SSwg) и межгрупповой (факторной, SSbg) составляющих:
SStot = S^wg + SSfrg.
Отличие заключается в выделении дополнительных составляющих межгрупповой (факторной) изменчивости в соответствии с проверяемыми гипотезами. Для двухфакторного случая:
SSf,g = SSA + SSB + SSAb,
где SSA, SSB — суммы квадратов для факторов Аи В, a SSAB — сумма квадратов для взаимодействия факторов. Соответственно, для каждого источника изменчивости далее вычисляются степени свободы и средние квадраты, вычисляются /'-отношения для проверяемых гипотез и определяютсяр-уровни значимости.
Последовательность вычислений основных показателей для двухфакторного ANOVAрассмотрим на упрощенном примере — при равной численности сравниваемых выборок (объектов в ячейках). Для случая с неравной численностью наблюдений в ячейках логика и общая последовательность вычислений не меняются, хотя сами вычисления и становятся более громоздкими.
Фактор А | Фактор В | |||
2 | ||||
Ми | Ми | мм | ||
мп | м23 | |||
ма | мвъ | м |
Численность каждой ячейки равна п, общее число наблюдений — 6/7 = N.
Напомним, что двухфакторный ANOVA проверяет 3 статистические гипотезы: а) о главном эффекте фактора А (о различии Мм и МА2); б) о главном эффекте фактора В (о различии Мт, Mm и Мвз); в) о взаимодействии факторов Аи В (влияние фактора А различается для разных уровней фактора В, и наоборот).
Межгрупповая (SSbg) и внутригрупповая (SS^) суммы квадратов вычисляются как составные части общей суммы квадратов (SSlot):
ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)
где к — число уровней фактора А; I — число уровней фактора В; Мо — среднее значение для ячейки ij.
Отношение межгрупповой и общей суммы квадратов — коэффициент детерминации. Как и в однофакторном случае, он показывает долю общей дисперсии зависимой переменной, которая обусловлена совокупным влиянием факторов (факторной моделью):
Чем больше этот показатель, тем больше общая дисперсия зависимой переменной объясняется влиянием изучаемых факторов. Межгрупповая сумма квадратов состоит из трех составляющих ее сумм квадратов: для фактора А, для фактора В, для взаимодействия факторов Аи В:
Дата добавления: 2015-11-04; просмотров: 42 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ В ANOVA | | | СС — СС -I- CC 4- ОС |