Читайте также: |
|
Однофакторный (One-Way) ANOVA позволяет проверить гипотезу о том, что изучаемый фактор оказывает влияние на зависимую переменную (средние значения, соответствующие разным градациям фактора, различаются).
ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
Математическая модель однофакторного ANOVA предполагает выделение в общей изменчивости зависимой переменной двух ее составляющих. Межгрупповая (факторная) составляющая изменчивости обусловлена различием средних значений под влиянием фактора. Внутригрупповая (случайная) составляющая изменчивости обусловлена влиянием неучтенных причин. Соотношение первой и второй из указанных составляющих изменчивости и есть основной показатель, определяющий статистическую значимость влияния фактора (различия средних значений групп, соответствующих уровням фактора).
Нулевая статистическая гипотеза содержит утверждение о равенстве средних значений. При ее отклонении принимается альтернативная гипотеза о том, что по крайней мере два средних значения различаются.
Исходные предположения: распределение зависимой переменной в сравниваемых генеральных совокупностях характеризуется нормальным законом и одинаковыми дисперсиями. Выборки являются случайными и независимыми. Проверка исходных предположений сводится к проверке однородности дисперсии в сравниваемых выборках в случае, если они заметно различаются по численности.
Структура исходных данных: изучаемый признак измерен у объектов (испытуемых), каждый из которых принадлежит к одной из нескольких сравниваемых выборок.
ПРИМЕР______________________________________________________________
Исследовалось влияние на продуктивность воспроизведения (Y) вербального материала интервала между 5 повторениями (Хг — 3 градации: 1 — 0 мин, 2 — 3 мин, 3 — 10мин).
Структура данных:
№ | Хх (интервал) | У (эффективность воспроизведения) |
I | ||
N |
Ограничения: если дисперсии выборок различаются статистически достоверно, то метод неприменим. Для проверки однородности дисперсии применяется критерий Ливена (Levene's Test of Homogeneity of Variances). Формально численность выборок не должна быть менее 2 объектов (фактически необходимо иметь не менее 5 объектов в каждой выборке).
Альтернатива методу: сравнение независимых выборок по критерию Н- Крас кал а-Уоллеса.
Основной результат: принятие или отклонение нулевой статистической гипотезы о равенстве средних значений, соответствующих разным уровням
ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)
фактора. Основной показатель для принятия решения — ^-уровень значимости критерия /-Фишера.
Дополнительно возможны множественные сравнения средних значений, позволяющие сделать вывод о том, как различаются друг от друга средние значения для разных градаций фактора.
Рассмотрим общие принципы и последовательность вычислений для од-нофакторного ANOVA в случае равной численности сравниваемых выборок.
Исходная идея ANOVA заключается в возможности разложения показателя изменчивости признака на две составляющие: изменчивость внутри групп и изменчивость между группами. В качестве показателя изменчивости используется сумма квадратов отклонения значений признака от среднего, которая обозначается SS (Sum of Squares).
Общая (Total) сумма квадратов (SStolai) является показателем общей изменчивости зависимой переменной и представляет собой числитель дисперсии:
/=]
Соответственно, общая сумма квадратов равна сумме межгрупповой и внут ригрупповой сумм квадратов:
Межгрупповая (Between-Group) сумма квадратов (SSbg) — показатель измен чивости между к группами (каждая численностью п объектов):
где Mj — среднее значение для группы/
Отношение межгрупповой и общей суммы квадратов показывает долю общей дисперсии зависимой переменной, обусловленную влиянием фактора. Этот показатель идентичен по смыслу квадрату коэффициента корреляции в регрессионном анализе, поэтому тоже называется коэффициентом детерминации (R1):
°°total
Коэффициент детерминации может принимать значения от 0 до 1. Чем больше этот показатель, тем больше влияние изучаемого фактора на дисперсию зависимой переменной. Помноженный на 100, он выражает процент учтенной дисперсии.
Внутригрупповая (Within-Group) сумма квадратов (SSwg) — показатель случайной изменчивости (внутри групп):
ее _ ее _ ее _
На величину сумм квадратов влияет численность и количество сравниваемых групп. Поэтому для сопоставления межгрупповой и внутригрупповой изменчивости используются средние квадраты (обозначается MS — от английского Mean of Squares). Средний квадрат — это частное от деления суммы квадратов на соответствующее число степеней свободы.
Каждая сумма квадратов характеризуется своим числом степеней свободы (df). Так, общее число степеней свободы соответствует общей сумме квадратов и равно:
Заметим, что частное от деления общей суммы квадратов на общее число степеней свободы — общий средний квадрат — это общая дисперсия.
Число степеней свободы для межгрупповой суммы квадратов равно числу слагаемых минус один (число групп минус 1):
Следует отметить, что тот и другой средние квадраты представляют собой различные выборочные оценки одной и той же генеральной дисперсии — для случая, когда сравниваемые средние не различаются. Однако это не так в случае, если хотя бы два из всех сравниваемых средних различаются: тогда межгрупповой средний квадрат превысит внутригрупповой средний квадрат. И чем больше величина отношения межгруппового к внутригрупповому среднему квадрату, тем больше оснований считать, что сравниваемые средние значения различаются. Соответственно, основным показателем ANOVA является F-отношение — эмпирическое значение критерия F-Фишера:
Процедура проверки Но подразумевает направленную альтернативу, так как ее отклонению соответствует только большее значение F3 (MSbg > MSwg). Поэтому для определения р-уровня значимости при вычислениях «вручную» применяются таблицы критических значений /'-распределения для направленных альтернатив (односторонний критерий). Для одних и тех же ^уровень значимости возрастает (/ьуровень убывает) при возрастании Гэ.
ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)
Последовательность выполнения AN OVA является общей для любого числа факторов. Вначале в общей изменчивости зависимой переменной выделяются основные ее составляющие. (В од-нофакторном АТЧОУАихдве: внутри групповая (случайная) и межгрупповая (факторная) изменчивость.) После этого вычисляются соответствующие показатели в следующей последовательности:
П суммы квадратов {SS)\
□ числа степеней свободы (df); '
D средние квадраты (MS);
О /^-отношения;
П ^-уровни значимости.
% ■-
..... i
ПРИМЕР 13.1
Предположим, изучалось различие в продуктивности воспроизведения одного и того же материала трех групп испытуемых (по 5 человек), различающихся условиями предъявления этого материала для запоминания. Зависимая переменная (У) — количество воспроизведенных единиц материала, независимая переменная (фактор) — условия предъявления (три градации). Проверим на уровне а = 0,01 гипотезу о том, что продуктивность воспроизведения материала зависит от условий его предъявления.
Условие 121 |
Условие 122
Так зависит ли запоминание материала от условий его предъявления?
Условие 1 | Условие 2 | Условие 3 | |||
№ | У | № | У | № | У |
Шаг 5. Определим р-уровень значимости. По таблице критических значений F-распределения (для направленных альтернатив) (приложение 3) для р = 0,01; d/чмсп =2; <#шам = 12 критическое значение равно F= 6,927. Следовательно,,р < 0,01. Дополнительно вычислим коэффициент детерминации:
Источник изменчивости | Сумма квадратов (SS) | df | Средний квадрат (MS) | F | /^-уровень |
Межгрупповой | < 0,0.1 | ||||
Внутригрупповой | 2,5 | — | — | ||
Общий | — | — | — |
Л2 = 0,571.
Ш а г 6. Принимаем статистическое решение и формулируем содержательный вывод. Отклоняем Но и принимаем альтернативную гипотезу о том, что межгрупповая изменчивость выше внутригрупповой. Содержательный вывод: обнаружено статистически достоверное влияние условий предъявления материала на продуктивность его воспроизведения (р < 0,01). Или: средние значения продуктивности воспроизведения материала статистически достоверно различаются в зависимости от условий его предъявления (р < 0,01).
В ANOVA с выборками неравной численности вычисления несколько усложняются. Изменения касаются формулы для вычисления межгрупповой суммы квадратов:
^ = 5>,.(А/у-М)2,
7=1
где rij — численность группы/
Кроме того, если группы различаются по численности, необходима проверка гомогенности дисперсии с использованием критерия Ливена.
ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)
Дата добавления: 2015-11-04; просмотров: 97 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Обработка на компьютере: критерий х2-Фридмана | | | МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ В ANOVA |