Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Однофакторный anova

ПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СРАВНЕНИЯ ДВУХ ВЫБОРОК | КРИТЕРИЙ Г-СТЬЮДЕНТА ДЛЯ ЗАВИСИМЫХ ВЫБОРОК | ОБРАБОТКА НА КОМПЬЮТЕРЕ | Group Statistics | СРАВНЕНИЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК | Обработка на компьютере: критерий (7-Манна-Уитни | СРАВНЕНИЕ БОЛЕЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК | СРАВНЕНИЕ БОЛЕЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК | Обработка на компьютере | СС — СС -I- CC 4- ОС |


Читайте также:
  1. МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ В ANOVA

Однофакторный (One-Way) ANOVA позволяет проверить гипотезу о том, что изучаемый фактор оказывает влияние на зависимую переменную (сред­ние значения, соответствующие разным градациям фактора, различаются).


ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

Математическая модель однофакторного ANOVA предполагает выделение в общей изменчивости зависимой переменной двух ее составляющих. Межгруп­повая (факторная) составляющая изменчивости обусловлена различием сред­них значений под влиянием фактора. Внутригрупповая (случайная) составля­ющая изменчивости обусловлена влиянием неучтенных причин. Соотношение первой и второй из указанных составляющих изменчивости и есть основной показатель, определяющий статистическую значимость влияния фактора (раз­личия средних значений групп, соответствующих уровням фактора).

Нулевая статистическая гипотеза содержит утверждение о равенстве сред­них значений. При ее отклонении принимается альтернативная гипотеза о том, что по крайней мере два средних значения различаются.

Исходные предположения: распределение зависимой переменной в сравни­ваемых генеральных совокупностях характеризуется нормальным законом и одинаковыми дисперсиями. Выборки являются случайными и независимы­ми. Проверка исходных предположений сводится к проверке однородности дисперсии в сравниваемых выборках в случае, если они заметно различаются по численности.

Структура исходных данных: изучаемый признак измерен у объектов (ис­пытуемых), каждый из которых принадлежит к одной из нескольких сравни­ваемых выборок.

ПРИМЕР______________________________________________________________

Исследовалось влияние на продуктивность воспроизведения (Y) вербального ма­териала интервала между 5 повторениями г 3 градации: 1 — 0 мин, 2 — 3 мин, 3 — 10мин).

Структура данных:

 

Хх (интервал) У (эффективность воспроизведения)
I    
     
     
     
     
N    

Ограничения: если дисперсии выборок различаются статистически досто­верно, то метод неприменим. Для проверки однородности дисперсии приме­няется критерий Ливена (Levene's Test of Homogeneity of Variances). Формаль­но численность выборок не должна быть менее 2 объектов (фактически необходимо иметь не менее 5 объектов в каждой выборке).

Альтернатива методу: сравнение независимых выборок по критерию Н- Крас кал а-Уоллеса.

Основной результат: принятие или отклонение нулевой статистической гипотезы о равенстве средних значений, соответствующих разным уровням


ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)

фактора. Основной показатель для принятия решения — ^-уровень значимо­сти критерия /-Фишера.

Дополнительно возможны множественные сравнения средних значений, позволяющие сделать вывод о том, как различаются друг от друга средние зна­чения для разных градаций фактора.

Рассмотрим общие принципы и последовательность вычислений для од-нофакторного ANOVA в случае равной численности сравниваемых выборок.

Исходная идея ANOVA заключается в возможности разложения показателя изменчивости признака на две составляющие: изменчивость внутри групп и изменчивость между группами. В качестве показателя изменчивости исполь­зуется сумма квадратов отклонения значений признака от среднего, которая обозначается SS (Sum of Squares).

Общая (Total) сумма квадратов (SStolai) является показателем общей измен­чивости зависимой переменной и представляет собой числитель дисперсии:

/=]

Соответственно, общая сумма квадратов равна сумме межгрупповой и внут ригрупповой сумм квадратов:

Межгрупповая (Between-Group) сумма квадратов (SSbg) — показатель измен чивости между к группами (каждая численностью п объектов):

где Mj — среднее значение для группы/

Отношение межгрупповой и общей суммы квадратов показывает долю об­щей дисперсии зависимой переменной, обусловленную влиянием фактора. Этот показатель идентичен по смыслу квадрату коэффициента корреляции в ре­грессионном анализе, поэтому тоже называется коэффициентом детермина­ции (R1):

°°total

Коэффициент детерминации может принимать значения от 0 до 1. Чем больше этот показатель, тем больше влияние изучаемого фактора на диспер­сию зависимой переменной. Помноженный на 100, он выражает процент уч­тенной дисперсии.

Внутригрупповая (Within-Group) сумма квадратов (SSwg) — показатель слу­чайной изменчивости (внутри групп):

ее _ ее _ ее _


На величину сумм квадратов влияет численность и количество сравнивае­мых групп. Поэтому для сопоставления межгрупповой и внутригрупповой изменчивости используются средние квадраты (обозначается MS — от анг­лийского Mean of Squares). Средний квадрат — это частное от деления суммы квадратов на соответствующее число степеней свободы.

Каждая сумма квадратов характеризуется своим числом степеней свободы (df). Так, общее число степеней свободы соответствует общей сумме квадратов и равно:

Заметим, что частное от деления общей суммы квадратов на общее число степеней свободы — общий средний квадрат — это общая дисперсия.

Число степеней свободы для межгрупповой суммы квадратов равно числу сла­гаемых минус один (число групп минус 1):



 


Следует отметить, что тот и другой средние квадраты представляют собой различные выборочные оценки одной и той же генеральной дисперсии — для случая, когда сравниваемые средние не различаются. Однако это не так в слу­чае, если хотя бы два из всех сравниваемых средних различаются: тогда меж­групповой средний квадрат превысит внутригрупповой средний квадрат. И чем больше величина отношения межгруппового к внутригрупповому среднему квадрату, тем больше оснований считать, что сравниваемые средние значе­ния различаются. Соответственно, основным показателем ANOVA является F-отношение — эмпирическое значение критерия F-Фишера:

Процедура проверки Но подразумевает направленную альтернативу, так как ее отклонению соответствует только большее значение F3 (MSbg > MSwg). По­этому для определения р-уровня значимости при вычислениях «вручную» при­меняются таблицы критических значений /'-распределения для направлен­ных альтернатив (односторонний критерий). Для одних и тех же ^уровень значимости возрастает (/ьуровень убывает) при возрастании Гэ.


ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)

Последовательность выполнения AN OVA является общей для любого числа факторов. Вначале в общей изменчивости зависи­мой переменной выделяются основные ее составляющие. (В од-нофакторном АТЧОУАихдве: внутри групповая (случайная) и меж­групповая (факторная) изменчивость.) После этого вычисляются соответствующие показатели в следующей последовательности:

П суммы квадратов {SS)\

□ числа степеней свободы (df); '

D средние квадраты (MS);

О /^-отношения;

П ^-уровни значимости.

% ■-

..... i

ПРИМЕР 13.1


Предположим, изучалось различие в продуктивности воспроизведения од­ного и того же материала трех групп испытуемых (по 5 человек), различа­ющихся условиями предъявления это­го материала для запоминания. Зави­симая переменная (У) — количество воспроизведенных единиц материала, независимая переменная (фактор) — условия предъявления (три градации). Проверим на уровне а = 0,01 гипотезу о том, что продуктивность воспроиз­ведения материала зависит от условий его предъявления.


Условие 121

Условие 122

Так зависит ли запоминание материала от условий его предъявления?


 

Условие 1 Условие 2 Условие 3
У У У
           
           
           
           
           




 


Шаг 5. Определим р-уровень значимости. По таблице критических значений F-распределения (для направленных альтернатив) (приложение 3) для р = 0,01; d/чмсп =2; <#шам = 12 критическое значение равно F= 6,927. Следовательно,,р < 0,01. Дополнительно вычислим коэффициент детерминации:



 


 

Источник изменчивости Сумма квадратов (SS) df Средний квадрат (MS) F /^-уровень
Межгрупповой         < 0,0.1
Внутригрупповой     2,5
Общий    

Л2 = 0,571.

Ш а г 6. Принимаем статистическое решение и формулируем содержательный вы­вод. Отклоняем Но и принимаем альтернативную гипотезу о том, что межгрупповая изменчивость выше внутригрупповой. Содержательный вывод: обнаружено статис­тически достоверное влияние условий предъявления материала на продуктивность его воспроизведения (р < 0,01). Или: средние значения продуктивности воспроизве­дения материала статистически достоверно различаются в зависимости от условий его предъявления (р < 0,01).

В ANOVA с выборками неравной численности вычисления несколько услож­няются. Изменения касаются формулы для вычисления межгрупповой сум­мы квадратов:

^ = 5>,.(А/у-М)2,

7=1

где rij — численность группы/

Кроме того, если группы различаются по численности, необходима про­верка гомогенности дисперсии с использованием критерия Ливена.


ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)


Дата добавления: 2015-11-04; просмотров: 97 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Обработка на компьютере: критерий х2-Фридмана| МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ В ANOVA

mybiblioteka.su - 2015-2024 год. (0.01 сек.)