Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Обработка на компьютере: критерий х2-Фридмана

ПАРАМЕТРИЧЕСКИЕ МЕТОДЫ СРАВНЕНИЯ ДВУХ ВЫБОРОК | КРИТЕРИЙ Г-СТЬЮДЕНТА ДЛЯ ЗАВИСИМЫХ ВЫБОРОК | ОБРАБОТКА НА КОМПЬЮТЕРЕ | Group Statistics | СРАВНЕНИЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК | Обработка на компьютере: критерий (7-Манна-Уитни | СРАВНЕНИЕ БОЛЕЕ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК | МНОЖЕСТВЕННЫЕ СРАВНЕНИЯ В ANOVA | Обработка на компьютере | СС — СС -I- CC 4- ОС |


Читайте также:
  1. Гигиеническая обработка рук.
  2. Когнитивная обработка информации и опыта
  3. КРИТЕРИЙ Г-СТЬЮДЕНТА ДЛЯ ЗАВИСИМЫХ ВЫБОРОК
  4. Критерий оценки знаний студентов при рейтинговом контроле
  5. Машиностроение и металлообработка
  6. Обработка валов
  7. ОБРАБОТКА ЕСТЕСТВЕННЫХ КОЖНЫХ СКЛАДОК

Для обработки использованы данные примера 12.4. Исходные данные для обработки введены в таблицу (Data Editor) в виде четырех переменных, соот­ветствующих четырем сравниваемым условиям (varl,..., var4).

A) Выбираем Analyze > Nonparametric Tests > К-Related Samples... (для
/с-зависимых выборок).

Б) В открывшемся окне диалога выделяем переменные (соответствующие нескольким измерениям одного и того же признака) и переносим их при по­мощи кнопки > из левого окна в правое окно (Test Variables). Переменных должно быть больше двух (в данном случае 4). Нажимаем ОК.

B) Получаем результаты в виде двух таблиц:

Ranks

 

  Mean Rank  
VAR1 2.    
VAR2 2.    
VAR3 1.    
VAR4 3.    
Test Statistics(a)
N  
Chi-Square 8.897
df  
Asymp. Sig. .031

a Friedman Test

В первой таблице содержатся ранговые статистики: средние ранги для каж­дой группы (Mean Rank). Во второй таблице содержатся результаты проверки гипотезы: эмпирическое значение критерия %2 (Chi-Square), число степеней свободы (df) и/7-уровень значимости (Asymp. Sig.).


Глава 13

ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)

НАЗНАЧЕНИЕ И ОБЩИЕ ПОНЯТИЯ ANOVA1

Общепринятое сокращенное обозначение дисперсионного анализа — ANOVA (от англоязычного ANalysis Of VAriance). В соответствии с принятой классификацией, ANOVA — это метод сравнения нескольких (более двух) выборок по признаку, измеренному в метрической шкале. Как и в случае срав­нения двух выборок при помощи критерия /-Стьюдента, ANOVA решает зада­чу сравнения средних значений, но не двух, а нескольких. Кроме того, метод допускает сравнение выборок более чем по одному основанию — когда деле­ние на выборки производится по нескольким номинативным переменным, каждая из которых имеет 2 и более градаций.

ПРИМЕР______________________________________________________

Исследовалось влияние на продуктивность воспроизведения вербального матери­ала (Y): а) интервала между 5 повторениями х — 3 градации: 1 — 0 мин, 2 — 3 мин, 3 — 10 мин) и б) трудность материала 2 2 градации: 1 — легкий, 2 — трудный).

Структура данных:

 

№.. Л", (интервал) Хг (объем) /(эффективность воспроизведения)
       
       
       
       
       
N      

1 В данной главе содержатся лишь самые необходимые сведения о дисперсионном анализе. Более полное изложение особенностей применения этого мощного и многогранного метода читатель может найти в других источниках, например, в кн.: Гусева А. Н. Дисперсионный ана­лиз в экспериментальной психологии. М,, 2000.


ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

Специфика ANOVA проявляется в двух отношениях: во-первых, этот ме­тод использует терминологию планирования эксперимента; во-вторых, для сравнения средних значений анализируются компоненты дисперсии изучае­мого признака.

ANOVA был разработан Р. Фишером специально для анализа результа­тов экспериментальных исследований. Соответственно, различные вари­анты ANOVA воспроизводят наиболее типичные планы организации эксперимента.

Типичная схема эксперимента сводится к изучению влияния независимой переменной (одной или нескольких) на зависимую переменную. Независи­мая переменная (Independent Variable) представляет собой качественно опреде­ленный (номинативный) признак, имеющий две или более градации. Каж­дой градации независимой переменной соответствует выборка объектов (испытуемых), для которых определены значения зависимой переменной. Не­зависимая переменная еще называется фактором (Factor), имеющим несколь­ко градаций (уровней). Зависимая переменная (Dependent Variable) в экспери­ментальном исследовании рассматривается как изменяющаяся под влиянием независимых переменных. В модели ANOVA зависимая переменная должна быть представлена в метрической шкале. В простейшем случае независимая переменная имеет две градации, и тогда задача сводится к сравнению двух выборок по уровню выраженности (средним значениям) зависимой пере­менной.

В зависимости от соотношения выборок, соответствующих разным града­циям (уровням) фактора, различают два типа независимых переменных (фак­торов). Градациям (уровням) межгруппового фактора соответствуют незави­симые выборки объектов. Градациям (уровням) внутригруппового фактора соответствуют зависимые выборки, чаще всего повторные измерения зави­симой переменной на одной и той же выборке.

В зависимости от типа экспериментального плана выделяют четыре основ­ных варианта ANOVA: однофакторный, многофакторный, ANOVA с повтор­ными измерениями и многомерный ANOVA. Каждый из этих вариантов дис­персионного анализа будет подробно рассмотрен далее в этой главе, а сейчас ограничимся их краткой характеристикой.

Однофакторный ANOVA (One-Way ANOVA) используется при изучении вли­яния одного фактора на зависимую переменную. При этом проверяется одна гипотеза о влиянии фактора на зависимую переменную.

Многофакторный (двух-, трех-,... -факторный) ANOVA (2-Way, 3-Way... ANOVA) используется при изучении влияния двух и более независимых пере­менных (факторов) на зависимую переменную. Многофакторный ANOVA позволяет проверять гипотезы не только о влиянии каждого фактора в от­дельности, но и о взаимодействии факторов. Так, для двухфакторного ANOVA проверяются три гипотезы: а) о влиянии одного фактора; б) о влиянии друго­го фактора; в) о взаимодействии факторов (о зависимости степени влияния одного фактора от градаций другого фактора).


ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)

ПРИМЕР______________________________________________________________

Предположим, изучается влияние на зрительскую оценку различных фильмов (за­висимая переменная) двух факторов: жанра фильма (мелодрама, комедия, боевик) и пола зрителя. Вполне вероятно, что в результате такого исследования будут обна­ружены не главные эффекты изучаемых факторов (влияние каждого из них в от­дельности), а их взаимодействие. Взаимодействие факторов «жанр фильма» и «пол зрителя» будет означать, что мужчины и женщины по-разному оценивают фильмы в зависимости от их жанра (фильмы разных жанров оцениваются по-разному, в за­висимости от пола зрителя).

ANOVA с повторными измерениями (Repeated Measures ANOVA) применяет­ся, когда по крайней мере один из факторов изменяется по внутригрупповому плану, то есть различным градациям этого фактора соответствует одна и та же выборка объектов (испытуемых). Соответственно, в модели ANOVA с повтор­ными измерениями выделяются внутригрупповые и межгрупповые факторы. Для двухфакторного ANOVA с повторными измерениями по одному из фак­торов проверяются три гипотезы: а) о влиянии внутригруппового фактора; б) о влиянии межгруппового фактора; в) о взаимодействии внутригруппово­го и межгруппового факторов.

Многомерный ANOVA (Multivariate ANOVA, MANOVA) применяется, когда зависимая переменная является многомерной, иначе говоря, представляет собой несколько (множество) измерений изучаемого явления (свойства).

Дополнительно выделяют модели ANOVA с постоянными (фиксированными) и случайными эффектами — различаются способами задания уровней (града­ций) фактора. В модели с постоянными эффектами (Fixed Factors) уровни ос­таются фиксированными (одними и теми же) и при проведении данного вы­борочного исследования: как при обобщении результата на генеральную совокупность, так и при повторном проведении исследования. В модели со случайными эффектами (Random Factors) уровни фактора представляют собой более или менее случайную выборку из множества других возможных уров­ней данного фактора. Конечно, интерпретация (обобщение) результатов бу­дет зависеть от используемой модели. При обработке данных различие между моделями в однофакторном ANOVA может не учитываться, но должно учи­тываться в двух- (и более) факторном ANOVA. В последнем случае результаты обработки для разных моделей будут различными. Допускается сочетание фиксированных и случайных факторов в одном исследовании.

ПРИМЕР______________________________________________________

Сравнивалась эффективность двух учебных программ. Для этого из нескольких сотен школ города было выбрано 5, а в них — по два параллельных класса, ученики которых обучались по разным программам. Исследование представляло собой ре­ализацию двухфакторного плана с одним фиксированным (учебная программа: две градации) и одним случайным факторами (школа: пять градаций). Такое исследо­вание позволяет проверить гипотезу не только об эффективности учебных программ, но и о том, будет ли различаться их эффективность в разных школах города.


ЧАСТЬ П. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

В случае, если фактор имеет более двух градаций, то подтверждение гипо­тезы о его влиянии позволяет сделать лишь неопределенный вывод о том, что по крайней мере две градации фактора различаются. Для более конкретного вывода о том, какие именно градации фактора различаются, в ANOVA пре­дусмотрена процедура множественных сравнений (Post Hoc multiple comparison tests).

Во всех вариантах ANOVA наряду с изучением влияния факторов допуска­ется изучение влияния метрической независимой переменной. Метрическая независимая переменная в этом случае называется ковариатой {Covariate), и дисперсионный анализ включает в себя ковариационный анализ.

Математическая идея ANOVA основана на соотнесении межгрупповой и внутригрупповой частей дисперсии (изменчивости) изучаемой зависимой переменной. Известно, что при объединении двух (или более) выборок с при­мерно одинаковой дисперсией, но с разными средними значениями диспер­сия увеличивается пропорционально различиям средних значений этих вы­борок. Это связано с тем, что к внутригрупповой дисперсии добавляется дисперсия, обусловленная различиями между группами. В модели ANOVA внутригрупповая изменчивость рассматривается как обусловленная случай­ными причинами, а межгрупповая — как обусловленная действием изучаемого фактора на зависимую переменную. Соответственно, в общей изменчивости (дисперсии) зависимой переменной выделяются две компоненты: внутригруп­повая (случайная) и межгрупповая (факторная) изменчивость. Чем больше отношение межгрупповой изменчивости к внутригрупповой, тем выше фак­торный эффект — тем больше различаются средние значения, соответствую­щие разным градациям фактора.

Нулевая гипотеза в ANOVA содержит утверждение о равенстве межгруппо­вой и внутригрупповой составляющих изменчивости и подразумевает направ­ленную альтернативу — о том, что межгрупповая составляющая изменчивости превышает внутригрупповую изменчивость. Нулевой гипотезе соответствует равенство средних значений зависимой переменной на всех уровнях фактора. Принятие альтернативной гипотезы означает, что по крайней мере два сред­них значения различаются (без уточнения, какие именно градации фактора различаются).

Основные допущения ANOVA: а) распределения зависимой переменной для каждой градации фактора соответствуют нормальному закону; б) дисперсии выборок, соответствующих разным градациям фактора, равны между собой; в) выборки, соответствующие градациям фактора, должны быть независимы (для межгруппового фактора). Выполнение допущения о независимости вы­борок является обязательным в любом случае. Последствия нарушений ос­тальных двух допущений требуют специального рассмотрения.

Нарушение предположения о нормальности распределения, как показали мно­гочисленные исследования, не оказывает существенного влияния на резуль­таты ANOVA (Шеффе, 1980; Гласе, Стэнли, 1977 и др.). Следовательно, перед проведением ANOVA нет необходимости в проверке соответствия выбороч­ных распределений нормальному закону.


ГЛАВА 13. ДИСПЕРСИОННЫЙ АНАЛИЗ (ANOVA)

Нарушение предположения о равенстве (однородности, гомогенности) дис­персий имеет существенное значение для ANOVA в том случае, если сравнива­емые выборки отличаются по численности. Таким образом, если выборки, со­ответствующие разным градациям фактора, отличаются по численности, то необходима предварительная проверка гомогенности (однородности) диспер­сий. В компьютерных программах это осуществляется при помощи критерия Ливена (Levene's Test of Homogeneity of Variances). Если выборки заметно раз­личаются по численности и дисперсии по критерию Ливена различаются ста­тистически достоверно, то ANOVA к таким данным не применим, следует вос­пользоваться непараметрической альтернативой.

В основе современных программных реализаций дисперсионного анализа ле­жит представление о родственности дисперсионного и множественного регрес­сионного анализа: оба метода исходят из одной и той же линейной модели. В связи с этим, а также в связи с применением в дисперсионном анализе процедур и по­казателей, характерных для множественной регрессии, в последнее время все варианты дисперсионного анализа объединяются (например, в программе SPSS) под названием: Общая линейная модель (GLM — General Linear Model).

Параметрическими аналогами ANOVA являются такие многомерные мето­ды, как множественный регрессионный анализ (глава 15) и дискриминант-ный анализ (глава 17). Отличие модели множественного регрессионного ана­лиза заключается в том, что все переменные в ней, в том числе и независимые, представлены в метрической шкале. В модели дискриминантного анализа, в отличие от ANOVA, зависимая переменная является классифицирующей (но­минативной), а независимые переменные — метрическими.

Непараметрическими аналогами ANOVA, как отмечалось, являются крите­рии //-Краскала-Уоллеса (для независимых выборок) и %2-Фридмана (для по­вторных измерений).

Вычислительные сложности, связанные с проведением ANOVA, представ­ляли проблему до появления компьютеров и специальных статистических программ. Современные статистические программы (SPSS, STATISTICA) из­бавляют пользователя от утомительных расчетов. Однако понимание и пра­вильная интерпретация получаемых показателей обязательно требуют нали­чия общего представления о том, как они вычисляются. Поэтому изложение основных методов ANOVA будет сопровождаться демонстрацией расчетов на упрощенных примерах, которые будущему пользователю компьютерных про­грамм желательно внимательно изучить.


Дата добавления: 2015-11-04; просмотров: 127 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
СРАВНЕНИЕ БОЛЕЕ ДВУХ ЗАВИСИМЫХ ВЫБОРОК| ОДНОФАКТОРНЫЙ ANOVA

mybiblioteka.su - 2015-2024 год. (0.01 сек.)