Читайте также: |
|
В некоторых случаях расчетная формула критерия включает в себя количество наблюдений в исследуемой выборке, обозначаемое как п. По специальной таблице мы определяем, какому уровню статистической значимости различий соответствует данная эмпирическая величина. В большинстве случаев одно и то же эмпирическое значение критерия может оказаться значимым или незначимым в зависимости от количества наблюдений в исследуемой выборке (л) или от так называемого количества степеней свободы, которое обозначается каку или как Ы (иногда с!).
Зная п или число степеней свободы, мы по специальным таблицам можем определить критические значения критерия и сопоставить с ними полученное эмпирическое значение. Обычно это записывается так: «При п = 22 критические значения критерия составляют 1Я= 2, 07» или «При V (б?) = 2 критические значения критерия Стьюдента составляют 151 = 4, 30» и т. п.
Обычно предпочтение оказывается все же параметрическим критериям, и мы придерживаемся этой позиции. Считается, что они более надежны и с их помощью можно получить больше информации и провести более глубокий анализ, чем с использованием непараметриче-
218 Глава 7. Математико-статистическая обработка данных исследования
ских критериев. Что же касается сложности математических вычислений, то при использовании компьютерных программ эта сложность исчезает (но появляются некоторые другие, впрочем, вполне преодолимые).
7.4. Оценка достоверности отличий по ^-критерию Стьюдента
Наиболее часто в психологическом исследовании встречается задача выявления различий между двумя или более группами признаков. Выявление таких различий на уровне средних арифметических мы уже рассмотрели выше, в процедуре анализа первичных статистик. Однако возникает вопрос, насколько эти различия достоверны и можно ли их распространить (экстраполировать) на всю популяцию. Для решения этой задачи чаще всего используется (при условии нормального или близкого к нормальному распределения) {-критерий (или критерий Стьюдента). Этот критерий предназначен для того, чтобы выяснить, насколько достоверно различаются показатели одной выборки испытуемых от другой (например, когда испытуемые получают в результате тестирования одной группы более высокие баллы, чем представители другой). Это параметрический критерий, имеющий две основные формы. Первая из них — несвязанный (-критерий (который также называют непарным (-критерием) — предназначен для того, чтобы выяснить, имеются ли различия между оценками, полученными при использовании одного и того же теста для тестирования двух групп, составленных из разных людей.
Например, это может быть сравнение уровня интеллекта или нервно-психической устойчивости, тревожности «успешных» учащихся и «отстающих» или сравнение по этим признакам учащихся разных классов, возрастных групп, социальных уровней и т. д. Это могут быть разнополые, различных национальностей выборки, а также подвыборки в исследуемых выборках, выделенные по определенному признаку.
Мы на это указывали, когда говорили о независимых переменных, «I», «()», и «Г»-данных, на основании которых возможно выделение подвыборок в основной выборке исследуемых.
Критерий называется «несвязанным», потому что сравниваемые группы составлены из разных людей. Связанный (-критерий (который иногда называют парным (-критерием) предназначен для сравнения показателей двух групп, между членами которых существует специфическая связь. Это означает, что каждому члену первой группы соот-
7.4. Оценка достоверности отличий по (-критерию Стьюдента _______ 219
ветствует какой-либо член второй группы, который похож на него по какому-то параметру, интересующему исследователя. Чаще всего сравниваются параметры одних и тех же людей до и после определенного события или воздействия (например, в процессе проведения лонги-тюдного исследования или формирующего эксперимента). Поэтому данный критерий используется для сравнения показателей одних и тех же людей до и после обследования, эксперимента или прошествия некоторого времени.
В случаях, когда данные не подчиняются нормальному закону распределения, используются непараметрические критерии, эквивалентные ^-критериям. Это критерий Манна-Уитни, который эквивалентен непарному ^-критерию, и двухвыборочный критерий Вилкоксона, эквивалентный парному г-критерию.
С помощью г-критериев и их непараметрических эквивалентов можно лишь сравнивать результаты двух групп, полученные с использованием одного и того же теста. Однако в некоторых случаях возникает необходимость сравнения нескольких групп или оценок нескольких видов. Это можно сделать поэтапно, разбив задачу на несколько пар сравнений (например, если надо сравнить группы А, Б и В по результатам тестов X и У, то можно с помощью г-критерия сначала сравнить группы А и Б по результатам теста X, потом А и Б по результатам теста У,АиВ по результатам теста Хит. д.). Однако это очень трудоемкий метод; кроме того, по некоторым причинам, в объяснение которых мы не будем здесь углубляться, при его использовании резко возрастает вероятность совершения ошибки первого рода. Поэтому необходим более сложный метод, метод дисперсионного анализа.
Метод дисперсионного анализа (от англоязычного АМа1уз13 От УАпапсе - АКЮУА)
В случае нормального распределения данных эта задача решается посредством проведения дисперсионного анализа. Этот универсальный метод позволяет сравнивать результаты двух или нескольких групп по одному или нескольким тестовым показателям. Например, можно сравнить три группы по одному показателю, две группы по восьми показателям или любое интересующее исследователя количество групп по любым показателям (например, допустим, вы хотите сравнить результаты тестирования учащихся четырех школ по математике, английскому языку и естественнонаучным предметам или результаты мужчин и женщин, полученные с использованием батареи из восьми различных тестов интеллекта). Метод АЛ/ОМ4 позволяет получить важные сведения. Во-первых, выясняется, существуют ли значимые различия между результатами разных групп. Кроме того, можно узнать, получают испытуемые одинаковые или различные результаты при тестировании одного и того же качества с использованием различных тес-
220 Глан.1 7, Млгем.пико-статистическая обработка данных исследования
гаи (например, таким образом можно показать, что один тест труднее дру-Ю1о), В-гро1ьих, ЛЫСЛ/А позволяет выявить наличие взаимодействия между группами и предложенными им тестами. Вернемся к приведенному выше примору со школами. С помощью ЛЫСЛ/А можно продемонстрировать, что и целом оценки учащихся одной школы выше по сравнению со всеми ос-юльными оценками. Кроме того, можно также показать различия в закономерностях распределения результатов. Например, может оказаться, что учащиеся одной школы относительно лучше справляются с заданиями по естественнонаучным предметам по сравнению с заданиями по английскому языку или математике, в то время как в третьей школе учащиеся демонстрируют примерно одинаковые результаты по всем предметам. Такие различия между группами в закономерностях распределения результатов называются взаимодействием, АМОУА позволяет выявить его и определить его статистическую надежность.
Ближайшими эквивалентами критерия АМСЛ/А являются непараметрический однофакторный критерий Крускала-Уоллиса, который позволяет сравнивать результаты трех или более групп, но только по одному показателю. Ни один непараметрический критерий не дает возможности одновременно сравнивать результаты более двух групп по нескольким показателям.
Источник: Стюарт-Гамильтон Я. Что такое психология. СПб.: Питер, 2002. С. 269. См. также: Наследов А. Д. Математические методы психологического исследования. Анализ и интерпретация данных: Учебное пособие. СПб.: Речь, 2004. С. 185-232.
Итак, рассмотрим более подробно метод оценки достоверности различий средних арифметических по достаточно эффективному параметрическому критерию Стьюдента, который предназначен для решения одной из наиболее часто встречающихся задач при обработке данных — выявления достоверности различий между двумя или более рядами значений.
Данная оценка часто необходима при сравнительном анализе полярных групп. Эти группы можно выделить, учитывая различную выраженность определенного целевого признака (характеристики) изучаемого явления. Какими критериями при этом руководствоваться, мы указывали выше. Обычно анализ начинают с подсчета первичных статистик выделенных групп, затем оценивают достоверность отличий. Он вычисляется по формуле:
( _ М,- М2
"-51 |
уот," + т |
Г^Л- (7-5)
где М,иМ2 — значения сравниваемых средних арифметических; 1$с — величина вычисленного эмпирического критерия, который необходимо сравнивать с критическим; ш,иш2 — соответствующие величины статистических ошибок средних арифметических.
7.4. Оценка достоверности отличий по ^-критерию Стьюдента _______ 221_
Значения критерия Стьюдента для трех уровней доверительной (статистической) значимости (р) приведены в приложении 2. Число степеней свободы определяется по формуле:
а1 = V = пх + п2 - 2,
где пх и пг — объемы сравниваемых выборок. С уменьшением объемов выборок (п < 10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуется использовать непараметрические методы или сравниватьполученные значения с критическими (приведенными в таблице) для более высокого уровня значимости.
Решение о достоверности различий принимается в том случае, если вычисленная величина 15( превышает табличное значение для данного числа степеней свободы (й? (^)). В тексте публикации или научного отчета указывают наиболее высокий уровень значимости из трех:/) < 0,05; /><0,01;р< 0,001.
Приведенная формула проста. Используя ее, можно с помощью бытового калькулятора с памятью вычислить ^-критерий без промежуточных записей. Однако, на наш взгляд, целесообразнее вычислять его, используя компьютерные программы. Алгоритм вычисления в программе Ехсе1 мы рассмотрим ниже.
Однако следует помнить, что при любом численном значении критерия достоверности различия между средними этот показатель оценивает не степень выявленного различия (она оценивается по самой разности между средними), а лишь статистическую достоверность его, т. е. право распространять полученный на основе сопоставления выборок вывод о наличии разницы на все явление (весь процесс) в целом. Низкий вычисленный критерий различия не может служить доказательством отсутствия различия между двумя признаками (явлениями), ибо его значимость (степень вероятности) зависит не только от величины средних, но и от численности сравниваемых выборок. Он говорит не об отсутствии различия, а о том, что при данной величине выборок оно статистически недостоверно: слишком велик шанс, что разница при данных условиях определения случайна, слишком мала вероятность ее достоверности [25, с. 70].
Алгоритм вычисления ^-критерия Стьюдента в программе Ехсе/
При условии нормального или близкого к нормальному распределения сравниваются две выборки или подвыбоки (из основной выборки), различающиеся по какому-либо показателю (независимой переменной).
222 Глава 7. Математико-статистическая обработка данных исследования
/Для выборок это могут быть мужчины и женщины (если ставится задача выявления тендерных различий), лица подросткового и юношеского возраста (при выявлении психологических особенностей возрастного развития) и т. д.
Если выборка одна, то одной из задач исследования может быть выявление психологических особенностей, характеристик, присущих «успешным» и «неуспешным» в данной выборке по каким-либо психологическим характеристикам. Решение этого рода задач мы и рассмотрим в качестве примера.
В любом случае в выборках, подвыборках вычисляются первичные статистики: М, а, п, т.
Выделение подвыборок в основной выборке осуществляется при помощи функции «Сортировка». Необходимо отсортировать выборку по какому-либо признаку. На примере эмпирических данных нашей таблицы это могут быть:
• интегральная шкала опросника МЛО «Адаптивность» — ЛАП (личностный адаптационный потенциал) и основные подшкалы: ПР (поведенческая регуляция, нервно-психическая устойчивость), КК (коммуникативные качества), МН (моральная нормативность);
• шкалы опросника «Спилбергера—Ханина» — РТ (реактивная тревожность — ситуативная) и ЛТ (личностная тревожность — как черта личности);
• интегральная шкала интеллектуальной батареи — балл..
По каждой из этих шкал мы можем выделить группы «успешных» и «неуспешных» по данному признаку и выявить, различаются они на достоверно значимом уровне или не различаются по остальным психологическим характеристикам.
Пример
Гипотеза (предположение): учащиеся с более высоким уровнем развития основных познавательных процессов отличаются от учащихся с более низким уровнем развития познавательных психических процессов по ряду личностных характеристик.
Задача: выделить группы «успешных» и «неуспешных» учащихся по уровню развития основных познавательных психических процессов с целью дальнейшего выявления различий между ними по личностным характеристикам.
Алгоритм сортировки данных сводной таблицы исследования студентов-психологов по шкале «Балл» (рис. 7.17).
7.4. Оценка достоверности отличий по (-критерию Стьюдента
.Зр'^г»** ]]?•*'» й«*?»** *«и* Ъргг- л*»** а*» ффю* 1^^*^(
-гГ"—У.",
Г -ДЦ- Г Гс 1 й 1г I Пб.1в1 > Щки1и,»Ю1 И 4. >АА. «ЫМИЯ
, * | 5 ^<мя ч5%щ-х. у д а чм Г* таг >»—«с2 Тг»*ч -ж^"* е-*х.и -щ,- г Г*"' *ы * п*в,*.«мв«т 1/И г "^
,— ~^ г т- 1 г—^ г-г -| -г—г *
...г |
мг<
Рис. 7.17. Сортировка по шкале «Балл» (Р)
Сравнительная характеристика групп успешных" и^иедспешных'Чтудентов по интеллекту |
& дн чр зп |ом |ас |вп |уз I ш |
|МН ЛАП |
— "не успешн а11ПР |
361 13 8 9 25 59ЛЗ 48 51^22 9 14' 19 92 9,2 22 2 24 120 10,2 433 358 1341 59 13,382 34 67 51 41 449128 65В 8 8 8 В В 8 9 9 9 9 9 9 9 9| 36 153 1 26 4 741 2 1 4 7 127 1 1, 2.2 17 14 1 51 0Э 2 19' 11 917 425 40 44 263 18125 21 16 27 2129 162 2 223 2861 5^ 13 186 19 25 27 43 16 0,8 662 6,6 666666,666>66 1 1' X7 065 03 2/ |
Рис. 7.18. Вычисление первичных статистик по подвыборкам
224 Глава 7. Математико-статистическая обработка данных исследования
Открываем Ехсе1 «лист 1» сводной таблицы. Выделяем данные для сортирошси: начиная от первой ячейки шкалы наименований признаков (и данном примере — АЗ) и заканчивая последней ячейкой численного показателя в последнем столбце признаков (в данном примере — Р29). В меню выбираем «Данные» > «Сортировка» > «Сортировать по...»> «Балл» >® «по возрастанию» (или «убыванию») > ОК.
Данные отсортированы по возрастанию, начиная от меньшего показателя признака к большему. Затем начинается творческая работа исследователя. Поскольку выборка одна и подчиняется закону нормального распределения признака, то следует в ней определить крайние границы «успешных» и «неуспешных» по интеллекту. В целом можно придерживаться правила, что 50% признаков от средней арифметической составляют популяционную норму, а следовательно, из расчетов должны быть исключены. Однако на практике эти границы можно варьировать, но в разумных пределах, при определении подвыборок в основной выборке.
Выделим в качестве «неуспешных» выборку с параметрами Р 4: Р 12 (т. е. пх = 9), а «успешных» — Р 24: Р 29 (т. е. п2 = 6). Вычислим для каждой этой выборки отдельно М, а (5), п, т, придерживаясь алгоритма, указанного раннее для вычисления первичных статистик, используя «Вставку функций» (рис. 7.18).
Будьте внимательны! Вы определяете параметры выборок «успешных» и «неуспешных» по столбцу «Р» («Балл»). Но вычисления будете проводить в столбце первого признака под таблицей — «С». Поэтому параметры выборки «неуспешных» будут С 4: С 12, а «успешных» — С 24: С 29. (см. рис. 7.18). После того как вычислены первичные статистики по выборкам «успешных» и «неуспешных», переходим к вычислению ^-критерия Стьюдента.
Дата добавления: 2015-08-05; просмотров: 106 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Характер распределения признака | | | Алгоритм вычисления ^-критерия Стьюдента |