Читайте также:
|
|
Статистическая значимость (Significant level, сокращенно Sig.), или р-уро- вень значимости (р-level), — основной результат проверки статистической гипотезы. Говоря техническим языком, это вероятность получения данного результата выборочного исследования при условии, что на самом деле для генеральной совокупности верна нулевая статистическая гипотеза — то есть связи нет. Иначе говоря, это вероятность того, что обнаруженная связь носит случайный характер, а не является свойством совокупности. Именно статис-
ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА
тическая значимость, р-уровень значимости является количественной оценкой надежности связи: чем меньше эта вероятность, тем надежнее связь.
Предположим, при сравнении двух выборочных средних было получено значение уровня статистической значимости/? = 0,05. Это значит, что проверка статистической гипотезы о равенстве средних в генеральной совокупности показала, что если она верна, то вероятность случайного появления обнаруженных различий составляет не более 5%. Иначе говоря, если бы две выборки многократно извлекались из одной и той же генеральной совокупности, то в 1 из 20 случаев обнаруживалось бы такое же или большее различие между средними этих выборок. То есть существует 5%-ная вероятность того, что обнаруженные различия носят случайный характер, а не являются свойством совокупности.
В отношении научной гипотезы уровень статистической значимости — это количественный показатель степени недоверия к выводу о наличии связи, вычисленный по результатам выборочной, эмпирической проверки этой гипотезы. Чем меньше значение р-уровня, тем выше статистическая значимость результата исследования, подтверждающего научную гипотезу.
Полезно знать, что влияет на уровень значимости. Уровень значимости при прочих равных условиях выше (значение /7-уровня меньше), если:
□ величина связи (различия) больше;
□ изменчивость признака (признаков) меньше;
□ объем выборки (выборок) больше.
Это демонстрируют формулы 7.1 и 7.2, как и другие формулы, предназначенные для соотнесения эмпирических значений статистик с теоретическими распределениями. В данном случае статистическая значимость возрастает (/^-уровень уменьшается), когда увеличивается г-значение: при увеличении разности средних значений, при уменьшении дисперсии признака, при увеличении объема выборки.
Чем больше гипотез проверяется, тем выше шанс получить результат чисто случайно — р-уровень увеличивается пропорционально количеству проверяемых гипотез!
Например, если результат считается значимым при р < 0,05 и проверяется 20 гипотез (о корреляции или различиях), то одна из гипотез подтвердится наверняка, независимо от действительного положения дел. Единственный шанс внести ясность — проверить эти гипотезы на параллельной (идентичной) выборке.
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ И ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ
Статистический критерий (Statistical Test) — это инструмент определения уровня статистической значимости. В частности, при демонстрации логики проверки статистической гипотезы мы воспользовались ^-критерием, а также
ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
упомянули критерий ^-Стьюдента. Как следует из логики проверки статистических гипотез, в качестве основы для применения статистических критериев используют теоретические распределения, для условия, когда верна нулевая гипотеза. Критерий также подразумевает формулу, позволяющую соотнести эмпирическое значение выборочной статистики с этим теоретическим распределением (например, формулы 7.1 и 7.2). Применяя эту формулу, исследователь вычисляет эмпирическое значение критерия. Полученное эмпирическое значение позволяет определить р-уровень — значение вероятности того, что нулевая статистическая гипотеза верна.
Помимо формулы эмпирического значения, критерий задает формулу для определения числа степеней свободы. Число степеней свободы (degrees of freedom — обозначается как df)— это количество возможных направлений изменчивости признака. Как правило, число степеней свободы линейно зависит от объема выборки, от числа признаков или их градаций — чем больше эти показатели, тем больше число степеней свободы. В связи с тем, что для каждого случая определение <#"имеет свою специфику, сейчас подчеркнем лишь следующее. Каждая формула для расчета эмпирического значения критерия обязательно сопровождается правилом (формулой) для определения числа степеней свободы.
Назначение критерия — проверка статистической гипотезы путем определения/ьуровня значимости (вероятности того, что Но верна).
Выбор критерия определяется проверяемой статистической гипотезой.
Критерий включает в себя:
П формулу расчета эмпирического значения критерия по выборочным статистикам; D правило (формулу) определения числа степеней свободы;
□ теоретическое распределение для данного числа степеней свободы;
□ правило соотнесения эмпирического значения критерия с теоретичес
ким распределением для определения вероятности того, что Но верна.
Для проверки статистических гипотез применяются различные критерии. При этом одному теоретическому распределению могут соответствовать разные формулы критериев — в зависимости от проверяемой статистической гипотезы. Но принцип проверки является общим для всего этого многообразия: вычисленное по формуле эмпирическое значение критерия сопоставляется с теоретическим распределением для заданного числа степеней свободы, что позволяет определить вероятность того, что Но верна.
ПРОВЕРКА ГИПОТЕЗ С ПОМОЩЬЮ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ
Множество разработанных статистических критериев (или статистических тестов) соответствует множеству возможных формулировок статистических гипотез. Выбор критерия представляет собой отдельную проблему, которая
ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА
V |
Выбор критерия представляет собой отдельную проблему
будет рассматриваться нами в следующей главе. А сейчас будем исходить из того, что исследователь уже решил проблему выбора критерия, и рассмотрим общую последовательность проверки гипотезы.
При обработке данных на компьютере при помощи статистической программы (например, SPSS) исследователю достаточно указать программе, какой критерий (метод, тест) необходимо применить к заданной выборке исходных данных. Далее программа сама вычисляет эмпирическое значение критерия и сопоставляет его с теоретическим распределением. В качестве результата исследователь получает значение ^-уровня значимости, наряду с эмпирическим значением критерия и числом степеней свободы.
Когда расчеты производятся «вручную», исследователь совершает более сложную последовательность действий для проверки гипотезы, включающую применение специальных таблиц критических значений критерия:
1. Выбор критерия в зависимости от вида исходных данных и статистичес
кой гипотезы: теоретического распределения, формул расчета эмпири
ческого значения критерия и числа степеней свободы.
2. Расчет по исходным данным (или по имеющимся статистикам) эмпи
рического значения критерия и числа степеней свободы.
3. Применение «Таблицы критических значений критерия» позволяет оп
ределить значение /?-уровня для данного числа степеней свободы.
Таблица критических значений содержит значения (квантили) теоретического распределения, соответствующие наиболее важным — критическим значениям /ьуровня (0,1; 0,05; 0,01 и т. д.) для различных чисел степеней свободы. /7-уровепь значимости по вычисленному эмпирическому значению критерия при помощи таких таблиц определяется следующим образом. Для данного числа степеней свободы по таблице определяются ближайшие критические значения и/?-уровни, им соответствующие. Далее значение р-уровня определяется в виде неравенства по правилу, которое демонстрируется на рис. 7.2 (значимость возрастает слева направо, в соответствии с убыванием /ьуровня):
П если эмпирическое значение критерия (Кэ) находится между двумя критическими значениями, то /^-уровень меньше того критического р, которое находится левее;
ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
П если К^ находится левее крайнего левого критического значения (обычно это соответствует критическому^ = 0,1, реже — р = 0,05), то ^-уровень больше, чем крайнее правое критическое значение р;
О если Кэ находится правее крайнего правого критического значения, то /ьуровень меньше крайнего правого критического р.
Например, если эмпирическое значение критерия (Кэ) находится между А^05 и А'оо,, то р < 0,05. Если Кэ находится левее ЛГО>Ь то р > 0,1. Если А^ находится правее АоОП,, тор < 0,001.
Решение исследователя:
р>0,1 р<0,1 р<0,05 р < 0,01 р< 0,001
Рис. 7.2. Схема определения/^-уровня (р~... — критические значения/ьуровня, К — соответствующие критические значения критерия)
Для разных критериев возможны разные соотношения между р-уровнем и величиной критических его значений. Для большинства критериев (t, F, у} и др.) — чем больше значение критерия, тем выше статистическая значимость (меньше/^-уровень). Но для некоторых критериев зависимость обратная. Например, £/-Манна-Уитни или Т-Вилкоксона убывают по мере увеличения уровня значимости (уменьшения ^-уровня). Тем не менее, правило остается общим, в соответствии со схемой на рис. 7.2. Например, если t3 находится между /0, и г005 (т. е. /0,i < t3< tQ$5), тор < 0,1. И если 1/э находится между UQl и £/о,о5 (т.е- ^о,о5 < &>< £/o,i)>to/K 0,1. Если же эмпирическое значение попадает левее критического для р = 0,1 (/э < tQ >ь но С/э > Uo^), то уровень значимости определяется как/j > 0,1.
ПРИМЕРЫ_____________________________________________________________
1. Гипотеза Но: М -100 проверяется при помощи критерия /-Стьюдента. Для вы
числения эмпирического значения критерия t3 применяется формула 7.2. На
выборке vV= 36 получены следующие значения статистик: М= 107,5, о = 15. По
формуле 7.2 t3- 3, df= 35. Далее воспользуемся таблицей критических значений
/-Стьюдента (приложение 2). В этой таблице строки соответствуют df— числам
степеней свободы, столбцы — критическим значениям р-уровня. В строке для
df— 35 обнаруживаем, что наше эмпирическое значение попадает в интервал
между значениями 2,724 (для р - 0,01) и 3,591 (для р ~ 0,001). Следовательно,
вероятность того, что Но верна, р < 0,01.
2. Предположим, та же гипотеза проверяется на выборке N — 36, но получены сле
дующие значения статистик: М= 102,5, а— 15. По формуле 1Э=\, df= 35. Вос
пользовавшись той же таблицей критических значений, обнаруживаем, что
наше эмпирическое значение меньше, чем /Oil = 1,69. Следовательно, в соответ
ствии со схемой на рис. 7.2, р > 0,1.
ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА
Дата добавления: 2015-11-04; просмотров: 147 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ | | | ВЫБОР МЕТОДА СТАТИСТИЧЕСКОГО ВЫВОДА |