Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Уровень статистической значимости

Таблицы сопряженности 2x2 с повторными измерениями | Сравнение более двух независимых выборок | АНАЛИЗ НОМИНАТИВНЫХ ДАННЫХ | СРАВНЕНИЕ ЭМПИРИЧЕСКОГО И ТЕОРЕТИЧЕСКОГО | Binomial Test | Test Statistics | Независимые выборки | Повторные измерения |


Читайте также:
  1. I Уровень. Достижение экономической прибыли
  2. II Уровень. Увеличение рыночной доли
  3. III Уровень. Рост стоимости/ценности компании
  4. Quot;Звезда Смерти", административный уровень, каюта гранд-моффа Таркина
  5. Quot;Звезда Смерти", административный уровень, отдел архитектуры
  6. Quot;Звезда Смерти", административный уровень, отдел архитектуры
  7. Quot;Звезда Смерти", административный уровень, спортзал

Статистическая значимость (Significant level, сокращенно Sig.), или р-уро- вень значимости (р-level), — основной результат проверки статистической ги­потезы. Говоря техническим языком, это вероятность получения данного ре­зультата выборочного исследования при условии, что на самом деле для генеральной совокупности верна нулевая статистическая гипотеза — то есть связи нет. Иначе говоря, это вероятность того, что обнаруженная связь носит случайный характер, а не является свойством совокупности. Именно статис-


ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА

тическая значимость, р-уровень значимости является количественной оцен­кой надежности связи: чем меньше эта вероятность, тем надежнее связь.

Предположим, при сравнении двух выборочных средних было получено значение уровня статистической значимости/? = 0,05. Это значит, что проверка статистической гипотезы о равенстве средних в генеральной совокупности по­казала, что если она верна, то вероятность случайного появления обнаружен­ных различий составляет не более 5%. Иначе говоря, если бы две выборки мно­гократно извлекались из одной и той же генеральной совокупности, то в 1 из 20 случаев обнаруживалось бы такое же или большее различие между средни­ми этих выборок. То есть существует 5%-ная вероятность того, что обнаружен­ные различия носят случайный характер, а не являются свойством совокупности.

В отношении научной гипотезы уровень статистической значимости — это количественный показатель степени недоверия к выводу о наличии связи, вычисленный по результатам выборочной, эмпирической проверки этой ги­потезы. Чем меньше значение р-уровня, тем выше статистическая значимость результата исследования, подтверждающего научную гипотезу.

Полезно знать, что влияет на уровень значимости. Уровень значимости при прочих равных условиях выше (значение /7-уровня меньше), если:

□ величина связи (различия) больше;

□ изменчивость признака (признаков) меньше;

□ объем выборки (выборок) больше.

Это демонстрируют формулы 7.1 и 7.2, как и другие формулы, предназна­ченные для соотнесения эмпирических значений статистик с теоретически­ми распределениями. В данном случае статистическая значимость возрастает (/^-уровень уменьшается), когда увеличивается г-значение: при увеличении разности средних значений, при уменьшении дисперсии признака, при уве­личении объема выборки.

Чем больше гипотез проверяется, тем выше шанс получить результат чис­то случайно — р-уровень увеличивается пропорционально количеству проверяе­мых гипотез!

Например, если результат считается значимым при р < 0,05 и проверяется 20 гипотез (о корреляции или различиях), то одна из гипотез подтвердится наверняка, независимо от действительного положения дел. Единственный шанс внести ясность — проверить эти гипотезы на параллельной (идентич­ной) выборке.

СТАТИСТИЧЕСКИЙ КРИТЕРИЙ И ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ

Статистический критерий (Statistical Test) — это инструмент определения уровня статистической значимости. В частности, при демонстрации логики проверки статистической гипотезы мы воспользовались ^-критерием, а также


ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

упомянули критерий ^-Стьюдента. Как следует из логики проверки статисти­ческих гипотез, в качестве основы для применения статистических критери­ев используют теоретические распределения, для условия, когда верна нулевая гипотеза. Критерий также подразумевает формулу, позволяющую соотнести эмпирическое значение выборочной статистики с этим теоретическим рас­пределением (например, формулы 7.1 и 7.2). Применяя эту формулу, исследо­ватель вычисляет эмпирическое значение критерия. Полученное эмпирическое значение позволяет определить р-уровень — значение вероятности того, что нулевая статистическая гипотеза верна.

Помимо формулы эмпирического значения, критерий задает формулу для определения числа степеней свободы. Число степеней свободы (degrees of free­dom — обозначается как df)— это количество возможных направлений измен­чивости признака. Как правило, число степеней свободы линейно зависит от объема выборки, от числа признаков или их градаций — чем больше эти пока­затели, тем больше число степеней свободы. В связи с тем, что для каждого случая определение <#"имеет свою специфику, сейчас подчеркнем лишь следу­ющее. Каждая формула для расчета эмпирического значения критерия обязательно сопровождается правилом (формулой) для определения числа степеней свободы.

Назначение критерия — проверка статистической гипотезы путем опреде­ления/ьуровня значимости (вероятности того, что Но верна).

Выбор критерия определяется проверяемой статистической гипотезой.

Критерий включает в себя:

П формулу расчета эмпирического значения критерия по выборочным ста­тистикам; D правило (формулу) определения числа степеней свободы;

□ теоретическое распределение для данного числа степеней свободы;

□ правило соотнесения эмпирического значения критерия с теоретичес­
ким распределением для определения вероятности того, что Но верна.

Для проверки статистических гипотез применяются различные критерии. При этом одному теоретическому распределению могут соответствовать раз­ные формулы критериев — в зависимости от проверяемой статистической гипотезы. Но принцип проверки является общим для всего этого многообра­зия: вычисленное по формуле эмпирическое значение критерия сопоставля­ется с теоретическим распределением для заданного числа степеней свобо­ды, что позволяет определить вероятность того, что Но верна.

ПРОВЕРКА ГИПОТЕЗ С ПОМОЩЬЮ СТАТИСТИЧЕСКИХ КРИТЕРИЕВ

Множество разработанных статистических критериев (или статистических тестов) соответствует множеству возможных формулировок статистических гипотез. Выбор критерия представляет собой отдельную проблему, которая


ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА


V

Выбор критерия представляет собой отдельную проблему

будет рассматриваться нами в следующей главе. А сейчас будем исходить из того, что исследователь уже решил проблему выбора критерия, и рассмотрим общую последовательность проверки гипотезы.

При обработке данных на компьютере при помощи статистической про­граммы (например, SPSS) исследователю достаточно указать программе, ка­кой критерий (метод, тест) необходимо применить к заданной выборке ис­ходных данных. Далее программа сама вычисляет эмпирическое значение критерия и сопоставляет его с теоретическим распределением. В качестве ре­зультата исследователь получает значение ^-уровня значимости, наряду с эм­пирическим значением критерия и числом степеней свободы.

Когда расчеты производятся «вручную», исследователь совершает более сложную последовательность действий для проверки гипотезы, включающую применение специальных таблиц критических значений критерия:

1. Выбор критерия в зависимости от вида исходных данных и статистичес­
кой гипотезы: теоретического распределения, формул расчета эмпири­
ческого значения критерия и числа степеней свободы.

2. Расчет по исходным данным (или по имеющимся статистикам) эмпи­
рического значения критерия и числа степеней свободы.

3. Применение «Таблицы критических значений критерия» позволяет оп­
ределить значение /?-уровня для данного числа степеней свободы.

Таблица критических значений содержит значения (квантили) теоретичес­кого распределения, соответствующие наиболее важным — критическим зна­чениям /ьуровня (0,1; 0,05; 0,01 и т. д.) для различных чисел степеней свободы. /7-уровепь значимости по вычисленному эмпирическому значению критерия при помощи таких таблиц определяется следующим образом. Для данного числа степеней свободы по таблице определяются ближайшие критические значения и/?-уровни, им соответствующие. Далее значение р-уровня опреде­ляется в виде неравенства по правилу, которое демонстрируется на рис. 7.2 (значимость возрастает слева направо, в соответствии с убыванием /ьуровня):

П если эмпирическое значение критерия э) находится между двумя кри­тическими значениями, то /^-уровень меньше того критического р, ко­торое находится левее;


ЧАСТЬ II. МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ

П если К^ находится левее крайнего левого критического значения (обычно это соответствует критическому^ = 0,1, реже — р = 0,05), то ^-уровень больше, чем крайнее правое критическое значение р;

О если Кэ находится правее крайнего правого критического значения, то /ьуровень меньше крайнего правого критического р.

Например, если эмпирическое значение критерия (Кэ) находится между А^05 и А'оо,, то р < 0,05. Если Кэ находится левее ЛГО>Ь то р > 0,1. Если А^ находится правее АоОП,, тор < 0,001.

Решение исследователя:

р>0,1 р<0,1 р<0,05 р < 0,01 р< 0,001

Рис. 7.2. Схема определения/^-уровня (р~... — критические значения/ьуровня, К — соответствующие критические значения критерия)

Для разных критериев возможны разные соотношения между р-уровнем и величиной критических его значений. Для большинства критериев (t, F, у} и др.) — чем больше значение критерия, тем выше статистическая значимость (меньше/^-уровень). Но для некоторых критериев зависимость обратная. На­пример, £/-Манна-Уитни или Т-Вилкоксона убывают по мере увеличения уровня значимости (уменьшения ^-уровня). Тем не менее, правило остается общим, в соответствии со схемой на рис. 7.2. Например, если t3 находится между /0, и г005 (т. е. /0,i < t3< tQ$5), тор < 0,1. И если 1/э находится между UQl и £/о,о5 (т.е- ^о,о5 < &>< £/o,i)>to/K 0,1. Если же эмпирическое значение попадает левее критического для р = 0,1 (/э < tQ но С/э > Uo^), то уровень значимости определяется как/j > 0,1.

ПРИМЕРЫ_____________________________________________________________

1. Гипотеза Но: М -100 проверяется при помощи критерия /-Стьюдента. Для вы­
числения эмпирического значения критерия t3 применяется формула 7.2. На
выборке vV= 36 получены следующие значения статистик: М= 107,5, о = 15. По
формуле 7.2 t3- 3, df= 35. Далее воспользуемся таблицей критических значений
/-Стьюдента (приложение 2). В этой таблице строки соответствуют df— числам
степеней свободы, столбцы — критическим значениям р-уровня. В строке для
df— 35 обнаруживаем, что наше эмпирическое значение попадает в интервал
между значениями 2,724 (для р - 0,01) и 3,591 (для р ~ 0,001). Следовательно,
вероятность того, что Но верна, р < 0,01.

2. Предположим, та же гипотеза проверяется на выборке N — 36, но получены сле­
дующие значения статистик: М= 102,5, а— 15. По формуле 1Э=\, df= 35. Вос­
пользовавшись той же таблицей критических значений, обнаруживаем, что
наше эмпирическое значение меньше, чем /Oil = 1,69. Следовательно, в соответ­
ствии со схемой на рис. 7.2, р > 0,1.


ГЛАВА 7. ВВЕДЕНИЕ В ПРОБЛЕМУ СТАТИСТИЧЕСКОГО ВЫВОДА


Дата добавления: 2015-11-04; просмотров: 147 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
ГИПОТЕЗЫ НАУЧНЫЕ И СТАТИСТИЧЕСКИЕ| ВЫБОР МЕТОДА СТАТИСТИЧЕСКОГО ВЫВОДА

mybiblioteka.su - 2015-2025 год. (0.009 сек.)