Читайте также:
|
|
РаспределениемФишера – Снедекора называется распределение случайной величины
где χ 2(k 1) и χ 2(k 2) -случайные величины, имеющие χ 2 - распределение соответственно с k 1 и k 2 степенями свободы.
Задание 1. Попытайтесь обосновать тот факт, что распределение χ 2 положено в основу многих критериев проверки статистических гипотез.
Пример 1. Для контроля качества обучения в двух школах восьмых классов было проведено тестирование 32 учеников первой и 45 учеников второй школы: n x =32; n y = 45.
По результатам тестирования были подсчитаны средние баллы для тестируемых учеников первой и второй школы. Они соответственно оказались равными: = 4,45; =4,19.
До начала тестирования школы представили сведения, свидетельствующие о тот, что успеваемость учеников восьмых классов, оцениваемая средним баллом за год обучения находится для этих школ на одном и том же уровне . Однако дисперсия среднего балла для этих школ различная и соответственно имеет следующие значения: D (X)= 1,1; D (Y)= 1,61. Отклонения уровня успеваемости учащихся в каждом классе распределены по нормальному закону.
Требуется на уровне значимости α = 0,05 проверить, существенно ли полученное различие средних показателей успеваемости учащихся или эти различия не существенны.
Решение. Для решения данной задачи необходимо сравнить 2 средние величины из нормально распределенных генеральных совокупностей, дисперсии которых известны. В данной задаче речь идет о больших выборках, так как п х = 32 и п y =45 больше 30. Выборки — независимые, так как из контекста задачи видно, что они извлечены из непересекающихся генеральных совокупностей.
Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н 0: = — генеральные средние двух нормально распределенных совокупностей с известными дисперсиями равны (применительно к условию данной задачи — учащиеся двух школ имеют на уровне значимости α = 0,05 одинаковую успеваемость).
Н 1: — генеральные средние двух нормально распределенных совокупностей с известными дисперсиями не равны.
Конкурирующая гипотеза двусторонняя, так как из условия задачи не следует, что необходимо выяснить больше или меньше успеваемость в одном из классов по сравнению с другим.
Поскольку конкурирующая гипотеза — двусторонняя, то и критическая область — двусторонняя.
В качестве критерия для сравнения 2-х средних генеральных совокупностей, дисперсии которых известны (большие независимые выборки), используется случайная величина Z.
Его наблюдаемое значение (Z наб)рассчитывается по формуле:
(1)
где — выборочная средняя для X;
— выборочная средняя для Y;
D (X) — генеральная дисперсия для X;
D (Y) — генеральная дисперсия для Y.
|
Так как конкурирующая гипотеза — двусторонняя, критическое значение (Z кр) следует находить по таблице функции Лапласа (см. приложение)из равенства
.
Отсюда
Ф0(1,96) = 0,475.
Учитывая, что конкурирующая гипотеза — двусторонняя, находим две критические точки:
Z кр-п = 1,96; Z кр-л = -1,96 (см. рис. 1).
Рис. 1. Область принятия решений
Заметим, что при левосторонней конкурирующей гипотезе Zкр следует находить по таблице функции Лапласа (приложение)из равенства Ф 0(Z кр) = (1 - 2 α)/2 и присваивать ему знак «минус».
При правосторонней конкурирующей гипотезе Zкр находим по таблице функции Лапласа (приложение)из равенства Ф 0(Z кр) = (1 - 2 α)/2.
В результате имеем, что Zнаб<Zкр, следовательно, на данном уровне значимости нулевая гипотеза не отвергается в пользу конкурирующей. На уровне значимости α = 0,05 можно утверждать, что полученное различие средних показателей успеваемости в школах случайно, их уровень примерно одинаков (на уровне доверия равном γ = 1- α =0,95).
Наблюдаемое значение критерия попадает в критическую область, следовательно, нулевая гипотеза отклоняется в пользу конкурирующей.
Ответ. На уровне значимости α = 0,05 можно утверждать, что полученное различие средних показателей тестирования учащихся в двух школах случайно, знания учащихся, контролируемые тестом, для обеих школ одинаковы.
|
Пример 2. Предлагаетсяновая методикаорганизации обслуживания
автомобилей, применение которой при том же объеме обслуживания сократит время на его проведение. Проведение обслуживания (ТО-1) 9 автомобилей по старой методике и 15 автомобилей - по новой методике дало следующие результаты:
- среднее время обслуживания старым методом = 60 мин, выборочная дисперсия s 2x = 180 (мин2);
- среднее время обслуживания новым методом = 50 мин, а выборочная дисперсия s 2y = 150 (мин2).
На уровне значимости α = 0,01 следует установить, позволило ли использование нового метода сократить время обслуживания автомобилей?
Решение. Для решения данной задачи необходимо сравнить 2 средние нормально распределенных генеральных совокупностей, генеральные дисперсии которых неизвестны,но предполагаются одинаковыми (малые независимые выборки). В этой задаче речь идет о малых выборках, так как п х = 9и п у = 15 меньше 30. Выборки — независимые, поскольку из контекста задачи видно, что они извлечены из непересекающихся генеральных совокупностей.
Сформулируем нулевую и конкурирующую гипотезы, согласно условию задачи.
Н 0: = — генеральные средние двух нормально распределенных совокупностей с неизвестными дисперсиями (предполагаемыми одинаковыми) равны, т.е. новая и старая методики по времени выполнения ТО-1 равнозначны.
Н 1: > — генеральная средняя для X больше, чем генеральная средняя для У, т.е. новая методики по времени выполнения ТО-1 дает выигрыш.
Так как конкурирующая гипотеза — правосторонняя, то и критическая область — правосторонняя.
Приступать к проверке гипотезы о равенстве генеральных средних 2-х нормально распределенных совокупностей с неизвестными дисперсиями можно лишь в том случае, если генеральные дисперсии равны. В противном случае, данная задача теоретически неразрешима.
Поэтому, прежде чем проверять эту гипотезу, проверим гипотезу о равенстве генеральных дисперсий нормальных совокупностей.
Сформулируем для этого дополнительного условия нулевую и конкурирующую гипотезы, согласно условию задачи.
H 0: D (X) = D (Y) — генеральные дисперсии 2 нормально распределенных совокупностей равны.
Н 1: D (X) > D (Y) — генеральная дисперсия для X больше генеральной дисперсии для Y. Выдвигаем правостороннюю конкурирующую гипотезу, так как выборочная дисперсия для X значительно больше, чем выборочная дисперсия для Y.
Так как конкурирующая гипотеза — правосторонняя, то и критическая область — правосторонняя.
В качестве критерия для сравнения 2-х дисперсий нормальных генеральных совокупностей используется случайная величина F — критерий Фишера-Снедекора (приложение).
Его наблюдаемое значение (f наб) рассчитывается по формуле
где S б — большая выборочная дисперсия;
S м — меньшая выборочная дисперсия.
Критическое значение (f кр)следует находится по таблице распределения Фишера-Снедекора (приложение)по уровню значимости α и числу степеней свободы k 1 и k 2.
По условию α = 0,01; число степеней свободы найдем по формуле
k 1 = п х – 1 = 9 – 1 = 8;
k 2 = п у – 1 = 15 – 1 = 14.
Определяем f кр по уровню значимости α = 0,01 и числу степеней свободы k l = 8 и k 2 =14:
f кр(9;14; α = 0,01 ) = 4,14.
Имеем, что f наб< f кр,следовательно, на данном уровне значимости нет оснований отвергнуть нулевую гипотезу о равенстве генеральных дисперсий нормальных совокупностей.
Следовательно, можно приступить к проверке гипотезы о равенстве генеральных средних двух нормально распределенных совокупностей.
В качестве критерия для проверки этой гипотезы используется случайная величина t -критерий Стьюдента. (Почему?)
Его наблюдаемое значение (t нa6)рассчитывается по формуле
Критическое значение (t кр)следует находить по таблице распределения Стьюдента (приложение)по уровню значимости α и числу степеней свободы k.
По условию α = 0,01; число степеней свободы найдем по формуле
k= п х + п у – 2 = 9 + 15 - 2 = 22.
Найдем t кр по уровню значимости α = 0,01 и числу степеней свободы k = 22 для односторонней критической области:
t кр(0,01; 22) = 2,51.
Таким образом, имеем: t нa6 < t к или 1,87 < 2,51.
Поэтому по имеющимся данным на уровне значимости α = 0,01 нельзя отклонить нулевую гипотезу о том, что генеральные средние равны, т.е. среднее время, затрачиваемое на ТО-1 по старой и новой методике, отличается незначимо, расхождения между ними случайны. Применение нового метода ТО-1 не позволяет снизить время обслуживания.
Ответ. На уровне значимости α = 0,01 нельзя утверждать о сокращении время обслуживания автомобилей по новой методике.
|
Пример 3. Изменим условие предыдущего примера и положим, что те же статистические показатели были получены на выборках n x =40 и n y = 50.
Решение. Сформулируем нулевую и конкурирующую гипотезы, исходя из условия задачи.
Н 0: = — генеральные средние двух нормально распределенных совокупностей равны, т.е. новая и старая методики по времени выполнения ТО-1 равнозначны.
Н 1: > — генеральная средняя для X больше, чем генеральная средняя для У, т.е. новая методики по времени выполнения ТО-1 дает выигрыш.
Так как конкурирующая гипотеза — правосторонняя, то и критическая область — правосторонняя.
В качестве критерия для проверки этой гипотезы используется случайная величина u нa6, вычисляемая по формуле
Заметим, что при правосторонней конкурирующей гипотезе Н 1: и кр следует находить по таблице функции Лапласа из равенства
Ф 0(и крпр) = (1 - 2 α)/2.
Отсюда
Ф0(2,58) = 0,495.
Дата добавления: 2015-07-10; просмотров: 387 | Нарушение авторских прав