Читайте также: |
|
Не менее важной, чем сравнение дисперсий, является задача о сравнении средних. Например, проводя наблюдения одного и того же объекта в течение длительного времени, мы должны проверять, остается ли при этом неизменным истинное значение измеряемой величины.
Пусть заданы две случайные выборки: х1, х2,..., хn1 и y1 , y2,…yn2 взятые из нормально распределенных генеральных совокупностей. Пусть генеральное среднее и генеральная дисперсия первой совокупности равны a1 и , второй — a2 и . Тогда среднее первой выборки есть нормально распределенная случайная величина с параметрами a1 и , среднее у1 второй выборки есть нормально распределенная случайная величина с параметрами а2 и . Рассмотрим случайную величину .
На основании свойств математического ожидания и дисперсии находим, что
,
.
Более того, распределение величины также является нормальным в силу линейности нормального распределения, поэтому и будут параметрами этого распределения. Это позволяет дать оценку разности а1 - а2 с помощью квантилей стандартного нормального распределения так, как это было уже сделано. При доверительной вероятности (1 – р) мы получим двустороннюю доверительную оценку:
или односторонние оценки:
,
Если высказывается гипотеза а1 = а2 (нулевая гипотеза), то полученные оценки могут служить критериями проверки этой гипотезы. Действительно, если нулевая гипотеза верна, то должны выполняться (с вероятностью 1—р) все записанные выше неравенства, где вместо а1 - а2,_ стоит нуль. Нарушение каждого такого неравенства имеет вероятность р, в силу чего оно является значимым (неслучайным) событием. Таким образом, гипотеза а1 = а2 отвергается, если выполнено неравенство
при двустороннем критерии или неравенство
при одностороннем критерии. Напомним, что односторонний критерий применяется тогда, когда заранее известно, что большему выборочному среднему ( или ) не может соответствовать меньшее генеральное среднее.
Указанные критерии просты и надежны, но они требуют знания и , что не всегда возможно, особенно при обработке малых выборок. Если генеральные дисперсии и неизвестны и можно оперировать только выборочными дисперсиями и , то приходится обращаться к распределению Стьюдента.
Предположим вначале, что . Это равенство можно проверять по заданным и , с помощью изложенного в предыдущем пункте критерия Фишера. В этом случае генеральную дисперсию можно оценивать средневзвешенной дисперсией
Число степеней свободы у s2 равно f = n1+n2—2.
Дисперсия величины имеет теперь простой вид
На основании общих правил нормированная случайная величина
имеет стандартное нормальное распределение. Если же заменить на s, то получится величина
имеющая распределение Стьюдента с f степенями свободы.
Используя квантили Стьюдента , мы можем теперь записать доверительные оценки для разности а1 — а2, не содержащие неизвестной генеральной дисперсии . При доверительной вероятности 1—р имеем двустороннюю оценку
или односторонние оценки
Вернемся вновь к рассмотрению нулевой гипотезы а1 = а2. Те же рассуждения, что и раньше, дадут нам критерий проверки этой гипотезы с помощью распределения Стьюдента:
нулевая гипотеза отвергается, если
при двустороннем критерии или
при одностороннем критерии. Напомним, что в оценках используются квантили величины t, соответствующие f =(n1 +n2 - 2) степеням свободы.
Сравним с помощью полученного критерия производительность некоторого завода (с установившимся производственным процессом) в дневную и ночную смены. Среднемесячная (п = 30) выработка дневной смены тыс. руб., ночной смены тыс. руб., дисперсии соответственно равны и .
Сначала сравним дисперсии по критерию Фишера:
Различие между дисперсиями оказывается незначимым, поэтому можно применять t - критерий. Найдем средневзвешенную дисперсию
,
откуда . Число степеней свободы f = 58. Из таблицы квантилей Стьюдента находим t0,95 = 1,67, поэтому
.
Мы видим, что Значит, при 5%-ном уровне значимости разницу между производителями дневной и ночной смены нужно считать значимой.
Заметим, что мы здесь рассматривали односторонний критерий, так как средние данные позволяют предполагать, что в ночную смену производительность ниже. Если бы мы не делали этого предположения и применили двусторонний критерий, то пришлось бы взять t0,975 = 2,00. Читателю нетрудно убедиться, что и при двустороннем критерии расхождение средних производительностей является значимым.
Рассмотрим теперь общий случай, когда генеральные дисперсии и не равны между собой. Полученные выше точные критерии оказываются в этом случае не пригодными. Существует несколько приближенных критериев, позволяющих проверять гипотезу о равенстве генеральных средних с той или иной точностью. Приведем один, наиболее распространенный и удобный в работе.
Пусть, как и прежде, и есть дисперсии первой и второй выборок и пусть первой дисперсии соответствуют f1 = n1 -1, а второй f2 = n2 -1 степеней свободы. Вычислим отношения
По таблице III Приложения найдем квантили (т. е. для f1 степеней свободы) и . Наконец, вычислим величину
Нулевая гипотеза a1 = a2 отклоняется, если окажется, что . Заметим, что сформулированный критерий является двусторонним и превращается в односторонний при замене на р.
Рассмотрим в качестве примера результаты опытов, проделанных в начале нашего столетия английским физиком Рэлеем. Он сравнивал вес одного и того же объема азота, полученного после тщательнейшей химической очистки из азотистых соединений (в дальнейшем обозначается через х) и из воздуха (обозначается через у). Измерения проводились при неизменных условиях (15°С и 760 мм рт. ст.), результаты измерений приведены в таблице 1.2. Непосредственный подсчет средних дает и , откуда .
x | y | x | y |
2301,43 | 2310,17 | 2299,40 | 2310,10 |
2298,90 | 2309,86 | 2298,49 | 2310,28 |
2298,16 | 2310,10 | 2298,89 | 2310,35 |
2301,82 | 2310,01 | 2310,26 | |
2298,69 | 2310,24 | 2310,24 |
Таким образом, получается, что, несмотря на тщательнейшую очистку, азот воздуха почти на - тяжелее азота, полученного из соединений.
Величина 10,69 невелика по сравнению с самими и , поэтому можно предположить, что она связана с неточностью измерений, с недостаточной очисткой азота и другими случайными причинами. Имея данные Рэлея, мы можем проверить, действительно ли расхождение случайно или оно значимо. В качестве уровня значимости возьмем самый низкий из имеющихся в таблице III Приложения, т. е. p = 0,001. Этот уровень позволяет считать значимыми (неслучайными) примерно в 50 раз меньше событий, чем общепринятый уровень 0,05. Благодаря такому выбору уровня значимости мы будем максимально застрахованы от ошибки первого рода — возможности отвергнуть гипотезу о равенстве средних, в то время как она верна.
Итак, приступим к проверке гипотезы а1 = а2. Непосредственный подсчет дает значения и с f1 = 7 и f2 = 9 степенями свободы. Отношение этих дисперсии намного превосходит табличное значение , поэтому дисперсии измерений нужно считать различными и для сравнения средних использовать приближенный критерий. Находим , .
Из таблицы берем квантили Стьюдента , . Отсюда
,
и значит, . Гипотезу о равенстве средних нужно отбросить (ее вероятность меньше p = 0,001).
Из проведенного сравнения средних вытекает, что расхождение между весом азота из воздуха и из соединений не является случайным. Это заставило ученых более внимательно исследовать азот, полученный из воздуха, и вскоре было показано, что в нем содержится небольшое количество газа, более тяжелого, чем азот,— аргона.
Дата добавления: 2015-08-10; просмотров: 82 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Санитарные показатели качества воды | | | Сравнение средних выборок более двух |