Читайте также:
|
|
Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше точечные. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.
Интервальной называют оценку, которая определяется двумя числами-концами интервала. Интервальные оценки позволяют установить точность и надежность оценок (смысл этих понятий выясняется ниже).
Пусть найденная по данным выборки статистическая характеристика Θ* служит оценкой неизвестного параметра Θ. Будем считать Θ постоянным числом (Θ может быть и случайной величиной). Ясно. что Θ* тем точнее определяет параметр Θ, чем меньше абсолютная величина разности ½Θ-Θ*½. Другими словами, если δ>0 и ½ Θ-Θ* ½<δ, то чем меньше δ, тем оценка точнее. Таким образом, положительное число δ характеризует точность оценки.
Однако статистические методы не позволяют категорически утверждать, что оценка Θ* удовлетворяет неравенству ½Θ-Θ*½ <δ; можно лишь говорить о вероятности γ, с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки Θ по Θ* называют вероятность γ, с которой осуществляется неравенство. Обычно надежность оценки задается наперед, причем в качестве γ берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.
Пусть вероятность того, что ½Θ-Θ*½ <δ, равна γ:
Р(½ Θ - Θ*½< δ) = γ.
Заменив неравенство ½ Θ-Θ*½ < δ равносильным ему двойным неравенством –δ < Θ - Θ* < δ, или
Θ*- δ < Θ < Θ* + δ, имеем
Р(Θ*- δ < Θ < Θ*+ δ) = γ.
Это соотношение следует понимать так: вероятность того, что интервал (Θ*- δ, Θ* + δ) заключает в себе (покрывает) неизвестный параметр Θ, равна γ.
Доверительным называют интервал (Θ* - δ, Θ* + δ), который покрывает неизвестный параметр с заданной надежностью γ.
Замечание. Интервал (Θ* - δ, Θ* + δ) имеет случайные концы (их называют доверительными границами). Действительно, в разных выборках получаются различные значения Θ*. Следовательно, от выборки к выборке будут изменяться и концы доверительного интервала, т.е. доверительные границы сами являются случайными величинами-функциями от х1, х2, …, хn
Так как случайной величиной является не оцениваемый параметр Θ, а доверительный интервал, то более правильно говорить не о вероятности попадания Θ в доверительный интервал, а о вероятности того, что доверительный интервал покроет Θ.
Метод доверительных интервалов разработал американский статистик Ю. Нейман, исходя из идей английского статистика Р. Фишера.
§ 15. Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ
Пусть количественный признак Х генеральной совокупности распределен нормально, причем среднее квадратическое отклонение σ этого распределения известно. Требуется оценить неизвестное математическое ожидание а по выборочной средней . Поставим своей задачей найти доверительные интервалы, покрывающие параметр а с надежностью γ.
Будем рассматривать выборочную среднюю как случайную величину ( изменяется от выборки к выборке) и выборочные значения признака х1, х2, …, хn - как одинаково распределенные независимые случайные величины Х1 Х2,..., Хn, (эти числа также изменяются от выборки к выборке). Другими словами, математическое ожидание каждой из этих величин равно а и среднее квадратическое отклонение - σ.
Примем без доказательства, что если случайная величина Х распределена нормально, то выборочная средняя X, найденная по независимым наблюдениям, также распределена нормально. Параметры распределения Х таковы (см. гл. VIII, § 9):
Потребуем, чтобы выполнялось соотношение
где γ - заданная надежность.
Пользуясь формулой (см. гл.XII, § 6)
Р(|Х—а| <δ)=2Ф(δ/σ),
заменив Х на и σ на ,получим
где .
Найдя из последнего равенства , можем написать
Приняв во внимание, что вероятность Р задана и равна g окончательно имеем (чтобы получить рабочую формулу, выборочную среднюю вновь обозначим через )
Смысл полученного соотношения таков: с надежностью γ можно утверждать, что доверительный интервал покрывает неизвестный параметр а; точность оценки
Итак, поставленная выше задача полностью решена. Укажем еще, что число t определяется из равенства 2Ф(t)=g, или Ф(t)==g/2; по таблице функции Лапласа (см. приложение 2) находят аргумент t, которому соответствует значение функции Лапласа, равное g/2.
Замечание 1. Оценку называют классической. Из формулы , определяющей точность классической оценки, можно сделать следующие выводы:
1) при возрастании объема выборки п число d убывает и, следовательно, точность оценки увеличивается;
2) увеличение надежности оценки g=2Ф(t) приводит к увеличению t (Ф(t)-возрастающая функция), следовательно, и к возрастанию d; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.
Пример. Случайная величина Х имеет нормальное распределение с известным средним квадратическим отклонением s=3. Найти доверительные интервалы для оценки неизвестного математического ожидания а по выборочным средним , если объем выборки. n==36 и задана надежность оценки g=0,95.
Решение. Найдем t. Из соотношения 2Ф(t)==0,95 получим Ф (t)=0,475. По таблице приложения 2 находим t==1,96. Найдем точность оценки:
Доверительный интервал таков: ( -0,98; +0,98). Например, если =4,1, то доверительный интервал имеет следующие доверительные границы:
-0,98=4,1 —0,98=3,12; +0,98=4,1 +0,98=5,08
Таким образом, значения неизвестного параметра а, согласующиеся с данными выборки, удовлетворяют неравенству 3,12 < а < 5,08. Подчеркнем, что было бы ошибочным написать Р (3,12 <а < 5,08) =0,95. Действительно, так как а - постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.
Поясним смысл, который имеет заданная надежность. Надежность g=0,95 указывает, что если произведено достаточно большое число выборок, то 95% из них определяет такие доверительные интервалы, в которых параметр действительно заключен; лишь в 5% случаев он может выйти за границы доверительного интервала.
Замечание 2. Если требуется оценить математическое ожидание с наперед заданной точностью δ и надежностью γ, то минимальный объемвыборки, который обеспечит эту точность, находят по формуле
n=t2s2/d2
(следствие равенства ).
§ 16. Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном s
Пусть количественный признак Х генеральной совокупности распределен нормально, причем среднее квадратическое отклонение о неизвестно. Требуется оценить неизвестное математическое ожидание а с помощью доверительных интервалов. Разумеется, невозможно воспользоваться результатами предыдущего параграфа, в котором а предполагалось известным.
Оказывается, что по данным выборки можно построить случайную величину (ее возможные значения будем обозначать через t):
,
которая имеет распределение Стьюдента с k=n— 1 степенями свободы (см. пояснение в конце параграфа); здесь - выборочная средняя, S - «исправленное» среднее квадратическое отклонение, п— объем выборки. Плотность распределения Стьюдента
,
где .
Мы видим, что распределение Стьюдента определяется параметром п - объемом выборки (или, что то же, числом степеней свободы k=n— 1) и не зависит от неизвестных параметров а и s; эта особенность является его большим достоинством. Поскольку S(t,n)—четная функция от t, вероятность осуществления неравенства
определяется так (см. гл. § XI, 2, замечание):
Р |
Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим
Итак, пользуясь распределением Стьюдента, мы нашли доверительный интервал , покрывающий неизвестный параметр а с надежностью g.
Здесь случайные величины и S заменены неслучайными величинами и s, найденными по выборке. По таблице приложения 3 по заданным n и g можно найти tg.
Пример. Количественный признак Х генеральной совокупности распределен нормально. По выборке объема n ==16 найдены выборочная средняя =20,2 и «исправленное» среднее квадратическое отклонение s = 0,8. Оценить неизвестное математическое ожидание при помощи доверительного интервала с надежностью 0,95.
Решение. Найдем tg. Пользуясь таблицей приложения3, по g=0,95 и п ==16 находим tg =2,13.
Найдем доверительные границы:
Итак, с надежностью 0,95 неизвестный параметр а заключен в доверительном интервале 19,774 < а < 20,626.
Замечание. Из предельных соотношений
следует, что при неограниченном возрастании объема выборки п распределение Стьюдента стремится к нормальному. Поэтому практически при п > 30 можно вместо распределения Стьюдента пользоваться нормальным распределением.
Однако важно подчеркнуть, что для малых выборок (п < 30), в особенности для малых значений п, замена распределения нормальным приводит к грубым ошибкам, а именно к неоправданному сужению доверительного интервала, т. е. к повышению точности оценки. Например, если п = 5 и g=0,99, то, пользуясь распределением Стьюдента, найдем tg = 4,6 а используя функцию Лапласа, найдем tg = 2,58, т. е. доверительный интервал в последнем случае окажется более узким, чем найденный по распределению Стьюдента.
То обстоятельство, что распределение Стьюдента при малой выборке дает не вполне определенные результаты (широкий доверительный интервал), вовсе не свидетельствует о слабости метода Стьюдента, а объясняется тем, что малая выборка, разумеется, содержит малую информацию об интересующем нас признаке.
П о я с не н и е. Ранее было указано (см. гл. XII, § 14), что если Z—нормальная величина, причем M(Z)==0, s(Z)==l, a V— независимая от Z величина, распределенная по закону c 2 с k степенями свободы, то величина
(*)
распределена по закону Стьюдента с k степенями свободы.
Пусть количественный признак Х генеральной совокупности распределен нормально, причем М(Х)=а, s(Х)= s. Если из этой совокупности извлекать выборки объема п и по ним находить выборочные средние, то можно доказать, что выборочная средняя распределена нормально, причем (см. гл. VIII, § 9)
М( в,)=а, s ( в,)= .
Тогда случайная величина
(**)
также имеет нормальное распределение как линейная функция нормального аргумента в (см. гл. XII, § 10, замечание), причем M(Z)=0, s(Z)=l.
Доказано, что случайные величины Z и
V=((n -1)S2)/ s2 (***)
независимы (S2—исправленная выборочная дисперсия) и что величина V распределена по закону c 2 с k = п— 1 степенями свободы.
Следовательно, подставив (**) и (***) в (*), получим величину
которая распределена по закону Стьюдента с k=n —1 степенями свободы.
Дата добавления: 2015-07-19; просмотров: 158 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Доверительные интервалы для параметров нормального распределения | | | Оценка истинного значения измеряемой величины |