Точность оценки, доверительная вероятность (надежность). Доверительный интервал.

Читайте также:

Точечной называют оценку, которая определяется одним числом. Все оценки, рассмотренные выше точечные. При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальной называют оценку, которая определяется двумя числами-концами интервала. Интервальные оценки позволяют установить точность и надежность оценок (смысл этих понятий выясняется ниже).

Пусть найденная по данным выборки статистическая характеристика Θ^* служит оценкой неизвестного параметра Θ. Будем считать Θ постоянным числом (Θ может быть и случайной величиной). Ясно. что Θ^* тем точнее определяет параметр Θ, чем меньше абсолютная величина разности ½Θ-Θ^*½. Другими словами, если δ>0 и ½ Θ-Θ^* ½<δ, то чем меньше δ, тем оценка точнее. Таким образом, положительное число δ характеризует точность оценки.

Однако статистические методы не позволяют категорически утверждать, что оценка Θ^* удовлетворяет неравенству ½Θ-Θ^*½ <δ; можно лишь говорить о вероятности γ, с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки Θ по Θ^* называют вероятность γ, с которой осуществляется неравенство. Обычно надежность оценки задается наперед, причем в качестве γ берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.

Пусть вероятность того, что ½Θ-Θ^*½ <δ, равна γ:

Р(½ Θ - Θ^*½< δ) = γ.

Заменив неравенство ½ Θ-Θ^*½ < δ равносильным ему двойным неравенством –δ < Θ - Θ^* < δ, или

Θ^*- δ < Θ < Θ^*+ δ, имеем

Р(Θ^*- δ < Θ < Θ^*+ δ) = γ.

Это соотношение следует понимать так: вероятность того, что интервал (Θ^*- δ, Θ^*+ δ) заключает в себе (покрывает) неизвестный параметр Θ, равна γ.

Доверительным называют интервал (Θ^*- δ, Θ^*+ δ), который покрывает неизвестный параметр с заданной надежностью γ.

Замечание. Интервал (Θ^*- δ, Θ^*+ δ) имеет случайные концы (их называют доверительными границами). Действительно, в разных выборках получаются различные значения Θ^*. Следовательно, от выборки к выборке будут изменяться и концы доверительного интервала, т.е. доверительные границы сами являются случайными величинами-функциями от х₁, х₂, …, х_n

Так как случайной величиной является не оцениваемый параметр Θ, а доверительный интервал, то более правильно говорить не о вероятности попадания Θ в доверительный интервал, а о вероятности того, что доверительный интервал покроет Θ.

Метод доверительных интервалов разработал американский статистик Ю. Нейман, исходя из идей английского статистика Р. Фишера.

§ 15. Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ

Пусть количественный признак Х генеральной совокупности распределен нормально, причем среднее квадратическое отклонение σ этого распределения известно. Требуется оценить неизвестное математическое ожидание а по выборочной средней . Поставим своей задачей найти доверительные интервалы, покрывающие параметр а с надежностью γ.

Будем рассматривать выборочную среднюю как случайную величину ( изменяется от выборки к выборке) и выборочные значения признака х₁, х₂, …, х_n - как одинаково распределенные независимые случайные величины Х₁ Х₂,..., Х_n, (эти числа также изменяются от выборки к выборке). Другими словами, математическое ожидание каждой из этих величин равно а и среднее квадратическое отклонение - σ.

Примем без доказательства, что если случайная величина Х распределена нормально, то выборочная средняя X, найденная по независимым наблюдениям, также распределена нормально. Параметры распределения Х таковы (см. гл. VIII, § 9):

Потребуем, чтобы выполнялось соотношение

где γ - заданная надежность.

Пользуясь формулой (см. гл.XII, § 6)

Р(|Х—а| <δ)=2Ф(δ/σ),

заменив Х на и σ на ,получим

где .

Найдя из последнего равенства , можем написать

Приняв во внимание, что вероятность Р задана и равна g окончательно имеем (чтобы получить рабочую формулу, выборочную среднюю вновь обозначим через )

Смысл полученного соотношения таков: с надежностью γ можно утверждать, что доверительный интервал покрывает неизвестный параметр а; точность оценки

Итак, поставленная выше задача полностью решена. Укажем еще, что число t определяется из равенства 2Ф(t)=g, или Ф(t)==g/2; по таблице функции Лапласа (см. приложение 2) находят аргумент t, которому соответствует значение функции Лапласа, равное g/2.

Замечание 1. Оценку называют классической. Из формулы , определяющей точность классической оценки, можно сделать следующие выводы:

1) при возрастании объема выборки п число d убывает и, следовательно, точность оценки увеличивается;

2) увеличение надежности оценки g=2Ф(t) приводит к увеличению t (Ф(t)-возрастающая функция), следовательно, и к возрастанию d; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.

Пример. Случайная величина Х имеет нормальное распределение с известным средним квадратическим отклонением s=3. Найти доверительные интервалы для оценки неизвестного математического ожидания а по выборочным средним , если объем выборки. n==36 и задана надежность оценки g=0,95.

Решение. Найдем t. Из соотношения 2Ф(t)==0,95 получим Ф (t)=0,475. По таблице приложения 2 находим t==1,96. Найдем точность оценки:

Доверительный интервал таков: ( -0,98; +0,98). Например, если =4,1, то доверительный интервал имеет следующие доверительные границы:

-0,98=4,1 —0,98=3,12; +0,98=4,1 +0,98=5,08

Таким образом, значения неизвестного параметра а, согласующиеся с данными выборки, удовлетворяют неравенству 3,12 < а < 5,08. Подчеркнем, что было бы ошибочным написать Р (3,12 <а < 5,08) =0,95. Действительно, так как а - постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.

Поясним смысл, который имеет заданная надежность. Надежность g=0,95 указывает, что если произведено достаточно большое число выборок, то 95% из них определяет такие доверительные интервалы, в которых параметр действительно заключен; лишь в 5% случаев он может выйти за границы доверительного интервала.

Замечание 2. Если требуется оценить математическое ожидание с наперед заданной точностью δ и надежностью γ, то минимальный объемвыборки, который обеспечит эту точность, находят по формуле

n=t²s²/d²

(следствие равенства ).

§ 16. Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном s

Пусть количественный признак Х генеральной совокупности распределен нормально, причем среднее квадратическое отклонение о неизвестно. Требуется оценить неизвестное математическое ожидание а с помощью доверительных интервалов. Разумеется, невозможно воспользоваться результатами предыдущего параграфа, в котором а предполагалось известным.

Оказывается, что по данным выборки можно построить случайную величину (ее возможные значения будем обозначать через t):

которая имеет распределение Стьюдента с k=n— 1 степенями свободы (см. пояснение в конце параграфа); здесь - выборочная средняя, S - «исправленное» среднее квадратическое отклонение, п— объем выборки. Плотность распределения Стьюдента

где .

Мы видим, что распределение Стьюдента определяется параметром п - объемом выборки (или, что то же, числом степеней свободы k=n— 1) и не зависит от неизвестных параметров а и s; эта особенность является его большим достоинством. Поскольку S(t,n)—четная функция от t, вероятность осуществления неравенства

определяется так (см. гл. § XI, 2, замечание):

Заменив неравенство в круглых скобках равносильным ему двойным неравенством, получим

Итак, пользуясь распределением Стьюдента, мы нашли доверительный интервал , покрывающий неизвестный параметр а с надежностью g.

Здесь случайные величины и S заменены неслучайными величинами и s, найденными по выборке. По таблице приложения 3 по заданным n и g можно найти t_g.

Пример. Количественный признак Х генеральной совокупности распределен нормально. По выборке объема n ==16 найдены выборочная средняя =20,2 и «исправленное» среднее квадратическое отклонение s = 0,8. Оценить неизвестное математическое ожидание при помощи доверительного интервала с надежностью 0,95.

Решение. Найдем t_g. Пользуясь таблицей приложения3, по g=0,95 и п ==16 находим t_g =2,13.

Найдем доверительные границы:

Итак, с надежностью 0,95 неизвестный параметр а заключен в доверительном интервале 19,774 < а < 20,626.

Замечание. Из предельных соотношений

следует, что при неограниченном возрастании объема выборки п распределение Стьюдента стремится к нормальному. Поэтому практически при п > 30 можно вместо распределения Стьюдента пользоваться нормальным распределением.

Однако важно подчеркнуть, что для малых выборок (п < 30), в особенности для малых значений п, замена распределения нормальным приводит к грубым ошибкам, а именно к неоправданному сужению доверительного интервала, т. е. к повышению точности оценки. Например, если п = 5 и g=0,99, то, пользуясь распределением Стьюдента, найдем t_g = 4,6 а используя функцию Лапласа, найдем t_g = 2,58, т. е. доверительный интервал в последнем случае окажется более узким, чем найденный по распределению Стьюдента.

То обстоятельство, что распределение Стьюдента при малой выборке дает не вполне определенные результаты (широкий доверительный интервал), вовсе не свидетельствует о слабости метода Стьюдента, а объясняется тем, что малая выборка, разумеется, содержит малую информацию об интересующем нас признаке.

П о я с не н и е. Ранее было указано (см. гл. XII, § 14), что если Z—нормальная величина, причем M(Z)==0, s(Z)==l, a V— независимая от Z величина, распределенная по закону c ² с k степенями свободы, то величина

(*)

распределена по закону Стьюдента с k степенями свободы.

Пусть количественный признак Х генеральной совокупности распределен нормально, причем М(Х)=а, s(Х)= s. Если из этой совокупности извлекать выборки объема п и по ним находить выборочные средние, то можно доказать, что выборочная средняя распределена нормально, причем (см. гл. VIII, § 9)

М( _в,)=а, s ( _в,)= .

Тогда случайная величина

(**)

также имеет нормальное распределение как линейная функция нормального аргумента _в (см. гл. XII, § 10, замечание), причем M(Z)=0, s(Z)=l.

Доказано, что случайные величины Z и

V=((n -1)S²)/ s² (***)

независимы (S²—исправленная выборочная дисперсия) и что величина V распределена по закону c ² с k = п— 1 степенями свободы.

Следовательно, подставив (**) и (***) в (*), получим величину

которая распределена по закону Стьюдента с k=n —1 степенями свободы.

Дата добавления: 2015-07-19; просмотров: 158 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
Доверительные интервалы для параметров нормального распределения	\|	Оценка истинного значения измеряемой величины

mybiblioteka.su - 2015-2025 год. (0.016 сек.)