Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Интервальное оценивание параметров распределений

Читайте также:
  1. II. ОЦЕНИВАНИЕ ЗНАНИЙ СТУДЕНТОВ
  2. Виды диагностических параметров
  3. ВИДЫ ДИАГНОСТИЧЕСКИХ ПАРАМЕТРОВ (ДП)
  4. Влияние оптических параметров на процесс лазерной резки
  5. ВСЕХ ПАРАМЕТРОВ И ЛУЧШИМИ И ХУДШИМИ НАБОРАМИ ПАРАМЕТРОВ ДЛЯ ПРЕДЫДУЩИХ ПЕРИОДОВ
  6. Выбор параметров АЦП. 34
  7. Задание точных значений параметров преобразования

Вычисляя на основании имеющихся у нас выборочных данных оценку параметра , мы отдаем себе отчет в том, что величина является лишь приближенным значением неизвестного параметра даже в том случае, когда эта оценка состоятельна (т.е. стремиться с ростом n к ), несмещенная (т.е. совпадает с в среднем) и эффективна (т.е. обладает наименьшей степенью случайных отклонений от ). Возникает вопрос: как сильно может отклоняться это приближенное значение (оценка) от истинного? В частности, нельзя ли указать такую величину , которая с «практической достоверностью» (т.е. с заранее заданной вероятностью близкой к 1) гарантировала бы выполнение неравенства ? Т.е. выполнялось бы следующее соотношение

(1)

Или, что то же, нельзя ли указать интервал вида , который с заранее заданной вероятностью (близкой к единице) накрывал бы неизвестное нам истинное значение искомого параметра?

(2)

При этом заранее выбираемая исследователем вероятность , близкая к единице, называется доверительной вероятностью или надежностью интервальной оценки.

Интервал называется доверительным интервалом или интервальной оценкой характеристики . Число называется точностью оценки или предельной ошибкой выборки, числа и называются доверительными границами.

В соотношении (2) случайными величинами являются доверительные границы и : во-первых, эти границы могут изменятся при переходе от одной выборке к другой хотя бы потому, что при этом изменяется значение оценки , во-вторых, при фиксированной выборке границы и изменяются при изменении вероятности , поскольку выбирается в зависимости от . Генеральная же характеристика - постоянная величина. Поэтому соотношение (2) следует читать так: «вероятность того, что интервал накроет характеристику , равна »; именно «интервал накроет характеристику», а не «характеристика попадет в интервал». На рис. 1 друг над другом изображены доверительные интервалы характеристики , построенные для разных выборок: центры интервалов – это выборочные значения оценки .

Рисунок 1.

Надежность принято выбирать равной 0,95; 0,99; 0,999. Тогда событие, состоящее в том, что интервал накроет характеристику , будет практически достоверным. Также практически достоверным является событие, состоящее в том, что погрешность оценки меньше , или, иначе, точность оценки больше .

В соотношении (2) границы и симметричны относительно точечной оценки . Обратим внимание на то, что не всегда удается построить границы с таким свойством.

Существует несколько подходов к решению задачи вычисления доверительных интервалов с заданной доверительной вероятностью.

Рассмотрим подход, который приводит к построению точных (при каждом конечном объеме выборок) доверительных интервалов. Реализовать его удается в тех случаях, когда существует принципиальная возможность подбора такой функции от результатов наблюдений (т.е. такой статистики), закон распределения вероятностей которой обладал бы одновременно следующими свойствами:

1. не зависит от от оцениваемого параметра ;

2. описывается одним из стандартных затабулированных распределений (стандартным нормальным, Стьюдента, , Фишера);

3. из того факта, что значения данной статистики заключены в определенных пределах с заданной вероятностью, можно сделать вывод, что оцениваемый параметр тоже должен лежать между некоторыми границами с той же самой вероятностью.

При этом в выражении самой этой статистики анализируемый параметр и его состоятельная точечная оценка (полученная одним из известных методов — максимального правдоподобия, моментов и т.д.) обычно участвуют в комбинациях разности или отношения .

В качестве примера рассмотрим задачу интервального оценивания параметров a и нормальной генеральной совокупности.

Рассмотрим два случая.

  1. Интервальная оценка математического ожидания нормального распределения при известной дисперсии.

Пусть с.в. X имеет нормальный закон распределения с параметрами и . Будем предполагать, что наблюдения над этой величиной независимы и проводятся в одинаковых условиях, т.е. возможные результаты этих наблюдений обладают следующими свойствами:

1) — независимые случайные величины;

2) закон распределения любой из величин совпадает с законом распределения величины X, что означает .

Как известно статистика имеет нормальное распределение с нулевым математическим ожиданием и единичной дисперсией, т.е.

= .   (3)

Воспользуемся табл. функции Лапласа и найдем для заданной вероятности число t такое, при котором .

Учитывая (3), получим

(4)

Выполним следующие тождественные преобразования:

Таким образом, получаем формулу:

(5)

Сравнивая (5) и (2), заключаем, что

(6)

Интервальная оценка математического ожидания такова:

(7)

Полученный результат имеет следующий смысл: с вероятностью можно быть уверенным в том, что вычисленное по выборке дает значение математического ожидания с точностью (6), или, иначе, с вероятностью можно быть уверенным в том, что интервал (7) накроет неизвестное математическое ожидание.

Приведем схему нахождения точности и доверительных границ, отвечающих надежности :

Пример 1. Случайная величина распределена по нормальному закону с параметром = 2. Сделана случайная выборка с возвратом объема n = 25. Найти с надежностью = 0,95 точность выборочной средней и интервальную оценку для неизвестного математического ожидания a.

∆ По схеме находим

Таким образом,

или

Это означает, что с вероятностью 95% можно быть уверенным в том, что интервал

( ) накроет параметр a, или с вероятностью 95% можно быть уверенным в том, что вычисленное по выборке среднее дает значение параметра a с точностью 0,784. ▲

Пример 2. Найти минимальный объем выборки из нормальной генеральной совокупности, при котором с надежностью, не меньшей , погрешность средней, найденной по этой выборке, будет меньше , если среднее квадратическое отклонение .

∆ Обратим внимание на то, что при заданных и с ростом объема выборки n увеличивается вероятность . В этом нетрудно убедится, проанализировав формулу (6). Поэтому неравенство выполняется для

при этом n должно быть целым числом.

В данном случае , , а - это число, при котором значение функции Лапласа . По табл. этой функции найдем, что при число = 1,65. Тогда Таким образом, минимальный объем выборки, при котором , равен 121. ▲

Пример 3. На контрольных испытаниях = 15 ламп была определена средняя продолжительность горения лампы, = 3000 ч. Считая, что срок службы лампы распределен нормально с = 16 ч. Определить доверительную вероятность того, что точность средней равна 10 ч.

∆ По формуле (6) получаем

.

Подставляя числовые данные, находим = 2,4. Теперь, зная , по табл. функции Лапласа найдем вероятность (2,4) = 0,9836; это и есть доверительная вероятность .▲

В таблице 1 приведены все формулы для вычисления доверительных интервалов математического ожидания для нормально распределенной случайной величины и генеральной доли признака, которые получены с помощью метода предложенного выше и которые необходимы для решения практических задач.

Напомним, что генеральной долей признака A называется величина , где

N — объем генеральной совокупности,

M — количество элементов генеральной совокупности, обладающих некоторым признаком A.

Для доли p несмещенной и состоятельной оценкой будет выборочная доля , где m — число элементов выборки объема n, обладающих признаком A.

 

 

Таблица 1

Параметр Оценка Предельная ошибка выборки
Повторная выборка Бесповторная выборка
n>30
a
P

 

Здесь t определяется из условия ( —функция Лапласа), определяется из условия (с.в. имеет распределение Стьюдента с n-1 степенями свободы).

При решении статистических задач часто требуется определить необходимый объем выборки для достижения требуемой надежности доверительного интервала. Из приведенных выше формул найдены объемы выборок для различных случаев и занесены в таблицу 2.


Таблица 2

Метод отбора Для средней Для доли
Повторный
Бесповторный

 

Далее рассмотрим некоторые практические задачи.

Задача 1. Из многочисленного коллектива работников фирмы случайным образом отобрано n=25 работников. Средняя заработная плата этих работников составила 700 ден.ед. при выборочном среднеквадратическом отклонении 100 ден.ед. предполагается, что распределение работников фирмы по размерам заработной платы подчиняется нормальному распределению. Требуется с доверительной вероятностью 0,95 определить интервальную оценку для:

1) среднемесячной заработной платы на фирме;

2) суммы затрат фирмы на заработную плату отдела, состоящего из 520 сотрудников.

∆ Среднемесячная зарплата на фирме характеризуется генеральной средней a.

1) Требуется определить интервальную оценку a с доверительной вероятностью P=0,95.

По условию задачи n=25, , .

Согласно таблице 1 поскольку выборка является повторной для вычисления предельной ошибки выборки воспользуемся формулой , т.е. .

По таблице распределения Стьюдента находим и .

Таким образом с вероятностью P=0,95 можно гарантировать, что средняя заработная плата на фирме находится в пределах или .

2) Сумма затрат фирмы на заработную плату отдела составит 520*a ден.ед. Поэтому с вероятностью 0,95 можно гарантировать, что затраты фирмы на заработную плату не выйдут из интервала . ▲

Задача 2. Владелец автостоянки опасается обмана со стороны своих служащих (охрана автостоянки). В течение года (365 дней) владельцем автостоянки проведено 40 проверок. По данным проверок среднее число автомобилей, оставляемых на ночь на охрану, составило 400 единиц, а выборочное среднее квадратическое отклонение их числа — 10 автомобилей.

С вероятностью 0,99 оцените с помощью доверительного интервала истинное среднее число автомобилей, оставляемых на ночь на охрану. Обоснованы ли опасения владельца автостоянки, если по отчетности охранников среднее число автомобилей, оставляемых на ночь на стоянку, составляет 395 автомобилей?

∆ По условию задачи

Поскольку выборка является бесповторной согласно таблице 1 используем формулу

.

Находим по таблице функции Лапласа.

t=2,58. Тогда предельная ошибка выборки .

Т.о. с вероятностью 0,99 можно гарантировать, что среднее число автомобилей, оставляемых на ночь на стоянке, находится в интервале или .

Очевидно, что служащие автостоянки обманывали владельца. ▲

Задача 3. В 24-х из 40 проверок число автомобилей на автостоянке не превышало 400 единиц. С вероятностью 0,98 найдите доверительный интервал для оценки истинной доли дней в течение года, когда число оставляемых на стоянку автомобилей не превышало 400 единиц.

∆ По условию .

Выборочная доля .

Согласно таблице 1 для повторной выборки используем формулу .

Находим по таблице функции Лапласа. t=2,33.

Тогда предельная ошибка выборки .

Так как доверительный интервал для имеем

;

.

Т.о. с вероятностью 0,98 можно ожидать, что доля дней в течение года, когда число отправляемых на автостоянку автомобилей не превышало 400 единиц, находится в интервале от 0,4297 до 0,7703. ▲

Задача 4. Найти объем повторной и бесповторной выборок из 10000 банок консервов для определения доли банок, не соответствующих стандарту. Предполагается, что предельная ошибка выборки равна 0,05 с доверительной вероятностью 0,99.

∆ По условию .

Для повторной выборки согласно таблице 2 .

Находим по таблице функции Лапласа. t=2,58.

Тогда .

Так как неизвестно, выберем его таким, чтобы значение выражения было максимальным, т.е. . Тогда .

Аналогично для бесповторной выборки .

Очевидно, и в этом случае наибольшее значение выражения соответствует максимальному значению .

Тогда . ▲

 

 


Дата добавления: 2015-11-14; просмотров: 94 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
ОТ 16 МАЯ 2013 ГОДА N 56-ПГ| Www.ligaretail.ru

mybiblioteka.su - 2015-2024 год. (0.022 сек.)