Читайте также:
|
|
Рассмотрим вначале случай, когда выборка объема n извлечена из нормальной генеральной совокупности с неизвестным параметром a и известным Параметр является математическим ожиданием (генеральным средним) случайной величины Х. В качестве точечной оценки параметра возьмем выборочное среднее: Для уточнения приближенного равенства построим доверительный интервал, накрывающий параметр с заданной доверительной вероятностью
Если выборка объема n извлекается из нормальной генеральной совокупности то статистика имеет нормальное распределение с параметрами: Поэтому доверительная вероятность удовлетворяет соотношению:
(5.2)
В этом соотношении неизвестной величиной является точность оценки Обозначим отсюда
(5.3)
Значение найдем с помощью таблицы функции Лапласа (приложение 1), учитывая, что
Доверительный интервал для генерального среднего будет иметь вид
(5.4)
Этот метод построения доверительного интервала применяется и в случае, если генеральная совокупность Х не является нормальной. Согласно центральной предельной теореме, для выборки достаточно большого объема выборочное среднее будет иметь приближенно нормальное распределение с параметрами и где и — соответствующие параметры генеральной совокупности. В этом случае для построения доверительного интервала используют формулу (5.4), определяя значение по таблицам функции Лапласа, если При значение заменяют на которое определяют по таблице распределения Стьюдента (приложение 3), и формула (5.4) принимает вид:
(5.5)
где (область двусторонняя).
Если значение параметра неизвестно, то доверительный интервал строят по формуле (3.5), заменяя параметр с его оценкой
Величина называется средней ошибкой выборки и зависит от способа отбора: в случае конечной генеральной совокупности объема N вносится поправка на «бесповторность отбора», равная (табл. 5.1).
Таблица 5.1
Средняя ошибка выборки для генерального среднего
Генеральная совокупность | Бесконечная | Конечная объема N |
Тип отбора | Повторный | Бесповторный |
Средняя ошибка выборки |
Пример 1. Служба контроля Энергосбыта провела выборочную проверку расхода электроэнергии жителями одного из многоквартирных домов. С помощью случайного отбора было выбрано 10 квартир и определен расход электроэнергии в течение одного из летних месяцев : 125, 78, 102, 140, 90, 45, 50, 125, 115, 112.
С вероятностью 0.95 определите доверительный интервал для среднего расхода электроэнергии на одну квартиру во всем доме при условии, что отбор был: а) повторным; б) бесповторным, и в доме имеется 70 квартир.
Решение. По условию задачи объем выборки т.е. выборка малая. В случае повторного отбора найдем границы доверительного интервала для генерального среднего по формуле (3.5), считая
Найдем выборочное среднее арифметическое:
и несмещенную оценку дисперсии
Тогда оценка среднего квадратического отклонения равна
По таблице распределения Стьюдента (приложение 3) найдем значение для двусторонней критической области. Число степеней свободы k здесь равно а вероятность Тогда (двусторонняя область).
При повторном случайном отборе средняя ошибка выборки равна а предельная ошибка т.е. доверительный интервал имеет границы
При условии, что отбор квартир был повторным, с вероятностью 0.95 можно ожидать, что средний расход электроэнергии на одну квартиру во всем доме находится в интервале от 75.63 до 121.17 .
Найдем теперь границы доверительного интервала, считая отбор бесповторным. Предельную ошибку определим с учетом того, что генеральная совокупность конечна и имеет объем N (табл. 5.1).
Из условия задачи Отсюда предельная ошибка выборки и доверительный интервал имеет границы
При условии, что отбор квартир был бесповторным, с вероятностью 0.95 можно утверждать, что средний расход электроэнергии на одну квартиру во всем доме находится в интервале от 76.93 до 119.47 .
Формула (5.3) позволяет при заданной доверительной вероятности и требуемой точности определить объем выборки n, учитывая тип отбора данных.
Пример 4. С помощью случайного повторного отбора определяется средний стаж работы служащих фирмы. Предполагается, что он подчиняется нормальному закону распределения. Каким должен быть объем выборки, чтобы с доверительной вероятностью 0.95 можно было утверждать, что, принимая полученный средний стаж работы за истинный, совершается погрешность, не превышающая 0.5 года, если стандартное отклонение равно 2.7 года?
Решение. По условию и требуется найти объём выборки n при повторном отборе. В этом случае где По таблице функции Лапласа (приложение 1) найдем, при каком значение Получим Отсюда необходимый объем выборки
Учитывая, что необходимо не превышать заданную ошибку, округляем результат до большего целого:
Итак, чтобы с вероятностью 0.95 и точностью года определить средний стаж работы в фирме, требуется опросить не менее 113 служащих.
Дата добавления: 2015-11-14; просмотров: 84 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Доверительный интервал и доверительная вероятность | | | Интервальное оценивание генеральной доли |