Читайте также: |
|
Статистическое наблюдение или сбор статистических данных на; сплошной или несплошной основе является первым этапом статистического исследования. В то же время такой вид несплошного наблюдения, как наблюдение выборочное основан на теории относительных и средних показателей, показателей вариации, предельных теоремах закона больших чисел. Поэтому приступать к изучению данной темы, к решению учебных и практических задач можно только после того, как будет пройден и усвоен материал предшествующих тем данного курса.
Выборочным называется такое несплошное наблюдение, при котором признаки регистрируются у отдельных единиц изучаемой статистической совокупности, отобранных с использованием специальных методов, а полученные в процессе обследования результаты с определенным уровнем вероятности распространяются на всю исходную совокупность. К наиболее распространенным на практике видам выборочного наблюдения относятся:
Отбор единиц в выборочную совокупность может быть повторным или бесповторным. При повторном отборе попавшая в выборку единица подвергается обследованию, т.е. регистрации значений ее признаков, возвращается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора. При бесповторном отборе попавшая в выборку единица подвергается обследованию и в дальнейшей процедуре отбора не участвует.
Выборочное наблюдение, как бы грамотно с методологической точки зрения оно ни было организовано, всегда связано с определенными, пусть небольшими и измеряемыми ошибками. Случайные ошибки выборки обусловлены действием факторов, не содержащих каких-либо элементов системности в направлении воздействия на рассчитываемые выборочные характеристики. Даже при строгом соблюдении всех принципов формирования выборочной совокупности выборочные и генеральные характеристики будут несколько различаться. Поэтому получаемые случайные ошибки должны быть статистически оценены и учтены при распространении результатов выборочного наблюдения на всю генеральную совокупность. Оценка таких ошибок и является основной задачей, решаемой в теории выборочного наблюдения. Обратной задачей является определение такой минимально необходимой численности выборочной совокупности, при которой ошибка не превысит заданной величины. На выработку навыков в решении этих задач и направлен материал данной главы.
Собственно-случайная выборка. Ее суть заключается в отборе единиц из генеральной совокупности в целом, без разделения ее на группы, подгруппы или серии отдельных единиц. При этом единицы отбираются в случайном порядке, не зависящем ни от последовательности расположения единиц в совокупности, ни от значений их признаков.
После проведения отбора с использованием одного из алгоритмов, реализующих принцип случайности, или на основе таблицы случайных чисел, определяются границы генеральных характеристик. Для этого рассчитываются средняя и предельная ошибки выборки.
Средняя ошибка повторной собственно-случайной выборки определяется по формуле
где - среднее квадратическое отклонение изучаемого признака;
n - объем (число единиц) выборочной совокупности.
Предельная ошибка выборки связана с заданным уровнем вероятности. При решении представленных ниже задач требуемая вероятность составляет 0,954 (t = 2) или 0,997 (t = 3). С учетом выбранного уровня вероятности и соответствующего ему значения / предельная ошибка выборки составит:
Тогда можно утверждать, что при заданной вероятности генеральная средняя будет находиться в следующих границах:.
.
При определении границ генеральной доли при расчете средней ошибки выборки используется дисперсия альтернативного признака, которая вычисляется по следующей формуле:
,
где w - выборочная доля, т. е. доля единиц, обладающих определенным вариантом или вариантами изучаемого признака.
При решении отдельных задач необходимо учитывать, что при неизвестной дисперсии альтернативного признака можно использовать ее максимально возможную величину, равную 0,25.
Пример 1. В результате выборочного обследования незанятого населения, ищущего работу, осуществленного на основе собственно-случайной повторной выборки, получен следующий ряд распределения (табл. 8.1).
Таблица 8.1
Результаты выборочного обследования незанятого населения
Возраст, лет | до 25 | 25-35 | 35-45 | 45 - 55 | 55 и более |
Численность лиц данного возраста |
С вероятностью 0,954 определите границы:
а) среднего возраста незанятого населения;
б) доли (удельного веса) лиц, моложе 25 лет, в общей численности незанятого населения.
Решение. Для определения средней ошибки выборки нам необходимо прежде всего рассчитать выборочную среднюю величину и дисперсию изучаемого признака (табл. 8.2):
Таблица 8.2
Расчет среднего возраста незанятого населения и дисперсии
Возраст, лет x | Численность лиц данного возраста fi | Середина интервала xi | |||
До 25 | -21,2 | 449,44 | 6741,60 | ||
25-35 | -11,2 | 125,44 | 4641,28 | ||
35-45 | -1,2 | 1,44 | 102,24 | ||
45-55 | 8,8 | 77,44 | 3484,80 | ||
55 и более | 18,8 | 353,44 | 7775,68 | ||
Итого | - | 22745,60 |
.
Средняя ошибка выборки составит:
Определим с вероятностью 0,954 (t = 2) предельную ошибку выборки:
года.
Установим границы генеральной средней:
41,2- 1,6 41,2+ 1,6,
или
39,6 42,8.
Таким образом, на основании проведенного выборочного обследования с вероятностью 0,954 можно заключить, что средний возраст незанятого населения, ищущего работу, лежит в пределах от 40 до 43 лет.
Для ответа на вопрос, поставленный в пункте «б» данного примера, по выборочным данным определим долю лиц в возрасте до 25 лет и рассчитаем дисперсию доли:
;
.
Рассчитаем среднюю ошибку выборки:
Предельная ошибка выборки с заданной вероятностью составит:
.
Определим границы генеральной доли:
0,079 - 0,04 0,079 + 0,04
или 0,039 0,119.
Следовательно, с вероятностью 0,954 можно утверждать, что доля лиц в возрасте до 25 лет в общей численности незанятого населения находится в пределах от 3,9до11,9%.
При расчете средней ошибки собственно-случайной бесповторной выборки необходимо учитывать поправку на бесповторность отбора:
,
где N - объем (число единиц) генеральной совокупности.
Необходимый объем собственно-случайной повторной выборки определяется по формуле:
Если отбор бесповторный, то формула приобретает следующий вид:
.
Полученный на основе использования этих формул результат всегда округляется в большую сторону до целого значения.
Пример 2. Определите, сколько учащихся первых классов школ района необходимо отобрать в порядке собственно-случайной бесповторной выборки, чтобы с вероятностью 0,997 определить границы среднего роста первокурсников с предельной ошибкой 2 см. Известно, что всего в первых классах школ района обучается 1100 студентов, а дисперсия роста по результатам аналогичного обследования в другом университете составила 24.
Решение. Необходимый объем выборки при уровне вероятности 0,997 (t = 3) составит:
.
Таким образом, для получения данных о среднем росте первокурсников с заданной точностью необходимо обследовать 52 школьника.
Механическая выборка. Данная выборка заключается в отборе единиц из общего списка единиц генеральной совокупности через равные интервалы в соответствии с установленным процентом отбора. При решении задач на определение средней ошибки механической выборки, а также необходимой ее численности, следует использовать приведенные выше формулы, применяемые при собственно-случайном бесповторном отборе.
Типическая выборка. Эта выборка применяется в тех случаях, когда единицы генеральной совокупности объединены в несколько крупных типичных групп. Отбор единиц в выборку производится внутри этих групп пропорционально их объему на основе использования собственно-случайной или механической выборки.
Средняя ошибка типической выборки определяется по формулам:
- (повторный отбор);
-— (бесповторный отбор),
где - средняя из внутригрупповых дисперсий.
Пример 3. В целях изучения доходов населения по трем районам области сформирована 2%-ная выборка, пропорциональная численности населения этих районов. Полученные результаты представлены в табл. 8.3.
Таблица 8.3
Результаты выборочного обследования доходов населения
Район | Численность населения, чел. | Обследовано, чел. | Доход в расчете на 1 человека | |
средняя, тыс. руб. | дисперсия | |||
I | 2,9 | 1,3 | ||
II | 2,5 | 1,1 | ||
III | 2,7 | 1,6 |
Определите границы среднедушевых доходов населения по области в целом при уровне вероятности 0,997.
Решение. Рассчитаем среднюю из внутригрупповых дисперсий:
Определим среднюю и предельную ошибки выборки:
;
.
Рассчитаем выборочную среднюю:
тыс. руб.
В результате проведенных расчетов с вероятностью 0,997 можно сделать вывод, что среднедушевые доходы жителей данной области находятся в следующих границах (тыс. руб.):
2,67 - 0,04 2,67 + 0,04.
При определении необходимого объема типической выборки учитывается средняя из внутригрупповых дисперсий:
(повторный отбор);
(бесповторный отбор).
Полученное значение общего объема выборки необходимо распределить по типическим группам пропорционально их численности, чтобы определить, какое количество единиц следует отобрать из каждой группы:
где — объем i -й группы;
- объем выборки из i -й группы.
Серийная выборка. Эта выборка используется в тех случаях, когда единицы изучаемой совокупности объединены в небольшие равновеликие группы или серии. Единицей отбора в этом случае является серия. Серии отбираются с использованием собственно-случайной либо механической выборки, а внутри отобранных серий обследуются все без исключения единицы.
В основе расчета средней ошибки серийной выборки лежит межгрупповая дисперсия:
— (повторный отбор);
—- (бесповторный отбор),
где r - число отобранных серий; R — общее число серий.
Межгрупповую дисперсию при равновеликих группах вычисляют следующим образом:
,
где , - средняя i- й серии;
x - общая средняя по всей выборочной совокупности.
Пример 4. В целях контроля качества комплектующих из партии изделий, упакованных в 50 ящиков по 20 изделий в каждом, была произведена 10%-ная серийная выборка. По попавшим в выборку ящикам среднее отклонение параметров изделия от нормы соответственно составило 9 мм, 11,12, 8 и 14 мм. С вероятностью 0,954 определите среднее отклонение параметров по всей партии в целом.
Решение. Рассчитаем выборочную среднюю:
мм.
Определим величину межгрупповой дисперсии:
.
С учетом установленной вероятности Р = 0,954 (t = 2) предельная ошибка выборки составит:
мм.
Произведенные расчеты позволяют заключить, что среднее отклонение параметров всех изделий от нормы находится в следующих границах:
(10,8 - 1,8) мм (10,8 + 1,8) мм.
Для определения необходимого объема серийной выборки при заданной предельной ошибке используются следующие формулы:
- (повторный отбор);
— (бесповторный отбор).
Дата добавления: 2015-08-13; просмотров: 429 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Особливості соціальної адаптації людей, що хворіють на ДЦП. | | | Задачи и упражнения |