Читайте также: |
|
“Собственно статистическая проблема, - пишет Келлерер о выборочных исследованиях, - возникает в связи со следующими тремя вопросами”:
а) каков должен быть объем выборки;
б) как должен происходить отбор элементов выборки;
в) в какой мере можно положиться на результаты выборки, то есть в какой степени они правильно отражают истинное положение вещей?
Вопросы а) и в) уже рассматривались в предыдущем разделе о “законе больших чисел”, и позднее мы еще раз вернемся к ним. Сейчас займемся вопросом б): “Как должен происходить отбор элементов выборки?” Об элементах можно говорить вообще, так как принципы отбора практически одинаковы - идет ли речь о выборке людей или домашних хозяйств, или предприятий розничной торговли, или бензоколонок, или кинотеатров, или школьных зданий, или крестьянских дворов, или различных объединений.
Вероятностные методы и метод квот
В принципе различают два метода отбора при построении репрезентативной выборочной совокупности:
а) вероятностные методы, в значительной степени использующие теоретико-вероятностный подход. Иногда в связи с описанием этих методов используют английские слова и говорят о рэндомизации (рэндом - случайность) или о пробабилистической выборке (probability - вероятность);
б) отбор по методу квот, который предписывает интервьюеру выделить определенное количество опрашиваемых в разных группах населения.
“Выбирает случай? Это легкомыслие!”
Фабрикант, решивший провести анализ спроса на товары, обращается за консультацией о методах исследования в Институт по изучению конъюнктуры. При этом он неизбежно теряет доверие к исследователям, когда в отделе статистики математик настойчиво советует ему: “Выбор опрашиваемых обычно проводится чисто случайно...”
Снова и снова мы убеждаемся, что двойной смысл основных понятий статистики затрудняет понимание и даже ведет к недоразумениям.
“Случайность” для математика означает совершенно противоположное тому, что мы обычно понимаем под словом “случай”. Для него это строгий, последовательно осуществляемый метод, помогающий выполнить основное требование: “Каждый элемент генеральной совокупности в репрезентативном исследовании должен иметь соизмеримые и отличные от нуля возможности попасть в выборку”.
Случайность, которая удовлетворяет этому условию, знакома нам по лотерее: каждый, кто покупает билет, верит в то, что были приняты все надлежащие меры, чтобы каждый билет имел равные и отличные от нуля возможности выигрыша.
Точно такие же условия должны быть созданы для отбора людей с помощью вероятностного метода в опросах населения. Здесь нецелесообразно рассматривать особые случаи в статистике Важно обеспечить, чтобы в принципе каждый представитель группы населения, мнение или поведение которой исследуется, имел равные с другими возможности попасть в выборку. При этом вероятностные методы предназначены для того, чтобы исключить “всякий субъективный момент при отборе”.
Основные типы вероятностной выборки
Г. Келлерер показывает на ряде примеров, как осуществляется вероятностный метод выборки. При этом он рассматривает четыре основных типа выборки:
- простая,
- стратифицированная,
- территориальная,
- многоступенчатая.
Приводятся следующие примеры простой выборки:
„В одном ведомстве по вопросам труда заведены личные карточки, 8000 шт. (N=8000), по одной на каждого зарегистрированного человека. Объем выборки определен: n =400. Следуя традиционным путем, нужно было бы положить все карточки в большую емкость и хорошо перемешать, а затем вытащить 400 штук. Тысячи лотерейных билетов, скатанные в одинаковые ролики, можно привести с помощью барабана в случайный порядок, для карточек из картотеки такой способ вряд ли пригоден. Кроме того, карточки при этом были бы приведены в ненужный беспорядок, возможно, даже повреждены.
Выход в этой ситуации лежит в нумерации карточек от 1 до 8000 для последующего применения таблицы случайных чисел. Это табличные ряды, например, из 10 000 цифр, которые расположены в совершенно случайном порядке. Изготовление таких таблиц - множество их имеется в продаже - наряду с этим возможно также машинным способом...
Применяя такую таблицу - ее можно назвать “урной про запас”, - следует действовать так:
Отмечаем начало в любом месте таблицы и постоянно берем четыре следующих друг за другом числа. Мы получаем, например, 1081,0412,6357,3180,0089... Тогда в картотеке мы отбираем карточки с порядковыми номерами 1081, 412, 6357, 3180, 89... Номера свыше 8000 мы пропускаем.
Проще обстоит дело при “систематическом методе отбора”. Объем выборки n =400 - это двадцатая часть от 8000 карточек в только что приведенном примере. Мы начинаем с какого-нибудь числа в пределах 20, например с 3. Затем после этого номера “З” берется каждая 20-я карточка, так мы получаем номера 3,23,43.., 7983. Особенно удачен этот метод там, где все элементы совокупности уже пронумерованы и стоят в правильном порядке...
Третий метод - это “способ конечных цифр”. Он также предполагает пронумерованную совокупность - от 1 до N. Для того чтобы выбрать из нее 20% всех случаев, следует отобрать все элементы, номера которых оканчиваются, например, на 2 или 9, так как каждая из этих цифр - 2 или 9 - представлена в 10% всей совокупности. Для того чтобы получить 3% всего объема, достаточно выбрать все элементы, порядковый номер которых кончается парами цифр 21, или 48, или 73. Преимуществом этого способа является то, что карты не должны лежать в порядке возрастания от 1 до N.
Отбор по буквам или по дням рождения часто также обеспечивает хорошее приближение к настоящей вероятностной выборке. На больших группах населения мы применяем способ выбора лиц, фамилии которых начинаются с определенной буквы, или же всех лиц, которые родились в определенный день - например, 8 декабря какого-нибудь календарного года. Конечно, можно взять также несколько начальных букв или дней рождения, чтобы увеличить объем выборки. При этом мы исходим из в целом получающей подтверждение гипотезы, что нет никакой связи между начальными буквами фамилии или днем рождения, с одной стороны, и интересующими нас статистическими признаками населения - с другой. Так, мы предполагаем, что календарный день рождения не оказывает влияния на доход соответствующего лица, что 20-25-летние мужчины в Федеративной Республике Германии, фамилии которых начинаются с буквы Д, так же распределяются по весовым категориям, как и мужчины того же возраста, фамилии которых начинаются с другой буквы”.
Стратифицированную выборку применяют тогда, когда генеральная совокупность, которую хотят выборочно исследовать, не гомогенна (не однородна). В этом случае составляют различные страты, обладающие большей гомогенностью, и затем проводят дальнейший отбор внутри этих страт, чтобы уменьшить область рассеивания, которая тем меньше, чем больше гомогенность “исходной массы”. Г. Келлерер приводит пример из практики составления переписей сельскохозяйственных предприятий, когда, чтобы скорее получить предварительные результаты, осуществляется выборочный анализ.
Территориальную выборку Г. Келлерер описывает на следующем примере:
“Если требуется, например, провести репрезентативный опрос хотя бы среди квартиросъемщиков крупного города А, то сталкиваются с серьезной трудностью- нет списка всех квартиросъемщиков, который можно использовать для составления выборочной совокупности. Но выход есть: вся городская территория на основании плана городе с очень крупным масштабом делится, например, на М=2000 кварталов; их нумеруют в форме серпантина от 1 до 2000. Когда будет сделана эта предварительная работа, можно подвергнуть обследованию каждый 20-й квартал. Теперь нам нужно в 100 выбранных кварталах собрать точные данные о всех квартиросъемщиках. Эта территориальная выборка может быть удачной даже тогда, когда у нас есть действительный список всех квартиросъемщиков по двум причинам:
а) “территориальная выборка” ограничивается определенными кварталами и поэтому уменьшаются расходы на дорогу и потери времени;
Дата добавления: 2015-07-08; просмотров: 201 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
СТАТИСТИЧЕСКИЕ ОТКЛОНЕНИЯ | | | Б) список жителей никогда не бывает совершенно точным, так как постоянно происходит пополнение и выезд. В территориальной выборке заложен учет текучести в принципе”. |