II. Для каждого элемента, попавшего в выборку, должна быть известна (или вычисляема) вероятность, с которой он был отобран.

Читайте также:

II тип. Для каждого вопроса, пронумерованного цифрой, подберите один или несколько соответствующих ответов, обозначенных буквенным индексом.
V. Келья, в которой Людовик Французский читает часослов
В XVIII в. Россия представляла собой огромную державу, процесс формирования территории которой еще не завершился.
В воде, которую Аллах ниспослал с неба и посредством которой
В душе каждого человека от рождения запечатлена вся мудрость Вселенной. Это — ДНК всех вещей. На самом деле ДНК можно расшифровать как Врожденное Божественное Осознание.
В зимний период проверку действия тормозов необходимо осуществлять не реже одного раза каждого часа следования поезда.

Вероятностные и невероятностные выборки

Правила отбора, которые должны быть выполнены, чтобы результаты обследования части совокупности можно было распространить на всю совокупность. Таких правил два.

I. Каждый элемент совокупности должен иметь шанс (ненулевую вероятность) быть отобранным (попасть в выборку).

II. Для каждого элемента, попавшего в выборку, должна быть известна (или вычисляема) вероятность, с которой он был отобран.

Выборки, удовлетворяющие этим двум условиям, называются случайными или вероятностными.

Все остальные выборки не являются случайными.

Теория математической статистики позволяет распространять результаты обследования части совокупности на всю совокупность только для вероятностных выборок. Для невероятностных выборок такое распространение теоретически не обосновано, а практически часто приводит к ошибкам.

В практике выборочных исследований далеко не всегда применяются вероятностные выборки. Это характерно не только для России, но и для других стран. Однако исследователи всегда стараются максимально приблизить реальную выборку к вероятностной.

Конструкция выборки определяется размером выборки n, способом отбора респондентов из совокупности.

Вероятность попадания истинного значения параметра в некоторый интервал называют доверительной вероятностью или уровнем доверия, а сам интервал называется доверительным интервалом.

Параметр - это константа, которая зависит от доверительной вероятности , с которой гарантируется попадание истинного значения параметра в указанный доверительный интервал. Величина берется из таблиц для нормального распределения, которое хорошо аппроксимирует распределение выборочной оценки . В социологии обычно используется уровень доверия = 95%. Для него полезно помнить значение константы , которое равно 1.96.

Общая ошибка выборки показывает, на сколько выборочная оценка отличается от истинного значения параметра .

В.И. Паниотто приводит следующие расчеты репрезентативной выборки с допущением 5-процентной ошибки.

Объем генеральной совокупности (чел.)									бесконечно
Объем выборки (чел.)

Простая случайная выборка является простейшим вариантом вероятностной выборки.

Простую случайную выборку можно определить через механизм ее формирования.

Пусть требуется сформировать выборку размера n из совокупности, состоящей из N элементов. Сначала отберем один элемент, причем отбирать его будем так, чтобы каждый из N элементов совокупности имел равную вероятность быть отобранным. Такой отбор называется отбором с равной вероятностью. Затем из оставшихся N-1 элементов отберем с равной вероятностью еще один. И так будем повторять до тех пор, пока не отберем ровно n элементов. Полученная таким образом выборка называется простой случайной выборкой или сокращенно SRS выборкой (SRS – сокращение от simple random sample), а описанный механизм называется простым случайным отбором.

Легко показать, что при простом случайном отборе каждый элемент совокупности имеет одну и ту же вероятность попасть в выборку. Эта вероятность равна .

Все элементы совокупности нумеруются числами от 1 до N. Далее используется датчик случайных чисел для отбора с равной вероятностью n разных порядковых номеров.

Датчик случайных чисел – это чаще всего компьютерная программа, которая генерирует случайные числа, удовлетворяющие заданным требованиям. Для простого случайного отбора нужен датчик, генерирующий с равной вероятностью целые числа из заданного интервала.

В Excel, например, такой датчик реализован в виде функции Randbetween(N1;N2) с двумя параметрами N1 и N2, задающими границы интервала. Есть в Excel и еще один датчик случайных чисел, генерирующий вещественные (псевдослучайные) числа, равномерно распределенные в интервале от 0 до 1. Это функция Rand() без параметров, в русскоязычных версиях Excel она называется СЛЧИС(). Чтобы с ее помощью отбирать целые числа, нужно умножить выдаваемое этой функцией случайное число на N, а затем округлить произведение вверх до целого. Получится целое случайное число в интервале от 1 до N.

Воспользовавшись датчиком n раз, можно получить n случайных чисел в интервале от 1 до N. Выборка формируется из элементов с этими порядковыми номерами. Однако прежде чем завершить отбор, необходимо проверить, что один и тот же номер не встретился в выборке два и более раз. Ведь случайный датчик может выдать какой-либо номер повторно. Каждый из повторяющихся номеров нужно оставить в выборке в единственном экземпляре. После удаления повторяющихся номеров размер выборки уменьшится. Его требуется довести до заданного размера n, генерируя новые случайные номера и добавляя в выборку новые элементы. Необходимо обеспечить выполнение двух условий: размер простой случайной выборки должен быть в точности равен n и элементы в выборке не должны повторяться.

Простая случайная выборка в «чистом» виде применяется в практике исследований крайне редко. Основные препятствия для ее применения заключаются в следующем.

1) Чтобы сформировать простую случайную выборку, необходимо составить полный список всех элементов совокупности. В большинстве случаев составить такой список невозможно. Действительно, трудно представить себе полный список всех жителей России или даже жителей крупного города, который бы адекватно отражал ситуацию на момент проведения исследования.

2) Простая случайная выборка равномерно распределяется среди всех элементов совокупности. Это значит, что место жительства попавших в выборку респондентов будет равномерно разбросано по всей территории, которую охватывает исследование. В исследованиях с широким территориальным охватом (таких, например, как всероссийские опросы) интервьюеру потребуется совершить целое путешествие, чтобы добраться от одного респондента до другого. Это делает опросы по простой случайной выборке крайне дорогостоящими. (Влияние данного фактора не распространяется на почтовые и телефонные опросы, а также на опросы через интернет).

Несмотря на это, простая случайная выборка занимает в выборочных исследованиях очень важное место. Она является эталоном, с которым сравнивают любую другую выборку, чтобы оценить ее качество. (Показателем качества выборки служит дизайн-эффект, который показывает, на сколько данная конструкция выборки лучше или хуже простой случайной). Без понимания принципов оценивания параметров в простой случайной выборке невозможен переход к выборкам более сложных конструкций. Кроме того, простая случайная выборка сама является составным элементом практически любой выборки.

Дата добавления: 2015-07-20; просмотров: 404 | Нарушение авторских прав

Читайте в этой же книге: Проектирование квотной выборки | Причины применения квотной выборки | Целевая (экспертная) выборка |

<== предыдущая страница	\|	следующая страница ==>
Исходные данные к задаче	\|	Кластерная выборка

mybiblioteka.su - 2015-2026 год. (0.004 сек.)