Читайте также: |
|
Первый вопрос, приходящий в голову при встрече с таблицей 2?2 и относящийся к переменным А и В: <Есть ли закономерность?>, под которой мы понимаем: <Зависят ли А и В друг от друга каким-либо образом?>. Если такой связи нет, это означает, что знание об отношении респондента к категории А не дает нам никакой информации насчет категории В. Так, например, мы не извлечем пользы из утверждения о том, что он или она моложе 40 лет. Хотя довольно трудно найти переменные, которые были бы совершенно независимы, сама идея независимости (отсутствия связи) теоретически очень важна, а
[17]
математически означает, что если А и В независимы, то отношение f11/f01 будет примерно равно f12/f02,а f10/f10 будет примерно равно f21/f20.
Даже если между А и В нет никакой связи, из этого еще не следует, что они независимы в множестве { fij }, поскольку в игру может вмешаться случайная вариация. Поэтому нам нужны средства проверки независимости. Для их получения мы должны вернуться к теоретическому (двумерному) распределению, лежащему в основе критерия, и ввести некоторые новые обозначения.
Записью pij будет обозначаться теоретическая вероятность для случайно выбранного респондента попасть в ячейку (i, j), т. е. соответствовать категориям Ai и Вj. Значения { pij } в табл. 2.2 - возможное представление, отвечающее данным табл. 2.1, где приведены наблюдаемые частоты. Индекс нуль работает, как и раньше, а именно:
poj = = 1 (2.2)
Уравнения (2.2) совершенно аналогичны ранее приведенным уравнениям (2.1) для частот. Отметим, что общая вероятность p00, конечно, равна 1, поскольку респонденты должны обязательно оказаться в одной из четырех ячеек.
Если А к В независимы, то мы должны ожидать, что доля в категории B1 тех, кто одновременно принадлежит и категории A1 должна быть такой же, как и доля тех в категории B2, кто принадлежит и A1. Отсюда мы должны потребовать, чтобы выполнялись соотношения:
(2.3)
т.е. p11= p10 p01
Аналогично условные доли принадлежащих к категории B1 не
должны зависеть от их расположения в категории A1, следовательно,
и
p11= p01p10
Поскольку отношения (2.3) и (2.4) - это одно и то же, можно констатировать их эквивалентность и сделать общее утверждение о том, что если А к В независимы, то
pij= pi0 p0j (2.5)
Еще мы можем заметить, что если А и В независимы, то и, раскрывая пропорцию, найдем p11 (p12+ p22)= p12 (p11+ p21), откуда
(2.6)
что дает общее соотношение, учитывающее вероятности всех четырех
ячеек.
[18]
Таблица 2.2. Теоретическое распределение вероятностей для таблицы 2?2
B1 | B2 | Всего | ||
A1 A2 | p11 p21 | p12 p22 | p10 p20 | |
Всего | p01 | p02 | p00 |
Таблица 2.3. Гипотетический набор данных
B1 | B2 | Всего | |
A1 A2 | |||
Всего |
Величину p11/p21 можно называть преобладанием категории A1 над категорией A2 в ответах индивидов из категории B1. Аналогично p12/p22 есть преобладание ответов A1 у индивидов из категории B2. Поскольку выражение в левой части уравнения (2.6) можно переписать в виде (p11/p21)? (p12/p22), то его часто называют отношением преобладаний (или отношением перекрестных произведений). Это отношение принято обозначать заглавной греческой буквой? (пси) и применять исключительно при условии, что А и В независимы.
Уравнения (2.5) или (2.6) легко могли бы служить ключом к проверке независимости. Действительных вероятностей мы почти никогда не знаем, зато у нас есть некоторые указания на их значения, содержащиеся в наблюдаемых долях ячеек, так что в качестве оценки для pij можно взять
(2.7)
Если А и В независимы, то на основании уравнения (2.5) мы должны ожидать, что
будет примерно равно
Действительно, если А и В на самом деле независимы и мы знаем f00 - общее число наблюдений в таблице, то наиболее вероятная частота в (i, j)-ячейке должна быть
(2.8)
Значит, сравнение этой оценки частоты eij, которая предполагает независимость, и наблюдаемой частоты fij может служить основой для проверки предположения о независимости.
К этой ситуации легко приспособить обычные критерии качества, основанные на X2 или Y2 (см. гл. 1), поскольку мы сравниваем наблюдаемые и ожидаемые частоты. Критерий X2 принимает следующую простую форму:
а) вычисляется (2.9)
[19]
б) найденное значение сравнивается с табличным?2-распределением при одной степени свободы.
Иейтс [Yates F., 1934] предложил модификацию X2, которая как он настаивал, дает результаты, лучше согласующиеся с распределением?2- Его статистика имеет вид:
(2.10)
Высказывались различные соображения относительно сравнительных достоинств выражений (2.9) и (2.10). Так, Гризли [Grizzle J. E., 1967] и Коноувер [Conover W. J., 1974] полагали, что X*2 следует применять при получении таблицы частот выборочным методом 2 из параграфа 2.2, а X2 - при выборочном методе 1. Бейкер [Baker R. J., 1977] предложил алгоритм для вычисления точных вероятностей распределений X2 (или X*2) при малых частотах ячеек.
Дата добавления: 2015-09-01; просмотров: 60 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Пример 1.5. | | | Пример 2.1 |