Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Проверка независимости a и в

Посвящается М. и Д. | ВВЕДЕНИЕ | ПЕРЕКРЕСТНАЯ КЛАССИФИКАЦИЯ | ВЫБОРКИ, СОВОКУПНОСТИ И СЛУЧАЙНЫЕ ОТКЛОНЕНИЯ | НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ | РАСПРЕДЕЛЕНИЕ ХИ-КВАДРАТ | ПРОВЕРКА ГИПОТЕЗ | ОЦЕНИВАНИЕ И ОЖИДАНИЕ | ХИ-КВАДРАТ КРИТЕРИЙ КАЧЕСТВА МОДЕЛИ | Пример 1.4. |


Читайте также:
  1. IV. Проверка знаний правил пожарной безопасности
  2. VI. Проверка долговечности подшипников
  3. VII. Проверка долговечности подшипника
  4. VIII. Проверка долговечности подшипника
  5. VIII. Проверка долговечности подшипников
  6. X. Проверка прочности шпоночных соединений
  7. X. Проверка прочности шпоночных соединений.

Первый вопрос, приходящий в голову при встрече с таблицей 2?2 и относящийся к переменным А и В: <Есть ли закономерность?>, под которой мы понимаем: <Зависят ли А и В друг от друга каким-либо образом?>. Если такой связи нет, это означает, что знание об отношении респондента к категории А не дает нам никакой информации насчет категории В. Так, например, мы не извлечем пользы из утверждения о том, что он или она моложе 40 лет. Хотя довольно трудно найти переменные, которые были бы совершенно независимы, сама идея независимости (отсутствия связи) теоретически очень важна, а

[17]

математически означает, что если А и В независимы, то отношение f11/f01 будет примерно равно f12/f02f10/f10 будет примерно равно f21/f20.

Даже если между А и В нет никакой связи, из этого еще не следует, что они независимы в множестве { fij }, поскольку в игру может вмешаться случайная вариация. Поэтому нам нужны средства проверки независимости. Для их получения мы должны вернуться к теоретическому (двумерному) распределению, лежащему в основе критерия, и ввести некоторые новые обозначения.

Записью pij будет обозначаться теоретическая вероятность для случайно выбранного респондента попасть в ячейку (i, j), т. е. соответствовать категориям Ai и Вj. Значения { pij } в табл. 2.2 - возможное представление, отвечающее данным табл. 2.1, где приведены наблюдаемые частоты. Индекс нуль работает, как и раньше, а именно:

poj = = 1 (2.2)

Уравнения (2.2) совершенно аналогичны ранее приведенным уравнениям (2.1) для частот. Отметим, что общая вероятность p00, конечно, равна 1, поскольку респонденты должны обязательно оказаться в одной из четырех ячеек.

Если А к В независимы, то мы должны ожидать, что доля в категории B1 тех, кто одновременно принадлежит и категории A1 должна быть такой же, как и доля тех в категории B2, кто принадлежит и A1. Отсюда мы должны потребовать, чтобы выполнялись соотношения:

(2.3)

т.е. p11= p10 p01

Аналогично условные доли принадлежащих к категории B1 не

должны зависеть от их расположения в категории A1, следовательно,

и

p11= p01p10

Поскольку отношения (2.3) и (2.4) - это одно и то же, можно констатировать их эквивалентность и сделать общее утверждение о том, что если А к В независимы, то

pij= pi0 p0j (2.5)

Еще мы можем заметить, что если А и В независимы, то и, раскрывая пропорцию, найдем p11 (p12+ p22)= p12 (p11+ p21), откуда

(2.6)

что дает общее соотношение, учитывающее вероятности всех четырех

ячеек.

[18]

Таблица 2.2. Теоретическое распределение вероятностей для таблицы 2?2

  B1 B2 Всего  
A1 A2 p11 p21 p12 p22 p10 p20  
 
Всего p01 p02 p00  

Таблица 2.3. Гипотетический набор данных

  B1 B2 Всего
A1 A2      
Всего      

Величину p11/p21 можно называть преобладанием категории A1 над категорией A2 в ответах индивидов из категории B1. Аналогично p12/p22 есть преобладание ответов A1 у индивидов из категории B2. Поскольку выражение в левой части уравнения (2.6) можно переписать в виде (p11/p21)? (p12/p22), то его часто называют отношением преобладаний (или отношением перекрестных произведений). Это отношение принято обозначать заглавной греческой буквой? (пси) и применять исключительно при условии, что А и В независимы.

Уравнения (2.5) или (2.6) легко могли бы служить ключом к проверке независимости. Действительных вероятностей мы почти никогда не знаем, зато у нас есть некоторые указания на их значения, содержащиеся в наблюдаемых долях ячеек, так что в качестве оценки для pij можно взять

(2.7)

Если А и В независимы, то на основании уравнения (2.5) мы должны ожидать, что

будет примерно равно

Действительно, если А и В на самом деле независимы и мы знаем f00 - общее число наблюдений в таблице, то наиболее вероятная частота в (i, j)-ячейке должна быть

(2.8)

Значит, сравнение этой оценки частоты eij, которая предполагает независимость, и наблюдаемой частоты fij может служить основой для проверки предположения о независимости.

К этой ситуации легко приспособить обычные критерии качества, основанные на X2 или Y2 (см. гл. 1), поскольку мы сравниваем наблюдаемые и ожидаемые частоты. Критерий X2 принимает следующую простую форму:

а) вычисляется (2.9)

[19]

б) найденное значение сравнивается с табличным?2-распределением при одной степени свободы.

Иейтс [Yates F., 1934] предложил модификацию X2, которая как он настаивал, дает результаты, лучше согласующиеся с распределением?2- Его статистика имеет вид:

(2.10)

Высказывались различные соображения относительно сравнительных достоинств выражений (2.9) и (2.10). Так, Гризли [Grizzle J. E., 1967] и Коноувер [Conover W. J., 1974] полагали, что X*2 следует применять при получении таблицы частот выборочным методом 2 из параграфа 2.2, а X2 - при выборочном методе 1. Бейкер [Baker R. J., 1977] предложил алгоритм для вычисления точных вероятностей распределений X2 (или X*2) при малых частотах ячеек.


Дата добавления: 2015-09-01; просмотров: 60 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Пример 1.5.| Пример 2.1

mybiblioteka.su - 2015-2024 год. (0.007 сек.)