Читайте также:
|
|
Чтобы построить какую-нибудь модель по множеству данных с помощью одного из пакетов машинных программ, достаточно описать определяющее множество параметров и затем, как обычно, нажать соответствующую кнопку. При этом автоматически вычисляется не только модель, но и значения статистик для проверки ее качества X2 и Y2. Значения Y2 для различных моделей лежат в основе критерия значимости отдельных l методом, который уже был описан в параграфе 5.7.
Теперь, воспользовавшись табл. 7.1, мы дадим пример для данных 2х2х2. Допустим, из подобранной по данным насыщенной модели следует, что необходимо учитывать взаимодействия АВ и АС и главные эффекты (A, В, С). Причем частоты всех ячеек увеличены на 0,5
[70]
Т а б л и ц а 7.2. Сравнение моделей для таблицы 2X2X2
Модель | Определяю-щее мно- | Включенные параметры | Число | Y2 |
жестро | ||||
АВ/АС АВ/С | ч, А, В, С, АВ, АС ч, Л, В, С, АВ | Y21 Y22 | ||
Различие | АС, все остальные эффекты совпадают |
(см. параграф 6.6). Следовательно, нам нужна модель, определяемая соотношением АВ/АС с соответствующим значением Y2, скажем Y12, имеющим 2 степени свободы (именно две, поскольку по сравнению с насыщенной моделью здесь не хватает двух параметров).
Давайте попробуем отыскать наипростейшую модель, в которую не входит взаимодействие АС. Такую модель определяет АВ/С: в ней встречаются все параметры, входящие в модель АВ/АС, за исключением АС. Новое значение Y2, равное Y22, имеет три степени свободы, поскольку теперь в модель входит на три параметра меньше, чем в насыщенную.
Различие между моделями заключается в отсутствии AC во второй из них. В результате значение Y22 получает на одну степень свободы больше, чем было у Y22. Эта ситуация обобщена в табл. 7.2. Здравый смысл подсказывает нам, что если все изменения обусловлены взаимодействием АС, то важность этого взаимодействия должна вытекать и из анализа разности ( ), имеющей распределение c2 с одной степенью свободы, поскольку (3-2) =1. Если эта разность оказывается достаточно большой, т. е. превышает верхнюю 5%-ную точку распределения c2, то мы приходим к выводу, что исключение этого параметра из модели делает различие недопустимо большим.
И в более сложных случаях, т. е. когда число переменных более трех, удается подобрать такие пары моделей, которые различаются только одним единственным параметром. Таких пар может быть несколько и разности в значениях Y2 для них не обязательно совпадают. Поэтому мы должны выяснить, что наш критерий - это критерий значимости отдельного параметра при заданном наборе всех прочих переменных, входящих в модель. Так, в табл. 7.2 мы проверяли важность АС при заданных значениях ч, А, В, С и АВ. Позднее (в параграфе 8.1) мы познакомимся с работой Брауна [Brown M,B., 1976], который выяснил этот момент.
Необходимо сделать еще одну оговорку, связанную с тем, что наш метод анализа использует c2-распределение, которое в данном случае не более чем хорошее приближение. Это означает, что когда число наблюдений достаточно велико, распределение нашей статистики- приблизительно c2. Применение этого распределения в качестве приближения для X2 исследовалось множеством специалистов, которые показали, что оно работает весьма хорошо даже для малых частот в ячейках (см., например, [Yarnold J.K., 1970]). Вильямc [Williams
[71]
В. А., 1976] исследовал распределение Y2 для логлинейных моделей, которые мы как раз описываем, и предложил поправочный множитель, улучшающий точность приближения c2. Правда, необходимость дополнительных вычислений сильно снижает его практическую ценность, тем более что мы получаем не некий закон, а просто правила уточнения этих соотношений.
Дата добавления: 2015-09-01; просмотров: 58 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
ПРИМЕРЫ ИЕРАРХИЧЕСКИХ МОДЕЛЕЙ | | | АНАЛИЗ ПЯТИФАКТОРНОЙ ТАБЛИЦЫ |