Читайте также: |
|
В многомерных таблицах числа, характеризующие частоты, во мно-жестве ячеек оказываются равными нулю, а появление этих нулей создает камень преткновения при анализе. Рассмотрим эти трудности в том порядке, в каком обсуждались сами методы, т. е. начнем с насы-щенной модели. Если нули имеют место, то Гудмен предложил добав-
[94]
лять по 0,5 в каждую ячейку. И действительно, по аналогии с хорошо известной поправкой на непрерывность для биномиального распределения вовсе не удивительно, что добавление к частоте каждой ячейки величины 0,5 оказывается хорошей идеей, безотносительно к тому, каковы частоты ячеек.
Для ненасыщенных моделей наличие отдельных нулевых ячеек - не проблема до тех пор, пока не появится так много нулей, что они приведут к нулевой условной сумме. Если эта сумма относится к факторам, а не к откликам, то простые вычисления приведут к уменьшению числа категорий фактора за счет отбрасывания тех из них, у которых оказались нулевые условные суммы. В противном случае оценки максимума правдоподобия для ячеек можно получить обычным путем, но для оценок параметров и определения числа степеней свободы понадобятся специальные методы счета, описанные в гл. 10.
В подходе, основанном на взвешенном методе наименьших квадратов, при анализе таблиц используются обратные значения частот ячеек, а значит, любой нуль создает проблему. Более того, если в таблице есть нуль, то никакая мостеллеризация не приведет к его исчезновению, ибо этот метод включает последовательное перемножение частот ячеек и даже, как очень удачно выразились Бишоп, Файнберг и Холленд [Bishop Y. M. M., Fienberg S. E., Holland P. W., 1975], <некоторые нули меньше, чем другие>. Как следствие этих проблем, появилась работа, в которой было выяснено, какие числа надо добавлять к частотам ячеек, чтобы сделать все эти частоты положительными. Эта работа, опиралась на псевдобайесовские оценки. Основы теории появились в статьях Файнберга и Холленда [Fienberg S. E., Holland P. W., 1970, 1973)], а ее развитие - в работе Бишопа, Файнберга и Холленда [Bishop Y. M. M., Fienberg S. E., Holland P. W., 1975].
Основу псевдобайесовского подхода составляет то, что еще до начала исследования данных мы можем сделать разумное предположение относительно фундаментальной структуры той совокупности, из которой была извлечена наша выборка. Мы должны обратить относительные вероятности категорий для различных факторов и вероятных взаимодействий. Бишоп, Файнберг и Холленд [Bishop Y. M. M., Fienberg S. E., Holland P. W., 1975] указали разнообразные ситуации, в которых наши знания должны быть довольно подробными. Если же никаких знаний нет, то было показано, что лучшее предположение в этом случае- считать, что все ячейки имеют равные вероятности. Во всех случаях из нашего предположения вытекает следующий шаг - явное выражение его в виде таблицы вероятностей ячеек. Для иллю-страции метода положим, что имеется двухфакторная ситуация и обо-значим наши предполагаемые вероятности через { }.
Как обычно, наблюдаемые частоты ячеек обозначим { fij }, а их суммы f 00. Следующий шаг этого метода состоит в вычислении некоторой константы k, которая количественно соотносит нашу предполагаемую структуру с наблюдениями. Эта константа дается формулой
8.15
[95]
Это число k соответствует тому числу гипотетических наблюдений, которое следует добавить к фактически имеющим место, распределив их между ячейками следующим простым способом: добавлением в ячейку fij величины . Таким образом мы получим таблицу, в которой все числа положительны и которая объединяет реальные данные с априорной информацией. В силу структуры соотношения (8.15) отношение гипотетических наблюдений k к фактическим наблюдениям y00 будет мало, когда наблюдаемая структура совокупности будет совсем не та, что мы предполагали, и, следовательно, неправдоподобна. Делая такое плохое предположение, мы можем нанести себе большой ущерб. С другой стороны, k/f00 велико, если структуры наблюдаемой и гипотетической совокупностей очень похожи, а значит, весьма важно, чтобы значения { }были установлены без обращения к величинам { fij } во избежание возможного смещения.
Отличное введение в этот метод для начинающих дал Смит [Smith К. W., 1976].
Дата добавления: 2015-09-01; просмотров: 55 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
ДРУГИЕ МЕТОДЫ ПРОВЕРКИ И ОЦЕНИВАНИЯ | | | Пример 8.1. Австралийская система голосования |