Латентно-структурные модели

Читайте также:

Совершенно другой подход к анализу таблиц сопряженности основывается на той идее, что, по-видимому, система связей, которые, проявляются как существующие между переменными в перекрестной классификации, можно объяснить с помощью очень простых соотношений между этими переменными и некоторыми другими переменными, которые мы не наблюдаем и которые называются поэтому латентными (скрытыми) переменными.

Для облегчения понимания идеи латентно-структурного анализа мы вернемся к задаче поиска модели перемен в голосовании. Мы видели, что модель <изменчивые-преданные> была наивной и давала сбои при попытках тонкой интерпретации данных. Эта модель делит избирателей на два класса-изменчивых и преданных. Разумная латентно-структурная модель будет содержать четыре (латентных) класса. Латентный класс С включает тех избирателей, которые придерживаются консервативных взглядов и от которых можно ожидать почти всегда, но не абсолютно всегда, голосования за консерваторов. Должны быть соответствующие классы S - для лейбористов, L - для либералов и A - для воздержавшихся. Тот человек, который голосовал за консерваторов на пяти выборах подряд, скорее всего, член консервативной партии, но может быть, что он принадлежит и к какому-нибудь из оставшихся классов. Проблемы, присущие моделям латентно-структурного анализа, связаны с определением вероятностей различных ответов для каждого класса, а также, в менее исследованных ситуациях, с определением числа латентных классов, необходимых для объяснения наблюдаемых данных. Главное свойство латентного класса состоит в том, что мы не можем быть уверенными в его существовании!

Идеи латентно-структурного анализа были четко изложены Лазерсфельдом и Генри [Lazarsfeld P. F., Henry N. W., 1968] и применены к данным опроса Виггинсом [Wiggins L. М., 1973]. Однако Виггинс пренебрег статистическими аспектами изменчивости данных и его подход основан на вере в получение удовлетворительной модели. Гудмен [Goodman L. А., 1974а, 1974б] обратил внимание на латентно-структурную модель и, как обычно, дал исчерпывающее описание методологии использования для ее получения логлинейных моделей. В конце этого параграфа мы приведем набросок его подхода к такой задаче.

[124]

Только для целей иллюстрации мы положим, что имеется четырех-клеточная классификация для переменных А, В, С и D, где - вероятность для произвольного наблюдения оказаться в ячейке (i, j, k, l). Согласно латентно-структурному подходу мы выдвигаем гипотезу о существовании ненаблюдаемой (латентной) переменной X, которая имеет Т классов. Число Т не известно и часть анализа заключается в том, чтобы исследовать влияния различных значений Т и установить, какое из них оптимально. Для этого мы представим данные

как компоненты частных итогов ABCD из пятивходовой таблицы ABCDX. То же самое верно и для теоретических вероятностей, что дает нам право записать

(10.20)

где - (неизвестные) вероятности того, что произвольное наблюдение угодит в ячейку (i, j, k, l, t) таблицы с пятью входами.

Оказывается, что принятый способ обращения с латентным фактором X приводит к использованию величин , определяемых как условные вероятности уровня i фактора A, когда известен подходящий уровень переменной X, и это уровень t. Тогда если внутри уровня t переменной Х факторы А, В, С и D взаимно независимы, то мы можем записать

(10.21)

где - обычная вероятность для произвольного индивида попасть на уровень t переменной X. Если прологарифмировать обе части выражения (10.21), то получится логлинейная модель, основанная на идее независимости.

Все члены выражения (10.21), стоящие справа, нам не известны и требуют оценки. Воспользовавшись принципом максимума правдоподобия, мы придем к решению системы уравнений такого вида:

(10.22)

где f_ijhi - наблюдаемая частота в данной ячейке, n - общая сумма частот всех ячеек, а остальные члены оценок максимума правдоподобия соответствуют вероятностям. Решать эти уравнения приходится численно, итеративным путем, как предложил Гудмен, который усуановил, что процесс сходится быстро.

Этот метод легко обобщается на случай множества латентных пе-

[125]

ременных. Так, например, если допустить наличие двух дихотомических латентных переменных Y и Z, то описанная теория может быть ис-пользована непосредственно в предположении, что Х имеет 2х2 = 4, уровня, с учетом соответствующих ограничений.

Идея латентной структуры, с помощью которой вводятся один или несколько скрытых факторов, весьма привлекательна, поскольку уп-рощает выявляемые сложные взаимосвязи между наблюдаемыми переменными. Примеры, приведенные Гудменом, показывают, что очень простые латентно-структурные модели работают удивительно хорошо при объяснении наборов данных, неудобоваримых для других методов. Однако число возможных латентно-структурных моделей из-за перестановок чисел латентных факторов и чисел уровней для каж-дого из этих факторов, действительно, огромно. Поэтому рассматривать возможность применения таких моделей стоит только в том случае, когда есть четкий подход к интерпретации латентных переменных и кажется целесообразной попытка проверить гипотезу о существовании именно этих латентных переменных для продвижения анализа имеющихся данных. Конечно, наиболее каверзный критерий требует перенесения латентно-структурной модели, полученной на одном множестве данных, на другое множество, для которого, можно ожидать, она пригодна. Поскольку переменные вводятся по необходимости незримо, это больше, чем обычное требование к модели дать убедительное объяснение наблюдаемых событий, обеспечивая выбор окончательной модели.

Дата добавления: 2015-09-01; просмотров: 38 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
МОДИФИКАЦИИ ЛОГЛИНЕИНЫХ МОДЕЛЕЙ	\|	АНАЛИЗ ДАННЫХ ОПРОСОВ ПРИ ОТСЕВЕ ОПРАШИВАЕМЫХ

mybiblioteka.su - 2015-2025 год. (0.013 сек.)