Читайте также:
|
|
В регрессионных моделях в качестве объясняющих переменных часто приходится использовать не только количественные (определяемые численно), но и качественные переменные. Например, спрос на некоторое благо может определяться ценой данного блага, ценой на заменители данного блага, ценой дополняющих благ, доходом потребителей и т.д. (эти показатели определяются количественно). Но спрос может также зависеть от вкусов потребителей, их ожиданий, национальных и религиозных особенностей и т.д. А эти показатели представить в численном виде нельзя. Возникает проблема отражения в модели влияния таких переменных на исследуемую величину. Обычно в моделях влияние качественного фактора выражается в виде фиктивной (искусственной) переменной, которая отражает два противоположных состояния качественного фактора. Например, «фактор действует» — «фактор не действует», «курс валюты фиксированный» — «курс валюты плавающий», «сезон летний» — «сезон зимний» и т.д. В этом случае фиктивная переменная может выражаться в двоичной форме:
Например, , если потребитель не имеет высшего образования, , если потребитель имеет высшее образование; , если в обществе имеются инфляционные ожидания, , если инфляционных ожиданий нет.
Переменная называется фиктивной (искусственной, двоичной) переменной (индикатором).
Таким образом, кроме моделей, содержащих только количественные объясняющие переменные (обозначаемые ), в регрессионном анализе рассматриваются также модели, содержащие лишь качественные переменные (обозначаемые ), либо те и другие одновременно.
Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются ANOVA-моделями (моделями дисперсионного анализа), Например, пусть — начальная заработная плата.
Тогда зависимость можно выразить моделью парной регрессии
. (59)
При этом коэффициент определяет среднюю начальную заработную плату при отсутствии высшего образования. Коэффициент указывает, на какую величину отличаются средние начальные заработные платы при наличии и при отсутствии высшего образования у претендента. Проверяя статистическую значимость коэффициента с помощью t -статистики либо значимость коэффициента детерминации с помощью F -статистики, можно определить, влияет или нет наличие высшего образования на начальную заработную плату.
Нетрудно заметить, что ANOVA-модели представляют собой кусочно-постоянные функции. Однако такие модели в экономике крайне редки. Гораздо чаще встречаются модели, содержащие как качественные, так и количественные переменные.
Модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называются ANCOVA- моделями (моделями ковариационного анализа).
Вначале рассмотрим простейшую ANCOVA-модель с одной количественной и одной качественной переменной, имеющей два альтернативных состояния:
(60)
Пусть, например, — заработная плата сотрудника фирмы, — стаж сотрудника, — пол сотрудника, т.е.
Тогда ожидаемое значение заработной платы сотрудников при годах трудового стажа будет:
Заработная плата в данном случае является линейной функцией от стажа работы. Причем и для мужчин, и для женщин заработная плата меняется с одним и тем же коэффициентом пропорциональности . А вот свободные члены отличаются на величину . Проверив с помощью -статистики статистические значимости коэффициентов можно определить, имеет ли место в фирме дискриминация по половому признаку. Если эти коэффициенты окажутся статистически значимыми, то, очевидно, дискриминация есть. Более того, при она будет в пользу мужчин, при — в пользу женщин.
В данном случае пол сотрудников имеет два альтернативных значения, и в модели это отражается одной фиктивной посменной.
Можно получить следующее общее правило:
Если качественная переменная имеет альтернативных значений, то при моделировании используются только фиктивных переменных.
Если не следовать данному правилу, то при моделировании исследователь попадает в ситуацию совершенной мультиколлинеарности или так называемую ловушку фиктивной переменной.
Значения фиктивной переменной можно изменять на противоположные. Суть модели от этого не изменится. Например, в модели можно положить, что:
Однако при этом знак коэффициента изменится на противоположный.
Значение качественной переменной, для которого принимается , называется базовым или сравнительным. Выбор базового значения обычно диктуется целями исследования, но может быть и произвольным.
Дата добавления: 2015-07-24; просмотров: 140 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Учет выплаты заработной платы | | | Сравнение двух регрессий |