Читайте также:
|
|
Регрессионные модели с переменной структурой
(фиктивные переменные)
Понятие о фиктивных переменных
В регрессионных моделях в качестве объясняющих переменных часто приходится использовать не только количественные (определяемые численно), но и качественные переменные.
Например:
1. Исследуется зависимость между продолжительностью полученного образования и доходом, и в выборке представлены лица как мужского, так и женского пола. Нужно выяснить, обусловливает ли пол различие в результатах.
2. Исследуется зависимость между доходом и потреблением и выборка включает как мусульманские и христианские семьи, нужно выяснить, имеет ли существенное влияние на предпочтение конфессиональное различие.
3. Исследуются факторы, определяющие инфляцию, и в некоторые годы периода наблюдений правительство проводило политику регулирования доходов. Нужно проверить, оказало ли это какое-либо влияние на исследуемую зависимость.
В каждом из этих примеров одним из возможных решений было бы оценивание отдельных регрессий для двух указанных категорий с последующим выяснением, различаются ли полученные коэффициенты. Другой возможный подход к решению состоит в оценивании единой регрессии с использованием всей совокупности наблюдений и измерением степени влияния качественного фактора посредством введения, так называемой фиктивной переменной (искусственной).
Второй подход обладает двумя важными преимуществами:
во-первых, имеется простой способ проверки, является ли воздействие качественного фактора значимым;
во-вторых, при условии выполнения определенных предположений регрессионные оценки оказываются более эффективными.
Обычно фиктивная переменная отражает два противоположных состояния качественного фактора и может выражаться в двоичной форме:
Переменная D называется фиктивной (искусственной, двоичной) переменной (индикатором).
Следует отметить не совсем удачный перевод на русский язык термина dummy variables как «фиктивные» переменные.
Во-первых, в модели регрессионного анализа уже имеет фиктивная переменная x0 при a0, всегда равная единицы.
Во-вторых, все процедуры регрессионного анализа проводятся при включении фиктивных переменных так, же как и обычных количественных переменных.
«Фиктивность» же переменных Di состоит только в том, что они количественным образом описывают качественный признак.
Таким образом, кроме моделей, содержащих только количественные объясняющие переменные (обозначаемые Xj), в эконометрике рассматривают содержащие лишь качественные переменные (обозначаемые Di), либо те и другие одновременно.
В связи с тем, что фиктивные переменные в регрессионных моделях могут располагаться как в левой, так и в правой части (быть зависимой переменой и не зависимой), а также входить как отдельно, так и совместно с объясняющими переменными, рассмотрим классификацию подобных моделей:
Фиктивные переменные в регрессионных моделях |
Пространственные данные |
Временные ряды |
Фиктивная переменная в левой части модели |
Фиктивная переменная в правой части модели |
Выявление сезонности |
Выделение временного тренда |
Моделирование скачкообразных структурных сдвигов |
ANCOVA-модель при наличии у фиктивной переменной двух альтернатив |
ANCOVA-модель при наличии у качественных переменных более двух альтернатив |
Регрессия с одной количественной и двумя качественными переменными |
Сравнение двух регрессий (тест Г.Чоу) |
линейная вероятностная модель (LPM-модель) |
Tobit-модель |
Logit-модель |
Также необходимо рассмотреть некоторую особенность включения в уравнение регрессии фиктивных переменных.
Вводя в уравнение регрессии фиктивную переменную и найдя параметры уравнения следующим шагом мы проверим нулевую гипотезу о равенстве коэффициента при Di нулю, этим мы можем установить существенность влияния фактора отражаемого фиктивной переменной на Y.
Если рассматриваемый качественный признак имеет несколько (k) уровней (градаций), то в принципе можно ввести в регрессионное уравнение дискретную переменную, принимающую такое же количественное значение. Однако так не поступают из-за трудности содержательной интерпретации соответственных коэффициентов регрессии, а вводят (k -1) бинарных переменных.
Вводить бинарную переменную Dk нельзя, так как при этом для любой i -го наблюдения D1+D2+…+Dk =1, т.е. при суммировании элементов столбцов общей матрицы, соответствующих фиктивных переменных D1, D2,…,Dk получим столбец, состоящий из одних единиц. А так как в матрице такой столбец из единиц уже есть, то это означает линейную зависимость значений (столбцов) общей матрицы X, т.е. нарушилось бы шестая предпосылка МНК. Таким образом, мы оказались бы в условиях мультиколлинеарности и как следствие – невозможности получения оценок МНК. Такая ситуация, когда сумма значений несколько переменных, включенных в регрессию, равна постоянному числу (единице) получила название «dummy trap» или «ловушка». Чтобы избежать указанной проблемы, число вводимых переменных должно быть на единицу меньше числа уровней (градации) качественного признака.
Дата добавления: 2015-08-20; просмотров: 220 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Слайд 12 | | | ANCOVA-модель при наличии у фиктивной переменной двух альтернатив |