Читайте также:
|
Очень часто при анализе данных типа временной ряд мы сталкиваемся с наличием автокорреляции и нестационарности. Визуальный анализ графика наблюдений может выявить очевидный на глаз тренд или сезонную (периодичную) компоненту или изменение разброса наблюдений с течением времени – гетероскедастичность. Все это может служить указанием на непостоянство среднего или дисперсии ряда (их зависимость от времени), то есть нестационарность изучаемого ряда. Анализ автокорреляционной функции и статистик, основанных на значениях корреляционных коэффициентов, позволяет выявить зависимость текущих значений изучаемых показателей от их предыдущих значений, то есть наличие авторкорреляции.
Замечание: Более формальные процедуры проверки на нестационарность (тесты Дики – Фуллера и Перрона, интегральная статистика
) будут рассматриваться на последующих занятиях.
Процедуры идентификации и диагностики:
Процедура подбора конкретной модели состоит из трех этапов:
1. Идентификация модели;
2. Оценивание модели;
3. Диагностика модели.
На этапе идентификации проводится предварительный анализ данных с целью выяснения возможных порядков p и q для ARMA - модели. Используемые при этом процедуры являются не вполне точными, что, впоследствии, может привести к выводу о непригодности идентифицированной модели и необходимости замены ее на альтернативную. На этом этапе можно провести пердварительную грубую оценку параметров модели.
На втором этапе проводится оценка модели с использованием эффективных статистических методов и уточнение полученных оценок.
На третьем этапе оцененная модель проверяется на адекватность имеющимся данным. Если выбранная модель не удовлетворяет критериям адекватности, запускается новый цикл подбора и т.д. до тех пор, пока не будет получена удовлетворительная модель.
Пусть предполагается, что анализируемые данные описываются ARMA(p,q) - моделью:

где
- белый шум.
Автокорреляционная и частная автокорреляционная функции
Наиболее известный способ идентификации ARMA моделей основан на анализе автокорреляционной – ACF (autocorrelation function) и частной автокорреляционной – PACF (partial autocorrelation function).
Aвтокорреляционная функция (ACF) вычисляется по формуле:
(1)
где 
В Eviews применяется несколько другая формула для расчета коэффициента автокорреляции
(1’)
Частная автокорреляционная функция – PACF описывает «чистую корреляцию» между
и
, когда устранено влияние всех промежуточных членов ряда
.
Теоретически значение PACF определяются по формуле:
(2)
функций изучаемого временного ряда.
Напомним, что частный коэффициент корреляции
измеряет «чистую» корреляцию между случайными величинами
и
при исключении влияния всех промежуточных случайных величин
.
Значение
находится из системы уравнений Юла-Уолкера
для решения которой используется правило Крамера.
В Eviews используется итеративная процедура вычисления значений PACF, поэтому значения
коэффициентов могут различаться.
На лекции будет показано, что
·
процесс можно идентифицировать по поведению ACF, поскольку,
,
·
процесс – по поведению PACF, для которой
.
Идентификация
модели на основе ACF и PACF является более трудной задачей поскольку при
на поведение ACF влияют как
, так и
компоненты, но
· начиная с
, поведение ACF аналогично поведению ACF для
процесса.
· PACF для
модели убывает подобно PACF для
процесса.
При работе с реальными данными неизвестные истинные значения
и
заменяются их оценками
и
– выборочные коэффициенты корреляции,которые являются состоятельными в случае стационарной модели.
В силу того, что
и
это всего лишь оценки для
и
характер изменения реальных ACF и PACF может не воспроизводиться в их выборочных аналогах. Тем не менее в большинстве случаев поведение истинных ACF и PACF в той или иной мере отражается на поведении выборочных аналогов, что позволяет их использовать для идентификации моделей из класса ARMA.
| МОДЕЛЬ | ACF | PACF |
(Белый шум)
|
|
|
|
Монотонное убывание
Осциллирующее убывание
|
|
| Убывание к нулю монотонное или осциллирующее | Зануление при
|
|
Положительный пик при , зануление при .
Отрицательный пик при , зануление при .
|
Осциллирующее убывание
Убывание по абсолютной величине
|
| Зануление при
| |
|
Экспоненциальное убывание с лага 1, знак совпадает со знаком
Осциллирующее убывание с лага 1, знак совпадает со знаком
|
Осциллирующее убывание с лага 1,
Экспоненциальное убывание с лага 1, , знак совпадает со знаком ,
|
| Осциллирующее или монотонное убывание | Осциллирующее или монотонное убывание |
Для обоснованного выбора структуры модели хотелось бы иметь какие-нибудь статистические критерии для проверки гипотез о равенстве нулю тех или иных значений
и
на основании наблюдаемых значений
и
. Вообще говоря, это довольно нетривиальный вопрос.
Однако заметим, что в модели с константой среднее остатков равно 0, поэтому выборочная автокорреляционная функция остатков
. (3)
Если модель адекватна данным и ошибки являются белым шумом, то при больших значениях
и
(асимптотически) случайная величина
имеет распределение близкое к нормальному
. Хорошая аппроксимация достигается начиная с
. Таким образом, значение
вне интервала
позволяет на 5% уровне значимости отвергнуть гипотезу о равенстве нулю коэффициента
.
Аналогичным образом, если рассматриваемый процесс
описывается моделью
моделью, то при больших
и
распределение случайной величины
близко к нормальному
. И опять же значение
вне интервала
позволяет на 5% уровне значимости отвергнуть гипотезу о равенстве нулю коэффициента
(гипотезы проверяются при каждом отдельном
!!!)
Можно использовать стандартные методы проверки коэффициентов
и 
на значимость.
Для тестирования гипотезы
используется
- статистика:
, (4)
которая при верной гипотезе
имеет распределение Стьюдента с
степенями свободы.
Гипотеза
также проверяется с помощью
- критерия Стьюдента:
, (5)
где
– это число устраненных переменных
Замечание: К интерпретации графиков ACF и PACF следует подходить с осторожностью.
Пусть
есть процесс белого шума,
. Согласно рассмотренному выше критерию,
. Оценим вероятность того, что за пределы полосы
выйдут
значений (биномиальная модель – выход за пределы полосы=успех), где
- рассматриваемое количество значений ACF:
. Возьмем для примера
. Т.е. вероятность выхода PACF за пределы критической полосы вовсе не мала, даже в ситуации, когда процесс моделируется как белый шум (DGP=data generating process)
можно ошибочно интерпретировать модель как
процесс (SM=statistical model).
Сюда же можно отнести и то обстоятельство, что в некоторых статистических пакетах, в том числе и в Eviews при расчете выборочная ковариационная функция делится не на
, а на
. Этот приводит к смещению оценки
в сторону нуля.
- статистика
Позволяет проверить гипотезу о равенстве нулю сразу
первых значений коэффициентов корреляции (нулевая гипотеза)
Существует несколько видов этой статистики:
– статистика Бокса-Пирса (6)
– статистика Льюнга- Бокса (7)
В Eviews сообщается значение статистики Льюнга – Бокса.
Если не базироваться на ARMA спецификации модели, то соответствующие величины имеют
распределение с
степенями свободы.
Если уже работаем в классе ARMA – моделей (диагностика свойств остатков), то
распределение с
степенями свободы, где
и
- параметры ARMA модели, оцененные ранее.
Информационные критерии
В ситуации, когда несколько ARMA моделей оказались адекватными данным, при выборе модели можно опираться на значения информационных критериев. Наиболее часто в распечатках компьютерных программ приводятся критерии AIC и SIC:
Акаике – AIC (Akaike information criterion)
(8)
Шварца – SIC (Scharz information criterion)
(9)
(хотя используются и другие).
Модели выбираются по минимальным значениям информационных критериев (принцип экономии мышления: чем меньше параметров в модели, тем лучше; модель ARMA с небольшими p и q предпочтительнее моделей AR или MA, с большими порядкамии, как правило, не хуже описывает данные).
Критерий Акаике это эвристическая попытка свести вместе 2 требования – уменьшение числа параметров и качество подгонки модели. Он базируется на обобщении принципа максимального правдоподобия в предположении о гауссовском распределении ошибок. AIC переоценивает порядок авторегрессии для AR модели, то есть оценка
не состоятельна!!!
Критерий Шварца имеет более фундаментальное основание. Оценка порядка модели здесь является состоятельной.
Критерии AIC и SIC нередко противоречат друг другу. Поэтому при исследованиях обычно указывают на то, какой из критериев использовался.
Замечание: С другой стороны вместо выбора одной модели можно сформировать портфель моделей, включающий несколько моделей одинаковых по характеристикам. Этот портфель можно использовать для прогнозирования и описания взаимосвязей между переменными.
Критерий для выбора моделей заключается в следующем (Poskitt and Tremayne, 1987)
,
где параметры
характеризуют наилучшую модель по критерию AIC. Для всех остальных моделей с параметрами
рассчитывается величина
- мера близости. В портфель можно включать те модели, у которых
.
Статистика 
Пусть ошибки в модели имеют следующий вид:
где
.
Проверяется гипотеза
(отсутствие корреляции)
(
).
Статистика Дарбина - Уотсона проверяет наличие автокорреляции 1 – го порядка!!!
(10)
Дарбин и Уотсон (1951) доказали, что для этой статистики существуют две границы
и
(u=upper, l=low), которые зависят от
и уровня значимости
(могут быть затабулированы) такие, что
Значение
| Вывод |
| отвергается в пользу альтернативы (есть отриц. корреляция)
Неопределенность
не отвергается (корреляции нет). Как правило,
Неопределенность
отвергается в пользу (есть положит. корреляция)
|
Зона неопределенности в тесте Дарбина - Уотсона может быть достаточно широкой. Например, для n=19 k=3 получаем интервал (0.97, 1.68).

Тест Дарбина - Уотсона предполагает, что регрессоры
не коррелированны с ошибками. Поэтому этот тест нельзя применять, когда среди регрессоров есть лагированные значения зависимой переменной
, так как его результаты смещены в сторону принятия
. Т.е. для временных рядов этот тест не применим!!!
Пусть оцениваемая модель имеет вид

В этом случае можно использовать либо тест множителей Лагранжа (общий случай), либо
- тест Дарбина для проверки на автокорреляцию первого порядка.
Тест множителей Лагранжа: 
Пусть
– остатки из модели.
Оценим вспомогательную регрессию
,
и найдем величину
. Статистика
имеет асимптотически
- распределение с
степенями свободы.
статистика (автокорреляция 1 порядка:
): 
, (11)
где
– статистика Дарбина-Уотсона. При верной нулевой гипотезе (нет автокорреляции), статистика теста имеет асимптотически стандартное нормальное распределение.
«Нормальность»
Проверка остатков может производиться с помощью стандартных визуальных методов – построения гистограммы. Кроме того. пакет Eviews сообщает значения статистики Ярку - Бера
, (12)
где
– коэффициент ассиметрии,
– коэффициент эксцесса,
– число параметров в уравнении регрессии.
При верной гипотезе
(нормальность) статистика теста имеет асимптотически!!!
- распределение с двумя степенями свободы.

Так как распределение асимптотическое нельзя полагаться на результаты только этого теста для выборок малого объема
Дата добавления: 2015-07-17; просмотров: 595 | Нарушение авторских прав
| <== предыдущая страница | | | следующая страница ==> |
| или как в это играть. | | | Оценивание ARMA моделей |