Читайте также:
|
|
Очень часто при анализе данных типа временной ряд мы сталкиваемся с наличием автокорреляции и нестационарности. Визуальный анализ графика наблюдений может выявить очевидный на глаз тренд или сезонную (периодичную) компоненту или изменение разброса наблюдений с течением времени – гетероскедастичность. Все это может служить указанием на непостоянство среднего или дисперсии ряда (их зависимость от времени), то есть нестационарность изучаемого ряда. Анализ автокорреляционной функции и статистик, основанных на значениях корреляционных коэффициентов, позволяет выявить зависимость текущих значений изучаемых показателей от их предыдущих значений, то есть наличие авторкорреляции.
Замечание: Более формальные процедуры проверки на нестационарность (тесты Дики – Фуллера и Перрона, интегральная статистика ) будут рассматриваться на последующих занятиях.
Процедуры идентификации и диагностики:
Процедура подбора конкретной модели состоит из трех этапов:
1. Идентификация модели;
2. Оценивание модели;
3. Диагностика модели.
На этапе идентификации проводится предварительный анализ данных с целью выяснения возможных порядков p и q для ARMA - модели. Используемые при этом процедуры являются не вполне точными, что, впоследствии, может привести к выводу о непригодности идентифицированной модели и необходимости замены ее на альтернативную. На этом этапе можно провести пердварительную грубую оценку параметров модели.
На втором этапе проводится оценка модели с использованием эффективных статистических методов и уточнение полученных оценок.
На третьем этапе оцененная модель проверяется на адекватность имеющимся данным. Если выбранная модель не удовлетворяет критериям адекватности, запускается новый цикл подбора и т.д. до тех пор, пока не будет получена удовлетворительная модель.
Пусть предполагается, что анализируемые данные описываются ARMA(p,q) - моделью:
где - белый шум.
Автокорреляционная и частная автокорреляционная функции
Наиболее известный способ идентификации ARMA моделей основан на анализе автокорреляционной – ACF (autocorrelation function) и частной автокорреляционной – PACF (partial autocorrelation function).
Aвтокорреляционная функция (ACF) вычисляется по формуле:
(1)
где
В Eviews применяется несколько другая формула для расчета коэффициента автокорреляции
(1’)
Частная автокорреляционная функция – PACF описывает «чистую корреляцию» между и , когда устранено влияние всех промежуточных членов ряда .
Теоретически значение PACF определяются по формуле:
(2)
функций изучаемого временного ряда.
Напомним, что частный коэффициент корреляции измеряет «чистую» корреляцию между случайными величинами и при исключении влияния всех промежуточных случайных величин .
Значение находится из системы уравнений Юла-Уолкера
для решения которой используется правило Крамера.
В Eviews используется итеративная процедура вычисления значений PACF, поэтому значения
коэффициентов могут различаться.
На лекции будет показано, что
· процесс можно идентифицировать по поведению ACF, поскольку, ,
· процесс – по поведению PACF, для которой .
Идентификация модели на основе ACF и PACF является более трудной задачей поскольку при на поведение ACF влияют как , так и компоненты, но
· начиная с , поведение ACF аналогично поведению ACF для процесса.
· PACF для модели убывает подобно PACF для процесса.
При работе с реальными данными неизвестные истинные значения и заменяются их оценками и – выборочные коэффициенты корреляции,которые являются состоятельными в случае стационарной модели.
В силу того, что и это всего лишь оценки для и характер изменения реальных ACF и PACF может не воспроизводиться в их выборочных аналогах. Тем не менее в большинстве случаев поведение истинных ACF и PACF в той или иной мере отражается на поведении выборочных аналогов, что позволяет их использовать для идентификации моделей из класса ARMA.
МОДЕЛЬ | ACF | PACF |
(Белый шум) | ||
Монотонное убывание Осциллирующее убывание | ||
Убывание к нулю монотонное или осциллирующее | Зануление при | |
Положительный пик при , зануление при . Отрицательный пик при , зануление при . | Осциллирующее убывание Убывание по абсолютной величине | |
Зануление при | ||
Экспоненциальное убывание с лага 1, знак совпадает со знаком Осциллирующее убывание с лага 1, знак совпадает со знаком | Осциллирующее убывание с лага 1, Экспоненциальное убывание с лага 1, , знак совпадает со знаком , | |
Осциллирующее или монотонное убывание | Осциллирующее или монотонное убывание |
Для обоснованного выбора структуры модели хотелось бы иметь какие-нибудь статистические критерии для проверки гипотез о равенстве нулю тех или иных значений и на основании наблюдаемых значений и . Вообще говоря, это довольно нетривиальный вопрос.
Однако заметим, что в модели с константой среднее остатков равно 0, поэтому выборочная автокорреляционная функция остатков
. (3)
Если модель адекватна данным и ошибки являются белым шумом, то при больших значениях и (асимптотически) случайная величина имеет распределение близкое к нормальному . Хорошая аппроксимация достигается начиная с . Таким образом, значение вне интервала позволяет на 5% уровне значимости отвергнуть гипотезу о равенстве нулю коэффициента .
Аналогичным образом, если рассматриваемый процесс описывается моделью моделью, то при больших и распределение случайной величины близко к нормальному . И опять же значение вне интервала позволяет на 5% уровне значимости отвергнуть гипотезу о равенстве нулю коэффициента (гипотезы проверяются при каждом отдельном !!!)
Можно использовать стандартные методы проверки коэффициентов и
на значимость.
Для тестирования гипотезы используется - статистика:
, (4)
которая при верной гипотезе имеет распределение Стьюдента с степенями свободы.
Гипотеза также проверяется с помощью - критерия Стьюдента:
, (5)
где – это число устраненных переменных
Замечание: К интерпретации графиков ACF и PACF следует подходить с осторожностью.
Пусть есть процесс белого шума, . Согласно рассмотренному выше критерию, . Оценим вероятность того, что за пределы полосы выйдут значений (биномиальная модель – выход за пределы полосы=успех), где - рассматриваемое количество значений ACF: . Возьмем для примера . Т.е. вероятность выхода PACF за пределы критической полосы вовсе не мала, даже в ситуации, когда процесс моделируется как белый шум (DGP=data generating process) можно ошибочно интерпретировать модель как процесс (SM=statistical model).
Сюда же можно отнести и то обстоятельство, что в некоторых статистических пакетах, в том числе и в Eviews при расчете выборочная ковариационная функция делится не на , а на . Этот приводит к смещению оценки в сторону нуля.
- статистика
Позволяет проверить гипотезу о равенстве нулю сразу первых значений коэффициентов корреляции (нулевая гипотеза)
Существует несколько видов этой статистики:
– статистика Бокса-Пирса (6)
– статистика Льюнга- Бокса (7)
В Eviews сообщается значение статистики Льюнга – Бокса.
Если не базироваться на ARMA спецификации модели, то соответствующие величины имеют распределение с степенями свободы.
Если уже работаем в классе ARMA – моделей (диагностика свойств остатков), то распределение с степенями свободы, где и - параметры ARMA модели, оцененные ранее.
Информационные критерии
В ситуации, когда несколько ARMA моделей оказались адекватными данным, при выборе модели можно опираться на значения информационных критериев. Наиболее часто в распечатках компьютерных программ приводятся критерии AIC и SIC:
Акаике – AIC (Akaike information criterion) (8)
Шварца – SIC (Scharz information criterion) (9)
(хотя используются и другие).
Модели выбираются по минимальным значениям информационных критериев (принцип экономии мышления: чем меньше параметров в модели, тем лучше; модель ARMA с небольшими p и q предпочтительнее моделей AR или MA, с большими порядкамии, как правило, не хуже описывает данные).
Критерий Акаике это эвристическая попытка свести вместе 2 требования – уменьшение числа параметров и качество подгонки модели. Он базируется на обобщении принципа максимального правдоподобия в предположении о гауссовском распределении ошибок. AIC переоценивает порядок авторегрессии для AR модели, то есть оценка не состоятельна!!!
Критерий Шварца имеет более фундаментальное основание. Оценка порядка модели здесь является состоятельной.
Критерии AIC и SIC нередко противоречат друг другу. Поэтому при исследованиях обычно указывают на то, какой из критериев использовался.
Замечание: С другой стороны вместо выбора одной модели можно сформировать портфель моделей, включающий несколько моделей одинаковых по характеристикам. Этот портфель можно использовать для прогнозирования и описания взаимосвязей между переменными.
Критерий для выбора моделей заключается в следующем (Poskitt and Tremayne, 1987)
,
где параметры характеризуют наилучшую модель по критерию AIC. Для всех остальных моделей с параметрами рассчитывается величина - мера близости. В портфель можно включать те модели, у которых .
Статистика
Пусть ошибки в модели имеют следующий вид: где .
Проверяется гипотеза
(отсутствие корреляции)
().
Статистика Дарбина - Уотсона проверяет наличие автокорреляции 1 – го порядка!!!
(10)
Дарбин и Уотсон (1951) доказали, что для этой статистики существуют две границы и (u=upper, l=low), которые зависят от и уровня значимости (могут быть затабулированы) такие, что
Значение | Вывод |
отвергается в пользу альтернативы (есть отриц. корреляция) Неопределенность не отвергается (корреляции нет). Как правило, Неопределенность отвергается в пользу (есть положит. корреляция) |
Зона неопределенности в тесте Дарбина - Уотсона может быть достаточно широкой. Например, для n=19 k=3 получаем интервал (0.97, 1.68).
Тест Дарбина - Уотсона предполагает, что регрессоры не коррелированны с ошибками. Поэтому этот тест нельзя применять, когда среди регрессоров есть лагированные значения зависимой переменной , так как его результаты смещены в сторону принятия . Т.е. для временных рядов этот тест не применим!!!
Пусть оцениваемая модель имеет вид
В этом случае можно использовать либо тест множителей Лагранжа (общий случай), либо - тест Дарбина для проверки на автокорреляцию первого порядка.
Тест множителей Лагранжа:
Пусть – остатки из модели.
Оценим вспомогательную регрессию
,
и найдем величину . Статистика имеет асимптотически - распределение с степенями свободы.
статистика (автокорреляция 1 порядка: ):
, (11)
где – статистика Дарбина-Уотсона. При верной нулевой гипотезе (нет автокорреляции), статистика теста имеет асимптотически стандартное нормальное распределение.
«Нормальность»
Проверка остатков может производиться с помощью стандартных визуальных методов – построения гистограммы. Кроме того. пакет Eviews сообщает значения статистики Ярку - Бера
, (12)
где – коэффициент ассиметрии, – коэффициент эксцесса, – число параметров в уравнении регрессии.
При верной гипотезе (нормальность) статистика теста имеет асимптотически!!! - распределение с двумя степенями свободы.
Так как распределение асимптотическое нельзя полагаться на результаты только этого теста для выборок малого объема
Дата добавления: 2015-07-17; просмотров: 595 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
или как в это играть. | | | Оценивание ARMA моделей |