Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Настоящий лабораторный практикум направлен на освоение основных понятий и методов, изложенных в учебном пособии Мишулиной О.А. Статистический анализ и обработка временных рядов (М.:



Введение

 

Настоящий лабораторный практикум направлен на освоение основных понятий и методов, изложенных в учебном пособии Мишулиной О.А. "Статистический анализ и обработка временных рядов" (М.: МИФИ, 2004). Лабораторный практикум выполняется в статистическом пакете STATGRAPHICS Plus 5.1. Овладение возможностями этого пакета по генерации, обработке и статистическому анализу временных рядов будет весьма полезным в дальнейшей работе студентов.

Лабораторный практикум содержит 6 лабораторных работ по основным разделам курса. Перед приходом в лабораторию студент должен ознакомиться с теми разделами учебного пособия, которые изучаются в текущей лабораторной работе. Ссылки на учебное пособие даются в следующей форме: "уч. п., стр. 141-143" или "уч. п., разд. 6, 7".

Некоторые лабораторные исследования выполняются студентами по индивидуальному заданию, которое указывается преподавателем из приводимой в пособии таблицы. В частности, такое индивидуальное задание студент заранее получает перед выполнением лабораторной работы 5 "Оптимальная обработка данных линейным фильтром с конечной памятью", так как проведение лабораторного исследования требует предварительного расчета импульсной реакции оптимального фильтра.

Для быстрейшего освоения принципов работы в статистическом пакете STATGRAPHICS Plus 5.1 в лабораторном журнале приведена краткая инструкция, а в описании различных лабораторных исследований указывается путь к используемым в пакете опциям.

В лабораторном журнале приведены все необходимые формы для представления результатов лабораторных работ. Для проверки усвоения изучаемого теоретического материала следует воспользоваться контрольными вопросами в конце соответствующих разделов учебного пособия.


Краткая инструкция по работе в пакете Statgraphics Plus 5.1

 

1.Главное и текущие окна анализа данных

После загрузки Statgraphics Plus 5.1 открывается окно, содержащее главное меню статистического пакета. С помощью этого меню осуществляется загрузка/сохранение данных, документов или всего статистического проекта на жестком диске, а также вызов текущих окон анализа, которые определяет пользователь в соответствии с решаемой задачей (статистическим проектом). Количество открытых одновременно текущих окон анализа ограничивается только техническими параметрами компьютера.



В течение всего сеанса работы в пакете принудительно открыты 5 вспомогательных окон общего назначения:

· электронная таблица,

· комментарий к выполняемому статистическому проекту (<имя проекта> comments),

· помощь в интерпретации полученных результатов (StatAdviser),

· галерея текстовых и графических документов (StatGallery),

· редактор отчета по выполняемому статистическому проекту (StatReporter).

Примерами текущих окон анализа могут служить "Одномерный статистический анализ" (One-Variable Analysis), "Сглаживание временного ряда" (Smoothing), "Анализ статистических распределений" (Probability Distributions).

В пакете предоставляется возможность сохранять

· полное текущее состояние всего статистического проекта, содержащее данные, текущие окна анализа, галерею документов и комментарии (Save Stat Folio),

· только данные электронной таблицы (Save Data File),

· только содержание галереи документов (Save StatGallery) или

· только отчет по статистическому проекту (Save StatReporter).

Во избежание потери данных и результатов статистического анализа рекомендуется периодически сохранять текущие результаты в файле и закрывать окна текущего анализа после выполнения в них всех необходимых действий.

 

2.Электронная таблица

В электронную таблицу могут быть загружены данные из файла в форматах.sf3,.sf (форматы STATGRAPHICS разных версий),.txt,.xls,.dbf и в ряде других распространенных форматах. Для этого необходимо воспользоваться главным меню пакета File – Open - Open Data File…

В электронной таблице сохраняются также переменные, сгенерированные пользователем по заданным алгебраическим выражениям, и результаты расчетов в текущих окнах анализа, если в этом есть необходимость.

Каждая переменная электронной таблицы располагается в одном столбце, которому может быть присвоено заданное пользователем имя. По умолчанию переменные именуются Col_1, Col_2,…. Для изменения имени переменной нужно щелчком левой кнопки мыши в положении курсора в ячейке имени переменной (столбца) активизировать соответствующую переменную (столбец при этом выделяется черным фоном). Далее по правой кнопке мыши необходимо выйти в контекстное меню, в котором выбирается опция Modify Column и указывается новое имя и другие атрибуты переменной в открывшемся окне.

Для расчета значений переменной по алгебраической формуле после активизации этой переменной (столбца) и выхода в контекстное меню по правой кнопке мыши следует выбрать опцию Generate Data. В открывающемся после этого окне содержатся:

· строка для записи расчетной формулы (Expression),

· список содержащихся в электронной таблице переменных (Variables),

· список встроенных функций (в пакете они называются операторами Operators), которые могут использоваться в алгебраическом выражении, кроме стандартных арифметических или логических операций.

В приводимой ниже таблице указаны основные встроенные функции, которые будут использоваться при выполнении лабораторного практикума. С другими встроенными функциями можно ознакомиться в справочной системе пакета. Следует обратить внимание на то, что аргументы встроенных функций разделяются символом ";". При наборе расчетного выражения можно воспользоваться автоматическим переносом заголовка функции в позицию курсора в поле Expression двойным нажатием левой кнопки мыши в поле выбранной функции. Аналогичным образом в поле расчетного выражения переносится имя переменной из списка переменных электронной таблицы.

 

Таблица встроенных функций пакета STATGRAPHICS Plus 5.1

 

№ п/п

Оператор

Функциональное назначение

 

COUNT(N1;N2;N3)

Вычисление последовательности целых чисел от N1 до N2 с интервалом N3

 

RNORMAL(N;m;σ)

Генерация выборки N случайных значений из нормальной генеральной совокупности с характеристиками m и σ

 

RUNIFORM(N;a;b)

Генерация выборки N случайных значений, равномерно распределенных в интервале [a, b]

 

AVG(Name)

Вычисление среднего значения выборки с именем Name

 

VARIANCE(Name)

Вычисление дисперсии выборки с именем Name

 

SKEWNESS(Name)

Вычисление коэффициента асимметрии выборки с именем Name

 

KURTOSIS(Name)

Вычисление эксцесса выборки с именем Name

 

SQRT(Name)

Вычисление квадратного корня из числа Name или каждого значения переменной с этим именем

 

SIZE(Name)

Определение длины переменной с именем Name

 

MAX(Name)

Вычисление максимального значения переменной с именем Name

 

MIN(Name)

Вычисление минимального значения переменной с именем Name

 

NORMAL(x;m;σ)

Вычисление функции распределения вероятностей нормального закона с параметрами m и σ при значении аргумента x

 

INVNORMAL(p;m;σ)

Вычисление аргумента функции распределения вероятностей x нормального закона с параметрами m и σ при значении вероятности p

(обратная функция распределения вероятностей)

 

STANDARDIZE(Name)

Стандартизация (нормирование) выборки с именем Name

 

COS(Name)

Вычисление косинуса числа Name или каждого значения переменной с этим именем. Аргумент указывается в градусах.

 

SIN(Name)

Вычисление синуса числа Name или каждого значения переменной с этим именем. Аргумент указывается в градусах.

 

DIFF(Name)

Вычисление первых разностей переменной Name

 

DROP(Name;k)

Удаление первых k строк переменной Name

 

DROPLAST(Name;k)

Удаление последних k строк переменной Name

 

JOIN(Name1;Name2)

Объединение переменных Name1 и Name2 (состыковывает две последовательности значений переменных)

 

JOIN3(Name1;Name2;Name3)

Объединение переменных Name1, Name2 и Name3 (состыковывает три последовательности значений переменных)

 

JOIN4(Name1;Name2;Name3; Name4)

То же, что JOIN() и JOIN3(), но для четырех переменных

 

LAG(Name;k)

Для положительного целого числа k выполняется смещение значений переменной Name на k строк вниз (впереди остаются k пустых строк). Для отрицательного аргумента k - смещение значений переменной Name на k строк вверх (удаляются первые k значений переменной)

 

REP(Name;k)

Повторение каждого значения переменной Name k раз.

 

SUM(Name)

Вычисление суммы всех значений переменной Name

 

 

Пример 1

Рассчитывается значение линейно нарастающей переменной (временного ряда) x6 длины 6, на которую аддитивно наложен белый нормально распределенный шум (переменная noise).

noise: 0.41 0.82 -1.31 0.05 -0.28 1.29

Expression: 2.5*COUNT(0;5;1) + noise

x6: 0.41 3.32 3.69 7.55 9.72 13.79

Пример 2

Генерируются значения временного ряда imp10, который представляет собой импульсный сигнал общей длины 10.

Expression: JOIN3(REP(0;3);REP(1;4);REP(0;3))

imp10: 0 0 0 1 1 1 1 0 0 0

Пример 3

Имеется переменная k, которая является дискретным временем с интервалом дискретности 1. Генерируется синусоидальный временной ряд (переменная si100) длины 100 с наложенным на него нормально распределенным центрированным белым шумом заданной интенсивности 0.01 (стандартное отклонение 0.1).

k: 1 2 3 4... 98 99 100

Expression: SIN(12*k+30)+RNORMAL(100;0;0.1)

Пример 4

Вычисляется грубая оценка m_noise математического ожидания случайной выборки (переменная noise).

noise: 0.41 0.82 -1.31 0.05 -0.28 1.29

Expression: (MAX(noise)+MIN(noise))/2

m_noise: 0.01

Пример 5

Вычисляется переменная index6, которая отмечает значением 1 факт выхода переменной noise за пределы коридора [-0.8, 0.8].

noise: 0.41 0.82 -1.31 0.05 -0.28 1.29

Expression: (noise>0.8)|(noise<-0.8)

index6: 0 1 1 0 0 1

Пример 6

Вычисляется среднеарифметическое значение mean_noise переменной noise при произвольной длине этой переменной.

noise: 0.41 0.82 -1.31 0.05 -0.28 1.29

Expression: SUM(noise)/SIZE(noise)

mean_noise: 0.163

Пример 7

Вычисляется переменная noise_2, значения которой являются полусуммой двух последовательных значений переменной noise.

noise: 0.41 0.82 -1.31 0.05 -0.28 1.29

Expression: (noise+LAG(noise;-1))/2

noise_2: 0.615 -0.245 -0.63 -0.115 0.505

Длина переменной noise_2 на 1 меньше длины переменной noise.

 

3.Графическое представление данных

Переменные электронной таблицы могут быть визуализированы с помощью различных графических опций пакета Statgraphics Plus 5.1. В лабораторном практикуме используются опции X-Y Plot для визуализации одной функции в поле графического документа и Multiple X-Y Plot - для нескольких функций. Доступ к этим опциям осуществляется с помощью пунктов Plot – Scatterplots главного меню. Другие графические документы автоматически создаются в текущих окнах анализа в соответствии с выполняемой функцией обработки данных.

Размер графического документа на экране может изменяться двойным нажатием левой кнопки мыши в поле графика. В пакете пользователю предоставляются широкие возможности по редактированию графического документа. Для этого нужно по правой кнопке мыши выйти в контекстное меню. Пункт Pane Options этого меню, кроме разметки точек графика по значениям другой переменной (эта опция не используется в лабораторном практикуме), дает возможность выбрать режим соединения точек функции линиями или их отдельной визуализации. Пункт Graphics Options дает возможность изменить цвета, разметку осей, толщину линий, форму и размер меток, установить масштабную решетку, изменить заголовок графика и пр. Используя в окне Graphics Options закладку Profile, можно сохранить установленные опции графика для следующих сеансов работы в пакете.

Заголовок графика, наименования осей, оцифровка осей, поле графика, функциональные кривые и точки являются отдельными объектами и для их редактирования необходимо сначала выделить редактируемый объект нажатием левой кнопки мыши (объект выделяется квадратными метками на его границах), а затем выйти в контекстное меню по правой кнопке мыши.

Следует обратить внимание на то, что при определении переменных в окне Input Dialog по вертикальной и горизонтальной осям графика могут указываться не только имена переменных из электронной таблицы, но и произвольные алгебраические выражения. Это дает возможность простой реализации сдвига кривых по вертикали или горизонтали (существенно при визуализации нескольких функциональных зависимостей), если он облегчает визуальный анализ.

Если выводимые на графический документ функциональные зависимости в режиме Multiple X-Y Plot имеют принципиально разные диапазоны значений, то рекомендуется воспользоваться возможностью оцифровки части кривых по левой вертикальной оси (Left Axis), а другой части – по правой (Right Axis).

 

4.Пользовательский интерфейс текущего окна анализа

Каждое текущее окно анализа имеет заголовок. В текстовой части окна отражены основные параметры, определенные пользователем при работе в этом окне или характеризующие указанные пользователем переменные. Обычно в тексте указаны также те значения параметров обработки, которые в данном окне приняты "по умолчанию" и могут быть изменены пользователем. Содержание выполняемой в текущем окне обработки, необходимые действия пользователя и интерпретация результата обработки указываются в тексте под заголовком The Advisor.

В верхней части окна текущего анализа имеются 4 основные рабочие кнопки и несколько вспомогательных. Первая кнопка Input Dialog (красная) дает возможность визуализировать или изменить значения переменных и параметров, которые были определены пользователем при входе в данный режим обработки. Этой возможностью удобно воспользоваться, если пользователю необходимо многократно выполнить одну и ту же операцию для разных переменных или условий. Вторая кнопка Tabular Options (желтая) предоставляет выбор операций статистической обработки (одной или нескольких одновременно) в рамках выбранного режима. Третья кнопка Graphical Options (синяя) дает возможность подключить к анализу графические документы, предлагаемые пакетом в выбранном режиме обработки. Четвертая кнопка Save Results (дискета на черном фоне) позволяет сохранить в электронной таблице рассчитанные в текущем окне анализа переменные (можно выбрать любой набор из предлагаемого списка переменных).

По правой кнопке мыши в каждом текущем окне анализа можно выйти в контекстное меню. Содержание контекстного меню зависит от положения курсора в текстовой или графической части текущего окна анализа. Среди предлагаемых в контекстном меню возможностей следует обратить внимание на Pane Options и Analysis Options. С их помощью устанавливаются условия обработки данных и определяются числовые значения параметров.


Общее знакомство с пакетом Statgraphics.

Генерация временных рядов

 

Первая лабораторная работа служит достижению двух главных целей:

- ознакомление с основными понятиями и определениями теории случайных временных рядов (уч. п., разд. 1) и

- генерация и визуальное представление случайных временных рядов в пакете STATGRAPHICS Plus 5.1.

В работе будет сгенерирована реализация случайного временного ряда, математическая модель которого задана формулой (уч. п., стр. 9):

,

где k –индекс дискретного времени, lk – тренд, pk – низкочастотные случайные колебания, sk – сезонные колебания, åk – случайные незакономерные движения (белый шум), ãk – грубые сбои регистрации временного ряда.

Перед началом работы студент получает индивидуальное задание, содержащее параметры генерируемого временного ряда. Варианты индивидуальных заданий представлены в Таблице.

Тренд lk рассматривается как параметрический полиномиальный временной ряд. Для его генерации используется следующая формула:

где r - порядок полинома, k - индекс дискретного времени, N – длина временного ряда, а - случайные величины, равномерно распределённые в интервале . Значения параметров моделируемой реализации lk студент найдет в Таблице по номеру варианта своего индивидуального задания.

Низкочастотные случайные колебания pk генерируются в работе как результат обработки белого шума низкочастотным линейным фильтром (EWMA - фильтр). Подробно свойства этого фильтра будут исследованы в лабораторной работе 4 (уч. п., разд. 5). Значение параметра ë EWMA – фильтра указано в индивидуальном задании.

Сезонные колебания sk генерируются как синусоидальная функция заданной круговой частоты ù, начальной фазы ϕ и амплитуды A. Значения этих параметров также указаны в индивидуальном задании.

Случайные незакономерные колебания (помеха) åk являются абсолютно случайным временным рядом (белым шумом).

Для генерации грубых сбоев ãk регистрации временного ряда задаются два параметра: вероятность сбоя в одном временном сечении pсб и интенсивность сбоев (амплитуда) â.

 

Таблица вариантов индивидуальных заданий

п/п

Параметры

Варианты

         
 

Порядок полинома тренда

         

 

b01

 

b02

 

b11

b12

-30

-20

-5

-10

-5

-25

-15

-15

 

b21

b22

         
 

b31

b32

         
 

ë

0.2

0.25

0.1

0.07

0.15

 

ù

         
 

A

       

2.5

 

ϕ

 

-135

   

-20

 

Вероятность сбоя в одном временном сечении pсб

0.05

0.065

0.07

0.045

0.09

 

Интенсивность сбоев (амплитуда) â

 

2.5

0.8

1.5

 

 

При моделировании устанавливается автоматическая связь интенсивности компонентов pk, sk, åk, ãk с диапазоном значении тренда lk. Это достигается предварительным умножением каждого из компонентов pk, sk, åk, ãk на масштабный коэффициент range = или ì = range*0.03. Значение параметра ì может быть изменено преподавателем.

Данные, сгенерированные при выполнении лабораторной работы 1, будут использоваться в следующих лабораторных работах, поэтому должны быть сохранены в файле.

ВАРИАНТ № ____

 

1.1 Генерация тренда временного ряда

а) Сгенерируйте целочисленную переменную k, которая изменяется от 1 до 100 и в дальнейшем будет использоваться как индекс дискретного времени для временного ряда длины N=100. Воспользуйтесь для этого встроенной функцией COUNT(;;). Запишите аргументы функции:

 

COUNT(;;)

 

б) Сгенерируйте случайные значения b0,b1 ,b2 и b3 (переменные B0, B1, B2 и B3), равномерно распределенные в заданных интервалах. Найдите соответствующую функцию в таблице встроенных функций. Запишите расчетное выражение для переменной B0:

 

 

 

 

в) Напишите расчетное выражение для генерации тренда временного ряда lk (переменная trend) с указанием числовых значений всех параметров.

 

 

 

г) Рассчитайте размах тренда range и масштабный коэффициент ì (переменные range и scale соответственно).

 

 

 

д) Постройте график тренда как функции дискретного времени, сделайте разметку осей координат и укажите их наименование:

 

 

 

е) Сохраните график в отчетном документе (StatGallery).

ж) Сохраните сгенерированные данные в файле с уникальным именем. Запишите путь к файлу данных:

 

 

 

1.2 Генерация реализаций абсолютно случайного временного ряда

а) Создайте переменную noise1, которая содержит значения нормально распределенного центрированного белого шума с постоянной интенсивностью d=1. Напишите расчетное выражение:

 

 

 

б) Выведите на экран график переменной noise1 как функцию дискретного времени k.

в) Сохраните график в отчетном документе (StatGallery).

г) Создайте еще 3 независимые реализации нормально распре-деленного центрированного белого шума с постоянной интенсивностью d=1 (переменные noise2, noise3, noise4), которые вместе с noise1 будут необходимы для генерации временных рядов pk, åk и ãk.

д) Воспользуйтесь опцией Multiple X-Y Plot для одновременного вывода на экран четырех реализаций белого шума. Чтобы избежать наложения графиков, выполните их смещение друг относительно друга на 5 (см. инструкцию). Изучите на примере этого графика возможности пакета STATGRAPHICS Plus 5.1 по редактированию графического представления данных.

е) Сохраните графический документ в StatGallery.

ж) Сохраните электронную таблицу в файле.

 

1.3 Генерация временных рядов pk, sk, åk

а) Для моделирования низкочастотного случайного компонента pk (переменная slow) производится сглаживание реализации белого шума noise1 линейным фильтром EWMA. С этой целью следует воспользоваться опцией Special – Time-Series Analysis – Smoothing. Укажите для проведения анализа реализацию noise1. Далее в окне Tabular Options укажите опцию Data table и нажатием на правую кнопку мыши в Pane Options выберите фильтр EWMA в качестве первого из двух последовательно применяемых к noise1 фильтров. Отказ от второго фильтра достигается указанием опции none. Введите значение параметра ë, указанное в индивидуальном задании.

После выполнения указанных операций на экран будет выведен результат сглаживания (если график не выводится автоматически, нужно задать соответствующую опцию по кнопке Graphical Options в текущем окне анализа).

Далее выполняется сохранение в электронную таблицу результата сглаживания. По кнопке Save Results текущего окна анализа определяется сохраняемая переменная (SMOOTH) и имя в электронной таблице (slow).

Обновите значения полученной переменной, умножив её на масштабный коэффициент scale.

б) Постройте средствами STATGRAPHICS Plus 5.1 график переменной slow после масштабирования и сохраните его в отчетном документе (StatGallery). Зафиксируйте график в лабораторном журнале:

 

 

в) Напишите расчетное выражение и выполните расчет сезонного компонента sk (переменная season) с учетом масштабного коэффициента scale:

 

 

 

г) Постройте средствами STATGRAPHICS Plus 5.1 график переменной season и сохраните его в отчетном документе (StatGallery). Зафиксируйте график в лабораторном журнале:

 

 

 

д) Для генерации компонента åk (переменная rand) следует умножить переменную noise2 на масштабный коэффициент scale.

е) Постройте и сохраните график переменной rand в StatGallery.

ж) Сохраните электронную таблицу в файле.

 

1.4 Моделирование грубых сбоев измерений

а) Модель временного ряда грубых сбоев измерений характеризуется тем, что ненулевые значения появляются в отдельных временных сечениях. Этот временной ряд управляется двумя параметрами: частотой сбоев (ненулевых значений) и интенсивностью сбоев (случайной амплитудой сбойных значений).

Возможны различные способы генерирования сигнала грубых сбоев . Рассмотрим следующую модель, которая использует реализацию независимых, нормально распределенных и центрированных случайных величин с заданным стандартным отклонением 1 (переменная noise2). Для определения моментов сбоев используется логическая формула:

где - параметр, управляющий частотой сбоев. При á=1.645 значение yk =1 будет наблюдаться примерно в 5% точек от длины реализации N (pсб=0.05). Эти точки будем считать сбойными. Для вычисления á по заданному значению параметра pсб следует выбрать опцию Plot - Probability Distribution и в открывшемся окне Input Dialog выбрать нормальное распределение вероятностей (Normal). Далее по кнопке Tabular Options (желтая) выбрать опцию Inverse CDF (обратная функция распределения вероятностей), при этом следует отказаться от других активных опций. В контекстном меню, которое активизируется по правой кнопке мыши, выбирается Pane Options и задается числовое значение вероятности (1-pсб) в соответствии с индивидуальным заданием. Полученное значение обратной функции распределения вероятностей и является искомым значением á (следует проверить в окне Analysis Options, что параметрами нормального закона являются m=0 и ó=1).

Для моделирования собственно сбойного значения воспользуемся другой реализацией независимых, нормально распределенных и центрированных случайных величин с заданным стандартным отклонением 1 (переменная noise3). Моделируемый временной ряд грубых сбоев рассчитывается теперь по следующей формуле: ãk = *range* * yk.

б) Выполните все расчеты, описанные в предыдущем пункте, и запишите результат вычислений временного ряда грубых сбоев в электронной таблице под именем out. Зафиксируйте в лабораторном журнале вычисленное значение параметра á: _ á= ____

в) Постройте графики временных рядов out и trend+out и убедитесь визуально в правильности построенной модели грубых сбоев. Укажите в лабораторном журнале число сбоев и опишите их особенности (одиночные, сдвоенные, только положительные или разнополярные, резко выделяются на графике тренда или несущественны).

 

 

 

 

г) Сохраните графики в StatGallery.

д) Сохраните электронную таблицу в файле.

 

 

1.5 Генерация обобщенной реализации временного ряда

а) В заключение лабораторной работы вычисляется реализация временного ряда (переменная model) как сумма временных рядов (переменные trend, slow, season, rand и out).

б) Постройте график временного ряда model и сохраните его в StatGallery.

 

 

 

в) Сохраните электронную таблицу и StatGallery в файлах.

г) Закройте все окна текущего анализа данных.

д) Завершите работу в пакете STATGRAPHICS.

 

Дата выполнения работы ______________

 

Подпись преподавателя _______________________

 


Статистический анализ

стационарных временных рядов

 

В лабораторной работе 2 студенты осваивают основы теории стационарных эргодических временных рядов (уч. п., разд. 1, 2) и практические средства их статистического анализа в пакете STATGRAPHICS Plus 5.1. Особенность этого класса временных рядов состоит в возможности построения оценок их статистических характеристик по одной реализации.

Перед исследованием свойств стационарных эргодических временных рядов студенты генерируют их реализации в соответствии с индивидуальным заданием. На модельных данных коррелированных временных рядов и белых шумов изучаются статистические характеристики (описательные статистики), связанные с законом распределения вероятностей первого порядка, и корреляционная функция, определяемая законом распределения вероятностей второго порядка. В результате выполнения лабораторной работы студенты должны освоить технику статистического анализа временного ряда и средства визуализации его характеристик.

ВАРИАНТ № ____

 

2.1 Подготовка данных для статистических исследований

В работе изучаются статистические характеристики пяти временных рядов, параметры которых определяются индивидуальным заданием:

- x1 = á1*noise1+á2 ,

- x2 = â1* (x1)2 + â2* (x1) + â3,

- x3 – результат генерации выборки независимых равномерно распределенных значений в интервале [ã1, ã2],

- x4 – переменная slow, созданная в первой работе,

- x5 – результат вычисления по формуле

,

где k – индекс дискретного времени.

 

Таблица вариантов индивидуальных заданий

 

№ п/п

 

Параметры

 

Варианты

 

                   
 

á1

-2

   

2.5

-4

-1.5

-2.5

-1

-3

 
 

á2

   

-5

-3

   

-6

     
 

â1

   

-3.5

-3

 

-4

5.5

2.5

-4

 
 

â2

-1

0.2

0.25

 

0.3

0.1

0.5

0.4

0.3

-2

 

â3

         

-5

-3

   

0.5

 

ã1

   

-5

-10

           
 

ã2

                   
 

n1

-2

-2

-3

   

-1

     

-2

 

n2

                   
 

a-3

-

-

0.8

-

-

-

-

-

-

-

 

a-2

0.2

0.6

0.2

-

-

-

-

-

-

0.2

 

a -1

0.2

0.4

-0.15

-

-

1.3

-

-

-

0.5

 

a 0

0.2

0.2

-0.05

0.9

-

0.5

-

-

0.9

1.0

 

a 1

0.2

0.0

0.1

0.3

0.6

0.1

-

-

0.4

0.5

 

a 2

0.2

-0.2

0.3

-0.1

0.4

-0.1

0.6

1.1

0.0

0.2

 

a 3

-

-

-

-0.2

0.0

 

0.4

0.6

-0.3

0.1

 

a 4

-

-

-

0.1

-0.4

0.1

0.2

0.3

-0.1

-

 

a 5

-

-

-

-

-0.6

0.3

 

0.1

-

-

 

a 6

-

-

-

-

-

-

-0.2

-0.2

-

-

 

а) Напишите расчетные выражения для переменных x1 – x5 с учетом синтаксиса языка пакета STATGRAPHICS Plus 5.1 и числовых значений параметров алгебраических выражений своего индивидуального задания.

 

Переменные

Расчетные выражения

x1

 

 

x2

 

 

x3

 

x4

 

 

x5

 

 

 

 

б) Сгенерируйте переменные x1 – x5 в электронной таблице.

Для моделирования реализации x5 воспользуйтесь оператором LAG(;) пакета STATGRAPHICS. Отредактируйте полученные данные в электронной таблице так, чтобы они не содержали неопределенных значений (пустых клеток) в первых строках.

в) Постройте графики временных рядов x1 – x5 и сохраните их в StatGallery.

 

2.2 Анализ одномерного закона распределения вероятностей

а) Сгенерируйте и изучите таблицу частот для переменной (временного ряда) x1. Для этой цели откройте текущее окно анализа: Describe - Numeric Data - One-Variable Analysis. Далее выберите опцию Frequency Tabulation в меню Tabular Options. Проварьируйте число классов (контекстное меню, Pane Options) и проанализируйте результат. Зафиксируйте таблицу частот для 8 классов.

Установите графическое представление гистограммы переменной x1 (кнопка Graphical Options текущего окна анализа). Выведите на экран гистограммы локальных и накопленных относительных частот (контекстное меню, Frequency Pane Options) для переменной x1.

Зафиксируйте в лабораторном журнале таблицу частот для 8 классов и гистограммы локальных и накопленных относительных частот. Отметьте на рисунках оси координат, нанесите масштабную сетку.

Сохраните гистограммы и таблицу частот в StatGallery. Перед сохранением таблицы частот отредактируйте текстовое окно, удалив из него ненужный комментарий и изменив шрифт.

 

Таблица частот для переменной x1

№ класса

Нижняя граница интервала

Верхняя граница интервала

Середина интервала

Абсолютная частота

Относительная частота

Накопленная абсолютная частота

Накопленная относительная частота

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Гистограмма Гистограмма

локальных относительных частот накопленных относительных частот

 

 

 

в) Проведите аналогичный анализ одномерных законов распределения вероятностей временных рядов x2 – x5. Результаты сохраните в StatGallery.

 

2.3 Сравнение экспериментального и теоретического

распределений вероятностей

а) Проведите для временного ряда x1 качественный сравнительный анализ экспериментального и теоретического распределений вероятностей с применением опции Describe - Distributions - Distribution Fitting. Укажите в контекстном меню теоретический закон распределения вероятностей, с которым проводится сравнение экспериментального закона (нормальный Normal). В окне Tabular Options выберите Goodness-of-Fit Tests. График плотности распределения вероятностей теоретического закона, который накладывается на гистограмму, соответствует экспериментальным оценкам математического ожидания и дисперсии, вычисленным по выборочным данным (используется графическая опция Frequency Histogram).

Исследуйте результат графического построения от числа классов (например, 5, 8 и 12). Зафиксируйте один из графиков, подпишите оси, сделайте их разметку, выделите классы.

Имя переменной: X1 Число классов:8

 

 

 

Сохраните график в StatGallery.

Результат качественного сравнения теоретического и экспериментального законов распределения вероятностей первого порядка для переменной x1 зафиксируйте в первой строке приводимой ниже таблицы.

б) Проведите аналогичные исследования для временных рядов x2 – x5. Качественный результат визуального анализа представьте в строках 2 – 5 таблицы.

 

 

№ п/п

Имя переменной

Теоретический

закон

Соответствует

теор. закону?

Допущена

ошибка

анализа?

 

x1

 

 

 

 

x2

 

 

 

 

x3

 

 

 

 

x4

 

 

 

 

x5

 

 

 

 

 

2.4 Изучение описательных статистик стационарного

эргодического временного ряда

а) Для изучения описательных статистик временных рядов x1 – x5 воспользуйтесь опцией Describe - Numeric Data - Multiple-Variable Analysis, которая позволяет одновременно анализировать несколько временных рядов. Укажите в окне Input Dialog все переменные x1 – x5. Далее в меню Tabular Options выберите опцию Summary Statistics, а в меню Graphical Options откажитесь от вывода графиков. Состав описательных статистик, выводимых в текущее окно анализа, может быть изменен с помощью контекстного меню (Pane Options). Внесите результаты расчета в приводимую ниже таблицу. Заполните также в таблице ячейки, предназначенные для указания теоретических значений математического ожидания и дисперсии временных рядов x1 и x3, выполнив для этого необходимые расчеты.

Проведите качественное сравнение теоретических и экспериментальных характеристик (m и d) для реализаций x1 и x3 (блоки 1 и 2 таблицы).

В блоке 3 таблицы укажите грубые оценки математического ожидания и дисперсии, рассчитанные по формулам:

.

В блоках 4 и 5 таблицы знаками «+» или «-» укажите Ваш ответ на поставленные вопросы.

 

Таблица результатов анализа описательных статистик

для временных рядов x1 – x5

 

 

x1

x2

x3

x4

x5

 

 

 

 

Теоретическое

мат. ожидание

 

 

 

 

 

Среднее

значение

 

 

 

 

 

Результат

сравнения

 

 

 

 

 

 

 

Теоретическая

дисперсия

 

 

 

 

 

Оценка дисперсии

 

 

 

 

 

Результат

сравнения

 

 

 

 

 

 

Стандартное отклонение

 

 

 

 

 

Максимальное значение

 

 

 

 

 

Минимальное значение

 

 

 

 

 

Размах значений временного ряда

 

 

 

 

 

Грубая оценка мат. ож.

 

 

 

 

 

Грубая оценка дисперсии

 

 

 

 

 

 

 

Стандартизованный коэф. асимметрии

 

 

 

 

 

Соответствуют ли данные симметричному з.р.в.?

 

 

 

 

 

 

 

Стандартизованный эксцесс

 

 

 

 

 

Соответствуют ли данные эксцессу нормального з.р.в.?

 

 

 

 

 

 

2.5 Исследование автокорреляционной функции

стационарного временного ряда

а) Проведите анализ автокорреляционной функции временного ряда x1. Для этого воспользуйтесь опцией Special – Time Series Analysis – Descriptive Methods. В меню Tabular Options выберите Autocorrelations, а в Graphical Options - Horizontal Time Sequence Plot и Autocorrelation Function. Сохраните график в StatGallery и зарисуйте в лабораторном журнале.

 

Временной ряд x1

 

Автокорреляционная функция r временного ряда x1

 

 

Обратите внимание на границы области допустимых значений для автокорреляционной функции , (уровень значимости ) при проверке статистической гипотезы . Проведите анализ числа значений , которые значимо отличаются от нуля.

Интервал корреляции временного ряда x1 равен _______, откуда следует вывод, что временной ряд x1 (является / не является) белым шумом.

б) Проведите аналогичный анализ автокорреляционной функции временных рядов x2 – x5 (при переходе к анализу каждого следующего временного ряда изменяется имя анализируемой переменной в окне Input Dialog).

Результаты анализа зафиксируйте в лабораторном журнале.


 

Временной ряд x2

 

 

Автокорреляционная функция r временного ряда x2

 

 

Временной ряд x3

 

Автокорреляционная функция r временного ряда x3

 

 

 

Временной ряд x4

 

 

Автокорреляционная функция r временного ряда x4

 

 

Временной ряд x5

 

 

Автокорреляционная функция r временного ряда x5

 

 

 

Значение интервала корреляции

Является ли временной ряд белым шумом?

x1

 

 

x2

 

 

x3

 

 

x4

 

 

x5

 

 

 

 

в) Сохраните данные в файле, закройте текущие окна анализа и завершите работу в пакете.

 

 

Дата выполнения работы ______________________

 

Подпись преподавателя _______________________


Дата добавления: 2015-08-28; просмотров: 120 | Нарушение авторских прав




<== предыдущая лекция | следующая лекция ==>
Измерение размеров дефектов и параметров сварного шва | Исследование схем включения полевых транзисторов.

mybiblioteka.su - 2015-2024 год. (0.269 сек.)