Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Парна лінійна регресія

Читайте также:
  1. ІV. В наведеній нижче таблиці знайдіть відповідність: якому загальнодидактичному принципу навчання відповідає певне правило (парна форма роботи).
  2. Лінійна алгебра
  3. САПТАПАРНА
  4. Тема 2. Парная линейная регрессия и корреляция
  5. Трехступенчатая вакуум-выпарная установка
  6. ТРОПА К ПАРНАСУ

Приклад 1.1. Для визначення рівня впливу собівартості продукції на чистий прибуток підприємства необхідно побудувати економетричну лінійну модель, яка характеризує залежність між цими показниками, на основі такої інформації(таблиці 1.1).

 

Таблиця 1.1 – Вихідні дані для побудови економетричної моделі

Х - собівартість продукції (тис. грн.) Y— чистий прибуток (тис, грн.)
   
  1,1
  1,4
  1,5
  1,8
  2,1
  2,3
  2,5
  3,2
Прогноз 400 ?

Ідентифікуємо дані: Y – чистий прибуток (залежний фактор); Х – собівартість продукції (незалежний фактор).

Специфікуємо економетричну модель лінійною функцією виду:

Y = a0 + a1X + и, (1.1)

 

де а0, а1 – коефіцієнти лінійної моделі, и – випадкова складова.

Здійснимо параметризацію економетричної моделі. Визначимо параметри економетричної моделі трьома способами.

Спосіб 1. Для того, щоб обчислити параметри лінійної регресії, в MS Excel передбачена вбудована функція ЛИНЕЙН (Y; X; константа; статистика), яка обчислює основні параметри регресії (коефіцієнти регресії, стандартні похибки коефі­цієнтів, коефіцієнт детермінації, стандартну похибку, критерій Фішера, суму квадратів різниць між фактичним та середнім значенням фактору Y та суму квадратів залишків). Обравши вихідні дані (таблиця 1.1) результативного показника Y та факторної ознаки X, значення константи та статистики дорівнюють 1, що означає ИСТИНА або 1. тоді а 0 і натиснемо клавіші Ctrl+Shift+Enter. Всі інші параметри можуть бути обчислені згідно означень.

Застосувавши функцію ЛИНЕЙН, одержимо:

 

0,009644 0,059391
0,00072 0,144609
0,962398 0,148685
179,1626  
3,960804 0,154751

 

У результаті обчислень отримано:

коефіцієнти регресії: a1 = 0,009644, а0 = 0,0594;

стандартні похибки коефі­цієнтів: Sa1= 0,00072, Sa0= 0,144609;

коефіцієнт детермінації: R2 = 0,9623984, стандартна похибка: Е = 0,148685;

критерій Фі­шера: F=179,1626, n-k= 7;

сума квадратів різниць між фактичним та середнім значенням фактору Y: S2рег=3,960804, сума квадратів залишків S2зал=0,154751.

Отже, економетрична модель має вигляд:

 

(1.2)

Спосіб 2. Невідомі параметри а0 і a1, економетричної лінійної моделі 1.1 шукаємо за формулою:

 

(1.3)

 

Розглянемо методику обчислень формул за допомогою вбудованих її Excel функцій.

 

Таблиця 1.2 – Алгоритм розрахунку параметрів моделі матричним способом

Математична формула Формула в Excel
ХT =ТРАНСП(А3:В11) (1)
XTX =МУМНОЖ(ТРАНСП(А3:В11);А3:В11) (2)
ТХ)-1 =МОБР(МУМНОЖ(ТРАНСП(А3:В11);А3:В11) (3)
ТХ)-1ХТ =МУМНОЖ(МОБР(МУМНОЖ(ТРАНСП(А3:В11);А3:В11));ТРАНСП(А3:В11)) (4)
ТХ)-1ХТY =МУМНОЖ(МУМНОЖ(МОБР(МУМНОЖ (ТРАНСП (А3:В11);А3:В11));ТРАНСП(А3:В11));С3:С11) (5)

 

Для застосування матричного способу визначення параметрів економетричної моделі виділимо будь-які пусті комірки (наприклад А15:А16), введемо за допомогою Мастера функцій формулу (5) і натиснемо клавіші Ctrl+Shift+Enter.

В результаті отрима­ємо значення матриці А=(а01)Т: в комірці А15 число 0,0594, а в комірці А16 число 0,0096.

Отже, а0 =0,0594; a1 =0,0096 і економетрична модель має вигляд

Спосіб 3. Заносимо вихідні дані у таблицю 1.3 (графи 2 і 3). Обчислюємо Xі2 (графа 4), XiYi (графа 5), (графа 6), (графа 7), (графа 8), (графа 9), (графа 13).

Таблиця 1.3 – Оцінка параметрів лінійної регресії

 

Мінімізуючи функцію суми квадратів відхилень фактичних значень від розрахункових, отримаємо систему алгебраїчних рівнянь для знаходження невідомих параметрів а0 і a1 економетричної лінійної моделі 1.1 Y=а0+a1X+u за формулами:

 

(4.1)
(1.4)

 

Розв'язком системи є параметри а0 =0,0594; a1 =0,0096.

Економетрична модель має вигляд

Знаходимо Yp та заповнюємо стовпець 10, табл. 1.3.

Будуємо точковий графік залежності між величинами X, Y, (рис. 1.1).

Рисунок 1.1 - Залежність між величинами X, Y,

 

Обчислимо для однофакторної лінійної регресії коефіцієнт кореляції Rxy за формулою:

 

(4.2)
(1.5)

 

Коефіцієнт кореляції Rxy можна також знайти використовуючи вбудовану функцію КОРРЕЛ (массив1; массив2), де массив1 – це фактичні зна­чення вихідного масиву Х; массив2 – фактичні значення вихідного масиву Y.

Знайдене значення вказує на щільний прямий зв'язок між показником і фактором: із зменшенням собівартості продукції прибуток зростає.

Обчислимо коефіцієнт детермінації R2 за формулами:

 

(4.3)
(1.6)

(1.7)

Бачимо, що . Цей показник показує скільком відсоткам варіація залежної змінної визначається варіацією незалежних змінних. Чим ближче значення коефіцієнта детермінації до одиниці, тим тіснішим є зв’язок.

 

Дослідимо статистичну значущість коефіцієнта детермінації за допомогою F-критерію:

 

(4.4)
(1.8)

 

де т – число незалежних змінних у рівнянні регресії;

п – число спостережень.

 

Для рівня значущості =0,05 і ступенів вільності знаходимо в таблиці F-розподілу Фішера табличне значення =5,59.

Для обчислення табличного значення критерію Фішера скорис­тає­мося вбудованою в MS Excel функцією FРАСПОБР, де вероятность=0,05; степени_свободы1=k-1=1; степени_свободы2 = n-k = 7. Одержимо табличне значення критерію Фішера Fтаб = 5,59.

Оскільки FR=179 значно перевищує , то можна вважати, що коефіцієнт детермінації статистично значимий і включені у регресію фактори достатньо пояснюють стохастичну залежність показника.

Оскільки, Fроз > Fтаб, то отримана економетрична модель достовірна, або така, що відповідає статистичним даним. Згідно з кри­терієм Фішера, отримана модель достовірна.

 

Обчислимо залишкову дисперсію:

 

(4.6)
(4.5)
(1.9)

 

Гіпотезу про рівень значущості зв'язку між залежною і не залежною змінними перевіримо за допомогою F-критерію:

 

(4.7)
(1.10)

 

Для рівня значущості =0,05 і ступенів вільності знаходимо в таблиці F -розподілу Фішера табличне значення Fтабл=5,59.

Оскільки F=22,2 перевищує Fтабл, то гіпотеза про істотність зв'язку між залежною і незалежними змін­ними економетричної моделі підтверджується.

 

Оцінимо згідно з t-критерієм Стьюдента значущість коефіцієнтів мо­делі а1 та а0.

За означенням t-критерії для коефіцієнтів а1 та а0:

 

= 13,38516; = 0,4107. (1.11)

 

Порівняємо одержані t-критерії для коефіцієнтів моделі з таб­личним значенням критерію Стьюдента. Для обчислення табличного значен­ня можна скористатися вбудованою функцією СТЬЮДРАСПОБР на рівні значимості 0,05 та числом ступенів віль­ності n-k=7: tтаб = 2,364624.

Оскільки, ta1>tтаб, то отримане значення коефіцієнта а1 достовірне з ймовірністю 0,95.

Оскільки, ta0<tтаб, то отримане значення коефіцієнта а0 статистично не відрізняється від 0. Це значить, що отримана оцінка коефіцієнта а0 є не точною, або зміщеною, що свідчить, можливо, про недостатню кіль­кість спостережень (n=9).

Достовірним є значення коефіцієнта а1 згідно з критерієм Стьюдента. Згідно з цим критерієм коефіцієнт а0 статистично не відріз­няється від 0.

 

Перевіримо значущість оцінок параметрів за допомогою t -критерію:

 

. (1.12)

 

Для цього обчислимо:

 

, (1.13)

де - діагональний елемент матриці (XTХ)-1.

 

Використовуючи вбудовані в Excel функції, значення c00 обчислимо, ввівши формулу:

 

ИНДЕКС(МОБР(МУМНОЖ(ТРАНСП(А3:В11);А3:В11));1;1)

 

Для обчислення c11 необхідно ввести формулу:

 

ИНДЕКС(МОБР(МУМНОЖ(ТРАНСП(А3:В11);А3:В11));2;2)

 

Всі значення матриці (XTХ)-1 знайдемо, ввівши формулу:

 

МОБР(МУМНОЖ(ТРАНСП(А3:В11);А3:В11))

 

і натиснувши клавіші Ctrl+Shift+Enter.

Тоді:

 

(1.14)

 

В результаті отримаємо:

 

с11 =0,000024 і

 

Розрахуємо t -критерій за формулою 1.12:

 

 

Крім цього, значення t -критерію можна обчислити на основі даних отриманих за допомогою функції ЛІННЕЙН: для цього слід значення першого стовпчика поділити на значення другого.

З таблиці t-розподілу Стьюдента для рівня значущості =0,05 і ступеня вільності знаходимо tтабл = 2,365. Отже, t1>tтабл і тому параметр а1 є статистично значимий.

Побудуємо довірчий інтервал для параметра а1 за формулою:

 

(1.15)

Визначимо точкове прогнозоване значення показника Y, коли х0 =400:

 

=0,0594 + 0,0096х0 =0,0594 + 0,0096 х 400 = 3,9.

 

Визначимо прогнозований інтервал математичного сподівання М(у0).

Обчислимо:

 

(1.16)

 

Дисперсія прогнозу дорівнює:

 

=0,022-1,266 = 0,028.

 

Тоді прогнозований інтервал математичного сподівання М(у0) при =0,05, k=n-m-1=7 і t =2,365 матиме вигляд:

 

(1.17)

 

Інтервальний прогноз індивідуального значення у0 знаходимо за формулою:

 

(1.18)

 

Отже, з ймовірністю Р=0,95 прогноз математичного сподівання М(у0) потрапляє — в інтервал [3,5; 4,3], а прогноз індивідуального значення в інтервал [3,37; 4,43].

Економічна інтерпретація: якщо в прогнозований період собівартість продукції становить 400 млн. грн., то середній прибуток потрапляє в інтервал [3,5; 4,3]. Водночас окреме значення прибутку знаходиться в інтервалі [3,37; 4,43].

Висновок: Економіко-математичний аналіз характеристик економетричної моделі свідчить, що:

üКоефіцієнт детермінації R2 =0,9624. Це означає, що на 96,24% варіація прибутку залежить від собівартості продукції.

üКоефіцієнт кореляції Rxy=0,98 свідчить про досить тісний зв'язок між прибутком та собівартістю продукції,

ü Залишкова дисперсія =0,022 показує, що розрахункові значення прибутку дуже близькі до фактичних.

ü Параметр моделі a1 =0,0096 свідчить про те, що збільшення собівартості продукції на одиницю сприятиме граничному зростан­ню прибутку на 0,0096 одиниць.

ü Згідно з F- критерієм, з надійністю Р=0,95 економетричну модель можна вважати адекватною експериментальним даним і на підставі прийнятої моделі мо­жна проводити економічний аналіз та знаходити значення про­гнозу.

üСереднє значення залежного фактору при Х = 400 дорівнює Yпр=3,9 і з ймовірністю 0,95 знаходиться в інтервалі від 3,5 до 4,3. Водночас окреме значення прибутку знаходиться в інтервалі [3,37; 4,43]

 

 

Приклад 1.2. На основі статистичних даних фактора Х та Y (Х – порядковий номер місяця, Y – обсяг реалізованої продукції, дані умовні), знайти най­кращий вид математичної функції, який відображає залежність фак­тора Y від фактора Х з використанням основних характеристик. Ви­хідні дані та їх перетворення подані у таблиці 1.2.

Таблиця 1.2. - Вихідні дані та обчислення

і Y(i) Х(і) Х2(і) 1/Х(і) ln(X) ln(Y) Yp
              0,735
        0,5 0,693 0,693 2,618
        0,333 1,098 1,098 5,503
        0,25 1,386 2,302 9,320
        0,2 1,609 2,995 14,02
        0,166 1,791 3,044 19,58
        0,142 1,945 3,401 25,97
        0,125 2,079 3,688 33,17
        0,111 2,197 3,737 41,16
        0,1 2,302 3,806 49,92
        0,090 2,397 3,912 59,44
пр   12         69,71

Розв’язання: Специфікуємо модель наступними функціями:

1) лінійною Y = a0 + a1X;

2) параболічною Y = a1 + a1X + a2X2;

3) гіперболічною ;

4) логарифмічною Y = a0 + a1ln(X);

5) степеневою Y = a0Xa1;

6) експоненціальною Y = a0ea1X.

Дані функції шляхом логарифмування та подальшої заміни змінних легко зводяться до лінійної. Всі необхідні перетворення та обчислення реалізовано у таблиці 1.2.

Розрахунки (за допомогою функції ЛИНЕЙН) дають наступні ре­зуль­тати:

1) лінійна функція (застосовуємо функцію ЛИНЕЙН до стовпців Y та Х):

5,490909 -8,94545
0,303998 2,061818
0,973154 3,188363
326,2464  
3316,509 91,49091

Функція Y = -8,94545 + 5,49091X з наступними параметрами: R2 = 0,97315; E = 3,18836; F = 326,246;

2) параболічна функція (ЛИНЕЙН застосовується до Y та Х, Х2):

0,048951 4,903497 -7,67273
0,114147 1,406374 3,67192
0,973757 3,343557 #Н/Д
148,4236   #Н/Д
3318,565 89,43497 #Н/Д

Функція Y = -7,6727 + 4,9035X + 0,049X2 з наступними параметрами: R2 = 0,97376; E = 3,67192; F = 148,424

3) гіперболічна функція (ЛИНЕЙН до стовпців Y та 1/Х):

 

-50,042 37,73824
15,53088 5,845047
0,535649 13,26025
10,3819  
1825,493 1582,507

Функція Y = 37,7382 – 50,042/X з наступними параметрами: R2 = 0,53565; E = 13,2602; F = 10,3819.

4) логарифмічна функція (ЛИНЕЙН до стовпців Y та ln(X):

22,6328 -12,0115
3,359911 5,854713
0,834484 7,916776
45,37546  
2843,922 564,078

Функція Y = -12,0115 + 22,6328ln(X) з наступними параметрами: R2 = 0,83448; E = 7,91678; F = 45,3755.

5) степенева функція (ЛИНЕЙН до стовпців ln(Y) та ln(X)):

1,831546 -0,30684
0,123933 0,215955
0,960423 0,292015
218,4063  
18,62417 0,767457

Функція ln(Y) = -0,30684 + 1,83155 ln(X). Для переходу до функції, яка задана в умові задачі, знайдемо спочатку коефіцієнт а0: a0 = е(a0) = e(-0,30684) = 0,73577.

Отже: Y = 0,73577 X 1,83155 з наступними параметрами: R2 = 0,96042; E = 0,29201; F = 218,406.

6) експоненціальна функція (ЛИНЕЙН до стовпців ln(Y) та Х):

0,391904 0,255945
0,050221 0,340613
0,871239 0,526718
60,89679  
16,89473 2,49689

Щоб знайти функцію, аналогічно обчислимо коефіцієнт а0: а00,25595=1,29169;

тоді Y= 1,29169e0,31991X з наступними параметрами: R2 = 0,87124, E = 0,52672; F = 60,8968.

Всі значення параметрів R2, E та F запишемо в окрему таблицю 1.3.

Таблиця 1.3. - Визначення виду та параметрів функцій

№ п/п Вид функції R2 Е F
  лінійна 0,97315 3,18836 326,246
  параболічна 0,97376 3,67392 148,424
  гіперболічна 0,53565 13,2602 10,3819
  логарифмічна 0,83448 7,91678 45,3755
  степенева 0,96042 0,29201 218,406
  експоненціальна 0,87124 0,52672 60,8968

Як видно з таблиці, згідно з коефіцієнтом детермінації R2, най­кра­щими функціями будуть (1), (2), (5); найменшу помилку мають функ­ції (5) і (6); найбільше значення критерію Фішера – функції (1), (2) та (5). Отже, «найкращою» функцією для даної вибірки є функція (5) – степенева функція вигляду Y = 0,73577X1,83155.

Специфікувавши вибірку степеневою функцією, отримаємо резуль­тати, що найкращим чином характеризують економічний процес. Проведемо економетричний аналіз та знайдемо прогнозне значення при і=12 для степеневої функції.

Оскільки, Fтаб = 5,1174 < F, то отримана модель достовірна з ймо­вірністю 0,95.

Коефіцієнт детермінації R2 = 0,96042 означає, що 96,04 % вибірко­вих даних підпорядковуються отриманій регресії.

Перевіримо на достовірність коефіцієнти моделі. Обчислимо кри­терій Стьюдента для вибірки та відповідні критерії для коефіцієнтів моделі: tтаб = 2,2622; ta1 = 14,779; ta0 = 3,4070.

Оскільки, ta1>tтаб, і ta0>tтаб, то коефіцієнти а1 і а2 достовірні з ймо­вірністю 0,95.

При зміні фактора Х на 1 у.о. функція Y зміниться на 0,73577 у.о.

При і=12 прогнозне значення залежної змінної Yпр = 69,7125. Інтер­вальний прогноз для функції Y1=a0+a1X1, де Y1= ln(Y), X1 = ln(X) роз­рахуємо, виконавши обернене перетворення. Для лінійної функції похибка прогнозу ΔY1=0,7341. Використовуючи обернене перетво­рен­ня, знайдемо похибку прогнозу для степеневої функції: ΔY=еΔY1 =2,0835.

Прогнозне значення Yпр=69,7125 буде знаходитися у межах від Ymin = 67,629 до Ymax = 71,796.

Коефіцієнт еластичності знайдемо за формулою k = Xcln(a1) = 0,963, тобто зміна фактору Х на 1% викличе зміну Y на 0,963%.

Графічно результати розрахунку можна представити на рисунку 1.2.

Рисунок 1.2. - Графік залежності Y=f(X) та модель економічного процесу


Дата добавления: 2015-07-11; просмотров: 1146 | Нарушение авторских прав


Читайте в этой же книге: Столбиковую диаграмму по всем отделам и кварталам. | Преобразовать диаграмму из 2) в суммарную, нормированную, объемную. | Нормативи ліквідності банку | Коефіцієнти ліквідності банку | Активи банку у розрізі рівня їх ліквідності | Протягом 2009 року | та філії – Черкаське облуправління | ТЕМА №1 СЛОВО | Склади речення. | Варіант 5 |
<== предыдущая страница | следующая страница ==>
Лабораторна робота №1| ТЕМА №5. ЗВУКИ, БУКВИ. НАГОЛОС, СКЛАД

mybiblioteka.su - 2015-2024 год. (0.031 сек.)