Парна лінійна регресія

Читайте также:

Приклад 1.1. Для визначення рівня впливу собівартості продукції на чистий прибуток підприємства необхідно побудувати економетричну лінійну модель, яка характеризує залежність між цими показниками, на основі такої інформації(таблиці 1.1).

Таблиця 1.1 – Вихідні дані для побудови економетричної моделі

Х - собівартість продукції (тис. грн.)	Y— чистий прибуток (тис, грн.)

	1,1
	1,4
	1,5
	1,8
	2,1
	2,3
	2,5
	3,2
Прогноз 400	?

Ідентифікуємо дані: Y – чистий прибуток (залежний фактор); Х – собівартість продукції (незалежний фактор).

Специфікуємо економетричну модель лінійною функцією виду:

Y = a₀ + a₁X + и, (1.1)

де а₀, а₁ – коефіцієнти лінійної моделі, и – випадкова складова.

Здійснимо параметризацію економетричної моделі. Визначимо параметри економетричної моделі трьома способами.

Спосіб 1. Для того, щоб обчислити параметри лінійної регресії, в MS Excel передбачена вбудована функція ЛИНЕЙН (Y; X; константа; статистика), яка обчислює основні параметри регресії (коефіцієнти регресії, стандартні похибки коефіцієнтів, коефіцієнт детермінації, стандартну похибку, критерій Фішера, суму квадратів різниць між фактичним та середнім значенням фактору Y та суму квадратів залишків). Обравши вихідні дані (таблиця 1.1) результативного показника Y та факторної ознаки X, значення константи та статистики дорівнюють 1, що означає ИСТИНА або 1. тоді а 0 і натиснемо клавіші Ctrl+Shift+Enter. Всі інші параметри можуть бути обчислені згідно означень.

Застосувавши функцію ЛИНЕЙН, одержимо:

0,009644	0,059391
0,00072	0,144609
0,962398	0,148685
179,1626
3,960804	0,154751

У результаті обчислень отримано:

коефіцієнти регресії: a₁ = 0,009644, а₀ = 0,0594;

стандартні похибки коефіцієнтів: Sa₁= 0,00072, Sa₀= 0,144609;

коефіцієнт детермінації: R² = 0,9623984, стандартна похибка: Е = 0,148685;

критерій Фішера: F=179,1626, n-k= 7;

сума квадратів різниць між фактичним та середнім значенням фактору Y: S²_рег=3,960804, сума квадратів залишків S²_зал=0,154751.

Отже, економетрична модель має вигляд:

(1.2)

Спосіб 2. Невідомі параметри а₀ і a₁, економетричної лінійної моделі 1.1 шукаємо за формулою:

(1.3)

Розглянемо методику обчислень формул за допомогою вбудованих її Excel функцій.

Таблиця 1.2 – Алгоритм розрахунку параметрів моделі матричним способом

Математична формула	Формула в Excel
Х^T	=ТРАНСП(А3:В11) (1)
X^TX	=МУМНОЖ(ТРАНСП(А3:В11);А3:В11) (2)
(Х^ТХ)^-1	=МОБР(МУМНОЖ(ТРАНСП(А3:В11);А3:В11) (3)
(Х^ТХ)^-1Х^Т	=МУМНОЖ(МОБР(МУМНОЖ(ТРАНСП(А3:В11);А3:В11));ТРАНСП(А3:В11)) (4)
(Х^ТХ)^-1Х^ТY	=МУМНОЖ(МУМНОЖ(МОБР(МУМНОЖ (ТРАНСП (А3:В11);А3:В11));ТРАНСП(А3:В11));С3:С11) (5)

Для застосування матричного способу визначення параметрів економетричної моделі виділимо будь-які пусті комірки (наприклад А15:А16), введемо за допомогою Мастера функцій формулу (5) і натиснемо клавіші Ctrl+Shift+Enter.

В результаті отримаємо значення матриці А=(а₀,а₁)^Т: в комірці А15 число 0,0594, а в комірці А16 число 0,0096.

Отже, а₀ =0,0594; a₁ =0,0096 і економетрична модель має вигляд

Спосіб 3. Заносимо вихідні дані у таблицю 1.3 (графи 2 і 3). Обчислюємо X_і² (графа 4), X_iY_i (графа 5), (графа 6), (графа 7), (графа 8), (графа 9), (графа 13).

Таблиця 1.3 – Оцінка параметрів лінійної регресії

Мінімізуючи функцію суми квадратів відхилень фактичних значень від розрахункових, отримаємо систему алгебраїчних рівнянь для знаходження невідомих параметрів а₀і a₁ економетричної лінійної моделі 1.1 Y=а₀+a₁X+u за формулами:

(4.1)

(1.4)

Розв'язком системи є параметри а₀ =0,0594; a₁ =0,0096.

Економетрична модель має вигляд

Знаходимо Yp та заповнюємо стовпець 10, табл. 1.3.

Будуємо точковий графік залежності між величинами X, Y, (рис. 1.1).

Рисунок 1.1 - Залежність між величинами X, Y,

Обчислимо для однофакторної лінійної регресії коефіцієнт кореляції R_xy за формулою:

(4.2)

(1.5)

Коефіцієнт кореляції R_xy можна також знайти використовуючи вбудовану функцію КОРРЕЛ (массив1; массив2), де массив1 – це фактичні значення вихідного масиву Х; массив2 – фактичні значення вихідного масиву Y.

Знайдене значення вказує на щільний прямий зв'язок між показником і фактором: із зменшенням собівартості продукції прибуток зростає.

Обчислимо коефіцієнт детермінації R² за формулами:

(4.3)

(1.6)

(1.7)

Бачимо, що . Цей показник показує скільком відсоткам варіація залежної змінної визначається варіацією незалежних змінних. Чим ближче значення коефіцієнта детермінації до одиниці, тим тіснішим є зв’язок.

Дослідимо статистичну значущість коефіцієнта детермінації за допомогою F-критерію:

(4.4)

(1.8)

де т – число незалежних змінних у рівнянні регресії;

п – число спостережень.

Для рівня значущості =0,05 і ступенів вільності знаходимо в таблиці F-розподілу Фішера табличне значення =5,59.

Для обчислення табличного значення критерію Фішера скористаємося вбудованою в MS Excel функцією FРАСПОБР, де вероятность=0,05; степени_свободы1=k-1=1; степени_свободы2 = n-k = 7. Одержимо табличне значення критерію Фішера F_таб = 5,59.

Оскільки F_R=179 значно перевищує , то можна вважати, що коефіцієнт детермінації статистично значимий і включені у регресію фактори достатньо пояснюють стохастичну залежність показника.

Оскільки, F_роз > F_таб, то отримана економетрична модель достовірна, або така, що відповідає статистичним даним. Згідно з критерієм Фішера, отримана модель достовірна.

Обчислимо залишкову дисперсію:

(4.6)

(4.5)

(1.9)

Гіпотезу про рівень значущості зв'язку між залежною і не залежною змінними перевіримо за допомогою F-критерію:

(4.7)

(1.10)

Для рівня значущості =0,05 і ступенів вільності знаходимо в таблиці F -розподілу Фішера табличне значення F_табл=5,59.

Оскільки F=22,2 перевищує F_табл, то гіпотеза про істотність зв'язку між залежною і незалежними змінними економетричної моделі підтверджується.

Оцінимо згідно з t-критерієм Стьюдента значущість коефіцієнтів моделі а₁ та а₀.

За означенням t-критерії для коефіцієнтів а₁ та а₀:

= 13,38516; = 0,4107. (1.11)

Порівняємо одержані t-критерії для коефіцієнтів моделі з табличним значенням критерію Стьюдента. Для обчислення табличного значення можна скористатися вбудованою функцією СТЬЮДРАСПОБР на рівні значимості 0,05 та числом ступенів вільності n-k=7: t_таб = 2,364624.

Оскільки, ta₁>t_таб, то отримане значення коефіцієнта а₁ достовірне з ймовірністю 0,95.

Оскільки, ta₀<t_таб, то отримане значення коефіцієнта а₀ статистично не відрізняється від 0. Це значить, що отримана оцінка коефіцієнта а₀ є не точною, або зміщеною, що свідчить, можливо, про недостатню кількість спостережень (n=9).

Достовірним є значення коефіцієнта а₁ згідно з критерієм Стьюдента. Згідно з цим критерієм коефіцієнт а₀ статистично не відрізняється від 0.

Перевіримо значущість оцінок параметрів за допомогою t -критерію:

. (1.12)

Для цього обчислимо:

, (1.13)

де - діагональний елемент матриці (X^TХ)^-1.

Використовуючи вбудовані в Excel функції, значення c₀₀ обчислимо, ввівши формулу:

ИНДЕКС(МОБР(МУМНОЖ(ТРАНСП(А3:В11);А3:В11));1;1)

Для обчислення c₁₁ необхідно ввести формулу:

ИНДЕКС(МОБР(МУМНОЖ(ТРАНСП(А3:В11);А3:В11));2;2)

Всі значення матриці (X^TХ)^-1 знайдемо, ввівши формулу:

МОБР(МУМНОЖ(ТРАНСП(А3:В11);А3:В11))

і натиснувши клавіші Ctrl+Shift+Enter.

Тоді:

(1.14)

В результаті отримаємо:

с₁₁ =0,000024 і

Розрахуємо t -критерій за формулою 1.12:

Крім цього, значення t -критерію можна обчислити на основі даних отриманих за допомогою функції ЛІННЕЙН: для цього слід значення першого стовпчика поділити на значення другого.

З таблиці t-розподілу Стьюдента для рівня значущості =0,05 і ступеня вільності знаходимо t_табл = 2,365. Отже, t₁>t_табл і тому параметр а₁ є статистично значимий.

Побудуємо довірчий інтервал для параметра а₁ за формулою:

(1.15)

Визначимо точкове прогнозоване значення показника Y, коли х₀ =400:

=0,0594 + 0,0096х₀ =0,0594 + 0,0096 х 400 = 3,9.

Визначимо прогнозований інтервал математичного сподівання М(у₀).

Обчислимо:

(1.16)

Дисперсія прогнозу дорівнює:

=0,022-1,266 = 0,028.

Тоді прогнозований інтервал математичного сподівання М(у₀) при =0,05, k=n-m-1=7 і t=2,365 матиме вигляд:

(1.17)

Інтервальний прогноз індивідуального значення у₀ знаходимо за формулою:

(1.18)

Отже, з ймовірністю Р=0,95 прогноз математичного сподівання М(у₀) потрапляє — в інтервал [3,5; 4,3], а прогноз індивідуального значення в інтервал [3,37; 4,43].

Економічна інтерпретація: якщо в прогнозований період собівартість продукції становить 400 млн. грн., то середній прибуток потрапляє в інтервал [3,5; 4,3]. Водночас окреме значення прибутку знаходиться в інтервалі [3,37; 4,43].

Висновок: Економіко-математичний аналіз характеристик економетричної моделі свідчить, що:

üКоефіцієнт детермінації R² =0,9624. Це означає, що на 96,24% варіація прибутку залежить від собівартості продукції.

üКоефіцієнт кореляції R_xy=0,98 свідчить про досить тісний зв'язок між прибутком та собівартістю продукції,

ü Залишкова дисперсія =0,022 показує, що розрахункові значення прибутку дуже близькі до фактичних.

ü Параметр моделі a₁ =0,0096 свідчить про те, що збільшення собівартості продукції на одиницю сприятиме граничному зростанню прибутку на 0,0096 одиниць.

ü Згідно з F- критерієм, з надійністю Р=0,95 економетричну модель можна вважати адекватною експериментальним даним і на підставі прийнятої моделі можна проводити економічний аналіз та знаходити значення прогнозу.

üСереднє значення залежного фактору при Х = 400 дорівнює Y_пр=3,9 і з ймовірністю 0,95 знаходиться в інтервалі від 3,5 до 4,3. Водночас окреме значення прибутку знаходиться в інтервалі [3,37; 4,43]

Приклад 1.2. На основі статистичних даних фактора Х та Y (Х – порядковий номер місяця, Y – обсяг реалізованої продукції, дані умовні), знайти найкращий вид математичної функції, який відображає залежність фактора Y від фактора Х з використанням основних характеристик. Вихідні дані та їх перетворення подані у таблиці 1.2.

Таблиця 1.2. - Вихідні дані та обчислення

і	Y(i)	Х(і)	Х²(і)	1/Х(і)	ln(X)	ln(Y)	Yp
							0,735
				0,5	0,693	0,693	2,618
				0,333	1,098	1,098	5,503
				0,25	1,386	2,302	9,320
				0,2	1,609	2,995	14,02
				0,166	1,791	3,044	19,58
				0,142	1,945	3,401	25,97
				0,125	2,079	3,688	33,17
				0,111	2,197	3,737	41,16
				0,1	2,302	3,806	49,92
				0,090	2,397	3,912	59,44
пр		12					69,71

Розв’язання: Специфікуємо модель наступними функціями:

1) лінійною Y = a₀ + a₁X;

2) параболічною Y = a₁ + a₁X + a₂X²;

3) гіперболічною ;

4) логарифмічною Y = a₀ + a₁ln(X);

5) степеневою Y = a₀X^a1;

6) експоненціальною Y = a₀e^a1X.

Дані функції шляхом логарифмування та подальшої заміни змінних легко зводяться до лінійної. Всі необхідні перетворення та обчислення реалізовано у таблиці 1.2.

Розрахунки (за допомогою функції ЛИНЕЙН) дають наступні результати:

1) лінійна функція (застосовуємо функцію ЛИНЕЙН до стовпців Y та Х):

5,490909	-8,94545
0,303998	2,061818
0,973154	3,188363
326,2464
3316,509	91,49091

Функція Y = -8,94545 + 5,49091X з наступними параметрами: R² = 0,97315; E = 3,18836; F = 326,246;

2) параболічна функція (ЛИНЕЙН застосовується до Y та Х, Х²):

0,048951	4,903497	-7,67273
0,114147	1,406374	3,67192
0,973757	3,343557	#Н/Д
148,4236		#Н/Д
3318,565	89,43497	#Н/Д

Функція Y = -7,6727 + 4,9035X + 0,049X² з наступними параметрами: R² = 0,97376; E = 3,67192; F = 148,424

3) гіперболічна функція (ЛИНЕЙН до стовпців Y та 1/Х):

-50,042	37,73824
15,53088	5,845047
0,535649	13,26025
10,3819
1825,493	1582,507

Функція Y = 37,7382 – 50,042/X з наступними параметрами: R² = 0,53565; E = 13,2602; F = 10,3819.

4) логарифмічна функція (ЛИНЕЙН до стовпців Y та ln(X):

22,6328	-12,0115
3,359911	5,854713
0,834484	7,916776
45,37546
2843,922	564,078

Функція Y = -12,0115 + 22,6328ln(X) з наступними параметрами: R² = 0,83448; E = 7,91678; F = 45,3755.

5) степенева функція (ЛИНЕЙН до стовпців ln(Y) та ln(X)):

1,831546	-0,30684
0,123933	0,215955
0,960423	0,292015
218,4063
18,62417	0,767457

Функція ln(Y) = -0,30684 + 1,83155 ln(X). Для переходу до функції, яка задана в умові задачі, знайдемо спочатку коефіцієнт а₀: a₀ = е^(a0) = e^(-0,30684) = 0,73577.

Отже: Y = 0,73577 X ^1,83155 з наступними параметрами: R² = 0,96042; E = 0,29201; F = 218,406.

6) експоненціальна функція (ЛИНЕЙН до стовпців ln(Y) та Х):

0,391904	0,255945
0,050221	0,340613
0,871239	0,526718
60,89679
16,89473	2,49689

Щоб знайти функцію, аналогічно обчислимо коефіцієнт а₀: а₀=е^0,25595=1,29169;

тоді Y= 1,29169e^0,31991Xз наступними параметрами: R² = 0,87124, E = 0,52672; F = 60,8968.

Всі значення параметрів R², E та F запишемо в окрему таблицю 1.3.

Таблиця 1.3. - Визначення виду та параметрів функцій

№ п/п	Вид функції	R²	Е	F
	лінійна	0,97315	3,18836	326,246
	параболічна	0,97376	3,67392	148,424
	гіперболічна	0,53565	13,2602	10,3819
	логарифмічна	0,83448	7,91678	45,3755
	степенева	0,96042	0,29201	218,406
	експоненціальна	0,87124	0,52672	60,8968

Як видно з таблиці, згідно з коефіцієнтом детермінації R², найкращими функціями будуть (1), (2), (5); найменшу помилку мають функції (5) і (6); найбільше значення критерію Фішера – функції (1), (2) та (5). Отже, «найкращою» функцією для даної вибірки є функція (5) – степенева функція вигляду Y = 0,73577X^1,83155.

Специфікувавши вибірку степеневою функцією, отримаємо результати, що найкращим чином характеризують економічний процес. Проведемо економетричний аналіз та знайдемо прогнозне значення при і=12 для степеневої функції.

Оскільки, F_таб = 5,1174 < F, то отримана модель достовірна з ймовірністю 0,95.

Коефіцієнт детермінації R² = 0,96042 означає, що 96,04 % вибіркових даних підпорядковуються отриманій регресії.

Перевіримо на достовірність коефіцієнти моделі. Обчислимо критерій Стьюдента для вибірки та відповідні критерії для коефіцієнтів моделі: t_таб = 2,2622; t_a1 = 14,779; t_a0 = 3,4070.

Оскільки, t_a1>t_таб, і t_a0>t_таб, то коефіцієнти а₁ і а₂ достовірні з ймовірністю 0,95.

При зміні фактора Х на 1 у.о. функція Y зміниться на 0,73577 у.о.

При і=12 прогнозне значення залежної змінної Y_пр = 69,7125. Інтервальний прогноз для функції Y₁=a₀+a₁X₁, де Y₁= ln(Y), X₁ = ln(X) розрахуємо, виконавши обернене перетворення. Для лінійної функції похибка прогнозу ΔY₁=0,7341. Використовуючи обернене перетворення, знайдемо похибку прогнозу для степеневої функції: ΔY=е^ΔY1 =2,0835.

Прогнозне значення Y_пр=69,7125 буде знаходитися у межах від Y_min = 67,629 до Y_max = 71,796.

Коефіцієнт еластичності знайдемо за формулою k = X_cln(a₁) = 0,963, тобто зміна фактору Х на 1% викличе зміну Y на 0,963%.

Графічно результати розрахунку можна представити на рисунку 1.2.

Рисунок 1.2. - Графік залежності Y=f(X) та модель економічного процесу

Дата добавления: 2015-07-11; просмотров: 1146 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
Лабораторна робота №1	\|	ТЕМА №5. ЗВУКИ, БУКВИ. НАГОЛОС, СКЛАД

mybiblioteka.su - 2015-2026 год. (0.128 сек.)