Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Элементы теории корреляции

Читайте также:
  1. A) расходуемые элементы
  2. I РЕЛИГИЯ И НАУЧНЫЕ ТЕОРИИ
  3. Ii) Указатели на элементы массива
  4. А теперь, чтобы двигаться дальше, нам нужно знать немного теории
  5. Аксиомы теории поведения потребителя. Предпочтения. Функция полезности.
  6. Актуальные проблемы теории международного частного права
  7. Альтернативные теории эволюции

График восстановленной функциональной зависимости по результатам измерений называется кривой регрессии. Для проверки согласия построенной кривой регрессии с результатами эксперимента обычно вводят следующие числовые характеристики: коэффициент корреляции (линейная зависимость), корреляционное отношение и коэффициент детерминированности. При этом результаты обычно группируют и представляют в форме корреляционной таблицы. В каждой клетке этой таблицы приводятся численности тех пар , компоненты которых попадают в соответствующие интервалы группировки по каждой переменной. Предполагая длины интервалов группировки (по каждой переменной) равными между собой, выбирают центры (соответственно ) этих интервалов и числа в качестве основы для расчетов.

Коэффициент корреляции является мерой линейной связи между зависимыми случайными величинами: он показывает, насколько хорошо в среднем может быть представлена одна из величин в виде линейной функции от другой.

Коэффициент корреляции вычисляется по формуле:

, (8)

где , и ¾ среднее арифметическое значение соответственно по x и y.

Коэффициент корреляции между случайными величинами по абсолютной величине не превосходит 1. Чем ближе к 1, тем теснее линейная связь между x и y.

В случае нелинейной корреляционной связи условные средние значения располагаются около кривой линии. В этом случае в качестве характеристики силы связи рекомендуется использовать корреляционное отношение, интерпретация которого не зависит от вида исследуемой зависимости.

Корреляционное отношение вычисляется по формуле:

, (9)

где , а числитель характеризует рассеяние условных средних около безусловного среднего .

Всегда . Равенство соответствует некоррелированным случайным величинам; тогда и только тогда, когда имеется точная функциональная связь между y и x. В случае линейной зависимости y от x корреляционное отношение совпадает с квадратом коэффициента корреляции. Величина используется в качестве индикатора отклонения регрессии от линейной.

Корреляционное отношение является мерой корреляционной связи y с x в какой угодно форме, но не может дать представления о степени приближенности эмпирических данных к специальной форме. Чтобы выяснить насколько точно построенная кривая отражает эмпирические данные вводится еще одна характеристика ¾ коэффициент детерминированности.

Для его описания рассмотрим следующие величины. - полная сумма квадратов, где среднее значение .

Можно доказать следующее равенство .

Первое слагаемое равно и называется остаточной суммой квадратов. Оно характеризует отклонение экспериментальных данных от теоретических.

Второе слагаемое равно и называется регрессионной суммой квадратов, и оно характеризует разброс данных.

Очевидно, что справедливо следующее равенство .

Коэффициент детерминированности определяется по формуле: . (10)

Чем меньше остаточная сумма квадратов по сравнению с общей суммой квадратов, тем больше значение коэффициента детерминированности , который показывает, насколько хорошо уравнение, полученное с помощью регрессионного анализа, объясняет взаимосвязи между переменными. Если он равен 1, то имеет место полная корреляция с моделью, т.е. нет различия между фактическим и оценочным значениями y. В противоположном случае, если коэффициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значений y

Коэффициент детерминированности всегда не превосходит корреляционное отношение. В случае, когда выполняется равенство то можно считать, что построенная эмпирическая формула наиболее точно отражает эмпирические данные.

 

Вариант 17.

Функция задана табл. 1.

 

Таблица 1.

аргу- мент функ- ция аргу- мент функ- ция аргу- мент функ- ция аргу- мент функ- ция аргу- мент функ- ция
0.21 1.62 4.98 40.09 7.96 63.31 12.33 97.77 17.32 126.45
1.19 8.65 5.49 43.56 8.32 67.45 13.21 105.34 18.43 144.34
2.43 16.76 6.07 48.45 9.43 72.87 14.72 112.56 19.38 160.45
3.12 24.45 6.81 52.21 10.21 81.34 15.53 121.89 20.45 161.34
4.54 32.87 7.21 57.34 11.54 89.45 16.23 108.54 21.22 170.59

 

Требуется выяснить - какая из функций - линейная, квадратичная или экспоненциальная наилучшим образом аппроксимирует функцию заданную таблицей 1.

Решение.

 

Поскольку в данном примере каждая пара значений встречается один раз, то корреляционная таблица примет вид единичной матрицы. Значит условные средние совпадают со значениями . Отсюда следует, что корреляционное отношение равно 1 и следовательно между и существует функциональная зависимость

 

Для проведения расчетов данные целесообразно расположить в виде таблицы 2, используя средства табличного процессора Microsoft Excel.

 

Таблица 2.

Xi Yi Xi^2 Xi*Yi Xi^3 Xi^4 Xi^2*Yi ln(Yi) Xi*ln(Yi)
0,21 1,62 0,0441 0,34 0,01 0,00 0,07 0,48 0,10
1,19 8,65 1,4161 10,29 1,69 2,01 12,25 2,16 2,57
2,43 16,76 5,9049 40,73 14,35 34,87 98,97 2,82 6,85
3,12 24,45 9,7344 76,28 30,37 94,76 238,01 3,20 9,97
4,54 32,87 20,6116 149,23 93,58 424,84 677,50 3,49 15,86
4,98 40,09 24,8004 199,65 123,51 615,06 994,25 3,69 18,38
5,49 43,56 30,1401 239,14 165,47 908,43 1312,90 3,77 20,72
6,07 48,45 36,8449 294,09 223,65 1357,55 1785,14 3,88 23,55
6,81 52,21 46,3761 355,55 315,82 2150,74 2421,30 3,96 26,94
7,21 57,34 51,9841 413,42 374,81 2702,35 2980,77 4,05 29,19
7,96 63,31 63,3616 503,95 504,36 4014,69 4011,42 4,15 33,02
8,32 67,45 69,2224 561,18 575,93 4791,74 4669,05 4,21 35,04
9,43 72,87 88,9249 687,16 838,56 7907,64 6479,96 4,29 40,44
10,21 81,34 104,2441 830,48 1064,33 10866,83 8479,22 4,40 44,91
11,54 89,45 133,1716 1 032,25 1536,80 17734,68 11912,20 4,49 51,86
12,33 97,77 152,0289 1 205,50 1874,52 23112,79 14863,87 4,58 56,50
13,21 105,34 174,5041 1 391,54 2305,20 30451,68 18382,26 4,66 61,52
14,72 112,56 216,6784 1 656,88 3189,51 46949,53 24389,32 4,72 69,53
15,53 121,89 241,1809 1 892,95 3745,54 58168,23 29397,54 4,80 74,59
16,23 108,54 263,4129 1 761,60 4275,19 69386,36 28590,84 4,69 76,07
17,32 126,45 299,9824 2 190,11 5195,70 89989,44 37932,77 4,84 83,83
18,43 144,34 339,6649 2 660,19 6260,02 115372,24 49027,23 4,97 91,64
19,38 160,45 375,5844 3 109,52 7278,83 141063,64 60262,52 5,08 98,41
20,45 161,34 418,2025 3 299,40 8552,24 174893,33 67472,79 5,08 103,96
21,22 170,59 450,2884 3 619,92 9555,12 202759,64 76814,70 5,14 109,06
258,33 2009,69 3618,31 28181,39 58095,08 1005753,05 453206,83 101,60 1184,51

 

Аппроксимируем функцию линейной функцией . Для определения коэффициентов и воспользуемся системой (4). Используя итоговые суммы таблицы 2, расположенные в ячейках A26, B26, C26 и D26, запишем систему (4) в виде

(11)

решив которую, получим -0.36 7.81

Таким образом, линейная аппроксимация имеет вид

(12)

Решение системы (11) проводили, пользуясь средствами Microsoft Excel. Результаты представлены в таблице 3.

 

Таблица 3.

  258,33 2009,69    
258,33 3618,31 28181,39    
         
Обратная матрица      
0,1525 -0,01089   a1= -0,35486
-0,011 0,001054   a2= 7,813887

 

Далее аппроксимируем функцию квадратичной функцией . Для определения коэффициентов , и воспользуемся системой (5). Используя итоговые суммы таблицы 2, расположенные в ячейках A26, B26, C26, D26, E26, F26 и G26 запишем систему (5) в виде

(13)

решив которую, получим 1,09 7,42 0.02

Таким образом, квадратичная аппроксимация имеет вид

(14)

Решение системы (13) проводили, пользуясь средствами Microsoft Excel. Результаты представлены в таблице 4.

 

Таблица 4.

  258,33 3618,31 2009,69    
258,33 3618,31 58095,08 28181,39    
3618,31 58095,08 1005753,05 453206,83    
           
Обратная матрица        
0,36812 -0,06915 0,00267   a1= 1,09342
-0,06915 0,01680 -0,00072   a2= 7,42250
0,00267 -0,00072 0,00003   a3= 0,01794

 

Теперь аппроксимируем функцию экспоненциальной функцией . Для определения коэффициентов и прологарифмируем значения и используя итоговые суммы таблицы 2, расположенные в ячейках A26, C26, H26 и I26 получим систему

(15)

где .

Решив систему (15) найдем 2.60 0.14

После потенцирования получим 13.44

Таким образом, экспоненциальная аппроксимация имеет вид

(16)

Решение системы (15) проводили, пользуясь средствами Microsoft Excel. Результаты представлены в таблице 5.

 

Таблица 5.

  258,33 101,60    
258,33 3618,31 1184,51    
         
обратная матрица   с= 2,59847
0,1525 -0,01089   a2= 0,14185
-0,011 0,00105   a1= 13,44317

 

Вычислим среднее арифметическое и по формулам:

;

Результаты расчета и средствами Microsoft Excel представлены в таблице 6.

 

Таблица 6.

Xcр= 10,3332
Yср= 80,3876

Для того, чтобы рассчитать коэффициент корреляции и коэффициент детерминированности данные целесообразно расположить в виде таблицы 7, которая является продолжением таблицы 2.

 

Таблица 7.

Xi Yi (X-Xcp)^2 (Y-Ycp)^2 линейн квадр. экспон.
0,21 1,62 797,38 102,48 6204,33 0,11 1,07
1,19 8,65 655,91 83,60 5146,28 0,09 1,69
2,43 16,76 502,86 62,46 4048,47 3,51 6,13
3,12 24,45 403,49 52,03 3129,02 0,18 0,00
4,54 32,87 275,28 33,56 2257,92 5,06 5,25
4,98 40,09 215,72 28,66 1623,90 2,35 2,52
5,49 43,56 178,36 23,46 1356,27 1,03 1,38
6,07 48,45 136,16 18,17 1020,01 1,89 2,69
6,81 52,21 99,28 12,41 793,98 0,42 0,07
7,21 57,34 71,98 9,75 531,19 1,84 3,23
7,96 63,31 40,53 5,63 291,64 2,15 3,99
8,32 67,45 26,05 4,05 167,38 7,80 11,29
9,43 72,87 6,79 0,82 56,51 0,21 0,04
10,21 81,34 -0,12 0,02 0,91 3,67 6,72
11,54 89,45 10,94 1,46 82,13 0,13 0,10
12,33 97,77 34,71 3,99 302,15 3,17 5,91
13,21 105,34 71,78 8,28 622,62 6,12 9,40
14,72 112,56 141,13 19,24 1035,06 4,43 2,82
15,53 121,89 215,68 27,01 1722,45 0,80 1,44
16,23 108,54 166,01 34,77 792,56 321,29 314,90
17,32 126,45 321,83 48,82 2121,74 72,79 73,65
18,43 144,34 517,81 65,56 4089,91 0,47 0,13
19,38 160,45 724,31 81,84 6409,99 87,83 76,95
20,45 161,34 818,98 102,35 6553,29 3,61 0,91
21,22 170,59 982,02 118,52 8136,47 26,36 15,32
258,33 2009,69 7414,86 948,93 58496,20 557,32 547,59

 

Теперь проведем расчеты коэффициента корреляции по формуле (8) (только для линейной аппроксимации) и коэффициента детерминированности по формуле (10). Результаты расчетов средствами Microsoft Excel представлены в таблице 8.

 

Таблица 8.

Коэффициент корреляции 0,995225  
Коэффициент детерминированности (линейная апроксимация) 0,990473  
 
Коэффициент детерминированности (квадратичнаяапроксимация) 0,990639  
 
Коэффициент детерминированности (экспоненциальная апроксимация) 0,524826  
 

 

Анализ результатов расчетов показывает, что квадратичная аппроксимация наилучшим образом описывает экспериментальные данные.

 


Дата добавления: 2015-11-14; просмотров: 51 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
МЕТОДОМ НАИМЕНЬШИХ КВАДРАТОВ| Полиномиальная регрессия

mybiblioteka.su - 2015-2024 год. (0.017 сек.)