Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Линейная корреляция

Читайте также:
  1. D. Корреляция шкалы F со шкалами Е и РЕС
  2. Билинейная фильтрация текстур
  3. Виды организационных структур: функциональная, линейная, линейно-функциональная, дивизиональная, программно-целевая, матричная.
  4. Двухлинейная ручьевая саламандра
  5. Зарисовки и наброски панорамных видов городского (4 работы) и сельского пейзажа (4 работы), в которых хорошо прочитывается линейная и воздушная перспектива.
  6. Корреляция между наличием детей и различными факторами

 

Графическое представление данных преследует цель установить связь между переменными. Характер зависимости определяется видом функции. Функциональная зависимость - необязательно причинно-следственная, поэтому говорят: функции - это законы, управляющие соответствиями переменных. Однако если мы попытаемся экспериментально проверить простой закон линейного расширения тел при нагревании l = + кТ, то окажется, что равным в пределах точности измерения значениям Т соответствует разное l. Из-за погрешности измерения, влияния случайных факторов функциональная зависимость проявляется как статистическая.

 

Наиболее простой случай статистической связи представляет линейная корреляция двух факторов. Наглядное представление о такой связи дает рис, 7. На нем изображено поле корреляции жесткости сульфатной целлюлозы и расхода активной щелочи на единицу абсолютно сухой целлюлозы. Здесь обнаруживается

 


довольно тесная корреляция, свидетельствующая о том, что в значительной мере обусловлено влиянием расхода активной щелочи.

 

Равномерное распределение точек вокруг некоторого геометрического центра привело бы нас к выводу об отсутствии корреляции между двумя переменными. Такие переменные не связаны друг с другом. Их изменение обусловлено влиянием не выявленных факторов.

 

Для выявления зависимости между переменными определяют коэффициент корреляции. Он характеризует корреляционную зависимость изменения среднего значения одной величины с изменением среднего значения другой. Примером корреляционной зависимости, кроме рассмотренного, является связь между плотностью и прочностью картона, динамическим модулем сдвига и прочностью на

разрыв бумаги и др.    
Пусть имеется выборка из N пар значений двух величин xi и yi
. Степень линейной связи между ними может быть определена эмпирическим
       

 

коэффициентом корреляции r:


 

  r =     ×   å(xi - x)(yi - y)  
  s   s N -1  
    X Y    
             
где x, y   - средние значения переменных х i и у i;  
       
  sX , sY - их средние квадратичные отклонения;  


(19),


 

N - число пар точек.

 

Коэффициент линейной корреляции по своей величине может изменяться от - 1 до +1. Значение r = 0 указывает на отсутствие линейной корреляции между случайными величинами, значение же r = ±1 указывает на строгую функциональную линейную связь.

 

Вывод о наличии корреляционной зависимости важен для исключения того или иного фактора при исследовании. Для ответа на вопрос, указывает ли найденное значение г на какую-либо корреляцию между случайными величинами, применяют t-распределение Стъюдента.

 

Сначала выдвигаем гипотезу, что случайные величины х и у являются некоррелированными. Затем по формуле находим значение tР с числом степеней свободы f=N-2.


 

t   = r  
P   -  
     
       

Если tP


 

 

N -2 (20).
r  

> t,найденное из табл. 3приложения,то гипотеза некоррелированности


 

случайных величин - необоснованная. В расчете используем абсолютную величину эмпирического коэффициента корреляции. Знак коэффициента указывает на характер связи: если с возрастанием одной величины возрастает и вторая, то знак положительный, в противном случае - отрицательный.

 

Если r значим, то между переменными можно установить зависимость в виде эмпирической прямой регрессии. Примем у в качестве зависимой переменной, х - в качестве независимой. Тогда прямая регрессия у на х имеет уравнение

 

y - y = r s y × (x - x) (21),  
sx  
       

 

или

 


y = y + r s y × (x - x).  
   
s    
  x    
       


(22).


 

В уравнение подставляют r с тем знаком, который получился при расчете. После

 

подстановки соответствующих значений у, х, s y, sx, r получим уравнение прямой

y = b + kx

, в котором k не имеет смысла r. Поэтому в конечных результатах следует

 

указать как степень коррелированности величин (r), так и уравнение линии регрессии, графически изображающее функцию регрессии.

 

Отметим, что параметры найденного уравнения удовлетворяют принципу наименьших квадратов по y:сумма квадратов отклонений уi от рассчитанных поуравнению прямой регрессии меньше, чем сумма квадратов отклонений их от любой другой прямой.

Средняя ошибка уравнения определяется по формуле

myx = s y 1 - r   . (23).  
   

 

Это значит, что значение у, найденное по уравнению, будет колебаться в пределах y ± myx в 68,3 случаях из 100, в пределах у±2тух в 95,4 случаях из 100. '

 

Прямая регрессии х на у имеет уравнение


 

x = x + r s x × (y - y)  
   
     
  s   .  
  y    
       

Средняя ошибка уравнения mxy = sx 1 - r 2.


(24).

 

(25).


 

Степень влияния переменных друг на друга может изменяться в зависимости от их значении. Такая связь называется нелинейной. Выбор уравнения нелинейности регрессии достаточно сложен.

 


Дата добавления: 2015-11-28; просмотров: 71 | Нарушение авторских прав



mybiblioteka.su - 2015-2024 год. (0.011 сек.)