Читайте также:
|
|
Графическое представление данных преследует цель установить связь между переменными. Характер зависимости определяется видом функции. Функциональная зависимость - необязательно причинно-следственная, поэтому говорят: функции - это законы, управляющие соответствиями переменных. Однако если мы попытаемся экспериментально проверить простой закон линейного расширения тел при нагревании l = lо + кТ, то окажется, что равным в пределах точности измерения значениям Т соответствует разное l. Из-за погрешности измерения, влияния случайных факторов функциональная зависимость проявляется как статистическая.
Наиболее простой случай статистической связи представляет линейная корреляция двух факторов. Наглядное представление о такой связи дает рис, 7. На нем изображено поле корреляции жесткости сульфатной целлюлозы и расхода активной щелочи на единицу абсолютно сухой целлюлозы. Здесь обнаруживается
довольно тесная корреляция, свидетельствующая о том, что в значительной мере обусловлено влиянием расхода активной щелочи.
Равномерное распределение точек вокруг некоторого геометрического центра привело бы нас к выводу об отсутствии корреляции между двумя переменными. Такие переменные не связаны друг с другом. Их изменение обусловлено влиянием не выявленных факторов.
Для выявления зависимости между переменными определяют коэффициент корреляции. Он характеризует корреляционную зависимость изменения среднего значения одной величины с изменением среднего значения другой. Примером корреляционной зависимости, кроме рассмотренного, является связь между плотностью и прочностью картона, динамическим модулем сдвига и прочностью на
разрыв бумаги и др. | |||
Пусть | имеется выборка из N пар значений двух величин | xi и | yi |
. Степень | линейной связи между ними может быть определена эмпирическим | ||
коэффициентом корреляции r:
r = | × | å(xi - | |||||
s | s | N -1 | |||||
X | Y | ||||||
где | - средние значения переменных х i и у i; | ||||||
sX | , sY | - их средние квадратичные отклонения; |
(19),
N - число пар точек.
Коэффициент линейной корреляции по своей величине может изменяться от - 1 до +1. Значение r = 0 указывает на отсутствие линейной корреляции между случайными величинами, значение же r = ±1 указывает на строгую функциональную линейную связь.
Вывод о наличии корреляционной зависимости важен для исключения того или иного фактора при исследовании. Для ответа на вопрос, указывает ли найденное значение г на какую-либо корреляцию между случайными величинами, применяют t-распределение Стъюдента.
Сначала выдвигаем гипотезу, что случайные величины х и у являются некоррелированными. Затем по формуле находим значение tР с числом степеней свободы f=N-2.
t | = | r | ||
P | - | |||
Если tP
N -2 | (20). |
r |
> t,найденное из табл. 3приложения,то гипотеза некоррелированности
случайных величин - необоснованная. В расчете используем абсолютную величину эмпирического коэффициента корреляции. Знак коэффициента указывает на характер связи: если с возрастанием одной величины возрастает и вторая, то знак положительный, в противном случае - отрицательный.
Если r значим, то между переменными можно установить зависимость в виде эмпирической прямой регрессии. Примем у в качестве зависимой переменной, х - в качестве независимой. Тогда прямая регрессия у на х имеет уравнение
y - | s y | × (x - | (21), | |
sx | ||||
или
y = | s | y | × (x - | |
s | ||||
x | ||||
(22).
В уравнение подставляют r с тем знаком, который получился при расчете. После
подстановки соответствующих значений у, х, s y, sx, r получим уравнение прямой
y = b + kx
, в котором k не имеет смысла r. Поэтому в конечных результатах следует
указать как степень коррелированности величин (r), так и уравнение линии регрессии, графически изображающее функцию регрессии.
Отметим, что параметры найденного уравнения удовлетворяют принципу наименьших квадратов по y:сумма квадратов отклонений уi от рассчитанных поуравнению прямой регрессии меньше, чем сумма квадратов отклонений их от любой другой прямой.
Средняя ошибка уравнения определяется по формуле
myx = s y | 1 - r | . | (23). | ||
Это значит, что значение у, найденное по уравнению, будет колебаться в пределах y ± myx в 68,3 случаях из 100, в пределах у±2тух в 95,4 случаях из 100. '
Прямая регрессии х на у имеет уравнение
x = | s | x | × (y - | |
s | . | |||
y | ||||
Средняя ошибка уравнения mxy = sx 1 - r 2.
(24).
(25).
Степень влияния переменных друг на друга может изменяться в зависимости от их значении. Такая связь называется нелинейной. Выбор уравнения нелинейности регрессии достаточно сложен.
Дата добавления: 2015-11-28; просмотров: 71 | Нарушение авторских прав