Читайте также:
|
|
Корреляционный анализ используется для выявления связей между признаками. Корреляционным методом решают две основные задачи:
- определение с помощью уравнений регрессий аналитической формы
связи между вариацией признаков x и y;
- установление тесноты связи между признаками и аналитическому выражению.
Связи между явлениями классифицируются по степени тесноты, направлению и аналитическому выражению. Корреляция может быть парной и множественной. Парная корреляция – это связь между двумя признаками, множественная – зависимость результативного признака от двух и более факторных признаков.
Исследование связи между признаками необходимо начинать с теоретического анализа существа явления – формулировка гипотезы о наличии корреляционной связи между признаками, определение факторного и результативного признаков. После того как выдвинута гипотеза о причинно-следственной связи между исследуемыми признаками, для ее подтверждения используются различные статистические методы – параллельных рядов, корреляционной таблицы, аналитической группировки и графический.
Предположим, исследуется связь между основными фондами и выпуском продукции. Корреляционная таблица, устанавливающая эту связь, имеет следующий вид (табл. 10.1).
Для построения корреляционной таблицы предварительно определяют величины интервалов по факторному и результативному признакам. Затем строятся группы по этим признакам. Внутри групп подсчитывается численность единиц, входящих в каждую группу. Концентрация численности единиц совокупности по диагонали свидетельствует о наличии корреляционной связи между изучаемыми признаками.
Таблица 10.1
Распределение предприятий по стоимости основных фондов и выпуску продукции
Группы предприятий по стоимости основных фондов, млн руб. | Группы предприятий по выпуску продукции, млн руб. | Всего | ||||
10-30 | 30-50 | 50-70 | 70-110 | 110-190 | ||
10-20 | ||||||
20-30 | ||||||
30-40 | ||||||
40-60 | ||||||
60-100 | ||||||
Всего |
Для построения корреляционной таблицы предварительно определяют величины интервалов по факторному и результативному признакам. Затем строятся группы по этим признакам. Внутри групп подсчитывается численность единиц, входящих в каждую группу. Концентрация численности единиц совокупности по диагонали свидетельствует о наличии корреляционной связи между изучаемыми признаками.
Связь между факторными и результативными признаками аналитически выражается уравнениями:
прямой ;
гиперболы ;
параболы .
Параметр a характеризует значение результативного признака, не зависящее от значения факторного признак. Параметр b – коэффициент регрессии говорит о том, на сколько в среднем изменится y при изменении x на одну единицу.
На основе параметров вычисляется коэффициент эластичности, который показывает изменение результативного признака в процентах в зависимости от изменения факторного признака на 1%:
.
После того, как выбрана форма связи, находится значение параметров а и b. Для этого применяют метод наименьших квадратов, который основывается на предположении независимости друг от друга отдельных наблюдений. Для решения составляется система уравнений:
В случае прямолинейной зависимости:
Подбор функции для выражения формы связи между признаками проходит несколько этапов – графический, логический, экономический, а также математическую проверку близости эмпирических данных к теоретическим.
Наиболее простой с точки зрения понимания, интерпретации и техники расчетов является линейная форма связи вида: y = a + bх.
Порядок решения системы уравнения прямой линии следующий:
1) все члены первого уравнения делятся на число n, все члены второго уравнения делятся на число ;
2) из первого уравнения вычесть второе, из полученного уравнения выразить b;
3) найденное значение b подставить в одно из исходных уравнений и найти значение a.
При нахождении зависимости между тремя и более признаками строится уравнение множественной регрессии. При построении таких уравнений следует учитывать, что факторы, включаемые в уравнение регрессии, не должны находиться между собой в линейной функциональной или очень тесной корреляционной связи. Линейное уравнение множественной регрессии имеет вид:
y = a + bx + cx .
Для решения системы нормальных уравнений необходимо разделить все члены уравнений на коэффициент при a, затем вычесть из первого уравнения второе и третье. Все члены полученных двух уравнений разделить на коэффициент при b и вычесть из первого уравнения второе. Из полученного уравнения выразить с. Подставив значение параметра с в уравнение, можно найти b. Аналогично определяем зачение параметра а.
Направление и мера тесноты связи между признаками устанавливается при помощи коэффициента корреляции. Знак коэффициента (+,-) говорит о направлении связи (прямая, обратная).
Линейный коэффициент корреляции рассчитывается по следующей формуле:
r = .
Если коэффициент корреляции находится в пределах от 0,1 до 0,3 – связь между признаками характеризуется как слабая, если 0,3-0,7 – связь средняя, 0,7-0,9 – связь тесная.
Необходимо также определить коэффициент детерминации , который показывает, какая доля изменения результативного признака объясняется влиянием факторного признака.
Для нахождения параметров уравнения и расчета коэффициента корреляции необходимо построить вспомогательную таблицу (табл.10.2).
Таблица 10.2
Расчет параметров уравнения и коэффициента корреляции
№ п/п | Исходные данные | Расчетные данные | |||
Факторный признак, Х | Результативный признак, У | x2 | y2 | xy | |
… | |||||
… | |||||
Итого |
При определении тесноты связи для множественной зависимости рассчитывают коэффициент множественной корреляции, предварительно определив коэффициенты парной корреляции:
,
где , . - парные коэффициенты корреляции.
Дата добавления: 2015-10-24; просмотров: 62 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Динамика физического объема продукции | | | Оценка существенности связи |