Читайте также:
|
|
Линейная регрессия сводится к нахождению уравнения вида
или . (1.1)
Уравнение вида позволяет по заданным значениям фактора находить теоретические значения результативного признака, подставляя в него фактические значения фактора .
Построение линейной регрессии сводится к оценке ее параметров – и .
Представим, что есть два ряда данных:
x = х1, х2,…, хn;
y = y1, y2,…, yn;
Каждое из наблюдений характеризуется двумя параметрами xj,yj. В парной линейной регрессии связь между переменными определяется следующим образом:
Где Y – зависимая (объясняемая) переменная, реальная либо фактическая (как ее еще называют эмпирическая, т.е. наблюдавшаяся в действительности); Х — независимая (объясняющая) переменная; — зависимая переменная (результат), рассчитанная с помощью уравнения регрессии, называемая также теоретической (в данном случае она вычисляется по линейному уравнению регрессии); а, b — константы, или параметры, уравнения линейной регрессии; — случайная компонента, или возмущение.
Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем по совокупности в целом наблюдаемых данных. Так, если зависимость потребления электроэнергии у от объема выпускаемой продукции х можно представить в следующем виде: у = 1500 + 24,8х, то это означает, что при увеличении объема выпуска на 1 ед. потребление электроэнергии в среднем возрастает на 24,8 ед. Таким образом, в уравнении регрессии связь между результатом и фактором представляется в качестве функциональной, причем функция, определяющая вид уравнения регрессии, может быть не только линейной.
Каждую пару наблюдений xi,yi можно представить в виде точки на плоскости ху. Такое графическое построение называется полем корреляции. В этом случае наилучшей считается функция, график которой проходит через наибольшее количество точек или как можно ближе к ним (рис. 2.1).
В каждом из наблюдений величину случайной компоненты можно определить как разность между фактическим значением результата и рассчитанным по уравнению регрессии:
Если на графике все точки (хi, уi) совпадают с линией регрессии, тогда между результативным признаком у и фактором х существует строгая функциональная связь и выполняется следующее равенство:
ε=0 для каждого i= 1, 2, …,n
В экономических процессах такое равенство практически не встречается, так как экономические данные обычно нt связаны строгой функциональной связью. Но во всех случаях, когда применение МНК оправдано, верно, что , поэтому в качестве меры отклонений используется сумма квадратов отклонений (см. 1.3 — остаточная дисперсия Dост.)
Случайная компонента ε по своей сути есть случайная величина, или, как ее еще называют, возмущение. Она характеризует воздействие не учтенных в модели факторов, каких-либо случайных влияний, неправильный выбор специфики модели и в некоторых случаях может быть связана с особенностями измерения. Как уже было сказано, данные, которые описывают экономический процесс, не могут иметь строгую функциональную связь, кроме того, при эконометрических исследованиях используется случайная выборка данных, что и обусловливает постоянное наличие случайной компоненты. Размер остаточной дисперсии Dост. может также зависеть от выбранного вида уравнения регрессии. Соответственно чем она меньше, тем лучше будет подобрана функция.
3. При эконометрических исследованиях часто встречаются ошибки различного рода. Их принято подразделять на три вида
1. Ошибки спецификации. От правильно выбранной спецификации модели зависит величина случайных ошибок Последняя будет тем меньше, чем ближе рассчитанные с помощью уравнения регрессии значения результативного признака ух подходят к фактическим данным y.
К ошибкам спецификации относится не только неправильный выбор той или иной математической функции для расчета , но и отсутствие в построенном уравнении регрессии какого-либо существенного фактора, т.е. использование парной регрессии вместо множественной или двух- вместо трехфакторной. Так, ценность работника может зависеть не только от его квалификации, но и от таких факторов, как возраст, пол и т.д. Ошибки спецификации — это ошибки, которые могут быть сведены исследователем к минимуму с помощью изменения вида уравнения регрессии (в результате замены линейной связи на нелинейную, лучше подходящую функцию, замена парной регрессии на множественную). Из рис. 2.2 следует, что нелинейная регрессия лучше описывает связь между результатом у и фактором х.
2. Ошибки выборки. Они могут иметь место наряду с ошибками спецификации, поскольку исследователь чаще всего работает с выборочными данными при установлении закономерной связи между признаками. Ошибки выборки обусловливаются и неоднородностью данных в исходной статистической совокупности, что, как правило, бывает при изучении экономических процессов. Если совокупность неоднородна, то уравнение регрессии не имеет практической смысла. При исследовании, например, зависимости качеств; товара определенного вида от его цены, в выборку данных могут попасть товары этого же типа, но другого уровня (сейчас очень часто цена зависит от престижности марки товара причем качество в этом случае не всегда играет основную роль). Для получения хорошего результата из совокупности обычно исключают единицы с аномальными значениями исследуемых признаков. Из рис. 2.3 следует, что некоторые значения для улучшения результатов регрессии нужно исключить из выборки. Но и при этом результаты регрессии представляют собой выборочные характеристики. Для получения более достоверных результатов регрессии можно увеличить также объем исследуемой выборки данных.
3. Ошибки измерения. Они являются практически неустранимыми при использовании методов регрессии. Если ошибки спецификации можно уменьшить за счет изменение формы модели, а ошибки выборки — за счет увеличения объема исходных данных, то ошибки измерения в принципе не поддаются минимизации. В связи с этим количественная оценка связи между признаками не будет достаточно достоверной. Особенно часто ошибки измерения встречаются при исследованиях на макроуровне. Так, в исследованиях спроса и потребления в качестве объясняющей переменной широко используется доход на душу населения. Вместе с тем статистическое измерение величины дохода сопряжено с рядом трудностей и не лишено возможных ошибок, в частности, за счет наличия сокрытых доходов. Классическим примером также являются эконометрические изыскания, основанные на экономических показателях, которые предприятия представляют в налоговые инспекции, вышестоящие организации, статистические управления. Достоверность этих данных никто не подтверждает, и чем больше в исследование попадает такой непроверенной информации, не соответствующей реальной действительности, тем больше ошибки измерения. К сожалению, такие ошибки практически невозможно устранить, так же как нельзя проверить достоверность всей информации.
При проведении эконометрических исследований за основу принимается предположение о том, что ошибки измерения отсутствуют или минимальны, и основное внимание уделяется уменьшению ошибок спецификации.
4. После того как выбрана модель и определен ее вид, следующим шагом является оценка параметров модели. Для линейной парной регрессии вида
необходимо оценить свободный член уравнения регрессии (константу) а и коэффициент регрессии b. Для определения параметров модели можно использовать следующие критерии:
1) сумму квадратов отклонений фактических значений результата у от рассчитанных с помощью уравнения регрессии :
Эта сумма, используется в методе наименьших квадратов, который является одним из основных методов эконометрики;
2) сумму модулей отклонений наблюдаемых значений зависимой переменной у от ее расчетных величин :
3) Сумма, включающая отклонения с определенной мерой,
Где g - мера, с которой отклонение для i - го наблюдения входит в функционал.
Дата добавления: 2015-07-14; просмотров: 76 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Тема 2. Парная линейная регрессия и корреляция | | | Использование метода наименьших квадратов для расчета параметров парной линейной регрессии. |