Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Лабораторная работа № 3.

Читайте также:
  1. D триггеры, работающие по фронту.
  2. I. ВНЕАУДИТОРНАЯ САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ
  3. I. ВНЕАУДИТОРНАЯ САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ
  4. I. ВНЕАУДИТОРНАЯ САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ
  5. I. ВНЕАУДИТОРНАЯ САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ
  6. I. ВНЕАУДИТОРНАЯ САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ
  7. I. ВНЕАУДИТОРНАЯ САМОСТОЯТЕЛЬНАЯ РАБОТА СТУДЕНТОВ

 

Тема работы: построение модели линейной регрессиидля несгруппированных данных.

 

Цель работы: овладение способами построения моделей линейной регрессии для несгруппированных данных, выработка умения и навыков оценки надежности коэффициента корреляции, уравнения регрессии и его коэффициентов.

 

Дано: Результаты наблюдений зависимости фазовой проницаемости нефти Y от насыщенности породы нефтью X представлены в таблице 10.

 

Таблица 10 - Результаты наблюдений зависимости фазовой проницаемости нефти Y от насыщенности породы нефтью X.

 

X 0,05 0,15 0,25 0,35 0,45 0,55 0,65 0,75 0,85 0,95
Y 0,35 0,45 0,55 0,65 0,75 0,8 0,85 0,95   1,25

 

Содержание работы: на основании опытных данных требуется:

1. Построить корреляционное поле. По характеру расположения точек в корреляционном поле выбрать общий вид регрессии.

2. Вычислить числовые характеристики , , , , , .

3. Определить значимость коэффициента корреляции и найти для него доверительный интервал с надежностью .

4. Написать эмпирические уравнения линий регрессий на и на .

5. Вычислить коэффициент детерминации и объяснить его смысловое значение.

6. Проверить адекватность уравнения регрессии на .

7. Провести оценку величины погрешности уравнения регрессии на и его коэффициентов.

8. Построить уравнение регрессии на в первоначальной системе координат.

 

Выполнение работы:

 

1. Для определения формы связи между признаками X и Y строим на координатной плоскости (рисунок 5) точки (xi;yi), пользуясь таблицей 10. Около построенных точек проводим линию тренда так, чтобы построенные точки были расположены как можно ближе к ней. По расположению точек около линии тренда делаем вывод о том, что связь между фазовой проницаемости нефти Y и насыщенности породы нефтью X может носить линейный характер.

 

 

Рисунок 5 - Линейная регрессия Y на X.

 

2. Произведем расчет статистик x̄, ȳ, Sx, Sy, r, которые войдут в уравнения линий регрессий. Составим расчетную таблицу 11.

 

Таблица 11 - расчет статистик x̄, ȳ, Sx, Sy, r.

 

xi xi-x̄ (xi-x̄)2 yi yi-ȳ (yi-ȳ)2 x2 xy
0,05 -0,47 0,221 0,35 -0,41 0,168 0,003 0,018
0,35 -0,17 0,029 0,45 -0,31 0,096 0,123 0,158
0,25 -0,27 0,073 0,55 -0,21 0,044 0,063 0,138
0,35 -0,17 0,029 0,65 -0,11 0,012 0,123 0,228
0,45 -0,07 0,005 0,75 -0,01 0,000 0,203 0,338
0,55 0,03 0,001 0,8 0,04 0,002 0,303 0,440
0,65 0,13 0,017 0,85 0,09 0,008 0,423 0,553
0,75 0,23 0,053 0,95 0,19 0,036 0,563 0,713
0,85 0,33 0,109   0,24 0,058 0,723 0,850
0,95 0,43 0,185 1,25 0,49 0,240 0,903 1,188
5,2   0,721 7,6   0,664 3,425 4,620

 

Пользуясь результатами последней строки таблицы 11 находим x̄,ȳ,Sx,Sy,r.

 

 

 

 

 

 

 

 

 

 

 

 

 

3. Проверяем значимость коэффициента корреляции.

3.1. Вычислим статистику по формуле:

 

 

 

3.2. По таблице критических точек распределения Стьюдента (приложение 6 учебного пособия «Статистические методы решения инженерных задач» под редакцией В. И. Губина, В. Н. Осташкова) по уровню значимости α=0,05 и числу степеней свободы k = n - 2 = 10 - 2 = 8 находим tт=2,306. Т.к. tp>tт то выборочный коэффициент корреляции значимо отличается от нуля. Следовательно, можно предположить, что фазовая проницаемость Y и насыщенность породы нефтью X связаны линейной регрессионной зависимостью, и провести приблизительную прямую на числовой плоскости.

3.3. Находим доверительный интервал для выборочного коэффициента корреляции rc с надежностью ɣ=0,95 по формуле:

 

 

3.3.1. По таблице функции Лапласа (приложение 3 учебного пособия «Статистические методы решения инженерных задач» под редакцией В. И. Губина, В. Н. Осташкова) находим tɣ. tɣ=1,96.

3.3.2. Вычисляем среднюю квадратическую ошибку σr по формуле:

 

 

 

 

3.3.3. с вероятностью 0,95 линейный коэффициент корреляции генеральной совокупности находится в пределах от 0,69 до 1. По имеющейся выборке следует ожидать влияние насыщенности породы нефтью на фазовую проницаемость нефти не менее чем на 69%. 4. Найдем эмпирические линейные уравнения регрессии y на x и x на y, которые являются приближенными уравнениями для истинных уравнений регрессий.

 

 

 

 

 

 

 

4.1. Произведем контроль вычислений a1b1 = r2. 0,91 * 0,83 = 0,755 - решение выполнено верно.

Из уравнения ŷx=0,83x+0,24 видно, что при увеличении нефтенасыщенности на 1 фазовая проницаемость возрастет на 8,3.

Подставляя x̅, y̅ в уравнения регрессий, получаем точки, координаты которых совпадают с координатами центра распределения C(x̅;y̅). Следовательно, линии регрессий пересекаются в точке C(x̅;y̅).

5. Найдем коэффициент детерминации. Для линейной регрессии при вычисленном коэффициенте r он равен r2 =0,755. Это означает, что 75 % рассеивания фазовой проницаемости нефти объясняется линейной регрессионной зависимостью между фазовой проницаемостю и насыщенностью породы нефтью, и только 25% рассеивания средней фазовой проницаемости нефти остались необъяснимыми. Такое положение могло произойти из-за того, что в модель не включены другие факторы, влияющие на изменение фазовой проницаемости нефти, либо опытных данных в данной выборке не достаточно, чтобы построить более надежное уравнение регрессии.

6. Проверим адекватность уравнения линейной регрессии x на y по критерию Фишера-Снедекора.

6.1. Вычислим статистику по формуле:

 

 

 

6.2. Для нахождения суммы составляем таблицу12.

 

Таблица 12 - расчет коэффициента детерминации (R2).

 

yi ŷx yix (yix)2
0,35 0,04 0,31 0,0951
0,45 0,29 0,16 0,0250
0,55 0,21 0,34 0,1166
0,65 0,29 0,36 0,1283
0,75 0,38 0,37 0,1405
0,8 0,46 0,34 0,1165
0,85 0,54 0,31 0,0949
0,95 0,63 0,32 0,1054
  0,71 0,29 0,0848
1,25 0,79 0,46 0,2096

=0,1259

 

 

 

6.3. При уровне значимости и числах степеней свободы , по таблице критических точек распределения Фишера -Снедекора (приложение 7 учебного пособия «Статистические методы решения инженерных задач» под редакцией В. И. Губина, В. Н. Осташкова) находим Fт=5,32.

Т.к. Fн > Fт то заключаем, что уравнение линейной регрессии ŷx = 0,83x + 0,24 статистически значимо описывает результаты эксперимента.

7. Проведем оценку величины погрешности уравнения линейной регрессии ŷx= 0,83x + 0,24.

7.1. Найдем относительную погрешность (δ) уравнения по формулам:

 

 

 

 

 

 

7.2. Для нахождения суммы составляем таблицу 13.

 

Таблица 13 - определение суммы (ui - u̅)2.

 

ui ui-u̅ (ui-u̅)2
0,31 0,1966 0,0387
0,16 0,0465 0,0022
0,34 0,2299 0,0528
0,36 0,2465 0,0608
0,37 0,2631 0,0692
0,34 0,2297 0,0528
0,31 0,1963 0,0385
0,32 0,2130 0,0453
0,29 0,1796 0,0322
0,46 0,3462 0,1198

=0,5124

 

 

 

Так как величина δ мала, то уравнение линейной регрессии ŷx= 0,83x + 0,24 хорошо описывает опытные данные.

8. Оценим коэффициенты уравнения регрессии. В нашем случае а0=0,24, а1=0,83.

8.1. Вычислим средние квадратические ошибки коэффициентов по формулам:

 

 

 

 

 

 

 

 

 

Так как условия выполняются, то коэффициенты а0 и а1 уравнения регрессии у на х значимы. Графиками найденных регрессий являются прямые представленные на рисунке 5. Таким образом, уравнение регрессии, ŷx= 0,83x+0,24 значимо описывает опытные данные и может быть принято для практического руководства.


Дата добавления: 2015-11-26; просмотров: 59 | Нарушение авторских прав



mybiblioteka.su - 2015-2024 год. (0.02 сек.)