Читайте также:
|
|
Тема работы: построение модели линейной регрессиидля несгруппированных данных.
Цель работы: овладение способами построения моделей линейной регрессии для несгруппированных данных, выработка умения и навыков оценки надежности коэффициента корреляции, уравнения регрессии и его коэффициентов.
Дано: Результаты наблюдений зависимости фазовой проницаемости нефти Y от насыщенности породы нефтью X представлены в таблице 10.
Таблица 10 - Результаты наблюдений зависимости фазовой проницаемости нефти Y от насыщенности породы нефтью X.
X | 0,05 | 0,15 | 0,25 | 0,35 | 0,45 | 0,55 | 0,65 | 0,75 | 0,85 | 0,95 |
Y | 0,35 | 0,45 | 0,55 | 0,65 | 0,75 | 0,8 | 0,85 | 0,95 | 1,25 |
Содержание работы: на основании опытных данных требуется:
1. Построить корреляционное поле. По характеру расположения точек в корреляционном поле выбрать общий вид регрессии.
2. Вычислить числовые характеристики , , , , , .
3. Определить значимость коэффициента корреляции и найти для него доверительный интервал с надежностью .
4. Написать эмпирические уравнения линий регрессий на и на .
5. Вычислить коэффициент детерминации и объяснить его смысловое значение.
6. Проверить адекватность уравнения регрессии на .
7. Провести оценку величины погрешности уравнения регрессии на и его коэффициентов.
8. Построить уравнение регрессии на в первоначальной системе координат.
Выполнение работы:
1. Для определения формы связи между признаками X и Y строим на координатной плоскости (рисунок 5) точки (xi;yi), пользуясь таблицей 10. Около построенных точек проводим линию тренда так, чтобы построенные точки были расположены как можно ближе к ней. По расположению точек около линии тренда делаем вывод о том, что связь между фазовой проницаемости нефти Y и насыщенности породы нефтью X может носить линейный характер.
Рисунок 5 - Линейная регрессия Y на X.
2. Произведем расчет статистик x̄, ȳ, Sx, Sy, r, которые войдут в уравнения линий регрессий. Составим расчетную таблицу 11.
Таблица 11 - расчет статистик x̄, ȳ, Sx, Sy, r.
xi | xi-x̄ | (xi-x̄)2 | yi | yi-ȳ | (yi-ȳ)2 | x2 | xy |
0,05 | -0,47 | 0,221 | 0,35 | -0,41 | 0,168 | 0,003 | 0,018 |
0,35 | -0,17 | 0,029 | 0,45 | -0,31 | 0,096 | 0,123 | 0,158 |
0,25 | -0,27 | 0,073 | 0,55 | -0,21 | 0,044 | 0,063 | 0,138 |
0,35 | -0,17 | 0,029 | 0,65 | -0,11 | 0,012 | 0,123 | 0,228 |
0,45 | -0,07 | 0,005 | 0,75 | -0,01 | 0,000 | 0,203 | 0,338 |
0,55 | 0,03 | 0,001 | 0,8 | 0,04 | 0,002 | 0,303 | 0,440 |
0,65 | 0,13 | 0,017 | 0,85 | 0,09 | 0,008 | 0,423 | 0,553 |
0,75 | 0,23 | 0,053 | 0,95 | 0,19 | 0,036 | 0,563 | 0,713 |
0,85 | 0,33 | 0,109 | 0,24 | 0,058 | 0,723 | 0,850 | |
0,95 | 0,43 | 0,185 | 1,25 | 0,49 | 0,240 | 0,903 | 1,188 |
5,2 | 0,721 | 7,6 | 0,664 | 3,425 | 4,620 |
Пользуясь результатами последней строки таблицы 11 находим x̄,ȳ,Sx,Sy,r.
3. Проверяем значимость коэффициента корреляции.
3.1. Вычислим статистику по формуле:
3.2. По таблице критических точек распределения Стьюдента (приложение 6 учебного пособия «Статистические методы решения инженерных задач» под редакцией В. И. Губина, В. Н. Осташкова) по уровню значимости α=0,05 и числу степеней свободы k = n - 2 = 10 - 2 = 8 находим tт=2,306. Т.к. tp>tт то выборочный коэффициент корреляции значимо отличается от нуля. Следовательно, можно предположить, что фазовая проницаемость Y и насыщенность породы нефтью X связаны линейной регрессионной зависимостью, и провести приблизительную прямую на числовой плоскости.
3.3. Находим доверительный интервал для выборочного коэффициента корреляции rc с надежностью ɣ=0,95 по формуле:
3.3.1. По таблице функции Лапласа (приложение 3 учебного пособия «Статистические методы решения инженерных задач» под редакцией В. И. Губина, В. Н. Осташкова) находим tɣ. tɣ=1,96.
3.3.2. Вычисляем среднюю квадратическую ошибку σr по формуле:
3.3.3. с вероятностью 0,95 линейный коэффициент корреляции генеральной совокупности находится в пределах от 0,69 до 1. По имеющейся выборке следует ожидать влияние насыщенности породы нефтью на фазовую проницаемость нефти не менее чем на 69%. 4. Найдем эмпирические линейные уравнения регрессии y на x и x на y, которые являются приближенными уравнениями для истинных уравнений регрессий.
4.1. Произведем контроль вычислений a1b1 = r2. 0,91 * 0,83 = 0,755 - решение выполнено верно.
Из уравнения ŷx=0,83x+0,24 видно, что при увеличении нефтенасыщенности на 1 фазовая проницаемость возрастет на 8,3.
Подставляя x̅, y̅ в уравнения регрессий, получаем точки, координаты которых совпадают с координатами центра распределения C(x̅;y̅). Следовательно, линии регрессий пересекаются в точке C(x̅;y̅).
5. Найдем коэффициент детерминации. Для линейной регрессии при вычисленном коэффициенте r он равен r2 =0,755. Это означает, что 75 % рассеивания фазовой проницаемости нефти объясняется линейной регрессионной зависимостью между фазовой проницаемостю и насыщенностью породы нефтью, и только 25% рассеивания средней фазовой проницаемости нефти остались необъяснимыми. Такое положение могло произойти из-за того, что в модель не включены другие факторы, влияющие на изменение фазовой проницаемости нефти, либо опытных данных в данной выборке не достаточно, чтобы построить более надежное уравнение регрессии.
6. Проверим адекватность уравнения линейной регрессии x на y по критерию Фишера-Снедекора.
6.1. Вычислим статистику по формуле:
6.2. Для нахождения суммы составляем таблицу12.
Таблица 12 - расчет коэффициента детерминации (R2).
yi | ŷx | yi-ŷx | (yi-ŷx)2 |
0,35 | 0,04 | 0,31 | 0,0951 |
0,45 | 0,29 | 0,16 | 0,0250 |
0,55 | 0,21 | 0,34 | 0,1166 |
0,65 | 0,29 | 0,36 | 0,1283 |
0,75 | 0,38 | 0,37 | 0,1405 |
0,8 | 0,46 | 0,34 | 0,1165 |
0,85 | 0,54 | 0,31 | 0,0949 |
0,95 | 0,63 | 0,32 | 0,1054 |
0,71 | 0,29 | 0,0848 | |
1,25 | 0,79 | 0,46 | 0,2096 |
=0,1259
6.3. При уровне значимости и числах степеней свободы , по таблице критических точек распределения Фишера -Снедекора (приложение 7 учебного пособия «Статистические методы решения инженерных задач» под редакцией В. И. Губина, В. Н. Осташкова) находим Fт=5,32.
Т.к. Fн > Fт то заключаем, что уравнение линейной регрессии ŷx = 0,83x + 0,24 статистически значимо описывает результаты эксперимента.
7. Проведем оценку величины погрешности уравнения линейной регрессии ŷx= 0,83x + 0,24.
7.1. Найдем относительную погрешность (δ) уравнения по формулам:
7.2. Для нахождения суммы составляем таблицу 13.
Таблица 13 - определение суммы (ui - u̅)2.
ui | ui-u̅ | (ui-u̅)2 |
0,31 | 0,1966 | 0,0387 |
0,16 | 0,0465 | 0,0022 |
0,34 | 0,2299 | 0,0528 |
0,36 | 0,2465 | 0,0608 |
0,37 | 0,2631 | 0,0692 |
0,34 | 0,2297 | 0,0528 |
0,31 | 0,1963 | 0,0385 |
0,32 | 0,2130 | 0,0453 |
0,29 | 0,1796 | 0,0322 |
0,46 | 0,3462 | 0,1198 |
=0,5124
Так как величина δ мала, то уравнение линейной регрессии ŷx= 0,83x + 0,24 хорошо описывает опытные данные.
8. Оценим коэффициенты уравнения регрессии. В нашем случае а0=0,24, а1=0,83.
8.1. Вычислим средние квадратические ошибки коэффициентов по формулам:
Так как условия выполняются, то коэффициенты а0 и а1 уравнения регрессии у на х значимы. Графиками найденных регрессий являются прямые представленные на рисунке 5. Таким образом, уравнение регрессии, ŷx= 0,83x+0,24 значимо описывает опытные данные и может быть принято для практического руководства.
Дата добавления: 2015-11-26; просмотров: 59 | Нарушение авторских прав