|
Федеральное Государственное Образовательное Учреждение
Высшего Профессионального образования
Сибирский федеральный университет
Институт Нефти и Газа
Кафедра МОДУС
Математическая статистика
Индивидуальное задание
Построение аналитических зависимостей
Выполнил: Горячий В.В.
Группа: НГ10-01Б
Проверил: Березина Э.В.
Красноярск 2011.
Вариант 6
Даны результаты измерения случайных величин X, Y:
x | Y | x | y | x | y | x | y | x | y |
Проведем исследование случайной величины Х:
n=100
Xmin=15
Xmax=90
Найдем размах выборки:
W=Xmax-Xmin=90-15=75
i= =25
Z1/4=X25=37
Z3/4=X76=65
Найдем медиану:
med= =49
Построим «Ящик с усами»:
15 37 49 65 90
Так как значение признака велико, можно считать, что совокупность X представляет собой НСВ. Для ее исследования строим группированный статистический ряд:
Определим количество интервалов (k):
k=1+3,3 lg100=1+6,6=7,6≈8
Группированный статистический ряд X:
№ | Xmin | Xmax | ni | Хср | niXср | Xср- | niXср2 |
-30,25 | |||||||
-20,25 | |||||||
-10,25 | |||||||
-0,25 | |||||||
9,75 | |||||||
19,75 | |||||||
34,75 | |||||||
Найдем основные числовые характеристики:
= =
m2=
S2=m2- 2=2852,25-50,25=2802
S= = 52.9
Определим коэффициент вариации:
V*=( ) =()100=105.3% 105.3%>33.3%
Т.к. коэффициент вариации больше 33,3%, выборка X не является однородной.
По числовым характеристикам можно сделать вывод, что выборка симметрична.
Строим гистограмму и полигон относительных частот:
Δi=h= = =9,375≈10
Найдем высоты:
H1= = =0,0085
H2= = =0,0149
H3= = =0,0203
H4= = =0,0235
H5= = =0,0149
H6= = =0,0149
H7= = =0,0096
Форма полигона относительных частот и гистограммы напоминают функцию распределения СВ X.
Так как выборочная дисперсия и выборочное среднеквадратическое отклонение являются смещенной оценкой дисперсии и среднеквадратического отклонения, в качестве оценки дисперсии берем исправленную выборочную дисперсию:
S2[X]= =50,76
А в качестве оценки среднеквадратического отклонения берем исправленное среднеквадратическое отклонение:
S[X]= = =7,12
Построим доверительные интервалы для оценки параметров нормального распределения математического ожидания и среднеквадратического отклонения. С доверительной вероятностью ɣ=0,95
Доверительный интервал математического ожидания m СВ X:
P(X̅ - ) < m < X̅ + () = ɣ
U(1+ɣ)/2= Ф-1(1+ɣ/2)
Ф(X) = (1+ɣ/2)
По таблице приложения для квантилей нормального распределения найдем квантиль U(1+ɣ)/2= U(1+0,95)/2 = U0,975 = 1,96
Тогда получим:
50,76 – < m < 50,76 +
49,36 < m < 52,16
P (49,36<m<52,16)=0,95
Доверительный интервал среднеквадратического отклонения σ СВ X:
P(S[1 – ] < σ < S[1 + ]) = ɣ
, где Ê=()-3 - выборочный эксцесс
m4=∑(Xi- X̅)4
U(1+ɣ)/2= Ф-1(1+ )
Определим выборочный эксцесс:
Ê=()-3= ()-3=54,7
По таблице приложения для квантилей нормального распределения найдем квантиль U(1+ɣ)/2= U(1+0,95)/2 = U0,975 = 1,96
Тогда получим:
7,12(1-0,05ˑ1,96ˑ√54,7+2) < σ < 7,12(1+0,05ˑ1,96ˑ√54,7+2)
16,2 < σ < 26,5
P (16,2< σ <26,5)=0,95
Проверка гипотезы о законе распределения выборки Х:
В нормальном распределении число параметров равно 2, поэтому число степеней свободы асимптотического закона χ2 равно r =7-2-1=4. Выбираем уровень значимости
α = 0,05 и по таблице находим квантиль распределенияχ2:
χ21-α(r)=χ20,95(4)=9,49
Построим таблицу вычисления χв2 для группированного статистического ряда X:
№ |
| ni | Ф0(bi) | p̂i= Ф0(bi)- Ф0(bi-l) | np̂i | |||||
Xmin | Xmax | |||||||||
-0,19 | -0,14 | - 0,4738
| -0,4192 | 0,0546 | 5,46 | 1,1816 | ||||
-0,14 | -0,09 | -0,4192
| -02995 | 0,1197 | 11,97 | 0,3443 | ||||
-0,09 | -0,05 | - 0,2995
| -0,1141 | 0,1854 | 18,54 | 0,0114 | ||||
-0,05 | -0,1141
| 0,1026 | 0,2167 | 21,67 | 0,005 | |||||
0,05 | 0,1026
| 0,2910 | 0,1884 | 18,84 | 1,2433 | |||||
0,05 | 0,09 | 0,2910
| 0,4131 | 0,1221 | 12,21 | 0,2624 | ||||
0,09 | 0,14 | 0,4934 | 0,0803 | 8,03 | 0,1171 | |||||
|
|
|
|
|
|
|
| 0,9672 | 96,72 | 3,1653 |
Вычисляем выборочное значение статистики критерия χв2:
Сравним χв2 и χ21-α(r):
9,49>3,1653
χ21-α(r)> χв2
На основании сравнения можно сделать вывод, что гипотеза о нормальном распределении не принимается.
Проведем исследование случайной величины Y:
Ymin=13
Ymax=36
n=100
Найдем размах выборки:
W=Ymax-Ymin=23
i= =25
Z1/4=20
Z3/4=28
Найдем медиану:
med=(Y50+Y51)/2=24
По результатам исследований строим «Ящик с усами»:
13 20 24 28 36
Так как значение признака велико, можно считать, что совокупность Y представляет собой НСВ.
Строим группированный статистический ряд:
Определим количество интервалов (k):
k=1+3,3 lg100=1+6,6=7,6≈8
Группированный статистический ряд:
№ | Ymin | Ymax | ni | Yср | niYср | Yср- | niYср2 |
14,5 | -9,4 | 1261,5 | |||||
17,5 | -6,4 | ||||||
20,5 | 430,5 | -3,4 | 8825,25 | ||||
23,5 | -0,4 | 9940,5 | |||||
26,5 | 2,6 | 15449,5 | |||||
29,5 | 5,6 | ||||||
33,5 | 301,5 | 9,6 | 10100,25 | ||||
= =23.89
m2=Σ =597
S2=m2- 2=25.8
S= =5.08
Определим коэффициент вариации:
V*=()100=21.2% 21,2%<33,3%
По значению коэффициента вариации и числовых характеристик можно сделать вывод, что выборка Y является однородной и симметричной.
Строим гистограмму и полигон событий:
Δi=h =2,875
Найдем высоты:
H1= = 5=0.02
H2= = =0.042
H3= = =0,073
H4= = =0,077
H5= = =0,0627
H6= = =0,042
H7= = =0,031
Форма полигона относительных частот и гистограммы напоминают функцию распределения СВ Y.
Так как выборочная дисперсия и выборочное среднеквадратическое отклонение являются смещенной оценкой дисперсии и среднеквадратического отклонения, в качестве оценки дисперсии берем исправленную выборочную дисперсию:
S2[Y]=∑ =25.8
А в качестве оценки среднеквадратического отклонения берем исправленное среднеквадратическое отклонение:
S[Y]= = =5.08
Построим доверительные интервалы для оценки параметров нормального распределения математического ожидания и среднеквадратического отклонения. С доверительной вероятностью ɣ=0,95
Доверительный интервал математического ожидания m СВ Y:
P (Ȳ - () < m < Ȳ +() = ɣ
U(1+ɣ)/2= Ф-1(1+ɣ/2)
Ф(X) = (1+ )
По таблице приложения для квантилей нормального распределения найдем квантиль U(1+ɣ)/2= U(1+0,95)/2 = U0,975 = 1,96
Тогда получим:
25.8 – (5.08ˑ1,96)/10 < m < 25.8 + (5,08ˑ1,96)/10
24,8 < m < 26,8
P (24,8<m<26,8)=0,95
Доверительный интервал среднеквадратического отклонения σ СВ Y:
P(S[1 – ( ] < σ < S[1 + ( ]) = ɣ
, где Ê=()-3 - выборочный эксцесс
m4 =1600.8
U(1+ɣ)/2= Ф-1(1+ )
Определим выборочный эксцесс:
Ê=()-3=()-3=-0,415
По таблице приложения для квантилей нормального распределения найдем квантиль U(1+ɣ)/2= U(1+0,95)/2 = U0,975 = 1,96
Тогда получим:
5.08(1-0,05ˑ1,96 +2) < σ < 5.08(1+0,05ˑ1,96 +2)
14.9 < σ < 15.6
P (14.9< σ <15.6)=0,95
Проверка гипотезы о законе распределения выборки Y:
В нормальном распределении, число оцениваемых параметров равно 2, поэтому число степеней свободы асимптотического закона χ2 равно r =7-2-1=4. Выбираем уровень значимости α = 0,05 и по таблице находим квантиль распределенияχ2:
χ21-α(r)=χ20,95(4)=9,49
Построим таблицу вычисления χв2 для группированного статистического ряда Y:
i | Ymin Ymax | ni | Ф0(bi) | p̂i= Ф0(bi)- Ф0(bi-l) | np̂i | |||||
-2.14567 | -1.55512 | -0.4838 | -0,4394 | 0,0444 | 4.44 | 54.8 | ||||
-1.55512 | -0.96457 | -0,4394 | -0,3315 | 0,1079 | 10.8 | 13.57 | ||||
-0.96457 | -0.37402 | -0,3315 | -0,1443 | 0,1872 | 18.7 | 27.8 | ||||
-0.37402 | 0.216535 | -0,1443 | 0,0832 | 0,2275 | 22.75 | 99.2 | ||||
0.216535 | 0.807087 | 0,0832 | 0,2881 | 0,2049 | 20.5 | 11.1 | ||||
0.807087 | 1.397638 | 0,291 | 0,4192 | 0,1282 | 12.8 | 5.24 | ||||
1.397638 | 2.38189 | 0,4192 | 0,4913 | 0,0721 | 7.21 | 44.4 | ||||
|
|
|
|
|
|
|
| 97.22 | 256.13 |
Вычисляем выборочное значение статистики критерия χв2:
Сравним χв2 и χ21-α(r):
9,49 < 256,13
χ21-α(r)< χв2
На основании сравнения можно сделать вывод, что гипотеза о нормальном распределении принимается, но могла и произойти ошибка второго рода (принятие неверной гипотезы).
Корреляционный и регрессионный анализ.
Для рассмотрения аналитических зависимостей между СВ X и Y определим коэффициент корреляции:
rxy=
=50,25
=24,33
=1309,53
=2832,27
=616,83
rxy= 0,994504
rxy≈1, следовательно, между СВ Х и СВ У линейная зависимость.
Регрессивный анализ:
Найдем уравнение регрессии Y на X:
На основании проведенных исследований сделаем предположение о линейной зависимости СВ:
y=ax+b
,где x – факторная переменная.
Рассмотрим функцию S(a;b)=
Подставим значения и найдем a и b:
a283227+b5025=130935
a5025+b100=2433
a= 0,282436
b= 10,13758
y=0,282436x+10,13758
Построим уравнение регрессии X на Y:
На основании проведенных исследований сделаем предположение о линейной зависимости СВ:
x=cy+d
,где y – факторная переменная.
Найдем коэффициенты c и d с помощью метода наименьших квадратов:
S(c;d)=
c ;
c
Найдем с и d:
c61683+d 2433= 130953
c2433+d100=5025
c=3,494534
d=-34,772
x=3,494534y-34,772
Отсюда:
y=0,286161x-9,9504
Таблица данных к графику:
24,25939 | 24,25846 | |
50,05 | 24,27351 | 24,27277 |
50,1 | 24,28763 | 24,28708 |
50,15 | 24,30176 | 24,30138 |
50,2 | 24,31588 | 24,31569 |
50,25 | 24,33 | 24,33 |
50,3 | 24,34412 | 24,34431 |
50,35 | 24,35824 | 24,35862 |
50,4 | 24,37237 | 24,37292 |
50,45 | 24,38649 | 24,38723 |
50,5 | 24,40061 | 24,40154 |
50,55 | 24,41473 | 24,41585 |
50,6 | 24,42885 | 24,43016 |
50,65 | 24,44297 | 24,44446 |
50,7 | 24,4571 | 24,45877 |
Дата добавления: 2015-08-28; просмотров: 35 | Нарушение авторских прав
<== предыдущая лекция | | | следующая лекция ==> |
Старик остался мужчиной до конца, а ты парень человек! Ранее утро 8 марта. Будильник зазвенел, и даже не успев, как следует начать свою песню, умолк под натиском моего пальца. Почти в темноте я | | | І вітчизняний, і зарубіжний досвід показує, що кадрова політика є надійним механізмом управління системою освіти, підвищення ефективності всіх її ресурсів, забезпечення цілісності та стійкості її |