Читайте также:
|
|
1. За даними вибірки С побудувати рівняння регресії Y по X та X по Y, скориставшись функцією ЛИНЕЙН() MS Excel.
2. На відповідних точкових діаграмах за допомогою команди Добавить линию тренда побудувати графіки лінійної та деякої нелінійної регресії (підібрати таку нелінійну функцію, яка найкраще пояснює емпіричні дані, тобто має R2»1). Висунути гіпотезу про те, яка функція краще апроксимує експериментальні дані.
3. За допомогою процедури Регрессия Пакета Анализа виконати лінійний регресійний аналіз Y по Х. Зробити висновки.
4. За допомогою процедури Регрессия Пакета Анализа побудувати рівняння множинної лінійної регресії змінної Y від Х та Z. Зробити аналіз отриманих результатів.
5. Ознайомитися з інструментами регресійного аналізу пакета SPSS (Analyze –> Regression). У пакті SPSS виконати регресійний аналіз Y по Х та множинний регресійний аналіз Y по X та Z.
6. За допомогою процедури Analyze –> Curve Estimation побудувати до даних лінійну та квадратичну регресію. Порівняти результати, з’ясувати, яка функція краще апроксимує дані.
7. Ознайомитися з інструментами регресійного аналізу пакета Statistica (Statistics –> Multiple Regression). Виконати регресійний аналіз Y по Х у пакті Statistica.
8. Порівняти результати, отримані у трьох пакетах. Зробити висновки.
Приклади виконання:
A | B | C | D | |
Довжина (X) | Ширина (Y) | Кількість зубців (Z) | ||
рослина 1 | ||||
рослина 2 | ||||
рослина 3 | ||||
рослина 4 | ||||
рослина 5 | ||||
рослина 6 | ||||
рослина 7 | ||||
рослина 8 | ||||
рослина 9 | ||||
рослина 10 |
Приклад 1: Студентам було запропоновано виміряти довжину та ширину (у мм) середнього листка у вибраних навмання рослин лісової полуниці та порахувати кількість зубців на листку. Результати вимірювань наведено у таблиці.
З’ясувати, чи існує зв’язок між змінними. Побудувати діаграми розсіювання.
Виконання:
Зручно подати результати обчислень під таблицею вхідних даних. Нижче наведено формули, які слід ввести у даному випадку до комірок В14, С14, D14 та Е14 відповідно.
B14 | C14 | D14 | E14 | |
Коефіцієнт кореляції за Пірсоном для першого та другого стовпців даних | Емпіричне значення t-критерія для оцінки достовірності отриманого коефіцієнту кореляції | Імовірність помилки І роду (α) | Результати порівняння α з обраним рівнем значущості та висновки | |
Rxy | =ПИРСОН(B2:B11;C2:C11) | =B14*КОРЕНЬ(10-2)/КОРЕНЬ(1-B14^2) | =СТЬЮДРАСП(C14;10-2;2) | =ЕСЛИ(D14<0,05;"H1";"H0") |
Для наведеного прикладу отримаємо:
Кореляція (r) | t-критерій | alpha | Висновок | |
Rxy | 0,826997062 | 4,160574433 | 0,003162722 | H1 |
Rxz | 0,821279263 | 4,071553121 | 0,00357572 | H1 |
Ryz | 0,718129688 | 2,918738829 | 0,019328577 | H1 |
Тобто в усіх випадках кореляція достовірна. Для rxy та rxz на рівні значущості a=0,01. А для ryz лише на рівні значущості a=0,05.
Для оцінки необхідного обсягу вибірки вводимо формули:
=ФИШЕР(B14) | =2,58^2/$B18^2+3 | =1,96^2/$B18^2+3 |
Перетворене за Фішером значення коефіцієнту кореляції | Обсяг вибірки необхідний для рівня значущості 5% | Обсяг вибірки необхідний для рівня значущості 5% |
Виконавши обчислення у даному випадку отримуємо таке:
n1% | n5% | ||
Z(xy) | 1,178560185 | 7,792210445 | 5,76572256 |
Z(xz) | 1,160734982 | 7,940526868 | 5,851320236 |
Z(yz) | 0,903772255 | 11,14932058 | 7,703207431 |
З таблиці видно, що необхідне значення n менше 10 (наявного обсягу вибірки), тобто даних цілком достатньо для того, щоб вважати отриманий коефіцієнт кореляції достовірним. Однак для коефіцієнта кореляції між змінними Y та Z на рівні значущості α=0,01 для прийняття достовірних висновків кількість спостережень слід збільшити хоча б до 12.
Діаграму розсіювання для змінних Х та Y зображено на Рис. 3.1. На ній видно, що більшість точок майже лежить на прямій з додатним кутовим коефіцієнтом. Тобто за діаграмою можна припустити наявність сильного прямого зв’язку між змінними, що і підтверджується обчисленнями.
Порядок обчислення коефіцієнта кореляції за формулою Cпірмена для змінних X та Y представлено на наступній таблиці:
A | B | C | D | E | F | G | H | |
Довжина (X) | Ширина (Y) | Кількість зубців (Z) | Ранг Х | Ранг Y | d | d^2 | ||
рослина 1 | 2,5 | 0,5 | 0,25 | |||||
рослина 2 | 7,5 | -4,5 | 20,25 | |||||
рослина 3 | 2,5 | 0,5 | 0,25 | |||||
рослина 4 | ||||||||
рослина 5 | ||||||||
рослина 6 | ||||||||
рослина 7 | ||||||||
рослина 8 | ||||||||
рослина 9 | 7,5 | -0,5 | 0,25 | |||||
рослина 10 |
Сума значень останнього стовпця Sd2=37. Відповідно rs = 0,776. Це значення менше за коефіцієнт кореляції Пірсона, однак воно теж свідчить про значний позитивний зв’язок між змінними, у даному разі – між шириною та довжиною листка.
У пакеті SPSS результати кореляційного аналізу можна отримати одразу для усіх вказаних змінних. Для даного прикладу вони будуть такими. Якщо вказано виводити параметри поисової статистики, то у першій таблиці для кожної змінної будуть виведені середнє та стандартне квадратичне відхилення.
У другій таблиці буде виведено результати обчислення коефіцієнтів кореляції за Пірсоном. Однією зірочкою (*) позначено результати достовірні на рівні значущості a=0,05, а двома зірочками (**) – результати достовірні на рівні значущості a=0,01. Крім коефіцієнтів кореляції у кожній клітинці таблиці наведено також p-значення та кількість порівнюваних пар чисел. Як бачимо результат не відрізняється від отриманого в MS Excel.
На третій таблиці наведено результати обчислення за ранговими критеріями Кендала та Спірмена. За цими критеріями кореляція між змінними Y та Z не визнається достовірною.
Дата добавления: 2015-11-14; просмотров: 37 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Завдання 1а: Виконати кореляційний аналіз вибірки С у пакеті MS Excel. | | | Nonparametric Correlations |