Читайте также:
|
|
Вступ
Методичні вказівки призначенідля практичного освоєння теоретичного курсу статистики з теми “Ряди розподілу” на конкретному прикладі в процесі виконання курсової роботи. Письмове виконання курсової роботи сприяє не тільки поглибленому вивчанню методів статистики, але й придбанню практичних навичок з розрахунку статистичних показників, правильної побудови й оформлення таблиць, графіків. Основна мета розробок – навчити розумінню суті розрахункових показників та їхнього аналізу.
Керівник курсової роботи видає студентові завдання з вихідними даними, у т.ч. - на тему “Ряди розподілу”, і встановлює порядок, обсяг і термін завершення розрахунків, аналізу і підготовки до захисту.
Керівник роботи:
- контролює процес виконання роботи;
- рекомендує літературу і довідкові матеріали;
- проводить консультації зі студентами;
- допомагає в обробці вихідних даних і в складанні висновків;
- перевіряє виконані розрахунки.
Перед рішенням кожної задачі необхідно ретельно вивчити її зміст.
Перш ніж приступати до практичного виконання завдань, варто уважно ознайомитися із відповідним матеріалом методичних вказівок та літературою з рекомендованого списку.
1. Ряди розподілу
Ряд розподілу – це упорядкований розподіл одиниць сукупності на групи за певною ознакою, яка варіює. Залежно від статистичної природи варіантів ряди поділяються на атрибутивні та варіаційні.
Варіаційний ряд розподілу – ряд, який будується за кількісною ознакою. При складанні структурних угруповань на основі кількісних варіюючих ознак необхідно визначити кількість груп та інтервали групування.
Орієнтовно оптимальну кількість груп з рівними інтервалами можна визначити за формулою американського вченого Стерджесса:
n=1+3,322 lgN,
де N – число одиниць сукупності.
Тоді величина інтервалу:
,
де xmax, xmin – найбільше і найменше значення ознаки;
n – кількість груп.
Після визначення ознаки групування та меж груп будується ряд розподілу. Ряд розподілу характеризує склад, структуру сукупності за визначеною ознакою. Варіаційні ряди розподілу складаються з двох елементів: варіант і частот. Числові значення кількісної ознаки у варіаційному ряді розподілу називаються варіантами. Частоти - це чисельність окремих варіант кожної групи варіаційного ряду, тобто це числа, що показують як часто зустрічаються ті чи інші варіанти в ряді розподілу. Сума всіх частот складає обсяг сукупності. Частки - це частоти, виражені у виді відносних одиниць (частках чи одиниць відсотків).
Закономірність статистичного ряду розподілу | |||
Статистичні характеристики | |||
частотні | центра розподілу | варіації абсолютні | варіації відносні |
n частота fi (Sfi=n) n частка di (Sdi=1(100) n кумулятив-на частота Sfi n кумулятивна частка Sdi n щільність частоти | n статистичні середні: арифметична гармонійна квадратична кубічна n середні структурні: мода Мо медіана Ме квартилі Q децилі Д процентілі | n варіаццйний розмах n середнє лінійне відхилення n дисперсія внутрігрупова середня внутрігрупова міжгрупова n середнє квадратичне відхилення | коефіцієнти: n варіації n лінійний n квадратичний n осциляції n квартільний n децільної диференціації n асиметрії: к-т ексцесу n локалізації n концентрації n схожесті n структурних зсувів момент розподілу |
Варіаційні ряди в залежності від характеру варіації підрозділяються на дискретні та інтервальні. Дискретні засновані на дискретних (перервних) ознаках, що приймає тільки цілі значення; інтервальні - на безперервних ознаках (приймаючих будь-які значення).
У співвідношенні варіантів і частот виявляється закономірність розподілу. Вона описується рядом статистичних характеристик, зокрема:
а) частотні характеристики;
б) характеристики центра розподілу;
в) характеристики варіації;
г)характеристики нерівномірності розподілу, концентрації, асиметрії.
2. Характеристики центра розподілу
Щоб визначити значення ознаки, характерне для всієї досліджуваної сукупності одиниць, виконують розрахунок середніх величин.
Середньою величиною у статистиці називається узагальнюючий показник, що характеризує типовий рівень явища в конкретних умовах місця і часу, що відображає розмір варіюючої ознаки у розрахунку на одиницю якісно однорідної сукупності.
В статистичній практиці в кожному конкретному випадку застосовується одна із середніх величин: арифметична, гармонійна, геометрична, квадратична, кубічна і т.д.
Перераховані середні відносяться до класу статистичних середніх і поєднуються загальною формулою (при різних значеннях m):
де - середнє значення досліджуваного явища;
m – показник ступеню середньої;
х – поточне значення (варіанта) ознаки, що усереднюється;
n – кількість ознак.
В залежності від значення показника ступеню m розрізняють наступні види статистичних середніх:
при m = -1 – середня гармонійна ;
при m = 0 – середня геометрична ;
при m = 1 – середня арифметична ;
при m = 2 – середня квадратична ;
при m = 3 – середня кубічна .
Кожна з даних середніх може приймати дві форми: просту і зважену. Якщо середня розраховується за первинними (незгрупованими) даними застосовується проста форма, якщо по вторинним (згрупованим) - застосовується зважена середня.
Так, середня арифметична зважена обчислюється за формулою:
,
де - сума добутків величини ознак на їхні частоти; - загальна кількість одиниць сукупності.
Структурні середні застосовуються для вивчення внутрішньої побудови і структури рядів розподілу.
Мода (Мо) - це найбільш розповсюджене значення ознаки, тобто варіанта, що у ряді розподілу має найбільшу частоту (частку). В дискретному ряду Мо визначається візуально по максимальній частоті. В інтервальному ряді по найбільшій частоті визначається модальний інтервал.
,
де Хмо – нижня межа модального інтервалу;
і – розмір інтервалу;
fi, fi-1, fi+1 – частоти модального, передмодального і наступного за модальним інтервалів.
Медіана (Ме) - це варіанта, що випадає на середину упорядкованого чи ранжованого ряду розподілу і поділяє його на дві рівні за обсягом частини. В дискретному ряду медіаною буде значення ознаки, для якого кумулятивна частота St перевищує половину обсягу сукупності, чи кумулятивна частина (частка) Sdj>=0,5. В інтервальному ряді в такий спосіб визначається медіанний інтервал.
де Хме - нижня межа медіанного інтервалу; і – розмір інтервалу; fi - частоти; fМе - частота медіанного інтервалу; Sме-1 – кумулятивна (накопичена) частота передмедіанного інтервалу.
3. Статистичні характеристики варіації
Варіація – характеризує коливання значень ознаки, розходження значень будь-якої ознаки різних одиниць сукупності в один і той самий момент часу. Середня не показує, як розташовуються біля неї варіанти (окремі значення) ознаки. Необхідні показники, що характеризують відхилення окремих значень від загальної середньої, - показники варіації.
3.1 Абсолютні показники варіації
Розмах варіації - різниця між максимальним і мінімальним значеннями ознаки:
R = Xmax - Xmin.
Чим більше розмах, тим менше стійкість середньої, але вище її резерв.
Однак цей показник відбиває лише крайні відхилення ознаки і не відображає відхилення всіх варіант у ряді.
Середнє лінійне відхилення () - середня арифметична абсолютних значень відхилень окремих варіант від середньої арифметичної. Дає узагальнену характеристику всіх коливань варіюючої ознаки. Для незгрупованих даних:
,
де n – кількість одиниць сукупності.
Для згрупованих даних:
,
де - сума частот варіаційного ряду.
У чисельнику взяті різниці по модулю, оскільки алгебраїчна сума відхилень варіантів від їх середньої арифметичної завжди буде дорівнювати нулю.
Дисперсія ознаки – це середній квадрат відхилень варіантів від їхньої середньої величини.
Проста дисперсія для незгрупованих даних:
,
де n – кількість одиниць сукупності.
Зважена дисперсія для варіаційного ряду:
.
Чи, зважаючи на те, що , отримаємо:
,
тобто дисперсія дорівнює різниці середньої з квадратів варіантів і квадрата їх середньої:
Властивості дисперсії:
* якщо всі значення ознаки зменшити на однакову постійну величину, то дисперсія від цього не зміниться;
* якщо всі значення ознаки зменшити в те саме число раз (i), то дисперсія зменшиться в i2 разів.
Середнє квадратичне відхилення (s) - дорівнює кореню квадратному з дисперсії. Це - узагальнююча характеристика розмірів варіації ознаки, абсолютна міра мінливості ознаки, що виражається в тих самих одиницях, що і варіанти.
3.2 Відносні показники варіації
При порівнянні коливань різних ознак в одній і тій же сукупності, чи при порівнянні коливань значень будь-якої ознаки в декількох сукупностях з різною величиною середньої арифметичної використовують відносні показники варіації. Ці показники обчислюються як відношення абсолютних показників варіації до середньої арифметичної чи медіани. Відносні показники варіації можна отримати, використовуючи такі абсолютні показники, як абсолютний розмах варіації, середнє лінійне, середнє квадратичне і квартильное відхилення.
Коефіцієнт осциляції:
Відносне лінійне відхилення:
Коефіцієнт варіації:
Відносний показник квартильної варіації:
Найбільш часто застосовуваний показник відносної мінливості - коефіцієнт варіації.
Сукупність вважається однорідною, якщо коефіцієнт варіації не перевищує 33%.
4. Дослідження асиметрії розподілу
Головне завдання аналізу варіаційних рядів – визначення дійсної закономірності розподілу шляхом виключення другорядних, випадкових для даного розподілу факторів.
Під кривою розподілу розуміється графічне зображення у вигляді безперервної лінії зміни частот у варіаціному ряду на основі полігону або гістограми.
Для однорідної сукупності, як правило, характерним є одновершинний розподіл. Багатовершинність свідчить про неоднорідність вивчаємої сукупності.
Відносний показник – коефіцієнт асиметрії As:
, або .
Коефіцієнт асиметрії може бути позитивним чи від’ємним. У першому випадку мова йде про правосторонню асиметрію (рис.1), а в другому – про лівосторонню (рис. 2). У симетричному розподілі Аs = 0.
Коефіцієнт асиметрії коливається в межах від -3 до +3.
|
|
Рис. 1 Правостороння асиметрія Рис. 2 Лівостороння асиметрія
У разі чіткої асиметрії варіаційного ряду середнє значення ознаки має доповнюватися модою і медіаною. В асиметричному розподілі між середньою арифметичною, медіаною і модою існують певні розбіжності. У разі правосторонньої асиметрії: > Me>Mo (рис. 1), а лівосторонньої - < Me<Mo (рис. 2). У симетричному розподілі необхідною умовою є рівність трьох характеристик: середньої арифметичної, моди і медіани: = Me=Mo.
У випадку недотримання ні однієї з вищезгаданих умов висновок з асиметричності робиться, зважаючи зі знаку коефіцієнту асиметрії: якщо Аs > 0, - слід вважати, що сукупність має слабко виражену правосторонню асиметрію, якщо Аs < 0 – слабко виражену лівосторонню асиметрію.
5. Визначення ступеню зв`язку між ознаками
Варіація ознаки обумовлена різними факторами, деякі з цих факторів можна виділити, якщо статистичну сукупність розбити на групи по будь-якій ознаці. Тоді поряд з вивченням варіації ознаки і всієї сукупності в цілому стає можливим вивчити варіацію для кожної зі складових її групи, а також між цими групами.
У найпростішому випадку, коли сукупність розчленована на групи по одному фактору, вивчення варіації досягається за допомогою обчислення й аналізу трьох видів дисперсії: загальної, міжгрупової, внутрішньогрупової.
Загальна дисперсія вимірює варіацію ознаки по всій сукупності під впливом усіх факторів, що обумовлюють цю варіацію. Вона дорівнює середньому квадрату відхилень окремого значення ознаки від загальної середньої і може бути обчислена як проста і зважена дисперсія.
Проста загальна дисперсія:
Зважена загальна дисперсія:
Міжгрупова дисперсія (d 2) характеризує систематичну варіацію результативної ознаки, обумовлену впливом ознаки фактора, покладеного в основу угруповання. Вона дорівнює середньому квадрату відхилень групових середніх від загальної середньої.
Внутрішньогрупова дисперсія відбиває випадкову варіацію, обумовлену впливом неврахованих факторів і незалежну від ознаки фактора, покладеного в основу угруповання. Вона дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи від середньої арифметичної цієї групи і може бути обчислена як проста, чи як зважена дисперсія.
Проста внутрішньогрупова дисперсія:
де j – кількість значень у групі.
Загальна середня з внутрішньогрупових дисперсій:
Відповідно до правила додавання дисперсій, загальна дисперсія дорівнює сумі середньої з внутрішньогрупових та міжгрупової дисперсії.
Загальна дисперсія:
У статистичному аналізі широко використовується емпіричний коефіцієнт детермінації h2 - показник, що представляє собою частку міжгрупової дисперсії в загальній дисперсії результативної ознаки, та характеризуючий силу впливу групувальної ознаки на варіацію ознаки.
Коефіцієнт детермінації:
Емпіричне кореляційне відношення -відображає тісноту зв'язку між групувальною та результативною ознакою. Приймає значення від 0 до 1 і дорівнює кореню квадратному з емпіричного коефіцієнту детермінації.
Якщо зв'язок є відсутнім, то кореляційне відношення дорівнює 0, а якщо зв'язок функціональний - 1.
Чим значення кореляційного відношення ближче до 1, тим тісніше та ближче до функціональної залежності зв'язок між ознаками.
Для якісної оцінки зв'язку на основі показника емпіричного кореляційного відношення можна скористатися кореляційними відносинами Чеддока:
0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99
сила слабкий помірний помітний тісний дуже
зв'язку зв'язок зв'язок зв'язок зв'язок тісний
зв'язок
Приклад
1. Перетворимо наступні первинні дані грошового місячного доходу 25 домогосподарств (гр.од.) у ряд розподілу:
Xi - 375;446;472;517;390;464;526;485;457;496;485;483; 412; 449;512;467;526;538;403;437; 504; 488; 454; 489; 472.
Першим кроком у побудові ряду розподілу є його ранжування, тобто розташування значень ознаки у зростаючому порядку:
375; 390; 403; 412; 437; 446; 449; 454; 457; 464; 467; 472; 472; 483; 485; 485; 488; 489; 496; 504; 512; 517; 526; 526; 538.
2. Ряд розподілу, побудований за кількісною ознакою, називається варіаційним. Побудуємо ряд розподілу, виражений у вигляді інтервалів. Такий ряд характеризує склад (структуру) досліджуваного явища, а також дозволяє судити про однорідність сукупності, закономірності розподілу і межах варіювання одиниць сукупності.
Визначимо кількість груп, величину інтервалу, показники структури, кумулятивну чисельність, середину інтервалу.
Кількість груп визначаємо за формулою Стерджеса:
n = 1 + 3,322 lg N
де N – число одиниць сукупності (=25).
n = 1 + 3,322 lg25 = 5,6 або 5 (округлення відбувається до найближчого цілого).
Результати розрахунку для деяких варіантів:
N = 15 n = 4,9 приймаємо n = 5;
N = 20 n = 5,3 приймаємо n = 5;
N = 25 n = 5,6 приймаємо n = 6;
N = 30 n = 5,9 приймаємо n = 6.
Тоді розмір інтервалу можна визначити за формулою:
= ,
де n - кількість інтервалів;
Х - значення варіюючої ознаки.
Приймаємо розмір інтервалу 33.
Округлення виконується до цілих, якщо у вихідних даних тільки цілі тризначні числа. В інших випадках округлення - до десятих (0,0).
В результаті одержимо наступний інтервальний ряд розподілу грошового місячного доходу домогосподарств:
xi | 375 – 408 | 408-441 | 441-474 | 474-507 | 507-540 |
fi |
Як видно з даного ряду розподілу, більшість домогосподарств отримує місячний доход в межах 441 – 507 гр.од.
Результати побудови ряду розподілу оформляються у вигляді таблиці.
Таблиця 1.1.
Розподіл грошового місячного доходу домогосподарств
Грошовий місячний дохід домогос-подарств гр.од., xi | Кількість домогосподарств fi | Структура домогос-подарств, f%і | Середина інтервалу, xi` | Кумулятивна чисельність Si |
375-408 408-441 441-474 474-507 507-540 | 391,5 424,5 457,5 490,5 523,5 | |||
Разом | х | х |
2. Побудуємо гістограму, полігон, кумуляту грошового доходу домогосподарств.
Рис. 1.1. Полігон та гістограма розподілу домогосподарств за розміром місячного доходу
Рис. 1.2. Кумулята розподілу домогосподарств за розміром місячного доходу
3. Визначимо характеристики центру розподілу.
До показників центру розподілу відносяться середнє значення, мода і медіана.
Середня величина характеризує типовий рівень ознаки в сукупності.
Для незгурпованих даних середня розраховується за формулою середньої аріфметичної простої:
,
де N – кількість одиниць сукупності.
(375 + 390 + 403 + 412 + 437 + 446 + 449 + 454 + 457 + 464 + 467 + 472 + 472 + 483 + 485 + 485 + 488 + 489 + 496 + 504 + 512 + 517 + 526 + 526 + 538) / 25 = 469,88 гр.од.
За згрупованими даними ряду розподілу середня розраховується як арифметична зважена:
,
де n - число груп xi` - середина інтервалу.
(391,5х3+424,5х2+457,5х8+490,5х7+523,5х5)/25 = 720/20 = 469,4 гр.од.
Це значення свідчить, що при рівномірному розподілі суми місячного доходу серед домогосподарств величина доходу кожного буде дорівнювати 469,4 гр.од.
Мода - це значення ознаки, що найбільш часто зустрічається, тобто варіанта, яка у ряді розподілу має найбільшу частоту (частість).
У дискретному ряду мода визначається візуально по максимальній частоті, або частості.
У інтервальному ряду мода визначається в межах модального інтервалу за ознакою за формулою:
,
де Хмо - початок модального інтервалу; і - розмір інтервалу;
fМо, fМо-1, fМо+1 - частота відповідно модальному, передмодальному і наступного за модальним інтервалів.
Модальний інтервал, в якому , у нашому прикладі 441-474.
Мо = 441 + 33х (8-2)/((8-2) + (8-7)) = 469,3 ден.ед.
В даному випадку найпоширенішим розміром доходу домогосподарства за місяць умовно є 469,3 ден.ед.
Медіана - це варіанта, яка розташована у середині упорядкованого ряду розподілу і ділить його навпіл на дві однакові за об'ємом частини. Медіана, як і мода, не залежить від крайніх значень варіант, тому використовується для характеристики центру розподілу з невизначеними межами.
У дискретному ряду розподілу медіаною буде перше з початку ряду значення ознаки, для якого кумулятивна частота Si перевищує половину об'єму сукупності.
У інтервальному ряду таким самим чином, за кумулятивною частотою, визначається медіанний інтервал: . Конкретне значення медіани в інтервалі обчислюється за формулою:
,
де Хме - нижня межа медіанного інтервалу; і - розмір інтервалу;
fi - частоти; fМе - частота медіанного інтервалу; Sме-1 - накопичена частота інтервалу, передуючого медіанному.
Медіанний інтервал з умови = : 441-474.
Ме = 441 + 33 х (12,5-5) /8 = 471,9 ден.ед.
Це означає, що половина домогосподарств має дохід менше 471,9 ден.ед., а половина - більше.
4. Визначимо медіану і моду графічно.
Для того, щоб побудувати моду графічно, на гістограмі потрібно знайти найвищий стовпчик, та поєднати його верхні кути з місцем приєднання до нього сусідніх стовпчиків.
Якщо найвищий стовпчик стоїть першим або останнім – місцем приєднання неіснуючого стовпчика є нуль.
Якщо гістограма має 2 сусідніх найвищих стовпчики - побудова виконується збільшеним методом: подвоєнням як модальних стовпчиків, так і сусідніх.
Медіана графічно зображається на кумуляте накопичених частот шляхом нанесення на полі графіка перпендикуляра до осі ординат у значенні, що дорівнює половині суми частот (25/2=12,5 у прикладі). Відповідне значення на осі абсцис (довжина цього перпендикуляра до кумуляти) відповідатиме значенню медіани.
Рис. 1.3. Графічне визначення моди по полігону розподілу домогосподарств за розміром місячного доходу
Рис. 1.4. Графічне визначення медіани за кумулятою грошового доходу
5. Розрахуємо показники варіації.
До абсолютних показників варіації відносяться розмах варіації, середнє лінійне відхилення, дисперсія, середнє квадратичне відхилення, квартильное відхилення, інше.
Розмах варіації є різницею між максимальним і мінімальним значеннями ознаки:
R = Xmax - Xmin.
R = 540-375 = 165.
Даний показник зручний своєю простотою, але залежить від крайніх значень. Тому область застосування його обмежена.
Більшість показників варіації заснована на розгляді відхилень значень ознаки окремих одиниць від середньої арифметичної.
До таких показників відносять середнє лінійне відхилення, дисперсію, середнє квадратичне відхилення.
Середнє лінійне відхилення для незгрупованих даних розраховується за формулою:
,
для згрупованих даних за формулою:
.
.
Дисперсія - це середнє з квадратів відхилень варіантів значень ознаки від їх середньої величини.
Для згрупованих даних дисперсія розраховується за наступною формулою:
.
Але для перевірки правила додавання дисперсій ще потрібно розрахувати дисперсію за незгрупованими даними. Для розрахунків використовується формула дисперсії простої з використанням середнього значення, розрахованого за незгрупованими даними (25 значень у прикладі):
(375-469,88)2 + (390-469,88)2 + (403-469,88)2 + (412-469,88)2 + (437-469,88)2 + (446-469,88)2 + (449-469,88)2 + (454-469,88)2 + (457-469,88)2 + (464-469,88)2 + (467-469,88)2 + (472-469,88)2 + (472-469,88)2 + (483-469,88)2 + (485-469,88)2 + (485-469,88)2 + (488-469,88)2 + (489-469,88)2 + (496-469,88)2 + (504-469,88)2 + (512-469,88)2 + (517-469,88)2 + (526-469,88)2 + (526-469,88)2 + (538-469,88)2 / 25 =1756,1.
Середнє квадратичне відхилення є коренем квадратний з дисперсії і визначається для варіаційного ряду за формулою:
.
Для порівнянь варіацій різних ознак використовують відносний коефіцієнт варіації. Це виражене у відсотках відношення середнього квадратичного відхилення до середньої арифметичної:
Сукупність вважається кількісно однорідною, якщо коефіцієнт варіації не перевищує 33%.
V = 40,56/469,4 *100 = 8,6% < 33%.
Згідно проведеному аналізу дана сукупність якісно однорідна.
6. Визначимо відносні характеристики варіації, показники асиметрії.
Для порівнянь варіацій різних ознак використовують відносний коефіцієнт варіації. Це виражене у відсотках відношення середнього квадратичного відхилення до середньої арифметичної:
Сукупність вважається кількісно однорідною, якщо коефіцієнт варіації не перевищує 33%.
V = 40,56/469,4 *100 = 8,6%.
Згідно проведеному аналізу дана сукупність якісно не однорідна.
Коефіцієнт осциляції:
КR = R / х =165 / 469,4 = 0,35 або 35%.
Відносне лінійне відхилення визначається як відношення середнього лінійного відхилення до середнього значення ознаки.
Кd = d / =33,5 / 469,4 = 0,071 або 7,1%.
Емпірична крива дозволяє заздалегідь припустити форму теоретичної кривої розподілу, що характеризує функціональний зв'язок між зміною варіюючої ознаки і зміною частот.
Рис. 1.5. Емпірична крива розподілу домогосподарств за розміром місячного доходу
Те, що сукупність не має чітко визначеної асиметрії виходить із недотримання умов: Мо>Ме>х (лівостороння), Мо<Ме<х (правостороння).
Тоді як в прикладі: 469, 3<471,9>469,4
Коефіцієнт асиметрії:
As = (Х-Ме)/s = (469,4-471,9) / 40,56 = - 0,06.
- від`ємний, тому вказує на нечітко виражену лівосторонню асиметрію.
7. Визначимо міжгрупову, внутрішньогрупову і загальну дисперсії, коефіцієнт детерміації.
Варіація ознаки обумовлена різними чинниками, деякі з яких можна виділити, якщо статистичну сукупність розділити на групи за якою-небудь ознакою. Коли сукупність розчленована на групи по одному чиннику, вивчення варіації досягається за допомогою числення і аналізу трьох видів дисперсій: загальної, міжгрупової і внутрішньогрупової.
Таблиця 1.2
Розподіл доходу господарств
Кількість домогосподарств | Розмір доходу, гр.од. | Середній розмір доходу у групах, гр.од. |
375,390,403 412,437 446,449,454,457,464,467,472,472 483,485,485,488,489,496,504 512,517,526,526,538 | 1168/3=389,3 849/2=424,5 3681/8=460,1 3430/7=490 2619/5=523,8 | |
469,9 |
У нашому прикладі дані групуються за розміром доходу домогосподарств.
Результативна ознака варіює як під впливом систематичного чинника, так і інших неврахованих випадкових чинників (внутрішньогрупова варіація).
група 1: = 1168 / 3 = 389,3;
група 2: = 849 / 2 = 424,5;
група 3: = 3681 / 8 = 460,1
група 4: = 3430 / 7 = 490;
група 5: = 2619 / 5 = 523,8;
Розрахуємо внутрішньогрупові дисперсії за формулою:
.
1 = ((375-389,3)2+(390-389,3)2+(403-389,3)2/3=392,67/3=130,89;
2 = ((412-424,5)2+(437-424,5)2/2 = 312,5/2 = 156,25;
3 = ((446-460,1)2 + (449-460,1)2 + (454-460,1)2 + (457-460,1)2 + (464-460,1)2 + (467-460,1)2 + (472-460,1)2 + (472-460,1)2)/8 = 730,9/8 = 91,26.
4 = ((483-490)2 + (485-490)2 + (485-490)2 + (488-490)2 + (489-490)2+ (496-490)2 + (504-490)2) = 336/7 = 48.
5 = ((512-523,8)2 + (517-523,8)2 + (526-523,8)2 + (526-523,8)2 + (538-523,8)2) = 396,8/5 = 79,36.
Внутрішньогрупові дисперсії показують варіації сум доходу в кожній групі, викликані всіма можливими чинниками.
Розрахуємо середню з внутрішньогрупових дисперсій:
.
(130,89х3 + 156,25х2 + 91,26х8 + 48х7 + 79,36х5)/25 = 86,72.
Середня з внутрішньогрупових дисперсій відображає варіацію суми доходу, обумовлену всіма чинниками, окрім розміру доходу, але в середньому по всій сукупності.
Обчислимо міжгрупову дисперсію.
.
((389,3-469,9)2 +(424,5-469,9)2 +(460,1-469,9)2 +(490-469,9)2 +(523,8-469,9)2) / 25 = 1669,35.
Міжгрупова дисперсія характеризує систематичну варіацію результативного порядку, обумовлену впливом ознаки - чинника, покладеного в підставу угрупування.
Обчислимо загальну дисперсію, згідно правилу складання дисперсій, за наступною формулою:
= 86,72 + 1669,35 = 1756,1.
Загальна дисперсія вимірює варіацію ознаки по всій сукупності під впливом всіх чинників, що зумовили цю варіацію.
Чим більше частка міжгрупової дисперсії в загальній дисперсії, тим сильніше вплив группировочного ознаки.
Для характеристики даного зв'язку застосовують емпіричний коефіцієнт детермінації:
.
У нашому прикладі:
1669,35/1756,1=0,951.
Емпіричне кореляційне відношення:
.
0,975.
Згідно якісній оцінці тісноти зв'язку Чеддока, в нашому прикладі існує дуже тісний зв'язок між сумою місячного доходу домогосподарства і розміром доходу як групувальної ознаки.
9. На основі одержаних абсолютних, відносних і середніх величин проведемо якісний аналіз кількісних оцінок.
Розглядаючи статистичний ряд розподілу місячного доходу домогосподарств, розділений на 5 груп з розміром інтервалу i=33, бачимо, що в значна частина розглянутих домогосподарств, а саме 60% (32%+28%), мають розмір місячного грошового доходу в межах 441-507 гр.од.
Побудовані графіки гістограми й кумуляти (рис. 1.1, 1.2) наочно відображають особливості розподілу місячного доходу домогосподарств. Слід зазначити більш рівномірні зміни кількості домогосподарств з розміром місячного доходу більше 441 гр.од., що видно з графіків. Кумулятивний ряд розподілу (рис. 1.2) дозволяє простежити за процесом концентрації явища, що вивчається.
На підставі розрахунків структурних середніх показників були отримані наступні результати: середній місячний дохід для розглянутої сукупності домогосподарств склав 469,4 гр.од. Із 25 домогосподарств половина домогосподарств має розмір доходів більше 471,9 гр.од., а половина – менше (див. рис. 1.4). Найпоширеніше значення (мода) місячного доходу домогосподарств складає 469,3 гр.од. (див. рис. 1.3).
У даного ряду нечітко виражена лівостороння асиметрія.
За наслідками розрахунку показника варіації зроблений висновок, що сукупність якісно однорідна.
Згідно якісній оцінці тісноти зв'язку Чеддока, існує дуже сильний зв'язок між сумою місячного доходу домогосподарства і розміром доходу як групувальної ознаки (частка міжгрупової дисперсії у складі загальної складає 95%).
Дата добавления: 2015-07-17; просмотров: 505 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
оформлення роботи | | | ВВЕДЕНИЕ |