Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Теоретичні положення

Типові задачі і їх розв’язуваня | Теоретичні положення | Типові задачі і їх розв’язуваня | Теоретичні положення | Типові задачі і їх розв’язуваня | Теоретичні положення | Типові задачі і їх розв’язуваня | Теоретичні положення | Типові задачі і їх розв’язуваня | Теоретичні положення |


Читайте также:
  1. I. Загальні положення
  2. I. Загальні положення
  3. Б) Перехідні коефіцієнти зміни характеристик розсіювання при зміні положення для стріляння
  4. географічне положення України є межовим – “між Сходом і Заходом”.
  5. Глава 1. ОСНОВНІ ПОЛОЖЕННЯ
  6. Глава 19. Загальні положення досудового розслідування
  7. Глава 67. Загальні положення щодо порушень митних правил та відповідальності за них

1. Як ми вже казали раніше, поведінка масових явищ і процесів підлягає визначеним закономірностям. Встановленням цих закономірностей на підставі результатів спостережень – статистичних даних з використанням теорії ймовірностей займається математична статистика. Тобто, математична статистика вивчає методи збору, обробки та аналізу статистичних даних для одержання наукових та практичних висновків. При цьому активно використовуються засоби теорії ймовірностей.

До основних задач, які вирішує математична статистика можна віднести:

а) розробка способів збору та групування статистичних даних, одержаних в результаті спостережень чи спеціально поставлених експериментів;

б) визначення закону розподілу випадкової величини чи системи випадкових величин за статистичними даними, а також його невідомих параметрів;

в) оцінка залежності випадкової величини від інших випадкових величин;

г) перевірка правдивості припущень про закон розподілу випадкової величини, про форму зв’язку між випадковими величинами або про значення параметра, який оцінюють.

При вивченні математичною статистикою сукупності об’єктів, вони мають бути однорідними. Тобто множина об’єктів, яка досліджується математичною статистикою повинна бути однорідною. Така множина однорідних об’єктів називається статистичною сукупністю.

Дослідженню підлягають як якісні ознаки об’єктів статистичної сукупності, так і кількісні. Якісна ознака характеризує певну властивість або стан, якими володіють об’єкти сукупності (стать, професія, якість продукції тощо). Кількісні ознаки вимірюються числом. Вони бувають дискретними та неперервними.

Розрізняють генеральну та вибіркову статистичні сукупності. Генеральна сукупністьце множина об’єктів, що підлягає статистичному дослідженню. Множина об’єктів, що випадково відібрані з генеральної сукупності називають вибірковою сукупністю, або коротко вибіркою.

Кількість елементів вибіркової та генеральної сукупностей називають їх обсягом і позначають відповідно та .

Суттєвою вимогою до вибірки є її репрезентативність. Це означає, що вибірка повинна правильно відображати пропорції генеральної сукупності. Наприклад, при дослідженні безробіття, опитувати треба як мешканців міських, так і сільських поселень, як чоловіків, так і жінок, як молодих, так і старших і т. п.

Згідно із законом великих чисел, вибірка буде репрезентативною, якщо, з одного боку, кожний об’єкт вибірки вибраний з генеральної сукупності випадково і з іншого – всі об’єкти генеральної сукупності мають однакову ймовірність попасти у вибірку.

Відбір об’єктів у вибірку можна виконувати відразу з усієї генеральної сукупності, або попередньо поділити її на частини. У зв’язку з цим, способи відбору об’єктів з генеральної сукупності можна поділити на два види. Якщо після відбору і спостереження об’єкту, його, перед відбором наступного, повертають назад у генеральну сукупність, то така вибірка називається повторною, в іншому випадкубезповторною. Відмінність між повторною і без повторною вибірками стираються якщо обсяг генеральної сукупності досить великий, а вибіркової – малий.

Відбір при якому генеральну сукупність попередньо розділяють на частини може бути типовим, механічним чи серійним.

Типовим називають відбір, при якому об’єкти відбирають не з усієї генеральної сукупності, а лише з її типових частин. При механічному відборі генеральну сукупність поділяють на стільки частин, скільки має бути об’єктів у вибірці, а потім з кожної частини випадковим чином вибирають один об’єкт.

Серійнийце такий відбір, при якому об’єкти відбирають з генеральної сукупності не по одному, а серіями, які і досліджують. Часом застосовують ці методи відбору об’єктів з генеральної сукупності в комбінації – спочатку один, а потім інший.

2. Перед нами може стояти завдання дослідити якусь одну сторону кожного об’єкту вибірки чи декілька їх сторін, тобто дослідити якусь одну їхню ознаку чи декілька. При дослідженні однієї ознаки об’єктів вибірки внаслідок збору інформації про цю ознаку ми отримаємо ряд чисел, який називають статистичним рядом. Ці числа можуть характеризувати окрему сторону явища, що вивчається, або зміни цього явища у часі.

За своїм змістом статистичні ряди поділяють на неупорядковані та упорядковані. Ряд, отриманий внаслідок спостережень, буде неупорядкованим. Тобто, на початковому етапі статистичного аналізу отримують неупорядкований статистичний ряд.

Розглянемо приклад. Нехай нам відома урожайність зернових у центнерах з одного гектара на 25 земельних ділянках: 24, 35, 20, 37, 31, 25, 29, 40, 31, 22, 27, 32, 25, 33, 20, 29, 38, 31, 31, 27, 40, 32, 25, 21, 37. Отже, в нашому випадку ознака – урожайність зернових, а вказаний ряд чисел – неупорядкований статистичний ряд.

Упорядкувавши ці числа за зростанням, отримаємо ряд 20, 20, 21, 22, 24, 25, 25, 25, 27, 27, 29, 29, 31, 31, 31, 31, 32, 32, 33, 35, 37, 37, 38, 40, 40. Цей ряд буде упорядкованим чи ранжированим статистичним рядом. Значення спостерігалося рази, значення спостерігалося рази, і т. д. Значення спостереження , тобто, окреме конкретне значення ознаки , яка має здатність варіюватися (змінюватися), називають варіантами, а послідовність варіант, записаних у зростаючому чи спадаючому порядку, – варіаційним рядом. Додатне число , яке вказує, скільки раз варіанта зустрічається у вибірці, називається частотою, а відношення відносною частотою (частістю) варіанти, де обсяг вибірки. Очевидно, що

(1)

Варіаційні ряди можуть бути дискретними чи неперервними.

Якщо у варіаційному ряді підрахувати, скільки різних значень набуває варіюючи ознака і скільки одиниць сукупності їм відповідає, та подати у вигляді таблиці, то одержимо дискретний ряд розподілу (див. табл. 1).

Таблиця 1

Варіанта Частота Варіанта Частота Варіанта Частота
           
           
           
           
           
        Р а з о м  

 

Часто поряд із розподілом частоти варіанти потрібно мати розподіл накопиченої (нагромадженої) частоти , яка одержують послідовним додаванням частот чергового інтервалу, починаючи з першого і закінчуючи даним інтервалом. Нагромадження частот називається кумуляцією. Кумулювати також можна відносні частоти варіант. В результаті одержують нагромаджені відносні частоти (частості).

Дискретний ряд розподілу розглянутого прикладу (див. табл. 1) з урахуванням відносних частот та нагромаджених частот і частостей буда мати вигляд (див. табл. 2).

Таблиця 2

Варіанта Частота Нагромаджена частота Частість Нагромаджена частість
      0,08 0,08
      0,04 0,12
      0,04 0,16
      0,04 0,20
      0,12 0,32

Закінчення таблиці 2

      0,08 0,40
      0,08 0,48
      0,16 0,64
      0,08 0,72
      0,04 0,76
      0,04 0,80
      0,08 0,88
      0,04 0,92
      0,08 1,00

 

Перелік всіх варіант варіаційного ряду і відповідних їм частот чи частостей ще називають статистичним розподілом вибірки.

Зауваження.

З1. В теорії ймовірностей під розподілом розуміють відповідність між можливими значеннями випадкової величини і їх ймовірностями, а в математичній статистиці – відповідність між варіантами, які ми спостерігаємо, і їх частотами чи частостями.

Якщо значення варіант згрупувати в інтервали, то одержимо інтервальний ряд. Тобто, інтервальним називають ряд згрупованих варіантів у визначених межах, або розподіл частот між інтервалами варіювання значень ознаки. Частота, яка відповідає інтервалу, рахується як кількість варіант, що попали в цей інтервал. До інтервалу включаються ті варіанти, що є меншими або дорівнюють верхній межі інтервалу і більшими за нижню межу. В інтервальному ряді частоти і частості також можна кумулювати.

Інтервальний ряд будують переважно для неперервної ознаки. Для дискретної ознаки такі ряди будують на підставі дискретного ряду. При цьому кількість груп, на які треба розчленувати сукупність може бути відома чи невідома. В першому випадку довжину інтервалу знаходять за формулою

(2)

де – найбільша та найменша варіанти, – кількість груп. Межі інтервалів розраховують також, виходячи із довжину інтервалу і заданої кількості груп розчленування.

Якщо кількість таких груп невідома, то довжину інтервалу можна розрахувати за формулою Стерджесса

(3)

де – обсяг вибірки.

Для нашого прикладу одержимо

Заокруглимо знайдену величину до п’яти. В результаті наш інтервальний ряд буде таким (див. табл. 3).

Таблиця 3

Група варіант Частота Нагромаджена частота Частість Нагромаджена частість
І 18 - 23     0,16 0,16
ІІ 23 - 28     0,24 0,40
ІІІ 28 - 33     0,36 0,76
ІV 33 - 38     0,16 0,92
V 38 - 43     0,08 1,00

 

Для наочності будують графічне зображення варіаційних рядів. Дискретні ряди найчастіше графічно зображають за допомогою многокутника розподілу, який називається полігоном. Він будується в прямокутній системі координат, де на осі абсцис відкладають варіанти , а на осі ординат – відповідні їм частоти чи частості . Отримані точки чи сполучають. В першому випадку графік називають полігоном частот, а в другому – полігоном частостей.

Для інтервальних варіаційних рядів доцільно будувати гістограму. Гістограмою частот (частостей) називають ступінчату фігуру, що складається з прямокутників, основами яких служать часткові інтервали довжини , а висоти дорівнюють щільності частоти (частості) , де – межі -ого інтервалу варіант ознаки , – кількість варіант, що спостерігалися в -ому інтервалі, з урахуванням їх частот, , – обсяг вибірки.

Площа -ого часткового прямокутника гістограми частот дорівнює – сумі частот варіант -ого інтервалу, а площа всіх прямокутників – обсягу вибірки. Площа всіх прямокутників гістограми частостей рівна одиниці.

3. Нехай – кількість спостережень вибіркової сукупності обсягу , при яких спостерігалось значення кількісної ознаки , менше за . Тоді функцію

(4)

називають емпіричною функцією розподілу.

Функцію розподілу генеральної сукупності називають теоретичною функцією розподілу. Отже, якщо теоретична функція розподілу визначає ймовірність події , то емпірична – відносну частоту цієї події.

На підставі теореми Бернуллі можна зробити висновок, що відносна частота події , тобто прямує за ймовірністю до ймовірності цієї події.

Функція має такі ж властивості, як і .

1)

2) функція неспадна;

3) якщо – найменша варіанта, то при

4) якщо – найбільша варіанта, то при

4. Володіючи даними вибірки, дослідник має зробити висновки про генеральну сукупність. Ці висновки можуть стосуватися підбору закону розподілу генеральної сукупності чи оцінки параметрів відомого закону розподілу.

Статистичною оцінкою невідомого параметра випадкової величини генеральної сукупності називають висновок, зроблений на підставі параметрів вибірки. Оскільки останні виражаються через дані вибірки, тобто через вибіркові значення цієї кількісної ознаки , то статистичною оцінкою невідомого параметра теоретичного розподілу ще називають функцію від випадкових величин (результатів вибірки), що спостерігаються.

Для статистичної оцінки, яка давала б найкраще наближення параметрів, що оцінюються, розроблено три вимоги: незміщеність, ефективність і змістовність (обґрунтованість).

Незміщеною називають статистичну оцінку , математичне сподівання якої дорівнює параметру, що оцінюється при будь-якому обсязі вибірки, тобто

. (5)

Якщо вимога (5) не виконується, то оцінка називається зміщеною.

Ефективною називають таку статистичну оцінку , яка при заданому обсязі вибірки має найменшу дисперсію.

Статистичну оцінку, яка при прямує за ймовірністю до параметра, що оцінюється називається змістовною чи обґрунтованою.

5. Статистичний розподіл містить повну інформацію про сукупність. Але великі обсяги інформації часом зменшують ефективність її використання. Надмірність інформації про якусь ознаку ускладнює аналіз цієї ознаки. Нераціональність використання в деяких випадках всієї цієї інформації пояснюється ще й тим, що при розв’язуванні визначених задач цю інформацію можна успішно замінити незначною кількістю зведених характеристик розподілу. До того ж, мистецтво статистичного аналізу саме й визначається не безпосереднім застосуванням статистичного розподілу, а тим, наскільки успішно і повно вдається виконати такий аналіз, спираючись на мінімальну кількість показників.

Аналогічно як для випадкових величин, для опису статистичних розподілів використовують переважно три види характеристик (показників), які обчислюються за результатами спостережень і називаються статистичними характеристиками:

1) середні характеристики центральної тенденції,

2) характеристики мінливості (варіації) варіантів,

3) характеристики форми розподілів.

Одними з найважливіших характеристик варіаційних рядів є середні значення, оскільки навколо них концентруються значення ознаки, які спостерігаються.

Нехай нам потрібно вивчити кількісну ознаку деякої дискретної генеральної сукупності обсягу . Значення цієї ознаки можуть бути різні , чи кожне з них може мати відповідно частоту , причому .

Генеральною середньою називається середнє арифметичне значень ознаки генеральної сукупності. Тобто в першому випадку

(6)

а в другому

(7)

Вибіркова середня називається середнє арифметичне значень ознаки вибіркової сукупності. Тобто, якщо значення ознаки вибірки різні, то

(8)

і якщо значення ознаки мають відповідно частоти , то

(9)

Зауваження.

З 2. Неважко довести, що замість формули (9) можна використати таку формулу

, (10)

де . Цю формулу доцільно використовувати коли початкові варіанти великі числа.

З 3. Вибіркову середню інтервального ряду наближено можна знайти прийнявши в якості варіант середини інтервалів цього ряду.

З 4. Якщо з генеральної сукупності взяти кілька вибірок, то кожна з них буде мати свою вибіркову середню. Тобто вибіркова середня може змінювати своє значення. Отже, характеристику можна розглядати як випадкову величину і тому говорити про її розподіл (теоретичний і емпіричний), а також про числові характеристики цього розподілу.

Вибіркові значення ознаки , одержані в результаті незалежних спостережень, можна розглядати як випадкові величини , що мають ті ж числові характеристики і той же розподіл, що й . Звідси, як для однаково розподілених випадкових величин, –

.

З іншого боку, як для однаково розподілених випадкових величин

Тобто

(11)

Це означає, що вибіркова середня є незміщеною оцінкою генеральної середньої.

Можна показати, що оцінка для є також і змістовною. Отже, при збільшенні обсягу вибірки вибіркова середня прямує до .

Модою називають варіанту, яка найчастіше зустрічається у варіаційному ряді. Для дискретного ряду мода відповідає значенню ознаки у найбільшої кількості одиниць.

Для інтервального ряду з рівними інтервалами, модальний інтервал, що містить моду визначається за найбільшою частотою, а при нерівних інтервалах – за найбільшою щільністю. При рівних інтервалах моду всередині модального інтервалу можна визначити за формулою

(12)

де – мода, – початок модального інтервалу (нижня межа), – частоти відповідно модального, передмодального і післямодального інтервалів, – довжина інтервалу.

Зокрема, для розглянутого раніше прикладу інтервального ряду (див. табл. 3) модальним є третій інтервал . Початком цього інтервалу є нижня межа довжина інтервалу , частота модального інтервалу передмодального – і післямодального – Підставляючи зі значення у формулу (11), знайдемо значення моди всередині модального інтервалу

Медіаною називають варіанту, яка ділить варіаційний ряд на дві частини, рівні за кількістю варіант: із значенням ознаки більшим і меншим за це значення. Тобто медіана – це середина варіаційного ряду.

Якщо варіаційний (ранжирований) ряд має непарну кількість членів , то Зокрема для нашого прикладу Тому

Коли кількість членів ряду парна, тобто , то .

В інтервальному ряді інтервал, який містить медіану, визначають виходячи з нагромаджених частот. Медіанному інтервалу відповідає перша з нагромаджених частот, яка перевищує половину всього обсягу сукупності. Всередині знайденого інтервалу медіану розраховують за формулою

, (13)

де – медіана, – нижня межа медіанного інтервалу, – сума всіх частот (обсяг вибірки), – частота медіанного інтервалу, – нагромаджена частота інтервалу, який передує медіанному, – довжина інтервалу.

Для нашого прикладу (медіанним є третій інтервал), , Отже

Величину мінливості (розсіювання) оцінюють за допомогою дисперсії і середнього квадратичного відхилення.

Генеральна дисперсія (дисперсія генеральної сукупності) називається середнє арифметичне квадратів відхилень значень ознаки генеральної сукупності від їхнього середнього значення. Тобто, якщо значення ознаки генеральної сукупності різні, то

(14)

і якщо значення ознаки мають відповідно частоти , то

(15)

Вибіркова дисперсія (дисперсія вибірки) називається середнє арифметичне квадратів відхилень отриманих значень ознаки вибіркової сукупності від їхнього середнього значення. Тобто, якщо значення ознаки вибірки різні, то

(16)

і якщо значення ознаки мають відповідно частоти , то

(17)

Вибіркове середнє квадратичне відхилення розраховується за формулою

. (18)

За подібною формулою на підставі генеральної дисперсії розраховується генеральне середнє квадратичне відхилення.

Як генеральну, так і вибіркову дисперсію можна розраховувати за формулою

, (19)

де знаходять за однією з формул (6), (7) чи (8), (9), а за тими ж формулами, підставивши в них замість величину .

Зауваження.

З 5. Дисперсія не зміниться, якщо перейти від початкових варіант до умовних за формулою

. (20)

Тоді, наприклад, вибіркова дисперсія при умові, що значення ознаки мають відповідно частоти буде обчислюватися за формулою

(21)

Цю формулу доцільно використовувати коли початкові варіанти великі числа. В якості постійної тоді найкраще брати число, яке рівне чи близьке до вибіркового середнього варіаційного ряду.

З 6. Вибіркову дисперсію інтервального ряду наближено можна знайти взявши в якості варіант середини інтервалів цього ряду.

Аналогічно як генеральну середню ми маємо вміти оцінити генеральну дисперсію з допомогою вибіркової. Однак поступити тут так само як із середнім (див формулу (10)) ми не можемо, бо аналогічна формула тут не виконується. Можна довести, що для вибіркової дисперсії справедлива формула

. (22)

Тобто, вибіркова дисперсія є зміщеною оцінкою . Тому для оцінки генеральної дисперсії використовують виправлену дисперсію

, (23)

яка вже є її незміщеною оцінкою.

Корінь з цієї дисперсії

, (24)

тобто, виправлене середнє квадратичне відхилення використовують для оцінки середнього квадратичного відхилення генеральної сукупності.

Зауваження.

З 7. Як видно із формул (16), (20), вони відрізняються тільки знаменниками. Очевидно, що при достатньо великих обсягах вибірки вибіркова та виправлена дисперсії відрізняються незначно. Тому на практиці виправлену дисперсію використовують, коли приблизно

Моментом (емпіричним) порядку називається середнє значення -го степеня відхилень варіант від деякої постійної величини . Тобто, якщо значення ознаки вибірки різні, то

(25)

і якщо значення ознаки мають відповідно частоти , то

(26)

При цей момент називається початковим, а при центральним емпіричним моментом порядку .

Використовуючи центральні емпіричні моменти третього і четвертого порядку за аналогічними як в теорії ймовірностей формулами розраховують асиметрію та ексцес емпіричних розподілів.

6. Якщо оцінка параметрів розподілу генеральної сукупності визначається одним числом, то її називають точковою. Такими були формули (10) і (20). Однак, для вибірки малого обсягу точкова оцінка може значно відрізнятися від параметра, який оцінюється, що може призвести до грубих помилок. Тому вводять інтервальні оцінки.

Інтервальною називають оцінку, яка визначається двома числами – кінцями інтервалу.

Нехай за даними вибірки знайдена статистична оцінка невідомого параметра , яке будемо вважати постійним числом. Очевидно, що тим точніше визначає параметр , чим менша за абсолютною величиною різниця .

Число , для якого виконується нерівність , називають точністю оцінки.

Надійністю (довірчою ймовірністю) оцінки за називають ймовірність , з якою виконується нерівність . Іншими словами

(27)

Зазвичай, надійність оцінки задають наперед і в якості значень вибирають число близьке до одиниці, наприклад, 0,95; 0,99; 0,999.

Якщо у формулі (24) замість нерівності використати рівносильну їй нерівність

,

то одержимо

(28)

Ця формула означає: ймовірність того, що інтервал містить у собі (покриває) невідомий параметр , дорівнює . Цей інтервал називають довірчим інтервалом чи інтервалом довір’я. Випадкові кінці цього інтервалу називають довірчими межами.

Нехай кількісна ознака генеральної сукупності розподілена за нормальним законом, середнє квадратичне відхилення якої відоме. Тоді довірчий інтервал

(29)

покриває математичне сподівання генеральної сукупності із заданою надійністю . Тут – вибіркова середня, – обсяг вибірки, а – значення функції Лапласа , при якому .

Якщо невідоме, то довірчий інтервал має вигляд

, (30)

де – виправлене вибіркове середнє квадратичне відхилення, а знаходиться за таблицями за заданими і .

7. При дослідженні генеральної сукупності на підставі вибірки часто приходиться робити деякі припущення, а потім перевіряти їх за допомогою статистичних методів. Якщо таке припущення стосуються вигляду невідомого розподілу генеральної сукупності чи параметрів відомих розподілів, то воно називається статистичною гіпотезою. Можливі інші гіпотези: про рівність параметрів двох чи декількох розподілів, про незалежність вибірок тощо.

Нульовою (основною) називають запропоновану гіпотезу, яку позначають через .

Альтернативною (конкуруючою) називають гіпотезу , яка суперечить основній.

Розрізняють також гіпотези за кількістю припущень. Простою називають гіпотезу, яка має одне припущення, інакше гіпотеза є складною. Для того, щоб переконатися яка з гіпотез правильна: основна чи конкуруюча потрібно їх перевірити. Оскільки перевірка проводиться статистичними методами, то її називають статистичною.

Очевидно, що при прийнятті рішень за допомогою гіпотез можливі помилки. Ці помилки бувають двох родів.

Помилка першого роду полягає у тому, що буде відкинута правильна гіпотеза, тобто, буде відхилена основна гіпотеза, коли насправді вона правильна.

Помилка другого роду полягає у тому, що буде прийнята неправильна гіпотеза, тобто, основна гіпотеза, коли насправді вона помилкова.

Зауваження.

З 8. Єдиний спосіб одночасно зменшити ймовірності похибок першого та другого роду – це збільшення обсягу вибірки.

Ймовірність здійснити помилку першого роду позначають через і називають рівнем значущості. Його задають достатньо малим. Переважно використовують значення , що дорівнюють 0,05; 0,01 і т.д. Наприклад, якщо , то це означає, що в одному випадку із 100є ризик допустити помилку першого роду (відкинути правильну гіпотезу ).

Висновки про правильність зроблених гіпотез роблять на підставі спеціально підібраної величини, точне чи наближене значення якої відоме.

Статистичним критерієм (чи просто критерієм) називають випадкову величину , на підставі значення якої перевіряють нульову гіпотезу.

Існує багато різних критеріїв, однак найчастіше застосовують критерії узгодженості Пірсона – , – Стьюдента, – Фішера та ін.

Спостережене значення критерію узгодженості обчислюють на підставі даних вибірки.

Множину можливих значень обраного критерію узгодженості завжди можна поділити на дві підмножини, що не перетинаються: одна з них містить значення критерію, при яких гіпотеза відхиляється, а друга – при яких вона приймається. Перша з них називається критичною областю, а друга – областю прийняття гіпотези.

Оскільки критерій узгодженості – одновимірна випадкова величина, то усі її можливі значення належать деякому інтервалу. Тому інтервалами будуть також критична область і область прийняття нульової гіпотези, а це означає, що існують точки, які ці інтервали відокремлюють.

Критичними точками (межами) критерію називають точки , які відокремлюють критичну область від області прийняття гіпотези.

Залежно від розміщення критичної точки щодо критичної області, останні поділяють на односторонню (правосторонню і лівосторонню) та двосторонню області.

Правосторонньою називають критичну область, що визначається нерівністю , де – додатне число.

Лівосторонньою називають критичну область, що визначається нерівністю , де – від’ємне число.

Двосторонньою називають критичну область, яка задовольняє нерівності і .

У більшості випадків для двосторонньої критичної області точки і розташовані симетрично відносно нуля, тобто .

Розглянемо застосування критерію Пірсона до перевірки гіпотези про нормальний розподіл генеральної сукупності. Аналогічно цей критерій можна застосувати і до інших розподілів.

Нехай у вибірці значення ознаки мають відповідно частоти . Щоб за допомогою цього критерію при заданому рівні значущості перевірити основну гіпотезу : генеральна сукупність розподілена нормально, треба

1) обчислити теоретичні частоти для варіант вибірки, якщо вони не задані;

2) обчислити спостережене значення критерію за формулою

(31)

3) знайти ступінь вільності за формулою

(32)

4) з таблиці знайти критичну точку , яка відповідає заданому рівню значущості та ступеню вільності

На підставі знайдених та треба зробити висновок:

якщо , то гіпотезу треба прийняти;

якщо , то гіпотезу треба відхилити.

 


Дата добавления: 2015-11-14; просмотров: 45 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Типові задачі і їх розв’язуваня| Типові задачі і їх розв’язуваня

mybiblioteka.su - 2015-2024 год. (0.066 сек.)