Читайте также:
|
|
Задание 1. Закон распределения случайной величины Х задан таблицей:
Х | 0,2 | 0,4 | 0,6 | 0,8 | |
Р | 0,1 | 0,2 | 0,4 | р 4 | 0,1 |
Найдите p 4?
Задание 2. Закон распределения случайной величины Х задан таблицей:
Х | |||||
Р | р 1 | 0,15 | р 3 | 0,25 | 0,35 |
Найдите вероятности р 1 р 3, если известно, что р 3 в 4 раза больше р 1?
Задание 3. Закон распределения случайной величины Х задан таблицей:
Х | |||
р | 0,3 | 0,1 | 0,6 |
Найдите М (Х), D (X) и s(Х).
Задание 4. В денежной лотерее выпущено 100 билетов. Разыгрываются 1 выигрыш в 500 руб. и 10 выигрышей по 100 руб. Найдите закон распределения случайного выигрыша Х для владельца одного лотерейного билета. Определите минимальную стоимость одного билета
5. При некоторых условиях стрельбы вероятность попадания в цель равна 0,8. Производится 10 выстрелов. Какова вероятность, что число попаданий в цель будет не менее двух?
6. Два равносильных противника играют в шахматы. Что вероятнее:
а) выиграть одну партию из двух или две партии из четырех?
б) выиграть не менее двух партий из четырех или не менее трех партий из пяти?
Задание 7. Известно, что непрерывная случайная величина распределена по нормальному закону, математическое ожидание равно 4. Определите значение среднего квадратического отклонения, если максимальное значение дифференциальной функции распределения составляет 0,4. Постройте график нормального распределения.
Задание 8. Известно, что непрерывная случайная величина распределена по нормированному закону, где х меняется от 10 до 20. Постройте график распределения.
Задание 9. Вероятность попадания в цель при стрельбе из орудия р = 0,6. Найдите математическое ожидание общего числа попаданий, если будет произведено 10 выстрелов.
Вопросы для самоконтроля
1. Чему равна сумма всех возможных вероятностей в законе распределения дискретной случайной величины?
2. Можно ли применять формулу Бернулли для зависимых испытаний?
3. Какими должны быть испытания, чтобы можно было применять формулу Бернулли?
4. Чему равно значение непрерывной случайной величины при котором функция плотности вероятности этой величины достигает максимального значения?
5. Приведите пример непрерывной случайной величины, распределенной по нормальному закону?
6. Как найти вероятность того, что в n независимых испытаниях событие A появится хотя бы один раз?
Математическая статистика
Основные умения: рассчитывать основные статистические показатели для решения профессиональных задач; осуществлять самостоятельную деятельность по сбору, обработке, группировке, анализу информации; использовать методы математической статистики в психолого-педагогических исследованиях.
Основной величиной в статистических измерениях является единица статистической совокупности (например, любой из критериев оценки качества педагога-исследователя). Единица статистической совокупности характеризуется набором признаков или параметров. Значения каждого параметра или признака могут быть различными и в целом образовывать ряд случайных значений x 1, х 2, …, хn.
Переменная (variable) – это параметр измерения, который можно контролировать или которым можно манипулировать в исследовании. Так как значения переменных не постоянны, нужно научиться описывать их изменчивость.
Для этого придуманы описательные или дескриптивные статистики: минимум, максимум, среднее, дисперсия, стандартное отклонение, медиана, квартили, мода.
Относительное значение параметра – это отношение числа объектов, имеющих этот показатель, к величине выборки. Выражается относительным числом или в процентах (процентное значение).
Пример 1: Успеваемость в классе = числу положительных итоговых отметок, деленному на число всех учащихся класса. Умножение этого значения на 100 дает успеваемость в процентах. 25/100=25%
Удельное значение данного признака – это расчетная величина, показывающая количество объектов с данным показателем, которое содержалось бы в условной выборке, состоящей из 10, 100, 1000 и т. д. объектов.
Пример 2: Для сравнения уровня правонарушений в разных регионах берется удельная величина – количество правонарушений на 1000 человек (N).
Минимум и максимум – это минимальное и максимальное значения переменной.
Размах (R)–это разность между максимальным и минимальным значением переменной: R= max–min.
Среднее арифметическое может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.
Для несгруппированных данных:
(1)
где n – объем выборки; xi – значения выборки.
Для сгруппированных данных:
(2)
где n – объем выборки; k – число интервалов группировки; ni – частоты интервалов; xi – срединные значения интервалов.
Пример 3: Наблюдение посещаемости четырех внеклассных мероприятий в экспериментальном (20 учащихся) и контрольном (30) классах дали значения (соответственно): 18, 20, 20, 18 и 15, 23, 10, 28. Среднее значение посещаемости в обоих классах получается одинаковое – 19. Однако видно, что в контрольном классе этот показатель подчинен воздействию каких-то специфических факторов.
Медианой (Ме) называется такое значение признака X, когда одна половина значений экспериментальных данных меньше ее, а вторая половина – больше.
Для вычисления медианы несгруппированных данных выборку сортируют, находят ранг R (порядковый номер) медианы:
(3)
Медианой будет значение признака, стоящее на RМе месте в ранжированной выборке. Для нахождения медианы в случае сгруппированных данных:
(4)
где хMeН – нижняя граница медианного интервала; h – ширина интервалов группировки; nxMe –1 – накопленная частота интервала, предшествующего медианному; nMe – частота медианного интервала.
Мода (Мо) представляет собой значение признака, встречающегося в выборке наиболее часто.
Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»). Для несгруппированных данных мода – это значение признака с наибольшей частотой появления.
Для сгруппированных данных:
(5)
где xMoH – нижняя граница модального интервала, nMo – частота интервала.
Пример 4: Найти среднее арифметическое, моду и медиану распределения студентов по числу баллов, полученных ими на экзамене: 20 19 12 18 7 15 12 11 16 17 15 13 14 15 20 8 9 10 18 12 10.
Решение.
Решим данную задачу, используя электронные таблицы MS Excel.
Внесите данные задачи в столбец В листа электронных таблиц, начиная со второй строки. В столбец А внесите № п/п, проставив которые получим последний №, соответствующий объему выборки n =21.
Поставив курсор в ячейку В23 введем формулу нахождения среднего значения =СРЗНАЧ(В2:В22). Можно ввести собственную формулу: =СУММ(В2:В22)/21.
Для вычисления медианы, расположим данные в порядке возрастания: скопируем данные в столбец D, выделим столбец и отсортируем. Найдем ранг медианы по формуле (3): На 11-м месте в ранжированной выборке стоит значение 14. Ме=14. Используя встроенную функцию: =МЕДИНА(В2:В22), получаем то же значение 14.
Для нахождения моды воспользуемся ранжированной выборкой, в которой можно заметить, что наиболее часто (3 раза) встречаются значения 12 и 15 – значения несмежные, поэтому выборка имеет 2 моды и называется бимодальной. Используя встроенную функцию: =МОДА (В2:В22). Получаем значение 12 (Excel не рассматривает случаи бимодальных распределений).
Пример 5: Дано распределение семей по числу детей. Найти моду, медиану и среднее арифметическое. Построить гистограмму и полигон распределения.
Число детей | |||||||
Число семей |
Решение. Значением признака будет являться число детей, а частотой – число семей, в которых содержится такое количество детей. Найдем среднее арифметическое количества детей в семье.
Внесем таблицу на лист электронных таблиц: число детей – в столбец А; число семей в столбец В. Данные в таблице являются сгруппированными.
Найдем общий объем выборки, суммируя данные столбца числа семей, и занесем в ячейку В10 формулу =СУММ(В2:В8), получим n =200. Для нахождения значения среднего арифметического сгруппированных данных воспользоваться встроенной функции невозможно, поэтому применяем формулу (2) – сумма произведений значений столбцов А и В =СУММПРОИЗВ(A2:A8;B2:B8)/B10 и занесем формулу в ячейку В12, получим .
Для нахождения медианы необходимо определить медианный интервал. Медианным будет тот интервал, в котором накопленная частота впервые окажется больше n /2 (n /2=200/2=100). В столбец D занесем значения накопленных частот: в D2 – В2, в D3=D2+B3 и т.д. Замечаем, что накопленная частота больше 100 равная 115 соответствует значению признака 2 ребенка в семье. Ме=2.
Мо=2, т.к. это значение признака встречается наиболее часто – 75 раз.
Построим гистограмму: | Построим полигон: | |||||
Для оценки степени разброса (отклонения) какого-то показателя от его среднего значения, наряду с максимальным и минимальным значениями, используются понятия дисперсии и стандартного отклонения.
Дисперсия выборки или выборочная дисперсия (от английского variance) – это мера изменчивостипеременной. Термин впервые введен Фишером в 1918 году.
Дисперсия меняется от нуля до бесконечности. Крайнее значение 0 означает отсутствие изменчивости, когда значения переменной постоянны.
Стандартное отклонение, среднее квадратическое отклонение (от английского standard deviation) вычисляется как корень квадратный из дисперсии. Чем выше дисперсия или стандартное отклонение, тем сильнее разбросаны значения переменной относительно среднего.
Пример 7: По данным примера 3, где приводиится посещаемость четырех внеклассных мероприятий в экспериментальном (20 учащихся) и контрольном (30) классах, рассчитаем дисперсию и стандартное отклонение:
Классы | D(x) | ||
Экспериментальный | |||
Контрольный | 48,5 |
Это означает, что в одном классе посещаемость высокая, стабильная, а в другом – отличается непостоянством.
Дата добавления: 2015-07-15; просмотров: 173 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Нормальное распределение | | | Дискретные случайные величины. |