Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Эмпирическое распределение

Читайте также:
  1. I. Общее распределение по полу, возрасту, национальности, месту рожде­ния и детства, общему обучению
  2. III. Распределение часов курса по темам и видам работ
  3. Воспоминания и разговоры о беременности • Эмпирическое исследование боли
  4. Генератор кода. Распределение памяти. Виды переменных
  5. Гипергеометрическое распределение.
  6. Глава 7. Распределение
  7. Глава 7. Распределение.

Генеральная совокупность – это 1) множество всех мысленно возможных объектов, над которыми проводится наблюдение с целью определения признака этих объектов, или 2) множество результатов всех мыслимых измерений, проводимых в неизменных условиях над одной из случайных величин, связанных с данным видом объекта.

Выборочная совокупность или выборка – множество определенным образом отобранных из генеральной совокупности объектов (измерений).

Объемом совокупности (выборочной или генеральной) называется число объектов этой совокупности. Объем выборки (выборочной совокупности) всегда меньше объема генеральной совокупности.

Пусть имеется выборка (x1, x2, …, xn) из генеральной совокупности с признаком X. Это – так называемая таблица наблюдаемых (эмпирических) данных (Таблица 1). Распределение X неизвестно, как неизвестно и распределение выборки.

Таблица 1. Эмпирические данные

Некоторые числовые характеристики выборки могут быть получены непосредственно из таблицы 1 путем несложных вычислений. Среди них количество значений, наибольшее и наименьшее значение, размах полученных значений (разница между наибольшим и наименьшим значениями), среднее значение и т.д.

Для дальнейшей работы целесообразно отсортировать эмпирические данные в возрастающем порядке.

Группирование эмпирических данных – это разделение размаха значений выборки на несколько интервалов, граничащих друг с другом, с отнесением каждого значения в выборке к тому или иному интервалу.

Рис. 1. Эмпирические данные и их группирование

Количество интервалов n при группировании выбирает исследователь, но его выбор должен учитывать следующее: 1) объема выборки; 2) размах полученных данных; 3) среднего количества данных в группе. Обычно n выбирается равным 7…15, ширина интервалов принимается одинаковой (желательно), а границы для удобства располагаются на округленных значениях.

При группировании в интервал включаются данные, значения которых больше или равны нижней границе интервала и строго меньше – верхней.



Варианта – характерное (срединное) значение интервала группирования.

Вариационный ряд – последовательность вариант, записанных в возрастающем порядке (например: 3, 5, 7).

Частота ni – это количество попавших в i-ый интервал эмпирических данных, где i = 1, 2, …, n. При этом .

В различные интервалы, как правило, попадает разное количество эмпирических данных.

Относительная частота (частость) wi – отношение частоты ni к объему выборки n, где i = 1, 2, …, n. При этом .

Относительная частота удобна тем, что не имеет привязки к объему выборки, и поэтому применима при сравнении выборок разного объема.

По частотам (частостям) можно вычислить накопленные частоты (накопленные частости), которые получаются суммированием с нарастающим итогом частот (относительных частот) соответствующих вариационному ряду.

Таблица 2. Табличное представление эмпиричесого распределения

Границы Варианта Частота Частость Накопленная частота Накопленная частость
           
           
           
n            
    Итого:        

Эмпирическим (статистическим) распределением называется перечень вариант и соответствующих им частот или относительных частот.

Загрузка...

В теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями.

Эмпирической функцией распределения (функцией распределения выборки) называется функция F*(x), определяющая для каждого значения x относительную частоту события X<x, то есть

,

где nx – количество эмпирических данных, для которых значение признака X меньше x (значение на шкале).

При изменении значения x будет меняться и nx. Поэтому относительная частота рассматриваемого события – функция от x. Так как эта функция находится на основе эмпирически полученных данных, то ее называют эмпирической. Поскольку она строится на основе дискретных значений, то является ступенчатой функцией.

Для построения эмпирической функции распределения можно использовать как несгруппированные данные, так и сгруппированные.

В отличие от эмпирической функции распределения выборки, интегральную функцию F(x) распределения генеральной совокупности называют теоретической функцией распределения.

Из теоремы Бернулли следует, что при увеличении n эмпирическая функция распределения приближается к теоретической, и чем объем выборки больше, тем меньше различий между ними. Поэтому для определения свойств генеральной совокупности допустимо использовать эмпирические распределения.

Полигон частот – это ломаная линия, для построения которой по оси абсцисс откладывают варианты, а по оси ординат – соответствующие им частоты, и затем полученные точки соединяют отрезками прямых.

Полигон относительных частот (частостей) строится аналогичным образом, но вместо частот используются частости вариант.

Внешне он будет идентичен ломаной линии полигона частот, поскольку только по оси ординат произойдет изменение масштаба (за счет деления на объем выборки).

Полигон накопленных частот – эта ломаная линия, для построения которой по оси абсцисс откладывают верхние границы интервалов группирования данных, а по оси ординат – соответствующие им накопленные частоты, и затем полученные точки соединяют отрезками прямых.

Переходя от накопленных частот к накопленным частостям, получим полигон накопленных частостей.

Здесь все значения по оси ординат лежат в диапазоне от 0 до 1 включительно. Это уже некоторый аналог графика функции распределения случайной величины.

Гистограмма частот – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат интервалы группирования (по оси абсцисс), а высоты (по оси ординат) равны отношению , где ni – частоты, hi – ширина интервала, i – номер интервала группирования. Площадь каждого прямоугольника равна ni , поскольку , где i = 1, 2, …, n.

Если все интервалы равны между собой, то по оси ординат можно откладывать частоты без деления их на ширину интервала.

Это возможно, поскольку деление всех частот на одно и то же число приводит только к изменению масштаба по оси ординат.

Площадь всех прямоугольников гистограммы частот равна объему выборки n и при перегруппировании не изменяется. Вид гистограммы существенно зависит от порядка группирования.

Гистограмма относительных частот (частостей) – ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат интервалы группирования длиною hi, а высоты равны отношению относительной частоты wi к длине интервала hi (плотность относительной частоты), где i = 1, 2, …, n.

Гистограмма относительных частот абсолютно идентичны по форме гистограммам частот, но с изменением масштаба оси ординат, получаемым в результате деления ее на объем выборки n.

Площадь всех прямоугольников гистограммы относительных частот равна 1, также как у функции плотности вероятности.

В качестве числовых характеристик эмпирического распределения могут использоваться:

выборочное среднее ;

взвешенное выборочное среднее ;

выборочная дисперсия ;

взвешенная выборочная дисперсия ,

где – варианта i-го интервала.


Дата добавления: 2015-07-08; просмотров: 287 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Обработка и интерпретация. Ключ.| Опубликовано: Традиционная культура, 2007, № 4. – С. 40–51.

mybiblioteka.su - 2015-2017 год. (0.011 сек.)