Читайте также: |
|
В первичной обработке результатов наблюдений при анализе показателей работы разных отраслей производственной сферы (добыча нефти и газа, ремонт скважин, машиностроение, строительная индустрия и т.д.) и их прогнозировании используют методы математической статистики, которые позволяют установить закономерности производственных результатов с требуемой точностью, надежностью и минимальных материальных, трудовых затратах и оценить их основные свойства.
Решение этих вопросов методами математической статистики осуществляют следующим образом.
Пусть Х — некоторый производственный показатель (признак), а ,
,...,
— результаты независимых наблюдений над ними. Если количество наблюдений n невелико, наблюдения либо ранжируют, либо сводит в табл. 1, где каждому значению
ставят в соответствие частоту
появления этого значения в данной выборке.
Таблица 1 | ||||
Варианты, ![]() | ![]() | ![]() | ... | ![]() |
частоты, ![]() | ![]() | ![]() | ... | ![]() |
Здесь , где n — объем выборки.
Если количество наблюдений n достаточно большое (), то результаты наблюдений сводят в интервальный вариационный ряд, который формируется следующим образом.
Вычисляют размах варьирования R признака Х, как разность между наибольшим и наименьшим
значениями признака, то есть
. Размах R варьирования признака Х делится на k разных частей и таким образом определяется число столбцов (интервалов) в таблице. Величину k частичного интервала выбирают, пользуясь следующими правилами:
,
,
.
При небольшом объеме n выборки число интервалов принимают равным от 6 до 10. Длина h каждого частичного интервала определяется по формуле
.
Величину h обычно округляют до некоторого значения d. Например, если результаты признака Х — целые числа, то h округляют до целого значения, если
содержат десятичные знаки, то h округляют до значения d, содержащего такое же число десятичных знаков. Затем подсчитывается частота
, с которой попадают значения
признака Х в i -ый интервал. Значение
, которое попадает на границу интервала относятся к какому-либо определенному концу, например, к левому. За начало
первого интервала рекомендуется брать величину
. Конец
последнего интервала находят по формуле
. Сформированный интервальный вариационный ряд записывают в виде табл. 2.
Таблица 2 | ||||
Варианты-интервалы,
(![]() ![]() | (![]() ![]() | (![]() ![]() | ... | (![]() ![]() |
частоты, ![]() | ![]() | ![]() | ... | ![]() |
Интервальный вариационный ряд изображают геометрически в виде гистограммы частот или гистограммы относительных частот
.
Гистограммой называется ступенчатая фигура, для построения которой по оси откладывают отрезки, изображающие частичные интервалы (
;
) варьирования признака Х, и на этих отрезках, как на основаниях, строят прямоугольники с высотами, равными частотам или частостям соответствующих интервалов.
Для расчета статистик (выборочной средней, выборочной дисперсии, асимметрии и эксцесса) переходят от интервального вариационного ряда к дискретному. В качестве вариантов этого ряда берут середины интервалов (
;
). Дискретный вариационный ряд записывается в виде табл. 3 или табл. 4.
Таблица 3 | ||||
Варианты, хi | х 1 | х 2 | ... | хk |
частоты, mi | m 1 | m2 | ... | mk |
Здесь , где n — объем выборки.
Таблица 4 | ||||
Варианты, ![]() | ![]() | ![]() | ... | ![]() |
относительные частоты, ![]() | ![]() | ![]() | ... | ![]() |
Здесь .
Графически дискретный вариационный ряд изображают в виде полигона частот или относительных частот. В системе координат 0 ху строят точки с координатами (;
) или (
;
), где
— значение i -го варианта, а
(
) — соответствующие частоты (частости). Ломаную линию, соединяющую построенные точки, называют полигоном.
Вариационные ряды графически можно изобразить в виде кумулятивной кривой (кривой сумм — кумуляты). При построении кумуляты дискретного вариационного ряда на оси абсцисс откладывают варианты , а по оси ординат соответствующие им накопленные частоты
. Соединяя точки с координатами (
;
) отрезками прямых, получаем ломаную (кривую), которую называют кумулятой. Для получения накопительных частот и дальнейшего построения точек (
;
) составляется расчетная табл. 5.
Таблица 5 | ||||
Варианты, ![]() | ![]() | ![]() | ... | ![]() |
относительные частоты, ![]() | ![]() | ![]() | ... | ![]() |
накопительные
относительные
частоты,
![]() | ![]() | ![]() | ... | ![]() |
При построении кумуляты интервального вариационного ряда левому концу первого интервала соответствует частота, равная нулю, а правому — вся частота этого интервала. Правому концу второго интервала соответствует накопительная частота первых двух интервалов, то есть сумма частот этих интервалов и т. д. Правая граница последнего интервала равна сумме всех частот, то есть объему n выборки.
Для характеристики свойств статистического распределения в математической статистике вводится понятие эмпирической функции распределения.
Эмпирической функцией распределения или функцией распределения называется функция , определяемая равенством
, (1)
где n — объем выборки, — число вариантов
, меньших х. Аналогом этой функции в теории вероятностей является интегральная функция распределения
. Функция
отличается от функции
тем, что вместо вероятности P (
) берется относительная частота
.
Чтобы найти значение функции приданном значении x, надо подсчитать число вариантов, которые принял признак Х меньше, чем х и разделить на объем выборки.
Эмпирическая функция служит для оценки теоретической функции распределения генеральной совокупности. При больших объемах n выборки согласно знака больших чисел функции
сходится по вероятности к теоретической функции
признака Х.
Значения эмпирической функции принадлежат промежутку
. Графиком функции
служит кусочно-постоянная кривая (рис. 1).
Эта кривая имеет скачки в точках, которые соответствуют вариантам . При обработке результатов эксперимента, например, результатов механических испытаний, целесообразно вместо ступенчатой кривой вычерчивать плавную кривую (на рис. 1 это штриховая линия), которая проходит через точки, расположенные посередине вертикальных частей ступенчатой кривой. Абсциссами этих точек служат значения механической характеристики
, а ординатами — эмпирическая функция
, характеризующая оценку вероятности события
.
Дата добавления: 2015-10-29; просмотров: 96 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Global warming | | | Распределения |