Читайте также:
|
|
Закон распределения реализаций случайной величины x 1, x 2,…, xn, составляющих выборку некоторой длины n, называется выборочным, или статистическим. Получение выборочной ФРВ F* (x) или ПРВ является одной из основных задач обработки результатов статистического моделирования. Возможны два варианта постановки такой задачи:
1. Вид закона распределения (чаще всего - аналитическое выражение для ПРВ) известен и требуется определить только его параметры. При такой постановке задачи применяются параметрические методы восстановления закона распределения.
2. Вид закона распределения неизвестен. В таком случае для его получения применяются непараметрические методы.
3.6.1. Параметрические методы восстановления закона распределения
Если известно или считается известным аналитическое выражение для ПРВ, она рассматривается как функция f (x, A), где A =(a 1, a 2,…, am) - вектор неизвестных параметров.
В соответствии с методом наибольшего правдоподобия вводится функция правдоподобия
,
где xi - реализации случайной величины x, составляющие выборку.
В качестве оценок параметров aj выбираются значения, доставляющие локальный максимум функции правдоподобия. Для этого в соответствии с необходимым условием достижения локального экстремума составляются m уравнений:
, j= 1,2,..., m.
Решение полученной системы m уравнений с m неизвестными дает вектор оценок искомых параметров A *=(a 1*, a 2*,…, am *).
Пример: f (x)= f (x,l)=l e -l x, , A =(l), m= 1,
,
,
,
.
В соответствии с методом моментов уравнения для оценок неизвестных параметров образуются приравниванием выборочных начальных моментов распределения
аналогичным моментам распределения генеральной совокупности
.
Количество составляемых уравнений соответствует количеству неизвестных параметров:
, l= 1,2,..., m.
Пример: f (x)= f (x,l)=l e -l x, , A =(l), m= 1,
,
,
, .
3.6.2. Непараметрические методы восстановления закона распределения
Классические непараметрические методы восстановления закона распределения по случайной выборке x 1, x 2,…, xn позволяют получить аппроксимации ПРВ или ФРВ кусочно-постоянными функциями.
Для аппроксимации ПРВ обычно используются статистические ряды или гистограммы.
При построении статистического ряда выборка разбивается на разряды:
[ xj, xj +1], x 1= xmin, xj +1= xj +D x, j= 1,2,..., m; xm +1= xmax.
Количество разрядов m обычно выбирается в соответствии с условиями:
при , при n> 500.
Длина разряда постоянна: . Разность xmax-xmin называется размахом выборки. Все попавшие в j -й разряд значения x далее считаются одинаковыми и равными среднему значению для данного разряда vj.
Статистический ряд составляется в форме табл. 8.
Таблица 8
Статистический ряд
Номер разряда | Границы разряда | Среднее значение | Число наблюдений в разряде | Частота разряда |
x 1¸ x 2 | v 1 | n 1 | p 1* | |
x 2¸ x 3 | v 2 | n 1 | p 2* | |
… | … | … | … | … |
j | xj ¸ xj +1 | vj | nj | pj * |
… | … | … | … | … |
m | xm ¸ xm +1 | vm | nm | pm * |
Средние значения для разрядов определяются как средние арифметические границ: . Частоты разрядов - как отношения количества элементов выборки, попавших в данный разряд к общему объему выборки: .
По статистическому ряду могут быть найдены оценки математического ожидания и дисперсии случайной величины x:
,
.
Гистограмма представляет собой графическую интерпретацию статистического ряда (рис. 28). На основе гистограммы могут быть получены аппроксимации ФРВ (рис. 29) или ПРВ (рис. 30). Ординаты F *(x) и f *(x) определяются по формулам:
,
.
Более точной аппроксимацией выборочной ФРВ является статистическая функция распределения Fx *(x), определяемая как частота наблюдения реализаций xi, не превышающих x: , где nx - количество значений .
Для ее построения вся выборка сортируется в порядке возрастания x: . Теперь отношения порядковых номеров j к объему выборки n дают значение Fx *(x) для интервалов [ xj, xj +1] (рис. 31):
.
Менее наглядна, но более удобна для алгоритмической реализации иная форма вычисления статистической функции распределения, не требующая предварительной сортировки выборки:
, ui=x-xi,
Получаемые на основе рассмотренных методов оценки ПРВ и ФРВ наглядны и просты в реализации, но не обладают свойством достаточности.
В последнее время разработаны более эффективные оценки ПРВ, являющиеся обобщениями "окошечной" оценки Розенблатта. Оценка Розенблатта имеет вид:
, ,
Величина 2 h называется шириной окна. В общем случае она выбирается в зависимости от объема выборки: h=h (n) > 0, причем .
Принцип построения "окошечной" оценки состоит в том, что с каждым выборочным значением xi совмещается окно шириной 2 h (рис. 32). Значение оценки ПРВ для любой точки пропорционально количеству окон, накрывающих эту точку.
Более общими и обладающими свойством достаточности являются ядерные оценки ПРВ вида
, , .
Функция Kn (x, xi) называется функцией ядра, h=h (n) > 0- коэффициентом вклада. В отличие от оценки Розенблатта, здесь K (u) отличается от нуля при любом u. Она имеет максимум при u= 0 (x=xi), является четной относительно u и монотонно убывает при удалении u от нуля. Благодаря такому выбору функции ядра, для любой точки x обеспечивается определение оценки ПРВ с учетом степени удаленности от x каждого значения xi, содержащегося в выборке.
Требования к K (u) и h (n):
, , , ,
.
Для конкретной задачи функция ядра и коэффициент вклада выбираются с учетом статистических характеристик обрабатываемой выборки [46].
Примеры функций ядра и коэффициентов вклада:
, , , ,
где s x * - оценка среднеквадратического отклонения.
Дата добавления: 2015-11-04; просмотров: 58 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Способы построения генераторов случайных чисел | | | Распределения |