Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Гистограмма

Читайте также:
  1. Для каких целей в практике контроля качества используется гистограмма?

Не всегда легко просмотреть измеренные данные и определить образцы или проанализировать то, что нам сообщают эти данные. Гистограмма может предоставить информацию о степени разнородности данных и указать образец распределения.

Если собрать данные о процессе, в котором все факторы (человек, машина, материал, метод и т.п.) строго постоянны, то они оказались бы одинаковыми. Однако в действительности невозможно все время сохранять постоянство всех факторов. Несмотря на стремление удержать на постоянном уровне те условия, которые подвержены изменениям, в показателях качества изделий все-таки наблюдается рассеивание значений. Строго говоря, даже те несколько факторов, которые считаются постоянными, на самом деле будут изменяться. Такого рода рассеивание можно подразделить на две категории:

а) неизбежное рассеивание значений показателей качества;

б) устранимое рассеивание значений показателей качества.

Поскольку категория а) представляет собой случайные погрешности производства, которые возникают либо из-за колебаний в качестве сырья и материалов (в пределах допустимых отклонений), либо из-за изменений в условиях производства (также в пределах допустимых отклонений), то устранять эту категорию рассеивания, как обусловленную случайными причинами, неэкономично.

Категория б) представляет собой систематическую погрешность производства, которая возникает либо в результате использования нестандартного сырья и материалов, либо из-за нарушения технологического режима при выполнении операций, либо вследствие осуществления их по технологической документации, которая недоработана, либо в результате неожиданной разладки оборудования. Следовательно, это происходит по определенной причине и представляет собой явление, которое следует устранить.

Вся совокупность рассматриваемых объектов называется генеральной совокупностью.

Один или несколько элементов, взятых из генеральной совокупности для получения информации о ней, называется выборкой. Так как выборка используется для оценивания характеристик всей генеральной совокупности, ее стоит выбирать таким образом, чтобы она отражала именно эти характеристики. Распространенный выборочный метод заключается в выборе любого члена генеральной совокупности с одинаковой вероятностью. Практически это может быть осуществлено, например, так: все изделия генеральной совокупности нумеруются последовательно, а затем из них по таблицам случайных чисел выбирается требуемое число изделий выборки. Этот метод называют случайным выбором, а выборку, полученную этим методом, – случайной выборкой. Мы получаем данные, измеряя характеристики выборки. Пользуясь этими данными, делаются выводы относительно генеральной совокупности, а затем производятся некоторые корректирующие действия. Правда, измеренные выборочные значения будут изменяться от выборки к выборке, затрудняя принятие решения о требуемом действии. Статистический анализ может подсказать, как интерпретировать такие данные.

Гистограмма, которую также называют распределением частот, – это визуальное изображение распределения. Информация на гистограмме изображается с помощью серии прямоугольников или полос одинаковой ширины. Высота этих полос указывает количество данных в каждом классе.

Частотность событий (отношение числа благоприятных событий к общему числу испытаний) указывается по вертикальной оси, а группа данных, или классы, указываются по горизонтальной оси. Чтобы провести оценку гистограммы, мы должны знать центральную тенденцию, а также рассеивание данных.

Может быть использован следующий алгоритм построения гистограммы:

1. Вычисление выборочного размаха R, равного разности между максимальным и минимальным значениями всех исходных данных.

2. Размеры классов определяются делением размаха на интервалы равной ширины, чтобы получилось от 5 до 20 интервалов равной ширины.

3. Готовят бланк, куда можно занести класс, среднюю точку, отметки частот, частоты и т.д.

4. Определяют нижнюю границу первого класса и прибавляют к ней ширину этого класса, чтобы получить границу между первым и вторым классами. Далее, продолжая прибавлять найденный интервал к предыдущему значению для получения второй границы, затем третьей и так далее, можно удостовериться, что последний класс включает максимальное значение.

Этап 5. Вычисляют середины классов, равные сумме верхней и нижней границ класса, деленной пополам;

6. Для получения частот надо подсчитать, какое количество значений из таблицы исходных данных попадает внутрь каждого из интервалов, и записать частоты, приходящиеся на каждый интервал, используя наклонные черточки, сгруппированные по пять.

Наиболее типичные виды гистограмм перечислены ниже:

а) Обычный тип (симметричный или колоколообразный).

Среднее значение гистограммы приходится на середину размаха данных. Наивысшая частота оказывается в середине и постепенно снижается к обоим концам. Форма симметрична. Это именно та форма, которая встречается чаще всего.

б) Гребенка (мультимодальный тип). Классы через один имеют более низкие частоты. Такая форма встречается, когда число единичных наблюдений, попадающих в класс, колеблется от класса к классу или когда действует определенное правило округления данных.

в) Положительно скошенное распределение (отрицательно скошенное распределение). Среднее значение гистограммы локализуется слева (справа) от центра размаха. Частоты довольно резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Форма ассимметрична.

Такая форма встречается, когда нижняя (верхняя) граница регулируется либо теоретически, либо по значению допуска или когда правое (левое) значение недостижимо.

г) Распределение с обрывом слева (распределение с обрывом справа). Среднее арифметическое гистограммы локализуется далеко слева (справа) от центра размаха. Частоты резко спадают при движении влево (вправо) и, наоборот, медленно вправо (влево). Форма асимметрична.

Это одна из тех форм, которые часто встречаются при 100 %-ном контроле изделий из-за плохой воспроизводимости процесса, а также когда проявляется резко выраженная положительная (отрицательная) асимметрия.

д) Плато (равномерное и прямоугольное распределения). Частоты в разных классах образуют плато, поскольку все классы имеют более или менее одинаковые ожидаемые частоты с конечными классами.

Такая форма встречается в смеси нескольких определений, имеющих различные средние.

е) Двухпиковый тип (бимодальный тип). В окрестностях центра данных частота низкая, зато есть по пику с каждой стороны.

Такая форма встречается, когда смешиваются два типа данных с далеко отстоящими средними значениями.

ж) Распределение с изолированным пиком. Наряду с распределением обычного типа появляется маленький изолированный пик

Эта форма, которая появляется при наличии малых включений данных из другого распределения, как, скажем, в случае нарушения нормальности процесса, появления погрешности измерения или просто включения данных из другого процесса.

Итак, есть множество видов распределений, но самое типичное из них -нормальное распределение. Когда разброс характеристики качества обусловлен суммой большого числа независимых ошибок, вызванных различными факторами, то ее распределение во многих случаях получается приблизительно нормальным. Нормальное распределение можно легко узнать по колоколообразной форме, если:

1) его наибольшая частота приходится на середину интервала и плавно спадает к его концам (хвостам) т.е. большинство точек (данных) располагаются вблизи центральной линии или в середине;

2) центральная линия делит кривую на две симметричные половины;

3) лишь малое число точек разбросано далеко и относится к минимальным или максимальным значениям;

4) нет точек, лежащих за колоколообразной кривой.

Нормальное распределение описывается выражением:

, (1)

где m – центр распределения (среднее арифметическое) и s – разброс распределения (стандартное отклонение).

Для нормального распределения иногда используют обозначение N(m,s2) так как оно характеризуется двумя параметрами – m и s.

Для подсчета вероятностей в нормальном распределении его нормируют, преобразуя случайную величину x к стандартной мере u:

. (2)

На практике мы можем пренебречь шансами, что x окажется за пределами m±3s. Этот правило нормального распределения получило название правила трех сигм. Оно служит основанием для определения контрольных пределов в контрольных картах.

При сборе подобных данных правильнее рассматривать каждый результат как часть целого множества и не обрабатывать его в отрыве от этого множества. Чтобы осознать данные как группу, сначала надо определить центр этой группы данных, а затем выяснить, как каждый результат соотносится с этим центром. Мера центра распределения – это число, которое характеризует положение центра. Подобная мера может быть введена различными способами. Здесь будут рассмотрены три таких меры: среднее арифметическое (или просто среднее), мода и медиана. Кроме того, ниже будет приведен пример вычисления среднего арифметического значения и стандартного отклонения.

Типичной мерой для представления центра данных служит среднее арифметическое, или математическое ожидание (ожидаемое значение). Когда у нас есть n отдельных значений x1, …, xn среднее таких данных описывается выражением

,

где xi – представляет i -ое значений случайной величины, n – объем выборки.

Среднее арифметическое – наиболее широко используемая центра распределения.

Достоинства использования среднего арифметического:

1. это "центр тяжести" всех данных;

2. при его вычислении используются все данные;

3. его расчет не требует сортировки данных.

Недостатки использования среднего арифметического:

1. резко выделяющиеся значения могут приводить к его существенному смещению;

2. среднее может и не совпадать ни с одним из фактическим значений.

Мода – это то значение, которое встречается во множестве даннычх наиболее часто. Для групп данных может существовать более одной моды.

Достоинства использования моды:

1. не требуется ни вычислений, ни сортировки данных;

2. резко выделяющиеся значения не влияют на результат вычисления;

3. она всегда совпадает с каким-то фактическим значением.

Недостатки использования моды:

1. данные могут не иметь моды;

2. мода может не иметь отношения к центру распределения.

Медиана (средняя точка) – это такое значение, которое расположено посередине упорядоченных по возрастанию или убываний! данных. Например, из 9 чисел – 2, 1, 2, 3, 6, 7, 7, 8, 4 – медианой будет 4 так как оно пятое по счету, то есть расположено посередине ряда 1,2,2, 3, 4, 6, 7, 7, 8. Для четного числа данных медиана – среднее из двух ближайших к центру значений. Например, если к тому же ряду добавить число 9, то для десяти чисел – 2, 1, 2, 3, 6, 7, 7, 8, 4, 9 – медианой будет 5, так как в ряду 1, 2,2,3,4, 6, 7, 7, 8, 9 посередине расположены числа 4 и 6, соответственно их среднее равно 5.

Достоинства использования медианы:

1. Она позволяет представить, где расположена большая часть данных;

2. Для расчета почти не требуется вычислений.

Недостатки использования медианы:

1. Данные надо предварительно упорядочить;

2. В эту меру входят не все данные;

3. Резко выделяющиеся существенные значения могут не влиять на значение медианы.

Когда выясняется, что гистограмма может быть разумно аппроксимирована нормальным распределением, то может быть предпринято исследование воспроизводимости процесса. Под воспроизводимостью процесса понимают соотношение между фактической шириной распределения и заданными границами поля допуска. Это соотношение важно при оценке того, на каком уровне процесс пересекает границы поля допуска. Если допустить, что нормальное распределение применимо, то долю дефектных изделий, оказавшихся за границами поля допуска при заданных значениях параметров m и s, можно определить сразу.

Если имеется допуск, то следует нанести на гистограмму линии границ для сравнения распределения с этими границами. Тогда можно оценить правильность расположения гистограммы внутри границ. При этом возможны пять типичных случаев:

I. Если отображаемое гистограммой фактическое распределение удовлетворяет требованиям допуска. Возможны следующие варианты:

а) гистограмма вполне соответствует допускам и существует запас допустимых значений. Поддержание существующего состояния – это все, что требуется;

б) допуски удовлетворяются, но нет никакого запаса. Поэтому было бы лучше сократить разброс до меньшего значения.

II. Если отображаемое гистограммой фактическое распределение не удовлетворяет требованиям допуска, то возможны следующие варианты:

в) центр распределения смещен и имеется односторонний выход распределения за границы допуска влево или вправо. Необходимо добиться смещения среднего ближе к центру поля допуска.

г) края распределения выходят за поле допуска с обеих сторон. Потребуются действия, направленные на снижение вариации (уменьшение стандартного отклонения);

д) распределение шире поля допуска и смещено влево или вправо. Одновременно потребуются меры, описанные в пунктах в) и г).

В некоторых случаях наблюдаемые значения делятся на две или более подсовокупности в соответствии с теми условиями, которые существовали во время сбора данных. Такие подсовокупности называются слоями (стратами), процесс разделения данных по слоям называется расслаиванием или стратификацией. Попадающие в эти подсовокупности значения почти всегда имеют некоторый разброс. Расслаивание данных в соответствии факторами, вызывающими вариации, существенно облегчает выявлен: причин вариаций. Знание причин вариации позволяет принять эффективные меры для уменьшения стандартного отклонения и смещения среднего значения процесса в нужную сторону. Это и есть способ повышения качества продукции с помощью метода стратификации данных. Расслаивание обычно проводят по материалам, машинам условиям производства и рабочим.


Дата добавления: 2015-07-16; просмотров: 188 | Нарушение авторских прав


Читайте в этой же книге: Контрольный лист | Анализ Парето | Контрольные карты |
<== предыдущая страница | следующая страница ==>
Причинно-следственная диаграмма Исикавы| Диаграмма разброса

mybiblioteka.su - 2015-2024 год. (0.014 сек.)