Читайте также:
|
|
К задаче качественного описания данных исследования систем относится задача распознавания образов и сопутствующая ей задача идентификации. Основная задача формулируется следующим образом. Задано разбиение объектов на группы (классы), называемые образами. Это разбиение можно рассматривать как качественный (номинальный) признак, а образы – как значения этого признака. Требуется охарактеризовать образы, то есть значения выходного признака в терминах значений входных признаков, так, чтобы для любого объекта исследования можно было на основе входных признаков прогнозировать, к какому образу объект принадлежит.
Основным методом качественного конструирования данных системы является метод группировки (или разбиения) объектов, часто называемый методом автоматической классификации. Он сводится к построению номинального признака (разбиения) на данном множестве объектов, в некотором смысле аппроксимирующего исходные данные.
Разбиение, классы которого описаны через признаки, использованные при его построении, называют типологией или типологической группировкой.
Примером естественнонаучной типологии является таблица Менделеева, связывающая термины (признаки) внешних физических свойств элементов с терминами химических реакций и терминами внутреннего строения атомов рассматриваемых элементов, таблица Дарвина и др. Имеются три основные количественные модели для качественных данных признаков и структур систем:
Именно в силу количественного характера этих моделей мы можем представлять их как элементы некоторых геометрических пространств, что нам позволяет формулировать и решать основные задачи анализа данных описания и конструирования независимо от характера исходной информации, как задачи аппроксимации с помощью более просто устроенных структур.
В данном изложении нет возможности подробно осветить содержание моделей. Остановимся на конспективном описании лишь первой из них.
1-я модель - модель распределений (многомерных таблиц сопряженности) признаков основана на представлении системами «вкладов», даваемых теми или иными группами признаков. Прежде всего, рассматривается задача конструирования номинального признака, который бы наилучшим образом соответствовал исходным экспериментальным данным. При этом применяется латентно-структурный анализ.
ПРИМЕР.
В процессе качественного исследования рынка полиграфической продукции региона был проведен выборочный опрос потенциальных потребителей. Объект выборки составил 1000 чел. В ходе опроса требовалось собрать информацию о читаемости журналов А и В. Ответы о читаемости (ответ «да» для журнала и ) и нечитаемости (ответ «нет» для журнала и ) сведены в следующую таблицу сопряженности признака:
140 | ||||||
Признаки А и В не являются статистически независимыми, так как мы видим, что . Следовательно, в журналах А и В есть что-то общее, хотя они и не являются одинаковыми с точки зрения читателей. Объяснить их связь (общее) может учет третьего признака, например, «уровень образования» со значениями - высший и - не высший.
Распределение этих признаков А, В с учетом ввода С сведено в следующую таблицу:
При фиксированных значениях признака «уровень образования» признаки А и В статистически независимых обеих таблицах столбцы пропорциональны, хотя и по разному. Значит, признак С объясняет связь между журналами. Они оба рассчитаны в основном на высокообразованных читателей, 60% которых от общей массы читают журнал А, и 80% от общей массы читают журнал В. В то же время среди низкообразованных читателей только 20% читают журнал А, и только 20% читают журнал В. Значит, первую группу, составляющую 50% от тысячи опрошенных читателей, можно охарактеризовать вектором , аналогично вторую группу опрошенных характеризуем .
Дата добавления: 2015-07-14; просмотров: 93 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Моделирование как метод системного анализа. | | | Методы решения задач количественного описания данных системы |