Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Восстановление пропущенных компонент данных

Читайте также:
  1. I. Создание базы данных
  2. А. Биохимический компонент боли.
  3. АЛФАВИТНЫЙ СПИСОК НАИБОЛЕЕ УПОТРЕБИТЕЛЬНЫХ В ДЕЛОВОЙ РЕЧИ ГЛАГОЛЬНО-ИМЕННЫХ СЛОВОСОЧЕТАНИЙ ПО ВТОРОМУ (ИМЕННОМУ) КОМПОНЕНТУ
  4. Б. Нейрогенный компонент боли.
  5. База данных MySQL
  6. Байт – машинное слово минимальной размерности, адресуемое в процессе обработки данных.
  7. Библиографирование документов как компонент библиографической деятельности.

Главные компоненты оказываются удобным инструментом и для восстановления пропусков во входных данных. Действительно, метод главных компонент дает наилучшее линейное приближение входных данных меньшим числом компонент: (Здесь мы, как и прежде, для учета постоянного члена включаем фиктивную нулевую компоненту входов, всегда равную единице - см. Рисунок 41, где справа показана нейросетевая интерпретация метода главных компонент. Таким образом, - это матрица размерности ). Восстановленные по главным компонентам данные из обучающей выборки имеют наименьшее среднеквадратичное отклонение от своих прототипов . Иными словами, при отсутствии у входного вектора компонент, наиболее вероятное положение этого вектора - на гиперплоскости первых главных компонент. Таким образом, для восстановленного вектора имеем: , причем для известных компонент .

Пусть, например, у вектора неизвестна всего одна, -я координата. Ее значение находится из оставшихся по формуле:

,

где в числителе учитываются лишь известные компоненты входного вектора .

В общем случае восстановить неизвестные компоненты (с индексами из множества ) можно с помощью следующей итеративной процедуры (см. Рисунок 42):

 

Рисунок 42. Восстановление пропущенных значения с помощью главных компонент. Пунктир - возможные значения исходного вектора с неизвестными координатами. Наиболее вероятное его значение - на пересечении с первыми главными компонентами


Дата добавления: 2015-11-30; просмотров: 36 | Нарушение авторских прав



mybiblioteka.su - 2015-2024 год. (0.007 сек.)