Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Многослойный персептрон

Читайте также:
  1. Многослойный плоский неороговевающий эпителий

Рассмотрим простейшее объединение – многослойный персептрон.

 

Рис. 2.1 Многослойный персептрон

 

Входной слой нейронных элементов выполняет распределительные функции. Выходной слой нейронов служит для обработки информации от предыдущих слоев и выдачи результатов. Слои нейронных элементов, расположенные между входным и выходным слоями, называются промежуточными или скрытыми. Как и выходной слой, скрытые слои являются обрабатывающими. Выход каждого нейронного элемента предыдущего слоя нейронной сети соединен синаптическими связями со всеми входами нейронных элементов следующего слоя. Таким образом, топология многослойной нейронной сети является однородной и регулярной.

В качестве функции активации нейронных элементов обычно используется гиперболический тангенс или сигмоидная функция.

 

1. Сигмоида (функция Ферми)

 

Функция описывающая сигмоиду: OUT=1/(1+exp(-NET))

 

Часто применяются для многослойных перцептронов и других сетей с непрерывными сигналами. Гладкость, непрерывность функции — важные положительные качества. Непрерывность первой производной позволяет обучать сеть градиентными методами (например, метод обратного распространения ошибки).

Функция симметрична относительно точки (NET=0, OUT=1/2), это делает равноправными значения OUT=0 и OUT=1, что существенно в работе сети. Тем не менее, диапазон выходных значений от 0 до 1 несимметричен, из-за этого обучение значительно замедляется. Значение производной выражается через саму функцию, что приводит к увеличению скорости расчета производной при обучении сети.

 

2. Гиперболический тангенс

Функция: OUT=(exp(NET)-exp(-NET))/(exp(NET)+exp(-NET)) также часто применяется в сетях с непрерывными сигналами. Производная выражается через саму функцию.

 

Пусть - матрица весовых коэффициентов i-го слоя многослойной сети. Тогда для нейронной сети с двумя скрытыми слоями выходные значения

где - вектор-строка входных сигналов; F – оператор нелинейного преобразования. Общее число синаптических связей многослойной нейронной сети

где р - общее количество слоев нейронной сети; k(i) – количество нейронных элементов в i-м слое.

Число слоев в многослойной нейронной сети характеризует, каким образом входное пространство может быть разбито на подпространства меньшей размерности. Так, двухслойная нейронная сеть с одним слоем нелинейных нейронов разбивает входное пространство образов на классы при помощи гиперплоскости. Трехслойная нейронная сеть, где в качестве двух последних слоев используются нейронные элементы с нелинейной функцией активации, позволяет формировать любые выпуклые области в пространстве решений. Четырехслойная нейронная сеть, которая имеет три нелинейных слоя, дает возможность получать область решений любой формы и сложности, в том числе и невыпуклой.

Многослойные персептроны успешно применяются для решения разнообразных сложных задач и имеют следующих три отличительных признака.

1. Каждый нейрон сети имеет нелинейную функцию активации. Важным является то, что такая нелинейная функция должна быть гладкой, в отличие от жесткой пороговой функции, используемой в персептроне Розенблатта. Наличие нелинейности играет очень важную роль, так как в противном случае отображение «вход-выход» сети можно свести к обычному однослойному персептрону.

2. Несколько скрытых слоев. Многослойный персептрон содержит один или несколько слоев скрытых нейронов, не являющихся частью входа или выхода сети. Эти нейроны позволяют сети обучаться решению сложных задач, последовательно извлекая наиболее важные признаки из входного образа.

3. Высокая связность. Многослойный персептрон обладает высокой степенью связности, реализуемой посредством синаптических соединений. Изменение уровня связности сети требует изменения множества синаптических соединений или их весовых коэффициентов.

Комбинация всех этих свойств наряду со способностью к обучению на собственном опыте обеспечивает вычислительную мощность многослойного персептрона. Однако следует учесть, что эти же качества являются причиной неполноты современных знаний о поведении такого рода сетей: распределенная форма нелинейности и высокая связность сети существенно усложняют теоретический анализ многослойного персептрона.


Дата добавления: 2015-11-14; просмотров: 77 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Винахід стародавнього Китаю № 4 — компас| ПРОПЕЧАТАТЬ КАЖДУЮ СТРОЧКУ ПО 6 РАЗ

mybiblioteka.su - 2015-2024 год. (0.007 сек.)