Что видит нейросеть и как она это делает?

18:23 28 мая 2018

Что и как видит нейросетьАрхитектура искусственной нейронной сети подразумевает наличие слоёв с нейронами. Самая простая сеть состоит из трёх: входного, промежуточного и выходного. Все нейроны предыдущего слоя связаны со всеми из следующего. Начальный слой принимает данные, в среднем – они сублимируются, и в конечном – дают выходной результат.

Как эффективно обучить такую систему давать желаемый ответ? Например,чтобы она явно отличала образ кошки от всего остального.

Промежуточный слой с меньшим количеством нейронов

Что если промежуточный слой будет короче начального? Это можно сделать двумя способами. Изменить структуру сети. Пусть во втором слое будет в два раза меньше нейронов, чем во входном. Второй способ, не уменьшая количества нейронов, часть их выключить.

Если нейронов на пути сигнала будет меньше, то нейросети ничего не останется, как сжать данные. То есть, вычленить главные признаки и отбросить второстепенные.

Каскад укороченных слоёв

А что если добавить за этим суженым слоем следующий, где активных элементов будет ещё меньше? И так, в каскадном порядке, несколько раз.

И как же всё это работает на примере распознавания образов?

От простого к сложному

В первом слое будут выделяться какие-то совсем элементарные составляющие: вертикальные и наклонные линии. Второй слой как входные данные получит не изначальные пиксели изображения, а образ, состоящий из линий под разными углами. После прохождения обработки во втором слое акцентируются фигуры более абстрактного уровня – круги, треугольники, прямоугольники. Третий слой будет работать уже с этими формами, и искать закономерности более высокого порядка, вычленив, например, схематичный контур кошки и так далее.
А если в конце сети поставить пару слоёв снова с увеличенным количеством нейронов, то можно будет классифицировать результат и подать его на тот выход, который, по «мнению» сети, соответствует классу объекта.

Аналогичные процессы в биологическом мозге

Зрение человека устроено подобным образом. Для того чтобы информация прошла через узкий зрительный канал, её необходимо сжать. Нейроны, которые расположены на сетчатке глаза, реагируют только на линии и яркостные градиенты. На следующем уровне нейроны активируются только на более сложные формы, составленные из простых, и так далее. Сложность распознанных образов возрастает, и упрощённо говоря, где-то на 15 слое через 15 миллисекунд мозг осознаёт, что видит некий объект. Всё это подтверждено экспериментально, снимая показания с групп датчиков, установленных в коре мозга животного в разных местах.

Свёрточные сети

Устройство зрительной системы очень похоже на работу свёрточных нейронных сетей. Работа таких сетей характеризуется переходом от особенностей образа к его абстрактным признакам вплоть до выявления понятий высокого уровня. Нейросети с таким принципом действия самонастраиваются и вырабатывают свою иерархию определяющих признаков, фильтруя детали малой важности и собирая существенное.


Теги: Нейронные сети
Категория Искусственный интеллект   |   0 комм.
Нет результатов.