Original size 1140x1600

введение

PROTECT STATUS: not protected
This project is a student project at the School of Design or a research project at the School of Design. This project is not commercial and serves educational purposes
big
Original size 1280x720

на изображении представлен метод создания человеческого лица 2019 года, созданный NVIDIA. Вся анимация также произведена нейросетью.

От автора:

Нейросети — одно из самый быстро развивающихся явлений на данный момент. Проект скорее представляет собой архивную документацию их развития, и уже через неделю исследование может оказаться неактуальным в связи с исправлением ошибок и быстрым обучением моделей.

Теория

Нейросети — это системы искусственного интеллекта, которые обучаются самостоятельно на основе опыта, подобно тому, как делают это люди.

Обучение нейросетей в основном осуществляется методом обратного распространения ошибок, который заключается в том, что нейросети настраиваются на определенном наборе данных, предоставленных для обучения. Эта важная техника позволяет минимизировать ошибки, совершаемые в результатах работы нейросети.

Задачи, которые выполняют нейросети, весьма разнообразны. Они могут распознавать образы на изображениях: например, узнавать, что на картинке изображен грузовик, а не легковой автомобиль.

big
Original size 1034x538

нейросеть ищет пожарный гидрант. 2019 г, фото в цвете

Они могут анализировать звуки и распознавать речь, что позволяет создавать системы голосового управления или превращать речь в текст. (невероятно, но факт: вы пользовались ими еще до того как это стало мейнстримом и все поголовно начали выкладывать свои обработанные фотки в запрещенную сеть)

Для генерации лиц несуществующих людей нейросети используют генеративно-состязательные сети (GAN).

Original size 1890x1888
Original size 754x356

На изображениях выше мы видим пример сбора множества изображений, взятых с сайта thispersondoesnotexist.com. После складывания изображений можно увидеть средний портрет несуществующего человека.

Примечательно, что в случае со средним портретом лиц реального человека итоговый портрет может меняться, в зависимости от разных условий.

Среднее же лицо генерируемого человека всегда остается одинаковым.

GAN состоит из двух нейронных сетей: генератора и дискриминатора: внутри нейросети взаимодействуют художник и критик.

Генератор (он же художник) получает на вход случайный вектор и генерирует изображение, претендуя на то, что оно похоже на лицо человека. Дискриминатор (он же критик) получает на вход реальное изображение лица и изображение, созданное генератором. Он анализирует изображения и решает, является ли изображение, созданное генератором реалистичным, или нет.

GAN учит генератор создавать изображения, которые могут обмануть дискриминатор. Генератор подстраивает свой выходной результат по мере получения обратной связи от дискриминатора. В результате GAN может создавать очень реалистичные изображения. Если художник может обмануть своего внутреннего критика, то и с человеком эта пара справится без проблем.

Original size 1280x720

Чтобы получить наиболее убедительные результаты, генератор может быть обучен на большом количестве реальных изображений. Это позволяет ему научиться обнаруживать общие черты реальных лиц, такие как форма глаз, носа, рта и их расположение.

Однако, суть работы GAN заключается в «имитации реальной действительности», и существует риск быть неточным в деталях. О чем и пойдет речь далее.

Обращение к читателю

Ошибки нейросети — это то, ради чего мы здесь все собрались. В данном опусе мы рассмотрим, почему о них не только интересно, но и важно говорить, узнаем, как «растет» сеть и, наконец, поймем — сможет ли нейросеть, в итоге, рисовать руки. Или же продолжит стараться прятать их в карманы.

Чтобы не бросать никого на произвол судьбы с миллионом новых и узконаправленных терминов, в конце каждой страницы будет приведен небольшой глоссарий, с подборкой употребляемых в статье терминов, возможно незнакомых читателю. Каждый из терминов был старательно написаны так, чтобы был понятен, от «человека» к человеку». Если после нескольких прочтений Вам продолжает казаться, что Вы не понимаете его смысла, возможно, он не так важен. Донесение общей сути возможно и без него.

Цель «статьи» — не оттолкнуть новоприбывших в данное поле деятельности людей, а, напротив, доказать безопасность и некую «человечность» происходящего.

ГЛОССАРИЙ

Генератор и дискриминатор. Художник и критик — это две базовые составляющие в нейронных сетях, используемых для генерации изображений, звуков и других типов данных.

Генератор — это нейронная сеть, которая создает новые изображения или данные путем преобразования случайного шума в структурированные данные. Например, генератор может произвольно создавать изображения лиц или зданий на основе случайно сгенерированных параметров. Цель генератора — создавать данные, максимально похожие на реальные, показанные ему во время обучения.

Дискриминатор  — это другая нейронная сеть, которая оценивает, насколько созданные генератором данные похожи на настоящие данные. В контексте изображений дискриминатор может определять, является ли данное изображение реальным или ненастоящим. Цель дискриминатора — различать настоящие данные от созданных генератором.

Обучение нейронной сети, состоящей из генератора и дискриминатора, включает в себя поочередную тренировку генератора и дискриминатора. Генератор пытается создать данные, которые будут проходить проверку дискриминатора, а дискриминатор в свою очередь учится различать настоящие данные от созданных генератором данных.

Метод обратного распространения ошибок (Backpropagation)

— это алгоритм обучения нейронной сети, который заключается в распространении ошибки от выходного слоя к скрытым слоям сети, с последующим обновлением весов нейронной сети в соответствии с полученной информацией об ошибке. Таким образом, метод обратного распространения ошибок оптимизирует веса каждого нейрона, чтобы минимизировать ошибку при вычислении выходных значений сети. Это достигается за счет вычисления градиента ошибки, который определяет направление наибольшего изменения функции ошибки при изменении весов. Используя градиент, метод обратного распространения ошибок определяет, в каком направлении следует изменять веса для минимизации ошибки.

Градиент при обучении нейронной сети

— это значение, которое показывает, как изменяется функция ошибки при изменении весов нейронной сети. Градиент используется для нахождения оптимальных значений весов, которые минимизировали бы ошибку.

Chapter:
1
2
3
4
5
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more