Исходный размер 912x1280

Обучение нейросети по картинам Одилона Редона

Проект принимает участие в конкурсе

Зачем я делаю этот проект?

Я делаю этот проект, чтобы ответить на вопрос: может ли генеративная нейросеть передать тяжёлое депрессивное состояние, используя художественные приёмы Одилона Редона? В отличие от формального копирования стиля, здесь важно, чтобы модель усвоила те визуальные средства (цвет, свет, композицию, символику), которые формируют меланхоличную, тревожную атмосферу. Датасет строится как репрезентативная подборка, фиксирующая повторяющиеся приёмы, отвечающие за эмоциональное воздействие. Цель эксперимента — проверить, способна ли нейросеть воспроизводить не просто стилистику, а именно заданное эмоциональное состояние.

На исходных изображениях мы имеем визуальную среду, построенную на приглушённой, но при этом насыщенной цветовой палитре, где доминируют глубокие синие, тёмные красные, охристые, золотистые и болезненно-жёлтые оттенки. Цвет здесь функционирует не как средство описания реальности, а как носитель эмоционального состояния: даже яркие тона лишены жизнеутверждающей силы и работают на создание напряжённой, меланхоличной атмосферы. Свет в этих работах носит внутренний, почти психический характер: он исходит не из внешнего источника, а как будто из самих объектов — голов, фигур, цветочных форм. Это создаёт ощущение замкнутости переживания и усиливает впечатление погружённости во внутренний мир. Повторяющиеся мотивы — изолированные головы, закрытые или отсутствующие глаза, цветы как символические формы, а также гибридные, трудноопределимые существа — формируют устойчивую систему визуальных знаков, связанных с состояниями отрешённости, сна и внутреннего напряжения. Персонажи почти всегда погружены в себя: их головы склонены, глаза закрыты или отсутствуют, взгляд не направлен во внешний мир. Они не взаимодействуют друг с другом и лишены социальной среды, что усиливает ощущение изоляции и одиночества. Композиции при этом лишены чёткой перспективы и пространственной логики: фигуры помещены в неопределённое, абстрактное поле, которое скорее отражает психологическое состояние, чем описывает физическую среду.

В совокупности эти приёмы формируют визуальный язык, в котором депрессивное и тревожное состояние передаётся не через сюжет или нарратив, а через систему художественных средств — цвет, свет, композицию и повторяемую символику. Именно эта совокупность признаков делает данный массив изображений репрезентативным для исследования: он фиксирует устойчивые визуальные механизмы, с помощью которых возможно моделирование меланхоличного, замкнутого и психологически напряжённого состояния, что напрямую соотносится с задачей проверки способности генеративной нейросети воспроизводить не только стиль, но и заданную эмоциональную атмосферу.

Процесс обучения модели в нескольких отдельных шагах

создал кастомные описания изображений с помощью BLIP

Исходный размер 1280x386

проверил правильно ли погрузился датасет с фото

Сгенерированная серия изображений

У меня получилось сгенерировать 5 удачных изображений на основе картин:

Исходный размер 1024x1024

промт: Image in odilon-redon style, sad alone white face without body on the black plate

Исходный размер 1024x1024

Промт: image in odilon-redon style, portrait of disappointed woman with closed eyes

Исходный размер 1024x1024

промт: image in odilon-redon style, depressed angels with big wings

Исходный размер 1024x1024

промт: image in odilon-redon style, depressed man sitting in boat

Исходный размер 1024x1024

промт: image in odilon-redon style, melancholic womеn sitting on the cliff

Выводы

В ходе эксперимента выяснилось, что нейросети удалось усвоить ключевые формальные характеристики, составляющие визуальный язык Одилона Редона. Модель уверенно воспроизводит характерную цветовую палитру с преобладанием глубоких коричневых, охристых и приглушённых красных оттенков, передаёт мягкость и размытость живописной поверхности, а также использует композиционные приёмы, связанные с изоляцией фигуры и отсутствием определённой пространственной среды. Важно, что эти элементы начинают работать не изолированно, а в совокупности: в сгенерированных изображениях возникает ощущение замкнутого, интроспективного пространства, где цвет, свет и форма формируют единое эмоциональное поле. Несмотря на сложность задачи, нейросеть демонстрирует способность не только имитировать стиль, но и частично воспроизводить меланхоличную и тревожную атмосферу, что позволяет говорить о её потенциале в передаче более сложных, опосредованных эмоциональных состояний.

Как сделано?

В основе экспериментов — архитектура Stable Diffusion XL 1.0. Адаптация весов выполнена методом Dreambooth с применением LoRA, что обеспечило точечную настройку без полного переобучения модели. Обучающая выборка состояла из 25 изображений, унифицированных до разрешения 1024×1024.

Дополнительно были использованы https://chatgpt.com/ и https://deepseek.com/en/ для написания текста

Обучение нейросети по картинам Одилона Редона
Проект создан 24.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше