Исходный размер 2480x3500

Мане

Проект принимает участие в конкурсе

Идея проекта

Эдуард Мане (1832–1883) занимает особое место в истории искусства: его работы стоят на границе двух эпох. Он сохранял академическую строгость в композиции, но разрушал её смелостью мазка, приглушёнными переходами тонов и подчёркнутой плоскостностью форм. Именно эта двойственность делает Мане идеальным кандидатом для обучения нейросети — его стиль достаточно узнаваем, но при этом технически сложен для воспроизведения.

Цель проекта — проверить, способна ли модель Stable Diffusion, дообученная на датасете картин Мане, воспроизводить характерные черты его живописи применительно к новым сюжетам: современным и классическим мотивам, натюрмортам, портретам и сценам на пленэре.

Исходный размер 960x960

пример изображения из датасета

Исходный размер 960x960

пример изображения из датасета

примеры изображений из датасета

Описание обучения

В качестве базовой модели использовалась Stable Diffusion XL (SDXL) с дообучением на собранном датасете из картин Мане. Обучение проводилось через Google Colab в два этапа с использованием двух техник.

— Сбор и подготовка датасета Отобраны картины Мане из открытых музейных коллекций (Met, Wikimedia). Все изображения обрезаны до квадратного формата 1:1, нормализованы по качеству. К каждому изображению составлен текстовый триггер для обучения.

— DreamBooth — закрепление стилистических черт Первый этап дообучения направлен на усвоение ключевых визуальных характеристик живописи Мане на уровне всей модели.

— LoRA — тонкая настройка без перезаписи модели Второй этап добавляет LoRA-адаптеры поверх дообученных весов. Это позволяет точечно закрепить детали стиля, не разрушая общие возможности базовой модели.

— Генерация и отбор Для каждого из 8 тематических промптов сгенерировано по 5-10 вариантов. Финальный отбор — по соответствию стилю и художественному качеству.

Обучение проходило через Google Colab, 500 шагов. Модель основана на stable-diffusion-xl-base-1.0 https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0

Серия сгенерированных изображений

Восемь итоговых работ охватывают ключевые жанры, характерные для Мане: портрет, натюрморт, жанровая сцена, морской пейзаж. Промпты составлялись так, чтобы воспроизводить как излюбленные сюжеты художника, так и узнаваемые формальные приёмы его письма.

Исходный размер 1024x1024

photo collage in Manet style, a man in a top hat reading a newspaper by a window

Исходный размер 1024x1024

photo collage in Manet style, child in a sailor suit playing in the surf

Исходный размер 1024x1024

photo collage in Manet style, glass of white wine and a half-eaten baguette on a café table

Исходный размер 1024x1024

photo collage in Manet style, oysters and a lemon on a silver tray

Исходный размер 1024x1024

photo collage in Manet style, sailors on a deck at dusk

Исходный размер 1024x1024

photo collage in Manet style, two figures picnicking in a sun-dappled park

Исходный размер 1024x1024

photo collage in Manet style, woman in a red dress

Исходный размер 1024x1024

photo collage in Manet style, young woman in a blue bonnet looking sideways, loose portrait

Модель воспроизвела приглушённые охристо-оливковые фоны, характерные для Мане. Локальные цвета — красный, синий, белый — переданы крупными, почти без градиентов. Особенно точно — в портретах и натюрмортах.

— Фактура мазка Свободный, «незаконченный» мазок — один из главных признаков стиля. Хорошо считывается в портрете в синем чепце и сцене с матросами. В натюрмортах — тяготение к более гладкой поверхности.

— Свет и тени Мане отказывался от классической светотени в пользу резких переходов. Модель передала это в портрете мужчины у окна: тёмный силуэт против светлого проёма без мягких полутеней.

— Композиция Центрирование фигуры, нейтральный или размытый фон — приёмы Мане-портретиста — переданы точнее всего. Групповые сцены (пикник, матросы) менее стилистически однородны.

— Морская тема Две работы из серии посвящены морю. Тёмная, насыщенная палитра сцены с матросами близка к историческим морским картинам Мане. Детская сцена с прибоем — более академична по исполнению.

— Ограничения Наибольшие расхождения заметны в анатомии рук и многофигурных сценах. Подписи на картинах — артефакты генерации, не несущие смысла. Часть работ балансирует между Мане и более академичной живописью XIX в.

Вариативность между изображениями серии отражает широту жанрового охвата: от камерного натюрморта до многофигурной пленэрной сцены. Там, где у Мане было меньше характерных работ в датасете (морской жанр), результат менее уверенный. Портреты и натюрморты — наиболее репрезентативные жанры — переданы убедительнее всего. Это соответствует общей логике DreamBooth: модель лучше воспроизводит то, чего в обучающей выборке было больше.

Проект показывает, что нейросеть способна уловить «дух» художника — особую комбинацию цвета, мазка и настроения — даже не понимая исторического контекста его работ.

Код

Исходный размер 1280x410
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше