Идея проекта
Эдуард Мане (1832–1883) занимает особое место в истории искусства: его работы стоят на границе двух эпох. Он сохранял академическую строгость в композиции, но разрушал её смелостью мазка, приглушёнными переходами тонов и подчёркнутой плоскостностью форм. Именно эта двойственность делает Мане идеальным кандидатом для обучения нейросети — его стиль достаточно узнаваем, но при этом технически сложен для воспроизведения.
Цель проекта — проверить, способна ли модель Stable Diffusion, дообученная на датасете картин Мане, воспроизводить характерные черты его живописи применительно к новым сюжетам: современным и классическим мотивам, натюрмортам, портретам и сценам на пленэре.
пример изображения из датасета
пример изображения из датасета
примеры изображений из датасета
Описание обучения
В качестве базовой модели использовалась Stable Diffusion XL (SDXL) с дообучением на собранном датасете из картин Мане. Обучение проводилось через Google Colab в два этапа с использованием двух техник.
— Сбор и подготовка датасета Отобраны картины Мане из открытых музейных коллекций (Met, Wikimedia). Все изображения обрезаны до квадратного формата 1:1, нормализованы по качеству. К каждому изображению составлен текстовый триггер для обучения.
— DreamBooth — закрепление стилистических черт Первый этап дообучения направлен на усвоение ключевых визуальных характеристик живописи Мане на уровне всей модели.
— LoRA — тонкая настройка без перезаписи модели Второй этап добавляет LoRA-адаптеры поверх дообученных весов. Это позволяет точечно закрепить детали стиля, не разрушая общие возможности базовой модели.
— Генерация и отбор Для каждого из 8 тематических промптов сгенерировано по 5-10 вариантов. Финальный отбор — по соответствию стилю и художественному качеству.
Обучение проходило через Google Colab, 500 шагов. Модель основана на stable-diffusion-xl-base-1.0 https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0
Серия сгенерированных изображений
Восемь итоговых работ охватывают ключевые жанры, характерные для Мане: портрет, натюрморт, жанровая сцена, морской пейзаж. Промпты составлялись так, чтобы воспроизводить как излюбленные сюжеты художника, так и узнаваемые формальные приёмы его письма.
photo collage in Manet style, a man in a top hat reading a newspaper by a window
photo collage in Manet style, child in a sailor suit playing in the surf
photo collage in Manet style, glass of white wine and a half-eaten baguette on a café table
photo collage in Manet style, oysters and a lemon on a silver tray
photo collage in Manet style, sailors on a deck at dusk
photo collage in Manet style, two figures picnicking in a sun-dappled park
photo collage in Manet style, woman in a red dress
photo collage in Manet style, young woman in a blue bonnet looking sideways, loose portrait
Модель воспроизвела приглушённые охристо-оливковые фоны, характерные для Мане. Локальные цвета — красный, синий, белый — переданы крупными, почти без градиентов. Особенно точно — в портретах и натюрмортах.
— Фактура мазка Свободный, «незаконченный» мазок — один из главных признаков стиля. Хорошо считывается в портрете в синем чепце и сцене с матросами. В натюрмортах — тяготение к более гладкой поверхности.
— Свет и тени Мане отказывался от классической светотени в пользу резких переходов. Модель передала это в портрете мужчины у окна: тёмный силуэт против светлого проёма без мягких полутеней.
— Композиция Центрирование фигуры, нейтральный или размытый фон — приёмы Мане-портретиста — переданы точнее всего. Групповые сцены (пикник, матросы) менее стилистически однородны.
— Морская тема Две работы из серии посвящены морю. Тёмная, насыщенная палитра сцены с матросами близка к историческим морским картинам Мане. Детская сцена с прибоем — более академична по исполнению.
— Ограничения Наибольшие расхождения заметны в анатомии рук и многофигурных сценах. Подписи на картинах — артефакты генерации, не несущие смысла. Часть работ балансирует между Мане и более академичной живописью XIX в.
Вариативность между изображениями серии отражает широту жанрового охвата: от камерного натюрморта до многофигурной пленэрной сцены. Там, где у Мане было меньше характерных работ в датасете (морской жанр), результат менее уверенный. Портреты и натюрморты — наиболее репрезентативные жанры — переданы убедительнее всего. Это соответствует общей логике DreamBooth: модель лучше воспроизводит то, чего в обучающей выборке было больше.
Проект показывает, что нейросеть способна уловить «дух» художника — особую комбинацию цвета, мазка и настроения — даже не понимая исторического контекста его работ.
Код




