Исходный размер 1140x1600

Современные портреты в стиле Густава Климта: обучение генеративной модели

Проект принимает участие в конкурсе

Концепция проекта

Проект посвящён исследованию того, как генеративная нейросеть Stable Diffusion может перенести уникальный орнаментальный стиль Густава Климта (золотой период) в жанр современного портрета.

Климт — один из самых ярких представителей венского модерна, чьи работы отличаются золотыми фонами, изогнутыми линиями, орнаментальными узорами и сложной символикой.

Цель проекта — обучить модель Stable Diffusion XL понимать и воспроизводить эти характерные черты, создавая новые портреты, в которых стиль художника органично сочетается с современными образами, чертами лица, одеждой и окружением.

«Поцелуй», 1907–1908 гг. / «Юдифь и Олоферн», 1901 г. Густав Климт

Исходный размер 3497x1209

«Ожидание», 1905–1909 гг. / «Портрет женщины», 1916–1917 гг. / «Портрет Адели Блох-Бауэр I», 1909 г. Густав Климт

Для обучения нейросети был собран датасет из 30 репродукций картин Густава Климта, относящихся к его золотому периоду. Все изображения были приведены к квадратному формату 512×512 пикселей и обработаны вручную для сохранения ключевых элементов стиля: золотые фоны, орнаментальные узоры, плавные линии, портретные композиции.

Исходный размер 1648x532

Подготовка изображений

Процесс обучения

Обучение проводилось в Google Colab с использованием ноутбука SDXL DreamBooth LoRA. Была выбрана базовая модель Stable Diffusion XL с улучшенным VAE (madebyollin/sdxl-vae-fp16-fix).

Исходный размер 1390x658

Часть кода

Датасет был загружен локально в папку klimt. Для каждого изображения в файле metadata.jsonl указан единый промпт, который модель ассоциирует со стилем: «photo collage in KLIMT style»

Исходный размер 2592x876

Загрузка датасета

Исходный размер 1346x866

Код обучения

После первоначальной попытки обучения с автоматически сгенерированными описаниями (BLIP) качество стиля оказалось низким. Было выполнено дообучение с исправленным metadata.jsonl, что позволило модели правильно усвоить ключевые признаки. Общее время обучения на GPU T4 составило около 1 часа.

Итоговые изображения

После обучения модель была применена для генерации портретов. Промпты строились по шаблону: «photo collage in KLIMT style, [описание]».

Для достижения разнообразия использовались различные seed, guidance scale (от 7 до 8.5) и количество шагов (30–40).

Исходный размер 1024x1024

Портрет крупным планом в стиле работ Густава Климта

Исходный размер 1024x1024

Женский портрет в стиле работ Густава Климта

Женские портреты в стиле работ Густава Климта

Исходный размер 1024x1024

Женский портрет в стиле работ Густава Климта

Примеры промптов:

— «photo collage in KLIMT style, close-up of a woman’s face with gold leaf details, abstract floral patterns, high detail, sharp» — «photo collage in KLIMT style, profile portrait of a man with a beard, blue and silver tones, geometric ornaments, moody lighting» — «photo collage in KLIMT style, a couple embracing, golden swirls, red and gold palette, romantic atmosphere, soft focus» — «photo collage in KLIMT style, full body portrait of a dancer in motion, flowing gold ribbons, dynamic composition, bright colors»

Женские портреты в стиле работ Густава Климта

Исходный размер 1024x1024

Портрет женщины в стиле работ Густава Климта

Портрет мужчины в стиле работ Густава Климта

Исходный размер 1024x1024

Портрет кошек Портрет в стиле работ Густава Климта

В итоговой серии изображений удалось передать несколько ключевых элементов, характерных для творчества Климта:

— Золотые фоны и орнаменты — в большинстве генераций присутствуют золотистые пятна, декоративные узоры, напоминающие климтовские круги, спирали и мозаичную текстуру.

— Плавные линии и ар-нуво — контуры лиц, одежды и декоративных элементов часто имеют изогнутую, «растительную» пластику.

— Портретная композиция — модель сохранила центрированный формат, характерный для многих работ Климта, а также крупный план лица, что соответствует оригинальному стилю.

— Цветовая гамма — в сгенерированных изображениях доминируют золотые, тёплые тона, иногда с добавлением синих, зелёных или красных акцентов, что перекликается с палитрой золотого периода.

Вывод

Обучение генеративной модели на репродукциях картин Густава Климта показало, что нейросеть способна перенимать ключевые особенности его стиля (золотые фоны, орнаменты, плавные линии) и переносить их на новые портретные сюжеты. При этом качество результата напрямую зависит от разнообразия датасета и точности промптов.

Для дальнейшего улучшения можно расширить датасет изображениями с различными ракурсами, добавить примеры современных портретов и использовать дополнительные методы управления генерацией (ControlNet).

Таким образом, первоначальная идея проекта — продемонстрировать возможность переноса уникального орнаментального стиля Климта в современные портретные образы — может считаться реализованной. Полученная серия изображений подтверждает гибкость генеративных моделей и их потенциал для стилизации и творческого переосмысления классического искусства.

Генеративные нейросети

Stable Diffusion XL — базовая модель для генерации изображений и дообучения (DreamBooth + LoRA).

ChatGPT (OpenAI) — использовался для формулировки промптов, уточнения описаний и устранения ошибок в коде.

DeepSeek — применялся для объяснения технических деталей, корректировки параметров обучения и анализа результатов.

Современные портреты в стиле Густава Климта: обучение генеративной модели
Проект создан 24.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше