Каджарское искусство представляет собой уникальный художественный стиль, расцветший в Персии в период правления династии Каджаров с конца XVIII до начала XX века. Это направление стало удивительным мостом между традиционной восточной миниатюрой и европейской масляной живописью, породив парадные портреты с узнаваемой «кукольной» эстетикой. Для этого стиля характерны строгая фронтальная композиция, плоскостная трактовка пространства и гиперболизированные каноны красоты: густые сросшиеся брови, огромные миндалевидные глаза и обилие детализированных орнаментов на тяжелых тканях, расшитых жемчугом.

Исходные изображения

Я выбрала эту тему, потому что каджарская живопись обладает мощным визуальным кодом, который кажется мне идеальным материалом для экспериментов с машинным обучением. Меня завораживает то, как в этих работах сочетаются декоративность и почти сакральная статичность поз, создающие эффект вневременья. Работа с этим стилем позволяет мне исследовать границы между историческим наследием и цифровой деформацией, проверяя, способна ли нейросеть уловить тонкую грань между гротеском и канонической красотой, которая так важна для персидского искусства той эпохи.

Исходный размер 2560x1920

Исходное изображение

Готовая серия

В рамках проекта я хочу получить серию цифровых полотен, которые будут выглядеть как «утерянные» или вновь обретенные портреты каджарской эпохи, но с едва заметными следами алгоритмического вмешательства. Моя цель — добиться высокой консистентности стиля, сохранив специфическую пластику лиц и фактуру материалов.

Промпт «Veiled beauty revealing one kohl eye, heavy gold necklace, emerald drop earrings, rosewater scent, ornate turban»

Исходный размер 2381x1024

Промпт «Princess holding mirror, turquoise headdress, ruby-encrusted bracelets, monobrow, large expressive eyes»

Исходный размер 2458x1024

Промпт «Persian lady with opium pipe, silk robe with pearl buttons, hennaed fingers, vibrant jewel tones, oil painting texture»

Исходный размер 2458x1024

Я очень довольна тем, какой получилась итоговая серия: изображения вышли четкими, в отличном разрешении и без того самого «цифрового шума», который часто портит нейросетевые работы. Лицо и детали выглядят естественно, а текстуры прорисованы чисто. Я вижу, что модель не просто заучила исходники, а уловила саму суть персонажа, поэтому картинки смотрятся как качественные фотографии, а не как случайная склейка кадров.

Для меня было важно закрепить узнаваемость, и это удалось на сто процентов. Персонажи сохраняют узнаваемые черты в любых ситуациях, будь то смена освещения или новый ракурс.

Исходный размер 3149x1024

Набор первых неудачных изображений

С точки зрения технологии самым сложным было создать точные промпты, которые бы правильно направляли нейросеть. Я пять раз перезапускала генерацию серий по 60 изображений, пока не добилась такого результата, который бы меня полностью устроил. Это был кропотливый процесс подбора нужных слов и весовых коэффициентов, чтобы модель не уходила в абстракцию, а выдавала именно ту картинку, которую я задумала. Сперва изображения получались почти реалистичными, с этим пришлось долго бороться. Каждая новая попытка помогала мне лучше понять, как алгоритм интерпретирует исходные данные, и в итоге это позволило отсеять лишний визуальный мусор и получить по-настоящему чистые, профессиональные кадры.

Исходный размер 1957x526

В остальном процесс был стандартным и строился на базе Colab-блокнота для обучения SDXL DreamBooth LoRA. Я использовала эту среду, чтобы эффективно задействовать облачные мощности и адаптировать веса модели под свои задачи. Сама технология LoRA позволила мне внести нужные коррективы в нейросеть, не перегружая её лишними данными, что и дало ту самую гибкость в генерации. Вся техническая цепочка — от подготовки датасета до финального рендеринга — прошла через этот инструмент, что обеспечило стабильную работу и предсказуемый результат в плане качества.

Исходный размер 3151x1411

Блокнот с кодом https://disk.yandex.ru/d/FSeWsluMAlHopw

Описание применения генеративной модели

SDXL (Stable Diffusion XL) — основная база для создания портретов. Я использовала её архитектуру для получения высокой детализации и естественных текстур.
DreamBooth LoRA — метод дообучения. С его помощью я закрепила внешность персонажа в модели, создав стабильного цифрового двойника.
DeepSeek — интеллектуальный ассистент. Я применяла его для тонкой настройки промптов и подбора отрицательных подсказок, что помогло добиться чистоты кадра.
Google Colab — облачная среда. В ней я запускала процесс обучения и генерации серий по 60 изображений на мощностях GPU.

Каджарское искусство. Обучение нейросети

Описание применения генеративной модели