Каджарское искусство представляет собой уникальный художественный стиль, расцветший в Персии в период правления династии Каджаров с конца XVIII до начала XX века. Это направление стало удивительным мостом между традиционной восточной миниатюрой и европейской масляной живописью, породив парадные портреты с узнаваемой «кукольной» эстетикой. Для этого стиля характерны строгая фронтальная композиция, плоскостная трактовка пространства и гиперболизированные каноны красоты: густые сросшиеся брови, огромные миндалевидные глаза и обилие детализированных орнаментов на тяжелых тканях, расшитых жемчугом.
Исходные изображения
Я выбрала эту тему, потому что каджарская живопись обладает мощным визуальным кодом, который кажется мне идеальным материалом для экспериментов с машинным обучением. Меня завораживает то, как в этих работах сочетаются декоративность и почти сакральная статичность поз, создающие эффект вневременья. Работа с этим стилем позволяет мне исследовать границы между историческим наследием и цифровой деформацией, проверяя, способна ли нейросеть уловить тонкую грань между гротеском и канонической красотой, которая так важна для персидского искусства той эпохи.
Исходное изображение
Готовая серия
В рамках проекта я хочу получить серию цифровых полотен, которые будут выглядеть как «утерянные» или вновь обретенные портреты каджарской эпохи, но с едва заметными следами алгоритмического вмешательства. Моя цель — добиться высокой консистентности стиля, сохранив специфическую пластику лиц и фактуру материалов.
Промпт «Veiled beauty revealing one kohl eye, heavy gold necklace, emerald drop earrings, rosewater scent, ornate turban»
Промпт «Princess holding mirror, turquoise headdress, ruby-encrusted bracelets, monobrow, large expressive eyes»
Промпт «Persian lady with opium pipe, silk robe with pearl buttons, hennaed fingers, vibrant jewel tones, oil painting texture»
Я очень довольна тем, какой получилась итоговая серия: изображения вышли четкими, в отличном разрешении и без того самого «цифрового шума», который часто портит нейросетевые работы. Лицо и детали выглядят естественно, а текстуры прорисованы чисто. Я вижу, что модель не просто заучила исходники, а уловила саму суть персонажа, поэтому картинки смотрятся как качественные фотографии, а не как случайная склейка кадров.
Для меня было важно закрепить узнаваемость, и это удалось на сто процентов. Персонажи сохраняют узнаваемые черты в любых ситуациях, будь то смена освещения или новый ракурс.
Набор первых неудачных изображений
С точки зрения технологии самым сложным было создать точные промпты, которые бы правильно направляли нейросеть. Я пять раз перезапускала генерацию серий по 60 изображений, пока не добилась такого результата, который бы меня полностью устроил. Это был кропотливый процесс подбора нужных слов и весовых коэффициентов, чтобы модель не уходила в абстракцию, а выдавала именно ту картинку, которую я задумала. Сперва изображения получались почти реалистичными, с этим пришлось долго бороться. Каждая новая попытка помогала мне лучше понять, как алгоритм интерпретирует исходные данные, и в итоге это позволило отсеять лишний визуальный мусор и получить по-настоящему чистые, профессиональные кадры.
В остальном процесс был стандартным и строился на базе Colab-блокнота для обучения SDXL DreamBooth LoRA. Я использовала эту среду, чтобы эффективно задействовать облачные мощности и адаптировать веса модели под свои задачи. Сама технология LoRA позволила мне внести нужные коррективы в нейросеть, не перегружая её лишними данными, что и дало ту самую гибкость в генерации. Вся техническая цепочка — от подготовки датасета до финального рендеринга — прошла через этот инструмент, что обеспечило стабильную работу и предсказуемый результат в плане качества.
Блокнот с кодом https://disk.yandex.ru/d/FSeWsluMAlHopw
Описание применения генеративной модели
- SDXL (Stable Diffusion XL) — основная база для создания портретов. Я использовала её архитектуру для получения высокой детализации и естественных текстур.
- DreamBooth LoRA — метод дообучения. С его помощью я закрепила внешность персонажа в модели, создав стабильного цифрового двойника.
- DeepSeek — интеллектуальный ассистент. Я применяла его для тонкой настройки промптов и подбора отрицательных подсказок, что помогло добиться чистоты кадра.
- Google Colab — облачная среда. В ней я запускала процесс обучения и генерации серий по 60 изображений на мощностях GPU.




