Исходный размер 1140x1600

Обучение генеративной нейросети Stable Diffusion под миниатюры Палеха

Проект принимает участие в конкурсе

Идея проекта

Проект посвящён переносу визуального языка палехской миниатюры в новые сюжеты, которые изначально не относятся к её историческому кругу образов. Палех традиционно связан со сказкой, былиной, религиозным и декоративным повествованием, с вытянутыми фигурами, тонкой линией, орнаментальностью и условным пространством. В этой работе меня интересовал не просто пересказ существующих палехских сцен, а проверка того, может ли нейросеть усвоить принципы этого стиля и применить их к новым темам.

Аллегорическое представление Третьего Интернационала. Палехская миниатюра, Иван Голиков, 1927

«Изба-читальня». Палех Баканов И.М., 1925

Палех Голиков, 1958 г

«Тройка» Голиков, 1925 г

Описание процесса обучения

Для обучения использовался собственный датасет, собранный из квадратных изображений палехской миниатюры хорошего качества. Изображения были предварительно приведены к формату 1:1 без жёсткого кропа: исходные работы не обрезались, а вписывались в квадрат с полями, чтобы сохранить композицию. От автоматических caption’ов BLIP для финального обучения я отказалась, потому что они давали слишком шумные и местами ошибочные описания; для тренировки использовался подготовленный вручную metadata.jsonl* с единым стилевым ядром и короткими смысловыми уточнениями.

big
Исходный размер 2877x1519

Фрагмент кода

Обучение проходило в Colab по схеме SDXL DreamBooth LoRA на базе stabilityai/stable-diffusion-xl-base-1.0* с разрешением 1024, что было важно именно для передачи тонкой линии и мелкой декоративной детализации.

Исходный размер 2879x1518

Фрагмент кода

На этапе генерации я использовала обученный checkpoint и регулировал силу LoRA, чтобы стиль проявлялся достаточно явно, но не разрушал изображение.

Исходный размер 2879x1525

Фрагмент кода

Промпты

prompt = «palekhstyle russian palekh lacquer miniature painting, russian fairy tale scene, ornate composition» # @param

Исходный размер 1024x1024

Результаты генераций

prompt = «palekhstyle russian palekh lacquer miniature painting, horsemen riding through a dark forest, fairy tale atmosphere»

Исходный размер 1024x1024

Результаты генераций

В итоговой серии хорошо считываются основные формальные признаки палехской миниатюры. Прежде всего это декоративная плоскостность изображения: пространство не строится по законам реалистической перспективы, а организуется как условная сцена, где фигуры, архитектура, растения, облака и огненные вспышки складываются в единый орнаментальный ритм. Во многих работах заметны вытянутые силуэты персонажей, текучие контуры, акцент на линии и на сложном взаимодействии тёплых красно-золотых и холодных сине-зелёных тонов. Даже там, где сюжет заведомо современный, изображение воспринимается не как иллюстрация в реалистической манере, а как декоративная миниатюра с насыщенной символической композицией.

Особенно важно, что модель не просто воспроизводит отдельные внешние признаки, а переносит сам принцип палехского повествования. В сказочных и романтических сценах это видно в камерности, в симметрии, в подчёркнутой изящности фигур и в превращении бытового сюжета в почти ритуальную композицию. В батальных изображениях стиль проявляется иначе: персонажи образуют динамические ленты, движение передаётся не через анатомическую точность, а через общий ритм линий, пятен и жестов. В результате даже сцены конфликта сохраняют декоративную цельность и не распадаются на случайные фрагменты.

prompt = «palekhstyle russian palekh lacquer miniature painting, romantic couple, flowers, decorative composition»

Исходный размер 1024x1024

Результаты генераций

prompt = «palekhstyle russian palekh lacquer miniature painting, battle scene, riders, dramatic sky»

Исходный размер 1024x1024

Результаты генераций

Наиболее интересной частью серии мне кажется перенос палехского языка на тему космоса. Ракеты, звёзды, планеты, дым и траектории полёта оказываются неожиданно совместимыми с эстетикой миниатюры. Космические сцены выглядят не как научно-фантастический реализм, а как новая разновидность сказочного повествования: ракета становится почти героем былины, а космос превращается в декоративную вселенную, близкую по логике к старым палехским композициям. Именно в этих работах лучше всего видно, что проект не сводится к стилизации под старину: модель пытается создать новый сюжетный мир, в котором народная орнаментальность соединяется с образом будущего.

prompt = «palekhstyle russian palekh lacquer miniature painting, rocket flying into space, stars, ornate composition» # @param

Результаты генераций

Исходный размер 1024x1024

Результаты генераций

prompt = «palekhstyle russian palekh lacquer miniature painting, rocket launching into outer space, stars, decorative fairytale composition, intricate details» # @param

Исходный размер 1024x1024

Результаты генераций

Результаты в целом соответствуют первоначальной идее проекта. Я не ставила задачу добиться точной реконструкции конкретных произведений Палеха. Напротив, задача состояла в том, чтобы обучить модель на палехской визуальной системе и затем проверить, насколько убедительно она сможет применить её к сюжетам вне обучающего набора. Итоговые изображения показывают, что стиль считывается достаточно уверенно: палехская графичность, декоративная организация кадра, сложный цветовой строй и сказочно-условная атмосфера сохраняются даже в тех сценах, которых в исходном наборе не было, например в космических композициях.

Использование GenAI

В проекте, помимо обученной мной нейросети Stable Diffusion XL с LoRA, использовались дополнительные инструменты генеративного ИИ.

  1. ChatGPT / Codex (OpenAl) Использовался как вспомогательный инструмент на этапах подбора и фильтрации датасета, проверки лицензионных ограничений, настройки параметров обучения, адаптации Colab-ноутбука под текущий проект и редактирования сопроводительных текстов для презентации проекта. Решения о финальном составе датасета, выборе результатов и содержании итоговой серии принимались мной.

  2. BLIP image captioning model Использовался в экспериментальном режиме для автоматического анализа и описания изображений датасета. После проверки качества автоподписей было принято решение не использовать их в финальном обучении, так как они содержали шум, повторы и неточные интерпретации сюжетов. Для итогового обучения применялся вручную подготовленный metadata.jsonl.

Таким образом, генеративный ИИ использовался в проекте как вспомогательный инструмент для организации процесса, проверки гипотез и подготовки описаний, но не заменял авторский отбор данных, принятие художественных решений и финальную оценку результата.

Заключение

В целом итоговая серия показывает, что палехская миниатюра может быть переосмыслена как живой визуальный язык, пригодный не только для воспроизведения знакомых фольклорных сюжетов, но идля создания новых образов. Нейросеть унаследовала от исходного материала не буквальные композиции, а систему выразительных средств: вытянутую фигуру, орнаментальный ритм, декоративную условность пространства, сложный цветовой строй и ощущение повествовательной театральности. Благодаря этому серия работает как эксперимент по соединению культурной памяти и современного генеративного инструмента: старый стиль не музейно копируется, а начинает говорить на новом материале.

Блокнот с кодом

Папка с изображениями

Обучение генеративной нейросети Stable Diffusion под миниатюры Палеха
Проект создан 24.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше