Описание идеи
Укиё-э — японское искусство гравюры на дереве XVII–XIX веков. Для него характерны плоские заливки цвета, чёткие контурные линии, декоративные паттерны и особый способ передачи пространства без линейной перспективы. Художники Хокусай, Хиросигэ и Утамаро создали визуальный язык, который до сих пор мгновенно узнаётся.
Идея проекта — обучить генеративную нейросеть Stable Diffusion XL воспроизводить этот стиль и применять его к современным сюжетам: городским пейзажам, портретам, природным сценам.
Интересно проверить, насколько нейросеть способна усвоить специфические черты укиё-э — не просто «японский стиль», а конкретные визуальные решения: способ изображения волн, гор, фигур людей — и перенести их на промпты, которых в оригинальных гравюрах не существовало.
Для обучения использован датасет из ~40 гравюр Хокусая, Хиросигэ, Утамаро и Куниёси из коллекции Metropolitan Museum of Art (public domain). Метод обучения — DreamBooth + LoRA, тренировочный токен UKIYOE.
Исходные изображения для обучения (несколько примеров)
Исходные изображения для обучения (несколько примеров)
Исходные изображения для обучения (несколько примеров)
Результирующая серия изображений
Результат демонстрирует, что нейросеть успешно усвоила ключевые визуальные характеристики укиё-э и уверенно переносит их на новые сюжеты
Наиболее очевидная черта, которую модель воспроизвела во всех изображениях — характерная цветовая палитра: приглушённые охристые, красно-коричневые тона фона в сочетании с насыщенными акцентами (красное небо, синие волны). Это прямая отсылка к технике многоцветной гравюры нисики-э, которую активно использовали Хиросигэ и Хокусай.
Пейзаж с Фудзи воспроизводит типичную для Хиросигэ композицию: гора на дальнем плане, деревья и вода на переднем, красное закатное небо. Характерна плоскостность изображения — нет западной линейной перспективы, пространство строится через наложение планов.
Портрет гейши точно передаёт стилистику бидзин-га — жанра красавиц Утамаро: вытянутое лицо, изящные черты, характерная причёска с гребнями. Это один из самых технически убедительных результатов серии.
Волны воспроизводят иконографию «Большой волны» Хокусая — динамичная форма воды с пенными завитками стала устойчивым паттерном, который модель явно хорошо запомнила.
Журавли в горах и рыбак в шторм демонстрируют, что модель усвоила не только колорит, но и принцип построения многоплановых композиций — туман, горные силуэты, динамика воды передаются в узнаваемой манере Хиросигэ.
Городской пейзаж Токио — интересный пример переноса стиля на современный сюжет, которого в датасете не было. Модель адаптировала плоскостную перспективу укиё-э к городской застройке, добавив характерный красный небосвод с солнечными дисками.
В целом серия убедительно работает как единое стилистическое высказывание. Все изображения читаются как укиё-э с первого взгляда — при этом ни один сюжет не является прямым заимствованием из датасета




