Исходный размер 1140x1600

Обучение генеративной нейросети стилю Косон Охара

Проект принимает участие в конкурсе
big
Исходный размер 1024x1024

Идея проекта

Иллюстрации Ohara Koson привлекли моё внимание своей мягкостью, тонкой проработкой деталей и особой атмосферой спокойствия и созерцания. Акварельная выразительность, приглушённые цвета и изящные композиции создают ощущение лёгкости и гармонии. Кроме того, данный стиль представляет интерес с точки зрения машинного обучения: он достаточно узнаваемый, но при этом содержит множество нюансов — текстуры, цветовые переходы, композиционные решения.

Исходные изображения для обучения

Источники и права использования: Все картины Косона Охары были взяты с сайта «Rijksmuseum» с надлежащей лицензией.

big
Исходный размер 1920x608
Исходный размер 1920x608

Результирующая серия изображений

На основе промптов получена серия из 11 изображений, состоящая из акварельных иллюстраций цветов, природы, животных.

Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024
Исходный размер 1024x1024

Развернутый комментарий результатов

Проект демонстрирует успешную интерпретацию художественного стиля Ohara Koson с помощью генеративной нейросети. Модель смогла передать основные визуальные особенности его работ и использовать их при создании новых изображений. Переданные элементы стиля: — Цветовая гармония — мягкие, приглушённые природные оттенки — Текстурность — частично передана акварельная лёгкость и плавные переходы цвета — Композиция — минимализм и акцент на отдельных объектах — Природные мотивы — птицы, растения и природные элементы — Атмосфера — спокойное, созерцательное настроение

Визуальный анализ изображений: Изображение 1 («goldfish in aquarium»): — Стеклянная сфера добавляет новый визуальный элемент — преломление — Искажение форм через воду создает сюрреалистический эффект — Домашний контекст расширяет тематический диапазон от природного к бытовому Изображение 2 («chrysanthemums with cricket»): — Пастельная гамма подчеркивает позднеосеннюю тематику — Элегантная простота в традициях катё-э Изображение 3 («cat and goldfish»): — Бытовой сюжет вписан в высокую художественную традицию — Взаимодействие кота и рыбок создает нарративное напряжение — Мягкий утренний свет объединяет интерьерную и водную темы Изображение 4 («fox in pampas grass»): — Теплая осенняя гамма задает настроение — Мистический оттенок сюжета отсылает к фольклору — Травяные текстуры обогащают визуальный слой Изображение 5 («waterfall with maples»): — Вертикальное построение подчеркивает движение воды — Осенние акценты вносят температурный контраст — Туман создает глубину и воздушную перспективу Изображение 6 («koi carp in stream»): — Контраст оранжевого и черного создает композиционный ритм — Эффект ряби на воде добавлен через световые блики — Мелководная перспектива усиливает ощущение прозрачности Изображение 7 («owl on pine with moon»): — Глубокий индиго-синий доминирует в цветовом решении — Луна выступает смысловым и композиционным центром — Успешная передача ночной атмосферы через градиенты Изображение 8 («irises with dragonfly»): — Приглушенные сине-зеленые тона создают ощущение прохлады — Горизонтальная композиция усиливает эффект спокойствия — Стрекоза добавляет динамический акцент в статичную сцену Изображение 9 («egrets in snow»): — Минималистичная композиция с активным использованием негативного пространства — Белые птицы на бледно-сером фоне создают графическую чистоту — Поэтичность образа соответствует эстетике ваби-саби Изображение 10 («frogs in stream»): — Игривый сюжет контрастирует с серьезностью стиля — Зеленая палитра объединяет лесную и водную эстетику — Сохранение анатомической точности при кавай-элементах Изображение 11 («fish with cherry blossoms»): — Розовые лепестки на воде вводят сезонный контекст — Совмещение сакуры и рыб объединяет две ключевые темы японской эстетики — Бледно-голубые тона усиливают весеннее настроение

Техническая реализация

Процесс обучения Архитектура и параметры: — Базовая модель: Stable Diffusion XL 1.0 — Метод адаптации: Dreambooth с LoRA — Размер датасета: 18 изображения — Количество шагов: 100 — Разрешение: 512×512 пикселей

Обучение модели проводилось на подготовленном датасете изображений. Для повышения качества генерации были применены такие методы, как gradient checkpointing и 8-битная оптимизация, что позволило эффективнее использовать вычислительные ресурсы и улучшить результат.

Описание применения генеративной модели

Использованные модели ИИ: Stable Diffusion XL 1.0 — Ссылка: https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0 — Цель: Использовалась как основная модель для генерации изображений

BLIP (Bootstrapping Language-Image Pre-training) — Ссылка: https://huggingface.co/Salesforce/blip-image-captioning-base — Цель: Применялась для автоматического создания описаний изображений

Dreambooth + LoRA методик — Цель: Использовались для адаптации модели под выбранный художественный стиль

СhatGPT — Ссылка: https://clck.ru/3SiMp9 — Цель: составление промптов и описаний орнаментов

Обучение генеративной нейросети стилю Косон Охара
Проект создан 23.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше