Тотемы северного побережья на BRND

Тотемы северного побережья

Обучение Stable Diffusion на собственных иллюстрациях

Исходный размер 1684x1202

В рамках профильного проекта 1 модуля 3 курса я разрабатывала понедельный календарь на тему тотемов северного побережья.

Всего было отрисовано 52 листа, каждый из которых принадлежал 1 из 4 культур и отличался цветовой палитрой в зависимости от культуры (хаида — сине-оранжевая, салиш — желто-фиолетовые и т. д.)

Процесс их создания был очень долгим и мне пришла идея: а можно ли было это как-то оптимизировать? Поэтому я решила обучить SD на некоторых тотемах. Я выбрала 18 своих тотемов (из-за ограничения во времени обучения модели) и обучила на них модель

Исходный размер 1247x724

Каждая картинка для обучения — отдельный тотем на черном фоне шириной 1024×2014 в формате JPG.

В ходе обучения я создала автоматические подписи к каждой и уже на них обучала итоговую модель.

Для настройки генерации изображений я использовала негативные промпты на создание узоров из самих тотемов, чтобы предотвратить заливку всего фрейма изображениями.

Иногда это помогало, а иногда нет

yellow-blue statue of shaman in TOTEM style

pink-green statue of raven in TOTEM style

Характеристики модели

Модель: Stable Diffusion XL Метод: LoRA (DreamBooth-подход)

Основные параметры: — resolution: 512 — batch size: 2 — max steps: 500 — mixed precision: fp16

Ноутбук с кодом

Исходный размер 1024x1024

statue of caveman in TOTEM style

totem in TOTEM style — общий промпт, вариация

yellow-blue statue of bird in TOTEM style

pink-green statue of fish in TOTEM style

Исходный размер 1024x1024

statues of monkeys in TOTEM style

statue of wolf and raven in TOTEM style

statue of sheep in TOTEM style

purple-yellow totem of masked man in TOTEM style

orange-blue totem of bird in TOTEM style

Т.к. модель обучена на маленьком количестве изображений, вариация генераций очень большая: моя модель генерит как отдельно стоящие тотемы на заднем фоне, так и заливает картинку полностью паттерном из тотемов.

Если задавать конкретное животное, а не абстрактный тотем — вероятность, что она сгенерит всего лишь один тотем на черном фоне гораздо выше.

Что удалось реализовать полностью?

Пправильная палитра, обводка белым всего тотема, заливка фона черным, характер формы

генерация: statue of woman in TOTEM style / моя иллюстрация: птица, стоящая на медведе гризли, держащем человеческого ребенка

Что не удалось реализовать?

Повторяющиеся блоки, из которых собираются тотемы — нужна большая обучающая выборка

Вывод: для более точного попадания в стиль нужна более большая обучающая выборка.

В целом, даже сейчас она справляется неплохо