Обучение генеративной нейросети под свой стиль на BRND

Идея проекта

Цель проекта — проверить, способна ли нейросеть создавать не отдельные изолированные объекты, а текстуры, паттерны, выполненные в стиле ручной ритмичной графики.

Нейросеть обучается на моих иллюстрациях, сделанных тушью и пером, которые передают фактуру и текстуру грибов.

В результирующей серии генерируются цветы, чтобы продемонстрировать способность не просто копировать конкретные объекты из обучающей базы данных, а воспроизводить графический язык.

Особенности стиля:

• Черно-белая палитра • Линейная графика • Штриховка • Плотность заполнения листа • Природные мотивы

Результирующая серия изображений

Исходный размер 1600x1152

Развёрнутый комментарий

Модель успешно передала ключевые приёмы: линии ритмичны и вариативны, штриховка следует за формой объектов, создавая объём, тональность сохраняется через плотность штриха без использования полутонов.

При этом алгоритм не копирует объекты из обучающей выборки — вместо грибов он сгенерировал принципиально новые объекты — цветы, применив нужный графический язык к другому предметному ряду.

Все работы серии сохраняют стилистическую целостность и узнаваемость техники. Нейросеть показала способность работать с текстурной сложностью, создавая композиции с разными типами фактур.

В целом проект демонстрирует, что нейросеть может быть инструментом не просто для генерации изображений, а для сохранения и трансляции авторских художественных техник.

Исходный размер 1600x1152

Были использованы дополнительные методы улучшения изображений:

• Двухэтапное увеличение разрешения (Сначала генерация в меньшем размере, затем апскейлинг до финального размера. Алгоритм LANCZOS — качественная ресемплинг-фильтрация)

• Unsharp Mask: «ImageFilter.UnsharpMask (radius=0.8, percent=100, threshold=0)»

• Negative prompt: «color, photo, realistic, 3d render, blurry, low quality, smooth, gradient, abstract, cartoon»

• Параметры генерации: 35 inference steps — баланс между качеством и скоростью Guidance scale 7.5 — сильное следование промпту (выше стандартного 7.0) Sequential CPU offload — экономия VRAM за счет поочередной загрузки компонентов модели

Процесс обучения

Для обучения нейросети использовались 10 иллюстраций размером 1024×1024px. Обучение нейросети заняло примерно 60 мин.

Параметры обучения:

Базовая модель: Stable Diffusion XL 1.0 LoRA (Low-Rank Adaptation) — легковесная надстройка, обучающая только 23.4MB параметров (вместо полных 6.6GB) 500 шагов обучения с сохранением чекпоинта на 250 шаге Разрешение: 512×512 пикселей Batch size: 2 изображения за шаг Gradient accumulation: 3 шага (эффективный batch size = 6) 8-bit Adam optimizer — экономия памяти Mixed precision fp16 — ускорение вычислений

Изначально понимание стиля нейросетью было протестировано на грибах:

Ссылка на код

Использование ИИ:

Stable Diffusion XL — генерация изображений и обучение генеративной модели

DeepSeek — для написании более качественного промта, ускорения его написания и устранения ошибок в коде