Идея проекта
Цель проекта — проверить, способна ли нейросеть создавать не отдельные изолированные объекты, а текстуры, паттерны, выполненные в стиле ручной ритмичной графики.
Нейросеть обучается на моих иллюстрациях, сделанных тушью и пером, которые передают фактуру и текстуру грибов.
В результирующей серии генерируются цветы, чтобы продемонстрировать способность не просто копировать конкретные объекты из обучающей базы данных, а воспроизводить графический язык.
Особенности стиля:
• Черно-белая палитра • Линейная графика • Штриховка • Плотность заполнения листа • Природные мотивы
Результирующая серия изображений
Развёрнутый комментарий
Модель успешно передала ключевые приёмы: линии ритмичны и вариативны, штриховка следует за формой объектов, создавая объём, тональность сохраняется через плотность штриха без использования полутонов.
При этом алгоритм не копирует объекты из обучающей выборки — вместо грибов он сгенерировал принципиально новые объекты — цветы, применив нужный графический язык к другому предметному ряду.
Все работы серии сохраняют стилистическую целостность и узнаваемость техники. Нейросеть показала способность работать с текстурной сложностью, создавая композиции с разными типами фактур.
В целом проект демонстрирует, что нейросеть может быть инструментом не просто для генерации изображений, а для сохранения и трансляции авторских художественных техник.
Были использованы дополнительные методы улучшения изображений:
• Двухэтапное увеличение разрешения (Сначала генерация в меньшем размере, затем апскейлинг до финального размера. Алгоритм LANCZOS — качественная ресемплинг-фильтрация)
• Unsharp Mask: «ImageFilter.UnsharpMask (radius=0.8, percent=100, threshold=0)»
• Negative prompt: «color, photo, realistic, 3d render, blurry, low quality, smooth, gradient, abstract, cartoon»
• Параметры генерации: 35 inference steps — баланс между качеством и скоростью Guidance scale 7.5 — сильное следование промпту (выше стандартного 7.0) Sequential CPU offload — экономия VRAM за счет поочередной загрузки компонентов модели
Процесс обучения
Для обучения нейросети использовались 10 иллюстраций размером 1024×1024px. Обучение нейросети заняло примерно 60 мин.
Параметры обучения:
Базовая модель: Stable Diffusion XL 1.0 LoRA (Low-Rank Adaptation) — легковесная надстройка, обучающая только 23.4MB параметров (вместо полных 6.6GB) 500 шагов обучения с сохранением чекпоинта на 250 шаге Разрешение: 512×512 пикселей Batch size: 2 изображения за шаг Gradient accumulation: 3 шага (эффективный batch size = 6) 8-bit Adam optimizer — экономия памяти Mixed precision fp16 — ускорение вычислений
Изначально понимание стиля нейросетью было протестировано на грибах:
Использование ИИ:
Stable Diffusion XL — генерация изображений и обучение генеративной модели
DeepSeek — для написании более качественного промта, ускорения его написания и устранения ошибок в коде




