Проект посвящен обучению генеративной нейросети Stable Diffusion созданию изображений в уникальном стиле — керамические фигурки котиков. Идея заключается в том, чтобы научить модель не просто генерировать котиков, а делать это в специфической эстетике ручной работы, с текстурой глины и глазури.
Почему это интересно: - Уникальность — керамические котики имеют характерную текстуру и стиль - Узнаваемость — объект легко идентифицируется даже в разных контекстах - Креативные возможности — можно помещать фигурки в любые сцены
Для обучения было собрано 20 изображений керамических котиков в разных ракурсах:
Количество: 20 изображений Разрешение: 512×512 пикселей Формат: PNG (квадратные) Содержание: Керамические фигурки котиков Источники: Сгенерированные + реальные фото
Использованные методы:
- LoRA (Low-Rank Adaptation) — эффективное дообучение
- Stable Diffusion 1.5
Несколько примеров исходников
результирующая серия изображений
Проект полностью реализовал поставленную задачу: нейросеть научилась понимать и воспроизводить эстетику керамических фигурок.
Анализ характеристик изображений:
- Сохранена характерная «кошачья» пластика
- Ушки, лапки, хвост пропорциональны
- Позы естественны для керамических фигурок
Процесс обучения: Python — Основной язык PyTorch — Фреймворк глубокого обучения Diffusers — Работа с диффузионными моделями PEFT — LoRA обучение Transformers — Текстовые энкодеры Accelerate — Оптимизация обучения
Использование ГенИИ в проекте
ChatGPT-4 — создание 30+ вариаций промптов для тестирования, помог в структурировании текста. Midjourney v6 — создание примеров для выбора стилистики. Claude 3 — оптимизация процесса обучения.







