Исходный размер 1140x1600

Керамические котики: обучение Stable Diffusion под уникальный стиль

Проект принимает участие в конкурсе

Проект посвящен обучению генеративной нейросети Stable Diffusion созданию изображений в уникальном стиле — керамические фигурки котиков. Идея заключается в том, чтобы научить модель не просто генерировать котиков, а делать это в специфической эстетике ручной работы, с текстурой глины и глазури.

Почему это интересно: - Уникальность — керамические котики имеют характерную текстуру и стиль - Узнаваемость — объект легко идентифицируется даже в разных контекстах - Креативные возможности — можно помещать фигурки в любые сцены

Для обучения было собрано 20 изображений керамических котиков в разных ракурсах:

Количество: 20 изображений Разрешение: 512×512 пикселей Формат: PNG (квадратные) Содержание: Керамические фигурки котиков Источники: Сгенерированные + реальные фото

Использованные методы:

  1. LoRA (Low-Rank Adaptation) — эффективное дообучение
  2. Stable Diffusion 1.5
0

Несколько примеров исходников

Исходный размер 1500x1500

результирующая серия изображений

Проект полностью реализовал поставленную задачу: нейросеть научилась понимать и воспроизводить эстетику керамических фигурок.

Анализ характеристик изображений:

  1. Сохранена характерная «кошачья» пластика
  2. Ушки, лапки, хвост пропорциональны
  3. Позы естественны для керамических фигурок

Процесс обучения: Python — Основной язык PyTorch — Фреймворк глубокого обучения Diffusers — Работа с диффузионными моделями PEFT — LoRA обучение Transformers — Текстовые энкодеры Accelerate — Оптимизация обучения

Использование ГенИИ в проекте

ChatGPT-4 — создание 30+ вариаций промптов для тестирования, помог в структурировании текста. Midjourney v6 — создание примеров для выбора стилистики. Claude 3 — оптимизация процесса обучения.

Керамические котики: обучение Stable Diffusion под уникальный стиль
Проект создан 18.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше