Исходный размер 1240x1750

PSHUR

Проект принимает участие в конкурсе

Идея

Обучение SDXL воспроизводить авторский фотографический стиль. Нейросеть учится на фотографиях одного автора и затем генерирует новые снимки «в его духе».

big
Исходный размер 1280x512

Финальная серия изображений

big
Исходный размер 1024x1536
0

Комментарий

Стиль: любительские фото в кафе, тёплые жёлтые тона, мягкий фокус, съёмка сверху/сбоку с близкого расстояния. Токен: MYPHOTO Датасет: 25 фото из food101

Ключевые решения:

lr_scheduler=cosine_with_restarts — периодически перезапускает lr, чтобы выйти из локальных минимумов checkpointing_steps=250 — два чекпоинта для анализа прогресса обучения Цветовой анализ датасета → показывает «ДНК» авторского стиля (R/G/B-профиль) Анализ результатов: Сравнение checkpoint-250 vs финальной модели показывает, что за 500 шагов модель усваивает:

Характерную цветовую гамму (warm/cold tones) Тип освещения и контраст Общее настроение и атмосферу снимков

Применение ИИ

Claude Sonnet 4.6 (Anthropic) — написание кода и структурирование ноутбука.

Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше