Исходный размер 1140x1600

A Photo of Donut: дообучение SDXL на пончиках

Проект принимает участие в конкурсе

Пончики — штука простая и понятная. У них есть форма, есть глазурь, есть посыпка.

Задача проекта — собрать датасет из реальных фотографий пончиков и дообучить модель, чтобы она научилась передавать ту самую «живую» текстуру: неровности глазури, хаотичную посыпку, пузырьки на тесте. Чтобы пончик выглядел не как 3D-модель, а как настоящий, из ближайшей кондитерской.

Исходный размер 1280x242

Для обучения использовались около 30 стоковых фотографий пончиков.

Исходный размер 1656x802

Каждому изображению подписали промпт. Все промпты начинаются с одной и той же фразы: «a photo of donut»

Исходный размер 2048x1186

Якорь нужен, чтобы модель понимала: всё, что идёт после — это вариации одного и того же объекта. Так она учится различать типы пончиков, но не теряет понимание, что это всё ещё пончик.

ОБУЧЕНИЕ

Исходный размер 1792x1398

Параметры обучения

Для дообучения использовали LoRA — метод, который добавляет к большой модели небольшой набор дополнительных весов.

После того, как мы час ждали дообучения ИИ чуть более часа, далее всё намного проще.

Загружаем обученный адаптер и пишем промпт:

Исходный размер 2048x716

Якорь обязателен, без него модель не использует дообученные веса. Если хочется чего-то конкретного, промпт можно расширять.

Исходный размер 1024x1024

«a photo of donut, donut as a wedding cake, tiered donut tower, decorated with sprinkles»

Исходный размер 1024x1024

«a photo of donut, macro shot of glazed donut, sugar crystals visible, shiny glaze, detailed texture»

Исходный размер 1024x1024

«a photo of donut, donut with gold leaf and edible flowers, luxury dessert, elegant presentation»

Исходный размер 1024x1024

«a photo of donut, donuts stacked on a plate, cup of coffee next to it, cozy cafe atmosphere»

Исходный размер 1024x1024

«a photo of donut, glazed donut with sprinkles, colorful, bakery display, soft lighting»

Исходный размер 1024x1024

«a photo of donut, chocolate frosted donut with rainbow sprinkles, on a marble countertop»

ИТОГИ

Можно расширить датасет: добавить больше типов пончиков, больше ракурсов, больше разного освещения. Можно попробовать увеличить количество шагов обучения, чтобы модель усвоила ещё больше деталей. Можно поэкспериментировать с комбинацией LoRA и ControlNet, чтобы управлять формой и композицией.

Но уже сейчас результат есть: модель, которая понимает, что такое пончик, и умеет его рисовать.

ССЫЛКИ

A Photo of Donut: дообучение SDXL на пончиках
Проект создан 24.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше