Исходный размер 2773x3923

Моменты тишины

Проект принимает участие в конкурсе

Серия иллюстраций, которая фиксирует не события, а состояния — моменты наблюдения, тишины и внутреннего напряжения. Приглушённая палитра и условное пространство создают ощущение памяти, сна или старой визуальной хроники.

За основу для обучения нейросети были взяты картины Анри де Тулуз-Лотрек с его уникальным стилем.

В итоговой серии ожидалось увидеть такую же легкость и непринужденность, которая есть в оригинальных картинах. Сочетание цветов, мазков и стилистики дали бы необходимые для концепции ощущение тишины и сна.

1. Этапы процесса обучения

Датасет (картинки) ↓ Авто-разметка через BLIP (caption_images) ↓ Добавление специального токена к каждому описанию ↓ Обучение LoRA-адаптера поверх SDXL ↓ Сохранение весов адаптера (~несколько МБ)

2. Разбор параметров тренировки

| Параметр | Значение | Смысл | |---|---|---| | mixed_precision=fp16 | float16 | Половинная точность → меньше VRAM | | use_8bit_adam | — | Оптимизатор с квантизацией → экономия памяти | | learning_rate=1e-4 | 0.0001 | Шаг обновления весов | | max_train_steps=750 | — | Количество итераций обучения | | train_batch_size=4 | — | Количество примеров за один шаг | | gradient_accumulation_steps=1 | — | Накопление градиентов перед обновлением | | snr_gamma=5.0 | — | Балансировка шума на разных timestep’ах диффузии | | lr_scheduler=constant | — | Скорость обучения не меняется в процессе | | checkpointing_steps=250 | — | Сохранение чекпоинта каждые 250 шагов |

3. Роль BLIP в пайплайне

BLIP — это мультимодальная модель, которая генерирует текстовые описания изображений (image captioning). Она нужна, чтобы автоматически разметить датасет:

картинка → BLIP → «a woman sitting at a table» + prefix → «painting in TOULOUSE-LAUTREC style, a woman sitting at a table»

Итоговое описание записывается в metadata.jsonl — стандартный формат для датасетов HuggingFace.

4. Итог

После обучения получается LoRA-адаптер — небольшой файл с весами, который можно подключить к SDXL и генерировать изображения в стиле Тулуз-Лотрека, просто упомянув токен в промпте.

В итоге получились изображения, соответствующие требованиям концепции и с хорошо узнаваемым стилем оригинального художника.

Моменты тишины
Проект создан 23.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше