RETROFUTUR на BRND

Концепция

Ещё с давних времён я был увлечён стилем ретрофутуризм. И много моих работ черпали вдохновение именно из него, поэтому я решил себе не изменять и обучить модель создавать изображения именно в этом стиле.

Исходный размер 1198x685

Генерация дома в стиле ретрофутуризм

Ретрофутуризм основан на эстетике XX века, когда будущее ассоциировалось с научным прогрессом, космическими открытиями и развитием технологий. Использование этого стиля позволяет создать интересный контраст между ностальгическими ретро-элементами и футуристическими идеями.

Для обучения было использовано более 150 сгенерированных изображений

Основная идея проекта заключалась в том, чтобы обучить нейросеть распознавать и воспроизводить характерные признаки этого визуального языка: пластичные футуристические силуэты, шлемы и визоры, металлические ткани, чистые минималистичные фоны, атмосферу глянцевой журнальной съёмки и общее ощущение оптимистического «мира будущего».

Для обучения модели был собран датасет изображений, объединённых общей визуальной концепцией ретрофутуризма. В него вошли референсы с характерными признаками выбранного стиля:

— футуристические женские и мужские портреты; — образы в духе fashion/editorial съёмки — серебристые, хромированные и пластиковые материалы — шлемы, визоры, аксессуары и костюмы, отсылающие к ретропредставлениям о будущем; — интерьеры и объекты с округлыми, обтекаемыми формами — сцены с мягким освещением и ограниченной палитрой

Описание процесса обучения

Для реализации проекта использовался ноутбук в среде Kaggle. На его основе была обучена LoRA-модель для генерации изображений в стилистике RETROFUTURBOGDAN. В качестве базовой модели использовалась SDXL, а обучение проводилось на подготовленном локальном датасете с текстовыми подписями к изображениям.

Исходный размер 1280x733

image in RETROFUTURBOGDAN style, futuristic car, chrome body, clean shot

В процессе обучения отдельно подбирались параметры, влияющие на качество и чистоту генерации: сила LoRA, количество шагов, guidance scale, длина промта, а также характер негативного промта. Практическое тестирование показало, что модель лучше всего работает в относительно простых, композиционно ясных сценах: портретах, fashion-образах и кадрах с одним доминирующим объектом. Более сложные сцены, такие как многолюдные городские виды или перегруженные интерьеры, вызывали больше артефактов и визуального «шума». Этот результат сам по себе стал частью исследования: он позволил выявить сильные и слабые стороны обученной модели.

Итоговая серия изображений

Лучше всего модель проявила себя в тех изображениях, где в центре композиции находился один герой или один главный объект. В таких сценах удалось добиться наиболее выразительного результата: чистой формы, узнаваемой эстетики, мягкой цветовой среды и визуальной целостности.

Image in RETROFUTURBOGDAN style, woman with chrome body in helmet RETROFUTURBOGDAN style woman

Image in RETROFUTURBOGDAN style, round chrome TV with antenna Image in RETROFUTURBOGDAN style, a retractable telephone handset of a round, elongated shape

Как только появляется большое количество деталей, так сразу качество сгенерированной картинки начинает портиться.

Image in RETROFUTURBOGDAN style, an apartment in white and orange tones with neon and futuristic furniture Image in RETROFUTURBOGDAN style, a man in orange spacesuit in space

Image in RETROFUTURBOGDAN style, an American diner with large sign that floats in outer space Image in RETROFUTURBOGDAN style, retro futuristic skyscraper with rounded shapes

С точки зрения концепции проекта итоговая серия соответствует первоначальной задаче: нейросеть научилась не просто копировать отдельные элементы референсов, а воспроизводить общий образ ретрофутуристического мира. В лучших работах отчётливо считывается визуальная идея утопического будущего, характерная для эстетики середины XX века: чистота форм, оптимизм, вера в технологичность, изящество предметного дизайна и особое внимание к внешнему облику человека. Важной особенностью стало то, что модель лучше всего работает там, где композиция строится вокруг одного главного героя или одного доминирующего объекта. Именно в таких сценах стиль раскрывается наиболее убедительно.

Код проекта