Исходный размер 2380x3368

Эстетика кабаре и обнаженный картон Анри де Тулуз-Лотрека

Проект принимает участие в конкурсе

Современные диффузионные сети панически боятся пустоты и незавершенности. Алгоритм запрограммирован заполнять каждый пиксель, доводить рендер до конца и тщательно скрывать «изнанку» холста. Но что произойдет, если стиль художника строится на намеренной небрежности, обнаженной фактуре картона и скетчевой, шероховатой линии?

Данный исследовательский проект посвящен оцифровке стиля Анри де Тулуз-Лотрека — гениального французского постимпрессиониста, мастера литографии и главного летописца богемной жизни Парижа конца XIX века. Его искусство — это кабаре «Мулен Руж», танцовщицы канкан, проститутки, абсент и аристократы в цилиндрах. Лотрек революционизировал плакатное искусство, смешав плоские цветовые заливки (влияние японской гравюры) с невероятно динамичным, нервным и «грязным» рисунком пастелью и разбавленным маслом.

Обучение генеративной модели на его работах — это экстремальный стресс-тест на «незавершенность». Лотрек часто рисовал прямо на сером картоне, оставляя огромные куски фона абсолютно пустыми, позволяя цвету и фактуре самой бумаги работать на композицию. Заставить ИИ не закрашивать холст целиком, научить его бросать линию на полпути и сохранять ощущение быстрого, почти сырого наброска, не скатываясь при этом в низкое разрешение или системный баг — задача, требующая ювелирного файнтюнинга.

Ниже представлены некоторые работы Анри де Тулуз-Лотрека, вошедшие в базу данных для обучения искусственного интеллекта.

В цирке Фернандо: наездница на белой лошади, 1887–1888, Музей Нортона Саймона, Пасадина, США

Исходный размер 1598x1292

Туалет (Мадам Пупуль), 1900, частное собрание

Исходный размер 1896x1292

Анри де Тулуз-Лотрек, «Две подруги», 1894–1895, частное собрание

Техническая реализация (Google Colab и LoRA)

В рамках проекта обучение проводилось в облачной среде Google Colab с использованием метода LoRA (Low-Rank Adaptation). Этот подход позволяет дообучить тяжелую базовую модель (например, Stable Diffusion), обновляя лишь небольшую часть алгоритмов, что делает процесс быстрым и эффективным.

0

фрагменты кода

Генерация и обучение нейросетей требуют мощных видеокарт (GPU). На этом шаге мы инициализируем сервер и проверяем, какой именно вычислительный ресурс выдал нам облачный сервис Google для работы.

Исходный размер 2604x1202

Мы подключаем облачный диск, на котором лежат бережно отобранные нами картины художника (датасет), и скачиваем необходимые библиотеки машинного обучения (такие как diffusers и accelerate).

Исходный размер 2078x268

Это кульминация технического процесса. Здесь мы передаем нейросети команду: «Возьми базовую модель, проанализируй картины в нашей папке и найди в них общие стилевые черты». Процесс идет шаг за шагом (steps), пока нейросеть не выучит уникальный почерк художника, связав его со специальным кодовым словом (триггером).

Исходный размер 2592x914

фрагменты кода

Исходный размер 2584x1118

фрагменты кода

После завершения обучения мы тестируем результат. Пишем текстовый запрос (промпт), используем выученное кодовое слово, и нейросеть «рисует» совершенно новое изображение в только что освоенном стиле.

Исходный размер 2488x334

фрагменты кода

Ключевые характеристики работ Анри де Тулуз-Лотрека: -> Намеренная незавершенность: использование сырого картона или холста как активного фона, не закрашенного краской.

-> Скетчевая, быстрая линия: контуры нанесены резко, часто углем, пастелью или сильно разбавленной масляной краской. • Плакатная плоскостность: крупные локальные пятна яркого цвета (красный, желтый, черный) без сложных градиентов.

-> Необычные ракурсы и кадрирование: влияние фотографии и японской гравюры, фигуры часто «обрезаны» краем холста.

-> Тематика парижского дна и богемы: артисты кабаре, циркачи, посетители баров, переданные с гротескной, но сочувствующей выразительностью.

Примеры сгенерированных изображений и промпты

0

Некоторые примеры промптов

Танцовщица кабаре: «A dynamic sketch of a female cabaret dancer performing the can-can, high kicking legs, ruffled skirts, photo in Anri style, rough pastel strokes, unpainted cardboard background, post-impressionism.»

Аристократ в баре: «A wealthy gentleman in a black top hat and monocle sitting alone at a small round table with a glass of green absinthe, photo in Anri style, vintage Parisian bohemian atmosphere, sketchy outlines.»

Певица на сцене: «A female singer on a stage illuminated by harsh footlights from below, casting long dramatic shadows, wearing long black gloves, photo in Anri style, lithographic poster aesthetic, flat bold colors.»

Нейросети удалось приблизиться к уникальному стилю Анри де Тулуз-Лотрека и передать его. В изображениях можно уловить богемную атмосферу парижских кабаре, любовь к резким контрастам, специфические ракурсы и попытки имитировать графичный, плакатный стиль конца XIX века.

И все же нельзя не отметить, что сгенерированные нейросетью изображения далеки от идеала. Главная слабость ИИ — это неумение вовремя «остановиться». Алгоритм категорически отказывается оставлять фон в виде голого, нетронутого картона (как это обожал делать Лотрек), всегда пытаясь залить его серой или коричневой краской. Во-вторых, нервная, быстрая линия Лотрека часто превращается у нейросети в аккуратный, слишком «правильный» цифровой контур, лишенный живой вибрации пастели или угля. Искусственному интеллекту пока сложно осознать, что иногда небрежность и «грязь» в рисунке — это высшее проявление авторской экспрессии. Все эти вещи могут быть замечены даже непрофессиональным взглядом человека, не имеющего искусствоведческого образования.

Применение генеративной модели

Эстетика кабаре и обнаженный картон Анри де Тулуз-Лотрека
Проект создан 24.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше