Идея проекта
В своём проекте мне захотелось изучить больше стиль стрит-арт художника Миши Most и посмотреть, сможет ли нейросеть вычленить основные особенности в его коллекции работ «future of the past» и сгенерировать похожие изображения.
В этой серии работ Миша Most размышляет над цивилизацией, которой свойствены и эволюция, и деградация.
«Яркие визуальные образы дополнены теориями и гипотезами ученых 60-х — 70-х годов XX века о ближайшем будущем, в том числе, и уже нашем настоящем, касательно как изменений в общественном строе, так и психо-физиологических особенностей хомо-сапиенса» [Миша Most, 2017].
«Мы приближаемся ко времени, когда искусственный интеллект всё чаще будет замещать реальный. Возможно, совсем скоро даже в музеях будут показывать произведения, созданные уже не человеком, а роботом.» [Misha Most, 2017]
Именно эта коллекция Миши Most и стейтменты к ней заинтересовали меня.
Захотелось создать парадокс — чтобы объект исследования художника, стал субъектом, который создаёт изображения на тему самого себя.
Идея сгенерировать нейросетью изображения в стиле Миши Most про будущее и искусственный интеллект в результате должна стать постироничным высказыванием.
Исходные изображения из коллекции Миши Most
Миша Most, колекция «future of the past»
Результат обучения нейросети
В результате обучение модели под стиль Миши Most прошло удачно. И сгенерированная серия изображений имеет достаточное количество сходств с коллекцией художника. Однако есть и отличие в изображениях. Обо всём по порядку.
+ линии как основа изображения
Основной отличительной характеристикой техники рисования Миши Most в коллекции «future of the past» — это жирные разноцветные линии.
Контуры всех предметов четкие и прорисованные.
Эту особенность нейросеть выполнила отлично. Все объекты на сгенерированных изображениях имеют толстую линию как основу.
Работа Миши Most // Работа нейросети
+ загруженность фона
На многих работах Миши Most — обилие объектов. Они наслаиваются друг на друга, не оставляя свободного пространства.
Нейросеть также удачно считала эту особенность стиля Миши Most, поэтому на всех сгенерированных изображениях фон обильно загружен.
Работа Миши Most // Работа нейросети
+ анатомичный образ человека
Образ человека будущего в работах Миши Most выглядит как набросок с только соблюденными правилами анатомии. Художник не прорисовывает человека детальнее, иногда даже не обозначает глаза, он оставляет только структуру человеческого тела. Такое представление человека стало — одной из основных особенностей коллекции.
Нейросеть абсолютно так же рисует человека, что делает сгенерированные изображения очень похожими на оригинальные работы автора.
Работа Миши Most // Работа нейросети
+ геометрические формы
Обилие геометрических форм, у которых прорисован только контур, тоже отличительная особенность в работах Миши Most.
Обученная нейросеть достаточно точно повторяет формы и фигуры из исходных изображений.
Работа Миши Most // Работа нейросети
+ образ планеты
Связь с космосом ещё одна важная деталь в коллекции «future of the past». Миша Most часто изображает планеты, как бы подчеркивая мотив будущности в своих работах.
Нейросеть идентично отображает планеты, так же, как и Миша Most, оставляя акцент на контуре предмета.
Работа Миши Most // Работа нейросети
- соответствие цветов
Единственным основным отличием исходных изображений художника от сгенерированных нейросетью является цветовая гамма.
В работах Миши Most цвета очень насыщены, яркость доходит до максимума.
А в изображениях, сгенерированных нейросетью, хоть и есть разноцветные цвета, но они достаточно тусклые и не такие контрастные как в исходнике.
Работа Миши Most // Работа нейросети
Ноутбук с кодом для обучения
Описание процесса обучения
- Создала аккаунт в Kaggle
- Перенесла туда исходный код проекта
- Запустила среду GPU P100
- Отобрала 48 изображений, откадрировала, чтобы размер у всех был 800×800 пикселей.
- Загрузила изображения в Kaggle, создав датасет «most»
- Запустила генерацию создания кэпшенов с помощью BLIP
- Создала файл с подписями для изображений и прописала кэпш-префикс «photo collage in MISHAMOST style»
- Удалила модель кэпшенинга BLIP, чтобы осовбодить память
- Сконфигурировала скрипт accelerate
- Зашла в аккаунт на Hugging Face, создала токен MISHA MOST
- Установила библиотеку датасетов.
- Начала процесс обучения, запустив команду accelerate
- Сохранила получившуюся модель в Hugging Face Hub
- Загрузила исходную модель stable duffusion xl, присоединила к этой модель веса lora, указав id моей модели с Hugging Face — polinnomore/mishamost_style_LoRA
- Сгенерировала 20 промтов для изображений через ChatGPT, делая акцент в запросах на изображения с человеком, с геометрическими фигурами, и с абстрактными ощущениями.
- Вставила промты в код и сгенерировала с помощью своей обученной модели 20 изображений в стиле Миши Most.
Описание применения генеративной модели
В проекте была использована модель stable-diffusion-xl-base-1.0
Результат
Генеративная нейросеть действительно смогла обучиться под стиль Миши Most и создавать достаточно похожие изображения на работы художника.
Изображения, сгенерированные нейросетью




