Обучение генеративной нейросети на картинах Анри Руссо на BRND

Концепция

Проект посвящен обучению нейросети, которая способна улавливать и воспроизводить уникальные художественные стили признанных мастеров живописи.

Нейросеть обучается на большой коллекции картин известных художников, изучая их композицию, цветовую гамму, технику нанесения мазков, особенности освещения и другие важные элементы, которые формируют неповторимый художественный почерк. В основе проекта лежат работы Анри Руссо.

Ниже представлены несколько картин Анри Руссо, которые стали частью базы данных для обучения искусственного интеллекта.

Серия изображений

Картины Анри Руссо выделяются своим особым стилем, который сформировался благодаря его наивному подходу к искусству. Вот ключевые черты его творчества:

— Наивный взгляд на мир. Руссо не получил академического образования, поэтому его работы излучают искренность, простоту и непосредственность, напоминая детские рисунки или народные картинки.

— Плоскостность и отсутствие перспективы. Фигуры и объекты на его полотнах часто находятся на одном плане, перспектива искажена или условна, что придаёт композициям декоративность и сказочность.

— Яркие, насыщенные цвета. Художник использовал чистые, контрастные оттенки, создавая ощущение праздника, мечты или фантазии.

— Фантастические и экзотические сюжеты. Несмотря на то, что Руссо никогда не покидал Францию, он изображал джунгли, диких животных и экзотические растения, вдохновляясь ботаническими садами и иллюстрациями из книг.

— Тщательно проработанные детали. Даже мельчайшие элементы на его полотнах выписаны с предельной точностью, подчёркивая декоративность и узорчатость композиций.

— Аллегоричность и символика. В ряде работ Руссо использовал необычные аллегории и символы, связанные с природой, фантазией или личными переживаниями.

Процесс обучения

Для реализации проекта была использована среда Kaggle, где проходила подготовка и обучение модели. Сначала был собран датасет изображений с работами Анри Руссо (52 шт. 1024×1024). Чтобы добавить к изображениям текстовое сопровождение, для каждой картины автоматически создавались описания с помощью модели BLIP.

Исходный размер 2211x863

К полученным подписям добавлялась единая формулировка, указывающая на художественный стиль — «painting in HENRI ROUSSEAU style». Это помогало модели связывать визуальные особенности изображений с конкретным стилевым маркером.

Исходный размер 2262x878

Далее на основе подготовленного датасета проводилось дообучение модели Stable Diffusion. Для этого использовались методы DreamBooth и LoRA, которые позволяют адаптировать базовую генеративную модель под определённый художественный язык. Обучение включало 500 тренировочных шагов.

Исходный размер 2271x1061

Применение генеративной модели

После завершения обучения модель была экспортирована и размещена на Hugging Face, чтобы её можно было использовать для дальнейшей генерации изображений. В процессе генерации параметры менялись: количество шагов варьировалось примерно от 25 до 80. Такой диапазон помог добиться более аккуратной прорисовки объектов и уменьшить искажения. Кроме того, использовался негативный промпт, который позволил снизить количество визуальных артефактов и сделать освещение на изображениях более сбалансированным.

Исходный размер 2121x1177

Блокнот и датасет

Модель на Hugging Face