Исходный размер 1140x1600

Сад нейронных наслаждений

Проект принимает участие в конкурсе
Исходный размер 2308x501

// КОНЦЕПЦИЯ

Иероним Босх — художник, чьи работы известны по всему миру своими сюрреалистичными сюжетами, гибридными существами, невозможными конструкциями и бесконечной детализацией. Всё это сегодня невольно ассоциируется с ранними экспериментами генеративных сетей, когда алгоритмы только учились создавать изображения и выдавали странные и гротескные результаты.

Для своего проекта я решила научить нейросеть генерировать не целые картины Босха, а именно их фрагменты. Это решение было принято, поскольку картины Босха редко воспринимают целостно; чаще принято рассматривать отдельные сцены, фигуры и странные объекты. Зачастую достаточно увидеть одно гибридное существо или характерный пейзаж, чтобы сразу узнать руку мастера. Поэтому мне захотелось обучить нейросеть воспроизводить мир Босха так, как мы сами его рассматриваем: по кусочкам, фрагментам, отдельным элементам, которые в сумме и создают эффект той самой «Босховской» вселенной.

// ИСХОДНЫЕ ИЗОБРАЖЕНИЯ

Из всех произведений Босха я решила остановить свой выбор на двух его самых известных триптихах — «Сад земных наслаждений» и «Страшный суд». Поскольку моей целью было научить нейросеть генерировать именно фрагменты в стилистике Босха, а не работы целиком, то я нарезала триптихи на фрагменты размером 512×512.

Всего получилось 190 фрагментов, на которых затем обучалась модель.

Исходный размер 5000x2534

«Сад земных наслаждений» // Иероним Босх // 1505–1513 гг.

Исходный размер 2700x1052

Примеры фрагментов, на которых затем обучалась модель («Сад земных наслаждений»)

Исходный размер 4000x3357

«Страшный суд» // Иероним Босх // 1504 г.

Поскольку «Страшный суд» имеет вверху скругленную форму, я вручную удалила фрагменты, на которых был виден лишний фон, чтобы избежать ошибок при обучении нейросети.

Исходный размер 2700x1052

Примеры фрагментов, на которых затем обучалась модель («Страшный суд»)

// ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ

В ходе выполнения проекта были задействованы следующие инструменты:

— Stable Diffusion для обучения генеративной модели — Google Colab для запуска и выполнения кода — Hugging Face для генерации токена и публикации модели — Deepseek для помощи в создании промптов для генерации итоговых изображений

// РЕЗУЛЬТИРУЮЩАЯ СЕРИЯ + КОММЕНТАРИИ

  1. «Озеро и его существа» — «in the style of BOSCH, grotesque lake with strange creatures emerging from water, detailed medieval fantasy painting»
  2. «Фонтан» — «in the style of BOSCH, grotesque fountain with strange animal heads and surreal water flows, detailed medieval painting»
  3. «Адский пейзаж» — «in the style of BOSCH, really dark burning hellish landscape with tortured figures and strange machines, detailed medieval oil painting»
  4. «Гибриды с рыбьими головами и птичьими ногами» — «in the style of BOSCH, grotesque hybrid creature with fish head and bird legs, detailed medieval fantasy painting»
  5. «Сад существ» — «in the style of BOSCH, medieval grotesque painting, contemporary garden of earthly delights with modern elements, surreal creatures, detailed oil painting»
  6. «Средневековый город» — «in the style of BOSCH, impossible medieval city with strange architecture and floating structures, detailed grotesque painting»
  7. «Адский оркестр» — «in the style of BOSCH, hellish orchestra with demonic musicians and strange instruments, detailed grotesque painting»
  8. «Адская ярмарка» — «in the style of BOSCH, grotesque medieval market with strange merchants selling impossible items, detailed painting»
  9. «Пиршество существ» — «in the style of BOSCH, grotesque feast with hybrid creatures and impossible food, detailed medieval painting»
  10. «Музыканты» — «in the style of BOSCH, grotesque musician playing strange instrument, detailed medieval painting»
  11. «Адская кухня» — «in the style of BOSCH, hellish kitchen with demonic chefs preparing strange food, detailed painting»
  12. «Руины» — «in the style of BOSCH, ruined medieval city with strange creatures living among broken towers, detailed grotesque painting»

«Озеро и его существа» // «Фонтан»

На мой взгляд, нейросеть успешно справилась с освоением визуального языка Босха. На сгенерированных изображениях отчетливо чувствуется фактура старой живописи, например, мелкие трещинки, которые появляются на холсте со временем. Цветовая гамма тоже близка к оригиналу: приглушенные землистые тона, холодные голубоватые оттенки в райских сценах и коричнево-красные в адских. Модель также уловила разницу между «райскими» и «адскими» промптами — в первом случае изображения получаются более светлыми, с небом и водоемами во втором — более хаотичными, мрачными, с всполохами огня. Композиционно нейросеть тоже повторяет босховскую логику: фигуры часто собираются в плотные группы, толпы существ взаимодействуют друг с другом, создавая многослойные сцены.

«Адский пейзаж» // «Гибриды с рыбьими головами и птичьими ногами»

«Сад существ» // «Средневековый город»

Конечно, без нейросетевых особенностей не обошлось. Анатомия у персонажей часто страдает: руки и ноги могут расти не из того места, количество конечностей превышает норму, и в целом фигуры буквально слипаются друг с другом, превращаясь в странные составные конструкции. Однако эти ошибки, с моей точки зрения, удивительным образом не разрушают общее впечатление. Босх сам был мастером гибридных форм, его существа часто состоят из фрагментов разных животных и предметов. То, что нейросеть довела этот принцип до абсурда, вписывается в логику художника. Если не всматриваться придирчиво, на первую секунду сгенерированные фрагменты вполне можно принять за оригинальные детали босховских триптихов.

«Адский оркестр» // «Адская ярмарка»

«Пиршество существ» // «Музыканты»

Лучше всего нейросеть справилась с воспроизведением характерных элементов: маленькие фигуры в фантастических пейзажах, группы странных существ, архитектурные элементы. Модель уловила общее настроение, однако сложнее ей далась логика отдельных сцен. Иногда композиция становится слишком хаотичной даже для Босха, а предметы теряют узнаваемость, превращаясь в нечитаемые формы. Также модель иногда «подглядывает» за конкретными фрагментами из обучения и повторяет их слишком близко, а не создает новые вариации. Но в целом баланс между узнаваемостью и новизной соблюден.

«Адская кухня» // «Руины»

Моя главная задумка была в том, чтобы научить нейросеть генерировать именно фрагменты, а не целые картины — и это сработало. Модель не пытается выстроить полноценную композицию триптиха, а выдает именно те детали, которые хочется рассматривать вблизи. Это соответствует тому, как зритель обычно воспринимает Босха: через отдельные сцены и маленькие сюжеты. Несмотря на технические шероховатости, результат получился именно тем, чем я задумывала — генерации выглядят как фрагменты неизвестных картин мастера, которые он гипотетически мог бы создать.

// ПРОЦЕСС ОБУЧЕНИЯ

Исходный размер 4096x2024

Сначала я проверила GPU и установила все необходимые библиотеки. Затем скачала готовый скрипт обучения Dreambooth LoRA и создала папку bosch, чтобы загрузить в неё все нарезанные фрагменты картин Босха для обучения.

Исходный размер 2048x1162

Я загрузила нужные файлы и прописала функцию image_grid, после чего вывела первые шесть фрагментов, чтобы убедиться, что все файлы загрузились корректно и визуально подходят для обучения.

0

Затем для каждого фрагмента я сгенерировала описание с помощью BLIP с добавлением префикса («in the style of BOSCH, medieval grotesque painting, „)

Все пары „имя файла — описание“ были сохранены в файл metadata.jsonl. В конце я для проверки вывела первые три строки. После генерации подписей я удалила модель BLIP из памяти, чтобы освободить ресурсы для обучения модели.

0

Затем я авторизовалась на Hugging Face и запустила обучение. Параметры обучения я подобрала так: разрешение 512×512 пикселей, 500 шагов, чекпоинты через каждые 250 шагов. Обучение заняло около часа.

После успешного обучения я загрузила модель на Hugging Face, чтобы она была доступна для генерации новых изображений в любой момент.

Исходный размер 4096x1728

После того как модель обучилась и загрузилась на Hugging Face, я подготовила её к генерации и начала экспериментировать с промптами.

// ЗАКЛЮЧЕНИЕ

В этом проекте я попыталась научить нейросеть видеть мир так, как его видел Иероним Босх. Используя фрагменты его картин, модель обучилась передавать характерную текстуру масляной живописи, приглушённую цветовую гамму и ту самую гротескную пластику, которая делает Босха узнаваемым с первых секунд.

Проект показал, что у нейросетей и Босха действительно есть что-то общее: и художник, и модель создают миры, где привычные формы распадаются и собираются заново в странных, пугающих и завораживающих комбинациях.

Исходный размер 2500x250

«Сад земных наслаждений» (фрагмент) // Иероним Босх // 1503–1515 гг.

Сад нейронных наслаждений
Проект создан 22.03.2026
Загрузка...
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше