Концепция
Проект направлен на обучение нейросети, способной постигать и воссоздавать визуальные стилистические приемы, присущие выдающимся мастерам иллюстрации и живописи. Процесс обучения модели осуществляется на тщательно подобранном массиве произведений известного художника. Искусственный интеллект анализирует композиционные решения, цветовую гамму, характер мазков, особенности светотени и прочие фундаментальные аспекты, определяющие неповторимый художественный почерк автора.
В основе данного проекта лежит творческое наследие Гюстава Доре, выдающегося французского иллюстратора и гравёра XIX столетия. Его иллюстрации к Библии, «Божественной комедии» Данте Алигьери и сказкам Шарля Перро признаны эталоном мировой книжной графики. Искусство Доре отличается эпическим масштабом, глубоким драматизмом и виртуозным мастерством в технике торцовой гравюры на дереве.
Исследование стиля Гюстава Доре посредством нейросетевых технологий представляет особый интерес, поскольку его творчество ставит перед алгоритмами искусственного интеллекта чрезвычайно сложные задачи. В отличие от произведений минималистов, где ИИ сталкивается с проблемой «пустоты», эстетика Доре характеризуется склонностью к заполнению пространства (horror vacui). Каждый элемент композиции формируется посредством тысяч точно выверенных тончайших линий. Объём, свет и тень созданы исключительно за счёт плотности и пересечения штриховки чёрными чернилами, без использования полутонов или градиентов серого. Задача научить модель диффузионного типа понимать принципы работы резца гравера, сохранять структуру множества параллельных линий и избегать цифрового шума или потери детализации является крайне нетривиальной.
Ниже представлены некоторые из работ Гюстава Доре, включённые в обучающую выборку для искусственного интеллекта.
Техническая реализация (Google Colab и LoRA)
В рамках данного проекта для проведения обучения была задействована облачная платформа Google Colab. При этом применялся специализированный метод — LoRA (Low-Rank Adaptation). Данная методика обеспечивает возможность дообучения массивных базовых моделей, к которым, в частности, относится Stable Diffusion. Суть подхода состоит в том, что модификации подвергается лишь незначительная часть вычислительных алгоритмов. Это обстоятельство существенно повышает скорость и эффективность процесса обучения.
Для обеспечения наглядности и структурированности всех технических операций, рабочий процесс (пайплайн) был намеренно сегментирован на четыре основные стадии, каждая из которых играет свою роль в общем цикле:
- Проверка оборудования (Видеокарта)
Генерация и обучение нейросетей требуют мощных видеокарт (GPU). На этом шаге мы инициализируем сервер и проверяем, какой именно вычислительный ресурс выдал нам облачный сервис Google для работы.
- Подключение датасета и установка программ
Для обеспечения работы программы производится подключение к облачному хранилищу, содержащему тщательно подобранную коллекцию произведений живописца (представляющую собой обучающий датасет). Одновременно осуществляется загрузка критически важных библиотек для машинного обучения, в частности, diffusers и accelerate. Эти компоненты предоставляют программному коду необходимый инструментарий для эффективной обработки и анализа графических данных.
- Запуск обучения (Тренировка стиля)
Это кульминация технического процесса. Здесь мы передаем нейросети команду: «Возьми базовую модель, проанализируй картины в нашей папке и найди в них общие стилевые черты». Процесс идет шаг за шагом (steps), пока нейросеть не выучит уникальный почерк художника, связав его со специальным кодовым словом (триггером).
- Генерация первой картинки (Инференс)
После завершения обучения мы тестируем результат. Пишем текстовый запрос (промпт), используем выученное кодовое слово, и нейросеть «рисует» совершенно новое изображение в только что освоенном стиле.
Творчество Гюстава Доре выделяется своим самобытным и легко идентифицируемым стилем, который определяется рядом отличительных черт. Прежде всего, это виртуозное мастерство ксилографии, где объем и форма достигаются с помощью плотной, математически точной штриховки. Следующей важной характеристикой является строгая монохромность, представляющая собой контрастное сочетание насыщенного черного цвета и незапятнанной белизны бумаги, избегающее полутонов. Неотъемлемой частью его работ является драматическое освещение, напоминающее театральное (кьяроскуро), часто проявляющееся в виде божественных световых лучей, прорезающих мрак или плотные облака. Доре также склонен к эпическому, грандиозному масштабу изображений, где миниатюрные человеческие фигуры кажутся незначительными перед лицом гигантских скал, обширных лесных массивов или монументальных архитектурных сооружений. Наконец, в его творчестве присутствует гротеск и элементы темной романтики, выраженные в образах устрашающих демонов, мрачных, внушающих страх лесов и экспрессивных, полных драматизма позах персонажей.
Примеры сгенерированных изображений и промпты
Для тестирования модели и раскрытия её потенциала были составлены специальные промпты:
«A solitary knight standing before a massive, overwhelmingly large dark gothic cathedral, eerie moonlight, photo in Gustav style, intricate line art, macabre atmosphere.»
«A lost traveler walking through a terrifying, dense forest with giant gnarled trees and thick twisted roots, photo in Gustav style, stark black and white contrast, meticulous ink shading.»
«A fragile wooden galleon tossed on gigantic, stylized crashing waves during a terrifying storm, photo in Gustav style, epic scale, dense linework, dramatic nature.»
«A colossal, terrifying gate carved into a dark mountain, souls weeping around it, photo in Gustav style, visionary art, extremely detailed hatching, dark romanticism.»
«A giant, terrifying sea monster emerging from the ocean depths to attack a ship, photo in Gustav style, mythological illustration, intricate scales texture, dramatic composition.»
«A towering, infinitely high spiraling tower reaching into dark storm clouds, thousands of tiny workers, photo in Gustav style, epic architecture, wood engraving texture.»
«A futuristic dystopian cyberpunk city with towering skyscrapers and flying vehicles, rendered entirely as a 19th-century wood engraving, photo in Gustav style, dense ink lines, stark contrast.»
«An astronaut floating alone in a terrifyingly vast cosmic abyss, giant monolithic alien structures in the background, photo in Gustav style, cosmic horror translated into classic engraving.»
«A colossal, terrifying mechanical walking machine looming over a tiny 19th-century village, photo in Gustav style, sci-fi meets dark romanticism, incredibly detailed crosshatching.»
На мой взгляд, искусственному интеллекту удалось в значительной степени имитировать неповторимую манеру Гюстава Доре. В созданных им произведениях прослеживаются грандиозный эпический размах, увлечение монументальной архитектурой, выразительная игра света и тени, характерная для мрачного романтизма девятнадцатого столетия.
Тем не менее, нельзя обойти вниманием и недостатки сгенерированных изображений. Основная трудность заключается в нюансах текстуры на микроуровне. В то время как Доре создавал объем с помощью четких, закономерных параллельных линий и перекрестной штриховки, нейросеть зачастую воспроизводит беспорядочное скопление пикселей. Издалека это напоминает гравюру, но при более детальном рассмотрении «штрихи» деформируются, сливаясь в серые переходы или превращаясь в цифровой шум.
Кроме того, искусственный интеллект периодически демонстрирует недостаточное понимание анатомии при работе со сложными ракурсами, свойственными гравюрам мастера, приводя к запутанным и нечетким сплетениям конечностей. Эти недочеты доступны для восприятия даже неспециалисту, не обладающему искусствоведческими знаниями.
Вывод
Цифровое воспроизведение классической торцовой гравюры Гюстава Доре выявило существующие ограничения современных диффузионных моделей. Искусственный интеллект, представленный такими системами, как Stable Diffusion 3.5, FLUX.1 или Midjourney v6, демонстрирует выдающиеся способности в передаче общих элементов изображения: композиции, уровня контраста, визуальной массивности объектов и общей атмосферы. Эти нейросети успешно адаптируют викторианскую эстетику к современным или футуристическим тематикам.
Тем не менее, на детализированном уровне алгоритмы пока не достигают уровня мастерства человека. Воссоздание техники граверного резца предполагает точное применение математических и физических принципов построения линий, тогда как искусственный интеллект генерирует изображения, исходя из пиксельного шума, что неизбежно влечет за собой снижение четкости и чистоты штриха.
Несмотря на это, данный проект подтверждает, что методы углубленного дообучения нейросетей, такие как LoRA и fine-tuning, являются ценным инструментом для художников-концептуалистов и иллюстраторов. Они дают возможность оперативно создавать концепции и наброски, обладающие необходимой монументальностью и атмосферой. Это обеспечивает творцу прочную основу для дальнейшей ручной обработки и детализации.
Применение генеративной модели
• Для генерации промптов и структуры кода пайплайна был использован Claude Sonnet 4.5.




