Ботаническая иллюстрация — это искусство изображения формы, цвета и деталей растений. Подобные иллюстрации обычно публикуются рядом с научным словесным описанием растений в книгах, журналах и других специализированных ботанических изданиях.
Мне стало интересно, как современные генеративные модели могут воспроизвести и даже переосмыслить подобный стиль.


Для ботанической иллюстрации характерны точно, наблюдательное изображение растений, внимание к строению цветка, листьев, стебля, а также изолированная подача объекта на нейтральном фоне.


Растение здесь показано почти как отдельный портрет или музейный образец, без лишнего окружения и сюжета.
Отличительные черты стиля — мягкая акварельная проработка, плавные переходы цвета, натуральная палитра, светлый или дымчатый фон, ясный силуэт и аккуратная композиция.

Именно эти визуальные признаки делают стиль особенно удобным для обучения нейросети: модель способна уверенно считывать, выделять и затем воспроизводить его основные характерные черты.

Нейросеть Stable Diffusion XL была адаптирована под стиль Ботанической иллюстрации посредством обучения LoRA на наборе из 23 изображений (подготовленных предварительно), после чего использовали для генерации изображений по текстовым запросам.
Результирующая серия изображений
Что удалось передать:
- Ботаническая точность — нейросети хорошо воспроизводят характерную для научной иллюстрации внимательность к форме листьев, лепестков, плодов, грибов и соцветий - Палитра — естественные цвета, акварель - Эффект старинной печати — изображения напоминают старинную печать XIX века - Композиционные решения — табличная композиция (объекты расположены как на страницах научного атласа), баланс формы и фона - Тематическая точность — сохранен научно-наблюдательный характер, растения считываются хорошо, правильное строение









