Исходный размер 2480x3500

Обучение генеративной модели Stable Diffusion стилю детских рисунков

Концепция

Идеей моего проекта является обучение генеративной нейросети Stable Diffusion, которая будет способна понимать и самостоятельно воспроизводить уникальные изображения, основанные на стиле детских рисунков.

В данном проекте я решила взять за основу именно детские рисунки, так как мне было интересно как нейросеть сможет повторить настолько интуитивный и наивный стиль рисования.

Исходные изображения

Для обучения генеративной нейросети на просторах интернета я собрала датасет, который состоял из 23 детских рисунков.

big
Исходный размер 2835x1417

Код

Наш код реализует обучение генеративной нейросети, ориентируясь на стилистику детских рисунков.

big
Исходный размер 1303x634
big
Исходный размер 1330x364

Подключаем созданную нами папку «kids_art» и выводим тренировочные изображения.

Исходный размер 1320x665

Далее мы просим нейросеть создать промпты на наши изображения.

Исходный размер 1316x387
Исходный размер 1304x743

На этом этапе происходит обучение генеративной модели на собранном наборе изображений.

Серия итоговых изображений

Исходный размер 1024x1024

На мой взгляд нейросеть вполне удачно справилась с генерацией изображений в стиле детских рисунков. Ей удалось передать неопытность и наивность. А также она справилась с передачей карандашной техники, штриховки и неоднотонного покрытия в некоторых областях.

Исходный размер 1024x1024

В некоторых рисунках вместо карандашной техники нейросеть решила использовать акварель, что отражается в полутонах и делает изображение более сложным и контрастным.

0

Также интересно наблюдать за тем, как нейросеть справилась с рукописными вставками. Она достаточно умело повторила чернильные корявые надписи, напоминающие почерк ребенка.

Исходный размер 1024x1024

Еще одним вариантом интересной генерации стала данная фотография. Здесь помимо детских рисунков мы можем заметить общую семейную фотографию, где человечки служат графикой и становятся частью рамки, частью дизайна самой фотографии.

Заключение

На мой взгляд, нейросеть действительно удачно справилась с поставленной задачей. Во всех изображениях прослеживается стилистика детских рисунков, карандашная или акварельная техника, узнаваемые формы и даже повторение рукописного шрифта. Цели, поставленные мной при создании этого проекта, были достигнуты.

Обучение генеративной модели Stable Diffusion стилю детских рисунков
Проект создан 10.04.2025
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше