Исходный размер 1086x1536

Обучение генеративной нейросети

big
Исходный размер 2600x600

Проект сосредоточен на создании иллюстраций, отражающих повседневную жизнь в городе через призму моего стиля. Изначально я не планировал использовать работы других художников для генерации изображений, так как считаю, что без их разрешения у меня нет на это права. Поэтому для обучения нейросети были использованы исключительно мои собственные иллюстрации. Основная цель проекта — показать разнообразие городской культуры, взаимодействие людей с окружающей средой и их повседневные моменты, используя яркие цвета и стилизованные элементы.

Первая база изображений

Первая база изображений содержала более 60 моих иллюстраций, и некоторые из них я продемонстрирую здесь, чтобы лучше понять, на что ориентировалась нейросеть.

big
Исходный размер 1152x1383
0

Хочу отметить, что на основе первой базы изображений мне удалось создать более авангардные версии своих работ. Я решил поэкспериментировать и смешать произведения из разных проектов и временных периодов, стремясь добиться эффекта дробления, большей смазанности и неоднозначности присутствующих элементов.

Исходный размер 1078x712
Исходный размер 1165x551
0

Процесс обучения

Исходный размер 1338x697

Автоматическая генерация описаний

Исходный размер 1294x608

Процесс обучения

Исходный размер 1123x743

Процесс генерации

Генерации

Исходный размер 3072x3072

Промпт: «A statue standing proudly in the center of a bustling city square»

Промпты: «A street musician playing guitar while people gather around» «People waiting at a bus stop»

Исходный размер 3072x3072

Промпт: «Overgrown train tracks leading into the distance surrounded by wildflowers»

Исходный размер 3072x3072

Промпты: «The grand entrance of a public library with steps and columns»

Промпты: «An intriguing art installation set up in a public space» «A bicycle parking area filled with colorful bikes lined up neatly»

Исходный размер 3072x3072

Промпт: «An inviting flower shop overflowing with colorful blooms outside»

Промпты: «Close-up of intricate architectural details on a historic building» «The ornate facade of an old theater lit up at night»

Исходный размер 3072x3072

Промпт: «Colorful banners hanging above stalls at a street market»

Исходный размер 3168x1024

Промпты: «A wall adorned with colorful street murals and abstract designs» «An old warehouse covered in graffiti and surrounded by overgrown plants» «A vibrant city skyline illuminated by sunset hues»

Исходный размер 3072x3072

Промпт: «A vintage water tower standing tall against a clear blue sky»

Промпты: «An old stone bridge arching over a serene river, surrounded» «A beautifully designed fountain surrounded by lush greenery»

Исходный размер 3072x3072

Промпт: «People waiting at a bus stop»

Исходный размер 3072x3072

Промпт: «An underground metro station with colorful tiles and artistic designs»

В целом, мне нравится получившийся результат на основе первой базы изображений. Думаю, что поскольку я собрал множество своих иллюстраций в различных стилях, нейросеть смогла обучиться чему-то общему и среднему между ними. Она часто создавала многофигурные композиции, так как таких примеров изначально было много. При этом стоит отметить интересное внимание к деталям: нейросеть хорошо уловила моё отношение к формам и контформам, а также к цвету и тени. Несмотря на то что многие изображения с присутствием людей выглядят смазанными и размытыми, в них есть прекрасные композиции и гармоничное заполнение листа. Я с удовольствием использовал бы эти результаты для создания, например, коллажа. Тем не менее, мне хотелось добиться большей четкости, поэтому я собрал вторую базу изображений.

Промпты: «A scenic waterfront with boats docked and buildings reflecting on the water» «A sandy beachfront with colorful beach umbrellas and clear waters»

Исходный размер 3072x3072

Промпт: «People waiting at a bus stop»

Вторая база изображений

Для второй базы данных я собрал всего 16 иллюстраций, что почти в 4 раза меньше, чем в первом варианте. Также важно отметить, что все эти иллюстрации выполнены в едином стиле, с общим подходом и цветовым решением. Поэтому я ожидал увидеть более четкий и полноценный результат.

Исходный размер 3307x3969
Исходный размер 1004x648

Процесс обучения

Во второй раз процесс обучения оказался гораздо более тщательным и аккуратным. Я стремился найти идеальные настройки, многократно изменяя и корректируя все параметры. Все генерации и изменения параметров вы можете найти в коде.

Исходный размер 990x561
Исходный размер 1317x791

Генерации. Итоговая серия

Исходный размер 1536x1536

Промпт: «A rooftop view of city at sunset with chimneys and antennas»

Промпты: «A couple dancing near street jazz band» «An old man feeding pigeons in city square»

Исходный размер 2304x2304

Промпт: «A bookstore with large display window and warm interior lighting»

Промпты: «Students reading books on university steps» «A street vendor selling flowers at intersection»

Исходный размер 2304x2304

Промпт: «A rainy city square with puddles reflecting neon signs»

Промпты: «A postman delivering letters to old apartments» «Friends chatting at outdoor cafe with umbrellas»

Исходный размер 2304x2304

Промпты: «A grandmother pushing a stroller with a baby in the park» «A woman painting watercolors of a city view»

Исходный размер 2304x2304

Промпт: «A bridge over a river with a city skyline in the background»

Промпты: «Friends having a picnic in an urban meadow» «A chef taking a break behind a restaurant with a cigarette»

Исходный размер 2400x768

Промпты: «A fountain in city center with pigeons around it» «An urban river with bridges and city reflections in water» «An urban canal with houseboats and bicycles parked nearby»

Промпты: «An underground pedestrian crossing with mosaic walls» «A cyclist stopping to check city map»

Исходный размер 2304x2304

Промпт: «Quiet cobblestone street with vintage lampposts»

Промпты: «A street cleaner with cart and broom early morning» «Photographer taking pictures of street art»

Исходный размер 1536x1536

Промпт: «A concrete pedestrian bridge over busy highway»

Промпты: «A fruit vendor weighing apples for a customer» «Children chasing a runaway balloon in the plaza»

Исходный размер 2304x2304

Промпт: «An old tram moving through narrow city streets»

Промпты: «A man reading poetry to small audience» «Old friends playing chess in the park»

Вывод

Благодаря сокращению количества изображений и единой стилистике нейросеть смогла гораздо точнее отразить и уловить мой стиль. Я доволен результатами генерации для итоговой серии; они кажутся мне живыми и приятными. Я вижу явные сходства между моими оригинальными иллюстрациями и тем, что получилось в итоге. Деревья, складки на одежде, цвет и тень — многие аспекты получились удачно. Однако изображения людей все еще не идеальны, хотя я приложил все усилия, чтобы привести их в приемлемый вид. Хочу также отметить первую пробную серию. Она вышла более экспериментальной и неожиданной, и мне она настолько понравилась, что я решил продемонстрировать ее тоже.

Применения генеративных моделей

Дообучение и создания изображений — модель Stable Diffusion. При генерации промптов мне помог chat GPT, а в составлении кода — DeepSeek Chat. Для повышения качества некоторых изображений было использовано приложение «Upscayl».

Исходный размер 4330x1005
Обучение генеративной нейросети
Проект создан 10.04.2025
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше