Исходный размер 2480x3500

Обучение генеративной нейросети под объект

Концепция

Цель моего проекта — обучить нейросеть понимать и воспроизводить изображение объекта: лошадей. Для обучения используются фотографии лошадей в различных позах, ракурсах и локациях. В разделе «Исходные изображения» представлены фото, включенные в базу данных для анализа и обучения.

Исходные изображения

big
Исходный размер 4256x2832
big
Исходный размер 800x495

Сгенерированные изображения

Исходный размер 1024x1024

A photo of TOK horse a horse running in a field of flowers

Исходный размер 1024x1024

A photo of TOK horse a horse standing in a field with the sun setting behind it

Исходный размер 3500x1109

Итоговая серия изображений представляет собой генерацию фотореалистичного объекта — лошадей.

Сгенерированные изображения демонстрируют успехи в имитации такого сложного объекта, как лошадь. Получилось создать фото с разными ракурсами, планами, локациями и светом. Особенно удачно нейросети удалось передать гриву, отлив шерсти, а также динамику поз лошадей, присутствующую на референсах в базе данных.

Работа с кодом

Исходный размер 1131x590

Просмотр датасета (первые 5 изображений)

Было собрано 20  изображений с лошадьми для базы данных. Подбирались фотографии с разными ракурсами, позами, фоном, планами и другими характеристиками.

Исходный размер 3500x3348

Генерируем описание к изображению

Исходный размер 1123x602

Обучение (500 шагов, сохранение каждые 250 шагов)

Код и датасет

Файл с кодом: https://disk.yandex.ru/d/cbB3TUQYlCy8kw

Датасет с фотографиями: https://disk.yandex.ru/d/NBhcSbswuP1Nmg

Обучение генеративной нейросети под объект
Проект создан 10.04.2025
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше