Идея проекта
В этом проекте я решила создать модель, способную генерировать изображения различных животных, будто бы запечатленных фотоловушкой ночного видения в их естественной среде обитания. Для этого я обучила нейросеть на реальных фотографиях такого типа.
Исходные изображения
В качестве исходных изображений для обучения нейросети я взяла картинки с сайта https://www.inaturalist.org/ и обрезала их под нужный формат
Итоговые изображения
Лиса промпт «a nightvision_style night vision wildlife trail camera photo of a fox»
Нейросеть понимает какое животное нужно изобразить и отлично соблюдает стиль камеры ночного видения
Медведь промпт «a nightvision_style night vision wildlife trail camera photo of a bear»
Барсук промпт «a nightvision_style night vision wildlife trail camera photo of a badger»
Конечно, есть неточности в деталях внешнего облика животных, но не такие значительные, можно даже сказать, что это добавляет загадочности.
Олень промпт «a nightvision_style night vision wildlife trail camera photo of a deer»
Вывод
Можно сказать, что результат соответствует исходной идее проекта: снимки выглядят достаточно реалистичными и случайными — так бы и выглядели фотографии, сделанные фотоловушкой. Животные изображены без заметных ошибок, стилистическе особености технологоии ночного видения сохранены, все это говорит о успехе проекта.
Обучение модели осуществлялось в среде Google Colab
Этапы работы над проектом:
— Установка необходимых библиотек — Загрузка предобученной модели — Подключение к Google Drive и загрузка набора данных — Обработка изображений (изменение размера и нормализация) — Создание описания изображений — Настройка параметров обучения с использованием LoRA — Проведение обучения — Создание конечных изображений с помощью текстовых промптов
В работе я также использовала ChatGPT для помощи в отладке кода
