Концепция проекта
«Мурка-путешественница» — это проект о воображаемом побеге домашней кошки за пределы привычного пространства. В реальности Мурка никогда не выходит из дома, поэтому генеративная модель становится инструментом, позволяющим представить альтернативные сценарии её жизни — прогулки, путешествия и ситуации, которые невозможны физически.
Идея и мотивация
Идея проекта возникла из личного наблюдения: Мурка полностью изолирована от внешнего мира. Используя Stable Diffusion и дообучение модели, я попыталась создать серию фотореалистичных изображений, в которых кошка оказывается в различных пространствах — от повседневных до фантазийных, сохраняя при этом узнаваемую внешность и анатомию.
Датасет
Для обучения модели был собран кастомный датасет фотографий моей кошки Мурки из личного архива. Датасет включал 64 изображения в высоком разрешении (3000×3000), приведённые к квадратному формату (1:1) и масштабированные до 640×640 для обучения.
При отборе изображений сознательно использовались разнообразные ракурсы, позы и условия освещения, что позволило модели лучше зафиксировать идентичность персонажа и корректно воспроизводить его в различных сценах и положениях тела.
Особое внимание уделялось анатомии, пропорциям и узнаваемым деталям морды.
Парочка фотографий из моего датасета
Про генерацию и контроль результата
Основной задачей генерации было сохранение анатомической корректности и узнаваемости кошки при смене контекста. Для этого использовались негативные промпты и ручная настройка параметров генерации, позволяющие избежать деформаций и случайных искажений.
Результаты
В результате была создана серия изображений, в которых Мурка «путешествует» по различным пространствам, оставаясь узнаваемой и реалистичной. Проект не стремится к документальности, а работает с образом и воображаемым сценарием.
Сгенерировано обученной моделью + промпт
Сгенерировано обученной моделью + промпт
Сгенерировано обученной моделью + промпт
Мурка на крыше


Сгенерировано обученной моделью
Промпт
Сгенерировано обученной моделью
Мурка среди цветочков


Сгенерировано обученной моделью
Промпт


Сгенерировано обученной моделью
Мурка на корабле


Сгенерировано обученной моделью
Промпт
Мурка в Египте


Сгенерировано обученной моделью
Промпт
Сгенерировано обученной моделью
Мурка на яхте


Сгенерировано обученной моделью
Промпт
Сгенерировано обученной моделью
Мурка в Азии


Сгенерировано обученной моделью
Промпт
Сгенерировано обученной моделью
Мурка среди детских игрушек


Сгенерировано обученной моделью
Промпт


Сгенерировано обученной моделью
Мурка на фоне Новогодних декораций


Сгенерировано обученной моделью
Промпт


Сгенерировано обученной моделью
Мурка в космосе


Сгенерировано обученной моделью
Промпт
Сгенерировано обученной моделью
Мурка на фоне взрыва


левая 04_______________________________________________________________________правая 01 Сгенерировано обученной моделью
Промпт


левая 04_______________________________________________________________________правая 01 Сгенерировано обученной моделью
Мурка на пляже


02 Сгенерировано обученной моделью
Промпт


левая 03_______________________________________________________________________правая 04 Сгенерировано обученной моделью
Дополнительная серия
Дополнительная серия изображений была создана на основе тех же обученных весов и промптов и расширяет основную концепцию проекта.
Сгенерировано обученной моделью
Описание применения генеративной модели
В проекте использовались инструменты генеративного искусственного интеллекта.
Модель Stable Diffusion XL применялась для обучения и генерации изображений персонажа на основе кастомного датасета.
Дополнительно использовался ChatGPT как вспомогательный инструмент для консультаций по структуре пайплайна, формированию промптов и описанию проекта. ChatGPT не использовался для генерации визуальных материалов.
Обучение модели проводилось в Google Colab с использованием готового пайплайна DreamBooth + LoRA для Stable Diffusion XL. Ноутбук фиксирует экспериментальный процесс подбора параметров, датасета и промптов. Из-за ограничений среды Colab (ограничения по памяти и времени сессии) ноутбук не является воспроизводимым «one-click» решением, а отражает исследовательский характер работы.
Спасибо за внимание!


















































