Концепция
Цель проекта — показать, что любые пространства сохраняют воспоминания. Даже после того, как здания меняют свой облик, а люди покидают эти интерьеры, создается ощущение, что посмотрев на эти фотографии, зритель наблюдает фрагменты воспоминаний, сохраненных на старых кассетах. Отсюда вытекают печальные эмоции при просмотре обветшалых комнат и залов, от которых практически ничего не осталось.
Серия фотографий, которая была сделана при помощи нейросети, становится своеобразным призраком памяти. Ситуации, показанные там, могли когда-то происходить в этих пространствах. Однако это не только навевает воспоминания, но еще и страх перед силой времени и контрастности изображаемого.
Исходные изображения для датасета
Изображения для датасета собирались с бесплатных стоковых сайтов:
- Pexels
- Pixabay
- Unsplash
Лицензия позволяет свободно использовать, распространять и изменять фотографии без указания авторства.
Фотографии подбирались по принципу поиска полностью разрушенных зданий или же сохранившихся частично.
Результирующая серия изображений
Промты:
«analog horror photo of family having dinner inside abandonedvhs restaurant, broken walls, dusty light, VHS aesthetic»
«analog horror photo of children playing inside abandonedvhs school classroom, broken desks, dust particles, VHS aesthetic»
«analog horror photo of birthday party inside abandonedvhs apartment, ruined interior, eerie atmosphere»
«analog horror photo of office workers sitting with laptops inside abandonedvhs shopping mall, abandoned escalators»
«analog horror photo of wedding ceremony inside abandonedvhs hotel hall, destroyed walls, VHS footage»
«analog horror photo of library scene inside abandonedvhs hospital corridor, books everywhere»
«analog horror photo of people dancing inside abandonedvhs ballroom, ruined architecture»
«analog horror photo of family watching television inside abandonedvhs living room, broken furniture»
«analog horror photo of children studying inside abandonedvhs classroom, dusty sunlight»
«analog horror photo of picnic scene inside abandonedvhs train station hall, large ruined architecture»
При обучении модели использовался собственный датасет изображений заброшенных интерьеров. Эти фотографии сформировали основу для визуального видения серии — пыльные помещения с порушенными стенами и поврежденной мебелью. В результате получилось воспроизвести типичные признаки заброшенных пространств.
Результаты генерации показывают различные вариации темы. В каких-то изображениях получилось больше уделить внимания архитектуре пространства — крупные разрушенные здания, длинные коридоры, разукрашенные стены, которые характерны своей облупившейся штукатуркой, а где-то акцент смещается на взаимодействие персонажей и происходящую сцену.
Если говорить про людей, то в данной работе не хватило пластичности и хорошей анатомии, так как в датасете не присутствовали изображения с конкретными лицами. Однако выбранная модель stable diffusion изначально обучена на физиологии, но, возможно стоило подобрать подходящие позы и сцены в качестве референсов для нейросети.
Также можно заметить, что освещение на исходных фотографиях гораздо темнее, а атмосфера в целом мрачная, что добавляет контрастности и резкости. Результирующая серия же, наоборот, достаточно светлая, и там появляются яркие цвета поверх фотографий, что приближает к эстетике старых видеозаписей.
Описание применения генеративной модели
Для реализации проекта была использована генеративная модель Stable Diffusion XL 1.0, которая была дообучена на собственном датасете. В процессе обучения также использовался метод LoRA, позволяющая адпатировать модель под специфический визуальный стиль при относительно небольшом количестве изображений.
При обучении были заданы следующие параметры:
— Размер датасета: 38 изображений — Количество шагов: 1000 — Разрешение фотографий: 768×768 пикселей — Размер батча: 1 — Gradient accumulation: 4 шага
После получения серии была использована нейросеть X-Design, чтобы улучшить качество изображений. Также для написания промтов была применена нейросеть ChatGPT.




