Концепция
Проект направлен на создание модели нейросети, способной генерировать уникальные, атмосферные изображения туннелей, которые развивают визуальный нарратив в сторону иллюстративного прочтения. Вдохновленная концепцией «фантомной катастрофы», нейросеть будет создавать изображения, вызывающие чувство таинственности и эпического масштаба.
Примеры реальных изображений для обучения
Итоговые изображения

«photorealistic shot of a dark, deep underground metro tunnel, curved train tracks leading into the distanсе»
«massive arched concrete tunnel, intricate ribbed structure, long perspective down railroad tracks»
«somebody alone in tunnel»
«glowing artefact, figure»
«bright light at the end of dark tunnel, dramatic glow, rays of light»
«stalkers sitting right in tunnel»
«trainway in tunnel»
Техническое описание
Процесс обучения// Архитектура и параметры:
• Базовая модель: Stable Diffusion XL 1.0 • Метод адаптации: Dreambooth с LoRA • Размер датасета: 14 изображений • Количество шагов: 25 • Разрешение: 1024×1024 пикселей
Использованные модели ИИ:
Stable Diffusion XL 1.0 Ссылка: https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0 //Цель: Базовая архитектура для генерации изображений
BLIP (Bootstrapping Language-Image Pre-training) — Ссылка: https://huggingface.co/Salesforce/blip-image-captioning-base //Цель: Автоматическая аннотация обучающих изображений
Dreambooth + LoRA //Цель: Персонализация базовой модели под заданный стиль
Обучение:
Обучение проводилось на датасете реальных фотографий, содержащем ограниченное количество изображений в единой визуальной обработке. Для улучшения качества результатов использовались gradient checkpointing и 8-битная оптимизация.
Анализ корреляции концепций:
Проект демонстрирует симбиоз реальной съемки и нейросетевого прочтения концепции.
Модели удалось усвоить ключевые принципы воспроизведения, переданы элементы стиля:
Цветовая интеграция: Приглушенные и монохромные изображения в холодных тонах;
Освещение: точечное контрастное освещение, естественный источник в качестве точки света, наделенный при этом резким визуальным весом;
Структурная адаптация: ракурсы соответствуют точкам съемки, заданным изначальным датасетом.








