Идея проекта
Идея проекта появилась довольно случайно — я наткнулась на старую детскую поделку, модель солнечной системы, сделанную из обычной коробки. Она сразу зацепила мое внимание: неровные планеты, простая покраска, немного наивные пропорции и ощущение, что всё собрано вручную без попытки сделать «правильно».
В этом объекте есть особое настроение, ведь он воспринимается не как научная модель, а как личное представление о космосе.
Мне стало интересно, можно ли перенести это ощущение в генеративную модель и сохранить его при создании новых изображений. В рамках проекта я обучаю Stable Diffusion на фотографиях этой поделки, чтобы затем получить серию генераций, в которых объект сохраняет свою узнаваемость, но при этом существует в других условиях — с новым светом, композицией и окружением.
Таким образом, я рассматриваю модель не просто как инструмент генерации, а как способ переосмысления исходного объекта: насколько она способна уловить его характер и продолжить его визуальную логику за пределами оригинальной формы.
В дальнейшем полученные изображения можно рассматривать как основу для иллюстраций или визуальных серий, где детская интерпретация космоса превращается в самостоятельный художественный образ.
Для обучения модели я самостоятельно собрала датасет из фотографий поделки. Объект был снят с разных ракурсов, чтобы зафиксировать его форму и объём, а также при различном освещении — от более мягкого до контрастного.
Все изображения были приведены к квадратному формату. Итоговый датасет включает 20 фотографий, которые отличаются по углу съёмки и свету, что позволило сделать его более разнообразным и пригодным для обучения.
Применение генеративной модели
Во время выполнения проекта использовались следующие инструменты: — Stable Diffusion для обучения генеративной модели; — Google Colab для выполнения кода; — ChatGPT для написания промптов.
Обучение генеративной модели
1) Подготовка среды и установка зависимостей
На первом этапе была настроена рабочая среда в Google Colab и установлены необходимые библиотеки для работы со Stable Diffusion.
2) Конфигурация проекта
Далее я задала основные параметры проекта, включая путь к датасету и текстовый идентификатор объекта, который использовался в процессе обучения.
3) Проверьте набор данных и предварительный просмотр изображений
На этом этапе проверяется папка с данными, отбираются подходящие изображения и выводится их предварительный просмотр.
4) Дополнительная предварительная обработка
На этом этапе выполняется дополнительная обработка данных: изображения переводятся в формат RGB и приводятся к квадратному виду с центрированием.
5) Создание подписей / метаданных
В этом разделе формируется файл метаданных, используемый в процессе обучения.
6) Настройка Accelerate
На этом этапе подготавливается конфигурация Accelerate для запуска скрипта обучения.
7) Обучение модели (LoRA)
На этом этапе проверяется среда, собирается команда и запускается обучение модели.
8) Проверка сохранённых файлов
После обучения выводится список файлов, созданных в выходной директории.
9) Подключение LoRA
Загружается модель и применяется обученная LoRA для генерации изображений.
Итоговые изображения
После завершения обучения я перешла к генерации изображений с использованием полученной модели. Для этого я использовала собственные текстовые запросы, в которых указывала объект и задавала различные условия окружения и освещения.
Все промпты строились вокруг уникального идентификатора объекта, чтобы модель корректно воспроизводила обученную форму и сохраняла его визуальные особенности в разных сценах.
промпт: «educational poster style image of handmade solar system model, clean background, vibrant colors»
Первой пробой стала генерация изображения с обученной моделью, в котором объект сохраняется в приближённых к исходным условиях на полностью белом фоне. Результат сразу показался удачным: нейросеть достаточно точно передала форму поделки, расположение планет и общую композицию.
Stable Diffusion — «Солнечная система», 2026
промпт: «minimalist photo of handmade solar system model on a white pedestal, gallery lighting»
В следующей генерации объект сохраняет свою узнаваемую структуру, но уже немного по-другому интерпретируется моделью. Видно, что форма и расположение элементов остаются близкими к оригиналу, однако подписи и мелкие детали начинают искажаться, подчеркивая особенности работы нейросети.
При этом хорошо сохраняется ощущение ручной текстуры и покраски, благодаря чему изображение по-прежнему выглядит как физическая поделка, а не полностью цифровой объект.
Stable Diffusion — «Солнечная система», 2026
промпт: «museum display photo of handmade solar system model, clean composition, realistic lighting»
В этой генерации заметно изменение фона: вместо нейтральной студийной среды появляется более сложное и реалистичное окружение. Это добавляет глубину изображению и делает объект частью пространства, а не изолированным элементом.
Stable Diffusion — «Солнечная система», 2026
промпт: «editorial photograph of handmade solar system model, artistic composition, colorful planets»
В этой генерации фон становится более насыщенным и детализированным: появляется рабочее пространство с материалами для творчества. Это усиливает ощущение ручной работы и делает объект частью живой, контекстной среды.
Stable Diffusion — «Солнечная система», 2026
промпт: «cinematic photo of handmade solar system model in a dark space-themed room, dramatic shadows»
В этой генерации фон становится более тёмным и атмосферным, с космическими элементами и направленным освещением. Это усиливает контраст и делает сцену более выразительной, придавая изображению ощущение завершённости.
Stable Diffusion — «Солнечная система», 2026
Заключение
Таким образом, обучив генеративную модель Stable Diffusion на фотографиях детской поделки, мне удалось получить серию изображений, в которых объект сохраняет свою узнаваемость, но при этом существует в различных визуальных средах. В ходе генерации модель не только воспроизводит форму и композицию, но и переносит объект в новые контексты — от более реалистичных до условно фантазийных.
Полученные изображения демонстрируют, что нейросеть успешно усваивает ключевые характеристики объекта: его пропорции, цвет и фактуру поверхности. Особенно важно, что сохраняется ощущение ручной работы — неровности, следы краски и наивная пластика формы, которые делают объект живым и материальным.
Итоговая серия показывает, что генеративная модель способна не просто копировать исходный материал, а интерпретировать его, создавая вариативные изображения с сохранением общей визуальной логики.




