В этом проекте проанализирован датасет о жилых домах Москвы. Этот анализ помог узнать, как какие изменения в строительстве произошли со временем, как зависит количество лифтов от площади помещений дома и в каких районах Москвы искать самые старые жилые дома.
Мудборд
Внешний вид графиков и стиль проекта в целом вдохновлен свечением окон в домах ночью, это как раз особенность жилых домов, и все они очень разные.
Мудборд
В исследовании использованы данные с сайта Хаб открытых данных (hubofdata.ru). Датасет содержит информацию для каждого дома о том, в каком округе и районе города он находится, год постройки и ввода в эксплуатацию, площадь помещений, количество этажей, квартир, лифтов и некоторую другую информацию.
Для анализа применены такие данные, как количество этажей, год постройки, общая площадь и название района.
Данные представлены в виде гистограмм с разным масштабом, чтобы наглядно показать наименьшие и наибольшие значения, линейной диаграммы, чтобы увидеть изменение тренда и точечной диаграммы для отображения взаимосвязи данных.
Использование библиотек
В коде использованы библиотека pandas для работы с csv-файлом, matplotlib.pyplot для основной визуализации данных, seaborn для небольшой стилизации графика, matplotlib.colors для удобной работы с градиентной заливкой, matplotlib.patches для дополнительной стилизации столбцов.
Обработка данных
В датасете на месте некоторых значений были нули, текстовые данные или пропуски, которые означали, что информация отсутствует. Поэтому ко всем использованным данным сначала была применена проверка, и, если необходимо, приведение к корректному типу и фильтрация по верхним или нижним значениям.
Сортировка или группировка, если это нужно для задачи.
Дополнительные настройки в тех задачах, где необходимо.
Далее — построение основы графика.
И подробная настройка внешнего вида графика — фон, оси, метки, значения, заливка и другая стилизация.
Визуализация
Топ-10 районов Москвы с наибольшим количеством исторической застройки. Гистограмма
Гистограмма показывает топ-10 районов Москвы с наибольшим количеством зданий, построенных ранее 1900 года, так легко определить районы с интересным архитектурным наследием и узнать, где больше всего исторических жилых домов. На графике видно, что в Басманном районе примерно в 2 раза больше старых жилых домов, чем даже в Тверском. И действительно, в Басманном районе находится дом Ярошенко, построенный в середине 17 века, это старейший жилой дом Москвы!
Распределение домов по годам постройки. Гистограмма
На гистограмме можно увидеть, что есть значительный рост, начинающийся в послевоенные годы, когда экономика восстанавливалась, и около 1960 года, что совпало с реформой жилищного строительства и появлением «первой массовой серии» жилых домов, хрущевок.
Зависимость количества подъездов от общей площади. Точечная диаграмма
Количество подъездов увеличивается пропорционально общей площади помещений дома.
Средняя этажность по годам постройки. Линейный график
В распределении этажности по годам можно увидеть небольшие колебания (практически стабильность) до 1950-х годов и значительный рост во время советских жилищных реформ и массового строительства.
Описание применения генеративной модели
Для работы были использованы изображения, сгенерированные в Midjourney, чтобы подобрать референсы и проиллюстрировать тему исследования.
Промпты: night luminous window, illustration, black background --sref https://s.mj.run/MIwF33AsAxc --ar 1240:1773 night luminous window, illustration, black background --sref https://s.mj.run/MIwF33AsAxc --ar 7:3
Ссылка на модель: https://www.midjourney.com
Список источников
[1] Выгрузка данных с «Реформы ЖКХ» 1–2 августа 2021. (URL: https://hubofdata.ru/dataset/mos_buildings_reformagkh_2021/resource/36beca8a-d5b4-4ad7-aab3-d6424ac97cf5) Просмотрено: 20.06.2024.




