

Логотип
Вступление
Для проекта я выбрала датасет Spotify с платформы Hugging Face, содержащий информацию о треках, жанрах, популярности и аудио-фичах (танцевальность, энергия, valence, темп и др.).
Мне было интересно посмотреть, какие жанры самые популярные, как характеристики песен (танцевальность, энергия, настроение) влияют на популярность треков, и есть ли закономерности между ними.
Этапы работы
Сначала я подключила библиотеки. Нам понадобятся pandas для работы с таблицами, matplotlib и seaborn для графиков. Также я сразу настроила стиль графиков и цветовую палитру, чтобы они выглядели красиво и удобно для восприятия.
Загрузила данные. Я скачала CSV прямо из Hugging Face и посмотрела на первые строки, чтобы понять, что в датасете есть и какие колонки нам пригодятся.

Нам нужны только строки, где есть жанр, популярность и аудио-фичи. Всё остальное убрали, чтобы анализ был корректным.
черновик
Для создания визуальной стилистики графиков я использовала предложенный ранее код с кастомной палитрой неоновых цветов. Для «переклички» с тематикой Spotify я заменила красный цвет на зелёный, чтобы графики выглядели более гармонично с концепцией музыкальной платформы. Остальные цвета оставила без изменений.
Графики 3 и 4 получились очень яркими и динамичными и напоминают дискотеку, поэтому их оставила в исходном виде без корректировок.
Цветовое решение
Пастельные и зеленый
Итоговые графики
Топ-10 жанров по средней популярности
Этот график показывает, какие музыкальные жанры в среднем популярнее всего на Spotify. Можно увидеть, какие жанры чаще попадают в чарты и собирают больше прослушиваний.
Распределение энергии по топ-10 жанрам
Boxplot показывает разброс значений энергии треков для каждого жанра. Высокая энергия означает более динамичные, активные треки, низкая спокойные или мягкие.
Танцевальность vs популярность
Scatterplot показывает связь между танцевальностью трека и его популярностью. Можно заметить, что треки с более высокой танцевальностью часто популярнее, но есть исключения.
Valence vs популярность
Valence показывает эмоциональную окраску трека (от грустного до веселого). График помогает понять, какие настроения треков чаще популярны.
Заключение
В рамках проекта я провела детальный анализ данных треков Spotify. Работа включала несколько ключевых этапов: загрузка, статистический анализ и визуализация с помощью графиков.
По итогам анализа можно выделить несколько закономерностей:
1. Популярность жанров: Топ 10 жанров по средней популярности показали, что определённые музыкальные направления стабильно привлекают больше слушателей. Например, жанры с более высокой танцевальностью и энергией чаще занимают лидирующие позиции.
2. Распределение аудио-фич: График распределения энергии по топ-10 жанрам выявил, что жанры с высоким показателем энергии имеют более широкое разнообразие треков, тогда как менее энергичные жанры демонстрируют более стабильные значения.
3. Связь танцевальности и популярности: График рассеяния показал, что высокая танцевальность треков часто коррелирует с большей популярностью, но существуют и исключения — треки с невысокой танцевальностью могут быть популярны благодаря известным артистам или трендовости.
4. Связь Valence и популярности: Аналогично, график Valence vs популярность показал, что «радостные» треки (с высоким valence) не всегда самые популярные, однако для определённых жанров позитивная энергетика трека способствует росту популярности.
Итоговые графики демонстрируют, что популярность трека зависит не только от одной аудио — фичи, а от сочетания характеристик и жанровой принадлежности. Данные подтверждают: даже треки с умеренной танцевальностью или valence могут стать популярными, если они попадают в любимые жанры слушателей.
Использованные инструменты и генеративные модели
1. Gemini — исправление ошибок в кодах, анализ графиков
2. Google Collab — работа с датасетом, создание графиков
Описание применения генеративной модели
Для работы были использованы изображения, сгенерированные в krea.ai, чтобы подобрать референсы и проиллюстрировать тему исследования.