Original size 1157x1600

HBO: Анализ контента, рейтингов и трендов 2010–2022 годов

PROTECT STATUS: not protected

Концепция

Недавно я пересматривала зарубежный сериал и поняла, что за всё время его просмотра, я смотрела не привычный для меня Netflix, а HBO, и именно это меня сподвигло провести анализ данного сервиса

Палитру я использовала чёрно-белую, вдохновляясь логотипом сервиса — черный текст на белом фоне, и подумала, что стоит сохранить этот минималистичный стиль в анализе

big
Original size 1414x765

Исследование проведено на основе данных с ресурса Kuggle — HBO and HBO Max Content Dataset. Датасет содержит в себе данные о каждом фильме или сериале, который выпустила компания с 2010 до 2022 года: его название, тип, описание, год релиза, жанр, страна производства, IMDb-рейтинг.

Для визуализации данных я выбрала линейный график динамики выпуска контента, показывающий количество выпущенных фильмов и сериалов по годам, круговую диаграмму, показывающую разницу между количествами фильмов и сериалов в процентах, гистограмму для демонстрации оценок IMDb, словесное облако самых популярных жанров и столбчатую диаграмму, показывающую страны производства контента

Использование библиотек

Для работы с датасетом была использована библиотека pandas для работы с CSV-файлом, matplotlib.pyplot для визуализации данных, seaborn для стилизации графиков, wordcloud для создания словесного облака и kagglehub для работы с датасетом

big
Original size 1200x600

Обработка данных

В датасете было значительное количество пропусков, поэтому была произведена обработка данных, чтобы убрать лишние пропуски и также отсортировать данные

Original size 1200x600

Визуализация

На линейном графике мы видим количество выпущенных фильмов и сериалов по годам. Мы можем заметить, что количество выпускаемых фильмов сильно больше сериалов, но к 2022 году произошел их сильный спад

0

Круговая диаграмма демонстрирует нам соотношение фильмов и сериалов: сериалы составляют 32% контента, а фильмы — 68%, что удивляет, ведь многие сериалы HBO обладают огромной популярностью, а фильмы не так сильно на слуху

0

Гистограмма показывает нам распределение рейтингов IMDb для всего контента HBO, из чего можно сделать вывод, что большинство оценок сосредоточено в диапазоне 6.5–7.5

0

Облако слов изображает самые популярные жанры HBO: мы видим, что драма, комедия и драма занимают лидирующие позиции

0

Столбчатая диаграмма показывает нам стран-лидеров по производству контента HBO: США с огромным отрывом занимает первое место

0

Подводя итог, меня удивило, во-первых, то, что фильмы занимают значительную часть контента HBO, хотя я думала, что они вкладываются больше в сериалы, во-вторых рейтинги не самые высокие: 6,5-7,5 — достаточно средний показатель для такого популярного сервиса, а в-третьих — контрастность между жанрами — драма и комедия выпускалась больше всего

Описание применения генеративной модели

Для помощи с кодом был использован DeepSeek (https://chat.deepseek.com/) Обложка leonardo.ai (URL: https://app.leonardo.ai/image-generation) промпт: generate a black and white picture with a laptop on it with black writing on a white background HBO

Блокнот с кодом и датасет: https://drive.google.com/drive/folders/1fTev4e2aezx4qX38BpqBMgj6iubz-3WH

HBO: Анализ контента, рейтингов и трендов 2010–2022 годов
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more