Original size 1344x1882

Анализ данных на тему «Student depression»

PROTECT STATUS: not protected

Концепция

Я решила сделать проект именно на эту тему, так как в последнее время наблюдается рост уровня депрессии среди студентов. Это связано с высоким уровнем академической нагрузки, финансовыми трудностями, социальным давлением и другими факторами. Анализ данной проблемы поможет выявить основные причины и разработать меры для их устранения.

Также депрессия негативно сказывается на успеваемости студентов, их мотивации и общем качестве жизни. Анализ данных на тему студенческой депрессии может помочь в разработке программ профилактики и раннего выявления симптомов. Это особенно важно, так как многие студенты не обращаются за помощью из-за стигматизации психических расстройств.

Студенты — это будущее общества, и их психическое здоровье напрямую влияет на их способность вносить вклад в развитие общества. Исследование депрессии среди студентов может способствовать созданию более здоровой и продуктивной образовательной среды.

В работе был выбран датасет Student Depression. Датасет включает в себя такие характеристики, как демографическая информация (возраст, пол, город), академическая успеваемость (средний балл), образ жизни (режим сна, физическая активность), история психического здоровья и ответы на стандартизированные шкалы депрессии.

В данном файле проанализированы следующие показатели среди студентов:

-Частота депрессии у студентов в зависимости от пола; -Влияние сна на наличие депрессии; -Депрессия по городам; -Зависимость среднего балла от статуса занятости и типа работы. -Также была построена тепловая карта корреляции.

0. Importing a dataset

big
Original size 1796x518

Установка последней версии датасета о депрессии у студентов с Kaggle

big
Original size 656x188

Импорт необходимых библиотек и настройка стиля графиков на ggplot

0

Чтение CSV-файла с помощью pandas и отображение первых 5 строк в датафрейме

1. Frequency of depression among students by gender

Original size 1286x490

Настройка размера графика и отображения распределения количества людей с депрессией среди женщин и мужчин

Original size 1096x270

Визуализация датафрейма df_deperssion через столбчатую диаграмму

Original size 584x496

По графику видно, что изначальные данные содержат больше информации о мужчинах, поэтому и людей с депрессией среди них больше, как и людей без депрессии.

Original size 1612x912

Так мы можем найти, на сколько процентов больше людей с депрессией среди женщин и мужчин.

Можно заметить, что доля депрессии у мужчин и женщин при разном количестве людей почти одинаковая.

2. Impact of sleep on depression

Original size 1450x594

Группировка столбцов Sleep Duration и Depression. Проверка, влияет ли количество сна на депрессию у людей

Original size 1932x372

Визуализация в виде линейного графика с двумя линиями

Original size 1018x552

Из графика видно, что больше всегда страдают от депрессии люди, сон которых длится 5 часов и меньше. Также видно, что люди, которые спали больше 8 часов, одинаково страдают и не страдают от депрессии

3. Depression in cities

1. Фильтрация только тех людей, у которых есть депрессия. Группировка по городам — сколько людей с депрессией в каждом городе. 2. Сортировка таких «депрессивных» городов по убыванию.

Original size 964x306

Визуализация с помощью горизонтальной столбчатой диаграммы, сколько людей находятся в депрессии во всех городах из датасета

Original size 1091x860

Можем заметить, что топ-3 города с депрессией из датасета: Kalyan, Hyderabad, Srinagar.

4. Dependence of CGPA on employment status and job type

0
Original size 1048x1234

Группировка по профессиям — какая профессия какой в среднем имеет средний балл

Original size 870x158

Визуализация выполнена в виде круговой диаграммы

Original size 650x389

Видно, что, в целом, профессия не влияет на средний балл, но у профессий UX/UI Designer средний балл выше всех.

5. Correlation Heatmap

Original size 2562x686

Выборка только необходимых столбцов с числовыми значениями для корреляции.

post

Построение тепловой карты корреляций между числовыми столбцами. Цветовые показатели указаны справа. 1 говорит об идеальной прямой пропорциональности между двумя столбцами. -1 говорит об обратной пропорциональности. 0 говорит об отсутствии связи.

Тепловая карта показывает также и числовые значения до 2 знаков после запятой.

Original size 632x536

Можно заметить, что есть сильная положительная связь между столбцами Job Satisfaction и Work Pressure.

*для генерации обложки я использовала нейросеть «Ideogram» Промт: make a cover for a project on the topic «student depression»

Анализ данных на тему «Student depression»
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more