Исходный размер 1240x1750

Визуализация HR-исследований

концепция

ПОИСК > При поиске материалов для визуализации данных с помощью возможностей языка программирования python я воспользовалась онлайн-платформой Kaggle.com, где есть специальный раздел с датасетами для визуализации.

ДАННЫЕ > Для создания проекта я выбрала данные о производительности и удовлетворенности сотрудников (ссылка на исходный датасет). Этот датасет содержал в себе много интересных данных о различных аспектах жизни офисных сотрудников: их возраст, зарплату, дату начала работы, продуктивность, удовлетворенность и фидбэк от других сотрудников.

ВИЗУАЛИЗАЦИЯ >

При анализе датасета у меня получилось 4 графика, в зависимости от видов используемых данных и способа их отношения:

  1. Столбчатый
  2. Линейный
  3. Круговая диаграма
  4. Матрица

Также для графиков был разработан единый стиль с помощью применения цветовой палитры, взятой из библиотеки MatPlotLib, а также с помощью редактирования стилей текста.

ИНСТРУМЕНТЫ > — Библиотеки NumPy, Pandas, Matplotlib — Chat GPT — Leonardo.Ai (для обложки)

предварительная обработка данных

big
Исходный размер 2910x741

Прежде чем приступить к визуализации я привела данные стобца «Joining Date», записанные в формате MON-YY к полной записи года. Месяцы и прочие уточнения даты в моем случае было бы целесообразно убрать, так как в данных числился только январь.

[promt]: «how to apply type of data to all values in column»

Исходный размер 2910x1052

Полученная запись дала возможность заодно рассчитать и добавить столбец о длительности работы в компании для каждого сотрудника.

Исходный размер 2910x858

После проведенных вычислений я закрепила результат, приведя даты к временному значению для дальнейшего построения графиков

[promt]: «how convert integer which represents the year to the actual date, using python pandas»

Исходный размер 2890x542

график#1

Исходный размер 2418x1364
Исходный размер 2884x1054
Исходный размер 2908x577

[promt]: «from this data: newbies_df = df.groupby ('Joining Date').agg ({ 'Joining Date': 'count'}).rename (columns={ 'Joining Date': 'Count of newbies' }) create barplot»

график#2

Исходный размер 2184x1303
Исходный размер 2902x902
Исходный размер 2912x1184

[promt]: «plot a pie chart based on this data: df.groupby ('Department').agg ({ 'Department': 'count'}).rename (columns={ 'Department': 'Count of employees' })», «How can I edit labels and add values for this chart?»

график#3

Исходный размер 2410x1369
Исходный размер 2906x1136
Исходный размер 2912x624

[promt]: «make graphic based on this dataset: df.groupby ('Joining Date').agg ({ 'Joining Date': 'count'}).rename (columns={ 'Joining Date': 'Count of newbies' })», «make this graph more colorful and smooth», «create this diagram with this dataset: salary_by_projects = df.groupby ('Projects Completed')['Salary'].mean ().reset_index ()»

график#4

Исходный размер 2333x1428
Исходный размер 2912x980
Исходный размер 2908x660

[promt]: «with matplotlib create matrices diagram where axis x = Position ('Analyst', 'Intern', 'Junior Developer', 'Manager', 'Senior Developer', 'Team Lead') and y = Gender ('Male', 'Female') It meant to count how much of each gender on every position»

Визуализация HR-исследований
Проект создан 25.09.2024
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше