Исходный размер 795x1118

Анализ данных FitBit Fitness Tracker Data

PROTECT STATUS: not protected
13

Описание

Был выбран набор данных, созданный респондентами распределенного опроса через Amazon. Механический турок в период с 03.12.2016 по 05.12.2016. Тридцать соответствующих критериям пользователей Fitbit дал согласие на отправку персональных данных трекера, в том числе поминутных выход для физической активности, частоты сердечных сокращений и мониторинга сна. Индивидуальный отчеты можно анализировать по идентификатору сеанса экспорта (столбец A) или метке времени (столбец B). Разница между выходными данными отражает использование различных типов трекеров Fitbit. и индивидуальное отслеживание поведения/предпочтений.

Выбранный для анализа на сайте https://www.kaggle.com/ датасет:

Ссылка: https://www.kaggle.com/datasets/arashnic/fitbit

big
Исходный размер 2080x1016

Краткое описание изменений в проекте:

В ходе выполнения проекта я работала с данными, полученными с фитнес-браслетов. Основная цель заключалась в том, чтобы провести полноценный анализ и построить линейную модель, строго следуя критериям, предъявляемым к проекту.

Подготовка данных:

• Был выбран файл с дневной активностью, поскольку он содержит все необходимые для анализа признаки: количество шагов, калории, минуты активности и т. д. • Далее преобразовали формат даты и добавили новый признак: день недели (это наш категориальный признак). • Провела проверку на пропущенные значения — их не оказалось.

Данные брала с сайта-трекера: https://www.kaggle.com/datasets/arashnic/fitbit

документ с материалами, кодами

https://colab.research.google.com/drive/1Ob65nTvwbFkdfIvMz7hXzHLHSleZcd8S?usp=sharing

Исходный размер 1922x870
0
Исходный размер 1964x874

Фильтрация и сортировка:

• Были отфильтрованы пользователи, проходившие более 15 000 шагов в день, и проанализированы их калории. • Провела фильтрацию по двум условиям одновременно: количество шагов больше 12 000 и при этом меньше 800 минут сидячей активности. Это помогло сравнить разные стили поведения. • Для каждого случая выстроены графики

Исходный размер 1904x374
0
Исходный размер 1792x274
Исходный размер 1814x1100
Исходный размер 1914x388
0
Исходный размер 1814x366
Исходный размер 1936x1134

Создание новых признаков:

• Добавила признак «уровень активности» по количеству шагов (низкий, средний, высокий). • Создала признак, который показывает, сколько калорий тратится в среднем на 1000 шагов. Это позволило оценить эффективность.

Исходный размер 1912x500
Исходный размер 1850x392
Исходный размер 1838x558
Исходный размер 1924x978
Исходный размер 1880x524
Исходный размер 1858x398
Исходный размер 1870x354
Исходный размер 1918x1146

Сводные таблицы:

• Построила пять разных сводных таблиц, как требуется по критериям: с одной и несколькими группировками, одним и несколькими агрегатами, с разными методами (среднее, максимум и т. д.). • Каждую таблицу визуализировали.

Исходный размер 1870x446
Исходный размер 1842x500
0

Работа с выбросами:

Исходный размер 1972x1208

• Сначала произвела очистку данных по признаку «калории» с помощью метода 3 стандартных отклонений.

Исходный размер 1854x356
Исходный размер 1834x396
0
Исходный размер 1960x1120
Исходный размер 1844x360
Исходный размер 1832x284
Исходный размер 1844x368
Исходный размер 1890x1150

• Затем была произведена очистка по признаку «шаги» с помощью метода межквартильного размаха.

• Далее все расчёты и построения делались уже на очищенных данных.

Исходный размер 1850x320
Исходный размер 1854x502
0
Исходный размер 1998x1150

Описательные статистики:

• Посчитала среднее, медиану, все квартильные значения, размах, дисперсию и стандартное отклонение по калориям. • Построила гистограммы и диаграммы для наглядности. • Также посчитала моду (самое частое значение) и количество уникальных значений для категориального признака — дня недели.

Исходный размер 1868x378
Исходный размер 1826x438
Исходный размер 1842x482
Исходный размер 1942x1024
Исходный размер 1864x646
Исходный размер 1868x432
Исходный размер 1892x1126
Исходный размер 1870x600
Исходный размер 1860x332
Исходный размер 1952x1146
Исходный размер 1872x378
Исходный размер 1828x970
0
Исходный размер 1878x1012
Исходный размер 1856x936
Исходный размер 1882x1104
Исходный размер 1846x944
Исходный размер 1834x440
Исходный размер 1846x988
Исходный размер 1828x684
Исходный размер 1854x448
Исходный размер 1868x524

Корреляция:

• Вычислялись коэффициенты корреляции между всеми числовыми признаками. • Визуализация в виде тепловой карты. • Выделила два признака с самой сильной связью и построила по ним график разброса.

Исходный размер 2172x1090
Исходный размер 2168x864
Исходный размер 2016x1018
Исходный размер 2182x1124

Линейная регрессия:

• Была сформулирована задача: можно ли по количеству шагов предсказать количество сожжённых калорий. • Построила уравнение линейной зависимости. • Нарисовала прямую регрессии на графике и рассчитала метрики качества: точность, среднюю ошибку, и среднеквадратичное отклонение.

Исходный размер 2098x590
Исходный размер 2044x842
Исходный размер 2044x562
Исходный размер 2138x1126
Исходный размер 2044x640

Итог работы:

Проект выполнен строго по всем требованиям. Все этапы проанализированы, графики построены, выводы сделаны. Использовались только корректные, очищенные данные. Визуализация помогает лучше понять поведение пользователей и эффективность их активности.

Исходный размер 2322x698

Ссылка на генерацию обложки: https://app.leonardo.ai/image-generation

Анализ данных FitBit Fitness Tracker Data
13
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше