Вводная часть
Для анализа я выбрал набор данных о персонажах в НРИ Dungeons&Dragons 5E, найденный на сайте Kaggle. Данные взяты с самого популярного инструмента, который используют для создания и хранения персонажей игроки, и D&D 5 редакции является самой популярной НРИ в истории. Как геймдизайнер, заинтересованный в НРИ, мне стало интересно составить впечатление об игроках по этим данным.
Интерфейс сайта D&D Beyond, с которого взяты данные
Основное, что меня интересовало — это частота появления определенных вещей и соотношения разных черт персонажей, например, рас и классов. Типы графиков были выбраны соответственно этому.
Этапы работы
Я открыл Jupyter notebook и, с некоторой помощью ChatGPT, написал код.
Начало ноутбука в Юпитере
Как можно увидеть, для теста я вывел самые популярные имена для персонажей. Так как D&D Beyond прост в использовании и игроки любят придумывать новых персонажей, в топ-5 вошли «Test» и 'test'. На втором месте было имя «Bob», что тоже просто объяснить — это короткое, немного забавное имя, которое просто вписать, когда не можешь ничего придумать. Имена «Varis» и «Rhogar» предположительно являются рандомными именами, которые дает персонажам D&D Beyond.
Пример промпта для ChatGPT
Так как счет шел в сотнях тысяч, стилизовать графики просто выписав данные в сторонние программы оказалось невозможным. Так что я привел их к единому стилю используя встроенные возможности matplotlib: Просто покрасил в фирменный для D&D красный.
Графики
Увидев колонку «inventory», я захотел узнать, какие предметы чаще всего встречаются. Список предметов в инвентаре персонажа подавался разделенным с помощью слэша. Я разделил все инвентари на отдельные предметы и вывел топ-20. Первые места не очень интересны: это просто предметы из набора, который получает каждый персонаж на 1 уровне. Далее можно увидеть самое популярное оружие, тоже из того списка, что можно получить на 1 уровне. Для сравнения я нашел количество зелий лечения — 70622 и бездонных волшебных сумок — 43493. Это самые популярные волшбеные предметы, которые можно получить за деньги или квесты во время игры. По сравнению с сотнями тысяч стартовых предметов, можно понять, что большинство игроков или так и не доходят до игры, или и не пытаются, а просто делают персонажей, потому что это весело.
Далее я вывел матрицу корреляции между классом и расой персонажа. Самой частой комбинацией стал человек-воин, что не удивительно. У эльфов самый популярный класс — следопыт, скорее всего, из-за ассоциации с эльфами Толкиена и Леголасом в частности. Матрица показала именно то, что я ожидал: ловкие полурослики — плуты, харизматичные полуэльфы — барды и сильные полуорки — варвары.
У характеристик в игре есть всем известные названия, но в данных они назывались stats_1 — stats_6. Я предположил, что порядок такой же, как в классическом листе персонажа, и чтобы проверить вывел два примера. На первом линейном графике — частота значений stats_1 (предположительно сила) у класса Воина, а на втором stats_4 (интеллект). Мои предположения оказались правильными — можно увидеть, что характеристика силы у воинов чаще всего 14-16, а характеристика интеллекта 8-10.
1 — сила, 2 — ловкость, 3- телосложение, 4-интеллект, 5 — мудрость, 6- харизма.
Наконец, я вывел сложенный график частоты значений характеристик. Он ограничен 5 самыми часто встречающимися числами. Разброс, учитывая количество данных, не слишком большой — это значит, что все классы достаточно популярны, так как разные классы требуют хороших значений в разных характеристиках. Выделяется stats_3 — это телосложение, и оно так популярно из-за того, что от него зависит количество очков здоровья персонажа. Иметь высокое телосложение полезно вне зависимости от класса и расы.
Блокнот и датасет
Описание применения генеративной модели
https://chatgpt.com/ ChatGPT 4.0 использовался для решения ошибок кода и подбора правильного вида графиков для визуализации данных.




