Original size 669x892

Анализ рынка бриллиантов

PROTECT STATUS: not protected

Послушайте: ведь если добывают алмазы Значит, на кольца с камнями есть спрос!

О проекте

Бриллианты, пожалуй, самые популярные камни для обручальных колец и в целом всевозможных украшений.

В поисках датасета для исследования я наткнулась на этот, содержащий информацию о десятках тысяч бриллиантов и заинтересовалась.

Насколько сильно рынок полон качественных или не качественных образцов? Насколько сильно цена отражает реальную ценность бриллианта? Насколько редкими являются чистые камни?

Для оформления я выбрала приглушённые синеватые цвета, отражающие холодность бриллиантов

В качестве шрифта я выбрала строгий, классический, утончённый, как бриллианты шрифт — Oranienbaum.

big
Original size 3452x400

#E5E5E5, #CDCCCF, #A8A6AD, #8B8992, #78757F, #67656F, #5D5B67, #514F5A

Работа с данными

Перед началом работы непосредственно с графиками нужно было импортировать Pandas и другие библиотеки, необходимые для работы

big
Original size 1170x160

График № 1

Первый график — линейная диаграмма, показывающая количество и отношение бриллиантов разного цвета. Как раз тех самых которые я выбрала для оформления. У каждого оттенка есть своя буква, и чтобы было понятно «хорошая» эта буква или «плохая», я решила добавить небольшую легенду сразу на график.

На самом деле градаций цветов намного больше, целых 23, однако в выбранном мной датасете не было данных о бриллиантах более низкого качества чем «J». Поэтому в легенде всего 2 градации: бесцветный и близко к бесцветному.

0

На этом графике видно, что на самом деле идеальных бесцветных бриллиантов не так-то много, они занимают всего лишь пятое место в списке. Самое же большое количество бриллиантов цвета G — самая середина. Уже не абсолютно бесцветные, но ещё не грязно жёлтые.

Также радует, что самых жёлтых бриллиантов всё же меньше всего.

График № 2

Вторым графиком я выбрала круговую диаграмму, на которой хорошо было бы видно отношение количества бриллиантов огранки разного качества.

В этот раз не требовалось добавление легенды, так как обозначения сразу понятны.

0

На круговой диаграмме хорошо видно какую часть всех бриллиантов занимают идеальные, а сколько среднего качества.

В целом, можно сказать, что больше половины бриллиантов имеют отличную огранку, и лишь примерно 12% более низкого качества.

График № 3

Далее я решила сделать точечный график, который бы отражал отношение стоимости бриллианта от карат.

Однако при первой попытке построить график, стало понятно что данных в датасете слишком много и при визуализации они превращаются в кашу.

Очевидно нужно было как-либо отсортировать и ограничить данные. В итоге я решила взять нижние 7000 и верхние 2000 значений, сделав 2 отдельных графика.

0

Сам код для двух графиков отличается одной строчкой, которая и берёт 7000 верхних или 2000 нижних значений.

diamonds = pd.read_csv («diamonds.csv», sep = «,»).sort_values (by = 'price').head (7000) или diamonds = pd.read_csv («diamonds.csv», sep = «,»).sort_values (by = 'price').tail (2000)

Original size 1500x600

Несмотря на то, что на графике мы не видим абсолютно все значения, общая тенденция всё равно видна: цена не напрямую зависит от значения карат. Бриллиант в 2 карата можно купить как за 14, так и практически за 19 тысяч, а пятикаратный бриллиант может стоить дешевле камня в 1 карат.

График № 4

Последним графиком стала гистограмма, с помощью которой решила отобразить количество чистых и не чистых бриллиантов.

Для неё, как в первой линейной диаграмме понадобилась легенда, так как специальные обозначения не понятны без дополнительного объяснения.

0

Тут мы видим насколько мало действительно чистых бриллиантов. Безупречных меньше 1000 (всего в датасете есть информация более чем о 50 тысячах образцов), бриллиантов второго класса также крайне мало. И самыми большими категориями становятся VS2, SI1 и SI2 — самого низкого качества бриллианты с самым большим процентом вкраплений.

Вывод

Анализ данного датасета, пусть и косвенно, позволил увидеть какую большую роль в индустрии бриллиантов играет маркетинг и обработка:

Цена за карат может сильно варьироваться, чистых и качественных бриллиантов крайне мало, большую часть составляют камни среднего или даже низкого качества. Однако ювелиры, которые занимаются огранкой выполняют свою работу отлично, крайне маленький процент бриллиантов можно классифицировать как «среднего» качества образцы.

Получается, анализ и визуализация этих данных открыли новые интересные грани бриллиантовой индустрии.

Original size 3000x1000
Анализ рынка бриллиантов
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more