0 added
0 removed
Original
2026-01-01
Modified
2026-02-26
1
<p>В этом уроке мы узнаем, что такое точечные диаграммы и какие они бывают. Мы агрегируем данные для точечной диаграммы продаж и прибыли, а также для пузырьковой диаграммы.</p>
1
<p>В этом уроке мы узнаем, что такое точечные диаграммы и какие они бывают. Мы агрегируем данные для точечной диаграммы продаж и прибыли, а также для пузырьковой диаграммы.</p>
2
<p>Точечные диаграммы отличаются тем, что их легко читать, значит, со знаниями о точечных диаграммах вы сможете строить отчеты для широкого круга людей.</p>
2
<p>Точечные диаграммы отличаются тем, что их легко читать, значит, со знаниями о точечных диаграммах вы сможете строить отчеты для широкого круга людей.</p>
3
<h2>Точечная диаграмма</h2>
3
<h2>Точечная диаграмма</h2>
4
<p>Представим, что у нас есть таблица средних продаж и прибыли по категориям товаров:</p>
4
<p>Представим, что у нас есть таблица средних продаж и прибыли по категориям товаров:</p>
5
<p><strong>avg_sales_profit</strong></p>
5
<p><strong>avg_sales_profit</strong></p>
6
<p>В этой таблице мы видим три столбца:</p>
6
<p>В этой таблице мы видим три столбца:</p>
7
<ul><li>sub_category - категория товара</li>
7
<ul><li>sub_category - категория товара</li>
8
<li>avg_sales - средние продажи по категориям товаров</li>
8
<li>avg_sales - средние продажи по категориям товаров</li>
9
<li>avg_profit - средняя прибыль по категориям товаров</li>
9
<li>avg_profit - средняя прибыль по категориям товаров</li>
10
</ul><p>По этой таблице мы хотим выявить взаимосвязь между средними продажами и средней прибылью. Для визуализации этой взаимосвязи хорошо подходят<strong>точечные диаграммы</strong>или<strong>Scatter chart</strong>.</p>
10
</ul><p>По этой таблице мы хотим выявить взаимосвязь между средними продажами и средней прибылью. Для визуализации этой взаимосвязи хорошо подходят<strong>точечные диаграммы</strong>или<strong>Scatter chart</strong>.</p>
11
<p>Посмотрим, как выглядит точечная диаграмма:</p>
11
<p>Посмотрим, как выглядит точечная диаграмма:</p>
12
<p>На точечной диаграмме, которая изображает связь прибыли и продаж, мы видим по горизонтальной оси переменную avg_sales, а по вертикальной - avg_profit.</p>
12
<p>На точечной диаграмме, которая изображает связь прибыли и продаж, мы видим по горизонтальной оси переменную avg_sales, а по вертикальной - avg_profit.</p>
13
<p>Точечные диаграммы используют для отображения отношения двух переменных, например, роста и веса людей или прибыли и продаж. Каждая пара значений двух переменных - это одна точка, где по оси X одна переменная, а по оси Y - вторая.</p>
13
<p>Точечные диаграммы используют для отображения отношения двух переменных, например, роста и веса людей или прибыли и продаж. Каждая пара значений двух переменных - это одна точка, где по оси X одна переменная, а по оси Y - вторая.</p>
14
<p>С помощью точечной диаграммы мы можем выявить, как связаны две переменные, а также определить тенденции и закономерности. Одно из основных преимуществ точечных диаграмм - это легкость в их чтении. Их легко понимают люди, работа которых не связана с данными.</p>
14
<p>С помощью точечной диаграммы мы можем выявить, как связаны две переменные, а также определить тенденции и закономерности. Одно из основных преимуществ точечных диаграмм - это легкость в их чтении. Их легко понимают люди, работа которых не связана с данными.</p>
15
<p>Мы выделим два вида точечных диаграмм:</p>
15
<p>Мы выделим два вида точечных диаграмм:</p>
16
<ol><li>Обычная точечная диаграмма или Scatter chart. Она состоит из точек, координаты которых - это пары значений наших двух переменных</li>
16
<ol><li>Обычная точечная диаграмма или Scatter chart. Она состоит из точек, координаты которых - это пары значений наших двух переменных</li>
17
<li>Пузырьковая диаграмма или Bubble chart. Она состоит из "пузырьков", координаты которых - пары значений наших переменных, а размер пузырька определяется третьей переменной</li>
17
<li>Пузырьковая диаграмма или Bubble chart. Она состоит из "пузырьков", координаты которых - пары значений наших переменных, а размер пузырька определяется третьей переменной</li>
18
</ol><p>Посмотрим, как выглядит пузырьковая диаграмма для продаж и прибыли, где размер пузырька - это количество проданных товаров:</p>
18
</ol><p>Посмотрим, как выглядит пузырьковая диаграмма для продаж и прибыли, где размер пузырька - это количество проданных товаров:</p>
19
<p>На рисунке видно, что взаимосвязь прибыли и продаж такая же, как на точечной диаграмме, но размер пузырька еще зависит от третьей переменной.</p>
19
<p>На рисунке видно, что взаимосвязь прибыли и продаж такая же, как на точечной диаграмме, но размер пузырька еще зависит от третьей переменной.</p>
20
<p>Точечные диаграммы отображают взаимосвязь двух переменных, но это необязательно причинно-следственная связь. Например, если мы решили изобразить связь между ростом и весом разных людей, это не значит, что одна из этих переменных зависит от другой. Такая зависимость может быть, но не всегда.</p>
20
<p>Точечные диаграммы отображают взаимосвязь двух переменных, но это необязательно причинно-следственная связь. Например, если мы решили изобразить связь между ростом и весом разных людей, это не значит, что одна из этих переменных зависит от другой. Такая зависимость может быть, но не всегда.</p>
21
<p>Теперь мы перейдем к практике и агрегируем данные для точечной диаграммы продаж и прибыли.</p>
21
<p>Теперь мы перейдем к практике и агрегируем данные для точечной диаграммы продаж и прибыли.</p>
22
<h2>Агрегация для точечной диаграммы</h2>
22
<h2>Агрегация для точечной диаграммы</h2>
23
<p>Мы будем работать с базой данных<a>scatter_chart</a>. В ней содержится одна таблица sales:</p>
23
<p>Мы будем работать с базой данных<a>scatter_chart</a>. В ней содержится одна таблица sales:</p>
24
<p><strong>Sales</strong></p>
24
<p><strong>Sales</strong></p>
25
<p>В таблице мы видим такие столбцы:</p>
25
<p>В таблице мы видим такие столбцы:</p>
26
<ol><li>order_id - ID заказа</li>
26
<ol><li>order_id - ID заказа</li>
27
<li>order_date - дата заказа</li>
27
<li>order_date - дата заказа</li>
28
<li>ship_date - дата отгрузки товара</li>
28
<li>ship_date - дата отгрузки товара</li>
29
<li>ship_mode - класс отгрузки</li>
29
<li>ship_mode - класс отгрузки</li>
30
<li>customer_id - ID покупателя</li>
30
<li>customer_id - ID покупателя</li>
31
<li>customer_name - имя покупателя</li>
31
<li>customer_name - имя покупателя</li>
32
<li>segment - категория покупателя</li>
32
<li>segment - категория покупателя</li>
33
<li>country - страна</li>
33
<li>country - страна</li>
34
<li>city - город</li>
34
<li>city - город</li>
35
<li>state - штат/округ</li>
35
<li>state - штат/округ</li>
36
<li>postal_code - почтовый индекс</li>
36
<li>postal_code - почтовый индекс</li>
37
<li>region - регион</li>
37
<li>region - регион</li>
38
<li>product_id - ID товара</li>
38
<li>product_id - ID товара</li>
39
<li>category - категория товара</li>
39
<li>category - категория товара</li>
40
<li>sub_category - подкатегория товара</li>
40
<li>sub_category - подкатегория товара</li>
41
<li>product_name - наименование товара</li>
41
<li>product_name - наименование товара</li>
42
<li>sales - сумма продаж по заказу</li>
42
<li>sales - сумма продаж по заказу</li>
43
<li>quantity - количество единиц товара в заказе</li>
43
<li>quantity - количество единиц товара в заказе</li>
44
<li>discount - скидка на заказ</li>
44
<li>discount - скидка на заказ</li>
45
<li>profit - прибыль по заказу</li>
45
<li>profit - прибыль по заказу</li>
46
</ol><p>Мы хотим агрегировать продажи sales и прибыль profit по подкатегориям товаров sub_category, чтобы получить средние продажи и прибыль. Для этого мы используем агрегацию по подкатегориям с помощью GROUP BY и агрегирующую функцию AVG, чтобы вычислить среднее.</p>
46
</ol><p>Мы хотим агрегировать продажи sales и прибыль profit по подкатегориям товаров sub_category, чтобы получить средние продажи и прибыль. Для этого мы используем агрегацию по подкатегориям с помощью GROUP BY и агрегирующую функцию AVG, чтобы вычислить среднее.</p>
47
<p>Напишем такой SQL-запрос:</p>
47
<p>Напишем такой SQL-запрос:</p>
48
<p>С помощью этого запроса мы получили таблицу со средними продажами и прибылью по подкатегориям товаров:</p>
48
<p>С помощью этого запроса мы получили таблицу со средними продажами и прибылью по подкатегориям товаров:</p>
49
<p><strong>avg_sales_profit</strong></p>
49
<p><strong>avg_sales_profit</strong></p>
50
<p><a>Ссылка на таблицу</a></p>
50
<p><a>Ссылка на таблицу</a></p>
51
<p>Скопируем эту таблицу в Google Sheets и построим точечный график. Для этого нужно выбрать тип диаграммы "Точечная диаграмма". Мы получили такую диаграмму:</p>
51
<p>Скопируем эту таблицу в Google Sheets и построим точечный график. Для этого нужно выбрать тип диаграммы "Точечная диаграмма". Мы получили такую диаграмму:</p>
52
<p>На этом графике мы построили взаимосвязь между средней прибылью и продажами. Мы можем видеть, что в среднем чем выше продажи, тем выше прибыль. Однако также мы можем видеть и выбросы.</p>
52
<p>На этом графике мы построили взаимосвязь между средней прибылью и продажами. Мы можем видеть, что в среднем чем выше продажи, тем выше прибыль. Однако также мы можем видеть и выбросы.</p>
53
<p>Теперь попробуем построить пузырьковую диаграмму. В качестве третьей переменной, от которой будет зависеть размер пузырька, мы возьмем quantity - это количество единиц одного товара. Для этого нужно изменить запрос так, чтобы кроме средних продаж и прибыли он выводил и суммарное количество единиц товара:</p>
53
<p>Теперь попробуем построить пузырьковую диаграмму. В качестве третьей переменной, от которой будет зависеть размер пузырька, мы возьмем quantity - это количество единиц одного товара. Для этого нужно изменить запрос так, чтобы кроме средних продаж и прибыли он выводил и суммарное количество единиц товара:</p>
54
<p>В результате мы получили новую таблицу:</p>
54
<p>В результате мы получили новую таблицу:</p>
55
<p><strong>SalesProfitQuantity</strong></p>
55
<p><strong>SalesProfitQuantity</strong></p>
56
<p><a>Ссылка на таблицу</a></p>
56
<p><a>Ссылка на таблицу</a></p>
57
<p>В этой таблице четыре столбца:</p>
57
<p>В этой таблице четыре столбца:</p>
58
<ul><li>sub_category - подкатегория товаров</li>
58
<ul><li>sub_category - подкатегория товаров</li>
59
<li>avg_sales - средние продажи для подкатегории товаров</li>
59
<li>avg_sales - средние продажи для подкатегории товаров</li>
60
<li>avg_profit - средняя прибыль для подкатегории товаров</li>
60
<li>avg_profit - средняя прибыль для подкатегории товаров</li>
61
<li>sum_quantity - суммарное количество всех проданных товаров по одной подкатегории</li>
61
<li>sum_quantity - суммарное количество всех проданных товаров по одной подкатегории</li>
62
</ul><p>Теперь скопируем эту таблицу в Google Sheets и построим диаграмму. В качестве типа выберем "Пузырьковая диаграмма". В настройках в поле "Размер" выберем параметр sum_quantity. И отключим легенду в "Дополнительные" -> "Легенда" -> "Расположение" -> "Не выбрано". Новая диаграмма будет выглядеть так:</p>
62
</ul><p>Теперь скопируем эту таблицу в Google Sheets и построим диаграмму. В качестве типа выберем "Пузырьковая диаграмма". В настройках в поле "Размер" выберем параметр sum_quantity. И отключим легенду в "Дополнительные" -> "Легенда" -> "Расположение" -> "Не выбрано". Новая диаграмма будет выглядеть так:</p>
63
<p>Мы построили пузырьковую диаграмму продаж и прибыли. Размер пузырька определяется суммарным количеством проданных товаров в одной подкатегории. Если мы видим, что продажи и прибыль большие, а размер пузырька маленький, то товары в этой подкатегории дорогостоящие.</p>
63
<p>Мы построили пузырьковую диаграмму продаж и прибыли. Размер пузырька определяется суммарным количеством проданных товаров в одной подкатегории. Если мы видим, что продажи и прибыль большие, а размер пузырька маленький, то товары в этой подкатегории дорогостоящие.</p>
64
<h2>Выводы</h2>
64
<h2>Выводы</h2>
65
<p>В этом уроке мы рассмотрели точечную диаграмму и ее разновидность - пузырьковую диаграмму. Мы разобрали особенности каждого типа диаграмм, агрегировали данные для точечной и пузырьковой диаграмм и построили их.</p>
65
<p>В этом уроке мы рассмотрели точечную диаграмму и ее разновидность - пузырьковую диаграмму. Мы разобрали особенности каждого типа диаграмм, агрегировали данные для точечной и пузырьковой диаграмм и построили их.</p>
66
<p>Точечные диаграммы позволяют выявлять тенденции и закономерности в данных, искать выбросы, а также их легко читать. Точечные диаграммы могут стать незаменимым инструментом в работе дата аналитиком.</p>
66
<p>Точечные диаграммы позволяют выявлять тенденции и закономерности в данных, искать выбросы, а также их легко читать. Точечные диаграммы могут стать незаменимым инструментом в работе дата аналитиком.</p>