HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-02-26
1 <p>В этом уроке мы узнаем, что такое точечные диаграммы и какие они бывают. Мы агрегируем данные для точечной диаграммы продаж и прибыли, а также для пузырьковой диаграммы.</p>
1 <p>В этом уроке мы узнаем, что такое точечные диаграммы и какие они бывают. Мы агрегируем данные для точечной диаграммы продаж и прибыли, а также для пузырьковой диаграммы.</p>
2 <p>Точечные диаграммы отличаются тем, что их легко читать, значит, со знаниями о точечных диаграммах вы сможете строить отчеты для широкого круга людей.</p>
2 <p>Точечные диаграммы отличаются тем, что их легко читать, значит, со знаниями о точечных диаграммах вы сможете строить отчеты для широкого круга людей.</p>
3 <h2>Точечная диаграмма</h2>
3 <h2>Точечная диаграмма</h2>
4 <p>Представим, что у нас есть таблица средних продаж и прибыли по категориям товаров:</p>
4 <p>Представим, что у нас есть таблица средних продаж и прибыли по категориям товаров:</p>
5 <p><strong>avg_sales_profit</strong></p>
5 <p><strong>avg_sales_profit</strong></p>
6 <p>В этой таблице мы видим три столбца:</p>
6 <p>В этой таблице мы видим три столбца:</p>
7 <ul><li>sub_category - категория товара</li>
7 <ul><li>sub_category - категория товара</li>
8 <li>avg_sales - средние продажи по категориям товаров</li>
8 <li>avg_sales - средние продажи по категориям товаров</li>
9 <li>avg_profit - средняя прибыль по категориям товаров</li>
9 <li>avg_profit - средняя прибыль по категориям товаров</li>
10 </ul><p>По этой таблице мы хотим выявить взаимосвязь между средними продажами и средней прибылью. Для визуализации этой взаимосвязи хорошо подходят<strong>точечные диаграммы</strong>или<strong>Scatter chart</strong>.</p>
10 </ul><p>По этой таблице мы хотим выявить взаимосвязь между средними продажами и средней прибылью. Для визуализации этой взаимосвязи хорошо подходят<strong>точечные диаграммы</strong>или<strong>Scatter chart</strong>.</p>
11 <p>Посмотрим, как выглядит точечная диаграмма:</p>
11 <p>Посмотрим, как выглядит точечная диаграмма:</p>
12 <p>На точечной диаграмме, которая изображает связь прибыли и продаж, мы видим по горизонтальной оси переменную avg_sales, а по вертикальной - avg_profit.</p>
12 <p>На точечной диаграмме, которая изображает связь прибыли и продаж, мы видим по горизонтальной оси переменную avg_sales, а по вертикальной - avg_profit.</p>
13 <p>Точечные диаграммы используют для отображения отношения двух переменных, например, роста и веса людей или прибыли и продаж. Каждая пара значений двух переменных - это одна точка, где по оси X одна переменная, а по оси Y - вторая.</p>
13 <p>Точечные диаграммы используют для отображения отношения двух переменных, например, роста и веса людей или прибыли и продаж. Каждая пара значений двух переменных - это одна точка, где по оси X одна переменная, а по оси Y - вторая.</p>
14 <p>С помощью точечной диаграммы мы можем выявить, как связаны две переменные, а также определить тенденции и закономерности. Одно из основных преимуществ точечных диаграмм - это легкость в их чтении. Их легко понимают люди, работа которых не связана с данными.</p>
14 <p>С помощью точечной диаграммы мы можем выявить, как связаны две переменные, а также определить тенденции и закономерности. Одно из основных преимуществ точечных диаграмм - это легкость в их чтении. Их легко понимают люди, работа которых не связана с данными.</p>
15 <p>Мы выделим два вида точечных диаграмм:</p>
15 <p>Мы выделим два вида точечных диаграмм:</p>
16 <ol><li>Обычная точечная диаграмма или Scatter chart. Она состоит из точек, координаты которых - это пары значений наших двух переменных</li>
16 <ol><li>Обычная точечная диаграмма или Scatter chart. Она состоит из точек, координаты которых - это пары значений наших двух переменных</li>
17 <li>Пузырьковая диаграмма или Bubble chart. Она состоит из "пузырьков", координаты которых - пары значений наших переменных, а размер пузырька определяется третьей переменной</li>
17 <li>Пузырьковая диаграмма или Bubble chart. Она состоит из "пузырьков", координаты которых - пары значений наших переменных, а размер пузырька определяется третьей переменной</li>
18 </ol><p>Посмотрим, как выглядит пузырьковая диаграмма для продаж и прибыли, где размер пузырька - это количество проданных товаров:</p>
18 </ol><p>Посмотрим, как выглядит пузырьковая диаграмма для продаж и прибыли, где размер пузырька - это количество проданных товаров:</p>
19 <p>На рисунке видно, что взаимосвязь прибыли и продаж такая же, как на точечной диаграмме, но размер пузырька еще зависит от третьей переменной.</p>
19 <p>На рисунке видно, что взаимосвязь прибыли и продаж такая же, как на точечной диаграмме, но размер пузырька еще зависит от третьей переменной.</p>
20 <p>Точечные диаграммы отображают взаимосвязь двух переменных, но это необязательно причинно-следственная связь. Например, если мы решили изобразить связь между ростом и весом разных людей, это не значит, что одна из этих переменных зависит от другой. Такая зависимость может быть, но не всегда.</p>
20 <p>Точечные диаграммы отображают взаимосвязь двух переменных, но это необязательно причинно-следственная связь. Например, если мы решили изобразить связь между ростом и весом разных людей, это не значит, что одна из этих переменных зависит от другой. Такая зависимость может быть, но не всегда.</p>
21 <p>Теперь мы перейдем к практике и агрегируем данные для точечной диаграммы продаж и прибыли.</p>
21 <p>Теперь мы перейдем к практике и агрегируем данные для точечной диаграммы продаж и прибыли.</p>
22 <h2>Агрегация для точечной диаграммы</h2>
22 <h2>Агрегация для точечной диаграммы</h2>
23 <p>Мы будем работать с базой данных<a>scatter_chart</a>. В ней содержится одна таблица sales:</p>
23 <p>Мы будем работать с базой данных<a>scatter_chart</a>. В ней содержится одна таблица sales:</p>
24 <p><strong>Sales</strong></p>
24 <p><strong>Sales</strong></p>
25 <p>В таблице мы видим такие столбцы:</p>
25 <p>В таблице мы видим такие столбцы:</p>
26 <ol><li>order_id - ID заказа</li>
26 <ol><li>order_id - ID заказа</li>
27 <li>order_date - дата заказа</li>
27 <li>order_date - дата заказа</li>
28 <li>ship_date - дата отгрузки товара</li>
28 <li>ship_date - дата отгрузки товара</li>
29 <li>ship_mode - класс отгрузки</li>
29 <li>ship_mode - класс отгрузки</li>
30 <li>customer_id - ID покупателя</li>
30 <li>customer_id - ID покупателя</li>
31 <li>customer_name - имя покупателя</li>
31 <li>customer_name - имя покупателя</li>
32 <li>segment - категория покупателя</li>
32 <li>segment - категория покупателя</li>
33 <li>country - страна</li>
33 <li>country - страна</li>
34 <li>city - город</li>
34 <li>city - город</li>
35 <li>state - штат/округ</li>
35 <li>state - штат/округ</li>
36 <li>postal_code - почтовый индекс</li>
36 <li>postal_code - почтовый индекс</li>
37 <li>region - регион</li>
37 <li>region - регион</li>
38 <li>product_id - ID товара</li>
38 <li>product_id - ID товара</li>
39 <li>category - категория товара</li>
39 <li>category - категория товара</li>
40 <li>sub_category - подкатегория товара</li>
40 <li>sub_category - подкатегория товара</li>
41 <li>product_name - наименование товара</li>
41 <li>product_name - наименование товара</li>
42 <li>sales - сумма продаж по заказу</li>
42 <li>sales - сумма продаж по заказу</li>
43 <li>quantity - количество единиц товара в заказе</li>
43 <li>quantity - количество единиц товара в заказе</li>
44 <li>discount - скидка на заказ</li>
44 <li>discount - скидка на заказ</li>
45 <li>profit - прибыль по заказу</li>
45 <li>profit - прибыль по заказу</li>
46 </ol><p>Мы хотим агрегировать продажи sales и прибыль profit по подкатегориям товаров sub_category, чтобы получить средние продажи и прибыль. Для этого мы используем агрегацию по подкатегориям с помощью GROUP BY и агрегирующую функцию AVG, чтобы вычислить среднее.</p>
46 </ol><p>Мы хотим агрегировать продажи sales и прибыль profit по подкатегориям товаров sub_category, чтобы получить средние продажи и прибыль. Для этого мы используем агрегацию по подкатегориям с помощью GROUP BY и агрегирующую функцию AVG, чтобы вычислить среднее.</p>
47 <p>Напишем такой SQL-запрос:</p>
47 <p>Напишем такой SQL-запрос:</p>
48 <p>С помощью этого запроса мы получили таблицу со средними продажами и прибылью по подкатегориям товаров:</p>
48 <p>С помощью этого запроса мы получили таблицу со средними продажами и прибылью по подкатегориям товаров:</p>
49 <p><strong>avg_sales_profit</strong></p>
49 <p><strong>avg_sales_profit</strong></p>
50 <p><a>Ссылка на таблицу</a></p>
50 <p><a>Ссылка на таблицу</a></p>
51 <p>Скопируем эту таблицу в Google Sheets и построим точечный график. Для этого нужно выбрать тип диаграммы "Точечная диаграмма". Мы получили такую диаграмму:</p>
51 <p>Скопируем эту таблицу в Google Sheets и построим точечный график. Для этого нужно выбрать тип диаграммы "Точечная диаграмма". Мы получили такую диаграмму:</p>
52 <p>На этом графике мы построили взаимосвязь между средней прибылью и продажами. Мы можем видеть, что в среднем чем выше продажи, тем выше прибыль. Однако также мы можем видеть и выбросы.</p>
52 <p>На этом графике мы построили взаимосвязь между средней прибылью и продажами. Мы можем видеть, что в среднем чем выше продажи, тем выше прибыль. Однако также мы можем видеть и выбросы.</p>
53 <p>Теперь попробуем построить пузырьковую диаграмму. В качестве третьей переменной, от которой будет зависеть размер пузырька, мы возьмем quantity - это количество единиц одного товара. Для этого нужно изменить запрос так, чтобы кроме средних продаж и прибыли он выводил и суммарное количество единиц товара:</p>
53 <p>Теперь попробуем построить пузырьковую диаграмму. В качестве третьей переменной, от которой будет зависеть размер пузырька, мы возьмем quantity - это количество единиц одного товара. Для этого нужно изменить запрос так, чтобы кроме средних продаж и прибыли он выводил и суммарное количество единиц товара:</p>
54 <p>В результате мы получили новую таблицу:</p>
54 <p>В результате мы получили новую таблицу:</p>
55 <p><strong>SalesProfitQuantity</strong></p>
55 <p><strong>SalesProfitQuantity</strong></p>
56 <p><a>Ссылка на таблицу</a></p>
56 <p><a>Ссылка на таблицу</a></p>
57 <p>В этой таблице четыре столбца:</p>
57 <p>В этой таблице четыре столбца:</p>
58 <ul><li>sub_category - подкатегория товаров</li>
58 <ul><li>sub_category - подкатегория товаров</li>
59 <li>avg_sales - средние продажи для подкатегории товаров</li>
59 <li>avg_sales - средние продажи для подкатегории товаров</li>
60 <li>avg_profit - средняя прибыль для подкатегории товаров</li>
60 <li>avg_profit - средняя прибыль для подкатегории товаров</li>
61 <li>sum_quantity - суммарное количество всех проданных товаров по одной подкатегории</li>
61 <li>sum_quantity - суммарное количество всех проданных товаров по одной подкатегории</li>
62 </ul><p>Теперь скопируем эту таблицу в Google Sheets и построим диаграмму. В качестве типа выберем "Пузырьковая диаграмма". В настройках в поле "Размер" выберем параметр sum_quantity. И отключим легенду в "Дополнительные" -&gt; "Легенда" -&gt; "Расположение" -&gt; "Не выбрано". Новая диаграмма будет выглядеть так:</p>
62 </ul><p>Теперь скопируем эту таблицу в Google Sheets и построим диаграмму. В качестве типа выберем "Пузырьковая диаграмма". В настройках в поле "Размер" выберем параметр sum_quantity. И отключим легенду в "Дополнительные" -&gt; "Легенда" -&gt; "Расположение" -&gt; "Не выбрано". Новая диаграмма будет выглядеть так:</p>
63 <p>Мы построили пузырьковую диаграмму продаж и прибыли. Размер пузырька определяется суммарным количеством проданных товаров в одной подкатегории. Если мы видим, что продажи и прибыль большие, а размер пузырька маленький, то товары в этой подкатегории дорогостоящие.</p>
63 <p>Мы построили пузырьковую диаграмму продаж и прибыли. Размер пузырька определяется суммарным количеством проданных товаров в одной подкатегории. Если мы видим, что продажи и прибыль большие, а размер пузырька маленький, то товары в этой подкатегории дорогостоящие.</p>
64 <h2>Выводы</h2>
64 <h2>Выводы</h2>
65 <p>В этом уроке мы рассмотрели точечную диаграмму и ее разновидность - пузырьковую диаграмму. Мы разобрали особенности каждого типа диаграмм, агрегировали данные для точечной и пузырьковой диаграмм и построили их.</p>
65 <p>В этом уроке мы рассмотрели точечную диаграмму и ее разновидность - пузырьковую диаграмму. Мы разобрали особенности каждого типа диаграмм, агрегировали данные для точечной и пузырьковой диаграмм и построили их.</p>
66 <p>Точечные диаграммы позволяют выявлять тенденции и закономерности в данных, искать выбросы, а также их легко читать. Точечные диаграммы могут стать незаменимым инструментом в работе дата аналитиком.</p>
66 <p>Точечные диаграммы позволяют выявлять тенденции и закономерности в данных, искать выбросы, а также их легко читать. Точечные диаграммы могут стать незаменимым инструментом в работе дата аналитиком.</p>