0 added
0 removed
Original
2026-01-01
Modified
2026-02-26
1
<p>В этом уроке мы узнаем, как можно визуализировать таблицы, и рассмотрим основные типы графиков. Часто визуализации наталкивают аналитика на гипотезы, которые он потом проверяет с помощью статистики. С ее помощью можно наглядно видеть зависимости, скрытые в данных. Умение строить графики по таблицам позволят строить информативные и красивые отчеты по данным.</p>
1
<p>В этом уроке мы узнаем, как можно визуализировать таблицы, и рассмотрим основные типы графиков. Часто визуализации наталкивают аналитика на гипотезы, которые он потом проверяет с помощью статистики. С ее помощью можно наглядно видеть зависимости, скрытые в данных. Умение строить графики по таблицам позволят строить информативные и красивые отчеты по данным.</p>
2
<h2>Визуализации</h2>
2
<h2>Визуализации</h2>
3
<p>Представим, что у нас есть витрина данных о продажах и прибыли в магазине за определенный период. Мы посчитали суммарные подневные продажи и прибыль и получили такую таблицу:</p>
3
<p>Представим, что у нас есть витрина данных о продажах и прибыли в магазине за определенный период. Мы посчитали суммарные подневные продажи и прибыль и получили такую таблицу:</p>
4
<p><strong>DailySales</strong></p>
4
<p><strong>DailySales</strong></p>
5
<p>В ней содержатся поля:</p>
5
<p>В ней содержатся поля:</p>
6
<ul><li>order_date - дата заказа</li>
6
<ul><li>order_date - дата заказа</li>
7
<li>sales - суммарные продажи за день</li>
7
<li>sales - суммарные продажи за день</li>
8
<li>profit - суммарная прибыль за день</li>
8
<li>profit - суммарная прибыль за день</li>
9
</ul><p>Эта таблица сама по себе уже представляет отчет: день -> продажи и прибыль за день. Но нам будет проще анализировать данные, если мы построим графики - визуализируем их.</p>
9
</ul><p>Эта таблица сама по себе уже представляет отчет: день -> продажи и прибыль за день. Но нам будет проще анализировать данные, если мы построим графики - визуализируем их.</p>
10
<p>Например, графики помогают понять, какие колебания подневных продаж происходят. Это позволяет упростить анализ данных в таблице с большим количеством строк.</p>
10
<p>Например, графики помогают понять, какие колебания подневных продаж происходят. Это позволяет упростить анализ данных в таблице с большим количеством строк.</p>
11
<p>Перед тем, как разобрать работу с графиками, рассмотрим, с какими типами признаков нам предстоит работать.</p>
11
<p>Перед тем, как разобрать работу с графиками, рассмотрим, с какими типами признаков нам предстоит работать.</p>
12
<h2>Типы признаков</h2>
12
<h2>Типы признаков</h2>
13
<p>Признаки, которые встречаются в данных, бывают разных типов.<strong>Тип</strong>- это характер значения этого признака. В анализе данных мы обычно будем встречаться со следующими типами признаков:</p>
13
<p>Признаки, которые встречаются в данных, бывают разных типов.<strong>Тип</strong>- это характер значения этого признака. В анализе данных мы обычно будем встречаться со следующими типами признаков:</p>
14
<ul><li>Числовые</li>
14
<ul><li>Числовые</li>
15
<li>Категориальные</li>
15
<li>Категориальные</li>
16
</ul><p><strong>Числовые признаки</strong>- это признаки, которые содержат только числа. Например, температуру воздуха мы измеряем в виде числа. В таблице DailySales поля sales и profit - это числовые признаки.</p>
16
</ul><p><strong>Числовые признаки</strong>- это признаки, которые содержат только числа. Например, температуру воздуха мы измеряем в виде числа. В таблице DailySales поля sales и profit - это числовые признаки.</p>
17
<p>Дату и время тоже можно представить в виде числа в формате<strong>timestamp</strong>. Этот показывает количество секунд от полуночи 1 января 1970 года до текущих даты и времени.</p>
17
<p>Дату и время тоже можно представить в виде числа в формате<strong>timestamp</strong>. Этот показывает количество секунд от полуночи 1 января 1970 года до текущих даты и времени.</p>
18
<p><strong>Категориальные признаки</strong>- это наименования или метки. Например, в каталоге с продуктами мы видим категории "Овощи и фрукты", "Заморозка", "Мясо". В этом случае тип признака - категориальный.</p>
18
<p><strong>Категориальные признаки</strong>- это наименования или метки. Например, в каталоге с продуктами мы видим категории "Овощи и фрукты", "Заморозка", "Мясо". В этом случае тип признака - категориальный.</p>
19
<p>Если числовые признаки непрерывны, то есть число может принимать любое значение, то количество категорий всегда конечно. Например, температура воздуха может принимать любое числовое значение. Но количество категорий продуктов в каталоге не бесконечно и их всегда какое-то заранее определенное число.</p>
19
<p>Если числовые признаки непрерывны, то есть число может принимать любое значение, то количество категорий всегда конечно. Например, температура воздуха может принимать любое числовое значение. Но количество категорий продуктов в каталоге не бесконечно и их всегда какое-то заранее определенное число.</p>
20
<p>При этом даже если мы поставим в соответствие каждой категории число, мы не сможем оперировать с ними как с числовыми признаками. Например, мы не можем сравнить, что больше - "Овощи и фрукты" или "Мясо". Но мы можем сравнить температуру воздуха: 15 градусов по Цельсию больше, чем 0 градусов.</p>
20
<p>При этом даже если мы поставим в соответствие каждой категории число, мы не сможем оперировать с ними как с числовыми признаками. Например, мы не можем сравнить, что больше - "Овощи и фрукты" или "Мясо". Но мы можем сравнить температуру воздуха: 15 градусов по Цельсию больше, чем 0 градусов.</p>
21
<p>Рассмотрим агрегированную таблицу с суммарными продажами по отдельным категориям товаров:</p>
21
<p>Рассмотрим агрегированную таблицу с суммарными продажами по отдельным категориям товаров:</p>
22
<p><strong>CategoriesSales</strong></p>
22
<p><strong>CategoriesSales</strong></p>
23
<p>В этой таблице категориальный признак - category, а числовой - sales.</p>
23
<p>В этой таблице категориальный признак - category, а числовой - sales.</p>
24
<p>В основе любого графика лежит примитивная таблица. Примеры таких таблиц - DailySales и CategoriesSales. В таких таблицах каждая строка - это одно значение на графике. Какая-то из колонок будет независимой переменной, а другая или несколько - зависимыми:</p>
24
<p>В основе любого графика лежит примитивная таблица. Примеры таких таблиц - DailySales и CategoriesSales. В таких таблицах каждая строка - это одно значение на графике. Какая-то из колонок будет независимой переменной, а другая или несколько - зависимыми:</p>
25
<ul><li>Независимая переменная - это переменная, которая строится по горизонтальной оси и не зависит от других переменных. Например, если мы строим график зависимости температуры от времени, то время будет независимым показателем</li>
25
<ul><li>Независимая переменная - это переменная, которая строится по горизонтальной оси и не зависит от других переменных. Например, если мы строим график зависимости температуры от времени, то время будет независимым показателем</li>
26
<li>Зависимая переменная - это одна или несколько переменных, которые зависят от других переменных и строятся по вертикальной оси. В примере с температурой и временем, температура будет зависимым показателем, так как она меняется в зависимости от времени</li>
26
<li>Зависимая переменная - это одна или несколько переменных, которые зависят от других переменных и строятся по вертикальной оси. В примере с температурой и временем, температура будет зависимым показателем, так как она меняется в зависимости от времени</li>
27
</ul><p>Допустим, мы хотим построить график продаж по категориям товаров. Категория будет независимым признаком, а продажи - зависимым. Во временном графике продаж и прибыли время будет независимым признаком, а продажи и прибыль - зависимыми.</p>
27
</ul><p>Допустим, мы хотим построить график продаж по категориям товаров. Категория будет независимым признаком, а продажи - зависимым. Во временном графике продаж и прибыли время будет независимым признаком, а продажи и прибыль - зависимыми.</p>
28
<p>Мы будем работать с разными типами графиков. Они по-разному визуализируют информацию и строят зависимости между разными типами признаков: числовой от числового, числовой от категориального.</p>
28
<p>Мы будем работать с разными типами графиков. Они по-разному визуализируют информацию и строят зависимости между разными типами признаков: числовой от числового, числовой от категориального.</p>
29
<p>В этом уроке мы рассмотрим следующие типы графиков:</p>
29
<p>В этом уроке мы рассмотрим следующие типы графиков:</p>
30
<ul><li>Линейный график (linear chart)</li>
30
<ul><li>Линейный график (linear chart)</li>
31
<li>Столбчатая диаграмма (bar chart)</li>
31
<li>Столбчатая диаграмма (bar chart)</li>
32
<li>Круговая диаграмма (pie chart)</li>
32
<li>Круговая диаграмма (pie chart)</li>
33
<li>Точечная диаграмма (scatter chart)</li>
33
<li>Точечная диаграмма (scatter chart)</li>
34
</ul><p>Начнем с линейного графика.</p>
34
</ul><p>Начнем с линейного графика.</p>
35
<h3>Линейный график</h3>
35
<h3>Линейный график</h3>
36
<p>Здесь и дальше мы будем работать в Google Sheets c<a>этой таблицей</a>.</p>
36
<p>Здесь и дальше мы будем работать в Google Sheets c<a>этой таблицей</a>.</p>
37
<p>Посмотрим еще раз на таблицу подневных продаж и прибыли:</p>
37
<p>Посмотрим еще раз на таблицу подневных продаж и прибыли:</p>
38
<p><strong>DailySales</strong></p>
38
<p><strong>DailySales</strong></p>
39
<p><a>ссылка на DB Fiddle</a>с этим датасетом.</p>
39
<p><a>ссылка на DB Fiddle</a>с этим датасетом.</p>
40
<p>Если мы хотим посмотреть, как продажи и прибыль изменялись во времени, то для этого подойдет линейный график.</p>
40
<p>Если мы хотим посмотреть, как продажи и прибыль изменялись во времени, то для этого подойдет линейный график.</p>
41
<p><strong>Линейный график</strong>- это зависимость одного числового признака от времени. Формат timestamp позволяет перевести даты и время в числа, поэтому линейный график - это зависимость числового признака от числового, где независимая переменная - время.</p>
41
<p><strong>Линейный график</strong>- это зависимость одного числового признака от времени. Формат timestamp позволяет перевести даты и время в числа, поэтому линейный график - это зависимость числового признака от числового, где независимая переменная - время.</p>
42
<p>Построим такой график. Для этого в Google Sheets переходим в лист DailySales и видим таблицу с данными:</p>
42
<p>Построим такой график. Для этого в Google Sheets переходим в лист DailySales и видим таблицу с данными:</p>
43
<p>Чтобы построить график, выделим столбцы A:C. Во вкладке "Вставка" найдем "Диаграмма" и вставим диаграмму. В меню справа в "Тип диаграммы" нужно выбрать тип "График":</p>
43
<p>Чтобы построить график, выделим столбцы A:C. Во вкладке "Вставка" найдем "Диаграмма" и вставим диаграмму. В меню справа в "Тип диаграммы" нужно выбрать тип "График":</p>
44
<p>В итоге мы получили линейный график продаж и прибыли в разрезе времени.</p>
44
<p>В итоге мы получили линейный график продаж и прибыли в разрезе времени.</p>
45
<p>Чтобы графики не выглядели однообразно, мы можем менять цвет линии, фона, стиль, толщину линии и другие параметры. Это называется<strong>кастомизацией</strong>- изменение внешнего вида графика под свои нужды. Google Sheets предоставляет возможности видоизменения графиков.</p>
45
<p>Чтобы графики не выглядели однообразно, мы можем менять цвет линии, фона, стиль, толщину линии и другие параметры. Это называется<strong>кастомизацией</strong>- изменение внешнего вида графика под свои нужды. Google Sheets предоставляет возможности видоизменения графиков.</p>
46
<p>Кастомизируем график. Нажмем на его название и впишем "Линейный график продаж и прибыли". Если щелкнуть по самому графику, можно изменить его цвет, стиль линии и другие параметры. Например, можно сделать линию графика profit штриховой и задать толщину линии 4px:</p>
46
<p>Кастомизируем график. Нажмем на его название и впишем "Линейный график продаж и прибыли". Если щелкнуть по самому графику, можно изменить его цвет, стиль линии и другие параметры. Например, можно сделать линию графика profit штриховой и задать толщину линии 4px:</p>
47
<p>Перейдем на вкладку "Стиль диаграммы" и заменим фон на черный. Последовательно щелкнем на все тексты на графике и заменим цвет текста на белый:</p>
47
<p>Перейдем на вкладку "Стиль диаграммы" и заменим фон на черный. Последовательно щелкнем на все тексты на графике и заменим цвет текста на белый:</p>
48
<p>На этом графике мы заменили цвет фона и цвет текста.</p>
48
<p>На этом графике мы заменили цвет фона и цвет текста.</p>
49
<h3>Столбчатая диаграмма</h3>
49
<h3>Столбчатая диаграмма</h3>
50
<p>Рассмотрим вторую таблицу с суммарными продажами по категориям товаров:</p>
50
<p>Рассмотрим вторую таблицу с суммарными продажами по категориям товаров:</p>
51
<p><strong>CategoriesSales</strong></p>
51
<p><strong>CategoriesSales</strong></p>
52
<p>Категории товаров находятся в колонке category, а суммарные продажи - в sales. Мы хотим визуализировать продажи, чтобы было видно, насколько продажи по каждой из категорий отличаются друг от друга. Для этого подходит<strong>столбчатая диаграмма</strong>- зависимость числового признака от категориального.</p>
52
<p>Категории товаров находятся в колонке category, а суммарные продажи - в sales. Мы хотим визуализировать продажи, чтобы было видно, насколько продажи по каждой из категорий отличаются друг от друга. Для этого подходит<strong>столбчатая диаграмма</strong>- зависимость числового признака от категориального.</p>
53
<p>Откроем лист CategoriesSales. Мы видим таблицу продаж в разрезе категорий, которую мы рассмотрели выше. Вставим диаграмму и выберем тип "Столбчатая диаграмма". Изменим заголовок и кастомизируем по своему усмотрению:</p>
53
<p>Откроем лист CategoriesSales. Мы видим таблицу продаж в разрезе категорий, которую мы рассмотрели выше. Вставим диаграмму и выберем тип "Столбчатая диаграмма". Изменим заголовок и кастомизируем по своему усмотрению:</p>
54
<p>Мы построили столбчатую диаграмму суммарных продаж по категориям товаров. Мы видим, что больше всего покупатели потратили на категорию Furniture.</p>
54
<p>Мы построили столбчатую диаграмму суммарных продаж по категориям товаров. Мы видим, что больше всего покупатели потратили на категорию Furniture.</p>
55
<h3>Круговая диаграмма</h3>
55
<h3>Круговая диаграмма</h3>
56
<p>Представим, что нам нужно построить суммарные продажи по категориям, но в процентном соотношении. Для это используется<strong>круговая диаграмма</strong>- показывает числовую переменную в разрезе категорий.</p>
56
<p>Представим, что нам нужно построить суммарные продажи по категориям, но в процентном соотношении. Для это используется<strong>круговая диаграмма</strong>- показывает числовую переменную в разрезе категорий.</p>
57
<p>В этом случае в качестве 100% берется целый круг, а определенная категория занимает долю от этого круга. Чем большую долю в круге занимает категория, тем больше в процентах его продажи относительно суммы всех продаж.</p>
57
<p>В этом случае в качестве 100% берется целый круг, а определенная категория занимает долю от этого круга. Чем большую долю в круге занимает категория, тем больше в процентах его продажи относительно суммы всех продаж.</p>
58
<p>Построим круговую диаграмму по таблице продаж по категориям. Для этого в настройке "Тип диаграммы" выберем круговую диаграмму:</p>
58
<p>Построим круговую диаграмму по таблице продаж по категориям. Для этого в настройке "Тип диаграммы" выберем круговую диаграмму:</p>
59
<p>По этому графику мы также видим, что на категорию Furniture покупатели потратили больше всего денег.</p>
59
<p>По этому графику мы также видим, что на категорию Furniture покупатели потратили больше всего денег.</p>
60
<p>Сравним столбчатую диаграмму и круговую:</p>
60
<p>Сравним столбчатую диаграмму и круговую:</p>
61
<ul><li>С помощью столбчатой диаграммы мы можем визуализировать и абсолютные значения продаж по категориям, и относительные</li>
61
<ul><li>С помощью столбчатой диаграммы мы можем визуализировать и абсолютные значения продаж по категориям, и относительные</li>
62
<li>С помощью круговой диаграммы мы можем посмотреть только на процентные доли. В качестве 100% принимается сумма всех продаж, даже если таблица содержит только абсолютные значения</li>
62
<li>С помощью круговой диаграммы мы можем посмотреть только на процентные доли. В качестве 100% принимается сумма всех продаж, даже если таблица содержит только абсолютные значения</li>
63
</ul><p>Сейчас мы рассчитаем процентные доли каждого из товаров и убедимся, что круговая диаграмма рассчитывает их верно. Для этого добавим в таблицу колонку sales_percent и запишем в клетке C2 формулу.</p>
63
</ul><p>Сейчас мы рассчитаем процентные доли каждого из товаров и убедимся, что круговая диаграмма рассчитывает их верно. Для этого добавим в таблицу колонку sales_percent и запишем в клетке C2 формулу.</p>
64
<p>Мы используем доли от целого, поэтому в формуле должно быть представлено целое. Мы принимаем за 100% суммарные продажи, а процентная доля от продаж равна продажам, поделенным на суммарные продажи:</p>
64
<p>Мы используем доли от целого, поэтому в формуле должно быть представлено целое. Мы принимаем за 100% суммарные продажи, а процентная доля от продаж равна продажам, поделенным на суммарные продажи:</p>
65
<p>Чтобы формулу можно было перетянуть на другие строки, изменим относительные ссылки на абсолютные с помощью символа $:</p>
65
<p>Чтобы формулу можно было перетянуть на другие строки, изменим относительные ссылки на абсолютные с помощью символа $:</p>
66
<p>Итоговая таблица с округленными значениями будет выглядеть так:</p>
66
<p>Итоговая таблица с округленными значениями будет выглядеть так:</p>
67
<p><strong>CategoriesSales</strong></p>
67
<p><strong>CategoriesSales</strong></p>
68
<p>Сравниваем ее со значениями процентов на круговой диаграмме и видим, что значения одинаковые.</p>
68
<p>Сравниваем ее со значениями процентов на круговой диаграмме и видим, что значения одинаковые.</p>
69
<h3>Точечная диаграмма</h3>
69
<h3>Точечная диаграмма</h3>
70
<p>Допустим, мы хотим найти корреляции между прибылью и продажами. Для визуализации такой зависимости используем<strong>точечную диаграмму</strong>- визуализирует зависимость одной числовой переменной от другой.</p>
70
<p>Допустим, мы хотим найти корреляции между прибылью и продажами. Для визуализации такой зависимости используем<strong>точечную диаграмму</strong>- визуализирует зависимость одной числовой переменной от другой.</p>
71
<p>В точечной диаграмме мы наносим на график точки, где одна точка - это одна строка в таблице. По горизонтальной оси идет одна числовая переменная - независимая. По вертикали мы откладываем значения зависимой переменной. В нашем случае продажи будут независимой переменной, а прибыль - зависимой.</p>
71
<p>В точечной диаграмме мы наносим на график точки, где одна точка - это одна строка в таблице. По горизонтальной оси идет одна числовая переменная - независимая. По вертикали мы откладываем значения зависимой переменной. В нашем случае продажи будут независимой переменной, а прибыль - зависимой.</p>
72
<p>Переходим на лист DailySales и выделяем столбцы B:C. Построим по ним диаграмму. Указываем точечный тип диаграммы:</p>
72
<p>Переходим на лист DailySales и выделяем столбцы B:C. Построим по ним диаграмму. Указываем точечный тип диаграммы:</p>
73
<p>Мы построили точечную диаграмму по прибыли и продажам компании. На диаграмме заметим, что обычно чем больше продажи, тем больше и прибыль.</p>
73
<p>Мы построили точечную диаграмму по прибыли и продажам компании. На диаграмме заметим, что обычно чем больше продажи, тем больше и прибыль.</p>
74
<p>В нашей точечной диаграмме нет оси времени, она показывает, как одна числовая переменная зависит от другой. В точечной диаграмме могут быть любые числовые признаки, в том числе и дата, но в данном случае мы ее не используем.</p>
74
<p>В нашей точечной диаграмме нет оси времени, она показывает, как одна числовая переменная зависит от другой. В точечной диаграмме могут быть любые числовые признаки, в том числе и дата, но в данном случае мы ее не используем.</p>
75
<h2>Выводы</h2>
75
<h2>Выводы</h2>
76
<p>В этом уроке мы рассмотрели четыре типа графиков:</p>
76
<p>В этом уроке мы рассмотрели четыре типа графиков:</p>
77
<ul><li>Линейный график</li>
77
<ul><li>Линейный график</li>
78
<li>Столбчатая диаграмма</li>
78
<li>Столбчатая диаграмма</li>
79
<li>Круговая диаграмма</li>
79
<li>Круговая диаграмма</li>
80
<li>Точечная диаграмма</li>
80
<li>Точечная диаграмма</li>
81
</ul><p>Мы определили особенности этих графиков, а также в каких случаях какой график лучше подходит под задачу. Еще мы построили графики для таблиц подневных продаж в магазине и суммарных продаж по категориям товаров.</p>
81
</ul><p>Мы определили особенности этих графиков, а также в каких случаях какой график лучше подходит под задачу. Еще мы построили графики для таблиц подневных продаж в магазине и суммарных продаж по категориям товаров.</p>
82
<p>Такой навык пригодится в аналитике данных, так как часто графики позволяют увидеть выбросы и аномалии в данных, а также наталкивают на разные гипотезы.</p>
82
<p>Такой навык пригодится в аналитике данных, так как часто графики позволяют увидеть выбросы и аномалии в данных, а также наталкивают на разные гипотезы.</p>