0 added
0 removed
Original
2026-01-01
Modified
2026-02-26
1
<p>Во многих случаях аналитики должны предоставить агрегированные или сгруппированные данные. Эта информация помогает понять общие характеристики в определенных разрезах данных. Часто этого достаточно, чтобы достичь бизнес-цели или принимать решения.</p>
1
<p>Во многих случаях аналитики должны предоставить агрегированные или сгруппированные данные. Эта информация помогает понять общие характеристики в определенных разрезах данных. Часто этого достаточно, чтобы достичь бизнес-цели или принимать решения.</p>
2
<p>В этом уроке мы продемонстрируем методы работы с инструментами библиотеки Pandas, чтобы делать такие операции.</p>
2
<p>В этом уроке мы продемонстрируем методы работы с инструментами библиотеки Pandas, чтобы делать такие операции.</p>
3
<h2>Агрегация данных с использованием метода agg()</h2>
3
<h2>Агрегация данных с использованием метода agg()</h2>
4
<p>Функции агрегирования вычисляют интегральные параметры наборов данных. Обычно возвращаемые значения - это несколько чисел. Чаще всего это одно значение для одного столбца данных.</p>
4
<p>Функции агрегирования вычисляют интегральные параметры наборов данных. Обычно возвращаемые значения - это несколько чисел. Чаще всего это одно значение для одного столбца данных.</p>
5
<p>Подгрузим данные:</p>
5
<p>Подгрузим данные:</p>
6
<p>В датасете столбец Advertising со значениями 'small', 'medium', 'large'. Они указывают на объем рекламы в этот день по магазинам, например, 'small' - были низкие объемы рекламы. А также столбец Size со значениями 'small' и 'big', которые указывают на величину магазина.</p>
6
<p>В датасете столбец Advertising со значениями 'small', 'medium', 'large'. Они указывают на объем рекламы в этот день по магазинам, например, 'small' - были низкие объемы рекламы. А также столбец Size со значениями 'small' и 'big', которые указывают на величину магазина.</p>
7
<h3>Примеры агрегаций</h3>
7
<h3>Примеры агрегаций</h3>
8
<p>С помощью метода agg() и встроенных функций можно вычислять агрегированные значения. Например, вычислим среднее число кликов каждого магазина:</p>
8
<p>С помощью метода agg() и встроенных функций можно вычислять агрегированные значения. Например, вычислим среднее число кликов каждого магазина:</p>
9
<p>Мы исключили столбцы 'Advertising', 'Size' в примере выше. Это категории, а не численные показатели. Вычисление функции mean() вызвало бы ошибку на категориальных столбцах.</p>
9
<p>Мы исключили столбцы 'Advertising', 'Size' в примере выше. Это категории, а не численные показатели. Вычисление функции mean() вызвало бы ошибку на категориальных столбцах.</p>
10
<p>Посчитаем несколько агрегаций одновременно для одного столбца. Для этого в аргументы метода agg() подадим список с перечислением функций:</p>
10
<p>Посчитаем несколько агрегаций одновременно для одного столбца. Для этого в аргументы метода agg() подадим список с перечислением функций:</p>
11
<h3>Продвинутые примеры агрегаций</h3>
11
<h3>Продвинутые примеры агрегаций</h3>
12
<p>С помощью метода agg() можно строить и более сложные примеры. Применим к столбцами различные агрегирующие функции:</p>
12
<p>С помощью метода agg() можно строить и более сложные примеры. Применим к столбцами различные агрегирующие функции:</p>
13
<p>Соответствующие функции применились к указанным столбцам. Для этого использовали словари для определения множества функций, при этом допустимо использование кортежей:</p>
13
<p>Соответствующие функции применились к указанным столбцам. Для этого использовали словари для определения множества функций, при этом допустимо использование кортежей:</p>
14
<p>Подход со словарями более популярен, так как в подходе с кортежами есть ограничения по применению только одного агрегирования за раз к определенному столбцу.</p>
14
<p>Подход со словарями более популярен, так как в подходе с кортежами есть ограничения по применению только одного агрегирования за раз к определенному столбцу.</p>
15
<h2>Агрегация данных с использованием метода groupby()</h2>
15
<h2>Агрегация данных с использованием метода groupby()</h2>
16
<p>Рассмотрим агрегацию данных через следующие функции:</p>
16
<p>Рассмотрим агрегацию данных через следующие функции:</p>
17
<ul><li>Числовые агрегирующие функции</li>
17
<ul><li>Числовые агрегирующие функции</li>
18
<li>Функции подсчета</li>
18
<li>Функции подсчета</li>
19
<li>Функции порядка</li>
19
<li>Функции порядка</li>
20
</ul><h3>Числовые агрегирующие функции</h3>
20
</ul><h3>Числовые агрегирующие функции</h3>
21
<p>С помощью метода groupby() можно находить значения агрегированных данных по определенным категориям. Вычислим агрегированные значения для дней, когда значение столбца Advertising было 'small', 'medium' и 'large':</p>
21
<p>С помощью метода groupby() можно находить значения агрегированных данных по определенным категориям. Вычислим агрегированные значения для дней, когда значение столбца Advertising было 'small', 'medium' и 'large':</p>
22
<p>Значение агрегирующих функций вычислились для каждого столбца, причем для всех категорий из столбца 'Advertising'.</p>
22
<p>Значение агрегирующих функций вычислились для каждого столбца, причем для всех категорий из столбца 'Advertising'.</p>
23
<p>Можно для каждого столбца находить свои агрегации:</p>
23
<p>Можно для каждого столбца находить свои агрегации:</p>
24
<p>Метод round() округляет дробную часть до двух знаков после запятой. Форматирование упрощает чтение данных.</p>
24
<p>Метод round() округляет дробную часть до двух знаков после запятой. Форматирование упрощает чтение данных.</p>
25
<h3>Функции подсчета</h3>
25
<h3>Функции подсчета</h3>
26
<p>В предыдущем разделе приведены примеры агрегаций для числовых столбцов. В этом разделе покажем примеры агрегаций на категориальных столбцах:</p>
26
<p>В предыдущем разделе приведены примеры агрегаций для числовых столбцов. В этом разделе покажем примеры агрегаций на категориальных столбцах:</p>
27
<p>Функция count подсчитывает количество значений соответствующей категории, функция nunique находит количество уникальных значений в категории. Функция nunique не учитывает пропуски при подсчете.</p>
27
<p>Функция count подсчитывает количество значений соответствующей категории, функция nunique находит количество уникальных значений в категории. Функция nunique не учитывает пропуски при подсчете.</p>
28
<h3>Функции порядка</h3>
28
<h3>Функции порядка</h3>
29
<p>В этом разделе покажем, как получать максимальное и минимальное количество кликов магазина по категориям рекламы. Будем использовать функции first() и last():</p>
29
<p>В этом разделе покажем, как получать максимальное и минимальное количество кликов магазина по категориям рекламы. Будем использовать функции first() и last():</p>
30
<p>Чтобы использовать функции порядка датасет, их нужно предварительно упорядочить. Для этого можно использовать метод sort_values().</p>
30
<p>Чтобы использовать функции порядка датасет, их нужно предварительно упорядочить. Для этого можно использовать метод sort_values().</p>
31
<h2>Выводы</h2>
31
<h2>Выводы</h2>
32
<p>В этом уроке мы познакомились с возможностями библиотеки Pandas по агрегации данных. Разобрали примеры агрегации с помощью метода agg(), а также более сложные примеры с использованием метода groupby(). На практике данные методы применяются довольно часто в силу того, что агрегация данных позволяет выявлять закономерности, тренды и другие информативные показатели.</p>
32
<p>В этом уроке мы познакомились с возможностями библиотеки Pandas по агрегации данных. Разобрали примеры агрегации с помощью метода agg(), а также более сложные примеры с использованием метода groupby(). На практике данные методы применяются довольно часто в силу того, что агрегация данных позволяет выявлять закономерности, тренды и другие информативные показатели.</p>