HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-02-26
1 <p>Во многих случаях аналитики должны предоставить агрегированные или сгруппированные данные. Эта информация помогает понять общие характеристики в определенных разрезах данных. Часто этого достаточно, чтобы достичь бизнес-цели или принимать решения.</p>
1 <p>Во многих случаях аналитики должны предоставить агрегированные или сгруппированные данные. Эта информация помогает понять общие характеристики в определенных разрезах данных. Часто этого достаточно, чтобы достичь бизнес-цели или принимать решения.</p>
2 <p>В этом уроке мы продемонстрируем методы работы с инструментами библиотеки Pandas, чтобы делать такие операции.</p>
2 <p>В этом уроке мы продемонстрируем методы работы с инструментами библиотеки Pandas, чтобы делать такие операции.</p>
3 <h2>Агрегация данных с использованием метода agg()</h2>
3 <h2>Агрегация данных с использованием метода agg()</h2>
4 <p>Функции агрегирования вычисляют интегральные параметры наборов данных. Обычно возвращаемые значения - это несколько чисел. Чаще всего это одно значение для одного столбца данных.</p>
4 <p>Функции агрегирования вычисляют интегральные параметры наборов данных. Обычно возвращаемые значения - это несколько чисел. Чаще всего это одно значение для одного столбца данных.</p>
5 <p>Подгрузим данные:</p>
5 <p>Подгрузим данные:</p>
6 <p>В датасете столбец Advertising со значениями 'small', 'medium', 'large'. Они указывают на объем рекламы в этот день по магазинам, например, 'small' - были низкие объемы рекламы. А также столбец Size со значениями 'small' и 'big', которые указывают на величину магазина.</p>
6 <p>В датасете столбец Advertising со значениями 'small', 'medium', 'large'. Они указывают на объем рекламы в этот день по магазинам, например, 'small' - были низкие объемы рекламы. А также столбец Size со значениями 'small' и 'big', которые указывают на величину магазина.</p>
7 <h3>Примеры агрегаций</h3>
7 <h3>Примеры агрегаций</h3>
8 <p>С помощью метода agg() и встроенных функций можно вычислять агрегированные значения. Например, вычислим среднее число кликов каждого магазина:</p>
8 <p>С помощью метода agg() и встроенных функций можно вычислять агрегированные значения. Например, вычислим среднее число кликов каждого магазина:</p>
9 <p>Мы исключили столбцы 'Advertising', 'Size' в примере выше. Это категории, а не численные показатели. Вычисление функции mean() вызвало бы ошибку на категориальных столбцах.</p>
9 <p>Мы исключили столбцы 'Advertising', 'Size' в примере выше. Это категории, а не численные показатели. Вычисление функции mean() вызвало бы ошибку на категориальных столбцах.</p>
10 <p>Посчитаем несколько агрегаций одновременно для одного столбца. Для этого в аргументы метода agg() подадим список с перечислением функций:</p>
10 <p>Посчитаем несколько агрегаций одновременно для одного столбца. Для этого в аргументы метода agg() подадим список с перечислением функций:</p>
11 <h3>Продвинутые примеры агрегаций</h3>
11 <h3>Продвинутые примеры агрегаций</h3>
12 <p>С помощью метода agg() можно строить и более сложные примеры. Применим к столбцами различные агрегирующие функции:</p>
12 <p>С помощью метода agg() можно строить и более сложные примеры. Применим к столбцами различные агрегирующие функции:</p>
13 <p>Соответствующие функции применились к указанным столбцам. Для этого использовали словари для определения множества функций, при этом допустимо использование кортежей:</p>
13 <p>Соответствующие функции применились к указанным столбцам. Для этого использовали словари для определения множества функций, при этом допустимо использование кортежей:</p>
14 <p>Подход со словарями более популярен, так как в подходе с кортежами есть ограничения по применению только одного агрегирования за раз к определенному столбцу.</p>
14 <p>Подход со словарями более популярен, так как в подходе с кортежами есть ограничения по применению только одного агрегирования за раз к определенному столбцу.</p>
15 <h2>Агрегация данных с использованием метода groupby()</h2>
15 <h2>Агрегация данных с использованием метода groupby()</h2>
16 <p>Рассмотрим агрегацию данных через следующие функции:</p>
16 <p>Рассмотрим агрегацию данных через следующие функции:</p>
17 <ul><li>Числовые агрегирующие функции</li>
17 <ul><li>Числовые агрегирующие функции</li>
18 <li>Функции подсчета</li>
18 <li>Функции подсчета</li>
19 <li>Функции порядка</li>
19 <li>Функции порядка</li>
20 </ul><h3>Числовые агрегирующие функции</h3>
20 </ul><h3>Числовые агрегирующие функции</h3>
21 <p>С помощью метода groupby() можно находить значения агрегированных данных по определенным категориям. Вычислим агрегированные значения для дней, когда значение столбца Advertising было 'small', 'medium' и 'large':</p>
21 <p>С помощью метода groupby() можно находить значения агрегированных данных по определенным категориям. Вычислим агрегированные значения для дней, когда значение столбца Advertising было 'small', 'medium' и 'large':</p>
22 <p>Значение агрегирующих функций вычислились для каждого столбца, причем для всех категорий из столбца 'Advertising'.</p>
22 <p>Значение агрегирующих функций вычислились для каждого столбца, причем для всех категорий из столбца 'Advertising'.</p>
23 <p>Можно для каждого столбца находить свои агрегации:</p>
23 <p>Можно для каждого столбца находить свои агрегации:</p>
24 <p>Метод round() округляет дробную часть до двух знаков после запятой. Форматирование упрощает чтение данных.</p>
24 <p>Метод round() округляет дробную часть до двух знаков после запятой. Форматирование упрощает чтение данных.</p>
25 <h3>Функции подсчета</h3>
25 <h3>Функции подсчета</h3>
26 <p>В предыдущем разделе приведены примеры агрегаций для числовых столбцов. В этом разделе покажем примеры агрегаций на категориальных столбцах:</p>
26 <p>В предыдущем разделе приведены примеры агрегаций для числовых столбцов. В этом разделе покажем примеры агрегаций на категориальных столбцах:</p>
27 <p>Функция count подсчитывает количество значений соответствующей категории, функция nunique находит количество уникальных значений в категории. Функция nunique не учитывает пропуски при подсчете.</p>
27 <p>Функция count подсчитывает количество значений соответствующей категории, функция nunique находит количество уникальных значений в категории. Функция nunique не учитывает пропуски при подсчете.</p>
28 <h3>Функции порядка</h3>
28 <h3>Функции порядка</h3>
29 <p>В этом разделе покажем, как получать максимальное и минимальное количество кликов магазина по категориям рекламы. Будем использовать функции first() и last():</p>
29 <p>В этом разделе покажем, как получать максимальное и минимальное количество кликов магазина по категориям рекламы. Будем использовать функции first() и last():</p>
30 <p>Чтобы использовать функции порядка датасет, их нужно предварительно упорядочить. Для этого можно использовать метод sort_values().</p>
30 <p>Чтобы использовать функции порядка датасет, их нужно предварительно упорядочить. Для этого можно использовать метод sort_values().</p>
31 <h2>Выводы</h2>
31 <h2>Выводы</h2>
32 <p>В этом уроке мы познакомились с возможностями библиотеки Pandas по агрегации данных. Разобрали примеры агрегации с помощью метода agg(), а также более сложные примеры с использованием метода groupby(). На практике данные методы применяются довольно часто в силу того, что агрегация данных позволяет выявлять закономерности, тренды и другие информативные показатели.</p>
32 <p>В этом уроке мы познакомились с возможностями библиотеки Pandas по агрегации данных. Разобрали примеры агрегации с помощью метода agg(), а также более сложные примеры с использованием метода groupby(). На практике данные методы применяются довольно часто в силу того, что агрегация данных позволяет выявлять закономерности, тренды и другие информативные показатели.</p>