0 added
0 removed
Original
2026-01-01
Modified
2026-03-10
1
<p>Теги: pandas, анализ данных, группировка, агрегирование</p>
1
<p>Теги: pandas, анализ данных, группировка, агрегирование</p>
2
<p>Библиотека<a>Pandas</a>широко используется при обработке и анализе данных, являясь, среди всего прочего, одним из важных инструментов системного аналитика. В этом материале мы вкратце расскажем о группировке и агрегировании данных.</p>
2
<p>Библиотека<a>Pandas</a>широко используется при обработке и анализе данных, являясь, среди всего прочего, одним из важных инструментов системного аналитика. В этом материале мы вкратце расскажем о группировке и агрегировании данных.</p>
3
<p>Стоит отметить, что<strong>группировка</strong>данных является одним из самых часто используемых методов в процессе анализа данных. В библиотеке Pandas за группировку отвечает специальный метод под названием<strong>.groupby</strong>.</p>
3
<p>Стоит отметить, что<strong>группировка</strong>данных является одним из самых часто используемых методов в процессе анализа данных. В библиотеке Pandas за группировку отвечает специальный метод под названием<strong>.groupby</strong>.</p>
4
<p>Чтобы продемонстрировать группировку, давайте возьмем стандартный набор данных (dataset), который часто применяется на курсах анализа данных - речь идет о данных, представляющих собой перечень пассажиров печально известного "Титаника". Скачать соответствующий CSV-файл вы можете по<a>этой ссылке</a>.</p>
4
<p>Чтобы продемонстрировать группировку, давайте возьмем стандартный набор данных (dataset), который часто применяется на курсах анализа данных - речь идет о данных, представляющих собой перечень пассажиров печально известного "Титаника". Скачать соответствующий CSV-файл вы можете по<a>этой ссылке</a>.</p>
5
<p>Перед нами задача сосчитать, сколько мужчин и женщин спаслись, а сколько нет. Здесь поможет вышеупомянутый метод<strong>.groupby</strong>.</p>
5
<p>Перед нами задача сосчитать, сколько мужчин и женщин спаслись, а сколько нет. Здесь поможет вышеупомянутый метод<strong>.groupby</strong>.</p>
6
<p>А теперь давайте выполним анализ с учетом класса каюты:</p>
6
<p>А теперь давайте выполним анализ с учетом класса каюты:</p>
7
<p>Здесь уместно ввести термин "сводная таблица". Он прекрасно известен всем, кто хорошо знаком с инструментом типа Microsoft Excel. В Pandas сводные таблицы строят с помощью метода<strong>.pivot_table</strong>. Исходя из вышесказанного, давайте теперь посчитаем, сколько всего мужчин и женщин было в конкретном классе корабля:</p>
7
<p>Здесь уместно ввести термин "сводная таблица". Он прекрасно известен всем, кто хорошо знаком с инструментом типа Microsoft Excel. В Pandas сводные таблицы строят с помощью метода<strong>.pivot_table</strong>. Исходя из вышесказанного, давайте теперь посчитаем, сколько всего мужчин и женщин было в конкретном классе корабля:</p>
8
<p>Теперь в качестве индекса выступает пол человека, а в качестве колонок -- значения из PClass. Что касается функции агрегирования, то это count (подсчет числа записей) по колонке Name.</p>
8
<p>Теперь в качестве индекса выступает пол человека, а в качестве колонок -- значения из PClass. Что касается функции агрегирования, то это count (подсчет числа записей) по колонке Name.</p>
9
<p>Как видите, все довольно просто.</p>
9
<p>Как видите, все довольно просто.</p>
10
<p><em>По материалам блога https://khashtamov.com/ru/.</em></p>
10
<p><em>По материалам блога https://khashtamov.com/ru/.</em></p>
11
11