0 added
0 removed
Original
2026-01-01
Modified
2026-02-26
1
<p>Фильтрация значений и оперирование с их подмножествами используются в задачах обработки, подготовки и анализа данных. В этом уроке мы познакомимся c правилами индексирования основных объектов Series и DataFrame, а также узнаем, как с их помощью осуществлять подвыборки нужных строк и столбцов в табличных данных.</p>
1
<p>Фильтрация значений и оперирование с их подмножествами используются в задачах обработки, подготовки и анализа данных. В этом уроке мы познакомимся c правилами индексирования основных объектов Series и DataFrame, а также узнаем, как с их помощью осуществлять подвыборки нужных строк и столбцов в табличных данных.</p>
2
<h2>Структура объекта DataFrame</h2>
2
<h2>Структура объекта DataFrame</h2>
3
<p>Рассмотрим объект DataFrame. Он состоит из набора столбцов, каждый из которых является объектом Series:</p>
3
<p>Рассмотрим объект DataFrame. Он состоит из набора столбцов, каждый из которых является объектом Series:</p>
4
<p>Применим функцию type() к столбцу df_orders:</p>
4
<p>Применим функцию type() к столбцу df_orders:</p>
5
<p>Объект Series спроектирован, чтобы хранить одномерные структуры данных. Он состоит из двух связанных между собой массивов: меток и значений:</p>
5
<p>Объект Series спроектирован, чтобы хранить одномерные структуры данных. Он состоит из двух связанных между собой массивов: меток и значений:</p>
6
<p>Выбрать несколько столбцов можно следующим образом:</p>
6
<p>Выбрать несколько столбцов можно следующим образом:</p>
7
<p>При выборе нескольких столбцов мы будем снова получать тип данных DataFrame.</p>
7
<p>При выборе нескольких столбцов мы будем снова получать тип данных DataFrame.</p>
8
<p>Иногда легче выбросить несколько столбцов, чем перечислять необходимые. В этом случае нужно использовать метод drop():</p>
8
<p>Иногда легче выбросить несколько столбцов, чем перечислять необходимые. В этом случае нужно использовать метод drop():</p>
9
<p>В методе drop() нужно задавать значение параметра axis. Значение 0 будет указывать, что нужно исключить некоторые строки. Значение 1 указывает на исключение столбцов.</p>
9
<p>В методе drop() нужно задавать значение параметра axis. Значение 0 будет указывать, что нужно исключить некоторые строки. Значение 1 указывает на исключение столбцов.</p>
10
<p>Метод drop() возвращает новый объект DataFrame и оставляет без изменений исходный.</p>
10
<p>Метод drop() возвращает новый объект DataFrame и оставляет без изменений исходный.</p>
11
<h2>Индексы объектов DataFrame и Series</h2>
11
<h2>Индексы объектов DataFrame и Series</h2>
12
<p>У каждой строки объекта DataFrame или значения у Series есть индекс. Индекс может быть как числом, так и строкой. Список индексов объектов DataFrame и Series можно получить с помощью атрибута index:</p>
12
<p>У каждой строки объекта DataFrame или значения у Series есть индекс. Индекс может быть как числом, так и строкой. Список индексов объектов DataFrame и Series можно получить с помощью атрибута index:</p>
13
<p>Если нужно, можно изменить значение индексов и имя столбца с индексами:</p>
13
<p>Если нужно, можно изменить значение индексов и имя столбца с индексами:</p>
14
<p>Строковые индексы обычно называют метки или ключи:</p>
14
<p>Строковые индексы обычно называют метки или ключи:</p>
15
<h2>Методы получения значений по индексу</h2>
15
<h2>Методы получения значений по индексу</h2>
16
<p>Разберем следующие методы:</p>
16
<p>Разберем следующие методы:</p>
17
<ul><li>loc() - метод выбора данных на основе меток строк</li>
17
<ul><li>loc() - метод выбора данных на основе меток строк</li>
18
<li>iloc() - метод выбора строк согласно их числовой позиции</li>
18
<li>iloc() - метод выбора строк согласно их числовой позиции</li>
19
</ul><h3>loc()</h3>
19
</ul><h3>loc()</h3>
20
<p>Выберем одну строку из объекта DataFrame по ее метке:</p>
20
<p>Выберем одну строку из объекта DataFrame по ее метке:</p>
21
<p>Выберем несколько строк:</p>
21
<p>Выберем несколько строк:</p>
22
<h3>iloc()</h3>
22
<h3>iloc()</h3>
23
<p>Выберем одну строку:</p>
23
<p>Выберем одну строку:</p>
24
<p>Выберем несколько строк:</p>
24
<p>Выберем несколько строк:</p>
25
<h3>Фильтрация строк и столбцов одновременно</h3>
25
<h3>Фильтрация строк и столбцов одновременно</h3>
26
<p>Методы loc() и iloc() позволяют выполнять фильтрацию по строкам и столбцам одновременно. Пример для loc():</p>
26
<p>Методы loc() и iloc() позволяют выполнять фильтрацию по строкам и столбцам одновременно. Пример для loc():</p>
27
<p>Пример для iloc():</p>
27
<p>Пример для iloc():</p>
28
<p>Как и при использовании методов отдельно для строк и столбцов, метод loc() ожидает на вход метки, а iloc() - номера позиций строк и столбцов.</p>
28
<p>Как и при использовании методов отдельно для строк и столбцов, метод loc() ожидает на вход метки, а iloc() - номера позиций строк и столбцов.</p>
29
<h2>Срезы</h2>
29
<h2>Срезы</h2>
30
<p>Срезы позволяют получать совокупности строк в определенном диапазоне. Пример:</p>
30
<p>Срезы позволяют получать совокупности строк в определенном диапазоне. Пример:</p>
31
<p>В срез данных попали все строки между позициями 1 и 3 включительно. Позиции 1 и 3 соответствуют меткам 'b' и 'd'. Можно строить более интересные срезы:</p>
31
<p>В срез данных попали все строки между позициями 1 и 3 включительно. Позиции 1 и 3 соответствуют меткам 'b' и 'd'. Можно строить более интересные срезы:</p>
32
<p>В данный срез попала каждая вторая строка между строками с метками 'b' и 'f'.</p>
32
<p>В данный срез попала каждая вторая строка между строками с метками 'b' и 'f'.</p>
33
<p>Можно получать срезы со строками и столбцами одновременно:</p>
33
<p>Можно получать срезы со строками и столбцами одновременно:</p>
34
<p>В срез попала каждая вторая строка между строками с метками 'b' и 'f' и столбцы с метками от 'shop_1' до 'shop_3' включительно.</p>
34
<p>В срез попала каждая вторая строка между строками с метками 'b' и 'f' и столбцы с метками от 'shop_1' до 'shop_3' включительно.</p>
35
<p>Аналогично получаются срезы с помощью метода iloc(). Приведем пример, который совпадает по результату с примером выше:</p>
35
<p>Аналогично получаются срезы с помощью метода iloc(). Приведем пример, который совпадает по результату с примером выше:</p>
36
<h2>Выводы</h2>
36
<h2>Выводы</h2>
37
<p>Работа с данными может производиться над конкретными элементами, строками, столбцами или их комбинациями. В этом уроке мы познакомились с фильтрацией значений таблиц по индексам строк и столбцов объекта DataFrame библиотеки Pandas. Изложенные методы позволяют получать различные срезы данных в соответствии с условиями на индексы.</p>
37
<p>Работа с данными может производиться над конкретными элементами, строками, столбцами или их комбинациями. В этом уроке мы познакомились с фильтрацией значений таблиц по индексам строк и столбцов объекта DataFrame библиотеки Pandas. Изложенные методы позволяют получать различные срезы данных в соответствии с условиями на индексы.</p>