0 added
0 removed
Original
2026-01-01
Modified
2026-02-26
1
<p>Pandas - это библиотека на языке программирования Python, предназначенная для анализа данных и работы с табличными данными. Она особенно удобна для выполнения различных операций с данными: фильтрации, группировки, агрегации и других.</p>
1
<p>Pandas - это библиотека на языке программирования Python, предназначенная для анализа данных и работы с табличными данными. Она особенно удобна для выполнения различных операций с данными: фильтрации, группировки, агрегации и других.</p>
2
<h2>Содержание</h2>
2
<h2>Содержание</h2>
3
<ul><li><a>Основные структуры данных в Pandas</a></li>
3
<ul><li><a>Основные структуры данных в Pandas</a></li>
4
<li><a>Пример использования Pandas</a></li>
4
<li><a>Пример использования Pandas</a></li>
5
<li><a>Заключение</a></li>
5
<li><a>Заключение</a></li>
6
</ul><h2>Основные структуры данных в Pandas</h2>
6
</ul><h2>Основные структуры данных в Pandas</h2>
7
<p>Основные структуры данных в Pandas - это DataFrame и Series. Они позволяют обрабатывать данные эффективно и интуитивно понятно.</p>
7
<p>Основные структуры данных в Pandas - это DataFrame и Series. Они позволяют обрабатывать данные эффективно и интуитивно понятно.</p>
8
<h3>Series</h3>
8
<h3>Series</h3>
9
<p>Series - это одномерный массив данных, который может содержать любой тип данных (целые числа, строки, числа с плавающей точкой, объекты Python и т. д.). Каждому элементу в Series соответствует метка, которая называется индексом. По умолчанию, если индекс не задан явно, он автоматически создается как последовательность целых чисел 0, 1, 2, ... и до n-1, где n - количество элементов в Series.</p>
9
<p>Series - это одномерный массив данных, который может содержать любой тип данных (целые числа, строки, числа с плавающей точкой, объекты Python и т. д.). Каждому элементу в Series соответствует метка, которая называется индексом. По умолчанию, если индекс не задан явно, он автоматически создается как последовательность целых чисел 0, 1, 2, ... и до n-1, где n - количество элементов в Series.</p>
10
<p>Основные операции с Series:</p>
10
<p>Основные операции с Series:</p>
11
<ul><li>Выборка данных по их индексу или с использованием срезов (slices).</li>
11
<ul><li>Выборка данных по их индексу или с использованием срезов (slices).</li>
12
<li>Фильтрация данных с помощью булевых выражений.</li>
12
<li>Фильтрация данных с помощью булевых выражений.</li>
13
<li>Агрегация с использованием функций sum(), mean(), max() и других.</li>
13
<li>Агрегация с использованием функций sum(), mean(), max() и других.</li>
14
</ul><h3>DataFrame</h3>
14
</ul><h3>DataFrame</h3>
15
<p>DataFrame - это двумерная структура данных, похожая на таблицу в SQL или на лист в Excel. DataFrame поддерживает столбцы различных типов данных, что очень удобно для задач по обработке данных, включая статистический анализ, очистку данных, а также их визуализацию.</p>
15
<p>DataFrame - это двумерная структура данных, похожая на таблицу в SQL или на лист в Excel. DataFrame поддерживает столбцы различных типов данных, что очень удобно для задач по обработке данных, включая статистический анализ, очистку данных, а также их визуализацию.</p>
16
<p>Основные операции с DataFrame:</p>
16
<p>Основные операции с DataFrame:</p>
17
<ul><li>Выборка данных в столбцах по именам или строки по индексу.</li>
17
<ul><li>Выборка данных в столбцах по именам или строки по индексу.</li>
18
<li>Фильтрация и преобразование данных.</li>
18
<li>Фильтрация и преобразование данных.</li>
19
<li>Группировка с помощью метода groupby() по одному или нескольким столбцам.</li>
19
<li>Группировка с помощью метода groupby() по одному или нескольким столбцам.</li>
20
<li>Слияние подобно тому, как это происходит в SQL.</li>
20
<li>Слияние подобно тому, как это происходит в SQL.</li>
21
<li>Изменение структуры таблицы, добавление и удаление столбцов, изменение индексации и многое другое.</li>
21
<li>Изменение структуры таблицы, добавление и удаление столбцов, изменение индексации и многое другое.</li>
22
</ul><h2>Пример использования Pandas</h2>
22
</ul><h2>Пример использования Pandas</h2>
23
<p>Рассмотрим простой пример, который демонстрирует эти операции. Допустим, в базе данных собраны данные людей из разных городов, разного возраста. Вот что можно делать с этими данными с помощью Pandas.</p>
23
<p>Рассмотрим простой пример, который демонстрирует эти операции. Допустим, в базе данных собраны данные людей из разных городов, разного возраста. Вот что можно делать с этими данными с помощью Pandas.</p>
24
<h3>Просмотр данных</h3>
24
<h3>Просмотр данных</h3>
25
<ul><li>df.head(n). Позволяет просмотреть первые n строк DataFrame. По умолчанию n равно 5, но можно указать любое число для просмотра.</li>
25
<ul><li>df.head(n). Позволяет просмотреть первые n строк DataFrame. По умолчанию n равно 5, но можно указать любое число для просмотра.</li>
26
<li>df.tail(n). Аналогично методу head, но показывает последние n строк. Это полезно для быстрой проверки того, какие данные добавлены в конец DataFrame.</li>
26
<li>df.tail(n). Аналогично методу head, но показывает последние n строк. Это полезно для быстрой проверки того, какие данные добавлены в конец DataFrame.</li>
27
</ul><h3>Выборка данных</h3>
27
</ul><h3>Выборка данных</h3>
28
<ul><li>Выбор столбца по имени: df['Column_Name'] возвращает Series, содержащий данные указанного столбца.</li>
28
<ul><li>Выбор столбца по имени: df['Column_Name'] возвращает Series, содержащий данные указанного столбца.</li>
29
<li>Выбор нескольких столбцов: df[['Column_Name1', 'Column_Name2']] вернет новый DataFrame только с указанными столбцами.</li>
29
<li>Выбор нескольких столбцов: df[['Column_Name1', 'Column_Name2']] вернет новый DataFrame только с указанными столбцами.</li>
30
<li>Выбор строки по индексу: df.iloc[index] используется для получения строки по числовому индексу. Например, df.iloc[0] вернет первую строку DataFrame как Series.</li>
30
<li>Выбор строки по индексу: df.iloc[index] используется для получения строки по числовому индексу. Например, df.iloc[0] вернет первую строку DataFrame как Series.</li>
31
<li>Выбор по метке: df.loc[label] позволяет выбрать строку по метке индекса. Если индекс представляет собой дату, можно использовать df.loc['2021-01-01'].</li>
31
<li>Выбор по метке: df.loc[label] позволяет выбрать строку по метке индекса. Если индекс представляет собой дату, можно использовать df.loc['2021-01-01'].</li>
32
</ul><h3>Фильтрация</h3>
32
</ul><h3>Фильтрация</h3>
33
<ul><li>Условная фильтрация: df[df['Age'] > 25] вернет новый DataFrame, содержащий только те строки, где значение в столбце Age больше 25. Можно комбинировать условия, используя операторы & (и) и | (или).</li>
33
<ul><li>Условная фильтрация: df[df['Age'] > 25] вернет новый DataFrame, содержащий только те строки, где значение в столбце Age больше 25. Можно комбинировать условия, используя операторы & (и) и | (или).</li>
34
</ul><h3>Группировка и агрегация</h3>
34
</ul><h3>Группировка и агрегация</h3>
35
<ul><li>df.groupby('Column_Name'). Этот метод используется для группировки данных по одному или нескольким столбцам. Например, df.groupby('City') создает объект GroupBy, который можно использовать для применения агрегирующих функций.</li>
35
<ul><li>df.groupby('Column_Name'). Этот метод используется для группировки данных по одному или нескольким столбцам. Например, df.groupby('City') создает объект GroupBy, который можно использовать для применения агрегирующих функций.</li>
36
<li>Агрегирующие функции. После группировки можно применять функции, такие как mean(), sum(), max(), min() и т. д. Например, df.groupby('City').mean() вычислит средние значения для каждой группы.</li>
36
<li>Агрегирующие функции. После группировки можно применять функции, такие как mean(), sum(), max(), min() и т. д. Например, df.groupby('City').mean() вычислит средние значения для каждой группы.</li>
37
</ul><h3>Сохранение данных</h3>
37
</ul><h3>Сохранение данных</h3>
38
<ul><li>df.to_csv('filename.csv'). Этот метод сохраняет DataFrame в файл формата CSV. Можно указать дополнительные параметры, например index=False, чтобы не включать индекс в файл.</li>
38
<ul><li>df.to_csv('filename.csv'). Этот метод сохраняет DataFrame в файл формата CSV. Можно указать дополнительные параметры, например index=False, чтобы не включать индекс в файл.</li>
39
<li>Другие форматы. DataFrame также можно сохранить в другом формате, например Excel (df.to_excel('filename.xlsx')), JSON (df.to_json('filename.json')), SQL (df.to_sql('table_name', connection_object)) и многих других.</li>
39
<li>Другие форматы. DataFrame также можно сохранить в другом формате, например Excel (df.to_excel('filename.xlsx')), JSON (df.to_json('filename.json')), SQL (df.to_sql('table_name', connection_object)) и многих других.</li>
40
</ul><p>В нашем примере, создав DataFrame, можно отфильтровать данные, выделив только людей младше 25 лет, затем сгруппировать эти данные и сохранить.</p>
40
</ul><p>В нашем примере, создав DataFrame, можно отфильтровать данные, выделив только людей младше 25 лет, затем сгруппировать эти данные и сохранить.</p>
41
<h2>Заключение</h2>
41
<h2>Заключение</h2>
42
<p>Pandas - это прекрасный инструмент для работы с данными, который используется в Data Science, финансовом анализе, исследовании и других областях. Благодаря широкому набору функций можно легко обрабатывать, анализировать и визуализировать данные в удобной форме.</p>
42
<p>Pandas - это прекрасный инструмент для работы с данными, который используется в Data Science, финансовом анализе, исследовании и других областях. Благодаря широкому набору функций можно легко обрабатывать, анализировать и визуализировать данные в удобной форме.</p>