0 added
0 removed
Original
2026-01-01
Modified
2026-02-26
1
<p>Библиотека Numpy используется в модулях для работы с различными типами данных:</p>
1
<p>Библиотека Numpy используется в модулях для работы с различными типами данных:</p>
2
<ul><li>Научными данными - SciPy</li>
2
<ul><li>Научными данными - SciPy</li>
3
<li>Табличными данными - Pandas</li>
3
<li>Табличными данными - Pandas</li>
4
<li>Визуализацией данных - Matplotlib, Plotly, Seaborn</li>
4
<li>Визуализацией данных - Matplotlib, Plotly, Seaborn</li>
5
<li>Алгоритмами машинного обучения - Sklearn</li>
5
<li>Алгоритмами машинного обучения - Sklearn</li>
6
<li>Тензорами и глубокими нейронными сетями - TensorFlow</li>
6
<li>Тензорами и глубокими нейронными сетями - TensorFlow</li>
7
<li>Изображениями - OpenCV</li>
7
<li>Изображениями - OpenCV</li>
8
</ul><p>Так произошло, потому что Numpy позволяет использовать единый интерфейс для работы с разными многомерными структурами данных и содержит широкий спектр операций для этого. В этом уроке мы познакомимся с математическими и статистическими методами библиотеки, решив ряд аналитических задач.</p>
8
</ul><p>Так произошло, потому что Numpy позволяет использовать единый интерфейс для работы с разными многомерными структурами данных и содержит широкий спектр операций для этого. В этом уроке мы познакомимся с математическими и статистическими методами библиотеки, решив ряд аналитических задач.</p>
9
<p>Рассмотрим недельные данные продаж в сети четырех магазинов:</p>
9
<p>Рассмотрим недельные данные продаж в сети четырех магазинов:</p>
10
<p>Одна из базовых задач аналитика - знакомство с данными. Типичный подход к этому вопросу - это оценка суммы заказов во всей сети и в каждом магазине по отдельности:</p>
10
<p>Одна из базовых задач аналитика - знакомство с данными. Типичный подход к этому вопросу - это оценка суммы заказов во всей сети и в каждом магазине по отдельности:</p>
11
<p>Кроме интегральных показателей, для оценки полезно понимать разброс значений от минимального до максимального. Мы можем обнаружить крайние значения и использовать эти данные, чтобы найти ошибки и расследовать инциденты в работе сети:</p>
11
<p>Кроме интегральных показателей, для оценки полезно понимать разброс значений от минимального до максимального. Мы можем обнаружить крайние значения и использовать эти данные, чтобы найти ошибки и расследовать инциденты в работе сети:</p>
12
<p>По абсолютным цифрам не всегда получается проверить гипотезы о состоянии сети. Для этого удобно смотреть на показатели относительно общего числа продаж:</p>
12
<p>По абсолютным цифрам не всегда получается проверить гипотезы о состоянии сети. Для этого удобно смотреть на показатели относительно общего числа продаж:</p>
13
<p>Раньше в аналитике использовались статические показатели, которые не показывают динамику изменений во времени. А теперь для оценки прироста заказов по дням можно использовать кумулятивные суммы и конечные разности.</p>
13
<p>Раньше в аналитике использовались статические показатели, которые не показывают динамику изменений во времени. А теперь для оценки прироста заказов по дням можно использовать кумулятивные суммы и конечные разности.</p>
14
<p>В примере ниже показана сумма для первого магазина. Каждое следующее значение равно сумме предыдущего и количеству продаж в этот день:</p>
14
<p>В примере ниже показана сумма для первого магазина. Каждое следующее значение равно сумме предыдущего и количеству продаж в этот день:</p>
15
<p>В случае разности для всех магазинов каждая строка представляет собой поэлементную разность показателей соседних дней:</p>
15
<p>В случае разности для всех магазинов каждая строка представляет собой поэлементную разность показателей соседних дней:</p>
16
<p>Фиксированная точность в расчетах требует выполнить один из двух вариантов:</p>
16
<p>Фиксированная точность в расчетах требует выполнить один из двух вариантов:</p>
17
<ul><li>Округлить полученные показатели до целых значений сверху, снизу или к ближайшему</li>
17
<ul><li>Округлить полученные показатели до целых значений сверху, снизу или к ближайшему</li>
18
<li>Оставить определенное количество знаков после запятой</li>
18
<li>Оставить определенное количество знаков после запятой</li>
19
</ul><p>Все эти подходы реализованы в Numpy. Ниже в примере рассмотрим приемы округления для относительных показателей продаж в магазинах. В качестве относительной величины берем среднее по всей сети:</p>
19
</ul><p>Все эти подходы реализованы в Numpy. Ниже в примере рассмотрим приемы округления для относительных показателей продаж в магазинах. В качестве относительной величины берем среднее по всей сети:</p>
20
<p>На продажи в магазинах могут влиять разные факторы:</p>
20
<p>На продажи в магазинах могут влиять разные факторы:</p>
21
<ul><li>Выходные, предпраздничные и праздничные дни</li>
21
<ul><li>Выходные, предпраздничные и праздничные дни</li>
22
<li>Акции</li>
22
<li>Акции</li>
23
<li>Логистические задержки</li>
23
<li>Логистические задержки</li>
24
<li>Погода</li>
24
<li>Погода</li>
25
</ul><p>Все они по-разному отражаются на продажах. Если факторы плановые, то их последствия можно точно предугадать. А вот если они имеют вероятностную природу, то точность существенно падает.</p>
25
</ul><p>Все они по-разному отражаются на продажах. Если факторы плановые, то их последствия можно точно предугадать. А вот если они имеют вероятностную природу, то точность существенно падает.</p>
26
<p>В этих случаях используют статистические методы. Они позволяют оценить влияние факторов на продажи. Аналитики сперва находят статистические показатели:</p>
26
<p>В этих случаях используют статистические методы. Они позволяют оценить влияние факторов на продажи. Аналитики сперва находят статистические показатели:</p>
27
<ul><li>Среднее - какое число продаж можно ожидать, если взять случайный день недели и магазин</li>
27
<ul><li>Среднее - какое число продаж можно ожидать, если взять случайный день недели и магазин</li>
28
<li>Отклонение от среднего - насколько сильно реальные показатели могут отличаться от среднего</li>
28
<li>Отклонение от среднего - насколько сильно реальные показатели могут отличаться от среднего</li>
29
<li>Медиана - значение продаж, в сравнение с которым ровно половина продаж - меньше, а другая половина - больше</li>
29
<li>Медиана - значение продаж, в сравнение с которым ровно половина продаж - меньше, а другая половина - больше</li>
30
</ul><p>Посмотрим, как находить такие показатели:</p>
30
</ul><p>Посмотрим, как находить такие показатели:</p>
31
<p>Более детальный анализ продаж может потребовать использования персентилей.<strong>Персентиль N%</strong>показывает значение продаж, относительно которого N% продаж меньше. Например, персентиль 50% дает значение продаж, относительно которого в данных ровно 50% значений меньше его. Оно совпадает с медианным значением. Часто используют персентили 25%, 50% и 75%:</p>
31
<p>Более детальный анализ продаж может потребовать использования персентилей.<strong>Персентиль N%</strong>показывает значение продаж, относительно которого N% продаж меньше. Например, персентиль 50% дает значение продаж, относительно которого в данных ровно 50% значений меньше его. Оно совпадает с медианным значением. Часто используют персентили 25%, 50% и 75%:</p>
32
<p>На разные магазины случайные факторы могут влиять по-разному. Мы можем находить магазины с похожими закономерностями, для этого мы прибегаем к<strong>корреляционному анализу</strong>. Если корреляция близка по модулю к 1, то факторы влияют одинаково. Если она близка к 0, то факторы влияют по-разному.</p>
32
<p>На разные магазины случайные факторы могут влиять по-разному. Мы можем находить магазины с похожими закономерностями, для этого мы прибегаем к<strong>корреляционному анализу</strong>. Если корреляция близка по модулю к 1, то факторы влияют одинаково. Если она близка к 0, то факторы влияют по-разному.</p>
33
<p>Ниже рассмотрим примеры корреляции для продаж магазинов. Используемая функция возвращает корреляции в виде матрицы - тем самым она помогает найти корреляции для нескольких массивов. В случае с двумя массивами нас интересует значение в первой строке и втором столбце:</p>
33
<p>Ниже рассмотрим примеры корреляции для продаж магазинов. Используемая функция возвращает корреляции в виде матрицы - тем самым она помогает найти корреляции для нескольких массивов. В случае с двумя массивами нас интересует значение в первой строке и втором столбце:</p>
34
<h2>Выводы</h2>
34
<h2>Выводы</h2>
35
<p>В этом уроке мы рассмотрели математические и статистические функции библиотеки Numpy, которые используют при решении аналитических задач. На практических примерах мы увидели правила и приемы их использования.</p>
35
<p>В этом уроке мы рассмотрели математические и статистические функции библиотеки Numpy, которые используют при решении аналитических задач. На практических примерах мы увидели правила и приемы их использования.</p>
36
<p>Эти знания упрощают работу с библиотеками, использующими Numpy. На это есть несколько причин:</p>
36
<p>Эти знания упрощают работу с библиотеками, использующими Numpy. На это есть несколько причин:</p>
37
<ul><li>Интерфейсы многих функций используют принципы построения функций в Numpy</li>
37
<ul><li>Интерфейсы многих функций используют принципы построения функций в Numpy</li>
38
<li>В других библиотеках структуры данных - это Numpy-масcивы</li>
38
<li>В других библиотеках структуры данных - это Numpy-масcивы</li>
39
<li>Методы структур данных можно дополнить методами массивов Numpy с небольшими доработками</li>
39
<li>Методы структур данных можно дополнить методами массивов Numpy с небольшими доработками</li>
40
</ul>
40
</ul>