HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-02-26
1 <p>Библиотека Numpy используется в модулях для работы с различными типами данных:</p>
1 <p>Библиотека Numpy используется в модулях для работы с различными типами данных:</p>
2 <ul><li>Научными данными - SciPy</li>
2 <ul><li>Научными данными - SciPy</li>
3 <li>Табличными данными - Pandas</li>
3 <li>Табличными данными - Pandas</li>
4 <li>Визуализацией данных - Matplotlib, Plotly, Seaborn</li>
4 <li>Визуализацией данных - Matplotlib, Plotly, Seaborn</li>
5 <li>Алгоритмами машинного обучения - Sklearn</li>
5 <li>Алгоритмами машинного обучения - Sklearn</li>
6 <li>Тензорами и глубокими нейронными сетями - TensorFlow</li>
6 <li>Тензорами и глубокими нейронными сетями - TensorFlow</li>
7 <li>Изображениями - OpenCV</li>
7 <li>Изображениями - OpenCV</li>
8 </ul><p>Так произошло, потому что Numpy позволяет использовать единый интерфейс для работы с разными многомерными структурами данных и содержит широкий спектр операций для этого. В этом уроке мы познакомимся с математическими и статистическими методами библиотеки, решив ряд аналитических задач.</p>
8 </ul><p>Так произошло, потому что Numpy позволяет использовать единый интерфейс для работы с разными многомерными структурами данных и содержит широкий спектр операций для этого. В этом уроке мы познакомимся с математическими и статистическими методами библиотеки, решив ряд аналитических задач.</p>
9 <p>Рассмотрим недельные данные продаж в сети четырех магазинов:</p>
9 <p>Рассмотрим недельные данные продаж в сети четырех магазинов:</p>
10 <p>Одна из базовых задач аналитика - знакомство с данными. Типичный подход к этому вопросу - это оценка суммы заказов во всей сети и в каждом магазине по отдельности:</p>
10 <p>Одна из базовых задач аналитика - знакомство с данными. Типичный подход к этому вопросу - это оценка суммы заказов во всей сети и в каждом магазине по отдельности:</p>
11 <p>Кроме интегральных показателей, для оценки полезно понимать разброс значений от минимального до максимального. Мы можем обнаружить крайние значения и использовать эти данные, чтобы найти ошибки и расследовать инциденты в работе сети:</p>
11 <p>Кроме интегральных показателей, для оценки полезно понимать разброс значений от минимального до максимального. Мы можем обнаружить крайние значения и использовать эти данные, чтобы найти ошибки и расследовать инциденты в работе сети:</p>
12 <p>По абсолютным цифрам не всегда получается проверить гипотезы о состоянии сети. Для этого удобно смотреть на показатели относительно общего числа продаж:</p>
12 <p>По абсолютным цифрам не всегда получается проверить гипотезы о состоянии сети. Для этого удобно смотреть на показатели относительно общего числа продаж:</p>
13 <p>Раньше в аналитике использовались статические показатели, которые не показывают динамику изменений во времени. А теперь для оценки прироста заказов по дням можно использовать кумулятивные суммы и конечные разности.</p>
13 <p>Раньше в аналитике использовались статические показатели, которые не показывают динамику изменений во времени. А теперь для оценки прироста заказов по дням можно использовать кумулятивные суммы и конечные разности.</p>
14 <p>В примере ниже показана сумма для первого магазина. Каждое следующее значение равно сумме предыдущего и количеству продаж в этот день:</p>
14 <p>В примере ниже показана сумма для первого магазина. Каждое следующее значение равно сумме предыдущего и количеству продаж в этот день:</p>
15 <p>В случае разности для всех магазинов каждая строка представляет собой поэлементную разность показателей соседних дней:</p>
15 <p>В случае разности для всех магазинов каждая строка представляет собой поэлементную разность показателей соседних дней:</p>
16 <p>Фиксированная точность в расчетах требует выполнить один из двух вариантов:</p>
16 <p>Фиксированная точность в расчетах требует выполнить один из двух вариантов:</p>
17 <ul><li>Округлить полученные показатели до целых значений сверху, снизу или к ближайшему</li>
17 <ul><li>Округлить полученные показатели до целых значений сверху, снизу или к ближайшему</li>
18 <li>Оставить определенное количество знаков после запятой</li>
18 <li>Оставить определенное количество знаков после запятой</li>
19 </ul><p>Все эти подходы реализованы в Numpy. Ниже в примере рассмотрим приемы округления для относительных показателей продаж в магазинах. В качестве относительной величины берем среднее по всей сети:</p>
19 </ul><p>Все эти подходы реализованы в Numpy. Ниже в примере рассмотрим приемы округления для относительных показателей продаж в магазинах. В качестве относительной величины берем среднее по всей сети:</p>
20 <p>На продажи в магазинах могут влиять разные факторы:</p>
20 <p>На продажи в магазинах могут влиять разные факторы:</p>
21 <ul><li>Выходные, предпраздничные и праздничные дни</li>
21 <ul><li>Выходные, предпраздничные и праздничные дни</li>
22 <li>Акции</li>
22 <li>Акции</li>
23 <li>Логистические задержки</li>
23 <li>Логистические задержки</li>
24 <li>Погода</li>
24 <li>Погода</li>
25 </ul><p>Все они по-разному отражаются на продажах. Если факторы плановые, то их последствия можно точно предугадать. А вот если они имеют вероятностную природу, то точность существенно падает.</p>
25 </ul><p>Все они по-разному отражаются на продажах. Если факторы плановые, то их последствия можно точно предугадать. А вот если они имеют вероятностную природу, то точность существенно падает.</p>
26 <p>В этих случаях используют статистические методы. Они позволяют оценить влияние факторов на продажи. Аналитики сперва находят статистические показатели:</p>
26 <p>В этих случаях используют статистические методы. Они позволяют оценить влияние факторов на продажи. Аналитики сперва находят статистические показатели:</p>
27 <ul><li>Среднее - какое число продаж можно ожидать, если взять случайный день недели и магазин</li>
27 <ul><li>Среднее - какое число продаж можно ожидать, если взять случайный день недели и магазин</li>
28 <li>Отклонение от среднего - насколько сильно реальные показатели могут отличаться от среднего</li>
28 <li>Отклонение от среднего - насколько сильно реальные показатели могут отличаться от среднего</li>
29 <li>Медиана - значение продаж, в сравнение с которым ровно половина продаж - меньше, а другая половина - больше</li>
29 <li>Медиана - значение продаж, в сравнение с которым ровно половина продаж - меньше, а другая половина - больше</li>
30 </ul><p>Посмотрим, как находить такие показатели:</p>
30 </ul><p>Посмотрим, как находить такие показатели:</p>
31 <p>Более детальный анализ продаж может потребовать использования персентилей.<strong>Персентиль N%</strong>показывает значение продаж, относительно которого N% продаж меньше. Например, персентиль 50% дает значение продаж, относительно которого в данных ровно 50% значений меньше его. Оно совпадает с медианным значением. Часто используют персентили 25%, 50% и 75%:</p>
31 <p>Более детальный анализ продаж может потребовать использования персентилей.<strong>Персентиль N%</strong>показывает значение продаж, относительно которого N% продаж меньше. Например, персентиль 50% дает значение продаж, относительно которого в данных ровно 50% значений меньше его. Оно совпадает с медианным значением. Часто используют персентили 25%, 50% и 75%:</p>
32 <p>На разные магазины случайные факторы могут влиять по-разному. Мы можем находить магазины с похожими закономерностями, для этого мы прибегаем к<strong>корреляционному анализу</strong>. Если корреляция близка по модулю к 1, то факторы влияют одинаково. Если она близка к 0, то факторы влияют по-разному.</p>
32 <p>На разные магазины случайные факторы могут влиять по-разному. Мы можем находить магазины с похожими закономерностями, для этого мы прибегаем к<strong>корреляционному анализу</strong>. Если корреляция близка по модулю к 1, то факторы влияют одинаково. Если она близка к 0, то факторы влияют по-разному.</p>
33 <p>Ниже рассмотрим примеры корреляции для продаж магазинов. Используемая функция возвращает корреляции в виде матрицы - тем самым она помогает найти корреляции для нескольких массивов. В случае с двумя массивами нас интересует значение в первой строке и втором столбце:</p>
33 <p>Ниже рассмотрим примеры корреляции для продаж магазинов. Используемая функция возвращает корреляции в виде матрицы - тем самым она помогает найти корреляции для нескольких массивов. В случае с двумя массивами нас интересует значение в первой строке и втором столбце:</p>
34 <h2>Выводы</h2>
34 <h2>Выводы</h2>
35 <p>В этом уроке мы рассмотрели математические и статистические функции библиотеки Numpy, которые используют при решении аналитических задач. На практических примерах мы увидели правила и приемы их использования.</p>
35 <p>В этом уроке мы рассмотрели математические и статистические функции библиотеки Numpy, которые используют при решении аналитических задач. На практических примерах мы увидели правила и приемы их использования.</p>
36 <p>Эти знания упрощают работу с библиотеками, использующими Numpy. На это есть несколько причин:</p>
36 <p>Эти знания упрощают работу с библиотеками, использующими Numpy. На это есть несколько причин:</p>
37 <ul><li>Интерфейсы многих функций используют принципы построения функций в Numpy</li>
37 <ul><li>Интерфейсы многих функций используют принципы построения функций в Numpy</li>
38 <li>В других библиотеках структуры данных - это Numpy-масcивы</li>
38 <li>В других библиотеках структуры данных - это Numpy-масcивы</li>
39 <li>Методы структур данных можно дополнить методами массивов Numpy с небольшими доработками</li>
39 <li>Методы структур данных можно дополнить методами массивов Numpy с небольшими доработками</li>
40 </ul>
40 </ul>