HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-02-26
1 <p><strong>В этой статье вместе с математиком и дата-сайентистом Василием Васильевым разберемся в перспективах и популярности профессии аналитик данных в 2022 году, поговорим о навыках и инструментах, необходимых для работы, и о источниках идей для первых проектов.</strong></p>
1 <p><strong>В этой статье вместе с математиком и дата-сайентистом Василием Васильевым разберемся в перспективах и популярности профессии аналитик данных в 2022 году, поговорим о навыках и инструментах, необходимых для работы, и о источниках идей для первых проектов.</strong></p>
2 <h2>Кто такой аналитик данных</h2>
2 <h2>Кто такой аналитик данных</h2>
3 <p>Начнем с простого примера. Представьте, что ваш ребенок нарисовал картину и вам нужно найти инструмент, чтобы повесить ее. Можно использовать гвозди, но чем их забить - непонятно. Можно сделать это кулаком, но, наверное, будет больно. Можно книжкой, но, наверно, жалко. Самый удобный инструмент - молоток.</p>
3 <p>Начнем с простого примера. Представьте, что ваш ребенок нарисовал картину и вам нужно найти инструмент, чтобы повесить ее. Можно использовать гвозди, но чем их забить - непонятно. Можно сделать это кулаком, но, наверное, будет больно. Можно книжкой, но, наверно, жалко. Самый удобный инструмент - молоток.</p>
4 <p>В работе с большими объемами данных инструмент - математические модели. Они помогают найти связи между разрозненными наборами информации и перевести ее на язык, понятный человеку. Сбором, обработкой данных и построением математических моделей занимается Data Analyst. Результат его работы - наглядные выводы (схема, диаграмма или инфографика), которые можно использовать для принятия бизнес-решений.</p>
4 <p>В работе с большими объемами данных инструмент - математические модели. Они помогают найти связи между разрозненными наборами информации и перевести ее на язык, понятный человеку. Сбором, обработкой данных и построением математических моделей занимается Data Analyst. Результат его работы - наглядные выводы (схема, диаграмма или инфографика), которые можно использовать для принятия бизнес-решений.</p>
5 <p>Аналитик данных, например, помогает ответить на следующие вопросы:</p>
5 <p>Аналитик данных, например, помогает ответить на следующие вопросы:</p>
6 <ul><li>На каких клиентов должен ориентироваться бизнес в своей следующей рекламной кампании</li>
6 <ul><li>На каких клиентов должен ориентироваться бизнес в своей следующей рекламной кампании</li>
7 <li>Какая возрастная группа наиболее уязвима для того или иного заболевания</li>
7 <li>Какая возрастная группа наиболее уязвима для того или иного заболевания</li>
8 <li>Какие модели поведения связаны с финансовым мошенничеством.</li>
8 <li>Какие модели поведения связаны с финансовым мошенничеством.</li>
9 </ul><p>Спрос на аналитиков данных постоянно растет - это сравнительно новая сфера, в которой число вакансий существенно превышает предложение. По<a>прогнозам</a>Всемирного экономического форума, с 2020 до 2030 года количество вакансий для аналитика данных вырастет на 25%. Это существенно быстрее, чем общий темп роста занятости (7,7% за тот же период).</p>
9 </ul><p>Спрос на аналитиков данных постоянно растет - это сравнительно новая сфера, в которой число вакансий существенно превышает предложение. По<a>прогнозам</a>Всемирного экономического форума, с 2020 до 2030 года количество вакансий для аналитика данных вырастет на 25%. Это существенно быстрее, чем общий темп роста занятости (7,7% за тот же период).</p>
10 <h2>С чего начать учиться</h2>
10 <h2>С чего начать учиться</h2>
11 <p>Без знания математики анализировать данные будет довольно сложно. На начальном уровне достаточно понимать производные на уровне школьной программы, уметь применять метод градиентного спуска, знать теорию вероятностей, основы дискретной математики и статистики.</p>
11 <p>Без знания математики анализировать данные будет довольно сложно. На начальном уровне достаточно понимать производные на уровне школьной программы, уметь применять метод градиентного спуска, знать теорию вероятностей, основы дискретной математики и статистики.</p>
12 <p>Если говорить о выборе языка программирования, то чаще аналитики работают со связкой Python и SQL. В вакансиях чаще упоминаются Python-библиотеки Pandas и NumPy. Если говорить об инструментах для визуализации данных, то чаще встречаются следующие:</p>
12 <p>Если говорить о выборе языка программирования, то чаще аналитики работают со связкой Python и SQL. В вакансиях чаще упоминаются Python-библиотеки Pandas и NumPy. Если говорить об инструментах для визуализации данных, то чаще встречаются следующие:</p>
13 <ul><li><strong>Matplotlib</strong>- Python-библиотека для визуализации данных двумерной графикой.</li>
13 <ul><li><strong>Matplotlib</strong>- Python-библиотека для визуализации данных двумерной графикой.</li>
14 <li><strong>Seaborn</strong>- еще одна Python-библиотека для создания статистических графиков.</li>
14 <li><strong>Seaborn</strong>- еще одна Python-библиотека для создания статистических графиков.</li>
15 <li><strong>Power BI</strong>- комплекс программных служб от Microsoft, в числе которых инструменты для визуализации данных.</li>
15 <li><strong>Power BI</strong>- комплекс программных служб от Microsoft, в числе которых инструменты для визуализации данных.</li>
16 <li><strong>Metabase</strong>- сервис, котрый позволяет хранить данные, создавать DataLake, строить гибкие запросы и визуализировать отчеты.</li>
16 <li><strong>Metabase</strong>- сервис, котрый позволяет хранить данные, создавать DataLake, строить гибкие запросы и визуализировать отчеты.</li>
17 </ul><p>Стоит отметить, что знать все перечисленные выше инструменты визуалиции не обязательно: часто в вакансиях указывают одну из них на выбор.</p>
17 </ul><p>Стоит отметить, что знать все перечисленные выше инструменты визуалиции не обязательно: часто в вакансиях указывают одну из них на выбор.</p>
18 <p>Стоит отметить, что существуют<a>no-code решения</a>с готовыми математическими моделями, в которые достаточно загрузить данные. Однако пользоваться ими стоит только в случае, если вы понимаете, что происходит внутри математической модели. В противном случае в результате анализа может быть много ошибок, которые напрямую повлияют на качества информации, которую предоставляет аналитик.</p>
18 <p>Стоит отметить, что существуют<a>no-code решения</a>с готовыми математическими моделями, в которые достаточно загрузить данные. Однако пользоваться ими стоит только в случае, если вы понимаете, что происходит внутри математической модели. В противном случае в результате анализа может быть много ошибок, которые напрямую повлияют на качества информации, которую предоставляет аналитик.</p>
19 <h2>Какими источниками пользоваться</h2>
19 <h2>Какими источниками пользоваться</h2>
20 <p>Выше уже говорилось, аналитику данных важно уделять много внимания математике, а не только учиться писать код. Вот несколько бесплатных курсов, которые помогут понять, в каком направлении двигаться:</p>
20 <p>Выше уже говорилось, аналитику данных важно уделять много внимания математике, а не только учиться писать код. Вот несколько бесплатных курсов, которые помогут понять, в каком направлении двигаться:</p>
21 <ul><li><a>Введение в математический анализ</a>, Александр Храбров, ВШЭ</li>
21 <ul><li><a>Введение в математический анализ</a>, Александр Храбров, ВШЭ</li>
22 <li><a>Введение в математическую логику</a>, Хекслет</li>
22 <li><a>Введение в математическую логику</a>, Хекслет</li>
23 <li><a>Теория вероятностей</a>, Александр Храбров, ВШЭ</li>
23 <li><a>Теория вероятностей</a>, Александр Храбров, ВШЭ</li>
24 <li><a>Python: Основы программирования</a>, Хекслет</li>
24 <li><a>Python: Основы программирования</a>, Хекслет</li>
25 <li><a>Открытый курс по машинному обучению</a>, сообщество Open Data Science</li>
25 <li><a>Открытый курс по машинному обучению</a>, сообщество Open Data Science</li>
26 </ul><p>Отдельные темы, связанные с анализом данных, обсуждаются на форуме<a>cyberforum</a>в разделах, посвященных базам данных, Python и SQL. Несмотря на устаревший дизайн, пользователи форума достаточно активно отвечают на вопросы и помогают решать проблемы.</p>
26 </ul><p>Отдельные темы, связанные с анализом данных, обсуждаются на форуме<a>cyberforum</a>в разделах, посвященных базам данных, Python и SQL. Несмотря на устаревший дизайн, пользователи форума достаточно активно отвечают на вопросы и помогают решать проблемы.</p>
27 <p>В списке книг -<a>Data Science from Scratch</a>Джоэла Граса (в русском переводе "Data Science. Наука о данных с нуля") и<a>Data Science for Business</a>Фостера Провоста. Обе предназначены для новичков, которые уже знакомы с математикой, и посвящены базовым принципам анализа данных.</p>
27 <p>В списке книг -<a>Data Science from Scratch</a>Джоэла Граса (в русском переводе "Data Science. Наука о данных с нуля") и<a>Data Science for Business</a>Фостера Провоста. Обе предназначены для новичков, которые уже знакомы с математикой, и посвящены базовым принципам анализа данных.</p>
28 <h2>Как проверить знания на практике</h2>
28 <h2>Как проверить знания на практике</h2>
29 <p><a>Kaggle</a>- крупнейшее в мире англоязычное сообщество дата-сайентистов и платформа для тренировки навыков по анализу данных. На ней есть раздел Learns с классическими задачами на анализ данных и Competition с более сложными кейсами, которые можно решать одному или в команде.</p>
29 <p><a>Kaggle</a>- крупнейшее в мире англоязычное сообщество дата-сайентистов и платформа для тренировки навыков по анализу данных. На ней есть раздел Learns с классическими задачами на анализ данных и Competition с более сложными кейсами, которые можно решать одному или в команде.</p>
30 <p>Кроме того, можно решать задачи из вступительных экзаменов прошлых лет в Высшую школу экономики (ВШЭ), Российскую экономическую школу (РЭШ) или Школу анализа данных (ШАД). Они доступны в открытом доступе, а результаты можно обсудить, например, с пользователями<a>cyberforum</a>.</p>
30 <p>Кроме того, можно решать задачи из вступительных экзаменов прошлых лет в Высшую школу экономики (ВШЭ), Российскую экономическую школу (РЭШ) или Школу анализа данных (ШАД). Они доступны в открытом доступе, а результаты можно обсудить, например, с пользователями<a>cyberforum</a>.</p>
31 <h2>На какую зарплату можно рассчитывать</h2>
31 <h2>На какую зарплату можно рассчитывать</h2>
32 <p>По данным рекрутингового сервиса HH, в апреле 2022 года в России открыто 10 536 вакансий Data Analyst. Подавляющее большинство из них - в Москве (<em>5 536</em>), далее следуют Санкт-Петербург (<em>1 356</em>), Свердловская область (<em>314</em>) и Татарстан (307).</p>
32 <p>По данным рекрутингового сервиса HH, в апреле 2022 года в России открыто 10 536 вакансий Data Analyst. Подавляющее большинство из них - в Москве (<em>5 536</em>), далее следуют Санкт-Петербург (<em>1 356</em>), Свердловская область (<em>314</em>) и Татарстан (307).</p>
33 <p>Средняя зарплата аналитика данных, по<a>подсчетам</a>сервиса Zarplan, в апреле 2022 года составляет 227 тыс. рублей. Минимальная зарплата составляет 60 тыс., максимальная - 500 тыс. рублей для руководителя команды анализа данных.</p>
33 <p>Средняя зарплата аналитика данных, по<a>подсчетам</a>сервиса Zarplan, в апреле 2022 года составляет 227 тыс. рублей. Минимальная зарплата составляет 60 тыс., максимальная - 500 тыс. рублей для руководителя команды анализа данных.</p>
34 <h2>Вместо заключения</h2>
34 <h2>Вместо заключения</h2>
35 <p>Главный итог обучения - смена профессии. Вот несколько советов, с чего начать переход от задач и тренировки к реальным проектам в портфолио:</p>
35 <p>Главный итог обучения - смена профессии. Вот несколько советов, с чего начать переход от задач и тренировки к реальным проектам в портфолио:</p>
36 <ul><li><strong>Автоматизация рутинных задач</strong></li>
36 <ul><li><strong>Автоматизация рутинных задач</strong></li>
37 </ul><p>Лучшее, с чего можно начать - найти в своей жизни момент, который можно автоматизировать. Например, посчитать, сколько страниц книги вы читаете в день и как количество прочитанных страниц зависит от времени, в которое вы читаете.</p>
37 </ul><p>Лучшее, с чего можно начать - найти в своей жизни момент, который можно автоматизировать. Например, посчитать, сколько страниц книги вы читаете в день и как количество прочитанных страниц зависит от времени, в которое вы читаете.</p>
38 <ul><li><strong>Задачи, которые встречаются в реальных проектах</strong></li>
38 <ul><li><strong>Задачи, которые встречаются в реальных проектах</strong></li>
39 </ul><p>Можно попробовать решить задачи, которые встречаются в реальных проектах. Часто их можно найти в тестовых заданиях компаний, которые ищут аналитиков данных. В<a>отдельном репозитории</a>Хекслета на GitHub есть около сотни реальных тестовых заданий российских и зарубежных компаний.</p>
39 </ul><p>Можно попробовать решить задачи, которые встречаются в реальных проектах. Часто их можно найти в тестовых заданиях компаний, которые ищут аналитиков данных. В<a>отдельном репозитории</a>Хекслета на GitHub есть около сотни реальных тестовых заданий российских и зарубежных компаний.</p>
40 <ul><li><strong>Принять участие в опенсорс-проекте</strong></li>
40 <ul><li><strong>Принять участие в опенсорс-проекте</strong></li>
41 </ul><p>Опенсорс - настоящие проекты или реальный продакшен. Участие в них дает новичку опыт работы в команде, учит ответственности, планированию, тайм-менеджменту и помогает применить знания на практике.</p>
41 </ul><p>Опенсорс - настоящие проекты или реальный продакшен. Участие в них дает новичку опыт работы в команде, учит ответственности, планированию, тайм-менеджменту и помогает применить знания на практике.</p>