0 added
0 removed
Original
2026-01-01
Modified
2026-02-26
1
<p><strong>В этой статье вместе с математиком и дата-сайентистом Василием Васильевым разберемся в перспективах и популярности профессии аналитик данных в 2022 году, поговорим о навыках и инструментах, необходимых для работы, и о источниках идей для первых проектов.</strong></p>
1
<p><strong>В этой статье вместе с математиком и дата-сайентистом Василием Васильевым разберемся в перспективах и популярности профессии аналитик данных в 2022 году, поговорим о навыках и инструментах, необходимых для работы, и о источниках идей для первых проектов.</strong></p>
2
<h2>Кто такой аналитик данных</h2>
2
<h2>Кто такой аналитик данных</h2>
3
<p>Начнем с простого примера. Представьте, что ваш ребенок нарисовал картину и вам нужно найти инструмент, чтобы повесить ее. Можно использовать гвозди, но чем их забить - непонятно. Можно сделать это кулаком, но, наверное, будет больно. Можно книжкой, но, наверно, жалко. Самый удобный инструмент - молоток.</p>
3
<p>Начнем с простого примера. Представьте, что ваш ребенок нарисовал картину и вам нужно найти инструмент, чтобы повесить ее. Можно использовать гвозди, но чем их забить - непонятно. Можно сделать это кулаком, но, наверное, будет больно. Можно книжкой, но, наверно, жалко. Самый удобный инструмент - молоток.</p>
4
<p>В работе с большими объемами данных инструмент - математические модели. Они помогают найти связи между разрозненными наборами информации и перевести ее на язык, понятный человеку. Сбором, обработкой данных и построением математических моделей занимается Data Analyst. Результат его работы - наглядные выводы (схема, диаграмма или инфографика), которые можно использовать для принятия бизнес-решений.</p>
4
<p>В работе с большими объемами данных инструмент - математические модели. Они помогают найти связи между разрозненными наборами информации и перевести ее на язык, понятный человеку. Сбором, обработкой данных и построением математических моделей занимается Data Analyst. Результат его работы - наглядные выводы (схема, диаграмма или инфографика), которые можно использовать для принятия бизнес-решений.</p>
5
<p>Аналитик данных, например, помогает ответить на следующие вопросы:</p>
5
<p>Аналитик данных, например, помогает ответить на следующие вопросы:</p>
6
<ul><li>На каких клиентов должен ориентироваться бизнес в своей следующей рекламной кампании</li>
6
<ul><li>На каких клиентов должен ориентироваться бизнес в своей следующей рекламной кампании</li>
7
<li>Какая возрастная группа наиболее уязвима для того или иного заболевания</li>
7
<li>Какая возрастная группа наиболее уязвима для того или иного заболевания</li>
8
<li>Какие модели поведения связаны с финансовым мошенничеством.</li>
8
<li>Какие модели поведения связаны с финансовым мошенничеством.</li>
9
</ul><p>Спрос на аналитиков данных постоянно растет - это сравнительно новая сфера, в которой число вакансий существенно превышает предложение. По<a>прогнозам</a>Всемирного экономического форума, с 2020 до 2030 года количество вакансий для аналитика данных вырастет на 25%. Это существенно быстрее, чем общий темп роста занятости (7,7% за тот же период).</p>
9
</ul><p>Спрос на аналитиков данных постоянно растет - это сравнительно новая сфера, в которой число вакансий существенно превышает предложение. По<a>прогнозам</a>Всемирного экономического форума, с 2020 до 2030 года количество вакансий для аналитика данных вырастет на 25%. Это существенно быстрее, чем общий темп роста занятости (7,7% за тот же период).</p>
10
<h2>С чего начать учиться</h2>
10
<h2>С чего начать учиться</h2>
11
<p>Без знания математики анализировать данные будет довольно сложно. На начальном уровне достаточно понимать производные на уровне школьной программы, уметь применять метод градиентного спуска, знать теорию вероятностей, основы дискретной математики и статистики.</p>
11
<p>Без знания математики анализировать данные будет довольно сложно. На начальном уровне достаточно понимать производные на уровне школьной программы, уметь применять метод градиентного спуска, знать теорию вероятностей, основы дискретной математики и статистики.</p>
12
<p>Если говорить о выборе языка программирования, то чаще аналитики работают со связкой Python и SQL. В вакансиях чаще упоминаются Python-библиотеки Pandas и NumPy. Если говорить об инструментах для визуализации данных, то чаще встречаются следующие:</p>
12
<p>Если говорить о выборе языка программирования, то чаще аналитики работают со связкой Python и SQL. В вакансиях чаще упоминаются Python-библиотеки Pandas и NumPy. Если говорить об инструментах для визуализации данных, то чаще встречаются следующие:</p>
13
<ul><li><strong>Matplotlib</strong>- Python-библиотека для визуализации данных двумерной графикой.</li>
13
<ul><li><strong>Matplotlib</strong>- Python-библиотека для визуализации данных двумерной графикой.</li>
14
<li><strong>Seaborn</strong>- еще одна Python-библиотека для создания статистических графиков.</li>
14
<li><strong>Seaborn</strong>- еще одна Python-библиотека для создания статистических графиков.</li>
15
<li><strong>Power BI</strong>- комплекс программных служб от Microsoft, в числе которых инструменты для визуализации данных.</li>
15
<li><strong>Power BI</strong>- комплекс программных служб от Microsoft, в числе которых инструменты для визуализации данных.</li>
16
<li><strong>Metabase</strong>- сервис, котрый позволяет хранить данные, создавать DataLake, строить гибкие запросы и визуализировать отчеты.</li>
16
<li><strong>Metabase</strong>- сервис, котрый позволяет хранить данные, создавать DataLake, строить гибкие запросы и визуализировать отчеты.</li>
17
</ul><p>Стоит отметить, что знать все перечисленные выше инструменты визуалиции не обязательно: часто в вакансиях указывают одну из них на выбор.</p>
17
</ul><p>Стоит отметить, что знать все перечисленные выше инструменты визуалиции не обязательно: часто в вакансиях указывают одну из них на выбор.</p>
18
<p>Стоит отметить, что существуют<a>no-code решения</a>с готовыми математическими моделями, в которые достаточно загрузить данные. Однако пользоваться ими стоит только в случае, если вы понимаете, что происходит внутри математической модели. В противном случае в результате анализа может быть много ошибок, которые напрямую повлияют на качества информации, которую предоставляет аналитик.</p>
18
<p>Стоит отметить, что существуют<a>no-code решения</a>с готовыми математическими моделями, в которые достаточно загрузить данные. Однако пользоваться ими стоит только в случае, если вы понимаете, что происходит внутри математической модели. В противном случае в результате анализа может быть много ошибок, которые напрямую повлияют на качества информации, которую предоставляет аналитик.</p>
19
<h2>Какими источниками пользоваться</h2>
19
<h2>Какими источниками пользоваться</h2>
20
<p>Выше уже говорилось, аналитику данных важно уделять много внимания математике, а не только учиться писать код. Вот несколько бесплатных курсов, которые помогут понять, в каком направлении двигаться:</p>
20
<p>Выше уже говорилось, аналитику данных важно уделять много внимания математике, а не только учиться писать код. Вот несколько бесплатных курсов, которые помогут понять, в каком направлении двигаться:</p>
21
<ul><li><a>Введение в математический анализ</a>, Александр Храбров, ВШЭ</li>
21
<ul><li><a>Введение в математический анализ</a>, Александр Храбров, ВШЭ</li>
22
<li><a>Введение в математическую логику</a>, Хекслет</li>
22
<li><a>Введение в математическую логику</a>, Хекслет</li>
23
<li><a>Теория вероятностей</a>, Александр Храбров, ВШЭ</li>
23
<li><a>Теория вероятностей</a>, Александр Храбров, ВШЭ</li>
24
<li><a>Python: Основы программирования</a>, Хекслет</li>
24
<li><a>Python: Основы программирования</a>, Хекслет</li>
25
<li><a>Открытый курс по машинному обучению</a>, сообщество Open Data Science</li>
25
<li><a>Открытый курс по машинному обучению</a>, сообщество Open Data Science</li>
26
</ul><p>Отдельные темы, связанные с анализом данных, обсуждаются на форуме<a>cyberforum</a>в разделах, посвященных базам данных, Python и SQL. Несмотря на устаревший дизайн, пользователи форума достаточно активно отвечают на вопросы и помогают решать проблемы.</p>
26
</ul><p>Отдельные темы, связанные с анализом данных, обсуждаются на форуме<a>cyberforum</a>в разделах, посвященных базам данных, Python и SQL. Несмотря на устаревший дизайн, пользователи форума достаточно активно отвечают на вопросы и помогают решать проблемы.</p>
27
<p>В списке книг -<a>Data Science from Scratch</a>Джоэла Граса (в русском переводе "Data Science. Наука о данных с нуля") и<a>Data Science for Business</a>Фостера Провоста. Обе предназначены для новичков, которые уже знакомы с математикой, и посвящены базовым принципам анализа данных.</p>
27
<p>В списке книг -<a>Data Science from Scratch</a>Джоэла Граса (в русском переводе "Data Science. Наука о данных с нуля") и<a>Data Science for Business</a>Фостера Провоста. Обе предназначены для новичков, которые уже знакомы с математикой, и посвящены базовым принципам анализа данных.</p>
28
<h2>Как проверить знания на практике</h2>
28
<h2>Как проверить знания на практике</h2>
29
<p><a>Kaggle</a>- крупнейшее в мире англоязычное сообщество дата-сайентистов и платформа для тренировки навыков по анализу данных. На ней есть раздел Learns с классическими задачами на анализ данных и Competition с более сложными кейсами, которые можно решать одному или в команде.</p>
29
<p><a>Kaggle</a>- крупнейшее в мире англоязычное сообщество дата-сайентистов и платформа для тренировки навыков по анализу данных. На ней есть раздел Learns с классическими задачами на анализ данных и Competition с более сложными кейсами, которые можно решать одному или в команде.</p>
30
<p>Кроме того, можно решать задачи из вступительных экзаменов прошлых лет в Высшую школу экономики (ВШЭ), Российскую экономическую школу (РЭШ) или Школу анализа данных (ШАД). Они доступны в открытом доступе, а результаты можно обсудить, например, с пользователями<a>cyberforum</a>.</p>
30
<p>Кроме того, можно решать задачи из вступительных экзаменов прошлых лет в Высшую школу экономики (ВШЭ), Российскую экономическую школу (РЭШ) или Школу анализа данных (ШАД). Они доступны в открытом доступе, а результаты можно обсудить, например, с пользователями<a>cyberforum</a>.</p>
31
<h2>На какую зарплату можно рассчитывать</h2>
31
<h2>На какую зарплату можно рассчитывать</h2>
32
<p>По данным рекрутингового сервиса HH, в апреле 2022 года в России открыто 10 536 вакансий Data Analyst. Подавляющее большинство из них - в Москве (<em>5 536</em>), далее следуют Санкт-Петербург (<em>1 356</em>), Свердловская область (<em>314</em>) и Татарстан (307).</p>
32
<p>По данным рекрутингового сервиса HH, в апреле 2022 года в России открыто 10 536 вакансий Data Analyst. Подавляющее большинство из них - в Москве (<em>5 536</em>), далее следуют Санкт-Петербург (<em>1 356</em>), Свердловская область (<em>314</em>) и Татарстан (307).</p>
33
<p>Средняя зарплата аналитика данных, по<a>подсчетам</a>сервиса Zarplan, в апреле 2022 года составляет 227 тыс. рублей. Минимальная зарплата составляет 60 тыс., максимальная - 500 тыс. рублей для руководителя команды анализа данных.</p>
33
<p>Средняя зарплата аналитика данных, по<a>подсчетам</a>сервиса Zarplan, в апреле 2022 года составляет 227 тыс. рублей. Минимальная зарплата составляет 60 тыс., максимальная - 500 тыс. рублей для руководителя команды анализа данных.</p>
34
<h2>Вместо заключения</h2>
34
<h2>Вместо заключения</h2>
35
<p>Главный итог обучения - смена профессии. Вот несколько советов, с чего начать переход от задач и тренировки к реальным проектам в портфолио:</p>
35
<p>Главный итог обучения - смена профессии. Вот несколько советов, с чего начать переход от задач и тренировки к реальным проектам в портфолио:</p>
36
<ul><li><strong>Автоматизация рутинных задач</strong></li>
36
<ul><li><strong>Автоматизация рутинных задач</strong></li>
37
</ul><p>Лучшее, с чего можно начать - найти в своей жизни момент, который можно автоматизировать. Например, посчитать, сколько страниц книги вы читаете в день и как количество прочитанных страниц зависит от времени, в которое вы читаете.</p>
37
</ul><p>Лучшее, с чего можно начать - найти в своей жизни момент, который можно автоматизировать. Например, посчитать, сколько страниц книги вы читаете в день и как количество прочитанных страниц зависит от времени, в которое вы читаете.</p>
38
<ul><li><strong>Задачи, которые встречаются в реальных проектах</strong></li>
38
<ul><li><strong>Задачи, которые встречаются в реальных проектах</strong></li>
39
</ul><p>Можно попробовать решить задачи, которые встречаются в реальных проектах. Часто их можно найти в тестовых заданиях компаний, которые ищут аналитиков данных. В<a>отдельном репозитории</a>Хекслета на GitHub есть около сотни реальных тестовых заданий российских и зарубежных компаний.</p>
39
</ul><p>Можно попробовать решить задачи, которые встречаются в реальных проектах. Часто их можно найти в тестовых заданиях компаний, которые ищут аналитиков данных. В<a>отдельном репозитории</a>Хекслета на GitHub есть около сотни реальных тестовых заданий российских и зарубежных компаний.</p>
40
<ul><li><strong>Принять участие в опенсорс-проекте</strong></li>
40
<ul><li><strong>Принять участие в опенсорс-проекте</strong></li>
41
</ul><p>Опенсорс - настоящие проекты или реальный продакшен. Участие в них дает новичку опыт работы в команде, учит ответственности, планированию, тайм-менеджменту и помогает применить знания на практике.</p>
41
</ul><p>Опенсорс - настоящие проекты или реальный продакшен. Участие в них дает новичку опыт работы в команде, учит ответственности, планированию, тайм-менеджменту и помогает применить знания на практике.</p>