0 added
0 removed
Original
2026-01-01
Modified
2026-02-21
1
<p><a>#статьи</a></p>
1
<p><a>#статьи</a></p>
2
<ul><li>16 мар 2021</li>
2
<ul><li>16 мар 2021</li>
3
<li>0</li>
3
<li>0</li>
4
</ul><h2>Специалист по машинному обучению: кто такой, чем занимается и сколько получает</h2>
4
</ul><h2>Специалист по машинному обучению: кто такой, чем занимается и сколько получает</h2>
5
<p>Разбираемся, нужно ли творцам искусственного интеллекта знать математику и Python.</p>
5
<p>Разбираемся, нужно ли творцам искусственного интеллекта знать математику и Python.</p>
6
<p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
6
<p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
7
<p>Специалист по машинному обучению (ML, machine learning) - это программист, который с помощью специальных наборов данных и алгоритмов обучает<a>искусственный интеллект</a>.</p>
7
<p>Специалист по машинному обучению (ML, machine learning) - это программист, который с помощью специальных наборов данных и алгоритмов обучает<a>искусственный интеллект</a>.</p>
8
<p>Посмотрим, например, как приложение "Яндекс.Навигатор" выбирает маршрут до пункта назначения. У него есть ваши GPS-координаты и карта, но при этом он знает и о пробках, авариях, дорожном ремонте. Всё это благодаря графу дорог - алгоритм быстро анализирует возможные пути и находит самый быстрый. А программисты следят, чтобы машинный интеллект не ошибался.</p>
8
<p>Посмотрим, например, как приложение "Яндекс.Навигатор" выбирает маршрут до пункта назначения. У него есть ваши GPS-координаты и карта, но при этом он знает и о пробках, авариях, дорожном ремонте. Всё это благодаря графу дорог - алгоритм быстро анализирует возможные пути и находит самый быстрый. А программисты следят, чтобы машинный интеллект не ошибался.</p>
9
<p>Но ситуация на дорогах постоянно меняется: вчера здесь был поворот, а сегодня висит "кирпич" и водители вынуждены объезжать это место. Добавлять на карту все изменения вручную, особенно в реальном времени, слишком трудозатратно и дорого, требуется много людей. Но алгоритму совсем не обязательно знать про запрет - ему достаточно увидеть, что машины стали двигаться по-другому, чтобы перенаправить всех водителей на другие маршруты.</p>
9
<p>Но ситуация на дорогах постоянно меняется: вчера здесь был поворот, а сегодня висит "кирпич" и водители вынуждены объезжать это место. Добавлять на карту все изменения вручную, особенно в реальном времени, слишком трудозатратно и дорого, требуется много людей. Но алгоритму совсем не обязательно знать про запрет - ему достаточно увидеть, что машины стали двигаться по-другому, чтобы перенаправить всех водителей на другие маршруты.</p>
10
<p>Научить компьютер принимать такие решения - задача специалистов по ML. Без этого мы не смогли бы обработать море информации, которую люди генерируют каждый день, и сделать нашу жизнь комфортнее.</p>
10
<p>Научить компьютер принимать такие решения - задача специалистов по ML. Без этого мы не смогли бы обработать море информации, которую люди генерируют каждый день, и сделать нашу жизнь комфортнее.</p>
11
<p>Задачи специалиста по МL отличаются в разных компаниях и проектах, но чаще всего он делает вот что:</p>
11
<p>Задачи специалиста по МL отличаются в разных компаниях и проектах, но чаще всего он делает вот что:</p>
12
<ul><li><strong>Собирает и подготавливает данные.</strong>Для прокачки искусственного интеллекта необходимо много данных. И не любых, а специально размеченных. Например, чтобы научить машину отличать котиков от собак, нужно дать ей много фотографий и "подписать", на каких изображены кошки, а на каких - собаки. Такая классификация данных называется<strong>разметкой</strong>.</li>
12
<ul><li><strong>Собирает и подготавливает данные.</strong>Для прокачки искусственного интеллекта необходимо много данных. И не любых, а специально размеченных. Например, чтобы научить машину отличать котиков от собак, нужно дать ей много фотографий и "подписать", на каких изображены кошки, а на каких - собаки. Такая классификация данных называется<strong>разметкой</strong>.</li>
13
</ul><p>Собирать данные вручную сложно: если это, например. изображения, требуются сотни тысяч фото с разных ракурсов и разными условиями освещённости. "ВКонтакте" недавно запустил новую функцию - сеть показывает фото пользователей их друзьям и спрашивает: "Это Вася Иванов?" Чтобы отметить друга на фото, требуется меньше секунды. Не поленитесь и сделайте это. Так вы поможете нейросети научиться распознавать лица, а заодно почувствуете себя специалистом по ML - хоть немножко :)</p>
13
</ul><p>Собирать данные вручную сложно: если это, например. изображения, требуются сотни тысяч фото с разных ракурсов и разными условиями освещённости. "ВКонтакте" недавно запустил новую функцию - сеть показывает фото пользователей их друзьям и спрашивает: "Это Вася Иванов?" Чтобы отметить друга на фото, требуется меньше секунды. Не поленитесь и сделайте это. Так вы поможете нейросети научиться распознавать лица, а заодно почувствуете себя специалистом по ML - хоть немножко :)</p>
14
<ul><li><strong>Строит модели машинного обучения для обработки данных.</strong>Простой пример - умная лента "ВКонтакте". Чтобы показывать только интересные записи, алгоритм отслеживает ваши лайки, комментарии, предпочтения друзей и даже похожих с вами по интересам людей, а потом показывает потенциально интересные материалы. Специалисты по ML создают и обучают такие алгоритмы. Результат их работы - умная модель, которая выдаёт прогноз на основе данных. Если вкусы изменились, вы подписались на кого-то или прокомментировали пост, непременно изменится и ваша лента.</li>
14
<ul><li><strong>Строит модели машинного обучения для обработки данных.</strong>Простой пример - умная лента "ВКонтакте". Чтобы показывать только интересные записи, алгоритм отслеживает ваши лайки, комментарии, предпочтения друзей и даже похожих с вами по интересам людей, а потом показывает потенциально интересные материалы. Специалисты по ML создают и обучают такие алгоритмы. Результат их работы - умная модель, которая выдаёт прогноз на основе данных. Если вкусы изменились, вы подписались на кого-то или прокомментировали пост, непременно изменится и ваша лента.</li>
15
</ul><p>Алгоритмы для построения модели программируют под конкретные задачи. Иногда они довольно простые - например,<a>алгоритм для предсказания предпочтений туристов</a>из разных городов занимает всего 20 строчек кода.</p>
15
</ul><p>Алгоритмы для построения модели программируют под конкретные задачи. Иногда они довольно простые - например,<a>алгоритм для предсказания предпочтений туристов</a>из разных городов занимает всего 20 строчек кода.</p>
16
<p>Но бывают и очень сложные - такие как гигантская нейросеть DeepCoder. Она копирует и миксует готовые фрагменты кода, создавая на выходе новые программы. Эта технология называется программным синтезом.</p>
16
<p>Но бывают и очень сложные - такие как гигантская нейросеть DeepCoder. Она копирует и миксует готовые фрагменты кода, создавая на выходе новые программы. Эта технология называется программным синтезом.</p>
17
<p>Получается, что сама нейросеть, состоящая из миллионов строк кода, может заимствовать его из множества других программ. Алгоритм порождает другие алгоритмы - чем не цифровая жизнь?</p>
17
<p>Получается, что сама нейросеть, состоящая из миллионов строк кода, может заимствовать его из множества других программ. Алгоритм порождает другие алгоритмы - чем не цифровая жизнь?</p>
18
<p>Вы читаете эту статью, потому что задумываетесь о карьере специалиста по машинному обучению? Присмотритесь к <a>курсу Skillbox</a> - он подойдёт вам, если вы хотите стартовать в этой сфере.</p>
18
<p>Вы читаете эту статью, потому что задумываетесь о карьере специалиста по машинному обучению? Присмотритесь к <a>курсу Skillbox</a> - он подойдёт вам, если вы хотите стартовать в этой сфере.</p>
19
<ul><li>Программисту, который хочет прокачать свои знания Python, R, C++, JavaScript, Scala или Julia, подтянуть математику и научиться работать с данными и алгоритмами.</li>
19
<ul><li>Программисту, который хочет прокачать свои знания Python, R, C++, JavaScript, Scala или Julia, подтянуть математику и научиться работать с данными и алгоритмами.</li>
20
<li>Аналитику или менеджеру продуктов, который стремится получать больше данных с помощью продвинутых технологий и принимать решения на их основе.</li>
20
<li>Аналитику или менеджеру продуктов, который стремится получать больше данных с помощью продвинутых технологий и принимать решения на их основе.</li>
21
<li>Учёному, который хочет моделировать сложные процессы и находить взаимосвязи в разрозненных данных.</li>
21
<li>Учёному, который хочет моделировать сложные процессы и находить взаимосвязи в разрозненных данных.</li>
22
<li>Исследователю или data-журналисту, который стремится обнаружить истинные причины тех или иных событий и явлений этого мира.</li>
22
<li>Исследователю или data-журналисту, который стремится обнаружить истинные причины тех или иных событий и явлений этого мира.</li>
23
</ul><ul><li><strong>Аналитический склад ума, внимание к деталям</strong>. Машинное обучение - это наука, где приходится постоянно выдвигать гипотезы и проверять их.</li>
23
</ul><ul><li><strong>Аналитический склад ума, внимание к деталям</strong>. Машинное обучение - это наука, где приходится постоянно выдвигать гипотезы и проверять их.</li>
24
</ul><p>Предположим, нам нужно построить автоматическую систему рекомендаций для соцсети. Что должно лежать в основе рекомендаций? Хороший вариант - посмотреть, что лайкают друзья: людей часто объединяют интересы. Но чтобы система работала ещё лучше, придётся учитывать время года или суток, события в стране и в мире. Например, "ВКонтакте" утром чаще рекомендует новости, а вечером - мемасики про котиков и другой развлекательный контент. Чтобы всё это продумать и учесть сотни различных факторов, нужно быть готовым к кропотливой и даже монотонной работе.</p>
24
</ul><p>Предположим, нам нужно построить автоматическую систему рекомендаций для соцсети. Что должно лежать в основе рекомендаций? Хороший вариант - посмотреть, что лайкают друзья: людей часто объединяют интересы. Но чтобы система работала ещё лучше, придётся учитывать время года или суток, события в стране и в мире. Например, "ВКонтакте" утром чаще рекомендует новости, а вечером - мемасики про котиков и другой развлекательный контент. Чтобы всё это продумать и учесть сотни различных факторов, нужно быть готовым к кропотливой и даже монотонной работе.</p>
25
<ul><li><strong>Логическое мышление.</strong>Создание любой программы - это решение задачи. Необходим особый склад ума, чтобы разбить проблему из реального мира на составные части и описать алгоритм, который будет её решать.</li>
25
<ul><li><strong>Логическое мышление.</strong>Создание любой программы - это решение задачи. Необходим особый склад ума, чтобы разбить проблему из реального мира на составные части и описать алгоритм, который будет её решать.</li>
26
</ul><p>Как определить, хороший контент в соцсети или плохой? Можно посадить сотни модераторов и разработать сложную систему правил, а можно просто добавить кнопку эмоциональной реакции - например, лайк. Если у поста много лайков, значит, людям он нравится, следовательно, материал хороший и нейросеть будет показывать его как можно большему количеству людей. Возможно, эта система не идеальна, но она позволяет решить проблему относительно эффективно и с минимальной затратой ресурсов.</p>
26
</ul><p>Как определить, хороший контент в соцсети или плохой? Можно посадить сотни модераторов и разработать сложную систему правил, а можно просто добавить кнопку эмоциональной реакции - например, лайк. Если у поста много лайков, значит, людям он нравится, следовательно, материал хороший и нейросеть будет показывать его как можно большему количеству людей. Возможно, эта система не идеальна, но она позволяет решить проблему относительно эффективно и с минимальной затратой ресурсов.</p>
27
<ul><li><strong>Алгебра и дискретная математика</strong>. Они пригодятся для разбора сложных технических концепций, которые лежат в основе машинных алгоритмов. Это не значит, что без диплома матфака путь в профессию закрыт, - для начала достаточно школьной программы.</li>
27
<ul><li><strong>Алгебра и дискретная математика</strong>. Они пригодятся для разбора сложных технических концепций, которые лежат в основе машинных алгоритмов. Это не значит, что без диплома матфака путь в профессию закрыт, - для начала достаточно школьной программы.</li>
28
<li><strong>Статистика и теория вероятностей.</strong>Специалисту по МL приходится работать с данными, анализировать их, применять теорию вероятностей, чтобы настроить алгоритмы и оценить корректность результатов. Немногие специалисты владеют всеми тонкостями высшей математики, а вот основы статистики может изучить почти каждый.</li>
28
<li><strong>Статистика и теория вероятностей.</strong>Специалисту по МL приходится работать с данными, анализировать их, применять теорию вероятностей, чтобы настроить алгоритмы и оценить корректность результатов. Немногие специалисты владеют всеми тонкостями высшей математики, а вот основы статистики может изучить почти каждый.</li>
29
<li><strong>Программирование.</strong>Обычно специалисты по МL используют Python или R, но одного знания языков недостаточно. Придётся много работать с базами данных - для этого нужен SQL. А ещё надо изучить много специфических фреймворков (Apache Spark, TensorFlow, PyTorch) и библиотек (scikit-learn, NumPy, Keras, Pandas). Пригодится и MATLAB - пакет программ для учёных, который часто используют в крупных компаниях.</li>
29
<li><strong>Программирование.</strong>Обычно специалисты по МL используют Python или R, но одного знания языков недостаточно. Придётся много работать с базами данных - для этого нужен SQL. А ещё надо изучить много специфических фреймворков (Apache Spark, TensorFlow, PyTorch) и библиотек (scikit-learn, NumPy, Keras, Pandas). Пригодится и MATLAB - пакет программ для учёных, который часто используют в крупных компаниях.</li>
30
<li><strong>Английский язык.</strong>Для программирования, чтения профессиональной литературы и общения с комьюнити - это мастхэв.</li>
30
<li><strong>Английский язык.</strong>Для программирования, чтения профессиональной литературы и общения с комьюнити - это мастхэв.</li>
31
</ul><p>Сегодня МL помогает людям практически в любой области - от выбора сериалов на Netflix до заботы о здоровье. Востребованность специалистов по ML с каждым годом растёт. Например, hh.ru отмечает, что с 2015 по 2019 год количество вакансий в сфере машинного обучения выросло в семь раз.</p>
31
</ul><p>Сегодня МL помогает людям практически в любой области - от выбора сериалов на Netflix до заботы о здоровье. Востребованность специалистов по ML с каждым годом растёт. Например, hh.ru отмечает, что с 2015 по 2019 год количество вакансий в сфере машинного обучения выросло в семь раз.</p>
32
<p>Больше всего таких специалистов требуется в сфере информационных технологий, разработке программного обеспечения, финансовом секторе, бизнес-среде, маркетинге и розничной торговле.</p>
32
<p>Больше всего таких специалистов требуется в сфере информационных технологий, разработке программного обеспечения, финансовом секторе, бизнес-среде, маркетинге и розничной торговле.</p>
33
<p>Яндекс, "Тинькофф" и другие компании нуждаются в крутых профессионалах в области ML. По наличию опыта такие специалисты делятся на три группы: Junior, Middle и Senior.</p>
33
<p>Яндекс, "Тинькофф" и другие компании нуждаются в крутых профессионалах в области ML. По наличию опыта такие специалисты делятся на три группы: Junior, Middle и Senior.</p>
34
<p><strong>Программист с опытом в ML около 1 года.</strong>Собирает и подготавливает данные, формулирует требования к сбору обучающей выборки, строит несложные модели машинного обучения - обычно под контролем более опытного специалиста.</p>
34
<p><strong>Программист с опытом в ML около 1 года.</strong>Собирает и подготавливает данные, формулирует требования к сбору обучающей выборки, строит несложные модели машинного обучения - обычно под контролем более опытного специалиста.</p>
35
<p>Нужно уметь работать с библиотеками для обработки данных - Pandas, NumPy, Matplotlib, и понимать системы управления базами данных - MySQL/PostgreSQL.</p>
35
<p>Нужно уметь работать с библиотеками для обработки данных - Pandas, NumPy, Matplotlib, и понимать системы управления базами данных - MySQL/PostgreSQL.</p>
36
<p>В регионах такой специалист может рассчитывать на зарплату от 40 тысяч рублей. В Москве джуны получают значительно больше - от 80 тысяч.</p>
36
<p>В регионах такой специалист может рассчитывать на зарплату от 40 тысяч рублей. В Москве джуны получают значительно больше - от 80 тысяч.</p>
37
<p><strong>Уверенный специалист с опытом от 2 до 5 лет.</strong>Он способен перевести задачи бизнеса на язык математики, реализовать с нуля и оценить производительность модели машинного обучения, проанализировать и проверить данные - соответствуют ли они заданным критериям.</p>
37
<p><strong>Уверенный специалист с опытом от 2 до 5 лет.</strong>Он способен перевести задачи бизнеса на язык математики, реализовать с нуля и оценить производительность модели машинного обучения, проанализировать и проверить данные - соответствуют ли они заданным критериям.</p>
38
<p>Среди требований к мидлу - навыки работы с современными аналитическими пакетами на R/Python и промышленными хранилищами данных (Teradata, DB2), а также понимание BigData. Приветствуется владение статистическими инструментами - SPSS, MATLAB, SAS Data Miner.</p>
38
<p>Среди требований к мидлу - навыки работы с современными аналитическими пакетами на R/Python и промышленными хранилищами данных (Teradata, DB2), а также понимание BigData. Приветствуется владение статистическими инструментами - SPSS, MATLAB, SAS Data Miner.</p>
39
<p>В регионах средняя зарплата - 60-80 тысяч, в Москве - не меньше 100 тысяч рублей.</p>
39
<p>В регионах средняя зарплата - 60-80 тысяч, в Москве - не меньше 100 тысяч рублей.</p>
40
<p><strong>Опытный специалист.</strong>Работодатели ожидают, что у сеньора за плечами 5-7 лет работы над проектами в сфере data mining, data analysis, машинного обучения или математического моделирования. В списке компетенций: уверенный Python, SQL/CQL, глубокое понимание архитектуры нейросетей, знание Spark Streaming (используется с Apache Spark), Cassandra (система управления базами данных), фреймворков TensorFlow, CV, PyTorch или других - в зависимости от стека компании.</p>
40
<p><strong>Опытный специалист.</strong>Работодатели ожидают, что у сеньора за плечами 5-7 лет работы над проектами в сфере data mining, data analysis, машинного обучения или математического моделирования. В списке компетенций: уверенный Python, SQL/CQL, глубокое понимание архитектуры нейросетей, знание Spark Streaming (используется с Apache Spark), Cassandra (система управления базами данных), фреймворков TensorFlow, CV, PyTorch или других - в зависимости от стека компании.</p>
41
<p>Иногда выделяют ML Team Lead (тимлид, лидер команды). Тимлидами становятся сеньоры, возглавляющие подразделения Machine Learning. Здесь важны лидерские качества, тайм-менеджмент и умение работать в команде.</p>
41
<p>Иногда выделяют ML Team Lead (тимлид, лидер команды). Тимлидами становятся сеньоры, возглавляющие подразделения Machine Learning. Здесь важны лидерские качества, тайм-менеджмент и умение работать в команде.</p>
42
<p>Сеньоры и тимлиды в регионах зарабатывают 100-120 тысяч, в Москве - от 200 и до 400-500 тысяч. Это хороший стимул освоить профессию. А учитывая, что потребность в машинном обучении с годами будет только расти, зарплаты опытных специалистов по ML точно не станут ниже.</p>
42
<p>Сеньоры и тимлиды в регионах зарабатывают 100-120 тысяч, в Москве - от 200 и до 400-500 тысяч. Это хороший стимул освоить профессию. А учитывая, что потребность в машинном обучении с годами будет только расти, зарплаты опытных специалистов по ML точно не станут ниже.</p>
43
<p>Изучать машинное обучение можно в университете, на курсах или самостоятельно.</p>
43
<p>Изучать машинное обучение можно в университете, на курсах или самостоятельно.</p>
44
<p><strong>Университет</strong>даёт студентам хорошую базу, особенно в математике и статистике. Вы получите диплом государственного образца - это может быть плюсом при трудоустройстве. Но поступить на специальность Data Science обычно непросто и дорого. Например, двухлетняя магистратура по наукам о данных в "Высшей школе экономики" обойдётся в 1 155 000 рублей.</p>
44
<p><strong>Университет</strong>даёт студентам хорошую базу, особенно в математике и статистике. Вы получите диплом государственного образца - это может быть плюсом при трудоустройстве. Но поступить на специальность Data Science обычно непросто и дорого. Например, двухлетняя магистратура по наукам о данных в "Высшей школе экономики" обойдётся в 1 155 000 рублей.</p>
45
<p><strong>Курсы</strong>позволяют получить структурированную информацию в сжатые сроки. Такой вариант образования гораздо дешевле университетской программы. Кроме того, на курсах готовят выпускников к практической деятельности, дают поработать над реальными проектами. Стоимость стартует от 50 тысяч рублей и доходит до 150 тысяч.</p>
45
<p><strong>Курсы</strong>позволяют получить структурированную информацию в сжатые сроки. Такой вариант образования гораздо дешевле университетской программы. Кроме того, на курсах готовят выпускников к практической деятельности, дают поработать над реальными проектами. Стоимость стартует от 50 тысяч рублей и доходит до 150 тысяч.</p>
46
<p><strong>Самостоятельное обучение</strong>подходит тем, у кого уже есть технический бэкграунд. В интернете много бесплатных книг и курсов, и некоторые из них весьма хороши. Но есть сложность: придётся самостоятельно планировать обучение и развитие, получать знания и навыки, которые понадобятся на работе. Без старшего товарища ориентироваться в океане информации и проверять рецепты из интернета непросто.</p>
46
<p><strong>Самостоятельное обучение</strong>подходит тем, у кого уже есть технический бэкграунд. В интернете много бесплатных книг и курсов, и некоторые из них весьма хороши. Но есть сложность: придётся самостоятельно планировать обучение и развитие, получать знания и навыки, которые понадобятся на работе. Без старшего товарища ориентироваться в океане информации и проверять рецепты из интернета непросто.</p>
47
<p>Специалисты по машинному обучению работают над сложными, увлекательными проектами, которые хорошо оплачиваются. Созданные ими решения делают нашу жизнь проще, интереснее и безопаснее. Так что если вам хочется быть на переднем крае технологий и заниматься самыми современными проектами, без которых немыслимо не только будущее, а уже и настоящее, - возможно, это идеальная карьера для вас.</p>
47
<p>Специалисты по машинному обучению работают над сложными, увлекательными проектами, которые хорошо оплачиваются. Созданные ими решения делают нашу жизнь проще, интереснее и безопаснее. Так что если вам хочется быть на переднем крае технологий и заниматься самыми современными проектами, без которых немыслимо не только будущее, а уже и настоящее, - возможно, это идеальная карьера для вас.</p>
48
<a>Курс с трудоустройством: "Профессия Machine Learning Engineer" Узнать о курсе</a>
48
<a>Курс с трудоустройством: "Профессия Machine Learning Engineer" Узнать о курсе</a>