HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-02-21
1 <p><a>#статьи</a></p>
1 <p><a>#статьи</a></p>
2 <ul><li>16 мар 2021</li>
2 <ul><li>16 мар 2021</li>
3 <li>0</li>
3 <li>0</li>
4 </ul><h2>Специалист по машинному обучению: кто такой, чем занимается и сколько получает</h2>
4 </ul><h2>Специалист по машинному обучению: кто такой, чем занимается и сколько получает</h2>
5 <p>Разбираемся, нужно ли творцам искусственного интеллекта знать математику и Python.</p>
5 <p>Разбираемся, нужно ли творцам искусственного интеллекта знать математику и Python.</p>
6 <p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
6 <p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
7 <p>Специалист по машинному обучению (ML, machine learning) - это программист, который с помощью специальных наборов данных и алгоритмов обучает<a>искусственный интеллект</a>.</p>
7 <p>Специалист по машинному обучению (ML, machine learning) - это программист, который с помощью специальных наборов данных и алгоритмов обучает<a>искусственный интеллект</a>.</p>
8 <p>Посмотрим, например, как приложение "Яндекс.Навигатор" выбирает маршрут до пункта назначения. У него есть ваши GPS-координаты и карта, но при этом он знает и о пробках, авариях, дорожном ремонте. Всё это благодаря графу дорог - алгоритм быстро анализирует возможные пути и находит самый быстрый. А программисты следят, чтобы машинный интеллект не ошибался.</p>
8 <p>Посмотрим, например, как приложение "Яндекс.Навигатор" выбирает маршрут до пункта назначения. У него есть ваши GPS-координаты и карта, но при этом он знает и о пробках, авариях, дорожном ремонте. Всё это благодаря графу дорог - алгоритм быстро анализирует возможные пути и находит самый быстрый. А программисты следят, чтобы машинный интеллект не ошибался.</p>
9 <p>Но ситуация на дорогах постоянно меняется: вчера здесь был поворот, а сегодня висит "кирпич" и водители вынуждены объезжать это место. Добавлять на карту все изменения вручную, особенно в реальном времени, слишком трудозатратно и дорого, требуется много людей. Но алгоритму совсем не обязательно знать про запрет - ему достаточно увидеть, что машины стали двигаться по-другому, чтобы перенаправить всех водителей на другие маршруты.</p>
9 <p>Но ситуация на дорогах постоянно меняется: вчера здесь был поворот, а сегодня висит "кирпич" и водители вынуждены объезжать это место. Добавлять на карту все изменения вручную, особенно в реальном времени, слишком трудозатратно и дорого, требуется много людей. Но алгоритму совсем не обязательно знать про запрет - ему достаточно увидеть, что машины стали двигаться по-другому, чтобы перенаправить всех водителей на другие маршруты.</p>
10 <p>Научить компьютер принимать такие решения - задача специалистов по ML. Без этого мы не смогли бы обработать море информации, которую люди генерируют каждый день, и сделать нашу жизнь комфортнее.</p>
10 <p>Научить компьютер принимать такие решения - задача специалистов по ML. Без этого мы не смогли бы обработать море информации, которую люди генерируют каждый день, и сделать нашу жизнь комфортнее.</p>
11 <p>Задачи специалиста по МL отличаются в разных компаниях и проектах, но чаще всего он делает вот что:</p>
11 <p>Задачи специалиста по МL отличаются в разных компаниях и проектах, но чаще всего он делает вот что:</p>
12 <ul><li><strong>Собирает и подготавливает данные.</strong>Для прокачки искусственного интеллекта необходимо много данных. И не любых, а специально размеченных. Например, чтобы научить машину отличать котиков от собак, нужно дать ей много фотографий и "подписать", на каких изображены кошки, а на каких - собаки. Такая классификация данных называется<strong>разметкой</strong>.</li>
12 <ul><li><strong>Собирает и подготавливает данные.</strong>Для прокачки искусственного интеллекта необходимо много данных. И не любых, а специально размеченных. Например, чтобы научить машину отличать котиков от собак, нужно дать ей много фотографий и "подписать", на каких изображены кошки, а на каких - собаки. Такая классификация данных называется<strong>разметкой</strong>.</li>
13 </ul><p>Собирать данные вручную сложно: если это, например. изображения, требуются сотни тысяч фото с разных ракурсов и разными условиями освещённости. "ВКонтакте" недавно запустил новую функцию - сеть показывает фото пользователей их друзьям и спрашивает: "Это Вася Иванов?" Чтобы отметить друга на фото, требуется меньше секунды. Не поленитесь и сделайте это. Так вы поможете нейросети научиться распознавать лица, а заодно почувствуете себя специалистом по ML - хоть немножко :)</p>
13 </ul><p>Собирать данные вручную сложно: если это, например. изображения, требуются сотни тысяч фото с разных ракурсов и разными условиями освещённости. "ВКонтакте" недавно запустил новую функцию - сеть показывает фото пользователей их друзьям и спрашивает: "Это Вася Иванов?" Чтобы отметить друга на фото, требуется меньше секунды. Не поленитесь и сделайте это. Так вы поможете нейросети научиться распознавать лица, а заодно почувствуете себя специалистом по ML - хоть немножко :)</p>
14 <ul><li><strong>Строит модели машинного обучения для обработки данных.</strong>Простой пример - умная лента "ВКонтакте". Чтобы показывать только интересные записи, алгоритм отслеживает ваши лайки, комментарии, предпочтения друзей и даже похожих с вами по интересам людей, а потом показывает потенциально интересные материалы. Специалисты по ML создают и обучают такие алгоритмы. Результат их работы - умная модель, которая выдаёт прогноз на основе данных. Если вкусы изменились, вы подписались на кого-то или прокомментировали пост, непременно изменится и ваша лента.</li>
14 <ul><li><strong>Строит модели машинного обучения для обработки данных.</strong>Простой пример - умная лента "ВКонтакте". Чтобы показывать только интересные записи, алгоритм отслеживает ваши лайки, комментарии, предпочтения друзей и даже похожих с вами по интересам людей, а потом показывает потенциально интересные материалы. Специалисты по ML создают и обучают такие алгоритмы. Результат их работы - умная модель, которая выдаёт прогноз на основе данных. Если вкусы изменились, вы подписались на кого-то или прокомментировали пост, непременно изменится и ваша лента.</li>
15 </ul><p>Алгоритмы для построения модели программируют под конкретные задачи. Иногда они довольно простые - например,<a>алгоритм для предсказания предпочтений туристов</a>из разных городов занимает всего 20 строчек кода.</p>
15 </ul><p>Алгоритмы для построения модели программируют под конкретные задачи. Иногда они довольно простые - например,<a>алгоритм для предсказания предпочтений туристов</a>из разных городов занимает всего 20 строчек кода.</p>
16 <p>Но бывают и очень сложные - такие как гигантская нейросеть DeepCoder. Она копирует и миксует готовые фрагменты кода, создавая на выходе новые программы. Эта технология называется программным синтезом.</p>
16 <p>Но бывают и очень сложные - такие как гигантская нейросеть DeepCoder. Она копирует и миксует готовые фрагменты кода, создавая на выходе новые программы. Эта технология называется программным синтезом.</p>
17 <p>Получается, что сама нейросеть, состоящая из миллионов строк кода, может заимствовать его из множества других программ. Алгоритм порождает другие алгоритмы - чем не цифровая жизнь?</p>
17 <p>Получается, что сама нейросеть, состоящая из миллионов строк кода, может заимствовать его из множества других программ. Алгоритм порождает другие алгоритмы - чем не цифровая жизнь?</p>
18 <p>Вы читаете эту статью, потому что задумываетесь о карьере специалиста по машинному обучению? Присмотритесь к <a>курсу Skillbox</a> - он подойдёт вам, если вы хотите стартовать в этой сфере.</p>
18 <p>Вы читаете эту статью, потому что задумываетесь о карьере специалиста по машинному обучению? Присмотритесь к <a>курсу Skillbox</a> - он подойдёт вам, если вы хотите стартовать в этой сфере.</p>
19 <ul><li>Программисту, который хочет прокачать свои знания Python, R, C++, JavaScript, Scala или Julia, подтянуть математику и научиться работать с данными и алгоритмами.</li>
19 <ul><li>Программисту, который хочет прокачать свои знания Python, R, C++, JavaScript, Scala или Julia, подтянуть математику и научиться работать с данными и алгоритмами.</li>
20 <li>Аналитику или менеджеру продуктов, который стремится получать больше данных с помощью продвинутых технологий и принимать решения на их основе.</li>
20 <li>Аналитику или менеджеру продуктов, который стремится получать больше данных с помощью продвинутых технологий и принимать решения на их основе.</li>
21 <li>Учёному, который хочет моделировать сложные процессы и находить взаимосвязи в разрозненных данных.</li>
21 <li>Учёному, который хочет моделировать сложные процессы и находить взаимосвязи в разрозненных данных.</li>
22 <li>Исследователю или data-журналисту, который стремится обнаружить истинные причины тех или иных событий и явлений этого мира.</li>
22 <li>Исследователю или data-журналисту, который стремится обнаружить истинные причины тех или иных событий и явлений этого мира.</li>
23 </ul><ul><li><strong>Аналитический склад ума, внимание к деталям</strong>. Машинное обучение - это наука, где приходится постоянно выдвигать гипотезы и проверять их.</li>
23 </ul><ul><li><strong>Аналитический склад ума, внимание к деталям</strong>. Машинное обучение - это наука, где приходится постоянно выдвигать гипотезы и проверять их.</li>
24 </ul><p>Предположим, нам нужно построить автоматическую систему рекомендаций для соцсети. Что должно лежать в основе рекомендаций? Хороший вариант - посмотреть, что лайкают друзья: людей часто объединяют интересы. Но чтобы система работала ещё лучше, придётся учитывать время года или суток, события в стране и в мире. Например, "ВКонтакте" утром чаще рекомендует новости, а вечером - мемасики про котиков и другой развлекательный контент. Чтобы всё это продумать и учесть сотни различных факторов, нужно быть готовым к кропотливой и даже монотонной работе.</p>
24 </ul><p>Предположим, нам нужно построить автоматическую систему рекомендаций для соцсети. Что должно лежать в основе рекомендаций? Хороший вариант - посмотреть, что лайкают друзья: людей часто объединяют интересы. Но чтобы система работала ещё лучше, придётся учитывать время года или суток, события в стране и в мире. Например, "ВКонтакте" утром чаще рекомендует новости, а вечером - мемасики про котиков и другой развлекательный контент. Чтобы всё это продумать и учесть сотни различных факторов, нужно быть готовым к кропотливой и даже монотонной работе.</p>
25 <ul><li><strong>Логическое мышление.</strong>Создание любой программы - это решение задачи. Необходим особый склад ума, чтобы разбить проблему из реального мира на составные части и описать алгоритм, который будет её решать.</li>
25 <ul><li><strong>Логическое мышление.</strong>Создание любой программы - это решение задачи. Необходим особый склад ума, чтобы разбить проблему из реального мира на составные части и описать алгоритм, который будет её решать.</li>
26 </ul><p>Как определить, хороший контент в соцсети или плохой? Можно посадить сотни модераторов и разработать сложную систему правил, а можно просто добавить кнопку эмоциональной реакции - например, лайк. Если у поста много лайков, значит, людям он нравится, следовательно, материал хороший и нейросеть будет показывать его как можно большему количеству людей. Возможно, эта система не идеальна, но она позволяет решить проблему относительно эффективно и с минимальной затратой ресурсов.</p>
26 </ul><p>Как определить, хороший контент в соцсети или плохой? Можно посадить сотни модераторов и разработать сложную систему правил, а можно просто добавить кнопку эмоциональной реакции - например, лайк. Если у поста много лайков, значит, людям он нравится, следовательно, материал хороший и нейросеть будет показывать его как можно большему количеству людей. Возможно, эта система не идеальна, но она позволяет решить проблему относительно эффективно и с минимальной затратой ресурсов.</p>
27 <ul><li><strong>Алгебра и дискретная математика</strong>. Они пригодятся для разбора сложных технических концепций, которые лежат в основе машинных алгоритмов. Это не значит, что без диплома матфака путь в профессию закрыт, - для начала достаточно школьной программы.</li>
27 <ul><li><strong>Алгебра и дискретная математика</strong>. Они пригодятся для разбора сложных технических концепций, которые лежат в основе машинных алгоритмов. Это не значит, что без диплома матфака путь в профессию закрыт, - для начала достаточно школьной программы.</li>
28 <li><strong>Статистика и теория вероятностей.</strong>Специалисту по МL приходится работать с данными, анализировать их, применять теорию вероятностей, чтобы настроить алгоритмы и оценить корректность результатов. Немногие специалисты владеют всеми тонкостями высшей математики, а вот основы статистики может изучить почти каждый.</li>
28 <li><strong>Статистика и теория вероятностей.</strong>Специалисту по МL приходится работать с данными, анализировать их, применять теорию вероятностей, чтобы настроить алгоритмы и оценить корректность результатов. Немногие специалисты владеют всеми тонкостями высшей математики, а вот основы статистики может изучить почти каждый.</li>
29 <li><strong>Программирование.</strong>Обычно специалисты по МL используют Python или R, но одного знания языков недостаточно. Придётся много работать с базами данных - для этого нужен SQL. А ещё надо изучить много специфических фреймворков (Apache Spark, TensorFlow, PyTorch) и библиотек (scikit-learn, NumPy, Keras, Pandas). Пригодится и MATLAB - пакет программ для учёных, который часто используют в крупных компаниях.</li>
29 <li><strong>Программирование.</strong>Обычно специалисты по МL используют Python или R, но одного знания языков недостаточно. Придётся много работать с базами данных - для этого нужен SQL. А ещё надо изучить много специфических фреймворков (Apache Spark, TensorFlow, PyTorch) и библиотек (scikit-learn, NumPy, Keras, Pandas). Пригодится и MATLAB - пакет программ для учёных, который часто используют в крупных компаниях.</li>
30 <li><strong>Английский язык.</strong>Для программирования, чтения профессиональной литературы и общения с комьюнити - это мастхэв.</li>
30 <li><strong>Английский язык.</strong>Для программирования, чтения профессиональной литературы и общения с комьюнити - это мастхэв.</li>
31 </ul><p>Сегодня МL помогает людям практически в любой области - от выбора сериалов на Netflix до заботы о здоровье. Востребованность специалистов по ML с каждым годом растёт. Например, hh.ru отмечает, что с 2015 по 2019 год количество вакансий в сфере машинного обучения выросло в семь раз.</p>
31 </ul><p>Сегодня МL помогает людям практически в любой области - от выбора сериалов на Netflix до заботы о здоровье. Востребованность специалистов по ML с каждым годом растёт. Например, hh.ru отмечает, что с 2015 по 2019 год количество вакансий в сфере машинного обучения выросло в семь раз.</p>
32 <p>Больше всего таких специалистов требуется в сфере информационных технологий, разработке программного обеспечения, финансовом секторе, бизнес-среде, маркетинге и розничной торговле.</p>
32 <p>Больше всего таких специалистов требуется в сфере информационных технологий, разработке программного обеспечения, финансовом секторе, бизнес-среде, маркетинге и розничной торговле.</p>
33 <p>Яндекс, "Тинькофф" и другие компании нуждаются в крутых профессионалах в области ML. По наличию опыта такие специалисты делятся на три группы: Junior, Middle и Senior.</p>
33 <p>Яндекс, "Тинькофф" и другие компании нуждаются в крутых профессионалах в области ML. По наличию опыта такие специалисты делятся на три группы: Junior, Middle и Senior.</p>
34 <p><strong>Программист с опытом в ML около 1 года.</strong>Собирает и подготавливает данные, формулирует требования к сбору обучающей выборки, строит несложные модели машинного обучения - обычно под контролем более опытного специалиста.</p>
34 <p><strong>Программист с опытом в ML около 1 года.</strong>Собирает и подготавливает данные, формулирует требования к сбору обучающей выборки, строит несложные модели машинного обучения - обычно под контролем более опытного специалиста.</p>
35 <p>Нужно уметь работать с библиотеками для обработки данных - Pandas, NumPy, Matplotlib, и понимать системы управления базами данных - MySQL/PostgreSQL.</p>
35 <p>Нужно уметь работать с библиотеками для обработки данных - Pandas, NumPy, Matplotlib, и понимать системы управления базами данных - MySQL/PostgreSQL.</p>
36 <p>В регионах такой специалист может рассчитывать на зарплату от 40 тысяч рублей. В Москве джуны получают значительно больше - от 80 тысяч.</p>
36 <p>В регионах такой специалист может рассчитывать на зарплату от 40 тысяч рублей. В Москве джуны получают значительно больше - от 80 тысяч.</p>
37 <p><strong>Уверенный специалист с опытом от 2 до 5 лет.</strong>Он способен перевести задачи бизнеса на язык математики, реализовать с нуля и оценить производительность модели машинного обучения, проанализировать и проверить данные - соответствуют ли они заданным критериям.</p>
37 <p><strong>Уверенный специалист с опытом от 2 до 5 лет.</strong>Он способен перевести задачи бизнеса на язык математики, реализовать с нуля и оценить производительность модели машинного обучения, проанализировать и проверить данные - соответствуют ли они заданным критериям.</p>
38 <p>Среди требований к мидлу - навыки работы с современными аналитическими пакетами на R/Python и промышленными хранилищами данных (Teradata, DB2), а также понимание BigData. Приветствуется владение статистическими инструментами - SPSS, MATLAB, SAS Data Miner.</p>
38 <p>Среди требований к мидлу - навыки работы с современными аналитическими пакетами на R/Python и промышленными хранилищами данных (Teradata, DB2), а также понимание BigData. Приветствуется владение статистическими инструментами - SPSS, MATLAB, SAS Data Miner.</p>
39 <p>В регионах средняя зарплата - 60-80 тысяч, в Москве - не меньше 100 тысяч рублей.</p>
39 <p>В регионах средняя зарплата - 60-80 тысяч, в Москве - не меньше 100 тысяч рублей.</p>
40 <p><strong>Опытный специалист.</strong>Работодатели ожидают, что у сеньора за плечами 5-7 лет работы над проектами в сфере data mining, data analysis, машинного обучения или математического моделирования. В списке компетенций: уверенный Python, SQL/CQL, глубокое понимание архитектуры нейросетей, знание Spark Streaming (используется с Apache Spark), Cassandra (система управления базами данных), фреймворков TensorFlow, CV, PyTorch или других - в зависимости от стека компании.</p>
40 <p><strong>Опытный специалист.</strong>Работодатели ожидают, что у сеньора за плечами 5-7 лет работы над проектами в сфере data mining, data analysis, машинного обучения или математического моделирования. В списке компетенций: уверенный Python, SQL/CQL, глубокое понимание архитектуры нейросетей, знание Spark Streaming (используется с Apache Spark), Cassandra (система управления базами данных), фреймворков TensorFlow, CV, PyTorch или других - в зависимости от стека компании.</p>
41 <p>Иногда выделяют ML Team Lead (тимлид, лидер команды). Тимлидами становятся сеньоры, возглавляющие подразделения Machine Learning. Здесь важны лидерские качества, тайм-менеджмент и умение работать в команде.</p>
41 <p>Иногда выделяют ML Team Lead (тимлид, лидер команды). Тимлидами становятся сеньоры, возглавляющие подразделения Machine Learning. Здесь важны лидерские качества, тайм-менеджмент и умение работать в команде.</p>
42 <p>Сеньоры и тимлиды в регионах зарабатывают 100-120 тысяч, в Москве - от 200 и до 400-500 тысяч. Это хороший стимул освоить профессию. А учитывая, что потребность в машинном обучении с годами будет только расти, зарплаты опытных специалистов по ML точно не станут ниже.</p>
42 <p>Сеньоры и тимлиды в регионах зарабатывают 100-120 тысяч, в Москве - от 200 и до 400-500 тысяч. Это хороший стимул освоить профессию. А учитывая, что потребность в машинном обучении с годами будет только расти, зарплаты опытных специалистов по ML точно не станут ниже.</p>
43 <p>Изучать машинное обучение можно в университете, на курсах или самостоятельно.</p>
43 <p>Изучать машинное обучение можно в университете, на курсах или самостоятельно.</p>
44 <p><strong>Университет</strong>даёт студентам хорошую базу, особенно в математике и статистике. Вы получите диплом государственного образца - это может быть плюсом при трудоустройстве. Но поступить на специальность Data Science обычно непросто и дорого. Например, двухлетняя магистратура по наукам о данных в "Высшей школе экономики" обойдётся в 1 155 000 рублей.</p>
44 <p><strong>Университет</strong>даёт студентам хорошую базу, особенно в математике и статистике. Вы получите диплом государственного образца - это может быть плюсом при трудоустройстве. Но поступить на специальность Data Science обычно непросто и дорого. Например, двухлетняя магистратура по наукам о данных в "Высшей школе экономики" обойдётся в 1 155 000 рублей.</p>
45 <p><strong>Курсы</strong>позволяют получить структурированную информацию в сжатые сроки. Такой вариант образования гораздо дешевле университетской программы. Кроме того, на курсах готовят выпускников к практической деятельности, дают поработать над реальными проектами. Стоимость стартует от 50 тысяч рублей и доходит до 150 тысяч.</p>
45 <p><strong>Курсы</strong>позволяют получить структурированную информацию в сжатые сроки. Такой вариант образования гораздо дешевле университетской программы. Кроме того, на курсах готовят выпускников к практической деятельности, дают поработать над реальными проектами. Стоимость стартует от 50 тысяч рублей и доходит до 150 тысяч.</p>
46 <p><strong>Самостоятельное обучение</strong>подходит тем, у кого уже есть технический бэкграунд. В интернете много бесплатных книг и курсов, и некоторые из них весьма хороши. Но есть сложность: придётся самостоятельно планировать обучение и развитие, получать знания и навыки, которые понадобятся на работе. Без старшего товарища ориентироваться в океане информации и проверять рецепты из интернета непросто.</p>
46 <p><strong>Самостоятельное обучение</strong>подходит тем, у кого уже есть технический бэкграунд. В интернете много бесплатных книг и курсов, и некоторые из них весьма хороши. Но есть сложность: придётся самостоятельно планировать обучение и развитие, получать знания и навыки, которые понадобятся на работе. Без старшего товарища ориентироваться в океане информации и проверять рецепты из интернета непросто.</p>
47 <p>Специалисты по машинному обучению работают над сложными, увлекательными проектами, которые хорошо оплачиваются. Созданные ими решения делают нашу жизнь проще, интереснее и безопаснее. Так что если вам хочется быть на переднем крае технологий и заниматься самыми современными проектами, без которых немыслимо не только будущее, а уже и настоящее, - возможно, это идеальная карьера для вас.</p>
47 <p>Специалисты по машинному обучению работают над сложными, увлекательными проектами, которые хорошо оплачиваются. Созданные ими решения делают нашу жизнь проще, интереснее и безопаснее. Так что если вам хочется быть на переднем крае технологий и заниматься самыми современными проектами, без которых немыслимо не только будущее, а уже и настоящее, - возможно, это идеальная карьера для вас.</p>
48 <a>Курс с трудоустройством: "Профессия Machine Learning Engineer" Узнать о курсе</a>
48 <a>Курс с трудоустройством: "Профессия Machine Learning Engineer" Узнать о курсе</a>