Rivalry2

HTML Diff

0 added 0 removed

Original 2026-01-01

Modified 2026-02-26

1 Алексей Озерин - эксперт по машинному обучению, занимался компьютерным зрением в Яндексе, а также обработкой естественного языка и нейросетями в технологических стартапах. Мы узнали у него, что такое нейросети, для чего их используют и как программистам начать работать с Machine Learning.

2 Меня зовут<a>Алексей Озерин</a>, сейчас я - эксперт по машинному обучению в агротехническом стартапе<a>OneSoil</a>. Учился на физика в МФТИ, занимался теоретической физикой, а потом ушел в программисты.

3 В 2012 году во всем мире случился бум в области развития нейросетей, до России он докатывался довольно долго. К 2015-2016 году появилось много стартапов и инициатив, связанных с нейросетями. В это же время я пришел работать в классную лабораторию Deephacklab, разрабатывать прототипы - поиск и генерация текстов. Проекты были в зачаточном состоянии, но очень интересными.

4 В 2018 году я перешел в Яндекс как Senior Developer, чтобы работать с компьютерным зрением. Решал разные задачи в области Machine Learning (ML) - с картинками, видео и текстами, вплоть до 2022 года. В 2019-2021 вел курс по DL в ВШЭ и был научруком у студентов.

5 Сейчас я работаю в стартапе, который занимается сельским хозяйством, - с помощью нейронных сетей по спутниковым снимкам предсказываю, что где растет и когда убирают поля.

6 <blockquote><h3>Изучите дата-аналитику на Хекслете</h3>

7 Пройдите нашу профессию "<a>Аналитик данных</a>" - эта сфера может идеально подойти для использования нейросетей в будущем.

8 </blockquote><h2>Содержание</h2>

9 <ul><li><a>Для каких задач применяют ML и нейросети</a></li>

10 <li><a>Как разрабатываются нейросети</a></li>

11 <li><a>Как попасть в индустрию</a></li>

12 <li><a>Карьерный путь в сфере ML</a></li>

13 <li><a>Прошлое, настоящее и будущее</a></li>

14 <li><a>Вклад разработчиков в развитие нейросетей</a></li>

15 <li><a>Что в итоге</a></li>

16 </ul><h2>Для каких задач применяют ML и нейросети</h2>

17 Есть много прикладных задач, которые решаются с помощью эксперта, простых правил и специально подобранных алгоритмов. Когда данных становится много, у нас появляется возможность извлекать из них полезные знания, обходя ограниченность простых подходов. С помощью ML можно рассчитывать риски - например, предсказать, выплатит ли человек кредит, или рассчитать будущие цены на квартиры.

18 Есть отдельная группа задач, для которых нейросети особенно хороши: находить похожие картинки, звуки и посты, генерировать изображения и тексты. Конечно, искать похожие аудио можно и без нейросетей - приложение Shazam прекрасно работало даже в первых версиях. Но обучение алгоритмов с помощью нейросетей дает дополнительные возможности.

19 Сейчас даже люди, далекие от ML, наслышаны про три направления их использования:

20 <ul><li>Генерация текстов - спасибо чат-боту<a>ChatGPT</a></li>

21 <li>Генерация картинок - спасибо<a>Stable Diffusion</a>и<a>Midjourney</a></li>

22 <li>Генерация музыки - спасибо<a>Jukebox</a>.</li>

23 </ul>Творчество нейросети<a>Midjourney</a>

24 <h2>Как разрабатываются нейросети</h2>

25 <blockquote>В этой части статьи будет немного хардовой информации, связанной с математикой и ML. Если вы ничего не поймете или захотите понять больше, советуем пройти наш курс<a>по математической логике для программистов</a>

26 </blockquote>Нейросеть - это формула, которая из одного массива чисел делает другой массив. Формула большая и длинная, может быть с миллионами параметров, но собирается из довольно простых операций - арифметики, элементарных функций (синусы, косинусы, экспоненты и даже более простые, вроде взятия степени) и суперпозиции.

27 Выше пример одной из решаемых задачек: классификация изображений на условные тысячу классов. Входной массив здесь - просто массив пикселей картинки, выходной - вектор с вероятностями, что изображено на картинке. Выходной массив может быть и картинкой (например, как в задачах pix2pix на улучшение картинок или дорисовывание). Входной массив может быть не картинкой, а последовательностью слов - так, например, происходит в генерации картинок по тексту.

28 С отдельными элементами входного массива обычно не работают: действия собирают в слои и применяют операцию ко всему массиву сразу. Котика на картинке распознают независимо от того, в какой части картинки он находится.

29 Саму формулу пишут не как аналитическую формулу, а вычислительным графом - это рецепт для калькулятора, в каком порядке и что делать с входным и промежуточным массивами.

30 Источник:<a>https://arxiv.org/abs/1812.01187</a>

31 Вот характерный пример ResNet50. Очень популярная, старая и довольно простая моделька. Она может показаться сложной, но операции - простые, а концепция вычислительного графа позволяет работать со сложными формулами. В этих слоях скрываются числа, они же - веса - коэффициенты в большой формуле. Сначала параметры инициализируют небольшими случайными числами, а затем улучшают с помощью градиентного спуска. Так система самообучается.

32 Расчеты по этой формуле обычно происходят на движке, написанном на С/C++. Обвязку к этому движку обычно делают на Python. Есть языки, которые считаются более производительными, чем Python, например, C++ и Lua. Но на них сейчас нейросети почти не пишут, кроме низкоуровневых сетей для устройств. Знания Python достаточно, чтобы писать крутые вещи.

33 Есть библиотеки, позволяющие упростить процесс разработки. Крутые обертки и сборники моделей - одна из причин, почему сейчас стало популярно разрабатывать нейросети. Например, проект<a>Hugging Face</a>- это платформа для разработки и использования моделей и приложений на основе искусственного интеллекта, особенно в области обработки естественного языка (Natural Language Processing). Интерфейсы моделей отвязаны от математики, это простые и конкретные инструкции, что именно сделать, чтоб получить результат. А вот при использовании фреймворков<a>PyTorch</a>,<a>Jax</a>и<a>TensorFlow</a>для работы с данными и машинного обучения придется плотнее взаимодействовать с математикой.

34 <h2>Как попасть в индустрию</h2>

35 Нейросетями можно заниматься как прикладной технологией в коммерческой разработке, так и использовать их в качестве инструмента для исследований в научных лабораториях.

36 В 2016 году, чтобы попасть в лабораторию, занимающуюся нейросетями, ничего особенного знать и уметь не требовалось. Сейчас порог входа в исследовательские лаборатории, где применяют эту технологию, увеличился. Нужно соответствовать высоким требованиям: знать математику, хорошо кодить, иметь научные публикации. Такой уровень экспертизы есть у небольшой части людей.

37 Вакансий публикуется больше не в области исследований, а в прикладных проектах. Прикладными проектами может заниматься обычный разработчик. Для этого нужно уметь кодить, решать задачи и использовать системный подход. Нужно учиться делать базовые вещи максимально аккуратно. А все остальное получится в свое время.

38 Самое тяжелое умение - на грани hard skills и soft skills - понимать, что делаешь. Подвох в том, что данные могут лежать в каком угодно виде, и надо уметь грамотно их обрабатывать. Если есть десятки CSV, которые ссылаются друг на друга, нужно правильно соединить их между собой по ключам и в процессе ничего не потерять и не приобрести. Это сложная задача для людей, которые хотят создавать искусственный интеллект.

39 Чтобы стать разработчиком нейросетей, должен быть искренний, неиссякаемый интерес к этому. Желательно иметь в голове образ результата, абстрактное желание заниматься нейросетями ни к чему не приведет. "Я хочу сделать систему, которая может взять сэмпл голоса и научиться подменять на него любой другой голос" - это круто.

40 Сильная образовательная база не так важна, как любознательность и усидчивость. Однако, если в вузе вы хорошо изучили математику и алгоритмы, ваш инструментарий будет богаче. Многие задачи, которые встречаются в моей работе сейчас, я научился решать еще в университете.

41 Помимо математических знаний и опыта разработки, здорово обладать профильной экспертизой - это помогает быстрее находить очевидные глупости и лучше понимать ценность решения. Нейросеть - это лишь инструмент, которым можно овладеть за короткий срок, а профильный опыт накапливается довольно долго. Выбирайте сферу, в которой у вас есть такой опыт. Например, если умеете работать с микроконтроллерами, портировать какие-то штуки на железки, то идите специалистом по нейросетям в промышленность. А если хорошо знаете банковскую сферу, ее риски и ограничения, то в банк.

42 Определитесь, к какому результату стремитесь именно вы. Можно копать в сторону определенного класса задач и пройти специализированные курсы:

43 <ul><li>По компьютерному зрению - например,<a>Стэнфордский курс CS231n: Convolutional Neural Networks for Visual Recognition</a></li>

44 <li><a>По обработке текстов на естественном языке (NLP)</a></li>

45 <li><a>По графовым нейронным сетям</a>.</li>

46 </ul>Эти курсы дадут хорошее представление о том, как все работает и что можно делать с помощью нейросетей. А параллельно с обучением стоит искать работу: лучше всего учится и запоминается то, что совпадает с рабочими обязанностями.

47 <h2>Карьерный путь в сфере ML</h2>

48 Карьерный путь специалиста в нашей области простой:

49 Анализируешь профильный опыт -> Ищешь точку приложения своих знаний и навыков -> Начинаешь работать -> Закрываешь пробелы и учишь новое на материалах подходящего уровня, которые соответствуют твоему опыту.

50 Я точно не знаю, как сейчас выглядит рынок ML-вакансий в России. Но те, что есть, в основном не для джуниоров. Все ищут сеньоров, и это очень плохо - отсутствует преемственность поколений. Будущий хороший специалист должен приходить в компанию джуном и учиться там у сеньоров и мидлов. Через некоторое время он матереет, легко справляется с типовыми задачами, становится способен исследовать что-то новое и продвигать индустрию. Если компания нанимает только сеньоров, она не растит джунов и не поставляет на рынок новых специалистов.

51 На мировой рынок, безусловно, сейчас влияет кризис в бигтехе (Big Tech). Стартапы стали получать значительно меньше инвестиций и перестали нанимать стажеров. Сокращения в компании Meta* (Объявлена в России "экстремистской организацией", ее деятельность в РФ запрещена. Мы вынуждены указывать это по требованию российских властей), Google, Microsoft привели к уменьшению вакансий, и это беда. Кризис в основном бьет по джунам и мидлам, которые хотели вкатиться в эту область.

52 Кажется, Яндекс все еще приглашает на стажировки. Это хорошо, потому что прийти стажером в крупную технологическую компанию - большая удача. На стажировку берут вчерашних выпускников и собеседуют их не так, как опытных разработчиков: смотрят, хороши ли они в математике - в области, релевантной задачам компании. Мидлов на собеседованиях спрашивают про опыт работы, а по математике не гоняют.

53 Если опыта нет, полезно работать над опенсорс-проектами. Есть такое движение -<a>AI for social good</a>, когда специалисты по ML решают какую-нибудь общественно полезную задачу. Например, были проекты помощи в поисках пропавших людей или затонувших кораблей. Это очень хорошее направление деятельности, в которое можно прийти новичком с горящими глазами, а уйти с ценным опытом.

54 <blockquote><h3>Читайте также:</h3>

55 Как выбрать свой первый опенсорс проект:<a>большая инструкция от Хекслета</a>

56 </blockquote>Необязательно ставить высокие благородные цели. Важно взять задачу и довести ее до конца, наступив на положенное количество граблей. Почти наверняка у каждого разработчика есть знакомый ML-специалист, преподаватель в области искусственного интеллекта или блогер, который делает материалы на эту тему. Имеет смысл написать ему и попросить задачку для новичка - так можно найти ментора или научного руководителя.

57 У IT в целом репутация непыльной работы. Во многих компаниях сотрудники перерабатывают и выгорают. Работа может быть и не пыльная, но стресс и нервы тут точно есть.

58 <h2>Прошлое, настоящее и будущее</h2>

59 Картины, нарисованные нейросетями, которые так восхищают современных пользователей, - не новость для нашей индустрии. GANы для генерации картинок появились еще в 2014 году и произвели фурор среди специалистов, но для широкой публики результаты получались невзрачными.

60 Большие компании копят данные и контент всю историю своего существования. С картинками прорыв случился в 2012 со знаменитым Imagenet, а вот в текстах Imagenet-момент зрел почему-то дольше. Теперь, когда нашлось столько вариантов применения для картинок и текстов, созданных нейросетями, дело за музыкой и голосом.

61 Сфера AI получила такое развитие только тогда, когда крупные компании увидели в этом перспективу. Нейросети помогают захватывать новые рынки, привлекать аудиторию. Поиск Google и Яндекс долгое время был построен на солидных, классических технологиях. Нейронные сети появились здесь совсем недавно. Сначала это были алгоритмы, потом - эвристики с подобранными параметрами, потом - какие-то простые ML-вещи. Нейросетей долго не было, потому что отвечать на запросы пользователей с их помощью сильно дороже, чем с помощью классических решений. А в поиске время ответа важно.

62 Раньше нужно было потратить год работы команды из ста человек, чтобы улучшить пользовательский опыт на пару процентов. С приходом нейросетей оказалось, что можно увеличить показатели качества на те же два процента, если в течение месяца обучать алгоритм. Стало ясно, что в это выгодно вкладываться.

63 За годы работы крупные компании - Google, Microsoft, Яндекс - накопили много данных. Они начали тренировать на этих данных большие нейросети, чтобы решить множество внутренних и внешних задач.

64 Пару лет назад "Яндекс" запустил нейросеть<a>"Балабоба"</a>. Технология позволяла решать различные задачи, связанные с текстами. Это выглядело как простой сервис для генерации текстов, но технология позволила решать разные прикладные задачи внутри компании - без сбора больших датасетов и привлечения разработчиков.

65 Это очень прикладные вещи: иногда нужно переписать формулировки, иногда найти в объявлении контактную информацию. Затратив пару месяцев работы команды, можно не просто увеличить показатели счастья юзеров, но и сразу решить целую пачку проблем на нескольких проектах.

66 Вот такой странноватый анекдот сочинила нейросеть<a>"Балабоба"</a>

67 Благодаря вложениям больших компаний на рынке стали появляться результаты работы разработчиков нейросетей. Сейчас люди успешно пишут письма и дипломы с помощью ChatGPT, генерят картинки с помощью StableDiffusion и делают потрясающие аватарки в Lensa или Prisma. Пользователи любят с их помощью менять и стилизовать изображения. Я тоже пользуюсь этой технологией: у меня на аватарке стоит картинка, сгенерированная нейросетью. Трудно сказать, почему это так популярно. Но факт остается фактом: в этой области все еще много стартапов, которые легко привлекают инвестиции.

68 Моя аватарка после обработки нейросетью

69 <h2>Вклад разработчиков в развитие нейросетей</h2>

70 Время от времени кто-то из разработчиков предлагает классные идеи и сам же воплощает их в жизнь - в рамках коммерческого проекта или просто в виде домашнего задания.

71 В 2016 году люди, работающие с текстами, стали пользоваться моделью, которую популяризовал<a>Андрей Карпатый</a>- сейчас очень известный специалист. Он был главой направления AI в компании Tesla и вел Стэнфордский курс по ML. Он написал один из популярных<a>постов</a>про рекуррентные нейронные сети.

72 Все кинулись искать полезное применение этой технологии. Модель была маленькая, она не позволяла решать много задач, но люди вдохновились. Вклад Карпатого в генерацию текстов огромный. Он популяризовал неизвестную технологию, привлек широкий круг разработчиков. Те стали генерировать идеи, проверять гипотезы и заметно продвинули отрасль вперед.

73 Видео Карпатого про языковое моделирование

74 Опенсорс дает большой вклад в развитие ML. Популярнейший фреймворк машинного обучения PyTorch для языка Python - полностью опенсорсный продукт. Известная библиотека для машинного обучения TensorFlow - изначально внутренняя библиотека Google, которую компания со временем перевела в опенсорс, и с тех пор ее развивает комьюнити. Среди контрибьюторов все еще много людей из Google, но влияние комьюнити велико.

75 Такими опенсорсными проектами пользуются абсолютно все, кто занимается обучением нейросетей и применяет их в своих проектах. Если разработчик делает коммиты в PyTorch, это классная строчка в его резюме - он сделал полезный вклад для всего сообщества. Поэтому разработчики заинтересованы в том, чтобы контрибьютить в громкие опенсорсные проекты.

76 Важный вклад делают журналисты и блогеры в мире науки, которые занимаются пересказом статей, рассказывают аудитории, какова была изначальная идея, как она менялась. Как правило, это классные специалисты с личным брендом, им можно доверять. В ML ярко проявляется тенденция, что с помощью личного бренда можно находить хорошую работу, получать гранты и участвовать в интересных проектах.

77 Кроме Андрея Карпатого, стоит упомянуть научного сотрудника Google<a>Себастиана Рудера</a>,<a>Константина Воронцова</a>с опенсорс-курсом по ML, преподавателей<a>Школы Академии Данных</a>, которые создали свой онлайн-учебник по машинному обучению,<a>Валеру Бабушкина</a>и других ребят, которые ведут научно-популярные Telegram-каналы и рассказывают про интересное в области ML.

78 <h2>Что в итоге</h2>

79 <ul><li>Нейросети отлично умеют находить и генерировать тексты, картинки и музыку. Но на этом их возможности не заканчиваются.</li>

80 <li>Нейросетями можно заниматься как прикладной технологией в коммерческой разработке, а можно использовать их в качестве инструмента для исследований в научных лабораториях. В первое легче попасть, а для второго порог входа выше. Вакансий тоже больше в коммерческой разработке.</li>

81 <li>Рынок сейчас не перегрет, поэтому зарплаты у ML-специалистов на уровне зарплат разработчиков.</li>

82 <li>Знания Python достаточно, чтобы писать нейросети и пользоваться ими, а специальные библиотеки упрощают взаимодействие с математикой.</li>

83 <li>Опенсорс дает большой вклад в развитие ML: большинство популярных библиотек и фреймворков с лицензиями - с открытым исходным кодом.</li>

84 </ul><blockquote><h3>Изучите дата-аналитику на Хекслете</h3>

85 Пройдите нашу профессию "<a>Аналитик данных</a>" - это станет вашим первым шажком в работе с нейросетями.

86 </blockquote>