0 added
0 removed
Original
2026-01-01
Modified
2026-02-26
1
<p><strong>Алексей Озерин - эксперт по машинному обучению, занимался компьютерным зрением в Яндексе, а также обработкой естественного языка и нейросетями в технологических стартапах. Мы узнали у него, что такое нейросети, для чего их используют и как программистам начать работать с Machine Learning.</strong></p>
1
<p><strong>Алексей Озерин - эксперт по машинному обучению, занимался компьютерным зрением в Яндексе, а также обработкой естественного языка и нейросетями в технологических стартапах. Мы узнали у него, что такое нейросети, для чего их используют и как программистам начать работать с Machine Learning.</strong></p>
2
<p>Меня зовут<a>Алексей Озерин</a>, сейчас я - эксперт по машинному обучению в агротехническом стартапе<a>OneSoil</a>. Учился на физика в МФТИ, занимался теоретической физикой, а потом ушел в программисты.</p>
2
<p>Меня зовут<a>Алексей Озерин</a>, сейчас я - эксперт по машинному обучению в агротехническом стартапе<a>OneSoil</a>. Учился на физика в МФТИ, занимался теоретической физикой, а потом ушел в программисты.</p>
3
<p>В 2012 году во всем мире случился бум в области развития нейросетей, до России он докатывался довольно долго. К 2015-2016 году появилось много стартапов и инициатив, связанных с нейросетями. В это же время я пришел работать в классную лабораторию Deephacklab, разрабатывать прототипы - поиск и генерация текстов. Проекты были в зачаточном состоянии, но очень интересными.</p>
3
<p>В 2012 году во всем мире случился бум в области развития нейросетей, до России он докатывался довольно долго. К 2015-2016 году появилось много стартапов и инициатив, связанных с нейросетями. В это же время я пришел работать в классную лабораторию Deephacklab, разрабатывать прототипы - поиск и генерация текстов. Проекты были в зачаточном состоянии, но очень интересными.</p>
4
<p>В 2018 году я перешел в Яндекс как Senior Developer, чтобы работать с компьютерным зрением. Решал разные задачи в области Machine Learning (ML) - с картинками, видео и текстами, вплоть до 2022 года. В 2019-2021 вел курс по DL в ВШЭ и был научруком у студентов.</p>
4
<p>В 2018 году я перешел в Яндекс как Senior Developer, чтобы работать с компьютерным зрением. Решал разные задачи в области Machine Learning (ML) - с картинками, видео и текстами, вплоть до 2022 года. В 2019-2021 вел курс по DL в ВШЭ и был научруком у студентов.</p>
5
<p>Сейчас я работаю в стартапе, который занимается сельским хозяйством, - с помощью нейронных сетей по спутниковым снимкам предсказываю, что где растет и когда убирают поля.</p>
5
<p>Сейчас я работаю в стартапе, который занимается сельским хозяйством, - с помощью нейронных сетей по спутниковым снимкам предсказываю, что где растет и когда убирают поля.</p>
6
<blockquote><h3>Изучите дата-аналитику на Хекслете</h3>
6
<blockquote><h3>Изучите дата-аналитику на Хекслете</h3>
7
<p>Пройдите нашу профессию "<a>Аналитик данных</a>" - эта сфера может идеально подойти для использования нейросетей в будущем.</p>
7
<p>Пройдите нашу профессию "<a>Аналитик данных</a>" - эта сфера может идеально подойти для использования нейросетей в будущем.</p>
8
</blockquote><h2>Содержание</h2>
8
</blockquote><h2>Содержание</h2>
9
<ul><li><a>Для каких задач применяют ML и нейросети</a></li>
9
<ul><li><a>Для каких задач применяют ML и нейросети</a></li>
10
<li><a>Как разрабатываются нейросети</a></li>
10
<li><a>Как разрабатываются нейросети</a></li>
11
<li><a>Как попасть в индустрию</a></li>
11
<li><a>Как попасть в индустрию</a></li>
12
<li><a>Карьерный путь в сфере ML</a></li>
12
<li><a>Карьерный путь в сфере ML</a></li>
13
<li><a>Прошлое, настоящее и будущее</a></li>
13
<li><a>Прошлое, настоящее и будущее</a></li>
14
<li><a>Вклад разработчиков в развитие нейросетей</a></li>
14
<li><a>Вклад разработчиков в развитие нейросетей</a></li>
15
<li><a>Что в итоге</a></li>
15
<li><a>Что в итоге</a></li>
16
</ul><h2>Для каких задач применяют ML и нейросети</h2>
16
</ul><h2>Для каких задач применяют ML и нейросети</h2>
17
<p>Есть много прикладных задач, которые решаются с помощью эксперта, простых правил и специально подобранных алгоритмов. Когда данных становится много, у нас появляется возможность извлекать из них полезные знания, обходя ограниченность простых подходов. С помощью ML можно рассчитывать риски - например, предсказать, выплатит ли человек кредит, или рассчитать будущие цены на квартиры.</p>
17
<p>Есть много прикладных задач, которые решаются с помощью эксперта, простых правил и специально подобранных алгоритмов. Когда данных становится много, у нас появляется возможность извлекать из них полезные знания, обходя ограниченность простых подходов. С помощью ML можно рассчитывать риски - например, предсказать, выплатит ли человек кредит, или рассчитать будущие цены на квартиры.</p>
18
<p>Есть отдельная группа задач, для которых нейросети особенно хороши: находить похожие картинки, звуки и посты, генерировать изображения и тексты. Конечно, искать похожие аудио можно и без нейросетей - приложение Shazam прекрасно работало даже в первых версиях. Но обучение алгоритмов с помощью нейросетей дает дополнительные возможности.</p>
18
<p>Есть отдельная группа задач, для которых нейросети особенно хороши: находить похожие картинки, звуки и посты, генерировать изображения и тексты. Конечно, искать похожие аудио можно и без нейросетей - приложение Shazam прекрасно работало даже в первых версиях. Но обучение алгоритмов с помощью нейросетей дает дополнительные возможности.</p>
19
<p>Сейчас даже люди, далекие от ML, наслышаны про три направления их использования:</p>
19
<p>Сейчас даже люди, далекие от ML, наслышаны про три направления их использования:</p>
20
<ul><li>Генерация текстов - спасибо чат-боту<a>ChatGPT</a></li>
20
<ul><li>Генерация текстов - спасибо чат-боту<a>ChatGPT</a></li>
21
<li>Генерация картинок - спасибо<a>Stable Diffusion</a>и<a>Midjourney</a></li>
21
<li>Генерация картинок - спасибо<a>Stable Diffusion</a>и<a>Midjourney</a></li>
22
<li>Генерация музыки - спасибо<a>Jukebox</a>.</li>
22
<li>Генерация музыки - спасибо<a>Jukebox</a>.</li>
23
</ul><p><em>Творчество нейросети<a>Midjourney</a></em></p>
23
</ul><p><em>Творчество нейросети<a>Midjourney</a></em></p>
24
<h2>Как разрабатываются нейросети</h2>
24
<h2>Как разрабатываются нейросети</h2>
25
<blockquote><p>В этой части статьи будет немного хардовой информации, связанной с математикой и ML. Если вы ничего не поймете или захотите понять больше, советуем пройти наш курс<a>по математической логике для программистов</a></p>
25
<blockquote><p>В этой части статьи будет немного хардовой информации, связанной с математикой и ML. Если вы ничего не поймете или захотите понять больше, советуем пройти наш курс<a>по математической логике для программистов</a></p>
26
</blockquote><p>Нейросеть - это формула, которая из одного массива чисел делает другой массив. Формула большая и длинная, может быть с миллионами параметров, но собирается из довольно простых операций - арифметики, элементарных функций (синусы, косинусы, экспоненты и даже более простые, вроде взятия степени) и суперпозиции.</p>
26
</blockquote><p>Нейросеть - это формула, которая из одного массива чисел делает другой массив. Формула большая и длинная, может быть с миллионами параметров, но собирается из довольно простых операций - арифметики, элементарных функций (синусы, косинусы, экспоненты и даже более простые, вроде взятия степени) и суперпозиции.</p>
27
<p>Выше пример одной из решаемых задачек: классификация изображений на условные тысячу классов. Входной массив здесь - просто массив пикселей картинки, выходной - вектор с вероятностями, что изображено на картинке. Выходной массив может быть и картинкой (например, как в задачах pix2pix на улучшение картинок или дорисовывание). Входной массив может быть не картинкой, а последовательностью слов - так, например, происходит в генерации картинок по тексту.</p>
27
<p>Выше пример одной из решаемых задачек: классификация изображений на условные тысячу классов. Входной массив здесь - просто массив пикселей картинки, выходной - вектор с вероятностями, что изображено на картинке. Выходной массив может быть и картинкой (например, как в задачах pix2pix на улучшение картинок или дорисовывание). Входной массив может быть не картинкой, а последовательностью слов - так, например, происходит в генерации картинок по тексту.</p>
28
<p>С отдельными элементами входного массива обычно не работают: действия собирают в слои и применяют операцию ко всему массиву сразу. Котика на картинке распознают независимо от того, в какой части картинки он находится.</p>
28
<p>С отдельными элементами входного массива обычно не работают: действия собирают в слои и применяют операцию ко всему массиву сразу. Котика на картинке распознают независимо от того, в какой части картинки он находится.</p>
29
<p>Саму формулу пишут не как аналитическую формулу, а вычислительным графом - это рецепт для калькулятора, в каком порядке и что делать с входным и промежуточным массивами.</p>
29
<p>Саму формулу пишут не как аналитическую формулу, а вычислительным графом - это рецепт для калькулятора, в каком порядке и что делать с входным и промежуточным массивами.</p>
30
<p><em>Источник:<a>https://arxiv.org/abs/1812.01187</a></em></p>
30
<p><em>Источник:<a>https://arxiv.org/abs/1812.01187</a></em></p>
31
<p>Вот характерный пример ResNet50. Очень популярная, старая и довольно простая моделька. Она может показаться сложной, но операции - простые, а концепция вычислительного графа позволяет работать со сложными формулами. В этих слоях скрываются числа, они же - веса - коэффициенты в большой формуле. Сначала параметры инициализируют небольшими случайными числами, а затем улучшают с помощью градиентного спуска. Так система самообучается.</p>
31
<p>Вот характерный пример ResNet50. Очень популярная, старая и довольно простая моделька. Она может показаться сложной, но операции - простые, а концепция вычислительного графа позволяет работать со сложными формулами. В этих слоях скрываются числа, они же - веса - коэффициенты в большой формуле. Сначала параметры инициализируют небольшими случайными числами, а затем улучшают с помощью градиентного спуска. Так система самообучается.</p>
32
<p>Расчеты по этой формуле обычно происходят на движке, написанном на С/C++. Обвязку к этому движку обычно делают на Python. Есть языки, которые считаются более производительными, чем Python, например, C++ и Lua. Но на них сейчас нейросети почти не пишут, кроме низкоуровневых сетей для устройств. Знания Python достаточно, чтобы писать крутые вещи.</p>
32
<p>Расчеты по этой формуле обычно происходят на движке, написанном на С/C++. Обвязку к этому движку обычно делают на Python. Есть языки, которые считаются более производительными, чем Python, например, C++ и Lua. Но на них сейчас нейросети почти не пишут, кроме низкоуровневых сетей для устройств. Знания Python достаточно, чтобы писать крутые вещи.</p>
33
<p>Есть библиотеки, позволяющие упростить процесс разработки. Крутые обертки и сборники моделей - одна из причин, почему сейчас стало популярно разрабатывать нейросети. Например, проект<a>Hugging Face</a>- это платформа для разработки и использования моделей и приложений на основе искусственного интеллекта, особенно в области обработки естественного языка (Natural Language Processing). Интерфейсы моделей отвязаны от математики, это простые и конкретные инструкции, что именно сделать, чтоб получить результат. А вот при использовании фреймворков<a>PyTorch</a>,<a>Jax</a>и<a>TensorFlow</a>для работы с данными и машинного обучения придется плотнее взаимодействовать с математикой.</p>
33
<p>Есть библиотеки, позволяющие упростить процесс разработки. Крутые обертки и сборники моделей - одна из причин, почему сейчас стало популярно разрабатывать нейросети. Например, проект<a>Hugging Face</a>- это платформа для разработки и использования моделей и приложений на основе искусственного интеллекта, особенно в области обработки естественного языка (Natural Language Processing). Интерфейсы моделей отвязаны от математики, это простые и конкретные инструкции, что именно сделать, чтоб получить результат. А вот при использовании фреймворков<a>PyTorch</a>,<a>Jax</a>и<a>TensorFlow</a>для работы с данными и машинного обучения придется плотнее взаимодействовать с математикой.</p>
34
<h2>Как попасть в индустрию</h2>
34
<h2>Как попасть в индустрию</h2>
35
<p>Нейросетями можно заниматься как прикладной технологией в коммерческой разработке, так и использовать их в качестве инструмента для исследований в научных лабораториях.</p>
35
<p>Нейросетями можно заниматься как прикладной технологией в коммерческой разработке, так и использовать их в качестве инструмента для исследований в научных лабораториях.</p>
36
<p>В 2016 году, чтобы попасть в лабораторию, занимающуюся нейросетями, ничего особенного знать и уметь не требовалось. Сейчас порог входа в исследовательские лаборатории, где применяют эту технологию, увеличился. Нужно соответствовать высоким требованиям: знать математику, хорошо кодить, иметь научные публикации. Такой уровень экспертизы есть у небольшой части людей.</p>
36
<p>В 2016 году, чтобы попасть в лабораторию, занимающуюся нейросетями, ничего особенного знать и уметь не требовалось. Сейчас порог входа в исследовательские лаборатории, где применяют эту технологию, увеличился. Нужно соответствовать высоким требованиям: знать математику, хорошо кодить, иметь научные публикации. Такой уровень экспертизы есть у небольшой части людей.</p>
37
<p>Вакансий публикуется больше не в области исследований, а в прикладных проектах. Прикладными проектами может заниматься обычный разработчик. Для этого нужно уметь кодить, решать задачи и использовать системный подход. Нужно учиться делать базовые вещи максимально аккуратно. А все остальное получится в свое время.</p>
37
<p>Вакансий публикуется больше не в области исследований, а в прикладных проектах. Прикладными проектами может заниматься обычный разработчик. Для этого нужно уметь кодить, решать задачи и использовать системный подход. Нужно учиться делать базовые вещи максимально аккуратно. А все остальное получится в свое время.</p>
38
<p><em><strong>Самое тяжелое умение - на грани hard skills и soft skills - понимать, что делаешь. Подвох в том, что данные могут лежать в каком угодно виде, и надо уметь грамотно их обрабатывать. Если есть десятки CSV, которые ссылаются друг на друга, нужно правильно соединить их между собой по ключам и в процессе ничего не потерять и не приобрести. Это сложная задача для людей, которые хотят создавать искусственный интеллект.</strong></em></p>
38
<p><em><strong>Самое тяжелое умение - на грани hard skills и soft skills - понимать, что делаешь. Подвох в том, что данные могут лежать в каком угодно виде, и надо уметь грамотно их обрабатывать. Если есть десятки CSV, которые ссылаются друг на друга, нужно правильно соединить их между собой по ключам и в процессе ничего не потерять и не приобрести. Это сложная задача для людей, которые хотят создавать искусственный интеллект.</strong></em></p>
39
<p>Чтобы стать разработчиком нейросетей, должен быть искренний, неиссякаемый интерес к этому. Желательно иметь в голове образ результата, абстрактное желание заниматься нейросетями ни к чему не приведет. "Я хочу сделать систему, которая может взять сэмпл голоса и научиться подменять на него любой другой голос" - это круто.</p>
39
<p>Чтобы стать разработчиком нейросетей, должен быть искренний, неиссякаемый интерес к этому. Желательно иметь в голове образ результата, абстрактное желание заниматься нейросетями ни к чему не приведет. "Я хочу сделать систему, которая может взять сэмпл голоса и научиться подменять на него любой другой голос" - это круто.</p>
40
<p>Сильная образовательная база не так важна, как любознательность и усидчивость. Однако, если в вузе вы хорошо изучили математику и алгоритмы, ваш инструментарий будет богаче. Многие задачи, которые встречаются в моей работе сейчас, я научился решать еще в университете.</p>
40
<p>Сильная образовательная база не так важна, как любознательность и усидчивость. Однако, если в вузе вы хорошо изучили математику и алгоритмы, ваш инструментарий будет богаче. Многие задачи, которые встречаются в моей работе сейчас, я научился решать еще в университете.</p>
41
<p>Помимо математических знаний и опыта разработки, здорово обладать профильной экспертизой - это помогает быстрее находить очевидные глупости и лучше понимать ценность решения. Нейросеть - это лишь инструмент, которым можно овладеть за короткий срок, а профильный опыт накапливается довольно долго. Выбирайте сферу, в которой у вас есть такой опыт. Например, если умеете работать с микроконтроллерами, портировать какие-то штуки на железки, то идите специалистом по нейросетям в промышленность. А если хорошо знаете банковскую сферу, ее риски и ограничения, то в банк.</p>
41
<p>Помимо математических знаний и опыта разработки, здорово обладать профильной экспертизой - это помогает быстрее находить очевидные глупости и лучше понимать ценность решения. Нейросеть - это лишь инструмент, которым можно овладеть за короткий срок, а профильный опыт накапливается довольно долго. Выбирайте сферу, в которой у вас есть такой опыт. Например, если умеете работать с микроконтроллерами, портировать какие-то штуки на железки, то идите специалистом по нейросетям в промышленность. А если хорошо знаете банковскую сферу, ее риски и ограничения, то в банк.</p>
42
<p>Определитесь, к какому результату стремитесь именно вы. Можно копать в сторону определенного класса задач и пройти специализированные курсы:</p>
42
<p>Определитесь, к какому результату стремитесь именно вы. Можно копать в сторону определенного класса задач и пройти специализированные курсы:</p>
43
<ul><li>По компьютерному зрению - например,<a>Стэнфордский курс CS231n: Convolutional Neural Networks for Visual Recognition</a></li>
43
<ul><li>По компьютерному зрению - например,<a>Стэнфордский курс CS231n: Convolutional Neural Networks for Visual Recognition</a></li>
44
<li><a>По обработке текстов на естественном языке (NLP)</a></li>
44
<li><a>По обработке текстов на естественном языке (NLP)</a></li>
45
<li><a>По графовым нейронным сетям</a>.</li>
45
<li><a>По графовым нейронным сетям</a>.</li>
46
</ul><p>Эти курсы дадут хорошее представление о том, как все работает и что можно делать с помощью нейросетей. А параллельно с обучением стоит искать работу: лучше всего учится и запоминается то, что совпадает с рабочими обязанностями.</p>
46
</ul><p>Эти курсы дадут хорошее представление о том, как все работает и что можно делать с помощью нейросетей. А параллельно с обучением стоит искать работу: лучше всего учится и запоминается то, что совпадает с рабочими обязанностями.</p>
47
<h2>Карьерный путь в сфере ML</h2>
47
<h2>Карьерный путь в сфере ML</h2>
48
<p>Карьерный путь специалиста в нашей области простой:</p>
48
<p>Карьерный путь специалиста в нашей области простой:</p>
49
<p><em>Анализируешь профильный опыт -> Ищешь точку приложения своих знаний и навыков -> Начинаешь работать -> Закрываешь пробелы и учишь новое на материалах подходящего уровня, которые соответствуют твоему опыту.</em></p>
49
<p><em>Анализируешь профильный опыт -> Ищешь точку приложения своих знаний и навыков -> Начинаешь работать -> Закрываешь пробелы и учишь новое на материалах подходящего уровня, которые соответствуют твоему опыту.</em></p>
50
<p>Я точно не знаю, как сейчас выглядит рынок ML-вакансий в России. Но те, что есть, в основном не для джуниоров. Все ищут сеньоров, и это очень плохо - отсутствует преемственность поколений. Будущий хороший специалист должен приходить в компанию джуном и учиться там у сеньоров и мидлов. Через некоторое время он матереет, легко справляется с типовыми задачами, становится способен исследовать что-то новое и продвигать индустрию. Если компания нанимает только сеньоров, она не растит джунов и не поставляет на рынок новых специалистов.</p>
50
<p>Я точно не знаю, как сейчас выглядит рынок ML-вакансий в России. Но те, что есть, в основном не для джуниоров. Все ищут сеньоров, и это очень плохо - отсутствует преемственность поколений. Будущий хороший специалист должен приходить в компанию джуном и учиться там у сеньоров и мидлов. Через некоторое время он матереет, легко справляется с типовыми задачами, становится способен исследовать что-то новое и продвигать индустрию. Если компания нанимает только сеньоров, она не растит джунов и не поставляет на рынок новых специалистов.</p>
51
<p>На мировой рынок, безусловно, сейчас влияет кризис в бигтехе (Big Tech). Стартапы стали получать значительно меньше инвестиций и перестали нанимать стажеров. Сокращения в компании Meta* (<em>Объявлена в России "экстремистской организацией", ее деятельность в РФ запрещена. Мы вынуждены указывать это по требованию российских властей</em>), Google, Microsoft привели к уменьшению вакансий, и это беда. Кризис в основном бьет по джунам и мидлам, которые хотели вкатиться в эту область.</p>
51
<p>На мировой рынок, безусловно, сейчас влияет кризис в бигтехе (Big Tech). Стартапы стали получать значительно меньше инвестиций и перестали нанимать стажеров. Сокращения в компании Meta* (<em>Объявлена в России "экстремистской организацией", ее деятельность в РФ запрещена. Мы вынуждены указывать это по требованию российских властей</em>), Google, Microsoft привели к уменьшению вакансий, и это беда. Кризис в основном бьет по джунам и мидлам, которые хотели вкатиться в эту область.</p>
52
<p>Кажется, Яндекс все еще приглашает на стажировки. Это хорошо, потому что прийти стажером в крупную технологическую компанию - большая удача. На стажировку берут вчерашних выпускников и собеседуют их не так, как опытных разработчиков: смотрят, хороши ли они в математике - в области, релевантной задачам компании. Мидлов на собеседованиях спрашивают про опыт работы, а по математике не гоняют.</p>
52
<p>Кажется, Яндекс все еще приглашает на стажировки. Это хорошо, потому что прийти стажером в крупную технологическую компанию - большая удача. На стажировку берут вчерашних выпускников и собеседуют их не так, как опытных разработчиков: смотрят, хороши ли они в математике - в области, релевантной задачам компании. Мидлов на собеседованиях спрашивают про опыт работы, а по математике не гоняют.</p>
53
<p>Если опыта нет, полезно работать над опенсорс-проектами. Есть такое движение -<a>AI for social good</a>, когда специалисты по ML решают какую-нибудь общественно полезную задачу. Например, были проекты помощи в поисках пропавших людей или затонувших кораблей. Это очень хорошее направление деятельности, в которое можно прийти новичком с горящими глазами, а уйти с ценным опытом.</p>
53
<p>Если опыта нет, полезно работать над опенсорс-проектами. Есть такое движение -<a>AI for social good</a>, когда специалисты по ML решают какую-нибудь общественно полезную задачу. Например, были проекты помощи в поисках пропавших людей или затонувших кораблей. Это очень хорошее направление деятельности, в которое можно прийти новичком с горящими глазами, а уйти с ценным опытом.</p>
54
<blockquote><h3>Читайте также:</h3>
54
<blockquote><h3>Читайте также:</h3>
55
<p>Как выбрать свой первый опенсорс проект:<a>большая инструкция от Хекслета</a></p>
55
<p>Как выбрать свой первый опенсорс проект:<a>большая инструкция от Хекслета</a></p>
56
</blockquote><p>Необязательно ставить высокие благородные цели. Важно взять задачу и довести ее до конца, наступив на положенное количество граблей. Почти наверняка у каждого разработчика есть знакомый ML-специалист, преподаватель в области искусственного интеллекта или блогер, который делает материалы на эту тему. Имеет смысл написать ему и попросить задачку для новичка - так можно найти ментора или научного руководителя.</p>
56
</blockquote><p>Необязательно ставить высокие благородные цели. Важно взять задачу и довести ее до конца, наступив на положенное количество граблей. Почти наверняка у каждого разработчика есть знакомый ML-специалист, преподаватель в области искусственного интеллекта или блогер, который делает материалы на эту тему. Имеет смысл написать ему и попросить задачку для новичка - так можно найти ментора или научного руководителя.</p>
57
<p>У IT в целом репутация непыльной работы. Во многих компаниях сотрудники перерабатывают и выгорают. Работа может быть и не пыльная, но стресс и нервы тут точно есть.</p>
57
<p>У IT в целом репутация непыльной работы. Во многих компаниях сотрудники перерабатывают и выгорают. Работа может быть и не пыльная, но стресс и нервы тут точно есть.</p>
58
<h2>Прошлое, настоящее и будущее</h2>
58
<h2>Прошлое, настоящее и будущее</h2>
59
<p>Картины, нарисованные нейросетями, которые так восхищают современных пользователей, - не новость для нашей индустрии. GANы для генерации картинок появились еще в 2014 году и произвели фурор среди специалистов, но для широкой публики результаты получались невзрачными.</p>
59
<p>Картины, нарисованные нейросетями, которые так восхищают современных пользователей, - не новость для нашей индустрии. GANы для генерации картинок появились еще в 2014 году и произвели фурор среди специалистов, но для широкой публики результаты получались невзрачными.</p>
60
<p>Большие компании копят данные и контент всю историю своего существования. С картинками прорыв случился в 2012 со знаменитым Imagenet, а вот в текстах Imagenet-момент зрел почему-то дольше. Теперь, когда нашлось столько вариантов применения для картинок и текстов, созданных нейросетями, дело за музыкой и голосом.</p>
60
<p>Большие компании копят данные и контент всю историю своего существования. С картинками прорыв случился в 2012 со знаменитым Imagenet, а вот в текстах Imagenet-момент зрел почему-то дольше. Теперь, когда нашлось столько вариантов применения для картинок и текстов, созданных нейросетями, дело за музыкой и голосом.</p>
61
<p><em><strong>Сфера AI получила такое развитие только тогда, когда крупные компании увидели в этом перспективу. Нейросети помогают захватывать новые рынки, привлекать аудиторию. Поиск Google и Яндекс долгое время был построен на солидных, классических технологиях. Нейронные сети появились здесь совсем недавно. Сначала это были алгоритмы, потом - эвристики с подобранными параметрами, потом - какие-то простые ML-вещи. Нейросетей долго не было, потому что отвечать на запросы пользователей с их помощью сильно дороже, чем с помощью классических решений. А в поиске время ответа важно.</strong></em></p>
61
<p><em><strong>Сфера AI получила такое развитие только тогда, когда крупные компании увидели в этом перспективу. Нейросети помогают захватывать новые рынки, привлекать аудиторию. Поиск Google и Яндекс долгое время был построен на солидных, классических технологиях. Нейронные сети появились здесь совсем недавно. Сначала это были алгоритмы, потом - эвристики с подобранными параметрами, потом - какие-то простые ML-вещи. Нейросетей долго не было, потому что отвечать на запросы пользователей с их помощью сильно дороже, чем с помощью классических решений. А в поиске время ответа важно.</strong></em></p>
62
<p>Раньше нужно было потратить год работы команды из ста человек, чтобы улучшить пользовательский опыт на пару процентов. С приходом нейросетей оказалось, что можно увеличить показатели качества на те же два процента, если в течение месяца обучать алгоритм. Стало ясно, что в это выгодно вкладываться.</p>
62
<p>Раньше нужно было потратить год работы команды из ста человек, чтобы улучшить пользовательский опыт на пару процентов. С приходом нейросетей оказалось, что можно увеличить показатели качества на те же два процента, если в течение месяца обучать алгоритм. Стало ясно, что в это выгодно вкладываться.</p>
63
<p>За годы работы крупные компании - Google, Microsoft, Яндекс - накопили много данных. Они начали тренировать на этих данных большие нейросети, чтобы решить множество внутренних и внешних задач.</p>
63
<p>За годы работы крупные компании - Google, Microsoft, Яндекс - накопили много данных. Они начали тренировать на этих данных большие нейросети, чтобы решить множество внутренних и внешних задач.</p>
64
<p>Пару лет назад "Яндекс" запустил нейросеть<a>"Балабоба"</a>. Технология позволяла решать различные задачи, связанные с текстами. Это выглядело как простой сервис для генерации текстов, но технология позволила решать разные прикладные задачи внутри компании - без сбора больших датасетов и привлечения разработчиков.</p>
64
<p>Пару лет назад "Яндекс" запустил нейросеть<a>"Балабоба"</a>. Технология позволяла решать различные задачи, связанные с текстами. Это выглядело как простой сервис для генерации текстов, но технология позволила решать разные прикладные задачи внутри компании - без сбора больших датасетов и привлечения разработчиков.</p>
65
<p>Это очень прикладные вещи: иногда нужно переписать формулировки, иногда найти в объявлении контактную информацию. Затратив пару месяцев работы команды, можно не просто увеличить показатели счастья юзеров, но и сразу решить целую пачку проблем на нескольких проектах.</p>
65
<p>Это очень прикладные вещи: иногда нужно переписать формулировки, иногда найти в объявлении контактную информацию. Затратив пару месяцев работы команды, можно не просто увеличить показатели счастья юзеров, но и сразу решить целую пачку проблем на нескольких проектах.</p>
66
<p><em>Вот такой странноватый анекдот сочинила нейросеть<a>"Балабоба"</a></em></p>
66
<p><em>Вот такой странноватый анекдот сочинила нейросеть<a>"Балабоба"</a></em></p>
67
<p>Благодаря вложениям больших компаний на рынке стали появляться результаты работы разработчиков нейросетей. Сейчас люди успешно пишут письма и дипломы с помощью ChatGPT, генерят картинки с помощью StableDiffusion и делают потрясающие аватарки в Lensa или Prisma. Пользователи любят с их помощью менять и стилизовать изображения. Я тоже пользуюсь этой технологией: у меня на аватарке стоит картинка, сгенерированная нейросетью. Трудно сказать, почему это так популярно. Но факт остается фактом: в этой области все еще много стартапов, которые легко привлекают инвестиции.</p>
67
<p>Благодаря вложениям больших компаний на рынке стали появляться результаты работы разработчиков нейросетей. Сейчас люди успешно пишут письма и дипломы с помощью ChatGPT, генерят картинки с помощью StableDiffusion и делают потрясающие аватарки в Lensa или Prisma. Пользователи любят с их помощью менять и стилизовать изображения. Я тоже пользуюсь этой технологией: у меня на аватарке стоит картинка, сгенерированная нейросетью. Трудно сказать, почему это так популярно. Но факт остается фактом: в этой области все еще много стартапов, которые легко привлекают инвестиции.</p>
68
<p><em>Моя аватарка после обработки нейросетью</em></p>
68
<p><em>Моя аватарка после обработки нейросетью</em></p>
69
<h2>Вклад разработчиков в развитие нейросетей</h2>
69
<h2>Вклад разработчиков в развитие нейросетей</h2>
70
<p>Время от времени кто-то из разработчиков предлагает классные идеи и сам же воплощает их в жизнь - в рамках коммерческого проекта или просто в виде домашнего задания.</p>
70
<p>Время от времени кто-то из разработчиков предлагает классные идеи и сам же воплощает их в жизнь - в рамках коммерческого проекта или просто в виде домашнего задания.</p>
71
<p>В 2016 году люди, работающие с текстами, стали пользоваться моделью, которую популяризовал<a>Андрей Карпатый</a>- сейчас очень известный специалист. Он был главой направления AI в компании Tesla и вел Стэнфордский курс по ML. Он написал один из популярных<a>постов</a>про рекуррентные нейронные сети.</p>
71
<p>В 2016 году люди, работающие с текстами, стали пользоваться моделью, которую популяризовал<a>Андрей Карпатый</a>- сейчас очень известный специалист. Он был главой направления AI в компании Tesla и вел Стэнфордский курс по ML. Он написал один из популярных<a>постов</a>про рекуррентные нейронные сети.</p>
72
<p>Все кинулись искать полезное применение этой технологии. Модель была маленькая, она не позволяла решать много задач, но люди вдохновились. Вклад Карпатого в генерацию текстов огромный. Он популяризовал неизвестную технологию, привлек широкий круг разработчиков. Те стали генерировать идеи, проверять гипотезы и заметно продвинули отрасль вперед.</p>
72
<p>Все кинулись искать полезное применение этой технологии. Модель была маленькая, она не позволяла решать много задач, но люди вдохновились. Вклад Карпатого в генерацию текстов огромный. Он популяризовал неизвестную технологию, привлек широкий круг разработчиков. Те стали генерировать идеи, проверять гипотезы и заметно продвинули отрасль вперед.</p>
73
<p><em>Видео Карпатого про языковое моделирование</em></p>
73
<p><em>Видео Карпатого про языковое моделирование</em></p>
74
<p>Опенсорс дает большой вклад в развитие ML. Популярнейший фреймворк машинного обучения PyTorch для языка Python - полностью опенсорсный продукт. Известная библиотека для машинного обучения TensorFlow - изначально внутренняя библиотека Google, которую компания со временем перевела в опенсорс, и с тех пор ее развивает комьюнити. Среди контрибьюторов все еще много людей из Google, но влияние комьюнити велико.</p>
74
<p>Опенсорс дает большой вклад в развитие ML. Популярнейший фреймворк машинного обучения PyTorch для языка Python - полностью опенсорсный продукт. Известная библиотека для машинного обучения TensorFlow - изначально внутренняя библиотека Google, которую компания со временем перевела в опенсорс, и с тех пор ее развивает комьюнити. Среди контрибьюторов все еще много людей из Google, но влияние комьюнити велико.</p>
75
<p><em><strong>Такими опенсорсными проектами пользуются абсолютно все, кто занимается обучением нейросетей и применяет их в своих проектах. Если разработчик делает коммиты в PyTorch, это классная строчка в его резюме - он сделал полезный вклад для всего сообщества. Поэтому разработчики заинтересованы в том, чтобы контрибьютить в громкие опенсорсные проекты.</strong></em></p>
75
<p><em><strong>Такими опенсорсными проектами пользуются абсолютно все, кто занимается обучением нейросетей и применяет их в своих проектах. Если разработчик делает коммиты в PyTorch, это классная строчка в его резюме - он сделал полезный вклад для всего сообщества. Поэтому разработчики заинтересованы в том, чтобы контрибьютить в громкие опенсорсные проекты.</strong></em></p>
76
<p>Важный вклад делают журналисты и блогеры в мире науки, которые занимаются пересказом статей, рассказывают аудитории, какова была изначальная идея, как она менялась. Как правило, это классные специалисты с личным брендом, им можно доверять. В ML ярко проявляется тенденция, что с помощью личного бренда можно находить хорошую работу, получать гранты и участвовать в интересных проектах.</p>
76
<p>Важный вклад делают журналисты и блогеры в мире науки, которые занимаются пересказом статей, рассказывают аудитории, какова была изначальная идея, как она менялась. Как правило, это классные специалисты с личным брендом, им можно доверять. В ML ярко проявляется тенденция, что с помощью личного бренда можно находить хорошую работу, получать гранты и участвовать в интересных проектах.</p>
77
<p>Кроме Андрея Карпатого, стоит упомянуть научного сотрудника Google<a>Себастиана Рудера</a>,<a>Константина Воронцова</a>с опенсорс-курсом по ML, преподавателей<a>Школы Академии Данных</a>, которые создали свой онлайн-учебник по машинному обучению,<a>Валеру Бабушкина</a>и других ребят, которые ведут научно-популярные Telegram-каналы и рассказывают про интересное в области ML.</p>
77
<p>Кроме Андрея Карпатого, стоит упомянуть научного сотрудника Google<a>Себастиана Рудера</a>,<a>Константина Воронцова</a>с опенсорс-курсом по ML, преподавателей<a>Школы Академии Данных</a>, которые создали свой онлайн-учебник по машинному обучению,<a>Валеру Бабушкина</a>и других ребят, которые ведут научно-популярные Telegram-каналы и рассказывают про интересное в области ML.</p>
78
<h2>Что в итоге</h2>
78
<h2>Что в итоге</h2>
79
<ul><li>Нейросети отлично умеют находить и генерировать тексты, картинки и музыку. Но на этом их возможности не заканчиваются.</li>
79
<ul><li>Нейросети отлично умеют находить и генерировать тексты, картинки и музыку. Но на этом их возможности не заканчиваются.</li>
80
<li>Нейросетями можно заниматься как прикладной технологией в коммерческой разработке, а можно использовать их в качестве инструмента для исследований в научных лабораториях. В первое легче попасть, а для второго порог входа выше. Вакансий тоже больше в коммерческой разработке.</li>
80
<li>Нейросетями можно заниматься как прикладной технологией в коммерческой разработке, а можно использовать их в качестве инструмента для исследований в научных лабораториях. В первое легче попасть, а для второго порог входа выше. Вакансий тоже больше в коммерческой разработке.</li>
81
<li>Рынок сейчас не перегрет, поэтому зарплаты у ML-специалистов на уровне зарплат разработчиков.</li>
81
<li>Рынок сейчас не перегрет, поэтому зарплаты у ML-специалистов на уровне зарплат разработчиков.</li>
82
<li>Знания Python достаточно, чтобы писать нейросети и пользоваться ими, а специальные библиотеки упрощают взаимодействие с математикой.</li>
82
<li>Знания Python достаточно, чтобы писать нейросети и пользоваться ими, а специальные библиотеки упрощают взаимодействие с математикой.</li>
83
<li>Опенсорс дает большой вклад в развитие ML: большинство популярных библиотек и фреймворков с лицензиями - с открытым исходным кодом.</li>
83
<li>Опенсорс дает большой вклад в развитие ML: большинство популярных библиотек и фреймворков с лицензиями - с открытым исходным кодом.</li>
84
</ul><blockquote><h3>Изучите дата-аналитику на Хекслете</h3>
84
</ul><blockquote><h3>Изучите дата-аналитику на Хекслете</h3>
85
<p>Пройдите нашу профессию "<a>Аналитик данных</a>" - это станет вашим первым шажком в работе с нейросетями.</p>
85
<p>Пройдите нашу профессию "<a>Аналитик данных</a>" - это станет вашим первым шажком в работе с нейросетями.</p>
86
</blockquote>
86
</blockquote>