HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-02-21
1 <p><a>#статьи</a></p>
1 <p><a>#статьи</a></p>
2 <ul><li>2 сен 2022</li>
2 <ul><li>2 сен 2022</li>
3 <li>0</li>
3 <li>0</li>
4 </ul><p>Зачем бизнесу нейросети и можно ли освоить ML без математической подготовки.</p>
4 </ul><p>Зачем бизнесу нейросети и можно ли освоить ML без математической подготовки.</p>
5 <p>Иллюстрация: Dalee / Openai / Tong / Rawpixel / Annie для Skillbox Media</p>
5 <p>Иллюстрация: Dalee / Openai / Tong / Rawpixel / Annie для Skillbox Media</p>
6 <p>Журналист, коммерческий автор и редактор. Пишет про IT, цифровой маркетинг и бизнес. Сайт:<a>darovska.com</a>.</p>
6 <p>Журналист, коммерческий автор и редактор. Пишет про IT, цифровой маркетинг и бизнес. Сайт:<a>darovska.com</a>.</p>
7 <p>Разработчик приложений, использующих ML. IT‑консультант, основатель и СTO в ML‑проекте<a>Giftbox</a>. Создал русскоязычную версию<a>Wordle</a>.</p>
7 <p>Разработчик приложений, использующих ML. IT‑консультант, основатель и СTO в ML‑проекте<a>Giftbox</a>. Создал русскоязычную версию<a>Wordle</a>.</p>
8 <p>Заниматься машинным обучением я начал ещё в университете и даже использовал его в дипломном проекте. Позже работал в аутсорс-агентстве, которое специализировалось на заказной разработке нейросетей, что помогло узнать массу нюансов. Например, даже развернуть модель в продакшен - непростая задача.</p>
8 <p>Заниматься машинным обучением я начал ещё в университете и даже использовал его в дипломном проекте. Позже работал в аутсорс-агентстве, которое специализировалось на заказной разработке нейросетей, что помогло узнать массу нюансов. Например, даже развернуть модель в продакшен - непростая задача.</p>
9 <p>Позже я решил создать собственный сервис, в котором нейросеть будет помогать выбирать подарки. Впрочем, давайте по порядку.</p>
9 <p>Позже я решил создать собственный сервис, в котором нейросеть будет помогать выбирать подарки. Впрочем, давайте по порядку.</p>
10 <p>Машинное обучение - часть Computer Science, объекты изучения и разработки в которой - алгоритмы, способные обучаться за счёт анализа данных. Эти алгоритмы применяют для решения задач довольно широкого спектра: классификации, прогнозирования, регрессии и так далее. А самая продвинутая методика на сегодняшний день - использование нейросетей, поэтому под ML чаще всего подразумевают именно работу с нейросетями.</p>
10 <p>Машинное обучение - часть Computer Science, объекты изучения и разработки в которой - алгоритмы, способные обучаться за счёт анализа данных. Эти алгоритмы применяют для решения задач довольно широкого спектра: классификации, прогнозирования, регрессии и так далее. А самая продвинутая методика на сегодняшний день - использование нейросетей, поэтому под ML чаще всего подразумевают именно работу с нейросетями.</p>
11 <p>Сейчас использование нейросетей стало повсеместным, и встретить их можно даже в популярных текстовых и табличных редакторах. Простейший пример - парсинг и выгрузка с сайтов в Google-таблицы картинок и другого контента. Можно даже не писать код: достаточно просто ввести в ячейки то, что вам нужно (название, цену товара в магазине и так далее), - и все данные подтянутся сами, как на видео:</p>
11 <p>Сейчас использование нейросетей стало повсеместным, и встретить их можно даже в популярных текстовых и табличных редакторах. Простейший пример - парсинг и выгрузка с сайтов в Google-таблицы картинок и другого контента. Можно даже не писать код: достаточно просто ввести в ячейки то, что вам нужно (название, цену товара в магазине и так далее), - и все данные подтянутся сами, как на видео:</p>
12 <p>Чуть более навороченный кейс, который широко развирусился, - нейросеть<a>DALL‑E</a>от OpenAI и её опенсорс-аналог<a>DALL‑E mini</a>. Принцип их работы такой: пользователь вводит текст, а нейросеть генерирует по этому запросу изображение:</p>
12 <p>Чуть более навороченный кейс, который широко развирусился, - нейросеть<a>DALL‑E</a>от OpenAI и её опенсорс-аналог<a>DALL‑E mini</a>. Принцип их работы такой: пользователь вводит текст, а нейросеть генерирует по этому запросу изображение:</p>
13 Примеры изображений по запросу "cat ice cream"<em>Скриншот:<a>Craiyon</a> </em><p>У этих сервисов большой потенциал: возможно, в будущем они сильно упростят работу с Photoshop и прочими графическими редакторами, позволят заметно ускорить работу дизайнеров, иллюстраторов, да и обычных пользователей. Больше не нужно будет искать исполнителя, согласовывать с ним техзадание и долго спорить с ним в духе: "Я вам не это заказывал! - Я художник, я так вижу!" Сравнительно несложные картинки и коллажи можно теперь сделать самостоятельно за несколько минут.</p>
13 Примеры изображений по запросу "cat ice cream"<em>Скриншот:<a>Craiyon</a> </em><p>У этих сервисов большой потенциал: возможно, в будущем они сильно упростят работу с Photoshop и прочими графическими редакторами, позволят заметно ускорить работу дизайнеров, иллюстраторов, да и обычных пользователей. Больше не нужно будет искать исполнителя, согласовывать с ним техзадание и долго спорить с ним в духе: "Я вам не это заказывал! - Я художник, я так вижу!" Сравнительно несложные картинки и коллажи можно теперь сделать самостоятельно за несколько минут.</p>
14 <p>Точно так же нейросети могут стать мощным инструментом для создания собственных продуктов, выполнения ежедневных рутинных операций, облегчения жизни людей. Например, недавно я работал над заказом одной крупной зарубежной компании. В их CRM-систему поступали тысячи обращений разной тематики в день. Нужно было разделить их по категориям, не привлекая менеджеров, - то есть сделать что-то, похожее на классификатор "Яндекс.Новостей". И таких задач с каждым днём всё больше.</p>
14 <p>Точно так же нейросети могут стать мощным инструментом для создания собственных продуктов, выполнения ежедневных рутинных операций, облегчения жизни людей. Например, недавно я работал над заказом одной крупной зарубежной компании. В их CRM-систему поступали тысячи обращений разной тематики в день. Нужно было разделить их по категориям, не привлекая менеджеров, - то есть сделать что-то, похожее на классификатор "Яндекс.Новостей". И таких задач с каждым днём всё больше.</p>
15 <p>Думаю, со временем создание нейросетей станет гораздо проще и даже человек без навыков программирования сможет дообучать готовые нейросети под свои задачи. Если провести аналогию с сайтами, то раньше сайт мог сделать только программист. А сейчас есть большое количество no-code-конструкторов сайтов, с помощью которых сайт может сделать даже человек без навыков программирования.</p>
15 <p>Думаю, со временем создание нейросетей станет гораздо проще и даже человек без навыков программирования сможет дообучать готовые нейросети под свои задачи. Если провести аналогию с сайтами, то раньше сайт мог сделать только программист. А сейчас есть большое количество no-code-конструкторов сайтов, с помощью которых сайт может сделать даже человек без навыков программирования.</p>
16 <p>Аналогично и с нейросетями: большой популярностью будут пользоваться сервисы, которые позволят обучить нейросеть под свои задачи, собирая различные готовые модели как кубики лего и настраивая их под себя. Это поможет даже малому бизнесу эффективнее автоматизировать свою работу.</p>
16 <p>Аналогично и с нейросетями: большой популярностью будут пользоваться сервисы, которые позволят обучить нейросеть под свои задачи, собирая различные готовые модели как кубики лего и настраивая их под себя. Это поможет даже малому бизнесу эффективнее автоматизировать свою работу.</p>
17 <p>Например, маркетологи будут загружать свои данные в готовую нейросеть, чтобы извлекать ценные данные о поведении клиентов и использовать их для улучшения своего продукта или сервиса.</p>
17 <p>Например, маркетологи будут загружать свои данные в готовую нейросеть, чтобы извлекать ценные данные о поведении клиентов и использовать их для улучшения своего продукта или сервиса.</p>
18 <p>Но если вернуться в текущие реалии, то использование нейросетей - дорогое удовольствие. Чтобы понять, стоит ли компании сейчас вкладываться в машинное обучение, определите, оправданно ли это финансово, насколько дешевле или дороже будет сделать это вручную или с использованием более простых алгоритмов.</p>
18 <p>Но если вернуться в текущие реалии, то использование нейросетей - дорогое удовольствие. Чтобы понять, стоит ли компании сейчас вкладываться в машинное обучение, определите, оправданно ли это финансово, насколько дешевле или дороже будет сделать это вручную или с использованием более простых алгоритмов.</p>
19 <p>Важный нюанс заключается в том, что нейросети обучаются на больших коллекциях данных, а их нужно где-то взять. Поэтому основная часть работы специалистов по ML - это сбор данных, очистка их от ненужного, не влияющего ни на что "белого шума" и правильная разметка. Процесс занимает много времени.</p>
19 <p>Важный нюанс заключается в том, что нейросети обучаются на больших коллекциях данных, а их нужно где-то взять. Поэтому основная часть работы специалистов по ML - это сбор данных, очистка их от ненужного, не влияющего ни на что "белого шума" и правильная разметка. Процесс занимает много времени.</p>
20 <p>Если компания, которая никогда не работала с крупными массивами данных, попытается создать нейросеть, первое время будет сложновато: много времени уйдёт на эксперименты и подготовку данных.</p>
20 <p>Если компания, которая никогда не работала с крупными массивами данных, попытается создать нейросеть, первое время будет сложновато: много времени уйдёт на эксперименты и подготовку данных.</p>
21 <p>В США и Европе есть большие стартапы, которые предоставляют бизнесу инструменты для разметки данных. В основном их клиенты - крупные компании, которые уже собрали большое количество данных и как-то с ними взаимодействуют: банки, телеком-операторы, медицинские сети и так далее.</p>
21 <p>В США и Европе есть большие стартапы, которые предоставляют бизнесу инструменты для разметки данных. В основном их клиенты - крупные компании, которые уже собрали большое количество данных и как-то с ними взаимодействуют: банки, телеком-операторы, медицинские сети и так далее.</p>
22 <p>Чтобы разметить данные, сейчас уже не нужно самостоятельно писать ПО для разметки или искать людей на подобную работу - можно использовать "Яндекс.Толоку" или другие платформы.</p>
22 <p>Чтобы разметить данные, сейчас уже не нужно самостоятельно писать ПО для разметки или искать людей на подобную работу - можно использовать "Яндекс.Толоку" или другие платформы.</p>
23 <p>Специалист в нашей отрасли не должен всё время писать код, но нужно владеть базовой статистикой и теорией вероятностей. Чем глубже вы хотите погрузиться в технологию, тем больше математических знаний и навыков потребуется.</p>
23 <p>Специалист в нашей отрасли не должен всё время писать код, но нужно владеть базовой статистикой и теорией вероятностей. Чем глубже вы хотите погрузиться в технологию, тем больше математических знаний и навыков потребуется.</p>
24 <p>Начать стоит с простых туториалов. Если человек владеет основами программирования, он сможет создать свою нейросеть. Раньше их приходилось писать самому с нуля, а сейчас есть готовые фреймворки:<a>TensorFlow</a>от Google или<a>Hydra</a>от "Фейсбука"*. Они позволяют быстрее обучать нейросети.</p>
24 <p>Начать стоит с простых туториалов. Если человек владеет основами программирования, он сможет создать свою нейросеть. Раньше их приходилось писать самому с нуля, а сейчас есть готовые фреймворки:<a>TensorFlow</a>от Google или<a>Hydra</a>от "Фейсбука"*. Они позволяют быстрее обучать нейросети.</p>
25 <p>Проблема в том, где взять данные и мощности, чтобы их обучить. Например, сделать такие мощные нейросети, как<a>GPT-3</a>или<a>mGPT</a>от "Сбера", на локальном компьютере сложно. Впрочем, есть сервис Google Colab, который бесплатно предоставляет виртуальную машину для обучения нейросетей в исследовательских целях. Многие используют её для быстрого тестирования, обучения и демонстрации возможностей нейросети. В интернете довольно много готовых решений, которые тоже можно запускать, тестировать и изменять через Google Colab.</p>
25 <p>Проблема в том, где взять данные и мощности, чтобы их обучить. Например, сделать такие мощные нейросети, как<a>GPT-3</a>или<a>mGPT</a>от "Сбера", на локальном компьютере сложно. Впрочем, есть сервис Google Colab, который бесплатно предоставляет виртуальную машину для обучения нейросетей в исследовательских целях. Многие используют её для быстрого тестирования, обучения и демонстрации возможностей нейросети. В интернете довольно много готовых решений, которые тоже можно запускать, тестировать и изменять через Google Colab.</p>
26 <p>Сейчас основной язык для машинного обучения - Python. Большинство курсов и книг по ML, а также основные фреймворки заточены под него. Но тот же TensorFlow от Google можно запускать даже в браузере, то есть использовать JavaScript.</p>
26 <p>Сейчас основной язык для машинного обучения - Python. Большинство курсов и книг по ML, а также основные фреймворки заточены под него. Но тот же TensorFlow от Google можно запускать даже в браузере, то есть использовать JavaScript.</p>
27 <p>Фундаментальные знания лучше получить в приличном университете. Скажем, топовые компании вроде "Сбера" или "Яндекса" на проекты с нейросетями и машинным обучением ищут стажёров в рейтинговых технических вузах - МФТИ, Бауманке и так далее. Если вы там отучились, это станет преимуществом. Вам будет легче "попасть на радары" и получить достойные предложения ещё во время учёбы.</p>
27 <p>Фундаментальные знания лучше получить в приличном университете. Скажем, топовые компании вроде "Сбера" или "Яндекса" на проекты с нейросетями и машинным обучением ищут стажёров в рейтинговых технических вузах - МФТИ, Бауманке и так далее. Если вы там отучились, это станет преимуществом. Вам будет легче "попасть на радары" и получить достойные предложения ещё во время учёбы.</p>
28 <p>Впрочем, если профильного высшего образования нет, выучиться можно и самостоятельно. Сейчас для этого существует довольно много бесплатных ресурсов - например, курсы на Coursera, Stepik и других платформах.</p>
28 <p>Впрочем, если профильного высшего образования нет, выучиться можно и самостоятельно. Сейчас для этого существует довольно много бесплатных ресурсов - например, курсы на Coursera, Stepik и других платформах.</p>
29 <p>Например, могу порекомендовать курс "<a>Специализация. Глубокое обучение</a>". Его авторы - ведущие учёные в области ML.</p>
29 <p>Например, могу порекомендовать курс "<a>Специализация. Глубокое обучение</a>". Его авторы - ведущие учёные в области ML.</p>
30 <p>Для начала попробуйте использовать готовые модели и фреймворки - многие из них можно запустить на домашнем компьютере. Потренируйтесь, чтобы понять, к чему лежит душа.</p>
30 <p>Для начала попробуйте использовать готовые модели и фреймворки - многие из них можно запустить на домашнем компьютере. Потренируйтесь, чтобы понять, к чему лежит душа.</p>
31 <p>А вот без чего точно не получится вкатиться в ML, так это без основ программирования. Работа с нейросетями скорее подойдёт уверенным джунам, которым не нужно объяснять азы программирования и Computer Science.</p>
31 <p>А вот без чего точно не получится вкатиться в ML, так это без основ программирования. Работа с нейросетями скорее подойдёт уверенным джунам, которым не нужно объяснять азы программирования и Computer Science.</p>
32 <p>Тем, кто решился погрузиться в машинное обучение, рекомендую читать и смотреть такие ресурсы:</p>
32 <p>Тем, кто решился погрузиться в машинное обучение, рекомендую читать и смотреть такие ресурсы:</p>
33 <ul><li>Telegram-канал "<a>Мишин Лернинг</a>" - там делятся новостями, открытиями в ML, готовыми моделями;</li>
33 <ul><li>Telegram-канал "<a>Мишин Лернинг</a>" - там делятся новостями, открытиями в ML, готовыми моделями;</li>
34 <li>Telegram-канал<a>Machine Learning in Art</a> - здесь собраны колабы и освещаются значимые события из мира машинного обучения в изобразительном искусстве;</li>
34 <li>Telegram-канал<a>Machine Learning in Art</a> - здесь собраны колабы и освещаются значимые события из мира машинного обучения в изобразительном искусстве;</li>
35 <li>Telegram-канал<a>Дениса Ширяева</a>, в котором он делится новостями из мира ML;</li>
35 <li>Telegram-канал<a>Дениса Ширяева</a>, в котором он делится новостями из мира ML;</li>
36 <li>ветка о машинном обучении на <a>Reddit</a>;</li>
36 <li>ветка о машинном обучении на <a>Reddit</a>;</li>
37 <li>новости на <a>Y Combinator</a>.</li>
37 <li>новости на <a>Y Combinator</a>.</li>
38 </ul><p>Сейчас я развиваю собственные проекты, связанные с машинным обучением и не только, - среди них русскоязычная версия игры<a>Wordle</a>,<a>приложение для подбора подарков</a>на основе интересов из "ВКонтакте" с помощью нейросети и другие.</p>
38 </ul><p>Сейчас я развиваю собственные проекты, связанные с машинным обучением и не только, - среди них русскоязычная версия игры<a>Wordle</a>,<a>приложение для подбора подарков</a>на основе интересов из "ВКонтакте" с помощью нейросети и другие.</p>
39 Так выглядят рекомендации подарков<em>Скриншот:<a>Giftbox</a> </em><p>Идея создать Giftbox пришла ещё несколько лет назад. Дело в том, что в декабре и январе у многих моих близких дни рождения. Выбор подарков для них отнимал много времени. Я человек ленивый, поэтому решил сделать приложение, которое автоматически подбирает идеи. Занимался им около месяца по вечерам после работы.</p>
39 Так выглядят рекомендации подарков<em>Скриншот:<a>Giftbox</a> </em><p>Идея создать Giftbox пришла ещё несколько лет назад. Дело в том, что в декабре и январе у многих моих близких дни рождения. Выбор подарков для них отнимал много времени. Я человек ленивый, поэтому решил сделать приложение, которое автоматически подбирает идеи. Занимался им около месяца по вечерам после работы.</p>
40 <p>Из ML-фреймворков использовал TensorFlow, дополнительно разобрался с MLflow - это такой опенсорс-инструмент для запуска ML-моделей в продакшен.</p>
40 <p>Из ML-фреймворков использовал TensorFlow, дополнительно разобрался с MLflow - это такой опенсорс-инструмент для запуска ML-моделей в продакшен.</p>
41 <p>Я определил около 80 интересов, сделал список групп и подписок и собрал нейросеть через VK API по ключевым словам, которые соответствуют каждому интересу. Потом с помощью фрилансеров распределил группы по темам (разметил данные). Например, ключевое слово "дизайн" может относиться к веб-дизайну, а может к дизайну интерьеров - это разные темы. Также я поручил фрилансерам проверить работу друг друга.</p>
41 <p>Я определил около 80 интересов, сделал список групп и подписок и собрал нейросеть через VK API по ключевым словам, которые соответствуют каждому интересу. Потом с помощью фрилансеров распределил группы по темам (разметил данные). Например, ключевое слово "дизайн" может относиться к веб-дизайну, а может к дизайну интерьеров - это разные темы. Также я поручил фрилансерам проверить работу друг друга.</p>
42 <p>Всего было обработано около 40 тысяч источников.</p>
42 <p>Всего было обработано около 40 тысяч источников.</p>
43 <p>Чтобы людям было проще, я сразу выгрузил все нужные данные в CSV. Это позволило делать всё прямо в "Google Таблицах", что существенно ускорило процесс. Часть данных использовалась для обучения классификационной нейросети, а часть - для оценки качества обучения. Приложение Giftbox работает в партнёрстве с онлайн-магазинами. Нейросеть подбирает подарок исходя из действий пользователя на его странице и его интересов.</p>
43 <p>Чтобы людям было проще, я сразу выгрузил все нужные данные в CSV. Это позволило делать всё прямо в "Google Таблицах", что существенно ускорило процесс. Часть данных использовалась для обучения классификационной нейросети, а часть - для оценки качества обучения. Приложение Giftbox работает в партнёрстве с онлайн-магазинами. Нейросеть подбирает подарок исходя из действий пользователя на его странице и его интересов.</p>
44 <p>Любой из выбранных подарков можно купить на сайте партнёра. Сервис входит в сеть партнёрских приложений социальной сети "ВКонтакте". Его использует 150 тысяч покупателей ежемесячно.</p>
44 <p>Любой из выбранных подарков можно купить на сайте партнёра. Сервис входит в сеть партнёрских приложений социальной сети "ВКонтакте". Его использует 150 тысяч покупателей ежемесячно.</p>
45 <p>Мои проекты позволяли мне не работать по найму. Вместо этого я развиваю свои сервисы, занимаюсь поддержкой пользователей и маркетингом. По моим ощущениям, в течение следующего года число стартапов с ML в России станет меньше. Крупные компании от этого выиграют и смогут занять нишу, которую раньше занимали западные конкуренты. А вот маленьким проектам найти финансирование станет гораздо сложнее. Сейчас многие венчурные фонды перестали рассматривать инвестиции в Россию, что негативно скажется на появлении новых инновационных продуктов.</p>
45 <p>Мои проекты позволяли мне не работать по найму. Вместо этого я развиваю свои сервисы, занимаюсь поддержкой пользователей и маркетингом. По моим ощущениям, в течение следующего года число стартапов с ML в России станет меньше. Крупные компании от этого выиграют и смогут занять нишу, которую раньше занимали западные конкуренты. А вот маленьким проектам найти финансирование станет гораздо сложнее. Сейчас многие венчурные фонды перестали рассматривать инвестиции в Россию, что негативно скажется на появлении новых инновационных продуктов.</p>
46 <p>* Решением суда запрещена "деятельность компании Meta Platforms Inc. по реализации продуктов - социальных сетей Facebook и Instagram на территории Российской Федерации по основаниям осуществления экстремистской деятельности".</p>
46 <p>* Решением суда запрещена "деятельность компании Meta Platforms Inc. по реализации продуктов - социальных сетей Facebook и Instagram на территории Российской Федерации по основаниям осуществления экстремистской деятельности".</p>
47 <a><b>Бесплатный курс по Python ➞</b>Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе. Смотреть программу</a>
47 <a><b>Бесплатный курс по Python ➞</b>Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе. Смотреть программу</a>