HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-02-21
1 <p><a>#статьи</a></p>
1 <p><a>#статьи</a></p>
2 <ul><li>24 окт 2023</li>
2 <ul><li>24 окт 2023</li>
3 <li>0</li>
3 <li>0</li>
4 </ul><p>Об этом все говорят, но мало кто знает, что это такое.</p>
4 </ul><p>Об этом все говорят, но мало кто знает, что это такое.</p>
5 <p>Фото: Leon Neal / Getty Images</p>
5 <p>Фото: Leon Neal / Getty Images</p>
6 <p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
6 <p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
7 <p>Содержание:</p>
7 <p>Содержание:</p>
8 <ul><li><a>что такое машинное обучение;</a></li>
8 <ul><li><a>что такое машинное обучение;</a></li>
9 <li><a>какие задачи оно решает;</a></li>
9 <li><a>какие задачи оно решает;</a></li>
10 <li><a>какие разновидности машинного обучения бывают;</a></li>
10 <li><a>какие разновидности машинного обучения бывают;</a></li>
11 <li><a>как оно устроено;</a></li>
11 <li><a>как оно устроено;</a></li>
12 <li><a>какие алгоритмы можно использовать;</a></li>
12 <li><a>какие алгоритмы можно использовать;</a></li>
13 <li><a>где его применяют.</a></li>
13 <li><a>где его применяют.</a></li>
14 </ul><p><strong>Машинное обучение</strong>(machine learning, ML) - это совокупность методов искусственного интеллекта, с помощью которых можно создавать самообучающиеся компьютерные системы (в частности, нейросети). Для таких систем разработчики не прописывают конкретные алгоритмы решения задач, а предоставляют подготовленные данные и описывают критерии успешного решения, по которым учатся нейросети.</p>
14 </ul><p><strong>Машинное обучение</strong>(machine learning, ML) - это совокупность методов искусственного интеллекта, с помощью которых можно создавать самообучающиеся компьютерные системы (в частности, нейросети). Для таких систем разработчики не прописывают конкретные алгоритмы решения задач, а предоставляют подготовленные данные и описывают критерии успешного решения, по которым учатся нейросети.</p>
15 <p>В традиционном программировании для решения некой задачи разработчику необходимо определить алгоритм и "объяснить" его компьютеру с помощью кода на языке программирования. У специалистов по машинному обучению другой подход: они пытаются научить машину "думать", подобно человеку, и самой находить решения.</p>
15 <p>В традиционном программировании для решения некой задачи разработчику необходимо определить алгоритм и "объяснить" его компьютеру с помощью кода на языке программирования. У специалистов по машинному обучению другой подход: они пытаются научить машину "думать", подобно человеку, и самой находить решения.</p>
16 <p>ML применяется для создания беспилотных автомобилей и рекомендательных систем, в генерации изображений по текстовому описанию, распознавании речи и других областях науки. Вы наверняка слышали о <a>ChatGPT</a>,<a>Bard</a>или<a>YaGPT</a>, а может, и пользовались ими. Всё это - результат машинного обучения.</p>
16 <p>ML применяется для создания беспилотных автомобилей и рекомендательных систем, в генерации изображений по текстовому описанию, распознавании речи и других областях науки. Вы наверняка слышали о <a>ChatGPT</a>,<a>Bard</a>или<a>YaGPT</a>, а может, и пользовались ими. Всё это - результат машинного обучения.</p>
17 <p>Важно не путать термины "машинное обучение" и "искусственный интеллект".<strong>Искусственный интеллект</strong>― это более общий термин. Можно сказать, что это способность компьютера обучаться, принимать решения и выполнять действия, свойственные человеческому интеллекту.<strong>Машинное обучение</strong> - это направление искусственного интеллекта, реализующее его с помощью алгоритмов.</p>
17 <p>Важно не путать термины "машинное обучение" и "искусственный интеллект".<strong>Искусственный интеллект</strong>― это более общий термин. Можно сказать, что это способность компьютера обучаться, принимать решения и выполнять действия, свойственные человеческому интеллекту.<strong>Машинное обучение</strong> - это направление искусственного интеллекта, реализующее его с помощью алгоритмов.</p>
18 <p>Глобальная задача машинного обучения ― создать искусственный интеллект, который по своим аналитическим способностям будет равен или даже превосходить человеческий. Это очень сложная задача, которую тем не менее наука вполне может решить в ближайшие 5-10 лет.</p>
18 <p>Глобальная задача машинного обучения ― создать искусственный интеллект, который по своим аналитическим способностям будет равен или даже превосходить человеческий. Это очень сложная задача, которую тем не менее наука вполне может решить в ближайшие 5-10 лет.</p>
19 <p>ИИ, который способен соперничать с человеком и решать задачи разного типа, называют<strong>сильным,</strong>или<strong>общим (artificial general intelligence)</strong>.</p>
19 <p>ИИ, который способен соперничать с человеком и решать задачи разного типа, называют<strong>сильным,</strong>или<strong>общим (artificial general intelligence)</strong>.</p>
20 <p>Что касается более узких задач машинного обучения, то их можно разделить на четыре группы: классификация, регрессия, кластеризация и уменьшение размерности. Разберём каждую из них.</p>
20 <p>Что касается более узких задач машинного обучения, то их можно разделить на четыре группы: классификация, регрессия, кластеризация и уменьшение размерности. Разберём каждую из них.</p>
21 <p>Используется для решения тех задач, где на основании признаков объектов требуется распределить их по заданным категориям. Например, на производстве могут отделять детали с браком от хороших с помощью<a>компьютерного зрения</a>.</p>
21 <p>Используется для решения тех задач, где на основании признаков объектов требуется распределить их по заданным категориям. Например, на производстве могут отделять детали с браком от хороших с помощью<a>компьютерного зрения</a>.</p>
22 <p>Регрессия в теории вероятностей и математической статистике ― это зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. Компьютеры могут анализировать огромные массивы данных и делать предсказания на их основе. Например, можно загрузить в компьютер данные о движении курса акций за последние 10 лет и попросить предсказать их цену в текущем году.</p>
22 <p>Регрессия в теории вероятностей и математической статистике ― это зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. Компьютеры могут анализировать огромные массивы данных и делать предсказания на их основе. Например, можно загрузить в компьютер данные о движении курса акций за последние 10 лет и попросить предсказать их цену в текущем году.</p>
23 <p>Кластеризация ― это распределение объектов по категориям, когда неизвестно, сколько категорий получится в итоге. Распределение происходит по заданному критерию. Например, компания может использовать кластеризацию для определения типов клиентов по паттернам их покупок и делать на основании этого персонализированные предложения товаров.</p>
23 <p>Кластеризация ― это распределение объектов по категориям, когда неизвестно, сколько категорий получится в итоге. Распределение происходит по заданному критерию. Например, компания может использовать кластеризацию для определения типов клиентов по паттернам их покупок и делать на основании этого персонализированные предложения товаров.</p>
24 <p>Уменьшение размерности помогает сократить количество признаков в данных без потери информации. Это упрощает их обработку и ускоряет алгоритмы машинного обучения, так как количество данных, с которыми им предстоит работать, уменьшается.</p>
24 <p>Уменьшение размерности помогает сократить количество признаков в данных без потери информации. Это упрощает их обработку и ускоряет алгоритмы машинного обучения, так как количество данных, с которыми им предстоит работать, уменьшается.</p>
25 <p>При распознавании изображений снижение размерности позволяет не анализировать каждый пиксель, а использовать только важные признаки. Например, чтобы распознать зебру среди животных, главное - научиться видеть белые и чёрные полосы.</p>
25 <p>При распознавании изображений снижение размерности позволяет не анализировать каждый пиксель, а использовать только важные признаки. Например, чтобы распознать зебру среди животных, главное - научиться видеть белые и чёрные полосы.</p>
26 <p>Вы читаете эту статью, потому что задумываетесь о карьере специалиста по машинному обучению? Присмотритесь к <a>курсу Skillbox</a> - он подойдёт вам, если вы хотите стартовать в этой сфере.</p>
26 <p>Вы читаете эту статью, потому что задумываетесь о карьере специалиста по машинному обучению? Присмотритесь к <a>курсу Skillbox</a> - он подойдёт вам, если вы хотите стартовать в этой сфере.</p>
27 <p>Чтобы обучить искусственный интеллект, можно использовать разные методы. Они отличаются друг от друга степенью вовлечённости человека в процесс.</p>
27 <p>Чтобы обучить искусственный интеллект, можно использовать разные методы. Они отличаются друг от друга степенью вовлечённости человека в процесс.</p>
28 <p>Компьютер может учиться под присмотром учителя, то есть дата-сайентиста или аналитика данных, который предоставляет ему размеченные данные.</p>
28 <p>Компьютер может учиться под присмотром учителя, то есть дата-сайентиста или аналитика данных, который предоставляет ему размеченные данные.</p>
29 <p>Специалист показывает программе разные примеры и объясняет: вот кот, а вот собака. После обучения предлагает ей по тому же принципу проанализировать незнакомые данные. Если модель ошибается, то учитель исправляет её. Так программа учится, пока не достигнет нужной точности ответов.</p>
29 <p>Специалист показывает программе разные примеры и объясняет: вот кот, а вот собака. После обучения предлагает ей по тому же принципу проанализировать незнакомые данные. Если модель ошибается, то учитель исправляет её. Так программа учится, пока не достигнет нужной точности ответов.</p>
30 <p>Этот тип обучения подходит для решения задач классификации и регрессии. Примеры алгоритмов:<a>наивный Байес</a>,<a>метод опорных векторов</a>,<a>дерево решений</a>,<a>k-ближайшие соседи</a>,<a>логистическая регрессия</a>и <a>линейная и полиномиальная регрессия</a>.</p>
30 <p>Этот тип обучения подходит для решения задач классификации и регрессии. Примеры алгоритмов:<a>наивный Байес</a>,<a>метод опорных векторов</a>,<a>дерево решений</a>,<a>k-ближайшие соседи</a>,<a>логистическая регрессия</a>и <a>линейная и полиномиальная регрессия</a>.</p>
31 <p>Используется для фильтрации спама, компьютерного зрения, поиска и классификации документов.</p>
31 <p>Используется для фильтрации спама, компьютерного зрения, поиска и классификации документов.</p>
32 <p>Здесь программа не получает от специалиста никаких подсказок. Есть большой массив данных, и модели машинного обучения нужно самой найти закономерности.</p>
32 <p>Здесь программа не получает от специалиста никаких подсказок. Есть большой массив данных, и модели машинного обучения нужно самой найти закономерности.</p>
33 <p>Часто обучение без учителя используется для глубокого анализа больших данных, когда информации так много, что классифицировать всё вручную для обучения алгоритмов невозможно. Также этот тип обучения применяется в тех случаях, когда дата-сайентист не знает, что он может найти, но предполагает, что какие-то паттерны в данных присутствуют.</p>
33 <p>Часто обучение без учителя используется для глубокого анализа больших данных, когда информации так много, что классифицировать всё вручную для обучения алгоритмов невозможно. Также этот тип обучения применяется в тех случаях, когда дата-сайентист не знает, что он может найти, но предполагает, что какие-то паттерны в данных присутствуют.</p>
34 <p>С помощью обучения без учителя тренируют алгоритмы по кластеризации данных и выявлению аномалий. Примеры алгоритмов:<a>метод k-средних</a>,<a>DBSCAN</a>,<a>сингулярное разложение</a>(SVD),<a>анализ главных компонент</a>(PCA) и <a>латентное размещение Дирихле</a>(LDA).</p>
34 <p>С помощью обучения без учителя тренируют алгоритмы по кластеризации данных и выявлению аномалий. Примеры алгоритмов:<a>метод k-средних</a>,<a>DBSCAN</a>,<a>сингулярное разложение</a>(SVD),<a>анализ главных компонент</a>(PCA) и <a>латентное размещение Дирихле</a>(LDA).</p>
35 <p>Метод используется для сегментации данных, обнаружения аномалий, составления рекомендаций, управления рисками и обнаружения фейковых изображений.</p>
35 <p>Метод используется для сегментации данных, обнаружения аномалий, составления рекомендаций, управления рисками и обнаружения фейковых изображений.</p>
36 <p>Как понятно из названия, этот метод обучения что-то среднее между полностью самостоятельным обучением и обучением с учителем. Например, специалист может разметить только небольшую часть данных, чтобы повысить точность предсказаний модели на старте её обучения.</p>
36 <p>Как понятно из названия, этот метод обучения что-то среднее между полностью самостоятельным обучением и обучением с учителем. Например, специалист может разметить только небольшую часть данных, чтобы повысить точность предсказаний модели на старте её обучения.</p>
37 <p>Такой способ используется в тех сферах, где требуется работать с большим количеством однотипных по форме, но разнообразных по содержанию данных. Например, при распознавании изображений и речи.</p>
37 <p>Такой способ используется в тех сферах, где требуется работать с большим количеством однотипных по форме, но разнообразных по содержанию данных. Например, при распознавании изображений и речи.</p>
38 <p>Некоторым навыкам можно обучиться только на практике: ходить, танцевать, плавать или водить машину. Людям не нужен постоянный контроль, чтобы эффективно учиться. Получая в ответ на свои действия положительные либо отрицательные сигналы, мы учимся очень эффективно. Например, ребёнок учится избегать острых углов стола, если хотя бы раз о них ударился.</p>
38 <p>Некоторым навыкам можно обучиться только на практике: ходить, танцевать, плавать или водить машину. Людям не нужен постоянный контроль, чтобы эффективно учиться. Получая в ответ на свои действия положительные либо отрицательные сигналы, мы учимся очень эффективно. Например, ребёнок учится избегать острых углов стола, если хотя бы раз о них ударился.</p>
39 <p>Компьютер тоже способен учиться в динамичной среде: игровом или реальном мире. Например, с помощью обучения с подкреплением обучают беспилотные автомобили. Описать абсолютно все ситуации на дороге в виде правил нереально. Нельзя предсказать, в какой момент на дорогу выбежит ребёнок или как ориентироваться на дороге в густом тумане. Поэтому беспилотные автомобили учатся водить при помощи симуляции реальной среды.</p>
39 <p>Компьютер тоже способен учиться в динамичной среде: игровом или реальном мире. Например, с помощью обучения с подкреплением обучают беспилотные автомобили. Описать абсолютно все ситуации на дороге в виде правил нереально. Нельзя предсказать, в какой момент на дорогу выбежит ребёнок или как ориентироваться на дороге в густом тумане. Поэтому беспилотные автомобили учатся водить при помощи симуляции реальной среды.</p>
40 <p>Примеры алгоритмов:<a>Q-обучение</a>,<a>генетический алгоритм</a>,<a>SARSA</a>,<a>DQN</a>и <a>DDPG</a>. Используется для обучения беспилотных автомобилей и роботов.</p>
40 <p>Примеры алгоритмов:<a>Q-обучение</a>,<a>генетический алгоритм</a>,<a>SARSA</a>,<a>DQN</a>и <a>DDPG</a>. Используется для обучения беспилотных автомобилей и роботов.</p>
41 <p>Глубинное обучение - это класс алгоритмов машинного обучения, созданный по аналогии со структурой человеческого мозга. Они работают благодаря многослойным нейронным сетям.</p>
41 <p>Глубинное обучение - это класс алгоритмов машинного обучения, созданный по аналогии со структурой человеческого мозга. Они работают благодаря многослойным нейронным сетям.</p>
42 <p>Для того чтобы обучить машину, нужны три компонента:</p>
42 <p>Для того чтобы обучить машину, нужны три компонента:</p>
43 <p><strong>Наборы данных, или датасеты.</strong>ML-системы обучаются на специальных коллекциях образцов, называемых наборами данных, или датасетами. Они могут включать числа, изображения, тексты или любые другие типы данных в зависимости от задачи. Хороший датасет - это один из факторов успешного обучения модели, поэтому его сбору и предварительной подготовке уделяется много времени.</p>
43 <p><strong>Наборы данных, или датасеты.</strong>ML-системы обучаются на специальных коллекциях образцов, называемых наборами данных, или датасетами. Они могут включать числа, изображения, тексты или любые другие типы данных в зависимости от задачи. Хороший датасет - это один из факторов успешного обучения модели, поэтому его сбору и предварительной подготовке уделяется много времени.</p>
44 <p><strong>Функции.</strong>Функции показывают машине, на что следует обратить внимание. Допустим, вы хотите спрогнозировать цену квартиры. Можно попытаться предсказать стоимость с помощью линейной регрессии и, например, оценить, сколько может стоить это место исходя из площади. Но гораздо проще найти корреляцию между ценой и районом, где расположено здание. Поэтому важно подбирать правильные функции, учитывающие наиболее подходящие параметры.</p>
44 <p><strong>Функции.</strong>Функции показывают машине, на что следует обратить внимание. Допустим, вы хотите спрогнозировать цену квартиры. Можно попытаться предсказать стоимость с помощью линейной регрессии и, например, оценить, сколько может стоить это место исходя из площади. Но гораздо проще найти корреляцию между ценой и районом, где расположено здание. Поэтому важно подбирать правильные функции, учитывающие наиболее подходящие параметры.</p>
45 <p><strong>Алгоритм.</strong>В математическом смысле алгоритм ― это совокупность функций. Он берёт данные на входе и выдаёт результат на выходе. Одну и ту же задачу можно решить, используя разные алгоритмы.</p>
45 <p><strong>Алгоритм.</strong>В математическом смысле алгоритм ― это совокупность функций. Он берёт данные на входе и выдаёт результат на выходе. Одну и ту же задачу можно решить, используя разные алгоритмы.</p>
46 <p>В зависимости от их выбора точность или скорость получения результатов может быть разной. Иногда для достижения большей производительности нужно комбинировать разные алгоритмы. Такие конструкции называются ансамблями (ensemble learning).</p>
46 <p>В зависимости от их выбора точность или скорость получения результатов может быть разной. Иногда для достижения большей производительности нужно комбинировать разные алгоритмы. Такие конструкции называются ансамблями (ensemble learning).</p>
47 <p>Если качество набора данных было высоким, целевые параметры выбраны правильно и использованы подходящие алгоритмы, то машинное обучение может справляться со специализированными задачами даже лучше, чем люди. Например, такие модели используются в диагностике опухолей и они дают<a>на 20% больше верных диагностических ответов</a>в сравнении с врачами-людьми.</p>
47 <p>Если качество набора данных было высоким, целевые параметры выбраны правильно и использованы подходящие алгоритмы, то машинное обучение может справляться со специализированными задачами даже лучше, чем люди. Например, такие модели используются в диагностике опухолей и они дают<a>на 20% больше верных диагностических ответов</a>в сравнении с врачами-людьми.</p>
48 <p>Кратко поговорим о популярных алгоритмах машинного обучения: наивном Байесе, логистической регрессии, деревьях решений и методе опорных векторов.</p>
48 <p>Кратко поговорим о популярных алгоритмах машинного обучения: наивном Байесе, логистической регрессии, деревьях решений и методе опорных векторов.</p>
49 <p>Байесовские алгоритмы - это семейство вероятностных классификаторов, основанных на применении теоремы Байеса. С её помощью можно предсказать, как возникновение одного события влияет на вероятность другого события.</p>
49 <p>Байесовские алгоритмы - это семейство вероятностных классификаторов, основанных на применении теоремы Байеса. С её помощью можно предсказать, как возникновение одного события влияет на вероятность другого события.</p>
50 <p>Наивный классификатор Байеса был одним из первых алгоритмов, использованных для машинного обучения. Например, алгоритм использовали для фильтрации спама до 2010 года. Механизм фильтрации с применением классификатора Байеса очень простой ― инженеры посчитали, какие слова чаще всего встречаются в подобных письмах: "срочно", "скидка", "бесплатно" и другие. А потом научили алгоритм автоматически сортировать письма, где такие слова встречаются часто, в отдельную папку.</p>
50 <p>Наивный классификатор Байеса был одним из первых алгоритмов, использованных для машинного обучения. Например, алгоритм использовали для фильтрации спама до 2010 года. Механизм фильтрации с применением классификатора Байеса очень простой ― инженеры посчитали, какие слова чаще всего встречаются в подобных письмах: "срочно", "скидка", "бесплатно" и другие. А потом научили алгоритм автоматически сортировать письма, где такие слова встречаются часто, в отдельную папку.</p>
51 <p>Но потом изобрели байесовское отравление. Спамеры научились прятать свои сообщения в большом количестве безобидного текста, например отрывков литературных произведений. Это помогало им обмануть фильтр. Поэтому появились другие способы фильтрации писем, более точные, например с помощью нейронных сетей.</p>
51 <p>Но потом изобрели байесовское отравление. Спамеры научились прятать свои сообщения в большом количестве безобидного текста, например отрывков литературных произведений. Это помогало им обмануть фильтр. Поэтому появились другие способы фильтрации писем, более точные, например с помощью нейронных сетей.</p>
52 <p>Регрессия разбивает все данные на две группы - верные и неверные показатели. Она получила своё название благодаря тому, что использует логистическую функцию для прогнозирования вероятности принадлежности объекта к одному из классов.</p>
52 <p>Регрессия разбивает все данные на две группы - верные и неверные показатели. Она получила своё название благодаря тому, что использует логистическую функцию для прогнозирования вероятности принадлежности объекта к одному из классов.</p>
53 Визуализация работы логистической регрессии. Часть данных отмечается как верные показатели, а часть - как неверные<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>С помощью алгоритма можно предсказать зависимость между двумя переменными. Регрессия даёт ответ, насколько вероятно, что произойдёт то или иное событие. По своему смыслу это простая статистическая модель, которая со временем перекочевала в машинное обучение.</p>
53 Визуализация работы логистической регрессии. Часть данных отмечается как верные показатели, а часть - как неверные<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>С помощью алгоритма можно предсказать зависимость между двумя переменными. Регрессия даёт ответ, насколько вероятно, что произойдёт то или иное событие. По своему смыслу это простая статистическая модель, которая со временем перекочевала в машинное обучение.</p>
54 <p>Например, с помощью логистической регрессии можно рассчитать, с какой вероятностью лишний вес и отсутствие физической активности спровоцируют у пациента сердечный приступ.</p>
54 <p>Например, с помощью логистической регрессии можно рассчитать, с какой вероятностью лишний вес и отсутствие физической активности спровоцируют у пациента сердечный приступ.</p>
55 <p>Дерево решений - это алгоритм машинного обучения, который используют для классификации, регрессии и выявления аномалий. Деревья решений часто применяют для анализа больших данных. Предсказания модели довольно точные и их легко визуализировать.</p>
55 <p>Дерево решений - это алгоритм машинного обучения, который используют для классификации, регрессии и выявления аномалий. Деревья решений часто применяют для анализа больших данных. Предсказания модели довольно точные и их легко визуализировать.</p>
56 <p>Чтобы дать предсказание, алгоритм полагается на систему правил "Если… то…". У правил есть иерархия. Например, если продавец решает, давать клиенту скидку или нет, то он может использовать такое дерево решений:</p>
56 <p>Чтобы дать предсказание, алгоритм полагается на систему правил "Если… то…". У правил есть иерархия. Например, если продавец решает, давать клиенту скидку или нет, то он может использовать такое дерево решений:</p>
57 Дерево решений для определения размера скидки<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>Алгоритм сам генерирует правила в процессе обучения. Правила ― это обобщения множества отдельных наблюдений, описывающих предметную область. Дерево решений анализирует выборку входящих данных, а затем группирует их, чтобы объекты одного класса оказались вместе.</p>
57 Дерево решений для определения размера скидки<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>Алгоритм сам генерирует правила в процессе обучения. Правила ― это обобщения множества отдельных наблюдений, описывающих предметную область. Дерево решений анализирует выборку входящих данных, а затем группирует их, чтобы объекты одного класса оказались вместе.</p>
58 <p>Например, в метеорологии они могут использоваться для прогнозирования погоды на основе данных о температуре, давлении и влажности воздуха.</p>
58 <p>Например, в метеорологии они могут использоваться для прогнозирования погоды на основе данных о температуре, давлении и влажности воздуха.</p>
59 <p>Машины опорных векторов применяют для задач регрессии и классификации.</p>
59 <p>Машины опорных векторов применяют для задач регрессии и классификации.</p>
60 <p>Цель SVM - построить в N-мерном пространстве гиперплоскость, которая однозначно разделяет данные на классы. N соответствует количеству признаков, а гиперплоскость ― это прямая, которая разделяет объекты на эти классы. Расстояние от неё до каждого класса должно быть максимальным, так как от этого зависит точность.</p>
60 <p>Цель SVM - построить в N-мерном пространстве гиперплоскость, которая однозначно разделяет данные на классы. N соответствует количеству признаков, а гиперплоскость ― это прямая, которая разделяет объекты на эти классы. Расстояние от неё до каждого класса должно быть максимальным, так как от этого зависит точность.</p>
61 <p>Логика SVM такая: чем больше расстояние между гиперплоскостью и объектами, то есть зазор, тем точнее предсказание. Гиперплоскость графически изображается в виде линии. Точки данных по разным сторонам от линии относятся к разным классам. Сложность заключается в том, чтобы найти правильную линию, которая будет разделять объекты на классы.</p>
61 <p>Логика SVM такая: чем больше расстояние между гиперплоскостью и объектами, то есть зазор, тем точнее предсказание. Гиперплоскость графически изображается в виде линии. Точки данных по разным сторонам от линии относятся к разным классам. Сложность заключается в том, чтобы найти правильную линию, которая будет разделять объекты на классы.</p>
62 Визуализация работы машины опорных векторов<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>SVM один из самых универсальных алгоритмов. Он используется и для распознавания лиц, и для извлечения содержания текстов при их анализе.</p>
62 Визуализация работы машины опорных векторов<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>SVM один из самых универсальных алгоритмов. Он используется и для распознавания лиц, и для извлечения содержания текстов при их анализе.</p>
63 <p>Нейронная сеть - это математическая модель, которая состоит из нейронов ― узлов, объединённых в слои. Между собой слои связаны синапсами. Всё вместе, хоть и очень упрощённо, напоминает устройство нашего мозга.</p>
63 <p>Нейронная сеть - это математическая модель, которая состоит из нейронов ― узлов, объединённых в слои. Между собой слои связаны синапсами. Всё вместе, хоть и очень упрощённо, напоминает устройство нашего мозга.</p>
64 <p>Когда данные подаются на вход модели, они проходят через множество слоёв нейросети и переживают трансформацию. Например, нерелевантные данные могут быть отсортированы, а более важные переданы на следующие слои. У каждого нейрона есть вес, который автоматически меняется в процессе обучения сети. Чем больше вес, тем сильнее связь между нейронами.</p>
64 <p>Когда данные подаются на вход модели, они проходят через множество слоёв нейросети и переживают трансформацию. Например, нерелевантные данные могут быть отсортированы, а более важные переданы на следующие слои. У каждого нейрона есть вес, который автоматически меняется в процессе обучения сети. Чем больше вес, тем сильнее связь между нейронами.</p>
65 <p>Нейросети сегодня превосходят большинство других моделей, независимо от задачи. А потому используются во многих областях и сферах деятельности человека.</p>
65 <p>Нейросети сегодня превосходят большинство других моделей, независимо от задачи. А потому используются во многих областях и сферах деятельности человека.</p>
66 <p>Рассмотрим, как умные компьютерные системы делают нашу жизнь проще в разных областях.</p>
66 <p>Рассмотрим, как умные компьютерные системы делают нашу жизнь проще в разных областях.</p>
67 <p>Многие интернет-магазины используют машинное обучение для предоставления персонализированных рекомендаций своим клиентам.</p>
67 <p>Многие интернет-магазины используют машинное обучение для предоставления персонализированных рекомендаций своим клиентам.</p>
68 <p>Алгоритмы анализируют данные о покупках клиентов, исследуют их поведение на сайте, а также информацию о товарах, которые они просматривают. На основе этих данных можно сделать предсказания о том, какие товары могут заинтересовать клиента, и предлагать их в ленте или даже на странице с корзиной.</p>
68 <p>Алгоритмы анализируют данные о покупках клиентов, исследуют их поведение на сайте, а также информацию о товарах, которые они просматривают. На основе этих данных можно сделать предсказания о том, какие товары могут заинтересовать клиента, и предлагать их в ленте или даже на странице с корзиной.</p>
69 <p>Рекомендательные системы также используют сайты, куда пользователи заходят, чтобы потреблять контент: соцсети, видеохостинги и новостные сайты.</p>
69 <p>Рекомендательные системы также используют сайты, куда пользователи заходят, чтобы потреблять контент: соцсети, видеохостинги и новостные сайты.</p>
70 <p>Большинство банков используют инструменты машинного обучения для защиты средств своих клиентов, например для обнаружения мошенничества в банковских операциях.</p>
70 <p>Большинство банков используют инструменты машинного обучения для защиты средств своих клиентов, например для обнаружения мошенничества в банковских операциях.</p>
71 <p>"Умные" системы анализируют большие данные и выявляют аномальные транзакции, например перевод средств с незнакомого устройства или непривычный паттерн покупок. Это позволяет банкам быстро реагировать на подозрительные операции и предотвращать финансовые потери.</p>
71 <p>"Умные" системы анализируют большие данные и выявляют аномальные транзакции, например перевод средств с незнакомого устройства или непривычный паттерн покупок. Это позволяет банкам быстро реагировать на подозрительные операции и предотвращать финансовые потери.</p>
72 <p>Алгоритмы машинного обучения могут анализировать данные о температуре, влажности, давлении и других показателях, чтобы делать прогнозы о том, каких погодных условий можно ожидать в ближайшее время. Например, у "Яндекса" есть система предсказания погоды на основе машинного обучения "<a>Метеум</a>".</p>
72 <p>Алгоритмы машинного обучения могут анализировать данные о температуре, влажности, давлении и других показателях, чтобы делать прогнозы о том, каких погодных условий можно ожидать в ближайшее время. Например, у "Яндекса" есть система предсказания погоды на основе машинного обучения "<a>Метеум</a>".</p>
73 <p>Машинное обучение применяют в анализе медицинских данных, например для анализа результата рентгенологических снимков, анализов и истории болезни. Это помогает врачам поставить правильный диагноз и подобрать наиболее эффективное лечение. Например, такой подход реализован в компании<a>Oncora</a>из США, использующей ML-подходы для выявления онкозаболеваний.</p>
73 <p>Машинное обучение применяют в анализе медицинских данных, например для анализа результата рентгенологических снимков, анализов и истории болезни. Это помогает врачам поставить правильный диагноз и подобрать наиболее эффективное лечение. Например, такой подход реализован в компании<a>Oncora</a>из США, использующей ML-подходы для выявления онкозаболеваний.</p>
74 <p>Машинное обучение может использоваться для распознавания речи. Алгоритмы анализируют звуковые данные и преобразовывают их в текстовую форму. Именно так работают голосовые помощники, такие как Siri и Alexa, а также переводчики текста в реальном времени.</p>
74 <p>Машинное обучение может использоваться для распознавания речи. Алгоритмы анализируют звуковые данные и преобразовывают их в текстовую форму. Именно так работают голосовые помощники, такие как Siri и Alexa, а также переводчики текста в реальном времени.</p>
75 <p>Например, сейчас Spotify тестирует новую функцию ―<a>дубляж подкастов в реальном времени</a>. Причём текст на другом языке воспроизводится голосами авторов. Это было бы невозможно без машинного обучения.</p>
75 <p>Например, сейчас Spotify тестирует новую функцию ―<a>дубляж подкастов в реальном времени</a>. Причём текст на другом языке воспроизводится голосами авторов. Это было бы невозможно без машинного обучения.</p>
76 <p>Давайте повторим то, что мы сегодня узнали о машинном обучении:</p>
76 <p>Давайте повторим то, что мы сегодня узнали о машинном обучении:</p>
77 <ul><li>Машинное обучение - это набор методов, с помощью которых создают системы, способные самостоятельно (без жёстко заданных алгоритмов) решать поставленные задачи.</li>
77 <ul><li>Машинное обучение - это набор методов, с помощью которых создают системы, способные самостоятельно (без жёстко заданных алгоритмов) решать поставленные задачи.</li>
78 <li>Компьютер может учиться под присмотром учителя, который помогает программе находить решения с помощью размеченного датасета или проверки результатов. Такой метод называется<strong>обучением с учителем</strong>.</li>
78 <li>Компьютер может учиться под присмотром учителя, который помогает программе находить решения с помощью размеченного датасета или проверки результатов. Такой метод называется<strong>обучением с учителем</strong>.</li>
79 <li>Если программа не получает от специалиста никаких подсказок и учится только на данных― это<strong>обучение без учителя</strong>.</li>
79 <li>Если программа не получает от специалиста никаких подсказок и учится только на данных― это<strong>обучение без учителя</strong>.</li>
80 <li><strong>Обучение с частичным привлечением учителя</strong>― что-то среднее между самообучением машины и методом с привлечением учителя. ML-инженер может разметить только небольшую часть данных, чтобы повысить точность предсказаний модели.</li>
80 <li><strong>Обучение с частичным привлечением учителя</strong>― что-то среднее между самообучением машины и методом с привлечением учителя. ML-инженер может разметить только небольшую часть данных, чтобы повысить точность предсказаний модели.</li>
81 <li>Некоторым навыкам, таким как вождение, компьютер может научиться только методом проб и ошибок в реальной среде. Так работает<strong>обучение с подкреплением</strong>.</li>
81 <li>Некоторым навыкам, таким как вождение, компьютер может научиться только методом проб и ошибок в реальной среде. Так работает<strong>обучение с подкреплением</strong>.</li>
82 <li>Машинное обучение применяют в разных областях: для рекомендации товаров в интернет-магазинах, постановки диагнозов в медицине, обнаружения мошенничества в банках и в других сферах.</li>
82 <li>Машинное обучение применяют в разных областях: для рекомендации товаров в интернет-магазинах, постановки диагнозов в медицине, обнаружения мошенничества в банках и в других сферах.</li>
83 </ul><a>Курс с трудоустройством: "Профессия Machine Learning Engineer" Узнать о курсе</a>
83 </ul><a>Курс с трудоустройством: "Профессия Machine Learning Engineer" Узнать о курсе</a>