0 added
0 removed
Original
2026-01-01
Modified
2026-02-21
1
<p><a>#статьи</a></p>
1
<p><a>#статьи</a></p>
2
<ul><li>24 окт 2023</li>
2
<ul><li>24 окт 2023</li>
3
<li>0</li>
3
<li>0</li>
4
</ul><p>Об этом все говорят, но мало кто знает, что это такое.</p>
4
</ul><p>Об этом все говорят, но мало кто знает, что это такое.</p>
5
<p>Фото: Leon Neal / Getty Images</p>
5
<p>Фото: Leon Neal / Getty Images</p>
6
<p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
6
<p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
7
<p>Содержание:</p>
7
<p>Содержание:</p>
8
<ul><li><a>что такое машинное обучение;</a></li>
8
<ul><li><a>что такое машинное обучение;</a></li>
9
<li><a>какие задачи оно решает;</a></li>
9
<li><a>какие задачи оно решает;</a></li>
10
<li><a>какие разновидности машинного обучения бывают;</a></li>
10
<li><a>какие разновидности машинного обучения бывают;</a></li>
11
<li><a>как оно устроено;</a></li>
11
<li><a>как оно устроено;</a></li>
12
<li><a>какие алгоритмы можно использовать;</a></li>
12
<li><a>какие алгоритмы можно использовать;</a></li>
13
<li><a>где его применяют.</a></li>
13
<li><a>где его применяют.</a></li>
14
</ul><p><strong>Машинное обучение</strong>(machine learning, ML) - это совокупность методов искусственного интеллекта, с помощью которых можно создавать самообучающиеся компьютерные системы (в частности, нейросети). Для таких систем разработчики не прописывают конкретные алгоритмы решения задач, а предоставляют подготовленные данные и описывают критерии успешного решения, по которым учатся нейросети.</p>
14
</ul><p><strong>Машинное обучение</strong>(machine learning, ML) - это совокупность методов искусственного интеллекта, с помощью которых можно создавать самообучающиеся компьютерные системы (в частности, нейросети). Для таких систем разработчики не прописывают конкретные алгоритмы решения задач, а предоставляют подготовленные данные и описывают критерии успешного решения, по которым учатся нейросети.</p>
15
<p>В традиционном программировании для решения некой задачи разработчику необходимо определить алгоритм и "объяснить" его компьютеру с помощью кода на языке программирования. У специалистов по машинному обучению другой подход: они пытаются научить машину "думать", подобно человеку, и самой находить решения.</p>
15
<p>В традиционном программировании для решения некой задачи разработчику необходимо определить алгоритм и "объяснить" его компьютеру с помощью кода на языке программирования. У специалистов по машинному обучению другой подход: они пытаются научить машину "думать", подобно человеку, и самой находить решения.</p>
16
<p>ML применяется для создания беспилотных автомобилей и рекомендательных систем, в генерации изображений по текстовому описанию, распознавании речи и других областях науки. Вы наверняка слышали о <a>ChatGPT</a>,<a>Bard</a>или<a>YaGPT</a>, а может, и пользовались ими. Всё это - результат машинного обучения.</p>
16
<p>ML применяется для создания беспилотных автомобилей и рекомендательных систем, в генерации изображений по текстовому описанию, распознавании речи и других областях науки. Вы наверняка слышали о <a>ChatGPT</a>,<a>Bard</a>или<a>YaGPT</a>, а может, и пользовались ими. Всё это - результат машинного обучения.</p>
17
<p>Важно не путать термины "машинное обучение" и "искусственный интеллект".<strong>Искусственный интеллект</strong>― это более общий термин. Можно сказать, что это способность компьютера обучаться, принимать решения и выполнять действия, свойственные человеческому интеллекту.<strong>Машинное обучение</strong> - это направление искусственного интеллекта, реализующее его с помощью алгоритмов.</p>
17
<p>Важно не путать термины "машинное обучение" и "искусственный интеллект".<strong>Искусственный интеллект</strong>― это более общий термин. Можно сказать, что это способность компьютера обучаться, принимать решения и выполнять действия, свойственные человеческому интеллекту.<strong>Машинное обучение</strong> - это направление искусственного интеллекта, реализующее его с помощью алгоритмов.</p>
18
<p>Глобальная задача машинного обучения ― создать искусственный интеллект, который по своим аналитическим способностям будет равен или даже превосходить человеческий. Это очень сложная задача, которую тем не менее наука вполне может решить в ближайшие 5-10 лет.</p>
18
<p>Глобальная задача машинного обучения ― создать искусственный интеллект, который по своим аналитическим способностям будет равен или даже превосходить человеческий. Это очень сложная задача, которую тем не менее наука вполне может решить в ближайшие 5-10 лет.</p>
19
<p>ИИ, который способен соперничать с человеком и решать задачи разного типа, называют<strong>сильным,</strong>или<strong>общим (artificial general intelligence)</strong>.</p>
19
<p>ИИ, который способен соперничать с человеком и решать задачи разного типа, называют<strong>сильным,</strong>или<strong>общим (artificial general intelligence)</strong>.</p>
20
<p>Что касается более узких задач машинного обучения, то их можно разделить на четыре группы: классификация, регрессия, кластеризация и уменьшение размерности. Разберём каждую из них.</p>
20
<p>Что касается более узких задач машинного обучения, то их можно разделить на четыре группы: классификация, регрессия, кластеризация и уменьшение размерности. Разберём каждую из них.</p>
21
<p>Используется для решения тех задач, где на основании признаков объектов требуется распределить их по заданным категориям. Например, на производстве могут отделять детали с браком от хороших с помощью<a>компьютерного зрения</a>.</p>
21
<p>Используется для решения тех задач, где на основании признаков объектов требуется распределить их по заданным категориям. Например, на производстве могут отделять детали с браком от хороших с помощью<a>компьютерного зрения</a>.</p>
22
<p>Регрессия в теории вероятностей и математической статистике ― это зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. Компьютеры могут анализировать огромные массивы данных и делать предсказания на их основе. Например, можно загрузить в компьютер данные о движении курса акций за последние 10 лет и попросить предсказать их цену в текущем году.</p>
22
<p>Регрессия в теории вероятностей и математической статистике ― это зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. Компьютеры могут анализировать огромные массивы данных и делать предсказания на их основе. Например, можно загрузить в компьютер данные о движении курса акций за последние 10 лет и попросить предсказать их цену в текущем году.</p>
23
<p>Кластеризация ― это распределение объектов по категориям, когда неизвестно, сколько категорий получится в итоге. Распределение происходит по заданному критерию. Например, компания может использовать кластеризацию для определения типов клиентов по паттернам их покупок и делать на основании этого персонализированные предложения товаров.</p>
23
<p>Кластеризация ― это распределение объектов по категориям, когда неизвестно, сколько категорий получится в итоге. Распределение происходит по заданному критерию. Например, компания может использовать кластеризацию для определения типов клиентов по паттернам их покупок и делать на основании этого персонализированные предложения товаров.</p>
24
<p>Уменьшение размерности помогает сократить количество признаков в данных без потери информации. Это упрощает их обработку и ускоряет алгоритмы машинного обучения, так как количество данных, с которыми им предстоит работать, уменьшается.</p>
24
<p>Уменьшение размерности помогает сократить количество признаков в данных без потери информации. Это упрощает их обработку и ускоряет алгоритмы машинного обучения, так как количество данных, с которыми им предстоит работать, уменьшается.</p>
25
<p>При распознавании изображений снижение размерности позволяет не анализировать каждый пиксель, а использовать только важные признаки. Например, чтобы распознать зебру среди животных, главное - научиться видеть белые и чёрные полосы.</p>
25
<p>При распознавании изображений снижение размерности позволяет не анализировать каждый пиксель, а использовать только важные признаки. Например, чтобы распознать зебру среди животных, главное - научиться видеть белые и чёрные полосы.</p>
26
<p>Вы читаете эту статью, потому что задумываетесь о карьере специалиста по машинному обучению? Присмотритесь к <a>курсу Skillbox</a> - он подойдёт вам, если вы хотите стартовать в этой сфере.</p>
26
<p>Вы читаете эту статью, потому что задумываетесь о карьере специалиста по машинному обучению? Присмотритесь к <a>курсу Skillbox</a> - он подойдёт вам, если вы хотите стартовать в этой сфере.</p>
27
<p>Чтобы обучить искусственный интеллект, можно использовать разные методы. Они отличаются друг от друга степенью вовлечённости человека в процесс.</p>
27
<p>Чтобы обучить искусственный интеллект, можно использовать разные методы. Они отличаются друг от друга степенью вовлечённости человека в процесс.</p>
28
<p>Компьютер может учиться под присмотром учителя, то есть дата-сайентиста или аналитика данных, который предоставляет ему размеченные данные.</p>
28
<p>Компьютер может учиться под присмотром учителя, то есть дата-сайентиста или аналитика данных, который предоставляет ему размеченные данные.</p>
29
<p>Специалист показывает программе разные примеры и объясняет: вот кот, а вот собака. После обучения предлагает ей по тому же принципу проанализировать незнакомые данные. Если модель ошибается, то учитель исправляет её. Так программа учится, пока не достигнет нужной точности ответов.</p>
29
<p>Специалист показывает программе разные примеры и объясняет: вот кот, а вот собака. После обучения предлагает ей по тому же принципу проанализировать незнакомые данные. Если модель ошибается, то учитель исправляет её. Так программа учится, пока не достигнет нужной точности ответов.</p>
30
<p>Этот тип обучения подходит для решения задач классификации и регрессии. Примеры алгоритмов:<a>наивный Байес</a>,<a>метод опорных векторов</a>,<a>дерево решений</a>,<a>k-ближайшие соседи</a>,<a>логистическая регрессия</a>и <a>линейная и полиномиальная регрессия</a>.</p>
30
<p>Этот тип обучения подходит для решения задач классификации и регрессии. Примеры алгоритмов:<a>наивный Байес</a>,<a>метод опорных векторов</a>,<a>дерево решений</a>,<a>k-ближайшие соседи</a>,<a>логистическая регрессия</a>и <a>линейная и полиномиальная регрессия</a>.</p>
31
<p>Используется для фильтрации спама, компьютерного зрения, поиска и классификации документов.</p>
31
<p>Используется для фильтрации спама, компьютерного зрения, поиска и классификации документов.</p>
32
<p>Здесь программа не получает от специалиста никаких подсказок. Есть большой массив данных, и модели машинного обучения нужно самой найти закономерности.</p>
32
<p>Здесь программа не получает от специалиста никаких подсказок. Есть большой массив данных, и модели машинного обучения нужно самой найти закономерности.</p>
33
<p>Часто обучение без учителя используется для глубокого анализа больших данных, когда информации так много, что классифицировать всё вручную для обучения алгоритмов невозможно. Также этот тип обучения применяется в тех случаях, когда дата-сайентист не знает, что он может найти, но предполагает, что какие-то паттерны в данных присутствуют.</p>
33
<p>Часто обучение без учителя используется для глубокого анализа больших данных, когда информации так много, что классифицировать всё вручную для обучения алгоритмов невозможно. Также этот тип обучения применяется в тех случаях, когда дата-сайентист не знает, что он может найти, но предполагает, что какие-то паттерны в данных присутствуют.</p>
34
<p>С помощью обучения без учителя тренируют алгоритмы по кластеризации данных и выявлению аномалий. Примеры алгоритмов:<a>метод k-средних</a>,<a>DBSCAN</a>,<a>сингулярное разложение</a>(SVD),<a>анализ главных компонент</a>(PCA) и <a>латентное размещение Дирихле</a>(LDA).</p>
34
<p>С помощью обучения без учителя тренируют алгоритмы по кластеризации данных и выявлению аномалий. Примеры алгоритмов:<a>метод k-средних</a>,<a>DBSCAN</a>,<a>сингулярное разложение</a>(SVD),<a>анализ главных компонент</a>(PCA) и <a>латентное размещение Дирихле</a>(LDA).</p>
35
<p>Метод используется для сегментации данных, обнаружения аномалий, составления рекомендаций, управления рисками и обнаружения фейковых изображений.</p>
35
<p>Метод используется для сегментации данных, обнаружения аномалий, составления рекомендаций, управления рисками и обнаружения фейковых изображений.</p>
36
<p>Как понятно из названия, этот метод обучения что-то среднее между полностью самостоятельным обучением и обучением с учителем. Например, специалист может разметить только небольшую часть данных, чтобы повысить точность предсказаний модели на старте её обучения.</p>
36
<p>Как понятно из названия, этот метод обучения что-то среднее между полностью самостоятельным обучением и обучением с учителем. Например, специалист может разметить только небольшую часть данных, чтобы повысить точность предсказаний модели на старте её обучения.</p>
37
<p>Такой способ используется в тех сферах, где требуется работать с большим количеством однотипных по форме, но разнообразных по содержанию данных. Например, при распознавании изображений и речи.</p>
37
<p>Такой способ используется в тех сферах, где требуется работать с большим количеством однотипных по форме, но разнообразных по содержанию данных. Например, при распознавании изображений и речи.</p>
38
<p>Некоторым навыкам можно обучиться только на практике: ходить, танцевать, плавать или водить машину. Людям не нужен постоянный контроль, чтобы эффективно учиться. Получая в ответ на свои действия положительные либо отрицательные сигналы, мы учимся очень эффективно. Например, ребёнок учится избегать острых углов стола, если хотя бы раз о них ударился.</p>
38
<p>Некоторым навыкам можно обучиться только на практике: ходить, танцевать, плавать или водить машину. Людям не нужен постоянный контроль, чтобы эффективно учиться. Получая в ответ на свои действия положительные либо отрицательные сигналы, мы учимся очень эффективно. Например, ребёнок учится избегать острых углов стола, если хотя бы раз о них ударился.</p>
39
<p>Компьютер тоже способен учиться в динамичной среде: игровом или реальном мире. Например, с помощью обучения с подкреплением обучают беспилотные автомобили. Описать абсолютно все ситуации на дороге в виде правил нереально. Нельзя предсказать, в какой момент на дорогу выбежит ребёнок или как ориентироваться на дороге в густом тумане. Поэтому беспилотные автомобили учатся водить при помощи симуляции реальной среды.</p>
39
<p>Компьютер тоже способен учиться в динамичной среде: игровом или реальном мире. Например, с помощью обучения с подкреплением обучают беспилотные автомобили. Описать абсолютно все ситуации на дороге в виде правил нереально. Нельзя предсказать, в какой момент на дорогу выбежит ребёнок или как ориентироваться на дороге в густом тумане. Поэтому беспилотные автомобили учатся водить при помощи симуляции реальной среды.</p>
40
<p>Примеры алгоритмов:<a>Q-обучение</a>,<a>генетический алгоритм</a>,<a>SARSA</a>,<a>DQN</a>и <a>DDPG</a>. Используется для обучения беспилотных автомобилей и роботов.</p>
40
<p>Примеры алгоритмов:<a>Q-обучение</a>,<a>генетический алгоритм</a>,<a>SARSA</a>,<a>DQN</a>и <a>DDPG</a>. Используется для обучения беспилотных автомобилей и роботов.</p>
41
<p>Глубинное обучение - это класс алгоритмов машинного обучения, созданный по аналогии со структурой человеческого мозга. Они работают благодаря многослойным нейронным сетям.</p>
41
<p>Глубинное обучение - это класс алгоритмов машинного обучения, созданный по аналогии со структурой человеческого мозга. Они работают благодаря многослойным нейронным сетям.</p>
42
<p>Для того чтобы обучить машину, нужны три компонента:</p>
42
<p>Для того чтобы обучить машину, нужны три компонента:</p>
43
<p><strong>Наборы данных, или датасеты.</strong>ML-системы обучаются на специальных коллекциях образцов, называемых наборами данных, или датасетами. Они могут включать числа, изображения, тексты или любые другие типы данных в зависимости от задачи. Хороший датасет - это один из факторов успешного обучения модели, поэтому его сбору и предварительной подготовке уделяется много времени.</p>
43
<p><strong>Наборы данных, или датасеты.</strong>ML-системы обучаются на специальных коллекциях образцов, называемых наборами данных, или датасетами. Они могут включать числа, изображения, тексты или любые другие типы данных в зависимости от задачи. Хороший датасет - это один из факторов успешного обучения модели, поэтому его сбору и предварительной подготовке уделяется много времени.</p>
44
<p><strong>Функции.</strong>Функции показывают машине, на что следует обратить внимание. Допустим, вы хотите спрогнозировать цену квартиры. Можно попытаться предсказать стоимость с помощью линейной регрессии и, например, оценить, сколько может стоить это место исходя из площади. Но гораздо проще найти корреляцию между ценой и районом, где расположено здание. Поэтому важно подбирать правильные функции, учитывающие наиболее подходящие параметры.</p>
44
<p><strong>Функции.</strong>Функции показывают машине, на что следует обратить внимание. Допустим, вы хотите спрогнозировать цену квартиры. Можно попытаться предсказать стоимость с помощью линейной регрессии и, например, оценить, сколько может стоить это место исходя из площади. Но гораздо проще найти корреляцию между ценой и районом, где расположено здание. Поэтому важно подбирать правильные функции, учитывающие наиболее подходящие параметры.</p>
45
<p><strong>Алгоритм.</strong>В математическом смысле алгоритм ― это совокупность функций. Он берёт данные на входе и выдаёт результат на выходе. Одну и ту же задачу можно решить, используя разные алгоритмы.</p>
45
<p><strong>Алгоритм.</strong>В математическом смысле алгоритм ― это совокупность функций. Он берёт данные на входе и выдаёт результат на выходе. Одну и ту же задачу можно решить, используя разные алгоритмы.</p>
46
<p>В зависимости от их выбора точность или скорость получения результатов может быть разной. Иногда для достижения большей производительности нужно комбинировать разные алгоритмы. Такие конструкции называются ансамблями (ensemble learning).</p>
46
<p>В зависимости от их выбора точность или скорость получения результатов может быть разной. Иногда для достижения большей производительности нужно комбинировать разные алгоритмы. Такие конструкции называются ансамблями (ensemble learning).</p>
47
<p>Если качество набора данных было высоким, целевые параметры выбраны правильно и использованы подходящие алгоритмы, то машинное обучение может справляться со специализированными задачами даже лучше, чем люди. Например, такие модели используются в диагностике опухолей и они дают<a>на 20% больше верных диагностических ответов</a>в сравнении с врачами-людьми.</p>
47
<p>Если качество набора данных было высоким, целевые параметры выбраны правильно и использованы подходящие алгоритмы, то машинное обучение может справляться со специализированными задачами даже лучше, чем люди. Например, такие модели используются в диагностике опухолей и они дают<a>на 20% больше верных диагностических ответов</a>в сравнении с врачами-людьми.</p>
48
<p>Кратко поговорим о популярных алгоритмах машинного обучения: наивном Байесе, логистической регрессии, деревьях решений и методе опорных векторов.</p>
48
<p>Кратко поговорим о популярных алгоритмах машинного обучения: наивном Байесе, логистической регрессии, деревьях решений и методе опорных векторов.</p>
49
<p>Байесовские алгоритмы - это семейство вероятностных классификаторов, основанных на применении теоремы Байеса. С её помощью можно предсказать, как возникновение одного события влияет на вероятность другого события.</p>
49
<p>Байесовские алгоритмы - это семейство вероятностных классификаторов, основанных на применении теоремы Байеса. С её помощью можно предсказать, как возникновение одного события влияет на вероятность другого события.</p>
50
<p>Наивный классификатор Байеса был одним из первых алгоритмов, использованных для машинного обучения. Например, алгоритм использовали для фильтрации спама до 2010 года. Механизм фильтрации с применением классификатора Байеса очень простой ― инженеры посчитали, какие слова чаще всего встречаются в подобных письмах: "срочно", "скидка", "бесплатно" и другие. А потом научили алгоритм автоматически сортировать письма, где такие слова встречаются часто, в отдельную папку.</p>
50
<p>Наивный классификатор Байеса был одним из первых алгоритмов, использованных для машинного обучения. Например, алгоритм использовали для фильтрации спама до 2010 года. Механизм фильтрации с применением классификатора Байеса очень простой ― инженеры посчитали, какие слова чаще всего встречаются в подобных письмах: "срочно", "скидка", "бесплатно" и другие. А потом научили алгоритм автоматически сортировать письма, где такие слова встречаются часто, в отдельную папку.</p>
51
<p>Но потом изобрели байесовское отравление. Спамеры научились прятать свои сообщения в большом количестве безобидного текста, например отрывков литературных произведений. Это помогало им обмануть фильтр. Поэтому появились другие способы фильтрации писем, более точные, например с помощью нейронных сетей.</p>
51
<p>Но потом изобрели байесовское отравление. Спамеры научились прятать свои сообщения в большом количестве безобидного текста, например отрывков литературных произведений. Это помогало им обмануть фильтр. Поэтому появились другие способы фильтрации писем, более точные, например с помощью нейронных сетей.</p>
52
<p>Регрессия разбивает все данные на две группы - верные и неверные показатели. Она получила своё название благодаря тому, что использует логистическую функцию для прогнозирования вероятности принадлежности объекта к одному из классов.</p>
52
<p>Регрессия разбивает все данные на две группы - верные и неверные показатели. Она получила своё название благодаря тому, что использует логистическую функцию для прогнозирования вероятности принадлежности объекта к одному из классов.</p>
53
Визуализация работы логистической регрессии. Часть данных отмечается как верные показатели, а часть - как неверные<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>С помощью алгоритма можно предсказать зависимость между двумя переменными. Регрессия даёт ответ, насколько вероятно, что произойдёт то или иное событие. По своему смыслу это простая статистическая модель, которая со временем перекочевала в машинное обучение.</p>
53
Визуализация работы логистической регрессии. Часть данных отмечается как верные показатели, а часть - как неверные<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>С помощью алгоритма можно предсказать зависимость между двумя переменными. Регрессия даёт ответ, насколько вероятно, что произойдёт то или иное событие. По своему смыслу это простая статистическая модель, которая со временем перекочевала в машинное обучение.</p>
54
<p>Например, с помощью логистической регрессии можно рассчитать, с какой вероятностью лишний вес и отсутствие физической активности спровоцируют у пациента сердечный приступ.</p>
54
<p>Например, с помощью логистической регрессии можно рассчитать, с какой вероятностью лишний вес и отсутствие физической активности спровоцируют у пациента сердечный приступ.</p>
55
<p>Дерево решений - это алгоритм машинного обучения, который используют для классификации, регрессии и выявления аномалий. Деревья решений часто применяют для анализа больших данных. Предсказания модели довольно точные и их легко визуализировать.</p>
55
<p>Дерево решений - это алгоритм машинного обучения, который используют для классификации, регрессии и выявления аномалий. Деревья решений часто применяют для анализа больших данных. Предсказания модели довольно точные и их легко визуализировать.</p>
56
<p>Чтобы дать предсказание, алгоритм полагается на систему правил "Если… то…". У правил есть иерархия. Например, если продавец решает, давать клиенту скидку или нет, то он может использовать такое дерево решений:</p>
56
<p>Чтобы дать предсказание, алгоритм полагается на систему правил "Если… то…". У правил есть иерархия. Например, если продавец решает, давать клиенту скидку или нет, то он может использовать такое дерево решений:</p>
57
Дерево решений для определения размера скидки<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>Алгоритм сам генерирует правила в процессе обучения. Правила ― это обобщения множества отдельных наблюдений, описывающих предметную область. Дерево решений анализирует выборку входящих данных, а затем группирует их, чтобы объекты одного класса оказались вместе.</p>
57
Дерево решений для определения размера скидки<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>Алгоритм сам генерирует правила в процессе обучения. Правила ― это обобщения множества отдельных наблюдений, описывающих предметную область. Дерево решений анализирует выборку входящих данных, а затем группирует их, чтобы объекты одного класса оказались вместе.</p>
58
<p>Например, в метеорологии они могут использоваться для прогнозирования погоды на основе данных о температуре, давлении и влажности воздуха.</p>
58
<p>Например, в метеорологии они могут использоваться для прогнозирования погоды на основе данных о температуре, давлении и влажности воздуха.</p>
59
<p>Машины опорных векторов применяют для задач регрессии и классификации.</p>
59
<p>Машины опорных векторов применяют для задач регрессии и классификации.</p>
60
<p>Цель SVM - построить в N-мерном пространстве гиперплоскость, которая однозначно разделяет данные на классы. N соответствует количеству признаков, а гиперплоскость ― это прямая, которая разделяет объекты на эти классы. Расстояние от неё до каждого класса должно быть максимальным, так как от этого зависит точность.</p>
60
<p>Цель SVM - построить в N-мерном пространстве гиперплоскость, которая однозначно разделяет данные на классы. N соответствует количеству признаков, а гиперплоскость ― это прямая, которая разделяет объекты на эти классы. Расстояние от неё до каждого класса должно быть максимальным, так как от этого зависит точность.</p>
61
<p>Логика SVM такая: чем больше расстояние между гиперплоскостью и объектами, то есть зазор, тем точнее предсказание. Гиперплоскость графически изображается в виде линии. Точки данных по разным сторонам от линии относятся к разным классам. Сложность заключается в том, чтобы найти правильную линию, которая будет разделять объекты на классы.</p>
61
<p>Логика SVM такая: чем больше расстояние между гиперплоскостью и объектами, то есть зазор, тем точнее предсказание. Гиперплоскость графически изображается в виде линии. Точки данных по разным сторонам от линии относятся к разным классам. Сложность заключается в том, чтобы найти правильную линию, которая будет разделять объекты на классы.</p>
62
Визуализация работы машины опорных векторов<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>SVM один из самых универсальных алгоритмов. Он используется и для распознавания лиц, и для извлечения содержания текстов при их анализе.</p>
62
Визуализация работы машины опорных векторов<em>Инфографика: Майя Мальгина для Skillbox Media</em><p>SVM один из самых универсальных алгоритмов. Он используется и для распознавания лиц, и для извлечения содержания текстов при их анализе.</p>
63
<p>Нейронная сеть - это математическая модель, которая состоит из нейронов ― узлов, объединённых в слои. Между собой слои связаны синапсами. Всё вместе, хоть и очень упрощённо, напоминает устройство нашего мозга.</p>
63
<p>Нейронная сеть - это математическая модель, которая состоит из нейронов ― узлов, объединённых в слои. Между собой слои связаны синапсами. Всё вместе, хоть и очень упрощённо, напоминает устройство нашего мозга.</p>
64
<p>Когда данные подаются на вход модели, они проходят через множество слоёв нейросети и переживают трансформацию. Например, нерелевантные данные могут быть отсортированы, а более важные переданы на следующие слои. У каждого нейрона есть вес, который автоматически меняется в процессе обучения сети. Чем больше вес, тем сильнее связь между нейронами.</p>
64
<p>Когда данные подаются на вход модели, они проходят через множество слоёв нейросети и переживают трансформацию. Например, нерелевантные данные могут быть отсортированы, а более важные переданы на следующие слои. У каждого нейрона есть вес, который автоматически меняется в процессе обучения сети. Чем больше вес, тем сильнее связь между нейронами.</p>
65
<p>Нейросети сегодня превосходят большинство других моделей, независимо от задачи. А потому используются во многих областях и сферах деятельности человека.</p>
65
<p>Нейросети сегодня превосходят большинство других моделей, независимо от задачи. А потому используются во многих областях и сферах деятельности человека.</p>
66
<p>Рассмотрим, как умные компьютерные системы делают нашу жизнь проще в разных областях.</p>
66
<p>Рассмотрим, как умные компьютерные системы делают нашу жизнь проще в разных областях.</p>
67
<p>Многие интернет-магазины используют машинное обучение для предоставления персонализированных рекомендаций своим клиентам.</p>
67
<p>Многие интернет-магазины используют машинное обучение для предоставления персонализированных рекомендаций своим клиентам.</p>
68
<p>Алгоритмы анализируют данные о покупках клиентов, исследуют их поведение на сайте, а также информацию о товарах, которые они просматривают. На основе этих данных можно сделать предсказания о том, какие товары могут заинтересовать клиента, и предлагать их в ленте или даже на странице с корзиной.</p>
68
<p>Алгоритмы анализируют данные о покупках клиентов, исследуют их поведение на сайте, а также информацию о товарах, которые они просматривают. На основе этих данных можно сделать предсказания о том, какие товары могут заинтересовать клиента, и предлагать их в ленте или даже на странице с корзиной.</p>
69
<p>Рекомендательные системы также используют сайты, куда пользователи заходят, чтобы потреблять контент: соцсети, видеохостинги и новостные сайты.</p>
69
<p>Рекомендательные системы также используют сайты, куда пользователи заходят, чтобы потреблять контент: соцсети, видеохостинги и новостные сайты.</p>
70
<p>Большинство банков используют инструменты машинного обучения для защиты средств своих клиентов, например для обнаружения мошенничества в банковских операциях.</p>
70
<p>Большинство банков используют инструменты машинного обучения для защиты средств своих клиентов, например для обнаружения мошенничества в банковских операциях.</p>
71
<p>"Умные" системы анализируют большие данные и выявляют аномальные транзакции, например перевод средств с незнакомого устройства или непривычный паттерн покупок. Это позволяет банкам быстро реагировать на подозрительные операции и предотвращать финансовые потери.</p>
71
<p>"Умные" системы анализируют большие данные и выявляют аномальные транзакции, например перевод средств с незнакомого устройства или непривычный паттерн покупок. Это позволяет банкам быстро реагировать на подозрительные операции и предотвращать финансовые потери.</p>
72
<p>Алгоритмы машинного обучения могут анализировать данные о температуре, влажности, давлении и других показателях, чтобы делать прогнозы о том, каких погодных условий можно ожидать в ближайшее время. Например, у "Яндекса" есть система предсказания погоды на основе машинного обучения "<a>Метеум</a>".</p>
72
<p>Алгоритмы машинного обучения могут анализировать данные о температуре, влажности, давлении и других показателях, чтобы делать прогнозы о том, каких погодных условий можно ожидать в ближайшее время. Например, у "Яндекса" есть система предсказания погоды на основе машинного обучения "<a>Метеум</a>".</p>
73
<p>Машинное обучение применяют в анализе медицинских данных, например для анализа результата рентгенологических снимков, анализов и истории болезни. Это помогает врачам поставить правильный диагноз и подобрать наиболее эффективное лечение. Например, такой подход реализован в компании<a>Oncora</a>из США, использующей ML-подходы для выявления онкозаболеваний.</p>
73
<p>Машинное обучение применяют в анализе медицинских данных, например для анализа результата рентгенологических снимков, анализов и истории болезни. Это помогает врачам поставить правильный диагноз и подобрать наиболее эффективное лечение. Например, такой подход реализован в компании<a>Oncora</a>из США, использующей ML-подходы для выявления онкозаболеваний.</p>
74
<p>Машинное обучение может использоваться для распознавания речи. Алгоритмы анализируют звуковые данные и преобразовывают их в текстовую форму. Именно так работают голосовые помощники, такие как Siri и Alexa, а также переводчики текста в реальном времени.</p>
74
<p>Машинное обучение может использоваться для распознавания речи. Алгоритмы анализируют звуковые данные и преобразовывают их в текстовую форму. Именно так работают голосовые помощники, такие как Siri и Alexa, а также переводчики текста в реальном времени.</p>
75
<p>Например, сейчас Spotify тестирует новую функцию ―<a>дубляж подкастов в реальном времени</a>. Причём текст на другом языке воспроизводится голосами авторов. Это было бы невозможно без машинного обучения.</p>
75
<p>Например, сейчас Spotify тестирует новую функцию ―<a>дубляж подкастов в реальном времени</a>. Причём текст на другом языке воспроизводится голосами авторов. Это было бы невозможно без машинного обучения.</p>
76
<p>Давайте повторим то, что мы сегодня узнали о машинном обучении:</p>
76
<p>Давайте повторим то, что мы сегодня узнали о машинном обучении:</p>
77
<ul><li>Машинное обучение - это набор методов, с помощью которых создают системы, способные самостоятельно (без жёстко заданных алгоритмов) решать поставленные задачи.</li>
77
<ul><li>Машинное обучение - это набор методов, с помощью которых создают системы, способные самостоятельно (без жёстко заданных алгоритмов) решать поставленные задачи.</li>
78
<li>Компьютер может учиться под присмотром учителя, который помогает программе находить решения с помощью размеченного датасета или проверки результатов. Такой метод называется<strong>обучением с учителем</strong>.</li>
78
<li>Компьютер может учиться под присмотром учителя, который помогает программе находить решения с помощью размеченного датасета или проверки результатов. Такой метод называется<strong>обучением с учителем</strong>.</li>
79
<li>Если программа не получает от специалиста никаких подсказок и учится только на данных― это<strong>обучение без учителя</strong>.</li>
79
<li>Если программа не получает от специалиста никаких подсказок и учится только на данных― это<strong>обучение без учителя</strong>.</li>
80
<li><strong>Обучение с частичным привлечением учителя</strong>― что-то среднее между самообучением машины и методом с привлечением учителя. ML-инженер может разметить только небольшую часть данных, чтобы повысить точность предсказаний модели.</li>
80
<li><strong>Обучение с частичным привлечением учителя</strong>― что-то среднее между самообучением машины и методом с привлечением учителя. ML-инженер может разметить только небольшую часть данных, чтобы повысить точность предсказаний модели.</li>
81
<li>Некоторым навыкам, таким как вождение, компьютер может научиться только методом проб и ошибок в реальной среде. Так работает<strong>обучение с подкреплением</strong>.</li>
81
<li>Некоторым навыкам, таким как вождение, компьютер может научиться только методом проб и ошибок в реальной среде. Так работает<strong>обучение с подкреплением</strong>.</li>
82
<li>Машинное обучение применяют в разных областях: для рекомендации товаров в интернет-магазинах, постановки диагнозов в медицине, обнаружения мошенничества в банках и в других сферах.</li>
82
<li>Машинное обучение применяют в разных областях: для рекомендации товаров в интернет-магазинах, постановки диагнозов в медицине, обнаружения мошенничества в банках и в других сферах.</li>
83
</ul><a>Курс с трудоустройством: "Профессия Machine Learning Engineer" Узнать о курсе</a>
83
</ul><a>Курс с трудоустройством: "Профессия Machine Learning Engineer" Узнать о курсе</a>