0 added
0 removed
Original
2026-01-01
Modified
2026-02-21
1
<p><a>#статьи</a></p>
1
<p><a>#статьи</a></p>
2
<ul><li>2 апр 2021</li>
2
<ul><li>2 апр 2021</li>
3
<li>0</li>
3
<li>0</li>
4
</ul><h2>Что такое рекомендательные системы и как они работают</h2>
4
</ul><h2>Что такое рекомендательные системы и как они работают</h2>
5
<p>Откуда соцсети, интернет-магазины и онлайн-кинотеатры знают, что вы любите? Разбираемся вместе.</p>
5
<p>Откуда соцсети, интернет-магазины и онлайн-кинотеатры знают, что вы любите? Разбираемся вместе.</p>
6
<p>microsoft / microsoft.com</p>
6
<p>microsoft / microsoft.com</p>
7
<p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
7
<p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
8
<p>Покупая что-то в онлайн-магазине, вы наверняка замечаете блок "Рекомендованное". И чем больше времени вы рассматриваете товары, тем более качественными становятся рекомендации.</p>
8
<p>Покупая что-то в онлайн-магазине, вы наверняка замечаете блок "Рекомендованное". И чем больше времени вы рассматриваете товары, тем более качественными становятся рекомендации.</p>
9
<p>Пока вы изучаете ассортимент, специальный алгоритм собирает досье: какие цвета и модели вам нравятся, что покупаете, а что удаляете из корзины. Программа находит похожие товары и в первую очередь показывает вам именно их - как если бы в ассортименте магазина были только ваши любимые вещи.</p>
9
<p>Пока вы изучаете ассортимент, специальный алгоритм собирает досье: какие цвета и модели вам нравятся, что покупаете, а что удаляете из корзины. Программа находит похожие товары и в первую очередь показывает вам именно их - как если бы в ассортименте магазина были только ваши любимые вещи.</p>
10
<p>Сложно устоять перед соблазном и не потратить все деньги. На это и рассчитывают заказчики рекомендательных систем - они пытаются увеличить конверсию в покупку и средний чек своих магазинов.</p>
10
<p>Сложно устоять перед соблазном и не потратить все деньги. На это и рассчитывают заказчики рекомендательных систем - они пытаются увеличить конверсию в покупку и средний чек своих магазинов.</p>
11
<p>Представьте, что вам нужно порекомендовать кому-то фильм. На чём вы будете основываться? Другу, с которым у вас много общего, можно посоветовать то, что понравилось вам. Но восьмилетней сестре вы вряд ли предложите "Декстера" - и вкусы, и потребности явно будут отличаться.</p>
11
<p>Представьте, что вам нужно порекомендовать кому-то фильм. На чём вы будете основываться? Другу, с которым у вас много общего, можно посоветовать то, что понравилось вам. Но восьмилетней сестре вы вряд ли предложите "Декстера" - и вкусы, и потребности явно будут отличаться.</p>
12
<p>Логика рекомендательных систем тоже может быть разной:</p>
12
<p>Логика рекомендательных систем тоже может быть разной:</p>
13
<ul><li>Фильтрация, основанная на контенте (content-based filtering).</li>
13
<ul><li>Фильтрация, основанная на контенте (content-based filtering).</li>
14
<li>Коллаборативная фильтрация (collaborative filtering).</li>
14
<li>Коллаборативная фильтрация (collaborative filtering).</li>
15
<li>Фильтрация, основанная на знаниях (knowledge-based filtering).</li>
15
<li>Фильтрация, основанная на знаниях (knowledge-based filtering).</li>
16
<li>Гибридные рекомендательные системы (hybrid filtering).</li>
16
<li>Гибридные рекомендательные системы (hybrid filtering).</li>
17
</ul><p>Рассмотрим каждый из типов подробнее.</p>
17
</ul><p>Рассмотрим каждый из типов подробнее.</p>
18
<p>Посмотрели ужастик про зомби? Рекомендательная система, основанная на контенте, посоветует ещё 25. Постоянно слушаете Queen? Вот вам плейлист рок-музыки семидесятых. Кажется, что это безотказный метод. Но нет.</p>
18
<p>Посмотрели ужастик про зомби? Рекомендательная система, основанная на контенте, посоветует ещё 25. Постоянно слушаете Queen? Вот вам плейлист рок-музыки семидесятых. Кажется, что это безотказный метод. Но нет.</p>
19
<p>Допустим, вы купили диван. Это крупная и дорогая покупка, большинство людей не приходит за новым диваном каждый месяц. Если рекомендательная система посоветует вам купить ещё 15 диванов, то магазин явно будет в убытке. А вот рекламные системы вроде "Яндекс.Директа" о факте покупки не знают, поэтому ещё долго будут кидаться в вас всевозможными диванами - то есть фильтровать рекламу, основываясь на контенте.</p>
19
<p>Допустим, вы купили диван. Это крупная и дорогая покупка, большинство людей не приходит за новым диваном каждый месяц. Если рекомендательная система посоветует вам купить ещё 15 диванов, то магазин явно будет в убытке. А вот рекламные системы вроде "Яндекс.Директа" о факте покупки не знают, поэтому ещё долго будут кидаться в вас всевозможными диванами - то есть фильтровать рекламу, основываясь на контенте.</p>
20
<p>Что же делать магазину мебели в такой ситуации? Рецепт простой - можно отследить историю корзин всех покупателей диванов. И окажется, что спустя пару месяцев многие покупают средства и губки для чистки мебели, какие-то аксессуары, чехлы, накидки. Порекомендовать их клиенту - значит сделать его жизнь проще, а заодно заработать. Но и этот подход не универсален.</p>
20
<p>Что же делать магазину мебели в такой ситуации? Рецепт простой - можно отследить историю корзин всех покупателей диванов. И окажется, что спустя пару месяцев многие покупают средства и губки для чистки мебели, какие-то аксессуары, чехлы, накидки. Порекомендовать их клиенту - значит сделать его жизнь проще, а заодно заработать. Но и этот подход не универсален.</p>
21
<p>Если на сайте продаются дома или машины, полагаться на отзывы других пользователей система не может: покупки штучные и редкие, а значит, информации слишком мало - нет статистической значимости. Но мы же хотим, чтобы пользователь купил дом своей мечты у нас, а не у конкурентов?</p>
21
<p>Если на сайте продаются дома или машины, полагаться на отзывы других пользователей система не может: покупки штучные и редкие, а значит, информации слишком мало - нет статистической значимости. Но мы же хотим, чтобы пользователь купил дом своей мечты у нас, а не у конкурентов?</p>
22
<p>В этом случае можно добавить фильтры: дом в городе или в деревне, количество этажей и квадратных метров, материал стен. После этого рекомендательная система подбирает наиболее подходящие дома из каталога.</p>
22
<p>В этом случае можно добавить фильтры: дом в городе или в деревне, количество этажей и квадратных метров, материал стен. После этого рекомендательная система подбирает наиболее подходящие дома из каталога.</p>
23
<p>Такой тип рекомендаций точен: пользователю показывают именно то, что он хочет видеть. Но алгоритмы фильтрации, основанной на знаниях, сложнее продумать, потому что параметров поиска может быть очень много.</p>
23
<p>Такой тип рекомендаций точен: пользователю показывают именно то, что он хочет видеть. Но алгоритмы фильтрации, основанной на знаниях, сложнее продумать, потому что параметров поиска может быть очень много.</p>
24
<p>Гибридные рекомендательные системы сочетают разные подходы. Так можно избавиться от большинства недостатков "несмешанных" систем. Например, в онлайн-магазинах одежды в рекомендациях показываются вещи, похожие на те, что вы уже смотрели, а также те, которые покупали пользователи с похожими вкусами, - то есть одновременно включаются механизмы фильтрации, основанной на контенте, и коллаборативной фильтрации.</p>
24
<p>Гибридные рекомендательные системы сочетают разные подходы. Так можно избавиться от большинства недостатков "несмешанных" систем. Например, в онлайн-магазинах одежды в рекомендациях показываются вещи, похожие на те, что вы уже смотрели, а также те, которые покупали пользователи с похожими вкусами, - то есть одновременно включаются механизмы фильтрации, основанной на контенте, и коллаборативной фильтрации.</p>
25
<p>Считается, что рекомендательная система Cinematch, созданная Netflix, - одна из наиболее продуманных в мире. Netflix не раскрывает всех деталей работы своей модели машинного обучения, но основные принципы известны.</p>
25
<p>Считается, что рекомендательная система Cinematch, созданная Netflix, - одна из наиболее продуманных в мире. Netflix не раскрывает всех деталей работы своей модели машинного обучения, но основные принципы известны.</p>
26
<p>При регистрации вас сразу просят указать несколько любимых фильмов и сериалов. На их основе генерируется лента, которая будет подстраиваться под ваши вкусы. С помощью лайков и дизлайков вы можете корректировать её и добавлять понравившиеся фильмы в плейлист.</p>
26
<p>При регистрации вас сразу просят указать несколько любимых фильмов и сериалов. На их основе генерируется лента, которая будет подстраиваться под ваши вкусы. С помощью лайков и дизлайков вы можете корректировать её и добавлять понравившиеся фильмы в плейлист.</p>
27
<p>Netflix хочет знать о вас всё: что вы смотрите, что смотрели до и после конкретной программы, в какое время суток используете сервис и сколько времени в нём проводите. Алгоритм учитывает ваши возраст, пол и геопозицию.</p>
27
<p>Netflix хочет знать о вас всё: что вы смотрите, что смотрели до и после конкретной программы, в какое время суток используете сервис и сколько времени в нём проводите. Алгоритм учитывает ваши возраст, пол и геопозицию.</p>
28
<p>Каждое видео на Netflix сначала просматривают специалисты. Они вручную маркируют и размечают контент, то есть описывают, что зритель увидит на экране. Пользователи иногда ищут очень конкретные вещи - например, "британская комедия про зомби" - и Netflix может выдать релевантный контент даже на такие сложные запросы.</p>
28
<p>Каждое видео на Netflix сначала просматривают специалисты. Они вручную маркируют и размечают контент, то есть описывают, что зритель увидит на экране. Пользователи иногда ищут очень конкретные вещи - например, "британская комедия про зомби" - и Netflix может выдать релевантный контент даже на такие сложные запросы.</p>
29
<p>Видеосервис использует данные о фильмах и пользователях, чтобы с помощью алгоритмов машинного обучения оценить, какая информация важнее всего. Например, что больше влияет на ваши вкусы сегодня: то, что вы смотрели год или неделю назад? Обычно чем свежее данные, тем лучше. Хотя если сейчас конец декабря, то новогодние и рождественские комедии окажутся более уместными - но только для стран с христианскими традициями.</p>
29
<p>Видеосервис использует данные о фильмах и пользователях, чтобы с помощью алгоритмов машинного обучения оценить, какая информация важнее всего. Например, что больше влияет на ваши вкусы сегодня: то, что вы смотрели год или неделю назад? Обычно чем свежее данные, тем лучше. Хотя если сейчас конец декабря, то новогодние и рождественские комедии окажутся более уместными - но только для стран с христианскими традициями.</p>
30
<p>Cinematch рассматривает как явные, так и неявные источники информации. Если вы добавляете сериал в избранное, значит, он вас заинтересовал. Но если вы посмотрели три сезона сериала за два дня и при этом не добавили его в избранное, это тоже хороший знак.</p>
30
<p>Cinematch рассматривает как явные, так и неявные источники информации. Если вы добавляете сериал в избранное, значит, он вас заинтересовал. Но если вы посмотрели три сезона сериала за два дня и при этом не добавили его в избранное, это тоже хороший знак.</p>
31
<p>Алгоритм машинного обучения анализирует не только каждого отдельного пользователя, но и группы пользователей со сходными вкусами - сегменты. У Netflix таких сегментов по интересам больше 2 тысяч. В итоге на рекомендации влияет даже то, что смотрели другие люди из вашего сегмента.</p>
31
<p>Алгоритм машинного обучения анализирует не только каждого отдельного пользователя, но и группы пользователей со сходными вкусами - сегменты. У Netflix таких сегментов по интересам больше 2 тысяч. В итоге на рекомендации влияет даже то, что смотрели другие люди из вашего сегмента.</p>
32
<p>В Интернете множество сайтов, на которых фильмы можно смотреть бесплатно, но Netflix в 2020 году набрал почти 200 млн платных подписчиков. А значит, их рекомендательная система чего-то стоит.</p>
32
<p>В Интернете множество сайтов, на которых фильмы можно смотреть бесплатно, но Netflix в 2020 году набрал почти 200 млн платных подписчиков. А значит, их рекомендательная система чего-то стоит.</p>
33
<p>Рекомендательные системы приносят очевидную выгоду владельцам онлайн-магазинов, различных сервисов и приложений. Они показывают пользователю именно то, что ему интересно, и генерируют прибыль.</p>
33
<p>Рекомендательные системы приносят очевидную выгоду владельцам онлайн-магазинов, различных сервисов и приложений. Они показывают пользователю именно то, что ему интересно, и генерируют прибыль.</p>
34
<p>Но есть и минусы. Человек привыкает к подсказкам рекомендательных сетей при выборе книг, фильмов и музыки. У него пропадает стимул изучать новые непривычные жанры - ведь всё, что предлагает сеть, ему в принципе нравится.</p>
34
<p>Но есть и минусы. Человек привыкает к подсказкам рекомендательных сетей при выборе книг, фильмов и музыки. У него пропадает стимул изучать новые непривычные жанры - ведь всё, что предлагает сеть, ему в принципе нравится.</p>
35
<p>Особенно остро стоит проблема потребления новостей и выдачи умной ленты в социальных сетях. Потому что здесь речь идёт уже не столько о развлечениях, сколько о формировании мировоззрения.</p>
35
<p>Особенно остро стоит проблема потребления новостей и выдачи умной ленты в социальных сетях. Потому что здесь речь идёт уже не столько о развлечениях, сколько о формировании мировоззрения.</p>
36
<p>Например, у расиста или у конспиролога, верящего в рептилоидов, в ленте будут преобладать поддерживающие его точку зрения материалы - а значит, его шансы познакомиться с качественными альтернативными источниками стремятся к нулю и он будет лишь ещё больше укрепляться в своём мнении. И это может привести к печальным последствиям или неадекватным поступкам.</p>
36
<p>Например, у расиста или у конспиролога, верящего в рептилоидов, в ленте будут преобладать поддерживающие его точку зрения материалы - а значит, его шансы познакомиться с качественными альтернативными источниками стремятся к нулю и он будет лишь ещё больше укрепляться в своём мнении. И это может привести к печальным последствиям или неадекватным поступкам.</p>
37
<p>Социальные сети и алгоритмы выдачи борются с таким явлением. Так что бояться полной потери индивидуальности не стоит. Все мы в какой-то степени полагаемся на гаджеты и современные технологии, а рекомендации помогают ориентироваться в потоке информации и находить интересные материалы быстрее.</p>
37
<p>Социальные сети и алгоритмы выдачи борются с таким явлением. Так что бояться полной потери индивидуальности не стоит. Все мы в какой-то степени полагаемся на гаджеты и современные технологии, а рекомендации помогают ориентироваться в потоке информации и находить интересные материалы быстрее.</p>
38
<a><b>Бесплатный курс по Python ➞</b>Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе. Смотреть программу</a>
38
<a><b>Бесплатный курс по Python ➞</b>Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе. Смотреть программу</a>