HTML Diff
0 added 0 removed
Original 2026-01-01
Modified 2026-02-21
1 <p><a>#статьи</a></p>
1 <p><a>#статьи</a></p>
2 <ul><li>2 апр 2021</li>
2 <ul><li>2 апр 2021</li>
3 <li>0</li>
3 <li>0</li>
4 </ul><h2>Что такое рекомендательные системы и как они работают</h2>
4 </ul><h2>Что такое рекомендательные системы и как они работают</h2>
5 <p>Откуда соцсети, интернет-магазины и онлайн-кинотеатры знают, что вы любите? Разбираемся вместе.</p>
5 <p>Откуда соцсети, интернет-магазины и онлайн-кинотеатры знают, что вы любите? Разбираемся вместе.</p>
6 <p>microsoft / microsoft.com</p>
6 <p>microsoft / microsoft.com</p>
7 <p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
7 <p>Пишет про digital и машинное обучение для корпоративных блогов. Топ-автор в категории "Искусственный интеллект" на Medium. Kaggle-эксперт.</p>
8 <p>Покупая что-то в онлайн-магазине, вы наверняка замечаете блок "Рекомендованное". И чем больше времени вы рассматриваете товары, тем более качественными становятся рекомендации.</p>
8 <p>Покупая что-то в онлайн-магазине, вы наверняка замечаете блок "Рекомендованное". И чем больше времени вы рассматриваете товары, тем более качественными становятся рекомендации.</p>
9 <p>Пока вы изучаете ассортимент, специальный алгоритм собирает досье: какие цвета и модели вам нравятся, что покупаете, а что удаляете из корзины. Программа находит похожие товары и в первую очередь показывает вам именно их - как если бы в ассортименте магазина были только ваши любимые вещи.</p>
9 <p>Пока вы изучаете ассортимент, специальный алгоритм собирает досье: какие цвета и модели вам нравятся, что покупаете, а что удаляете из корзины. Программа находит похожие товары и в первую очередь показывает вам именно их - как если бы в ассортименте магазина были только ваши любимые вещи.</p>
10 <p>Сложно устоять перед соблазном и не потратить все деньги. На это и рассчитывают заказчики рекомендательных систем - они пытаются увеличить конверсию в покупку и средний чек своих магазинов.</p>
10 <p>Сложно устоять перед соблазном и не потратить все деньги. На это и рассчитывают заказчики рекомендательных систем - они пытаются увеличить конверсию в покупку и средний чек своих магазинов.</p>
11 <p>Представьте, что вам нужно порекомендовать кому-то фильм. На чём вы будете основываться? Другу, с которым у вас много общего, можно посоветовать то, что понравилось вам. Но восьмилетней сестре вы вряд ли предложите "Декстера" - и вкусы, и потребности явно будут отличаться.</p>
11 <p>Представьте, что вам нужно порекомендовать кому-то фильм. На чём вы будете основываться? Другу, с которым у вас много общего, можно посоветовать то, что понравилось вам. Но восьмилетней сестре вы вряд ли предложите "Декстера" - и вкусы, и потребности явно будут отличаться.</p>
12 <p>Логика рекомендательных систем тоже может быть разной:</p>
12 <p>Логика рекомендательных систем тоже может быть разной:</p>
13 <ul><li>Фильтрация, основанная на контенте (content-based filtering).</li>
13 <ul><li>Фильтрация, основанная на контенте (content-based filtering).</li>
14 <li>Коллаборативная фильтрация (collaborative filtering).</li>
14 <li>Коллаборативная фильтрация (collaborative filtering).</li>
15 <li>Фильтрация, основанная на знаниях (knowledge-based filtering).</li>
15 <li>Фильтрация, основанная на знаниях (knowledge-based filtering).</li>
16 <li>Гибридные рекомендательные системы (hybrid filtering).</li>
16 <li>Гибридные рекомендательные системы (hybrid filtering).</li>
17 </ul><p>Рассмотрим каждый из типов подробнее.</p>
17 </ul><p>Рассмотрим каждый из типов подробнее.</p>
18 <p>Посмотрели ужастик про зомби? Рекомендательная система, основанная на контенте, посоветует ещё 25. Постоянно слушаете Queen? Вот вам плейлист рок-музыки семидесятых. Кажется, что это безотказный метод. Но нет.</p>
18 <p>Посмотрели ужастик про зомби? Рекомендательная система, основанная на контенте, посоветует ещё 25. Постоянно слушаете Queen? Вот вам плейлист рок-музыки семидесятых. Кажется, что это безотказный метод. Но нет.</p>
19 <p>Допустим, вы купили диван. Это крупная и дорогая покупка, большинство людей не приходит за новым диваном каждый месяц. Если рекомендательная система посоветует вам купить ещё 15 диванов, то магазин явно будет в убытке. А вот рекламные системы вроде "Яндекс.Директа" о факте покупки не знают, поэтому ещё долго будут кидаться в вас всевозможными диванами - то есть фильтровать рекламу, основываясь на контенте.</p>
19 <p>Допустим, вы купили диван. Это крупная и дорогая покупка, большинство людей не приходит за новым диваном каждый месяц. Если рекомендательная система посоветует вам купить ещё 15 диванов, то магазин явно будет в убытке. А вот рекламные системы вроде "Яндекс.Директа" о факте покупки не знают, поэтому ещё долго будут кидаться в вас всевозможными диванами - то есть фильтровать рекламу, основываясь на контенте.</p>
20 <p>Что же делать магазину мебели в такой ситуации? Рецепт простой - можно отследить историю корзин всех покупателей диванов. И окажется, что спустя пару месяцев многие покупают средства и губки для чистки мебели, какие-то аксессуары, чехлы, накидки. Порекомендовать их клиенту - значит сделать его жизнь проще, а заодно заработать. Но и этот подход не универсален.</p>
20 <p>Что же делать магазину мебели в такой ситуации? Рецепт простой - можно отследить историю корзин всех покупателей диванов. И окажется, что спустя пару месяцев многие покупают средства и губки для чистки мебели, какие-то аксессуары, чехлы, накидки. Порекомендовать их клиенту - значит сделать его жизнь проще, а заодно заработать. Но и этот подход не универсален.</p>
21 <p>Если на сайте продаются дома или машины, полагаться на отзывы других пользователей система не может: покупки штучные и редкие, а значит, информации слишком мало - нет статистической значимости. Но мы же хотим, чтобы пользователь купил дом своей мечты у нас, а не у конкурентов?</p>
21 <p>Если на сайте продаются дома или машины, полагаться на отзывы других пользователей система не может: покупки штучные и редкие, а значит, информации слишком мало - нет статистической значимости. Но мы же хотим, чтобы пользователь купил дом своей мечты у нас, а не у конкурентов?</p>
22 <p>В этом случае можно добавить фильтры: дом в городе или в деревне, количество этажей и квадратных метров, материал стен. После этого рекомендательная система подбирает наиболее подходящие дома из каталога.</p>
22 <p>В этом случае можно добавить фильтры: дом в городе или в деревне, количество этажей и квадратных метров, материал стен. После этого рекомендательная система подбирает наиболее подходящие дома из каталога.</p>
23 <p>Такой тип рекомендаций точен: пользователю показывают именно то, что он хочет видеть. Но алгоритмы фильтрации, основанной на знаниях, сложнее продумать, потому что параметров поиска может быть очень много.</p>
23 <p>Такой тип рекомендаций точен: пользователю показывают именно то, что он хочет видеть. Но алгоритмы фильтрации, основанной на знаниях, сложнее продумать, потому что параметров поиска может быть очень много.</p>
24 <p>Гибридные рекомендательные системы сочетают разные подходы. Так можно избавиться от большинства недостатков "несмешанных" систем. Например, в онлайн-магазинах одежды в рекомендациях показываются вещи, похожие на те, что вы уже смотрели, а также те, которые покупали пользователи с похожими вкусами, - то есть одновременно включаются механизмы фильтрации, основанной на контенте, и коллаборативной фильтрации.</p>
24 <p>Гибридные рекомендательные системы сочетают разные подходы. Так можно избавиться от большинства недостатков "несмешанных" систем. Например, в онлайн-магазинах одежды в рекомендациях показываются вещи, похожие на те, что вы уже смотрели, а также те, которые покупали пользователи с похожими вкусами, - то есть одновременно включаются механизмы фильтрации, основанной на контенте, и коллаборативной фильтрации.</p>
25 <p>Считается, что рекомендательная система Cinematch, созданная Netflix, - одна из наиболее продуманных в мире. Netflix не раскрывает всех деталей работы своей модели машинного обучения, но основные принципы известны.</p>
25 <p>Считается, что рекомендательная система Cinematch, созданная Netflix, - одна из наиболее продуманных в мире. Netflix не раскрывает всех деталей работы своей модели машинного обучения, но основные принципы известны.</p>
26 <p>При регистрации вас сразу просят указать несколько любимых фильмов и сериалов. На их основе генерируется лента, которая будет подстраиваться под ваши вкусы. С помощью лайков и дизлайков вы можете корректировать её и добавлять понравившиеся фильмы в плейлист.</p>
26 <p>При регистрации вас сразу просят указать несколько любимых фильмов и сериалов. На их основе генерируется лента, которая будет подстраиваться под ваши вкусы. С помощью лайков и дизлайков вы можете корректировать её и добавлять понравившиеся фильмы в плейлист.</p>
27 <p>Netflix хочет знать о вас всё: что вы смотрите, что смотрели до и после конкретной программы, в какое время суток используете сервис и сколько времени в нём проводите. Алгоритм учитывает ваши возраст, пол и геопозицию.</p>
27 <p>Netflix хочет знать о вас всё: что вы смотрите, что смотрели до и после конкретной программы, в какое время суток используете сервис и сколько времени в нём проводите. Алгоритм учитывает ваши возраст, пол и геопозицию.</p>
28 <p>Каждое видео на Netflix сначала просматривают специалисты. Они вручную маркируют и размечают контент, то есть описывают, что зритель увидит на экране. Пользователи иногда ищут очень конкретные вещи - например, "британская комедия про зомби" - и Netflix может выдать релевантный контент даже на такие сложные запросы.</p>
28 <p>Каждое видео на Netflix сначала просматривают специалисты. Они вручную маркируют и размечают контент, то есть описывают, что зритель увидит на экране. Пользователи иногда ищут очень конкретные вещи - например, "британская комедия про зомби" - и Netflix может выдать релевантный контент даже на такие сложные запросы.</p>
29 <p>Видеосервис использует данные о фильмах и пользователях, чтобы с помощью алгоритмов машинного обучения оценить, какая информация важнее всего. Например, что больше влияет на ваши вкусы сегодня: то, что вы смотрели год или неделю назад? Обычно чем свежее данные, тем лучше. Хотя если сейчас конец декабря, то новогодние и рождественские комедии окажутся более уместными - но только для стран с христианскими традициями.</p>
29 <p>Видеосервис использует данные о фильмах и пользователях, чтобы с помощью алгоритмов машинного обучения оценить, какая информация важнее всего. Например, что больше влияет на ваши вкусы сегодня: то, что вы смотрели год или неделю назад? Обычно чем свежее данные, тем лучше. Хотя если сейчас конец декабря, то новогодние и рождественские комедии окажутся более уместными - но только для стран с христианскими традициями.</p>
30 <p>Cinematch рассматривает как явные, так и неявные источники информации. Если вы добавляете сериал в избранное, значит, он вас заинтересовал. Но если вы посмотрели три сезона сериала за два дня и при этом не добавили его в избранное, это тоже хороший знак.</p>
30 <p>Cinematch рассматривает как явные, так и неявные источники информации. Если вы добавляете сериал в избранное, значит, он вас заинтересовал. Но если вы посмотрели три сезона сериала за два дня и при этом не добавили его в избранное, это тоже хороший знак.</p>
31 <p>Алгоритм машинного обучения анализирует не только каждого отдельного пользователя, но и группы пользователей со сходными вкусами - сегменты. У Netflix таких сегментов по интересам больше 2 тысяч. В итоге на рекомендации влияет даже то, что смотрели другие люди из вашего сегмента.</p>
31 <p>Алгоритм машинного обучения анализирует не только каждого отдельного пользователя, но и группы пользователей со сходными вкусами - сегменты. У Netflix таких сегментов по интересам больше 2 тысяч. В итоге на рекомендации влияет даже то, что смотрели другие люди из вашего сегмента.</p>
32 <p>В Интернете множество сайтов, на которых фильмы можно смотреть бесплатно, но Netflix в 2020 году набрал почти 200 млн платных подписчиков. А значит, их рекомендательная система чего-то стоит.</p>
32 <p>В Интернете множество сайтов, на которых фильмы можно смотреть бесплатно, но Netflix в 2020 году набрал почти 200 млн платных подписчиков. А значит, их рекомендательная система чего-то стоит.</p>
33 <p>Рекомендательные системы приносят очевидную выгоду владельцам онлайн-магазинов, различных сервисов и приложений. Они показывают пользователю именно то, что ему интересно, и генерируют прибыль.</p>
33 <p>Рекомендательные системы приносят очевидную выгоду владельцам онлайн-магазинов, различных сервисов и приложений. Они показывают пользователю именно то, что ему интересно, и генерируют прибыль.</p>
34 <p>Но есть и минусы. Человек привыкает к подсказкам рекомендательных сетей при выборе книг, фильмов и музыки. У него пропадает стимул изучать новые непривычные жанры - ведь всё, что предлагает сеть, ему в принципе нравится.</p>
34 <p>Но есть и минусы. Человек привыкает к подсказкам рекомендательных сетей при выборе книг, фильмов и музыки. У него пропадает стимул изучать новые непривычные жанры - ведь всё, что предлагает сеть, ему в принципе нравится.</p>
35 <p>Особенно остро стоит проблема потребления новостей и выдачи умной ленты в социальных сетях. Потому что здесь речь идёт уже не столько о развлечениях, сколько о формировании мировоззрения.</p>
35 <p>Особенно остро стоит проблема потребления новостей и выдачи умной ленты в социальных сетях. Потому что здесь речь идёт уже не столько о развлечениях, сколько о формировании мировоззрения.</p>
36 <p>Например, у расиста или у конспиролога, верящего в рептилоидов, в ленте будут преобладать поддерживающие его точку зрения материалы - а значит, его шансы познакомиться с качественными альтернативными источниками стремятся к нулю и он будет лишь ещё больше укрепляться в своём мнении. И это может привести к печальным последствиям или неадекватным поступкам.</p>
36 <p>Например, у расиста или у конспиролога, верящего в рептилоидов, в ленте будут преобладать поддерживающие его точку зрения материалы - а значит, его шансы познакомиться с качественными альтернативными источниками стремятся к нулю и он будет лишь ещё больше укрепляться в своём мнении. И это может привести к печальным последствиям или неадекватным поступкам.</p>
37 <p>Социальные сети и алгоритмы выдачи борются с таким явлением. Так что бояться полной потери индивидуальности не стоит. Все мы в какой-то степени полагаемся на гаджеты и современные технологии, а рекомендации помогают ориентироваться в потоке информации и находить интересные материалы быстрее.</p>
37 <p>Социальные сети и алгоритмы выдачи борются с таким явлением. Так что бояться полной потери индивидуальности не стоит. Все мы в какой-то степени полагаемся на гаджеты и современные технологии, а рекомендации помогают ориентироваться в потоке информации и находить интересные материалы быстрее.</p>
38 <a><b>Бесплатный курс по Python ➞</b>Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе. Смотреть программу</a>
38 <a><b>Бесплатный курс по Python ➞</b>Мини-курс для новичков и для опытных кодеров. 4 крутых проекта в портфолио, живое общение со спикером. Кликните и узнайте, чему можно научиться на курсе. Смотреть программу</a>