Оформление заказа
Вы ищете решение:
Выберите свой вариант, и мы составим для вас наиболее выгодное
предложение
«Телепатия» нейросети: как персональные рекомендации помогают абонентам и операторам
Американский журнал Time признал 2020 год худшим в истории, но не для крупных стриминговых гигантов: акции Netflix, Amazon и Disney в 2020 побили исторические рекорды и продолжают расти до сих пор.
Оказавшись на самоизоляции, люди стали массово подписываться на видеосервисы, но тут же столкнулись с новой проблемой: что смотреть? Раньше при выборе контента зрители ориентировались на подборки тематических порталов и советы друзей. Однако эти источники не учитывают индивидуальные вкусы каждого пользователя и приводят к парадоксальной ситуации: поиск контента занимает больше времени, чем его просмотр.
Стриминговые сервисы решили эту проблему с помощью персональных рекомендаций контента. В этой статье мы расскажем, как работают эти системы и зачем они нужны.
Основные принципы построения рекомендательных систем
Рекомендательные системы — предлагают зрителю фильмы и сериалы, способные его заинтересовать. Существуют четыре основных подхода к созданию рекомендательных движков:
- Фильтрация, основанная на контенте (content-based filtering)
- Коллаборативная фильтрация (collaborative filtering)
- Фильтрация, основанная на знаниях (knowledge-based filtering)
- Гибридная фильтрация (hybrid filtering)
Расскажем подробнее об особенностях каждой из систем.
Фильтрация, основанная на контенте
Этот метод базируется на поиске общих атрибутов у разного контента. Например, рекомендации к фильмам часто основаны на таких характеристиках как режиссер, актеры, жанр и длительность. Некоторые системы также анализируют описания фильмов для оценки TF-IDF (насколько важно определенное слово в контексте документа).
Цель контент-ориентированного метода — создать профиль каждого предмета для дальнейшего поиска совпадений. Например, после просмотра «Мстителей» вам будут рекомендовать другие фильмы о вселенной Marvel, картины с Робертом Дауни-младшим и работы Джосса Уидона.
У этого подхода есть положительные и отрицательные стороны:
Плюсы |
Минусы |
Рекомендации не зависят от данных других пользователей. |
Формируя группы похожих предметов, система ограничивает рекомендации другого контента. Из-за этого возникает «информационный пузырь». |
Нет проблемы «холодного старта» для новых картин, т. к. их основные атрибуты известны сразу. |
Если информации о продуктах мало, их сложнее группировать, и качество рекомендаций снижается. |
Коллаборативная фильтрация
Коллаборативная фильтрация предлагает рекомендации на основе оценок пользователей со схожими интересами или поведением.
Например, необходимо решить, рекомендовать ли Пользователю A мультсериал «Рик и Морти». Алгоритм «сканирует» базу в поисках зрителей, оценивших этот контент положительно, и строит матрицу предпочтений. В таблице ниже каждая строка означает оценку другого пользователя, а каждый столбец — фильм. Система дает рекомендации, ища сходства между строками в этой таблице.
Алгоритм работы коллаборативного фильтра
В нашем примере у Пользователя A больше общих предпочтений с Пользователем D. Система делает вывод: если Пользователь D высоко оценил сериал «Рик и Морти», то его можно рекомендовать и Пользователю А.
Коллаборативная фильтрация на основе элементов
Этот вид фильтрации основывается не на данных профилей, а на рейтинге картин. Например, если большинство поклонников сериала «Как я встретил вашу маму» также высоко оценили «Теорию большого взрыва», то второй сериал можно рекомендовать всем, кто поставил 5 звезд первому. Используя этот метод мы сравниваем не строки, а столбцы матрицы.
Плюсы и минусы этого подхода:
Плюсы |
Минусы |
Система дает более точные и разнообразные рекомендации. |
Зрительские предпочтения со временем меняются, и некоторые рекомендации могут устареть. |
Чем больше пользователей, тем больше времени требуется для выработки рекомендаций. | |
Уязвимость к умышленному вмешательству фальшивых аккаунтов, ради повышения рейтинга контента. |
Фильтрация, основанная на знаниях
Системы на основе знаний редко применяются в стриминговых сервисах, но некоторые операторы предлагают отдельные их элементы. Чаще всего такие «движки» используют в случаях, когда невозможно собрать достаточно информации, чтобы построить профиль клиента или объекта.
В данном методе применяют фильтры. Для фильма, например, это жанр, год выпуска, актерский состав и режиссер. Такие системы создают консультанты, знающие потребности клиентов и изучившие взаимосвязи между разными атрибутами контента.
Такой тип рекомендаций очень точен: пользователю предлагают именно то, что ему нужно, но и создавать фильтры, основанные на знаниях, сложно и долго.
Гибридная фильтрация
Такие системы объединяют в себе разные подходы, устраняя недостатки отдельных систем. Например, в онлайн-кинотеатре могут порекомендовать похожие картины и фильмы, оцененные пользователями с похожими предпочтениями.
Уровни работы рекомендательных систем
1 уровень — глобальные оценки; продукты, популярные в том или ином регионе у пользователей определенного пола или возрастной группы. Эти оценки достаточно постоянны и незначительно меняются с течением времени. | |
2 уровень — кратковременные тренды; «модные» картины, премьеры, привлекающие зрительское внимание сейчас, но теряющие популярность со временем. |
Для составления оценок используются явные и неявные признаки:
Явные признаки
| Неявные признаки (все, что косвенно намекает на отношение пользователя к картине)
|
Продвинутые операторы комбинируют эти подходы: например, Netflix просит новых пользователей указать любимые картины, а когда те приступают к просмотру, анализирует их взаимодействия.
Как это работает в приставках MAG
Медиаплееры MAG на базе Android TV используют рекомендательную систему от Google. Проиллюстрировать принципы ее работы можно на примере YouTube, работающего по тому же алгоритму. Система использует гибридный подход: оценивает предпочтения отдельного пользователя и вкусы похожей аудитории.
Алгоритм работы рекомендаций YouTube
- Система состоит из двух обучающихся нейронных сетей: «отбор кандидатов» и «ранжирование».
- Первая сеть отвечает за подбор видео по теме. Из миллионов доступных роликов она выбирает наиболее подходящие и передает их второй, ранжирующей контент от наиболее к менее интересному.
- Система учитывает историю просмотров пользователя и контекст (время суток, возраст, пол, язык, страну проживания).
- На этапе ранжирования подборка учитывает показатель ожидаемого времени просмотра: чем дольше другие пользователи смотрят видео, тем выше его шанс попасть в рекомендации.
- При оценке также учитывается CTR (click through rate) — процент пользователей, запустивших ролик, по отношению ко всем, кто увидел его в рекомендациях. Показатель CTR не применяется в отрыве от времени просмотра. Система стремится исключить из выдачи кликбейт. На этом этапе также учитывают активность пользователей: лайки, комментарии, подписки. Видео с низкой вовлеченностью быстро отсекаются.
- При составлении выборки проводят A/B-тестирование: пользователю показывают разные варианты подборок. Если какая-то из них пользуется большим успехом, система учитывает ее в дальнейших рекомендациях. Так она учится и становится эффективней.
Персональные рекомендации помогают операторам заинтересовать аудиторию, увеличить время просмотра контента, и повысить лояльность подписчиков к сервису. Если контент соответствует интересам пользователя, зритель досмотрит до конца, с высокой долей вероятности продлит подписку и порекомендует сервис знакомым. Операторам, создающим контент, системы персональных рекомендаций предоставляют информациею о том, какой хотят смотреть пользователи. Опираясь на эти данные, можно производить фильмы и сериалы, завоевывающие сердца и умы зрителей.
Recommended
Ministra PRO без вложений: как оператору получить новое бесплатное middleware?
Запуск IPTV/OTT-проекта требует от оператора инвестиций в исследование рынка, оборудование, закупку контента, рекламу, пользовательские устройства и множества других вложений. Infomir предлагает выгодное решение, которое позволит операторам сэкономить на оплате одного из важнейших элементов сервиса и получить бесплатное промежуточное ПО для IPTV.
Перспективное IPTV с RDK: удобная платформа для операторов
Телекоммуникационные технологии с каждым годом выходят на новый уровень, предлагая операторам новые эффективные решения и усовершенствования сферы телевидения. В этой статье мы расскажем об одном из них — технологии RDK, выясним, почему сотни операторов выбирают это решение и в чем его ценность.
Ministra PRO: обновления в июле
Время отпусков в самом разгаре и мы сами готовимся к отдыху, поэтому июльский дайджест будет коротким. Мы собрали все основные обновления за этот год, чтобы вы могли ознакомиться с ними, наслаждаясь отдыхом у бассейна.