Отдел продаж

Выберите цель обращения:

сотрудничество или оптовая закупка
розничная покупка

«Телепатия» нейросети: как персональные рекомендации помогают абонентам и операторам

Американский журнал Time признал 2020 год худшим в истории, но не для крупных стриминговых гигантов: акции Netflix, Amazon и Disney в 2020 побили исторические рекорды и продолжают расти до сих пор.

Оказавшись на самоизоляции, люди стали массово подписываться на видеосервисы, но тут же столкнулись с новой проблемой: что смотреть? Раньше при выборе контента зрители ориентировались на подборки тематических порталов и советы друзей. Однако эти источники не учитывают индивидуальные вкусы каждого пользователя и приводят к парадоксальной ситуации: поиск контента занимает больше времени, чем его просмотр.

Стриминговые сервисы решили эту проблему с помощью персональных рекомендаций контента. В этой статье мы расскажем, как работают эти системы и зачем они нужны.

Основные принципы построения рекомендательных систем

Рекомендательные системы — предлагают зрителю фильмы и сериалы, способные его заинтересовать. Существуют четыре основных подхода к созданию рекомендательных движков:

Фильтрация, основанная на контенте (content-based filtering)
Коллаборативная фильтрация (collaborative filtering)

«Телепатия» нейросети: как персональные рекомендации помогают абонентам и операторам

Фильтрация, основанная на знаниях (knowledge-based filtering)
Гибридная фильтрация (hybrid filtering)

«Телепатия» нейросети: как персональные рекомендации помогают абонентам и операторам

Расскажем подробнее об особенностях каждой из систем.

Фильтрация, основанная на контенте

Этот метод базируется на поиске общих атрибутов у разного контента. Например, рекомендации к фильмам часто основаны на таких характеристиках как режиссер, актеры, жанр и длительность. Некоторые системы также анализируют описания фильмов для оценки TF-IDF (насколько важно определенное слово в контексте документа).

Цель контент-ориентированного метода — создать профиль каждого предмета для дальнейшего поиска совпадений. Например, после просмотра «Мстителей» вам будут рекомендовать другие фильмы о вселенной Marvel, картины с Робертом Дауни-младшим и работы Джосса Уидона.

У этого подхода есть положительные и отрицательные стороны:

Плюсы

Минусы

Рекомендации не зависят от данных других пользователей.

Формируя группы похожих предметов, система ограничивает рекомендации другого контента. Из-за этого возникает «информационный пузырь».

Нет проблемы «холодного старта» для новых картин, т. к. их основные атрибуты известны сразу.

Если информации о продуктах мало, их сложнее группировать, и качество рекомендаций снижается.

Коллаборативная фильтрация

Коллаборативная фильтрация предлагает рекомендации на основе оценок пользователей со схожими интересами или поведением.

Например, необходимо решить, рекомендовать ли Пользователю A мультсериал «Рик и Морти». Алгоритм «сканирует» базу в поисках зрителей, оценивших этот контент положительно, и строит матрицу предпочтений. В таблице ниже каждая строка означает оценку другого пользователя, а каждый столбец — фильм. Система дает рекомендации, ища сходства между строками в этой таблице.

Алгоритм работы коллаборативного фильтра

В нашем примере у Пользователя A больше общих предпочтений с Пользователем D. Система делает вывод: если Пользователь D высоко оценил сериал «Рик и Морти», то его можно рекомендовать и Пользователю А.

Коллаборативная фильтрация на основе элементов

Этот вид фильтрации основывается не на данных профилей, а на рейтинге картин. Например, если большинство поклонников сериала «Как я встретил вашу маму» также высоко оценили «Теорию большого взрыва», то второй сериал можно рекомендовать всем, кто поставил 5 звезд первому. Используя этот метод мы сравниваем не строки, а столбцы матрицы.

Плюсы и минусы этого подхода:

Плюсы

Минусы

Система дает более точные и разнообразные рекомендации.

Зрительские предпочтения со временем меняются, и некоторые рекомендации могут устареть.

Чем больше пользователей, тем больше времени требуется для выработки рекомендаций.

Уязвимость к умышленному вмешательству фальшивых аккаунтов, ради повышения рейтинга контента.

Фильтрация, основанная на знаниях

Системы на основе знаний редко применяются в стриминговых сервисах, но некоторые операторы предлагают отдельные их элементы. Чаще всего такие «движки» используют в случаях, когда невозможно собрать достаточно информации, чтобы построить профиль клиента или объекта.

В данном методе применяют фильтры. Для фильма, например, это жанр, год выпуска, актерский состав и режиссер. Такие системы создают консультанты, знающие потребности клиентов и изучившие взаимосвязи между разными атрибутами контента.

Такой тип рекомендаций очень точен: пользователю предлагают именно то, что ему нужно, но и создавать фильтры, основанные на знаниях, сложно и долго.

Гибридная фильтрация

Такие системы объединяют в себе разные подходы, устраняя недостатки отдельных систем. Например, в онлайн-кинотеатре могут порекомендовать похожие картины и фильмы, оцененные пользователями с похожими предпочтениями.

Уровни работы рекомендательных систем

	1 уровень — глобальные оценки; продукты, популярные в том или ином регионе у пользователей определенного пола или возрастной группы. Эти оценки достаточно постоянны и незначительно меняются с течением времени.
2 уровень — кратковременные тренды; «модные» картины, премьеры, привлекающие зрительское внимание сейчас, но теряющие популярность со временем.

Для составления оценок используются явные и неявные признаки:

Явные признаки

заполненные анкеты
рейтинг
сознательные и недвусмысленные оценки контента

Неявные признаки (все, что косвенно намекает на отношение пользователя к картине)

время просмотра
комментарии
перемотки
повторные просмотры

Продвинутые операторы комбинируют эти подходы: например, Netflix просит новых пользователей указать любимые картины, а когда те приступают к просмотру, анализирует их взаимодействия.

Как это работает в приставках MAG

Медиаплееры MAG на базе Android TV используют рекомендательную систему от Google. Проиллюстрировать принципы ее работы можно на примере YouTube, работающего по тому же алгоритму. Система использует гибридный подход: оценивает предпочтения отдельного пользователя и вкусы похожей аудитории.

«Телепатия» нейросети: как персональные рекомендации помогают абонентам и операторам

Алгоритм работы рекомендаций YouTube

Система состоит из двух обучающихся нейронных сетей: «отбор кандидатов» и «ранжирование».
Первая сеть отвечает за подбор видео по теме. Из миллионов доступных роликов она выбирает наиболее подходящие и передает их второй, ранжирующей контент от наиболее к менее интересному.
Система учитывает историю просмотров пользователя и контекст (время суток, возраст, пол, язык, страну проживания).
На этапе ранжирования подборка учитывает показатель ожидаемого времени просмотра: чем дольше другие пользователи смотрят видео, тем выше его шанс попасть в рекомендации.
При оценке также учитывается CTR (click through rate) — процент пользователей, запустивших ролик, по отношению ко всем, кто увидел его в рекомендациях. Показатель CTR не применяется в отрыве от времени просмотра. Система стремится исключить из выдачи кликбейт. На этом этапе также учитывают активность пользователей: лайки, комментарии, подписки. Видео с низкой вовлеченностью быстро отсекаются.
При составлении выборки проводят A/B-тестирование: пользователю показывают разные варианты подборок. Если какая-то из них пользуется большим успехом, система учитывает ее в дальнейших рекомендациях. Так она учится и становится эффективней.

Персональные рекомендации помогают операторам заинтересовать аудиторию, увеличить время просмотра контента, и повысить лояльность подписчиков к сервису. Если контент соответствует интересам пользователя, зритель досмотрит до конца, с высокой долей вероятности продлит подписку и порекомендует сервис знакомым. Операторам, создающим контент, системы персональных рекомендаций предоставляют информациею о том, какой хотят смотреть пользователи. Опираясь на эти данные, можно производить фильмы и сериалы, завоевывающие сердца и умы зрителей.

Оформление заказа

Вы ищете решение:

Какие продукты вас интересуют?

Подтвердите данные

Какие продукты вас интересуют?

Спасибо!
Ваше сообщение отправлено.

Подтвердите данные

Какие продукты вас интересуют?

Спасибо!
Ваше сообщение отправлено.

«Телепатия» нейросети: как персональные рекомендации помогают абонентам и операторам