Оформление заказа
Вы ищете решение:
Выберите свой вариант, и мы составим для вас наиболее выгодное
предложение
«Телепатія» нейромережі: як персональні рекомендації допомагають абонентам і операторам
Американський журнал Time визнав 2020 рік найгіршим в історії, але не для стримінгових гігантів: акції Netflix, Amazon і Disney у 2020-му побили історичні рекорди і продовжують зростати.
Потрапивши в самоізоляцію, люди почали масово використовувати відеосервіси, але в них одразу виникла нова проблема: що дивитися? Раніше у виборі контенту глядачі орієнтувалися на добірки тематичних порталів і поради друзів. Проте ці джерела не враховують індивідуальних смаків кожного користувача й спричинюють парадоксальну ситуацію: пошук контенту забирає більше часу, ніж сам перегляд.
Стримінгові сервіси розв’язали цю проблему за допомогою персональних рекомендацій контенту. У цій статті ми розповімо, як працюють такі системи й навіщо вони потрібні.
Головні принципи створення рекомендаційних систем
Рекомендаційні системи пропонують глядачу фільми та серіали, які здатні його зацікавити. Є чотири основних підходи до створення рекомендаційних «движків»:
- Фільтрація, що ґрунтується на контенті
- Колаборативна фільтрація
- Фільтрація, що базується на знаннях
- Гібридна фільтрація
Розповімо докладніше про особливості кожної системи.
Фільтрація, що ґрунтується на контенті
Цей метод базується на пошуку спільних атрибутів у різного контенту. Наприклад, рекомендації до фільмів часто ґрунтуються на таких характеристиках, як режисер, актори, жанр і тривалість. Деякі системи також аналізують описи фільмів для оцінювання TF-IDF (наскільки важливе певне слово в контексті документа).
Мета контент-орієнтованого методу — створити профіль кожного предмета для подальшого пошуку збігів. Приміром, після перегляду «Месників» вам рекомендуватимуть інші фільми про всесвіт Marvel, стрічки з Робертом Дауні-молодшим і роботи Джосса Відона.
Такий підхід має позитивні й негативні сторони:
Переваги |
Недоліки |
Рекомендації не залежать від даних інших користувачів. |
Формуючи групи подібних предметів, система обмежує рекомендації іншого контенту. Через це виникає «інформаційна бульбашка». |
Немає проблеми «холодного старту» для нових фільмів, бо їхні основні атрибути відомі одразу. |
Якщо інформації про продукти мало, їх складніше групувати, а отже, якість рекомендацій знижується. |
Колаборативна фільтрація
Колаборативна фільтрація пропонує рекомендації на базі оцінок користувачів з подібними інтересами чи поведінкою.
Наприклад, треба вирішити, чи рекомендувати Користувачеві A мультсеріал «Рік і Морті». Алгоритм «сканує» базу в пошуку глядачів, що оцінили цей контент позитивно, і будує матрицю схвалень. В таблиці нижче кожен рядок містить оцінку іншого користувача, а кожна колонка — фільм. Система надає рекомендації, відшукуючи подібність між рядками в цій таблиці.
Алгоритм роботи колаборативного фільтра
У нашому прикладі в Користувача A більше спільних позитивних оцінок з Користувачем D. Система доходить висновку: якщо Користувач D високо оцінив серіал «Рік і Морті», то його можна рекомендувати також Користувачеві А.
Колаборативна фільтрація на основі елементів
Цей різновид фільтрації базується не на даних профілів, а на рейтингу фільмів. Наприклад, якщо більшість прихильників серіалу «Як я зустрів вашу маму» також високо оцінили «Теорію великого вибуху», то другий серіал можна рекомендувати всім, хто поставив 5 зірочок першому. Застосовуючи цей метод, ми порівнюємо не рядки, а колонки матриці.
Переваги й недоліки цього підходу:
Переваги |
Недоліки |
Система дає точніші й різноманітніші рекомендації. |
Глядацькі смаки з часом змінюються, і деякі рекомендації можуть застаріти. |
Що більше користувачів, то більше часу потребує вироблення рекомендацій. | |
Вразливість до умисного втручання фальшивих акаунтів заради підвищення рейтингу контенту. |
Фільтрація, що ґрунтується на знаннях
Системи на базі знань мало застосовуються в стримінгових сервісах, але деякі оператори пропонують окремі їхні елементи. Найчастіше такі «движки» використовують у випадках, коли неможливо зібрати достатньо інформації, щоб побудувати профіль клієнта чи об’єкта.
У цьому методі застосовують фільтри. Для фільму, наприклад, це є жанр, рік випуску, акторський склад і режисер. Такі системи створюють консультанти, що обізнані в потребах клієнтів і вивчили взаємозв’язки між різними атрибутами контенту.
Такий тип рекомендацій дуже точний: користувачеві пропонують саме те, що йому потрібно, але створювати фільтри, які базуються на знаннях, складно й довго.
Гібридна фільтрація
Такі системи поєднують у собі різні підходи, усуваючи недоліки окремих систем. До прикладу, в онлайн-кінотеатрі можуть порекомендувати подібні стрічки та фільми, що вподобали користувачі зі схожими смаками.
Рівні роботи рекомендаційних систем
1 рівень — глобальні оцінки; продукти, популярні в тому чи іншому регіоні серед користувачів певної статі чи вікової групи. Такі оцінки досить сталі й незначно змінюються з плином часу. | |
2 рівень — короткострокові тренди; «модні» фільми, прем’єри, що привертають увагу глядачів тепер, проте згодом втрачають популярність. |
Для складання оцінок використовують явні та неявні ознаки:
Явні ознаки
| Неявні ознаки (все, що опосередковано натякає на ставлення користувача до фільму)
|
Просунуті оператори комбінують ці підходи: наприклад, Netflix просить нових користувачів вказувати улюблені кінофільми, а коли ті розпочинають перегляд, аналізує їхні взаємодії.
Як це працює в приставках MAG
Медіаплеєри MAG на основі Android TV застосовують рекомендаційну систему від Google. Проілюструвати принципи її роботи можна на прикладі YouTube, що працює за тим самим алгоритмом. Система застосовує гібридний підхід: оцінює вподобання окремого користувача та смаки схожої аудиторії.
Алгоритм роботи рекомендацій YouTube
- Система складається з двох нейронних мереж, що навчаються: «відбір кандидатів» і «ранжування».
- Перша мережа відповідає за підбір відео за темою. З мільйонів доступних роликів вона вибирає найбільш відповідні й передає їх другій, що ранжує контент від найбільш до найменш цікавого.
- Система враховує історію переглядів користувача й контекст (час доби, вік, стать, мову, країну проживання).
- На етапі ранжування добірка враховує показник сподіваного часу перегляду: що довше інші користувачі дивляться відео, то вищим буде його шанс потрапити до рекомендацій.
- Під час оцінювання також враховується CTR (click through rate) — відсоток користувачів, що запустили ролик, відносно тих, хто побачив його в рекомендаціях. Показник CTR не застосовується у відриві від часу перегляду. Система прагне вилучити з видачі клікбейт. На цьому етапі також враховують активність користувачів: вподобання, коментарі, підписки. Відео з низькою залученістю швидко відсікаються.
- Під час складання вибірки проводять A/B-тестування: користувачеві показують різні варіанти добірок. Якщо якась із них має більший успіх, система враховує її в подальших рекомендаціях. Таким чином вона навчається та стає ефективнішою.
Персональні рекомендації допомагають операторам зацікавити аудиторію, збільшити час перегляду контенту і підвищити лояльність передплатників до сервісу. Якщо контент відповідає інтересам користувача, глядач додивиться до кінця, з великим відсотком імовірності подовжить передплату та порекомендує сервіс знайомим. Операторам, що створюють контент, системи персональних рекомендацій надають інформацію про те, який бажають переглядати користувачі. Спираючись на ці дані, можна створювати фільми та серіали, що полонять серця й розум глядачів.
Recommended
Ministra PRO без вкладень: як оператору отримати нове безплатне middleware?
Запуск IPTV/OTT-проєкту вимагає від оператора інвестицій у дослідження ринку, обладнання, закупівлю контенту, рекламу, пристрої та безліч інших вкладень. Infomir пропонує вигідне вирішення, яке дасть операторам змогу заощадити на оплаті одного з найважливіших елементів сервісу та отримати безплатне проміжне програмне забезпечення для IPTV.
Перспективне IPTV з RDK: зручна платформа для операторів
Телекомунікаційні технології з кожним роком виходять на новий рівень, пропонуючи операторам нові ефективні вирішення та вдосконалення телебачення. У цій статті ми розповімо про одне з них — технологію RDK, з'ясуємо, чому сотні операторів обирають це вирішення і в чому його цінність.
Ministra PRO: оновлення в липні
Час відпусток у самісінькому розпалі, та ми й самі готуємося до відпочинку, тому липневий дайджест буде коротким. Ми зібрали всі основні оновлення за цей рік, щоб ви могли ознайомитися з ними, насолоджуючись відпочинком біля басейну.