Особенности работы и внедрения рекомендательной системы
Необходимость внедрения рекомендательных систем в контентные сервисы сегодня, пожалуй, не отрицает никто. Это вызвано прежде всего огромным объемом контента, которые предлагают IPTV и ОТТ сервисы.
В частности, в услуге Wifire TV абоненты получают доступ к более чем 180 телеканалам с огромным числом передач и к нескольким тысячам единиц фильмового контента, предоставляемого в партнерстве с онлайн-кинотеатрами, такими как Amediateka, Megogo и ivi. Чтобы помочь абоненту сконцентрировать внимание на контенте, который будет интересен именно ему, и мы в NetByNet, и многие другие компании внедряют рекомендательные системы, работающие на базе той или иной математической модели.
Взять, к примеру, систему Cinematch, которую использует компания Netflix. В ее основу заложен принцип коллаборативной фильтрации, который подразумевает, что пользователи явно или неявно выставляют оценки просмотренным фильмам. Рекомендации здесь формируются с учетом как своих оценок пользователя, так и оценок других зрителей — для этого система подбирает пользователей со схожими предпочтениями, чьи оценки близки к их собственным. На основании мнения этого круга людей зрителю автоматически выдается рекомендация: посмотреть тот или иной фильм.
Чуть позже Netflix разыгрывал Netflix Prize для компаний, которые смогут улучшить показатели рекомендаций Cinematch на 10%. Промежуточные номинации вручались каждый год до тех пор, пока первый приз не достался компании BellKor’s Pragmatic Chaos, группе ученых из AT&T, которым удалось добиться улучшения точности рекомендаций на 10,06%. В целом именно благодаря Netflix многие контентные компании поверили в силу рекомендаций.
Для максимально корректной работы рекомендательной системы, безусловно, основополагающую роль играют накопленные и собираемые данные. Чем больше данных накапливается о профиле потребления того или иного абонента, тем точнее рекомендации ему выдаются.
Что касается лично нашего опыта, мы решили обратиться к рекомендательной системе от компании E-Contenta. Мы запустили ее в эксплуатацию и отладку в сервисе WiFire TV в декабре 2016 года, и к настоящему времени она является гибридной. Работает она по следующему принципу: если система знает о пользователе или о контенте достаточно много, превалируют алгоритмы коллаборативной фильтрации, если же контент новый либо собрано недостаточно информации о взаимодействии с ним пользователей, применяются контентные алгоритмы, оценивающие схожесть контента на основе имеющихся метаданных.
В случае с сервисом WifireTV подобный гибридный подход оказался необходимым, поскольку на наших приставках абоненты постоянно имеют доступ к большому объему разнообразного фильмового контента. Более сложной была задача, связанная с рекомендацией телевизионного контента: мы хотели помочь своим абонентам разобраться в огромном потоке одновременно транслируемого телевизионного контента, выбор которого становится еще больше благодаря нашему сервису отложенного просмотра. Вместо бесконечного циклического переключения каналов рекомендательный сервис поможет найти интересную передачу уже за 2–3 нажатия кнопки. Для этого рекомендательной системе необходимо следить за выпуском новых серий передач и помогать абонентам не пропускать любимые шоу, предсказывать интерес зрителей к нерегулярным передачам и трансляциям фильмов, доверяя машинным алгоритмам работу ответственного редактора.
Работа с потоковым телевидением имеет свою специфику. К примеру, часто одни и те же популярные телешоу идут по разным каналам. В этом случае рекомендательной системе приходится понимать дублирование информации и выбирать рекомендацию на основе предпочтений абонента относительно каналов, времени начала передачи и т.п. Подобное дублирование информации также возникает при наличии у абонента подписки на SD и HD версии каналов.
Удобство для абонентов — не единственная причина внедрения решения от E-Contenta. Мы хотим донести до наших абонентов ценность подписки на премиальные пакеты каналов, подмешивая из них релевантные пользователю передачи в рекомендации. Также мы хотим показать, что приобретать и смотреть легальный видеоконтент — это нормально, удобно и просто. Рекомендательная система подскажет абоненту интересные фильмы, даже если они уже давно вышли из разряда новинок: таким образом обширный видеокаталог перестает быть пыльной библиотекой, а становится интерактивной витриной, гибко подстраивающейся под вкусы и настроения абонентов.
По сравнению со многими другими видеосервисами, мы в Wifire TV имеем преимущество в виде владения уникальными данными, которые "оживляем" при помощи алгоритмов data science. Так, рекомендательная система E-Contenta, чтобы точнее угадать, какую картину вам захочется посмотреть сегодня вечером, анализирует не только вашу историю просмотра фильмов, но и гораздо более богатую историю просмотра IPTV, понимая при этом, когда вы действительно смотрите телевизор, а когда уснули рядом с ним на диване.
Непрерывно работающая обратная связь от абонентов, взаимодействующих с рекомендациями, наполняет базу прецедентов алгоритмов машинного обучения и позволяет рекомендациям изменяться в зависимости от неявных признаков смены предпочтений абонентов, таких как время года, приближение праздников или изменение состава семьи.