Рекомендательные системы в online-видео

Егор Данилов 03.03.2016
Развитие online-видео вывело на новый уровень тренд фрагментации телевизионной аудитории. Персонализация видеопотребления и повышение релевантности контента — один из основных запросов аудитории, который, очевидно, не может игнорироваться ни одной медиакомпанией, претендующей на успех. Именно по этой причине ivi.ru не первый год разрабатывает и усовершенствует систему рекомендации контента для пользователей.
 
Фрагментация телеаудитории в России набирала свои обороты в первой половине двухтысячных годов на фоне роста количества доступных телеканалов. Так, например, в 2000 году по данным АЦ Vi зрителю в России были доступны в среднем 6,6 телеканалов, в 2005 10,9, а в 2008 уже 22,3. На сегодняшний день в каталоге "Кабельщика" значится более 400 телеканалов. Рост количества телеканалов приводил к тому, что аудитория стала всё больше распределяться между разными кнопками пульта. Отражением этого процесса, например, является снижение суммарной доли крупнейших телеканалов. В 2005 году на долю Первого, России и НТВ суммарно приходилось 55% аудитории. К концу 2015 года три самых популярных кнопки собирали около 38% аудитории, а совокупная доля неэфирных каналов выше любого отдельно взятого эфирного канала. Важной деталью является то, что фрагментация телевизионной аудитории происходила на базе групп интересов (здоровье, единоборства, мода, рыбалка и т.д.).
 
Набирающее популярность видео в сети унаследовало телевизионные тренды, но они сопровождаются рядом гораздо более сложных, на мой взгляд, задач. С тех пор, как зритель получил возможность полностью самостоятельно формировать своё видеопотребление, распределение на группы интересов, по сути, стало неактуальным. Пользователь хочет видеть только интересующий его в данный момент контент. В Интернете всегда prime-time. Это является одной из причин, по которой видеосервисы стали задумываться о системе рекомендаций. Десятки миллионов пользователей, ежемесячно заходящих к нам на сайт (в приложения мобильных устройств или Smart TV) должны получать персонализированное предложение.
 
Есть и другие причины. На ранних этапах развития видео в сети видеосервисы во многом выступали в качестве видеопроката или dvd-магазина. Аудитория приходила посмотреть что-то конкретное, без привязки к программной политике каналов и телевизионной сетки. Отсюда и название категории — VOD (video on demand). Но по мере того, как всё больше пользователей стали рассматривать видеосервисы как способ организации своего досуга, всё больше пользователей стало приходить к нам не в поисках конкретного контента, а "посмотреть что-нибудь". Выбор "что посмотреть", когда не знаешь, что именно — сложная задача для пользователя. Мы много анализировали поведение таких пользователей на нашей площадке и нам стало очевидно, что мы должны помогать пользователю выбрать контент для просмотра (безусловно, не забывая о персонализации). 
 
Огромное контентное предложение — очевидное достоинство видеосервисов. Но оно же становится помехой для "счастья пользователя". В настоящий момент на ivi.ru пользователю доступно такое количество контента, которое позволило бы обеспечить круглосуточное вещание телеканала на 3,5 года. Но окно взаимодействия и поиска для пользователя ограничивается экраном монитора (а то и вовсе экраном мобильного телефона). По этой причине, видеосервис должен сужать диапазон поиска контента или другими словами пермодерировать, что, отчасти, делает телевидение. Система телевизионных каналов, во-первых, отбирает для пользователя контент, во-вторых, группирует его по каналам (пользователь примерно понимает, что он получит, зайдя на тот или иной канал). Простейшим решением такого уровня в Интернете является вывод блока с самым популярным контентом, что и делает большинство площадок для новых пользователей (для нас новый пользователь означает отсутствие информации о его предпочтениях и просмотрах на нашем сайте). Такой механизм неидеален, поскольку сводит огромную библиотеку к линейке раскрученного контента. Видеоповестка аудитории в среднем формируется двумя основными каналами: афиши кинопроката и телеэфир. Список популярного в большинстве случаев — это киноновинки, рейтинговый телеконтент и классика. Но это далеко не всё интересное, что есть в мире кино и сериалов. По этой причине мы стремимся существенно расширить список предлагаемого контента, одновременно, сузив его для упрощения поиска. В этом и заключается успех рекомендательной системы.
 
Изначально мы попробовали использовать 2 сторонние рекомендательные системы. Одну российскую, вторую — от компании, которая вошла в Топ-20 соревнования Netflix Prize (конкурс, который проводил крупнейший VoD сервис Netflix по улучшению своего рекомендательного алгоритма). Ни тот ни другой не показал удовлетворительных результатов как по качеству рекомендаций, так и по гибкости работы. Количество данных, которыми обладает ivi о смотрении пользователей, огромно. Например, до какой минуты пользователь досмотрел фильм. Эта информация может быть ценной для понимания, понравился фильм или нет. При этом нужно отличать брошенный просмотр от просмотра в несколько заходов, тем более что начаться он может на одном устройстве, а закончиться на другом.
 
В результате мы разработали свой собственный рекомендательный алгоритм. Он учитывает как действия пользователя (просмотры, оценки, покупки и тд), так и метаданные, которыми описан контент. Каждый фильм, сериал и мультфильм на ivi описывается не просто стандартным набором метаданных (съемочная команда, год выхода, жанры), но и очень подробно размечается тегами. Про что этот фильм, какое у него настроение, для какой аудитории предназначен, какие у него особенные качества, где происходит действие фильма и многое, много другое. Таких тегов сотни. Каждому проставленному тегу еще присваивается вес, насколько он характерен для данного контента. Например, для мультфильма "Труп невесты" тег "мрачный" будет иметь вес "1″, минимальный. А, например, у фильма "Груз 200″ тег "мрачный" будет иметь вес "5″.
 
Рекомендательный сервис ivi используется для рекомендаций 2 типов: content to content и content to user. Первый тип — это рекомендации на странице фильма, что еще посмотреть. Второй тип — персональные рекомендации контента для каждого пользователя. На данный момент рекомендации content to content внедрены на ivi.ru на всех платформах. А content to user — на сайте ivi.ru и в приложениях для iOS и нового Apple TV. В ближайшее время персонализированную выдачу получат приложения для Smart TV и Android.
 
Одна из распространенных ошибок, которая допускается при интеграции на сервис — это просто добавление одного блока под названием "Личные рекомендации". Пользователь, глядя на них, не понимает, почему ему рекомендуются такие фильмы. Эффективность такого блока крайне низкая:
 
 
На ivi.ru благодаря подробно размеченному контенту мы можем собирать автоматические "полки". Например, если система видит, что пользователю нравятся фильмы про любовь или комедийные боевики, соответствующие подборки появятся при следующих заходах на сервис. Таким образом, рекомендательным становится весь сервис. На сайте рекомендации генерируют уже более 60% всех просмотров. На iOS — более 50%. При этом мы не останавливаемся на достигнутом — на наших сервисах практически непрерывно идут A/B тесты новых алгоритмов рекомендаций. Буквально за год мы улучшили показатели рекомендательного сервиса более чем в 2 раза.
 
Имея возможность одновременно строить десятки миллионов телеканалов (по числу заходящих пользователей), мы просто не можем смириться с текущей моделью потребления и популяризации контента. ivi стремится расширить мир видеоконтента пользователя, смешав его интересы, актуальность контента и контентную экспертизу видеосервиса. В нашем понимании идеалом видеосервиса с качественной рекомендательной системой является продукт, где есть всего одна кнопка. Нажав на эту кнопку, любой пользователь гарантированно получит интересующий его контент и будет возвращаться к нам за таким контентом снова и снова.

Об авторе

Егор Данилов
директор по продукту ivi.ru