Дмитрий Колесов: "MediaHills 2.0 – мейк тиви грейт эгейн. По уму"

Дмитрий Колесов не раз становился героем публикаций Кабельщика, а еще чаще автором больших аналитических материалов о состоянии рынка, обо всех аспектах медиабизнеса – от телесмотрения до экосистем. Недавний переход Дмитрия в компанию MediaHills, конечно, не мог нас не порадовать – это значит, что мы еще чаще сможем публиковать материалы об аудитории и ее поведении. Первый же "выход в свет" Дмитрия Колесова подтвердил наши предположения: его выступление на Конгрессе НАТ наши коллеги-журналисты буквально растащили на цитаты. Поэтому мы решили предложить ему пересказать этот доклад для наших читателей – с дополнениями, уточнениями, и деталями, которые сложно уместить в получасовой публичный доклад.

Я.Бельская: В ноябре Вы выступили на конгрессе НАТ, представили данные, которые разошлись, размножились через СМИ и соцсети. Что вы такое новое представляли – можно ли подробнее для аудитории Кабельщика?

Д. Колесов: Моя задача на ближайшую перспективу – поменять представление индустрии о нашей компании, ее работе. Сегодня подавляющее большинства людей на рынке думает о MediaHills, что это только сбор данных с IPTV-приставок. Есть какие-то цифры по телеаудитории (в основном по городам) и есть пользователи, которые могут их анализировать через web-интерфейс. Но, во-первых, наш проект – это обработанные данные о телеаудитории от операторов, которые будут со следующего года обогащены демографией. Во-вторых, мы собираем не только информацию по телеаудитории. MediaHills выполняет много проектов на стыке разных медиа. И собираем на самом деле мы BigData, и, самое главное, научились их правильно обрабатывать.

Компания MediaHills основана 6 лет назад, и на сегодня собирает данные с более чем 250 операторов. В 2020 году нашим основным акционером стал Mediascope, и это очень важное событие. Теперь наши возможности в исследованиях расширились.

Красивая цифра – 8,1 миллиона домохозяйств в России, с данными которых работают наши клиенты. Цифра постоянно растет, мы расширяем список операторов (сейчас их более 250), которые к нам подключаются. На сегодня прежде всего используется IPTV, потому что эта технология платного ТВ имеет обратный канал связи. Благодаря ему можно собирать информацию о просмотре каналов абонентами. Мы проводим верификацию этих данных и их предварительную обработку. Одна из важных задач – это отсеять ситуации, когда телевизор выключен, а приставка включена. Такое "смотрение" сильно влияет на адекватность итогового результата.

Я. Бельская: Как вы верифицируете данные, и как работает данная отсечка?

Д. Колесов: Все это происходит в ежедневном режиме. Есть несколько алгоритмов, которые позволяют это делать. Один из них – связь приставки и телевизора через HDMI. Выключенный телевизор не передает соответствующий сигнал. Другой – сравнение полученных данных с приставки с накопленной статистикой о ее смотрении за 3 месяца. Есть и другие способы.

  

На сегодня у нас существуют данные по 83 субъектам федерации. Пока нет контактов с операторами в Чечне и на Чукотке, но это вопрос времени. И мы не просто собираем операторские данные, а на основании их моделируем общее телесмотрение в городе или субъекте федерации при помощи дополнительной обработки.

Я. Бельская: Как вы договариваетесь с операторами?

Д. Колесов: Мы стараемся искать взаимовыгодные варианты сотрудничества. Чаще всего очень важной для них является информация о демографии собственных зрителей. Вторая ценность – это обработанные данные. Например, на основании собираемой от абонентов информации мы создаем рекомендательные системы для видеосервисов операторов. Одним словом, у нас есть, чем заинтересовать оператора.

Я. Бельская: Каким образом те данные, которые вы получаете, могут быть использованы в рекомендательных системах?

Д. Колесов: Собирается аудитория различного контента и анализируется ее поведение перед телевизором. Статистика накапливается по абонентской базе конкретного оператора. Соответственно, на основании этих данных можно предлагать конкретному пользователю «его» программу или канал в реальном времени.

Я. Бельская: А теперь вы сможете еще и наложить на все это демографию?

Д. Колесов: Конечно! Со следующего года наши клиенты смогут анализировать смотрение по целевым аудиториям. Как это работает? В основе метода нейронная сеть – постоянно работающая программа, которая на входе алгоритма распознавания использует обучающие выборки. На выходе мы получаем вероятностное распределение, что в данный момент в конкретном домохозяйстве с такой-то вероятностью находится мужчина, женщина или ребенок. Такого-то возраста. Да, это вероятностная модель. Но по всей генеральной совокупности или по конкретному региону мы получаем достаточно точные оценки аудитории.

Я. Бельская: Так работает BigData?

Д. Колесов: Конечно, это методика обработки больших данных. У нас в исследовании более 240 городов. Среднее количество домохозяйств в них – 18 тысяч. Есть такие города как Санкт-Петербург (где больше 170 тысяч абонентов) или Москва (более 150 тысяч). А минимум – это 1000 домохозяйств-участников исследования в городе. Так вот, из этих 240+ городов в текущую поставку данных включены не все (нужен запрос индустрии). Совсем недавно история добавления городов была в Ленинградской области.

Клиент сказал: "Мне нужны все населенные пункты области, по которым вы можете дать информацию". После этого мы проводим установочное исследование в новых городах, верификацию данных и настройку интерфейса нашего софта. И примерно через месяц начинается регулярная поставка.

Я. Бельская: Вы уже сказали про более чем 250 операторов связи – это все IPTV-провайдеры? Или вы уже умеете работать с DVB-C– цифровыми кабельными операторами, спутниковыми?

Д. Колесов: Самое главное – чтобы был обратный канал связи на приставке. Зачастую DVB-C приставки этого канала не имеют, и, соответственно, мы не можем получать с них информацию. Скоро, я надеюсь, мы договоримся с такими игроками, как "Триколор" или "НТВ Плюс", у которых есть ОТТ приставки. У этих приборов обратный канал связи есть по определению.

Я. Бельская: Как работает система сбора информации?

Д. Колесов: Абонент при просмотре нажимает кнопку на пульте приставки. И вся информация о просмотре отправляется на сервера оператора. Какой канал, сколько времени, какую передачу смотрели. Именно с операторами мы и договариваемся о предоставлении данных о просмотре. В результате получаются рейтинги и доли каналов, временных интервалов. Для сбора аудитории конкретных программ мы используем программы передач. Но этого достаточно, когда на канале нет прямого эфира. И для подавляющего большинства наших клиентов это абсолютно рабочий инструмент, который позволяет делать подробный анализ аудитории контента. С учетом выходов утром, вечером и повторов.

При этом, возвращаясь к самому началу, мы стараемся выстроить с операторами прямые отношения, максимально полезные для всех.

Я. Бельская: А как же человеческий фактор и предоставление чувствительных данных?

Д. Колесов: Все данные обезличены. Более того, мы не имеем возможности разделить базы операторов, поэтому честно говорим клиентам: "Вот такое количество городов, где работают операторы. Общее количество абонентов в них такое".

Я. Бельская: Какие есть важные выводы на основе ваших данных?

Д. Колесов: Факт, что региональное телевидение не умерло. И это в условиях, когда у абонента на приставке более 100 каналов. Очень востребованы локальные телекомпании с вещанием на местных языках. В отдельных городах или субъектах федерации (Татарстан, Башкортостан, Якутия и другие) большая доля от общего телесмотрения приходится на таких вещателей. При этом центральная Россия близка среднероссийским 1,3% доли аудитории региональных каналов.

Я. Бельская: Может быть, это потому, что в центре России нет потребности говорить на другом языке, они себя чувствуют Московской областью?

Д. Колесов: В ЦФО и ЮФО исторически выше смотрение федеральных каналов – это еще один научный факт.

 


 

Я. Бельская: А что нового могут использовать телеканалы?

Д. Колесов: Есть одна новация телевидения, которая уже работает. Очень много говорили про то, как запустить адресную рекламу на ТВ. Как выбирать конкретные адреса домохозяйств, которым нужно показывать то, что им интересно? Мы нашли решение, т.к. про каждую приставку знаем, что и когда на ней смотрят. Используя нейросети и вероятностные модели, получаем ответ на вопрос – какой именно зритель именно сейчас смотрит ТВ. Наша модель двухступенчатая. На первом этапе на основе смотрения программ-маркеров восстанавливается состав домохозяйства (мужчины, женщины, дети). А на втором – аудитория передач в реальном времени.

Платформы размещения адресной рекламы получают запрос от рекламных агентств на такое размещение. За таргетингом они приходят к нам. И получают анализ: в каких домохозяйствах чаще смотрят передачи о животных (если мы говорим про корма) или в каких домохозяйствах смотрят гонки (для рекламы машин), и так далее. То есть, реклама в зависимости от целевой аудитории. Важная оговорка: дополнительно мы можем предоставить не просто демографию, а именно потребительские характеристики этих домохозяйств, собранные на основе анализа их поведения в интернете.

  

Отвечая на запросы рекламного рынка, мы уже провели анализ более 1500 таких групп потребления с помощью наших партнеров-операторов связи. А еще при желании заказчика мы можем предоставить анализ аудитории даже в конкретном районе населенного пункта. Лишь бы хватило абонентских устройств, чтобы итоговые данные были устойчивы.

  

Я. Бельская: Т.е. демография интересна в связке с потребительским поведением?

Д. Колесов: Именно. Идея в совмещении разных данных друг с другом. Задача MediaHills – профилирование домохозяйств (по данным от операторов), определение, кому именно нужно показывать рекламу в виде выплывающей плашки поверх изображения во время программы. И затем формирование отчетности о показах после проведения кампании.

Я. Бельская: Всплывающая плашка, которую можно активировать с пульта?

Д. Колесов: Гениально! Прямо во время рекламы с пульта ДУ зритель переходит на сайт, созданный, например, продавцом автомобилей, и записывается на тест-драйв. Технологии интернета на ТВ.

Я. Бельская: А что про измерение аудитории новостей?

Д. Колесов: Это новый проект для наших клиентов по предоставлению информации на основе данных операторов. Клиентами могут быть как отдельные телеканалы, так и медиахолдинги, куда эти телеканалы входят У нас есть информация о пользовании интернетом от более 13 миллионов домохозяйств, которые обслуживают провайдеры. Для анализа аудитории новостей мы можем одновременно измерять количество зрителей на телеканале-заказчике и количество пользователей, которые прочитали новость на сайтах этого вещателя. Технология основана на использовании пикселя. Это метка, которую пользователь получает при заходе на сайт, и в дальнейшем в логах операторов ее можно отследить и сопоставить с ID домохозяйства, где измеряется телесмотрение по данным от оператора. Пиксель ставится на каждую новость на сайте телеканала, параллельно мы разделяем новостной блок на сюжеты. Сюжеты и статьи объединяем по общему тексту при помощи искусственного интеллекта, а затем сопоставляем аудиторию.

В результате клиент получает данные о том, сколько людей ходило на сайт телеканала, а сколько смотрело конкретные новости по на данном канале по телевизору, и какая была общая аудитория. Может понять, из каких регионов люди заходили на сайт телеканала, с каких устройств. На сегодня география тестовых установок пикселей – Сургут, Челябинск, Самара, Ленинградская область, Воронеж и еще более 40 регионов. Появляется больше понимания о том, что сейчас представляет общая аудитория новостей, которые новостная служба ТВ произвела и выдала в эфир или разместила на сайте. В качестве первого очевидного вывода – вещатели должны делать обязательную оптимизацию новостей на на своем сайте под мобильные устройства. Парк устройств в разных регионах разный, поэтому у всех решение этой задачи будет отличаться.

В качестве краткого итога моего рассказа. MediaHills – это анализ данных операторов о телесмотрении 8,1 миллиона домохозяйств, поведение 13 миллионов пользователей в интернете по данным от провайдеров, и, конечно, BigData, с соответствующими задачами по обработке, верификации и анализу этой информации.

Я. Бельская: Исчерпывающе, спасибо, Дмитрий! Вы ответили даже на те вопросы, которые я не успела задать.

Д. Колесов: Вот и хорошо!