Инструмент для телеканалов MediaHills – как мы это делаем

После резонансной публикации об аналитике телесмотрения и эффективности промо-кампаний, основанной на данных компании MediaHills, на редакцию и автора материала посыпались уточняющие вопросы и комментарии – от восторженных предложений сотрудничества до откровенного хамства. А поскольку "Кабельщик" был и остается свободной от цензуры площадкой, пишущей обо всем, что интересует нашу аудиторию, мы решили еще раз хайпануть рассказать подробнее о RPD-платформе и инструментарии, который использует эта компания. И кто же сделает это лучше, как не сам автор технологии…

В апреле MediaHills представил рынку сервис по измерению аудитории тематических телеканалов. Полученные данные использовались при написании ряда статей и выступлении на форуме Connected Future. В ответ поступило большое количество вопросов и комментариев от участников рынка. Особенно сильно обсуждалась статья с данными о средней продолжительности просмотров телеканалов постоянными зрителями. Как учитывать HD и SD версии? Какие критерии постоянных телезрителей? Это примеры дискуссионных вопросов, ответы на которые надо искать в диалоге. Я искренне благодарен участникам конструктивного обсуждения, мы учтем их мнения.

Очевидно, что тема измерений волнует отрасль, но многие участники рынка еще не понимают суть наших решений, подходов и ограничений. Попробую внести ясность.

В России вещают более 1000 различных телеканалов, но только ~5% из них имеют ежедневные данные о своей аудитории. Ежемесячные данные доступны менее 20% телеканалов. А как же остальные? Они вынуждены жить практически вслепую, пытаясь различными опросами, показателями собственных сайтов понять своего зрителя. И это в эру расцвета информационных технологий…

Самое удивительное, что данные о просмотре всех телевизионных каналов давно собираются. 18% всех телезрителей платного телевидения в нашей стране уже подключены по новым технологиям, одной из особенностей которых является накопление данных о всех переключениях телеканалов.

Мы решили исправить это очевидное недоразумение, собрав и обработав данные с операторов связи. Результаты исследований сделали доступными для всех телеканалов, которые могут успешно их применять при программировании телеканала. 

Вот примеры основных вопросов, на которые можно получить ответы с помощью измерений:

- Какие передачи пользуются повышенным спросом на канале?

- Переходит ли аудитория на следующую передачу или уходит с канала? В какой последовательности выстроить передачи?

- Какие новостные сюжеты интересны телезрителям, а на каких они уходят?

- Куда уходит зритель? На канал конкурента, вечерние новости или выключает телевизор?

- Есть ли результаты продвижения канала, телепередачи?

- Принял ли постоянный зритель новый контент (телешоу, сериал и т.д.)?

Информацию для ответов на подобные вопросы и дает наша система телеизмерений для абсолютного большинства тематических телеканалов.

Более двух лет нам потребовалось, чтобы настроить сбор данных о переключении телеканалов с 240 операторов связи. Сегодня мы уже измеряем более 450 000 домохозяйств в 160 городах страны. Такой объем измерений позволяет увидеть поведение аудитории даже на совсем небольших телеканалах (сегодня в системе измеряется 489 тематических телеканалов).

Принципы обработки данных

Большой объем данных напрямую не гарантирует точности измерений, необходимо их корректно обрабатывать. Одной из базовых методик, использующихся социологами, является формирование репрезентативной телеизмерительной панели (когда панель составляется из всех типов домохозяйств, представленных пропорционально реальному населению региона).   Нам очень повезло, что в мире существуют рекомендации (GGTAM), которые описывают подходы к формированию такой панели. Мы их активно используем.  

Ключевым вопросом является определение состава измеряемых домохозяйств. Невозможно регулярно анкетировать сотни тысяч, миллионы семей. Поэтому для выявления реального состава домохозяйств мы заимствовали из сети Интернет технологию определения социально-демографических характеристик семьи на основании анализа фактического телесмотрения. В Интернете эта технология используется повсеместно и показывает отличные результаты. Наши исследования подтвердили корректность ее применения и для ТВ. 

Простой пример - мы анализируем объем просмотра “типично женских“ передач ("Дом-2", "Давай поженимся" и т.д.) и делаем вывод о наличии женщины в семье. Аналогично выявляется возраст членов семьи и уровень дохода.

Безусловно, что это вероятностная модель и она обладает погрешностью (по нашим замерам – в пределах 10%). Это обязательно требуется учитывать, анализируя результаты. 

Данные собираемые с операторов связи в каждом городе проецируются на всех жителей. При этом учитываются доли каждого оператора, наличие в его сети телеканалов. Эту информацию мы самостоятельно собираем по каждому городу при проведении установочного исследования и постоянно актуализируем. 

Данные по городам объединяются в регионы, часовые пояса и всю Россию (учитывая вес каждого города).

Практическое применение

Мы разработали и применяем еще один инструмент для измерения аудитории. Использование современных технологий позволяет в режиме реального времени изучить аудиторию даже самых небольших телеканалов. Этот инструмент отлично подходит для решения задач, связанных с программированием. На почасовом графике пример, на котором прекрасно виден различный интерес аудитории к телепередачам (обозначенные полосами).  

Также наши измерения успешно используются для оценки результативности продвижения телеканалов/телепередач. Можно легко выявлять общий рост аудитории и даже появление новых зрителей.

Конечно, данные измерений не дают ответы на все вопросы, это только инструмент, который в опытных руках специалиста (чаще всего программного директора) может принести много пользы.

Сегодня мы активно развиваем проект, опираясь на мнения и пожелания участников рынка. Внимательно прислушиваемся не только к пожеланиям, но и конструктивной критике. И продолжим совершенствовать методологию, увеличивать число измеряемых домохозяйств и городов, создавая качественное решение для участников телевизионного рынка. Пользуясь случаем, прошу операторов связи активно присоединяться к проекту (это совершенно анонимно). Без ваших данных телеканалам очень сложно развиваться.

Отдельно обращаюсь к телеканалам, экспертному сообществу – нам нужна обратная связь, что реально требуется рынку, как еще можно улучшить проект.

 

Памятуя о декларированной демократичности и безцензурности нашего ресурса, мы предложили прокомментировать материал эксперта и старинного друга и автора нашей редакции, заместителя декана факультета коммуникаций, медиа и дизайна Высшей школы экономики Сергея Давыдова:

"Индустриальная статистика – больная тема, поэтому "хайп" вокруг проекта MediaHills не удивляет. Неэфирные телеканалы и другие заинтересованные игроки рынка испытывают аналитический голод, это признанный факт. Эксперты, пишущие для Федерального агентства знаменитые индустриальные отчеты, вынуждены "скрести по амбарам, по сусекам". Коллеги работают с большими данными, использование которых в медиаизмерениях – глобальный тренд. Вопрос о коллективном использовании данных операторов обсуждается в России лет 10, не меньше. И если MediaHills начал этот процесс, это можно только приветствовать.

В свое время французский этнограф К. Леви-Стросс написал книгу "Сырое и вареное" - о том, насколько важную роль сыграли в развитии человечества практики приготовления пищи. С данными примерно то же самое – они могут быть сырыми (это термин, а не метафора) или обработанными. Обработка – наукоемкий и дорогостоящий процесс.

В статье Андрея Бояринова настораживает тот факт, что разговор ведется с позиций исследовательской высокой кухни. Например, речь идет не просто о наборе данных операторов, а о панели. Используются понятия репрезентативности и установочного исследования. Об этом хотелось бы узнать поподробнее. По каким критериям построена панель, как поддерживается ее репрезентативность? Вообще говоря, если панель уже репрезентативная, зачем приглашать к сотрудничеству новых операторов и расширять выборку исследования? И почему бы не опубликовать результаты установочного исследования – как правило, это масштабный исследовательский проект, результаты которого имеют высокую ценность для индустрии.

В статье также упоминается исследовательский стандарт GGTAM, а он, напомню, разработан для узкой и вполне конкретной группы "валютных" измерений телевизионной аудитории. Получается, MediaHills метит в сегмент, занятый "Медиаскопом". А телевизионный проект "Медиаскопа", как известно, очень дорогой. Поэтому второй вопрос к MediaHills – уже не про методическую, а про финансовую обоснованность.

Хорошая новость в том, что вкусно поесть можно не только в мишленовских ресторанах. Не все маркетинговые исследования должны репрезентировать население - есть фокус-группы, тесты, и некоторые другие жанры. Анализ набора больших данных, даже нерепрезентативный, может оказаться полезен. Для оценки возможностей и ограничений необходима более детальная информация. И, конечно, принципиально важна готовность клиентов платить за такого рода аналитику".

Разумеется, мы предложили ответить на этот комментарий автору статьи, тем паче что, по крайней мере, некоторые заданные Сергеем Давыдовым вопросы интересуют и нас.

Андрей Бояринов: 

"Приятно получить оперативную обратную связь от эксперта.
С удовольствием отвечаю на поставленные вопросы.

Безусловно, построение общероссийской измерительной системы требует серьезных финансовых вложений. Применение современных технологий по сбору данных с операторов связи (используемые решения не требуют установки пиплметров), стремительное развитие серверного оборудования и технологий обработки больших данных (необходимо в реальном времени анализировать миллиардов переключений каналов) позволили существенно снизить капитальные затраты.

За 2,5 года в разработку системы, присоединение операторов и проведение установочных исследований частными инвесторами нами было вложено чуть более 60 млн. рублей.

Наши первоначальные попытки просто объединить сырые данные, собранные с операторов связи успехом не увенчались. Различная структура их абонентской базы кардинально влияла на результаты. Единственным решением стало формирование репрезентативной панели. В настоящий момент для ее формирования используются следующие критерии:

- Число взрослых членов домохозяйств,

- Пол, возраст взрослых членов домохозяйств,

- Количество детей,

- Уровень дохода,

- Языковая принадлежность (используется для части регионов),

Контроль панели осуществляется ежемесячно в автоматическом режиме, удаляются отключившиеся домохозяйства (обычно около 1% в месяц), проверяется состав семей. Для поддержания панели рекрутируются новые домохозяйства.

Установочные исследования по новым городам проводятся в момент запуска измерений и обновляются ежегодно. Сейчас проводится очередная волна обновлений, которые закончатся осенью. Результаты будут доступны для участников рынка.

Целью проекта MediaHills в России является охват измерениями большинства городов страны. Сейчас мы получаем данные всего по 160 городам из 1113 расположенных в РФ. Т.е. почти в тысяче городов автоматические исследования не проводятся, а в этих городах вещают региональные телеканалы, осуществляются местные вставки в эфир федеральных телеканалов. Для того чтобы обеспечить реальными данными всех участников рынка, требуется существенно увеличить выборку. Кроме того, повышение числа измеряемых домохозяйств позволяет предоставлять данные с повышенной детализацией для региональных и небольших тематических телеканалов. Для этих целей мы и приглашаем операторов к сотрудничеству".

 

P.S. Редакция благодарит участников дискусси и, конечно, обязательно вернется к темам телесмотрения, RPD-исследований и опыта различных исследовательских компаний в этой области. В настоящий момент уже готовится к печати большой материал Mediascope о телесмотрении в первом квартале 2018 года.