Гібридні вимірювання та різні панелі
Якщо ви ще не прочитали попередній матеріал, в якому я обіцяв описати, як працює вимірювання в Данії, то ви правильно зробили, бо його буде набагато легше читати після цього. Адже читачі звернули увагу — не вперше, правда, — на те, що «Детектор медіа» — це ресурс, який читають не лише «фанати» методологічних тонкощів панельних вимірювань, а мої матеріали часто вимагають у читачів якогось розуміння телевізійних вимірювань. Натомість читає наші матеріали ширша аудиторія, на що вказує кількість переглядів. Та й навіть ті, хто, здавалося б, щодня стикається та використовує дані піплметричного дослідження, можуть забувати такі прості речі, як, наприклад те, що показники перегляду зважуються на три типи прийому (цифровий ефір, кабель та все інше).
Тому в цьому матеріалі я спробую розповісти, що зараз відбувається з вимірюваннями в типовій країні, Данії, яка є певним лідером у трансформації вимірювань. Але навіть досвід цієї країни показує, що ситуація в Україні є особливою, і прикро буде, якщо цими особливими можливостями ми не скористаємося.
А почати варто, напевно, з простої таблиці термінів, які зараз стали найбільш поширеними, коли говорять про телевізійні вимірювання. Хоча, напевно, правильніше говорити й писати про вимірювання телевізійного контенту:
ТАМ |
Термін, який спочатку означав вимірювання телевізійної аудиторії. Найчастіше використовується для позначення індустріального дослідження телеперегляду. Його результати використовують у країні як валюту для продажу рекламного часу на ТБ. Базується на класичній моделі панельного дослідження з використанням піплметрів. |
Сенсус |
Використовується для позначення вимірювання, яке базується на повному невибірковому замірі. Походить від англійського «перепис» — коли всі беруть участь у збиранні інформації. |
RPD |
Дослівно — зворотні дані. Позначає, що це дані про споживання контенту, які можна отримувати безпосередньо з сервісу провайдера. В нашому випадку це дані ОТТ-провайдерів, коли сервери «знають», який канал, коли та з якого пристрою абонент почав отримувати й споживати. |
Стримінг |
Спосіб отримання телевізійного контенту, який доставляють з використанням інтернету. Неважливо, на якому пристрої чи який саме сервіс — це й ОТТ, і перегляд ютубу, і відео на сторінках прямо в браузері свого пристрою. |
Ф’южинг даних |
Поєднання даних, отриманих різним шляхом, в одне ціле — певне моделювання. |
Гібридна модель |
Термін, який частіше почали використовувати, заміщаючи ним термін ф’южинг даних. Загалом вказує на те, що дані телеперегляду (споживання) контенту отримані різним методами та з використанням різних підходів. |
Tags (мітки) |
У вимірюванні контенту означає існування спеціального сигналу, вбудованого в контент, який не бачить і не чує споживач, але який добре ідентифікують нові вимірювальні системи. Мітка може містити як назву контенту (каналу, передачі) так і джерело розповсюдження (цифровий ефір, назву конкретного провайдера — «Ланет», «Мегого» тощо. Але самі мітки потребують співпраці того, кого вимірюють: мають вставлятися в точці видачі контенту за участі виробника контенту. |
Вимірювання ТАМ добре давало раду з дослідженням телевізійної поведінки в багатьох країнах багато десятиліть. Але два фактори змусили шукати «гібридну» альтернативу, з чим Україна почала відставати ще навіть до війни.
Перший — це фрагментація перегляду. Зросла і далі зростає кількість каналів, які стали доступні глядачам. А це означає, що хай яким великим буде панельне вибіркове дослідження — кількості людей, яку будуть мати піплметри в себе вдома, не вистачатиме для того, щоб заміряти перегляд тих каналів. Тобто в ТАМ-панелі будуть канали, у яких показники матимуть «0», тоді як певна кількість глядачів у цього каналу точно є. І якщо раніше цей «хвіст» малих каналів був незначним, то зараз таких каналів стає дуже багато. Якщо скласти їх «нулі», то виходить, що втрачаються значні обсяги глядачів.
Другий чинник — це те, що зі зростанням кількості користувачів стримінгу частина перегляду телевізійного контенту мігрувала з телеекранів на екрани інших пристроїв, використання яких не адаптовано для вимірювання піплметрами, котрі, природно, підключені саме до телевізійних великих екранів.
Ці фактори мультиплікуються: більше стримінгу на малих екранах, ще більше каналів і контенту, який продовжує споживати користувач, поведінку якого хочеться виміряти. Ці два чинники набирають ваги, коли обсяги споживання будь-якого телевізійного контенту через стримінг зростають. Для прикладу, станом на червень 2023 року, за даними мого дослідження (це не установче дослідження Індустріального телевізійного комітету, а приватний експеримент автора. Його вибірка склала для різних питань 220 і 600 людей, що менше, ніж у звичайних установчих досліджень. Обраний метод випадкової генерації телефонних номерів не враховує демографічних показників, тому результати слід сприймати як суб’єктивний погляд автора — «ДМ»), близько 50% всього споживання вже припадає на стримінг. Тому ці виклики вже стають не додатковими, а основними.
Нові можливості, які відкриває стримінг, — це застосування даних RPD. У наших українських обставинах ними є дані від ОТТ-операторів чи провайдерів. Але як їх поєднати та якими є основні перепони чи перестороги у їх використанні. Звісно, це бажання будь-якого оператора ТАМ стабільності та мінімальності змін? Але контракти з ТАМ оператори зазвичай і укладають на 4-6 років у різних країнах, щоб завжди була можливість щось змінити та щось покращити. Навіть у Данії у 2022 році змінився оператор, щоб міряти щось по-іншому, про що далі. Спершу пройдемося загальною схемою, щоб зрозуміти, які елементи в цій гібридній моделі можуть брати участь.
Два вищевказаних виклики ТАМ-даних не подолати в межах використання лише ТАМ. Так само є два виклики й в ОТТ-даних, які також не подолати самими ОТТ-даними. По-перше, це дані сенсусного типу — коли фіксується все — але в таких даних немає повноцінної демографічної інформації користувача: віку, статі та інших атрибутів індивіда, до яких ми звикли. По-друге, не все використання телевізійного контенту відбувається на ОТТ-платформах, адже є ще й інші типи поширення та споживання контенту користувачами.
Таким чином поєднання двох методів і допомагає кожному з них розв’язати проблеми, які має кожен. Дані ОТТ збагачуються даними, які можна отримувати від панельного дослідження.
Історично на багатьох ринках ТАМ-дослідження було головним, довкола якого гуртувалися всі вимірювання. Тож першим етапом такого поєднання, який ще напряму не включав дані ОТТ, але історично підштовхував до того, було розширення ТАМ-панелі для вимірювання споживання за межами екрана телевізора — на малих екранах. Майже всі вимірювачі адаптували підхід із використанням «віртуального метра», який може називатися по-різному в кожного світового вимірювача.
Виглядає це так. Користувачам, яких вимірюють, необхідно встановити на всі телефони та пристрої, які він чи вона використовує для споживання контенту, програмне забезпечення, яке буде фіксувати все, що споживається на цих екранах. На деяких ринках такі «віртуальні метри» встановлюють наявним панелістам, а на деяких — набирають нових учасників панелі та формують нову панель саме для вимірювання за межами телевізійних екранів.
Це виглядає як початковий етап. У цього підходу є два своїх обмеження. Перше — так званий «респонс рейт» (згода на участь у дослідженні), адже не всі люди згодні встановлювати такий програмний продукт на свої телефони чи гаджети, і поведінка в споживанні телеконтенту у згодних може бути несхожою на споживання інших. А інше обмеження — статистичного характеру, адже такий підхід все одно залишається вибірковим і не може вимірювати все споживання контенту.
І ось зараз подивимося, як Данія розв’язувала це завдання. Там із 2017 по 2022 рік основним вимірювачем був «Кантар», а у 2022 році новим підрядником вимірювання став «Нільсен».
Коли ядром вимірювання була компанія «Кантар», то вона досліджувала телеекрани у 1200 сімей, це десь близько 2500 індивідів, які жили в цих родинах. Додатково існувала панель із 1100 індивідів, яка вимірювала споживання за межами екранів телевізора на приладах із малими екранами або відносно малими — такими як ноутбуки, смартфони чи планшети. Ще 25 тисяч індивідів вимірювали на рівні куків, щоб фіксувати їхнє цифрове споживання у стримінгу. Цю частину вибірки використовували, щоб калібрувати й отримувати демографічні дані для ОТТ.
Другим ядром цієї гібридної системи було використання міток в онлайн-контенті, коли всі учасники дослідження додавали ці мітки в усі свої потоки залежно від «програвачів» (провайдерів чи додатків), через які поширювався їхній контент. Завдяки цим міткам «Кантар» міг отримувати дані сенсуса — збираючи інформацію про споживання всього поміченого контенту. Потім дані з «віртуальних метрів» проходять ф’южн із даними піплметричної ТАМ-панелі; паралельно з цим дані стримінгового сенсуса та зібраних із кукі використовуються для зважування споживання. Важливо, що ф’южн відбувається в такому випадку на рівні даних індивіда, а не всього агрегованого масиву. Це дозволяє вимірювати охоплення не лише на загальному рівні, але і з використанням різних демографічних груп, і рахувати такі охоплення для кожної зі сформованих груп.
У такому дизайні дослідження ідентифікується та вимірюється лише той контент, який «хоче», щоб його міряли. Або, як у випадку з нами, замовники можуть визначати, кого міряти, а кого — ні, наприклад, не додаючи маркування певним каналам чи платформам. При цьому платформа може не хотіти, щоб її вимірювали, як, наприклад, ютуб. Тобто можна знати, скільки дивилися ютуб, але що саме на ньому дивилися — буде невідомо в першій ітерації. Але тут можна поширити гібридну модель і долучити до вимірювання через ф’южн і їх.
У 2022 році в Данії «Нільсен» прийшов на зміну «Кантару». Замість двох панелей (1200 сімей із піплметрами та 1100 людей із «віртуальними метрами») у Данії набрали нові 1750 сімей, у яких був уже і піплметр, під’єднаний до телевізора, і «віртуальний метр» на їхніх гаджетах. Сумарно це близько 3500 індивідів. Раніше було 2400 + 1100 — ті самі 3500.
Також підхід «Нільсен» полягає в тому, що всі гаджети, які належать панелістам, ідентифікуються в загальному потоці даних, де через маркування контенту фіксується все його споживання на всіх майданчиках, які стримлять такий маркований контент. Тобто сенсус вимірювання плюс панель у Данії залишилися. Відмовилися від додаткового демографічного калібрування ОТТ-даних, за що раніше відповідала кукі-панель у 25 тис. пристроїв-індивідів. І якщо раніше «віртуальний метр» «Кантара» стежив саме за гаджетами панелістів, то з 2022 року в Данії почали використовувати «стримінговий метр», який не «мандрує» з панелістом, а вимірює його стримінг на гаджетах у домі, до якого «стримінговий метр» під’єднано. Це такий собі роутер, який фіксує всю активність і розуміє, який стримінг використовує користувач. Як на мене, дивна заміна, технологічно не найновіша реалізація.
Можна помітити, що в Данії, яку я розглянув як приклад, вимірювач не використовує дані RPD (ОТТ-дані операторів). Натомість до базової ТАМ-панелі додалися ще дві додаткові панелі — вибіркові групи та один сенсусовий підхід. Ці зміни означають суттєве здорожчання вимірювання споживання телевізійного контенту.
Використання ОТТ-даних (RPD) навпаки дозволить без здорожчання вимірювання розширити його і при правильному підході зробити його більш точним і надійнішим. І головне, з його допомогою можна створити гібридну модель на перехідний період від класичної ТАМ-моделі вимірювання до вимірювання споживання всього контенту.
Ось основні способи, в які може бути використано дані ОТТ, і які результати експериментів є доступними.
За кількістю провайдерів. RPD можуть бути отримані як від усіх провайдерів ОТТ, що існують на ринку, так і від певної групи провайдерів — обидва підходи є можливими й кожен із варіантів може покращити наявні вимірювання. В кожному з цих варіантів ми маємо два види дисперсії (відхилень від поведінки): одна — це відмінності в тому, що дивиться домогосподарство в цілому, якщо мова про перегляд ОТТ на телевізійному екрані, друга — дисперсія всередні самого домогосподарства, коли важить те, хто з членів сім’ї та з ким переглядає контент — і це не лише на телевізійному екрані, але й на ноутбуці та навіть на смартфонах. За даними мого дослідження (примітку про нього дивіться вище — «ДМ») в Україні спільне споживання ОТТ-контенту на малих екранах складає близько 1,1 людини на прилад.
За наявністю демографічних даних. RPD може давати повні дані (сенсусного типу) або дані за певною підвибіркою з демографічними характеристиками, а при певній можливості — і повні дані ОТТ з демографією.
Найпростіший і ефективний спосіб наділити дані ОТТ демографію — це використовувати дані ТАМ-піплметрії. Це такий собі синтез двох методів, за допомогою якого ми отримуємо профіль аудиторії з ТАМ-панелі та поширюємо його на дані ОТТ. Для прикладу, якщо «Скажене весілля» дивляться 44% чоловіків і 56% жінок, то відповідні пропорції розподілу будуть і у даних перегляду ОТТ. Аналогічно — за віковими групами чи іншими характеристиками глядачів.
Уточнювати модель можна з використанням демографічних даних ОТТ-користувачів — для цього необхідно, щоб ОТТ-провайдери почали збирати демографічні дані всіх користувачів, а не лише тих, на кого зареєстрована підписка на сервіс. Ці дані мають містити і структуру домогосподарства — для цього треба синхронізувати типи структури з даними ТАМ-панелі. Для прикладу, в Україні в ТАМ-панелі за структуру домогосподарства відповідають лише показники розміру сім’ї (4 категорії), наявність людей старше за 60 років (2 категорії відповідно) та наявність дітей до 17 років (також 2 категорії). Така система не враховує реальну структуру домогосподарства, наприклад, сім’ю з двох людей віком 20 і 22 роки або 57 і 58 років, родини з двох жінок чи двох чоловіків. Для доброго функціонування моделі необхідно розробити структуру з 8–10 категорій типу домогосподарств. Перший підхід до такої ідентифікації можна зробити на основі даних мого дослідження та долучити до них дані установчих досліджень за різні періоди. Це дасть можливість ОТТ-провайдерам, які візьмуть участь у формуванні гібридної моделі, ефективніше збирати демографічні дані абонентів-користувачів.
У 2018 році, на прикладі даних британських панелей, було проведено експериментальні включення різного типу RPD-даних. Використано було чотири типи RPD-даних: 25 тис. абонентів із демографічними даними зі всіх платформ, варіант у 25 тис. абонентів лише з однієї платформи; а також два сенсус-варіанти: всіх абонентів без демографії всіх платформ і варіант усіх абонентів однієї з платформ.
Результати розрахунків вказали, що використання даних ОТТ із демографією працює краще, ніж використання всього масиву даних ОТТ (сенсусу). А використання даних усіх ОТТ-провайдерів дає кращі результати ніж використання лише одного провайдера. Для каналів — використання будь-якого з чотирьох варіантів однозначно покращує надійність показників малих каналів, а найбільше — каналів, які доступні лише на ОТТ-платформах.
Ця експериментальна знахідка, якою займався Steve Wilcox, насправді є дуже корисною для нашого українського випадку. Адже зібрати повні «сирі» або первинні дані зі всіх провайдерів — непросте завдання через недовіру, небажання чи прагнення приховати реальну кількість користувачів кожної з платформ. А от зібрати підвибірку в 30–50 тис. користувачів і скласти їхні демографічні характеристики — цілком реальне завдання, яке можна реалізувати вже у 2024 році, не чекаючи тендерів чи появи нових панелей для вимірювання. Можна включитися до наявної панелі ТАМ даними ОТТ і зробити панель із більш надійними даними та повернути реальні охоплення споживання телевізійного контенту.
Розглянемо, що є зараз і що буде, коли отримаємо гібридну модель із використанням даних класичної ТАМ-панелі й даних RPD (ОТТ-провайдерів в Україні).
Таблиця-графік допомагає уявити, як виглядає споживання, а відповідно і можливе вимірювання телевізійного споживання. Дивитися телевізійний контент можна по телевізору та на інших екранах. Також телевізор може бути вдома, а може й на дачі, в гостях, у місцях публічного сповіщення тощо. Дивитися телевізійний контент теж можна по-різному: лінійно (це всі способи без використання інтернету, такі як цифровий ефір, кабель і супутник) та за допомогою стримінгу (з використанням інтернету для доставлення контенту.
У таблиці я також зафіксував та позначив яким методом з двох чи двома разом можна вимірювати споживання телевізійного контенту.
Лінійне споживання на екрані телевізора в дома вимірює класична ТАМ-панель — це коли в нас в обраних сім’ях стоять інстальовані піплметри, будь-якого покоління, і фіксують споживання саме через лінійні способи розповсюдження.
Лінійне споживання на телеекрані за межами дому вимірюється частково в ТАМ-панелі, але воно стосується лише частини такого споживання, наприклад, коли глядач прийшов у гості до когось і дивиться на чужому телевізорі. Вимірювання в такий спосіб не може врахувати перегляду на дачах, у ресторанах, тобто в класичних місцях споживання поза домом.
Лінійного споживання не на телевізорі немає, бо немає способу отримувати лінійно контент за межами телевізійного екрана (є деякі особливі випадки, але їх мало).
Стримінг на телеекранах удома може вимірюватися у ТАМ і ОТТ; а от щодо споживання стримінгу на телеекранах за межами дому, то в ОТТ немає поняття «поза домом», адже будь-яке споживання на телеекрані можна зараховувати як «удома». Гостьовий стримінг частково може вимірювати ТАМ, але знову-таки його буде небагато.
Стримінг за межами телеекранів не може вимірювати ТАМ, це частина, яку може вимірювати лише ОТТ.
Якщо використати дані з мого дослідження, поєднати його з даними поточної панелі, то можна отримати заповнену таблицю-графік, де відсотки будуть показувати, який обсяг глядачів користуються тим чи тим способом отримання телевізійного контенту. І ось як вона може виглядати зараз:
Коли ви оцінюєте таблицю, зауважте, що технологічно лінійне споживання буде зменшуватися, а стримінг — рости.
ТАМ |
83% |
RPD (ОТТ) |
46% |
Калібраційна |
29% |
Якщо визначити, який відсоток споживачів може покривати той чи той спосіб отримання інформації про споживання телевізійного контенту, то виходить, що ТАМ може зараз покривати до 83%, ОТТ може охоплювати у вимірюванні до 46%, а близько 30% споживання буде у подвійній зоні вимірювання ТАМ і RPD (ОТТ) — і це та частина, де ринок зможе отримати якісніші й точніші дані в тій частині вимірювання, про яку я писав на початку — точні вимірювання малих каналів і більш стабільні дані.
Як це може вигляди в дизайні гібридної моделі:
ТАМ зараз нараховує близько 2450 індивідів, це люди, в яких є інстальовані піплметри. В ОТТ можна зібрати дані з демографію близько 45 тисяч абонентів. Це не повні дані всіх ОТТ-абонентів, а вибірка з 20–22 тисяч абонентів зі складом родин, що на рівні індивідів складе близько 45 тисяч індивідів. Це можуть бути як абоненти всіх основних ОТТ-провайдерів, так і одного-двох провайдерів.
Ось необхідні кроки для реалізації цієї ідеї у 2024 році, без заміни ТАМ-панелі та ТАМ-оператора:
1) Сформувати вибірку з абонентів ОТТ і почати збір демографічних даних для них.
2) Сформувати опитувальник для установчого дослідження для синхронізації даних ОТТ й ТАМ.
3) Провести саме оновлене установче дослідження.
4) Сформувати форму «сирих» первинних даних від ОТТ-провайдерів для ф’южну з даними ТАМ-панелі.
5) Обрати компанію для ф’южну отриманих даних ТАМ і ОТТ. Яка буде оперувати сирими даними ОТТ- і ТАМ-панелей.
Це рішення може бути реалізоване як із ТАМ-оператором, так і з залученням навіть лише одного ОТТ-провайдера, як показав експеримент на англійському ринку.
Фото Getty Images