Орест Білоскурський: «Глядачі, які дивляться телевізор не так, як інші, випадають із завдання вибіркового дослідження»
У квітні цього року Індустріальний телевізійний комітет ухвалив за основу алгоритм виявлення сімей із суттєвим відхиленням перегляду. Механізм має знаходити людей, чиї телевізійні вподобання суттєво відрізняються від типових, щоб потім можна було детальніше проаналізувати та інтерпретувати ці дані. Тобто щоб зрозуміти, що це - зловживання чи смак глядача.
З того часу вже виникло чимало домислів щодо результатів роботи алгоритму. Нібито виявилося, що деякі глядачі палають нетиповою пристрастю до телеканалів групи Maxximum. Домисли підігрівалися давнішими чутками про те, що ця група придбала в екс-працівника GfK Ukraine частину бази піплметрів (а потім - що цю дещо застарілу базу продавали мало не на кожному лотку на Петрівці). Проте оскільки після запуску алгоритму такі ж палкі прихильники знайшлися й у великих телеканалів, ІТК нібито забракував новацію і попросив її вдосконалити. Місяць тому Ольга Роcманова з GfK Ukraine заперечила ТК відхилення алгоритму і повідомила, що робота над ним ніколи не зупинялася. Хоча в деталі щодо виявлення нетипових глядачів вона не захотіла заглиблюватися.
Було вирішено дочекатися результатів червня-липня. Нагадаємо, з червня Maxximum припинив співпрацю з телеканалом Ru Music. Якщо плітки про підкуп власників піплметрів мали під собою хоч якісь підстави, показники каналу мали би піти вниз. Чи сталося це, які справжні результати роботи алгоритму, за якими параметрами він узагалі працює, - «Детектор медіа» дізнавалася в його безпосереднього ініціатора, керівника відділу якісницьких досліджень ICTV Ореста Білоскурського.
- Розкажіть, будь ласка, про механізм роботи алгоритму та мотиви його створення.
- Ми з колегою почали його продумувати десь у лютому, а з березня він у складній розробці. За своєю суттю це автоматизована складна математична система пошуку відхилень.
Піплметрічне дослідження - це стандартне вибіркове дослідження, просто з купою прибамбасів. Є населені пункти, які входять до нашої генеральної сукупності. Є конкретні люди, що мають репрезентувати цю генеральну сукупність. Усі люди мають право потрапити до вибірки. Усі вони мають безліч характеристик. Деякі можуть суттєво відрізнятися від загалу. Це не означає, що вони «погані» чи що вони куплені. Просто це люди чи сім'ї із зовсім іншою поведінкою. Завдання дослідників - набрати таку групу людей, яка має репрезентувати всіх.
Проведімо паралелі з дослідженням рівня доходів у Києві. Скажімо, до вибірки потрапило 999 людей і один Альф. Це мало б означати, що з населення Києва 0,1% складають альфи, тобто на кожну тисячу киян припадає один альф. Але ж це не так, ми знаємо, що Альф - один-єдиний у своєму роді. Що робиться в такому разі у звичайних дослідженнях? Наприклад, у дослідженні рівня доходів, під час якого до тисячі звичайних людей потрапляє олігарх чи просто людина з фантазією, яка заявила, що вона є мільярдером? Надмаленькі величини просто виключають, не беруть до розрахунку.
- Хто в нашому випадку є альфом, за якими критеріями людина потрапляє до категорії аномально нетипових глядачів?
- Ми обрали собі кілька критеріїв, але самі по собі вони ні про що не свідчать. Їх треба дивитися вкупі, щоб когось знайти. Але про це пізніше. Отже, ми когось знаходимо, якусь «крапочку», але пам'ятаємо, що ця крапочка має право на існування. Для когось дивитися з ранку до ночі один канал - це нормальна поведінка, вона ще не означає, що людину «купили». Але ми точно бачимо, що цей один руйнує систему репрезентації вибірки. Бо якщо б таких людей було багато, їх, відповідно, більше би потрапило у вибірку. А він один такий, відповідно, його представленість у вибірці перебільшено. Отже, його слід замінити на когось стандартного.
- Де межа між перебільшеним і неперебільшеним представленням?
- Є статистичний механізм, який існує ще з 60-х років. Звернімося до простого прикладу. Ви розсипали буси на столі. Одна бусинка далеко закотилася. Якщо ми візьмемо її і ще три бусинки з центру стола, то можна подумати, що 75% бусинок розсипалися на столі, а 25% закотилися далеко. Але ж це не так, це лише одна бусинка з півсотні...
- Але в даному випадку ми впевнені, що бусинка одна, що альф один. А як можна бути впевненим, що в якогось каналу є лише один або кілька затятих прихильників?
- Базова ідея - вибірка максимально точно репрезентує генеральну сукупність. Ми з цього виходимо, ми не ставимо цей факт під сумнів. Але в будь-якої вибірки є викиди. Є аутлаєри (бусинка впала на кінець стола) та екстремуми (бусинка впала аж на підлогу). Якщо ми давно і довго шукали «бусинки» у вибірці і знайшли лише одну, то можемо припустити, що в генеральній сукупності їх також дуже мало. Таким чином, ми бачимо, що є якісь глядачі, які дивляться телевізор зовсім не так, як інші. Вони просто випадають із завдання вибіркового дослідження.
- Ви можете назвати критерії, за якими відбувається аналіз?
- Це цілий набір показників, які в сукупності перевіряють, наскільки особа відрізняється від загалу. Скільки часу вона дивиться телевізор, які канали вона дивиться, які канали вона може приймати, як вона дивилася телевізор раніше і так далі. Ми дивимося на них і порівнюємо із сукупністю. Повний склад оприлюднити не можемо, бо тоді буде зрозуміло, як його можна обійти, алгоритм має бути закритим. Бо це як із порушниками швидкості. Має бути якась система, яка виловлює порушників. Якщо просто поставити на перехрестях даішників із паличками, порушник гальмуватиме біля них, а далі знову їхатиме на великій швидкості. Взагалі-то, в ідеалі, сім'ї самі мають звертатися до GFK і повідомляти про те, що хтось намагається їх підкупити. Але це все одно, що самому прийти до ДАІ і зізнатися, що зранку ти їхав зі швидкістю 80 км/год.
- Щодо перегляду яких каналів виникли підозри?
- Чув такий міф, що нібито ми спіймало багато тих, хто дивиться тільки «Інтер» чи «1+1». Просто що більший канал, то пропорційно більшою буде кількість оцих бусинок. Умовно кажучи, якщо ми зловили 10 аутлаєрів, то їх розподіл має бути такий: в «Інтера» два, у «1+1» - півтора і так далі. Це означає, що алгоритм попрацював і знайшов собі середньостатистичне відхилення. Але якщо в каналу з часткою перегляду 1% частка у бусинках - 20%, тобто дві бусинки з десяти, з цим каналом щось не те. Тому алгоритм - це просто статистична процедура, яка щось знаходить, але ще нікого не звинувачує. Щоб інтерпретувати дані, треба аналізувати їх кожен окремо. Й отут чіткої процедури, чітких критеріїв ще немає. Ми можемо провести інтерв'ю з сім'єю, розпитати, чому вона саме так дивиться телевізор. Є технічний комітет, який з цими людьми далі працює, дивиться на них зліва і справа. Є ІТК, який по конкретних винесених на розгляд сім'ях приймає рішення - вилучити їх чи залишати у вимірюванні.
- І якими були рішення щодо тих, кого вже виносили?
- Поки що нікого не виключили, бо не всі члени ІТК проголосували за виключення. Хтось побачив у викладених фактах щось підозріле, хтось - ні, або ж вважав, що цих фактів недостатньо для виключення.
- На якому етапі наразі перебуває вироблення критеріїв для аналізу?
- Нині в нас якраз триває дискусія - чи мають параметри бути формалізовані (наприклад, людина йде на виключення, якщо провалила 5 з 10 контрольних запитань), чи аналіз має бути індивідуальнім та якісницьким. Особисто я стояв на тому, що не може бути абсолютно чіткого набору запитань. Для кожної родини можуть бути свої кути погляду. Якщо вам 65 років і ви дивитеся тільки «Інтер», то це нормально, а якщо вам лише 15, то це вже дивно. Так само, є дивні мікси каналів. Існує канал Maxxi-TV, який позиціонує себе як канал для жінок. Там відповідне наповнення програм і фільмів. І є такий собі Star-TV з «кислотними» кліпами. От уявіть, що людина 30-40 років, чоловік, дивиться і старі добрі фільми для жінок, і Star-TV з «кислотними» кліпами. Може бути такий мікс смаків? У принципі, так. Але далі дивимося структуру перегляду і бачимо, що вона якось дуже дивно змінюється. Подивіться на приклад з Ru Music, про який ви говорили. От що по ньому відбувається: одна віднайдена родина має велику любов до цього каналу, але у червні ця любов раптом миттєво зникає...
- Але тут видно, що на першому тижні року цієї любові майже не було, а в той час канал ще був з Maxximum...
- Так. Але от наступна родина, де така сама картина. Спочатку вони теж їх не любили, потім полюбили, а останнім часом знов розлюбили. Кожен окремо ці факти ще нічого не означають, але разом вони складаються в чітку і дуже дивну картинку. Можливо, там щось сталося з кабельним провайдером, й ані він, ані ці четверо людей нам про це не повідомили? Можливо... Але навряд чи. Не виключено, що далі вони знову почнуть дивитися канал, то як нам це інтерпретувати? Що це буде - ефект «засвіченого» даішника на перехресті чи чергова різка зміна смаків? Питань багато.
- Чотири людини - це мало чи багато для такого каналу?
- Ці четверо роблять близько 25% рейтингів цих каналів. Якщо у Maxxi-TV частка 0,39%, то з них 0,1% - це внесок цих чотирьох осіб. Куплені вони чи не куплені - не знаю, за великим рахунком, для нас це взагалі не має значення, бо ми не прокурори і не детективне агентство. Важливо те, що вони випадають з природи дослідження.
- Це їх виносили на ІТК?
- Так.
- По інших каналах є аналогічні приклади?
- Таких яскравих немає.
Внесок чотирьох осіб у показники каналів, по аудиторії 14-49, панель «50 тис.+», 27 тижнів 2009 року
Оскільки у цьому матеріалі згадуються канали, що входять до групи Maxximum, «Детектор медіа» запропонувала представникам цієї групи прокоментувати ситуацію. Наводимо відгук керуючого партнера Maxximum Adv Вікторії Семененко:
«Якби ми знали, як «робляться» рейтинги, то давно б уже були Новим каналом. Проте я вважаю зайвим вплутуватися у ці незрозумілі мені таблички-графіки. Якщо хтось справді вірить у те, що селлер якимось чином може вплинути на рейтинги телеканалів, то нехай собі вірить. Вважаю, що зараз ГФК дуже правильно підходить до цього питання. Є підозри чи сумніви - впроваджується методика перевірки. Є привід - блокують чи переміщують піплметри з одного місця в інше. От і все. А все інше - це балаган», - зазначила пані Семененко.