Після 24 лютого 2022 року, ми стали свідками масового переходу на українську мову в соцмережах, на YouTube, у повсякденному спілкуванні. Це не просто зміна мовних звичок — це частина трансформації суспільства. Але пізніше виникло інше відчуття — а чи не відбувається зараз “відкат”? Чи ми справді продовжуємо рух у бік українізації, чи лише перебуваємо в інформаційній бульбашці?
newage. постійно працює з даними, створює кампанії, що базуються на аналітиці. Тож ми вирішили проаналізувати, як змінюється мовна ситуація в країні за допомогою open data та інструментів машинного навчання.
Ми поставили собі низку запитань:
Проблема традиційних підходів до вимірювання мовної ситуації
Питання мовної ситуації в Україні вже давно є предметом соціологічних досліджень, медіа-обговорень і політичних дискусій. Однак, попри активний інтерес, досі бракує об’єктивної, масштабної та регулярно оновлюваної статистики про мовні зміни в країні. Соціологічні опитування залишаються основним інструментом вивчення настроїв, але вони мають обмеження: невеликі вибірки, вплив формулювань запитань і політична заангажованість можуть спотворювати результати та їхню інтерпретацію.
В останні роки поширився аналіз пошукових запитів як індикатора суспільних змін, що вже є кроком до більш точного, data-driven підходу. Проте такі дослідження не дають розуміння мотивації користувачів і потребують серйозної інфраструктури для систематизації. Тому, щоб отримати більш комплексну картину, доцільно звернутися до аналізу поведінки користувачів у відкритому цифровому просторі (хоча навіть дані з пошуковиків уже можуть служити корисним маркером).
Методологія дослідження
Замість покладатися лише на традиційні методи, ми вирішили застосувати те, в чому команда newage. має експертизу — роботу з даними. В епоху open data мовне середовище можна вимірювати точніше, частіше й масштабніше. Головне — знати, що саме аналізувати і як із цим працювати. Тож ми обрали власний підхід, у якому поєднали відкриті джерела інформації з можливостями машинного навчання.
В основі дослідження — проста ідея: використати ті дані, які вже є у відкритому доступі, і пропустити їх через сучасні machine-learning інструменти аналізу. Мовне середовище — це не лише розмови на кухні, а й коментарі в YouTube, обговорення в Telegram, оголошення на сайтах.
Важливий дисклеймер: публічний простір (навіть якщо це коментарі під відео в YouTube чи під постом в Telegram) не завжди на 100% відображає приватне життя, саме з нього починаються зрушення. Тож наше завдання — фіксувати, аналізувати й робити ці зрушення видимими.
Джерела даних, які ми аналізували
Для аналізу ми обрали кілька платформ, які найкраще відображають мовне середовище в публічній площині:
Як працює система
Щоб обробити такі обсяги даних, ми створили автоматизовану систему з кількох частин:
Цей підхід дозволив нам створити гнучкий інструмент, який можна масштабувати, оновлювати та адаптувати під нові джерела даних.
Що ми побачили в даних
Після обробки понад 300 тисяч коментарів та повідомлень на різних платформах, ми змогли побачити чітку картину мовної ситуації в онлайн-просторі. Ці дані не лише підтвердили інтуїтивні відчуття, а й дозволили подивитися на тенденції у динаміці. Виявилося, що цифрове середовище здатне дуже точно фіксувати зміни в мовній поведінці суспільства.
Відсотки та динаміка по платформах
Українська мова впевнено посідає провідне місце в онлайн-комунікації.
У більшості великих платформ вона стала основною мовою взаємодії.
YouTube
Ці канали - це тільки приклади, загалом було проаналізовано 200+ каналів
Telegram
Платформа з оголошеннями у сфері e-commerce
Такі результати — це свідчення не лише мовних змін, а й вибору мільйонів українців — бути почутими своєю мовою.
Українська мова в регіонах: на шляху до єдності
Дані з Telegram-каналів по різних містах України яскраво показують: українізація відбувається не лише в центрі чи на заході, а охоплює всю країну — хоч і з різною інтенсивністю.
У містах західної України ситуація очікувано потужна:
Центральні регіони також демонструють високі показники:
У східних та південних регіонах ситуація покращується, але українська мова все ще не домінує:
Важливо! У багатьох випадках ці цифри вже зросли в 2–3 рази з початку повномасштабного вторгнення. Це не найоптимістичніша картина, але вона покращується з кожним днем.
Чи є мовний відкат?
Це запитання ми чули часто. У соцмережах періодично виникають обговорення, що “українізація сповільнилась” або “є зворотній рух”. І справді, після хвилі українізації 2022 року хтось міг відчути, що темп знизився. Ми вирішили не спиратись на припущення — а звернутись до даних. І вони дали чітку відповідь.
Наш аналіз охопив десятки каналів на різних платформах — від Telegram до YouTube та великих e-commerce майданчиків. На більшості з них українська мова утримує провідні позиції, а в багатьох — продовжує зростати. І хоч темпи можуть відрізнятися залежно від платформи, тематики чи регіону — тренд один: українська продовжує набирати силу.
Навіть на платформах, де можливий вплив бот-активності чи іноземної аудиторії (наприклад, Telegram), українська зберігає перевагу. У сегментах із меншою уразливістю — таких як YouTube чи платформи з побутовими оголошеннями — україномовність уже стала нормою.
Ще одна важлива ознака — регіональні зміни. У містах, де традиційно переважала російська мова, ми зафіксували значне зростання україномовного контенту. Наприклад, в одеських Telegram-каналах показники виросли від 2–11% до 50%, у Харкові — понад 45%, у Дніпрі — стабільно понад 60%.
Це не просто тимчасова хвиля. Це — стійкий тренд. Так, перехід триває нерівномірно, але він триває.
Ключові інсайти дослідження
Після обробки даних з різних платформ і каналів ми виокремили кілька важливих спостережень, які допомагають краще зрозуміти реальний стан української мови в цифровому просторі.
Українська — це вже нова норма
На більшості проаналізованих платформ частка україномовних коментарів коливається в межах 65–85%. Повномасштабне вторгнення стало точкою зламу — мільйони українців свідомо перейшли на українську як у публічному, так і в особистому спілкуванні.
Бульбашки формують мовне середовище
Україномовні блогери, медіа та контент-творці створюють навколо себе активні спільноти, де українська — мова за замовчуванням. Це підсилює ефект “у нас всі говорять українською”. Хоч це й не завжди відповідає загальній картині, воно має величезне значення для нормалізації української в цифровому просторі.
Контент, який ми споживаємо щодня, впливає на мовні звички. Саме україномовні автори задають тон онлайн-середовищу — і тому варто підтримувати їхню видимість і розвиток.
Політичні канали — під прицілом ботів
На новинних та суспільно важливих каналах ми зафіксували хвилі бот-активності — переважно російськомовної. Такі атаки можуть спотворювати мовну статистику, але водночас стають індикатором уразливості інформаційного простору. Цифрова гігієна в цьому напрямку — критично важлива.
Регіональні зміни — глибші, ніж здається
Не лише Київ чи Львів демонструють позитивну динаміку. Наприклад, згідно з дослідженням “Детектора медіа”, в Одеській області частка людей, які розмовляють українською вдома, зросла з 26% у 2021 до 42% у 2023 році. Схожі зрушення відбуваються і в Харкові, Дніпрі, Кривому Розі. Так, шлях до рівномірної українізації ще триває, але його вже не спинити.
Ці інсайти — не просто підсумки дослідження. Вони — маркери майбутнього. Українська мова живе, розвивається і зміцнюється. І це не абстрактна ідея, а вимірюваний факт.
Мовна ситуація в цифрах сьогодні відображає глибокі суспільні зміни: якщо до 2022 року україномовні коментарі були меншістю, то тепер спостерігається помітний рух у бік української. Дані показують, що мова змінюється не за наказом, а завдяки щоденним виборам людей, і цей поступ — хоч і нерівномірний — стабільно веде до утвердження української як нової норми, навіть на масових платформах на кшталт Telegram.
Це не просто про комунікацію — це про вибір, відповідальність і національну ідентичність. Тепер ми можемо впевнено сказати: ми говоримо, пишемо й думаємо українською, і за цими словами стоять не лише переконання, а й конкретні цифри, які підтверджують цей зсув.