
Vector запустив функцію озвучування статей за допомогою штучного інтелекту
Vector запустив функцію озвучування статей за допомогою штучного інтелекту


Медіа Vector у партнерстві з українським стартапом, що працює з голосовими моделями, Respeecher запустило функцію озвучування своїх статей за допомогою технологій штучного інтелекту. Про це повідомили на сайті медіа.
Особливістю функції є можливість прослухати текст з будь-якого рядка, а не лише з початку. Функція розширить доступ до матеріалів, зокрема людям із порушеннями зору.
Наразі статті на сайті можна прослухати голосами саунд-продюсера, артиста Positiff, підприємця, засновника холдингу Netpeak Group Артема Бородатюка, засновника креативної агенції I am idea Ігоря Фінашкіна, бізнесмена, блогера Гаріка Корогодського, співзасновниці мережі барів G.Bar, блогерки Сабіни Мусіної та співака Романа Бахарєва, відомого під псевдонімом Bah.roma.
«Ми прагнули змінити парадигму споживання контенту не тільки в Україні, а й у світі. Усе прискорюється, тож текстові матеріали не завжди зручні для читача. Уявіть: ви читаєте статтю вдома, і розумієте, що вам вже пора виходити по справах. Ви не вимкнете телефон і забудете про неї, а дослухаєте її в машині», — сказав гендиректор Vector Ісмаїл Осбанов.
Технічним партнером розробки став Respeecher, який працював над створенням ШІ-голосів, зокрема, для Дарта Вейдера та Люка Скайвокера у «Зоряних війнах». Оновлення для Vector базується на технології text-to-speech.
«Для роботи в кіно ми зазвичай використовуємо speech-to-speech, тобто коли один живий актор грає голосом іншого. Але у випадках, коли необхідна повна автоматизація процесу, ось як, наприклад озвучення статей, необхідно використовувати text-to-speech, коли машина сама генерує природний голос із тексту», — пояснив технічний директор Respeecher Дмитро Бєлєвцов.
Нагадаємо, у листопаді 2024 року ми повідомляли про те, що 24 канал оновив функцію аудіоновин на сайті, запустивши озвучення голосом ведучої Катерини Соляр за допомогою технології штучного інтелекту. Аудіоновини наближені до людської мови та враховують манеру подачі інформації й тон ведучої.
Фото: Vector
