К 2027 году каждое третье онлайн-совещание будет расшифровываться и преобразовываться в текст с помощью искусственного интеллекта. Это существенно сэкономит время компаний на создание протоколов таких встреч.
Уже через два года в режиме записи будут преобразовываться из речи в текст более 95% всех онлайн-встреч, в которых принимают участие свыше трех человек. Такой прогноз сделали аналитики ВТБ. По их оценке, компания со штатом в 10 тыс. человек может сэкономить до 7,5 тыс. часов в год, если вместо расшифровки онлайн-совещаний вручную будут использоваться нейросетевые алгоритмы.
«Сейчас из всех онлайн-совещаний в реальном времени расшифровывается не более 1% онлайн-конференций и до 10% в записи. Всю аудиторию сервисов видео-конференц-связи (ВКС) мы оцениваем в 20 млн пользователей в РФ. Из них регулярно функцией преобразования речи в текст пользуется порядка 1% аудитории. К 2027 году, мы прогнозируем, этот показатель вырастет до 10% всех пользователей сервисов видеоконференций. Он может вырасти и до 20% в случае развития не только сервисов транскрибации, но в целом сегмента цифровых ассистентов», — отмечает заместитель президента – председателя правления банка Вадим Кулик.
Инструмент преобразования речи в текст (speech-to-text) работает на базе алгоритмов искусственного интеллекта и сегодня доступен сотрудникам ВТБ при использовании видеохостинга DION Видео - элемента платформы унифицированных коммуникаций DION, которая используется в банке с 2022 года. Все, что говорят участники видеовстречи, алгоритм преобразовывает в разбитые на реплики письменные сообщения.
Модели постоянно совершенствуются. Например, сейчас на их основе тестируется функция саммаризации, когда пользователи могут получить краткое изложение прошедшей онлайн-конференции. А в дальнейшем появится функция автопротоколирования — автоматически генерируемого по итогам онлайн-встречи перечня поручений.