EN
Следите за нашими новостями в удобном формате Есть новость? Присылайте!
Центр искусственного интеллекта группы «Т-Технологии» выложил в открытый доступ потоковую модель распознавания речи T-one. При сравнительно небольшом размере она лидирует по качеству распознавания на русском языке на шумных и сжатых записях из колл-центров, сообщили разработчики.
Модель изначально спроектирована для работы в реальном времени с аудиопотоком произвольной длины. Технология обеспечивает низкую задержку, что критично для голосовых ассистентов, автоматизации колл-центров и аналитики звонков, отметили разработчики.
Потоковое распознавание речи позволяет обрабатывать звонки в реальном времени, повышать скорость и качество обслуживания, а также снижать нагрузку на операторов и затраты на персонал, подчеркнули разработчики.
T-one распространяется по лицензии Apache 2.0, разрешающей свободное коммерческое использование и модификацию. Веса модели и код для запуска в высоконагруженной среде и адаптации под собственные задачи доступны на специальных сайтах для разработчиков ПО.