В Военном инновационном технополисе «ЭРА» разработано программное обеспечение, предназначенное для задач обработки естественного языка

Для создания алгоритмов по распознаванию речевой информации требуется тысячи часов размеченной живой речи. А конкретно для этих задач нужна подробная транскрипция речи, то есть перевода аудиоинформации в текст.
При этом такая работа не является конечной. Она должна проводиться постоянно, в следствии естественного развития разговорного языка и специфики области применения разработанных технологий.
Операторами 6 научной роты технополиса в Центре машинного обучения разработано программное обеспечение, позволяющее в разы сократить время, затрачиваемое оператором на эти операции.
Созданный алгоритм разбивает слова на простейшие составные части и, используя разработанные словари соответствий устанавливает фонетическую трактовку, тем самым поэтапно создавая транскрипцию с точностью более 98%.
В дальнейшем планируется создание словарей для специальных условий применения в Вооруженных Силах Российской Федерации, где необходимо применение речевых технологий и работы по повышению процента точности распознавания речи.
19 ноября 2021
Источник: Технополис