【发布时间】:2023-01-31 22:27:57
【问题描述】:
我正在使用 azure speech to text 来查找 wav 文件中话语的时间戳。
我遇到的问题是,如果用户记录了数字,例如“我要数到三。一、二、三,我来了”。输出中省略了数字。英语和其他语言都会发生这种情况。 我可以理解省略“eh”和“ah”之类的话语,但是数字?为什么这是默认值。
我正在使用:
- speechConfig.OutputFormat = OutputFormat.Detailed;
- 默认语言模型。
我可以以某种方式配置 SpeechRecognizer 以使其也输出数字吗?
【问题讨论】:
标签: azure speech-recognition speech-to-text