【发布时间】:2020-01-21 08:58:18
【问题描述】:
在我们正在进行的使用各种语音到文本供应商转录视频材料的实验中,微软似乎是实际单词识别的有力竞争者。对于英语材料,格式/标点符号也很好,但对于挪威语材料(与我们最相关),几乎没有任何格式/标点符号。我们使用 C# API SpeechRecognizer,config.SpeechRecognitionLanguage 设置为“nb-NO”,config.OutputFormat 设置为 OutputFormat.Detailed,并使用 config.RequestWordLevelTimestamps()。我们可以做些什么来改进结果的格式?
此外,在检索带时间戳的单个单词时(这是我们的要求之一),即使使用英文材料也没有格式。在检索单个单词时,我们可以设置一些选项来保持格式/标点符号吗?
最好的问候, 贡纳尔
【问题讨论】:
-
您使用的是哪个结果?词法、显示、ITN、MaskedITN?
-
我们正在使用显示。但据我所知,除了 Display 和 Masked ITN 版本中第一个单词大写外,结果版本之间的格式没有区别。 (这是给挪威语的;英语剪辑是另一回事。)
标签: speech-recognition microsoft-cognitive