【问题标题】:MS SAPI SpeechRecognitionEngine in C# completely wrong transcriptionC# 中的 MS SAPI SpeechRecognitionEngine 完全错误的转录
【发布时间】:2012-02-26 00:12:51
【问题描述】:

我是 MS SAPI 的新手,我正在尝试使用 SpeechRecognitionEngine 类在 C#/Windows 窗体中编写 WAV 到 TXT 转换实用程序。我注意到演讲完全不正确。这些词甚至听起来都不相似。我猜这可能会受到一长串因素的影响,例如输入 WAV 文件的音质和加载到识别引擎中的语法。我正在使用 DictationGrammar 类。

我会感谢经验丰富的语音识别/数字信号处理人员提供的任何线索。

【问题讨论】:

    标签: c# speech-recognition sapi


    【解决方案1】:

    您可能会得到如此令人失望的结果有几个原因。首先,如果您使用的是桌面识别器,您应该针对说话者进行训练。

    第二个想法是,如果您从 Wav 文件转换,则在选择该文件的格式时必须小心。您可能需要重新采样 wav 文件,因为语音识别引擎仅支持某些采样率。

    • 每个样本 8 位
    • 单声道单声道
    • 每秒 22,050 个样本
    • PCM 编码

    在 Windows 上运行良好。请参阅https://stackoverflow.com/a/6203533/90236 了解更多信息。

    【讨论】:

    • 谢谢,我在发布这个帖子后就看到了那个帖子,我很抱歉。我的 WAV 文件确实无效。在 22050 重新采样并导出为无符号 8 位后,识别语音的置信度从约 8% 上升到大部分高于 50%。我认为哪个好?
    • 不需要道歉。这是一个很好的问题,文档没有明确指定支持的格式。最后我看了一下,知道支持的格式的唯一方法是编写代码来查询 SupportedAudioFormats。
    猜你喜欢
    • 2011-09-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-03-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多