C# 中的 MS SAPI SpeechRecognitionEngine 完全错误的转录

【问题标题】：MS SAPI SpeechRecognitionEngine in C# completely wrong transcriptionC# 中的 MS SAPI SpeechRecognitionEngine 完全错误的转录
【发布时间】：2012-02-26 00:12:51
【问题描述】：

我是 MS SAPI 的新手，我正在尝试使用 SpeechRecognitionEngine 类在 C#/Windows 窗体中编写 WAV 到 TXT 转换实用程序。我注意到演讲完全不正确。这些词甚至听起来都不相似。我猜这可能会受到一长串因素的影响，例如输入 WAV 文件的音质和加载到识别引擎中的语法。我正在使用 DictationGrammar 类。

我会感谢经验丰富的语音识别/数字信号处理人员提供的任何线索。

【问题讨论】：

标签： c# speech-recognition sapi

【解决方案1】：

您可能会得到如此令人失望的结果有几个原因。首先，如果您使用的是桌面识别器，您应该针对说话者进行训练。

第二个想法是，如果您从 Wav 文件转换，则在选择该文件的格式时必须小心。您可能需要重新采样 wav 文件，因为语音识别引擎仅支持某些采样率。

每个样本 8 位
单声道单声道
每秒 22,050 个样本
PCM 编码

在 Windows 上运行良好。请参阅https://stackoverflow.com/a/6203533/90236 了解更多信息。

【讨论】：

谢谢，我在发布这个帖子后就看到了那个帖子，我很抱歉。我的 WAV 文件确实无效。在 22050 重新采样并导出为无符号 8 位后，识别语音的置信度从约 8% 上升到大部分高于 50%。我认为哪个好？
不需要道歉。这是一个很好的问题，文档没有明确指定支持的格式。最后我看了一下，知道支持的格式的唯一方法是编写代码来查询 SupportedAudioFormats。

猜你喜欢

2011-09-05
1970-01-01
1970-01-01
1970-01-01
2023-03-20
1970-01-01
1970-01-01
1970-01-01
1970-01-01

相关资源

下载 2021-06-05
下载 2023-01-28
下载 2022-12-30
下载 2022-12-06

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode