pyspeech (python) - 转录 mp3 文件？答案

【问题标题】：pyspeech (python) - Transcribe mp3 files?pyspeech (python) - 转录 mp3 文件？
【发布时间】：2011-06-04 10:13:30
【问题描述】：

我想使用 pyspeech API 转录 mp3（语音转文本）。不过，我不知道这是否可能。

是吗？怎么样？

【问题讨论】：

【解决方案1】：

pyspeech 似乎只是常规 Windows 语音 API 的 python 接口。您很可能会创建一些方法，将 mp3 播放视为音频源，供该语音 API 收听。

【讨论】：

能否更详细地解释一下如何做到这一点？
另外，我有一台 Mac。这会阻止我使用 pyspeech 吗？
你必须在你的 Mac 上运行 Windows。要么直接在硬件上，要么在虚拟机中（Parallels、VMWare 等）。 MacOS 不支持 Windows API（不应该）。至于怎么做，我不知道。我不是 Win32 程序员。但由于 Windows api 旨在“收听”音频源，因此您必须以编程方式将 mp3 转换为 API 可以收听的音频设备。

【解决方案2】：

我不了解 pyspeech，但如果它是围绕 Microsoft 语音 API 的 Python 包装器，那么其他一些帖子可能会有所帮助。

Microsoft Speech 引擎不需要麦克风输入。他们可以接受音频文件。

如果您要进行转录，则需要听写语法。听写语法包含在随 Windows 7 和 Vista 一起提供的 Microsoft 语音引擎的客户端版本中。 Microsoft 提供的服务器引擎上不提供听写语法。

在 C# 中使用带有 System.Speech 命名空间的听写语法的简单示例位于 StackOverflow 问题 SAPI and Windows 7 Problem

【讨论】：