【问题标题】:pyspeech (python) - Transcribe mp3 files?pyspeech (python) - 转录 mp3 文件?
【发布时间】:2011-06-04 10:13:30
【问题描述】:

我想使用 pyspeech API 转录 mp3(语音转文本)。不过,我不知道这是否可能。

是吗?怎么样?

【问题讨论】:

    标签: python speech-recognition speech speech-to-text


    【解决方案1】:

    pyspeech 似乎只是常规 Windows 语音 API 的 python 接口。您很可能会创建一些方法,将 mp3 播放视为音频源,供该语音 API 收听。

    【讨论】:

    • 能否更详细地解释一下如何做到这一点?
    • 另外,我有一台 Mac。这会阻止我使用 pyspeech 吗?
    • 你必须在你的 Mac 上运行 Windows。要么直接在硬件上,要么在虚拟机中(Parallels、VMWare 等)。 MacOS 不支持 Windows API(不应该)。至于怎么做,我不知道。我不是 Win32 程序员。但由于 Windows api 旨在“收听”音频源,因此您必须以编程方式将 mp3 转换为 API 可以收听的音频设备。
    【解决方案2】:

    我不了解 pyspeech,但如果它是围绕 Microsoft 语音 API 的 Python 包装器,那么其他一些帖子可能会有所帮助。

    Microsoft Speech 引擎不需要麦克风输入。他们可以接受音频文件。

    如果您要进行转录,则需要听写语法。听写语法包含在随 Windows 7 和 Vista 一起提供的 Microsoft 语音引擎的客户端版本中。 Microsoft 提供的服务器引擎上不提供听写语法。

    在 C# 中使用带有 System.Speech 命名空间的听写语法的简单示例位于 StackOverflow 问题 SAPI and Windows 7 Problem

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2015-03-17
      • 2023-01-12
      • 2017-06-29
      • 1970-01-01
      • 2017-01-07
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多