【问题标题】:VAD to switch from listen mode to speak modeVAD 从听模式切换到说模式
【发布时间】:2013-02-20 05:02:46
【问题描述】:

我正在尝试使用树莓派和自定义电路将我的四线公寓蜂鸣器变成 VOIP 电话。问题是不支持双向通信。我要么在听,要么在说。我想使用带有星号的标准 SIP 设置,但在树莓派的声音输出上执行 VAD,以便在音频输出上有声音时发送数字信号,将对讲机切换到“说话模式”。是否有任何预先存在的 c 函数或包含来监听 ALSA 混音器并抛出 1 表示语音和 0 表示没有语音,并且延迟足够低,可用于这个类似步话机的系统?

再一次,我更喜欢预先存在的库,因为这是实时的,低延迟。

【问题讨论】:

  • 我相信这会更适合 StackOverflow。

标签: c audio voice alsa


【解决方案1】:

ALSA 是一个简单的混音器,它的界面只包含混音器相关的方法。它旨在抽象出硬件驱动程序。您可以实时从 ALSA 获取音频数据,但您需要实现自己的语音活动检测。

这个question on Signal Processing SE 对库和编解码器实现有一些很好的建议,可以帮助您入门。

【讨论】:

  • 我在这里问这个问题是因为我相信与 ALSA 的接口会相当简单,但我对我编写 VAD 算法的能力没有信心,所以我正在寻找一个预先存在的库(如果它存在的话)。我看到了你链接到的线程,但没有一个链接的代码看起来像我需要的。我知道有预先存在的库,但我不知道哪些最接近我想要的,或者如何修改它们,所以这就是我在 dsp 中询问的原因。
  • 您希望它迁移回来吗?
猜你喜欢
  • 1970-01-01
  • 2013-10-04
  • 2015-08-03
  • 2020-03-22
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多