【问题标题】:align audio files that start and end at different times对齐在不同时间开始和结束的音频文件
【发布时间】:2016-07-13 07:01:00
【问题描述】:

我有在不同时间开始和结束的录音。

audio 1: -----t1--------------------------s1->time
audio 2: ---------t2----s2------------------->time
audio 3: ------------------------t3-------s3->time

音频 1 最长,它与音频 2 和 3 重叠。 音频 2 和音频 3 是短片段,但它们根本不重叠。 有没有这样做的python库?

【问题讨论】:

  • 开始和结束是什么意思?您想从最开始的地方读取音频文件吗?
  • 那些是同一事件的录音,有些是先于其他人开始的。有些提前结束了。所以它的一种找到偏移量。 @sandoval31

标签: python audio


【解决方案1】:

您可以先使用 python 库读取音频文件(例如 numpy 或 scipy,参见 https://stackoverflow.com/a/26716031/3244382)。

然后您必须确定每个文件的 t 和 s。如果文件不是太嘈杂,音频信号上的简单阈值就足够了。更复杂一点的方法是计算 RMS 能量包络(平均信号),并在其上使用阈值。

一旦您知道 st,您就可以使用相同的音频库从这个边界编写一个新的音频文件。

【讨论】:

    猜你喜欢
    • 2013-12-16
    • 2021-04-29
    • 2021-08-04
    • 2022-08-15
    • 1970-01-01
    • 1970-01-01
    • 2015-11-20
    • 1970-01-01
    • 2020-04-05
    相关资源
    最近更新 更多