【问题标题】:Removing same audio sections from audio files从音频文件中删除相同的音频部分
【发布时间】:2014-05-20 20:22:39
【问题描述】:

作为一名收藏家,我从播客服务下载了数千个音频文件。所有提要都以 15 秒的相同介绍开始。这对我来说很烦人,所以我尝试将它们全部裁剪。

但它们都不是规则的。语音演示完全相同,但其中一些......

  • ...从 00:00 或 00:05 或我们不知道的任何秒开始
  • ...启动时没有介绍

我无法确定应该裁剪哪几秒。

问题:我们如何根据特定的音频剪辑裁剪所有音频文件?

用其他说法“检测相同的部分并删除它”?

【问题讨论】:

  • 您是否尝试过在视觉上比较两个介绍剪辑?它们看起来完全一样还是接近?如果是这样,那么您可以执行简单的搜索。否则,可能会非常困难。
  • 让我们知道您愿意为解决方案使用哪些软件平台可能会有所帮助。
  • 嗨@jacket。两个介绍剪辑看起来完全相同或接近。亲爱的罗斯·本西纳你是对的。我也不知道我需要哪个软件平台。也许是大胆。
  • @RarLines Stackoverflow 是一个编程社区,我假设您知道如何对计算机进行编程以处理音频?

标签: audio audio-processing audacity


【解决方案1】:

据我了解,您已经有办法在特定点裁剪文件。所以问题归结为找出每个剪辑中介绍的结束位置。以下是我的做法:

  • 首先,手动将介绍音频隔离在单独的文件/缓冲区中。
  • 对于每个剪辑,您需要确定在剪辑中出现介绍音频的位置。通过在介绍音频和主剪辑之间计算cross-correlation 来做到这一点。正确的偏移量将是具有最高相关系数的偏移量。 (您也可以在均值差中寻找最小值,这是等效的。)
  • 知道介绍音频的位置后,您就可以计算裁剪位置。

有一些明显的优化:

  • 仅在每个剪辑的前(例如)30 秒内搜索介绍音频。
  • 不要搜索整个介绍音频,只搜索最后 1/2 秒。
  • 如果您不能 100% 确定音频是否存在,则可能需要设置接受阈值。

【讨论】:

  • 感谢您的回复,但 stackoverflow 让我大吃一惊!如何“搜索”和“设置阈值”找不到所需的软件平台
猜你喜欢
  • 2021-03-29
  • 2019-10-23
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-05-24
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多