【问题标题】:How to apply data-augmentation on acoustic datasets?如何在声学数据集上应用数据增强?
【发布时间】:2020-03-24 09:46:46
【问题描述】:

我有一个小的人类声音声学数据集,我想对其进行扩充,然后将其传递给二元分类器。

我熟悉图像的数据增强,但声学数据集是如何完成的?

我找到了 2 个关于 autoencodersSpecAugment with Pytorch & TorchAudio 的相关答案 但我想听听您对特定于音频的“最佳方法”的看法。

【问题讨论】:

    标签: python data-augmentation acoustics


    【解决方案1】:

    这实际上取决于您要实现的目标、分类器的设计目的以及它的工作原理。

    根据上述情况,您可以例如以不同的方式剪切音频(如果您正在为分类器提供剪切的音频片段,这在您的特定情况下是有意义的)。您还可以使用一些具有不同信噪比的背景噪声(如白噪声或录制的人工噪声)来增强它 - 这应该另外使分类器对噪声更加鲁棒。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-02-08
      • 2018-11-14
      • 2022-12-11
      • 2017-10-20
      • 1970-01-01
      • 2020-07-22
      • 1970-01-01
      • 2020-05-01
      相关资源
      最近更新 更多