【问题标题】:Convert Voice A to Voice B using librosa使用 librosa 将语音 A 转换为语音 B
【发布时间】:2020-11-27 09:23:34
【问题描述】:

我是 librosavoice/sound 分析的新手。我在SOgoogle 中搜索了这个直截了当的问题,但没有得到可以理解的答案。

考虑有两个声音AB。我想将voice A 转换为voice B

考虑到这两种声音,是否有可能在 A 上做一些事情,听起来像 B

【问题讨论】:

    标签: python-3.x machine-learning voice-recognition voice librosa


    【解决方案1】:

    这种任务有时被称为“风格转移”,其中一个人保持内容相同(口语),但通过风格改变表达方式(prosody,他们的口语)。要搜索的一些关键字是语音风格转移、语音风格转移、音频风格转移、语音翻译、语音克隆、韵律转移。这是来自该领域的从业者 Kyle Kastner 的explanation of some of the approaches

    良好的语音风格迁移是一项相当艰巨的任务,过去几年已经有很多研究论文。许多使用神经网络的语音风格转换系统是对文本到语音 (TTS) / 语音合成模型的改编,例如 Tacotron、Tacotron 2 或 Wavenet。

    Github 上有许多神经语音风格迁移论文的开源实现,但其中许多需要大量设置才能使用(下载数据集、模型、格式化输入等)。最流行的替代方案之一是Real Time Voice Cloning,它应该能够克隆具有 5 秒音频的声音。 另一个例子是https://sforaidl.github.io/Neural-Voice-Cloning-With-Few-Samples/

    【讨论】:

      猜你喜欢
      • 2023-01-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多