【问题标题】:How Shazam or Sound Hound works? [closed]Shazam 或 Sound Hound 的工作原理是什么? [关闭]
【发布时间】:2012-04-04 15:31:30
【问题描述】:

我正在使用 SDK for iOS 5.0 和 XCode 4.2 开发一个 iOS 应用程序。

我想开发一个识别声音的应用程序。我看到有一个名为 Sound Hound 的应用程序可以识别音乐并告诉艺术家和标题。

我该如何做类似的事情?我想将声音与现有的声音数据库进行比较。 我该怎么做?

也许我可以使用 傅立叶变换。我不知道如何处理声音。或者它可能类似于语音识别,不是吗?

【问题讨论】:

  • 这是一个相当简单的算法,但应用的真正关键是该算法已获得专利,所以如果你尝试自己实现它,吸血鬼牙齿的律师会凭空出现并吸你的生活......;)
  • 好吧,我不想要那个。我想知道如何比较声音。使用傅里叶变换?
  • 这可能会有所帮助:gizmodo.com/5647458/…
  • 感谢您投票结束,不要说出原因。

标签: ios audio signal-processing fft speech-recognition


【解决方案1】:

我看到了一篇解释音频搜索算法如何工作的论文。这是link。它是由 SoundHound 的竞争对手应用程序 Shazam 的一位开发人员编写的。

【讨论】:

    【解决方案2】:

    【讨论】:

      【解决方案3】:

      Shazam 应用程序是链接开放数据中应用程序的最佳示例之一,它从最终用户那里获取简短的样本音乐,并从数据集中识别歌曲以及购买专辑的链接。

      用户标记一首歌曲 10 秒,应用程序根据简化频谱图的一些锚点和它们之间的目标区域创建音频指纹。

      对于目标区域的每个点,他们创建一个哈希值,该哈希值是锚点所在的频率、目标区域中该点所在的频率以及两者之间的时间差的组合。点在目标区域中以及当锚点位于歌曲中时。

      创建音频指纹后,Shazam 开始在数据库中搜索匹配项。如果匹配,则将信息返回给用户;否则它会返回一个“未知的歌曲”对话。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2010-11-30
        • 1970-01-01
        • 1970-01-01
        • 2021-01-07
        • 1970-01-01
        • 1970-01-01
        • 2015-12-12
        • 2019-12-09
        相关资源
        最近更新 更多