【问题标题】:What does a sample of audio data represent?音频数据样本代表什么?
【发布时间】:2016-03-24 15:44:52
【问题描述】:

我想知道单个音频数据样本(未压缩的 PCM)代表什么。

它是一个数字,但这个数字究竟是什么,它又是如何被转换回音频的呢?

例如如果是4位采样,0代表绝对静音,15代表最大音量吗?

如果是音量,我们在谈论什么频率?频率信息是如何存储的?

在歌曲中,我们可以同时听到各种乐器(频率),这意味着每个频率都以某种方式存储在单个样本中。这是怎么做到的?

【问题讨论】:

标签: audio pcm


【解决方案1】:

音频只是一条随着时间向左/向右上下摆动的曲线。在给定的时间点,样本是曲线高度的量度。静默是当曲线不摆动时......它只是变平......在零值处,样本值为 0(更准确地说是其范围从最大值到最小值的中间值)......当曲线达到其最大高度时向上或向下这段音频是最响亮的

归一化的概念很重要……曲线值的绝对范围(最大向上或向下)是任意的……可以是任何东西……假设最大值为 15,最小值为 0……记住静音是没有晃动,所以最大上/下静音的中间大约是 7

曲线可以编码为任意数量的位...这大致映射为您将曲线切成多少条水平线...更多线更多位因此曲线高度样本值的准确性更高

A sin or cos curve 被认为是纯音 ... Joseph Fourier 证明了任意曲线(音频或其他)可以以 (A) 各种音量(最大向上/向下)的一组 sin 曲线的形式存储(B )各种频率(C)各种相位偏移......有趣的是,这种变换可以在任何一个方向上起作用:从任意形状的曲线到一组以上(A/B/C)或从一组(A/B/C)回到合成任意形状的曲线(这就是音频合成器的工作原理)

关于频率存储的信息被烘焙到曲线形状中......这完全是关于曲线上下摆动的频率......从中间线下方到上方穿过很长时间的懒惰摆动是低频.. . 一段紧密间隔的波浪线暗示着高频的尖叫声

当麦克风记录多个人同时说话或各种乐器都发出自己的声音时,我们有许多同时的频率,但录音却不知何故正常工作 - 怎么样?想想麦克风内部(或你的公寓eardrum)发生了什么......它的线圈可以被认为是一个平面(一个2D表面),它只能向上或向下晃动......要么只能向后移动,要么第四……这是一条任意曲线……一条曲线在从最大值到最小值时在某个时间点具有其高度值

【讨论】:

    猜你喜欢
    • 2016-01-10
    • 2012-02-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-02-26
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多