声音是什么,它是如何产生的,如何改变和分析声音?本文将介绍声音的基本特征,并看看一些典型的声波及频谱。这里需要用到一些数学知识,但我希望主要的思想可以使读者不需要花太多时间便可理解。
图片
什么是声音
1. 静压
我身边的一切,我坐的椅子,我呼吸的空气,以及我喝的伏特加马提尼鸡尾酒,所有的都是由称为原子的微小粒子组成的。这些原子被特别地组成为一个较大组合叫做分子。例如,在我喝的酒里,用来稀释酒精的水,就是由百亿以上的分子组成,其中每一个分子由两个氢原子和一个氧原子构成。分子和原子在气体和液体中可以自由地移动,因为它们之间的粘连很微弱。与此相反,在固体中的分子和原子联系紧密,以产生致密的结构;我的椅子(它是由固体组成的)中的分子是相当密集的,而在空气中(其由气体组成的),这些分子间隔相对较远。
空气中的分子不断地移动,数百亿空气分子持续碰撞,从而在任何一个与空气接触的物质上形成一个静态压强。压强取决于空气的密度(每单位体积中分子越多,分子碰撞物体的次数越多,产生的压强也就越大)和空气的温度(温度越高,空气中分子移动得越快,它们彼此碰撞越多,产生的压强越大)。由于地球万有引力的原因,靠近地球表面的空气分子被挤压在一起,造成每平方米十万牛顿的压强(牛顿/平方),也就是大气压强。牛顿是一个力单位(一个质量为100g的物体,如一个小苹果,大约为1牛顿)。一平方米是一个面积单位,那么压强则是代表每单位面积上测得的压力。因此,对于一个恒定的力,面积越大,压强越小。
2. 压强变化
如果空气被一个物体(声源)的运动或振动所干扰,则空气密度将会不断变化。当振动物体向外移,将附近的空气分子推开,并挤压在一起,导致密度和压强略有增加,形成密部;当振动物体向内移动,空气分子散播开来填充空出的空间,产生密度和压强略有下降的疏部,这些压强变化被称为声波。
声波由交替的密部和疏部组成,我们通常经历的压强变化是非常小的(通常少于大气压的0.01%)。声源产生的压强变化在空气中传播的方式,大致与在一个池塘里投入石头产生的水波的方式相似。然而,也有一些重要的差异。声波能在三维空间内向所有方向传播,然而水波在平静的水面传播时,仅是在两维空间里。另外,在水波中,分子向上和向下振荡做圆周运动;而声波是纵波,声波的粒子(例如,在空气中的分子)沿着波运动的方向向前和向后振荡。
可以这样试想一下,空气好像一条被弹簧连接起来的高尔夫球链(这个比喻由霍华德和安格斯于2001年提出)。如果最左端的高尔夫球从左边被推到右边,则弹簧将被压缩(密部),从而导致旁边的高尔夫球移动到右边,然后将导致下一弹簧被压缩,接着使旁边的高尔夫球右移……如此,沿着这条链传遍所有高尔夫球。同样,如果将最左端的高尔夫球向左拉,弹簧将被拉伸(疏部)导致下个高尔夫球移动到左侧,使下一个弹簧被拉伸,以此类推。根据这一模式,如果一个高尔夫球从一边向另一边移动,然后其振动方式将沿着整条链传播,见图1。
图1 一个外力干扰沿着由弹簧连接的高尔夫球链传播的示意图,从上到下展示了七个连续的时间段
实质上,这就是声波如何通过介质传播的。在空气中,空气分子之间没有像弹簧一样的连接,但是大量的分子相互碰撞和传递动量的效果,可以以这种方式来表示。用过自行车打气筒的人都知道,堵住喷嘴运动活塞时,会明显感觉到压缩之后的空气有外弹的作用力。
举一个更为具体的例子,扬声器可将电势的变化转换成声波。扬声器对空气进行推拉,产生交替的密部(扬声器纸盆向外移动所产生的高压)和疏部(扬声器纸盆向内移动产生低压)。图2所示的是工作状态的扬声器在空管中的情况。阴影处表示的高压区域,明亮处表示低压区域。按压力变化的顺序排列,从扬声器首次开始移动起(顶图)到完成了近两个周期的时刻(底图)。重新用水作为比喻,你可以想象一下在一个方形敞口鱼缸里上下移动你的手,同样会产生类似的波动。在这种情况下,在图2的阴影处代表高水位,并且明亮处表示低水位。
图2 一组扬声器在空管内产生的声波的示意图,阴影处表示高压(密部);明亮处表示低压(疏部)。右图是管内压强随扬声器位移变化而变化的一个函数曲线图。横线代表大气压强。
3. 声音的速度
声波在空气中是以一定的速度传播的。虽然该值取决于空气的密度和温度,在常压下的声速是约330米每秒(米/秒)也就是740英里每小时,或者1马赫。与6.7亿英里时速的光速相比,声波传播速度真是慢成了渣渣。声音在空气中的慢速行程在大型演唱会上会导致这样的郁闷情景:由于声波传播延迟,前排的粉丝的拍手和后排粉丝的拍手完全不在一个节奏上。
声波在最重要的介质——空气中的传播。然而,理论上声波也可以在其它物质中传播。在某一定点施加一点压力变化将引起这个压力变化以一定的速度传播,这个速度取决于该物质的密度和硬度(想想之前说的高尔夫球和弹簧)。物质的密度越大,速度越慢,因为过重的物体需要更长的时间来加速。物质的硬度越大,速度越快,因为对于一个特定的位移,弹簧越硬,产生的弹力和加速度就越大。例如,声音穿过钢铁(非常硬)的速度为5200米/秒,而声音穿过硫化橡胶(密而不硬)仅为54米/秒。我们对于水中产生的声音了解得比较多,它被许多海洋哺乳动物用来交流,在水下也可以通过回声(声纳)来识别物体。虽然水比空气密度大一些,这可能会使水中的声速较慢,不过水比空气硬度大多了,所以总体来说声音在水中的传播比在空气中更快,约1500米/秒。
图片纯音的特性
1. 频率与相位
根据一个声学家的观点,最简单的声波是纯音。图2中扬声器中发出的声音是一种纯音。纯音的声压的变化与时间成正弦关系:
式中,x(t ) 表示随着时间t 的推移,压强的变化;A 表示峰值振幅(或压强);f 表示该纯音的频率;Φ 表示起始相位。这个正弦函数产生的波形随着时间的推移在±1之间上下交替变化。这个众人皆知的常量π,是圆的周长和直径的比值 (3.14159265...),正弦运动是最简单的一种振动形式。观察正弦运动可以通过观察一个振子的位移随时间的变化,例如一个砝码连在弹簧一端的上下移动,或一个摆锤的前后摆动。
声音的频率是指纯音(疏波密波交替)在一定时长、一定位置发生循环的次数。高频一般与高音(明亮的声音)相联系,低频与低音(柔和的声音)相联系。声音的频率是测得的每秒钟完成周期的次数,也就是赫兹 (Hz)。换句话说,纯音的频率用赫兹作单位,在数值上等于每秒钟空气压强从高到低,再从低到高循环往复的次数。有时在测量高频音时,使用千赫兹 (kHz) 作单位更方便。
纯音的周期是频率的倒数,也就是指纯音完成一个交替密波疏波的周期所用的时间。因为声音的速度在一个给定的介质中是不变的,声音的波长——也就是涵盖声音振动一个完整循环的物理距离,是频率的简单函数。并且,波长等于波速除以频率:高频率,低波长,反之亦然。如图3是纯音的周期和波长,如图4是两种不同频率的纯音(因此周期不同,频率不同)。
图3 纯音的压强随时间和距离的变化。这个图形说明周期和波长的关系。
另外一个重要的概念就是相位,纯音的相位就是在一个特定的时间到达的声压曲线上的一个点。对于波的一个周期,相位覆盖的范围是360°或者是2π 弧度。(一些读者可能注意到相位的测量方式与圆周角测量很类似;360°或2π 弧度对应于一个完整的圆周的角度。这并不是巧合:正弦函数和圆周在数学上是相关联的。一个垂直圆周上做匀速圆周运动的质点的高度与时间是呈正弦函数关系的)想象相位是在秋千上推某个人,如果你在一个恰好的时间推,也就是说,在每个周期中的正确的相位推一下,你就会增加秋千震荡的高度。相位的测量是相对的,我们可以举一个例子,在一个特定的时间点,一个纯音比另一个纯音的相位延迟π,如果前者波形位于波峰,那么后者是在波谷。在上述方程中,初始相位 (Φ) 是指在时间为0(t=0) 时的相位。时间为0不是指创世之初,而是指波形的开始,或是指声源振动的开始。初始相位是一个相对量,其参考量是波形经过0并且在上升的相位(也被称作正向零交叉,见图4)。如果一个纯音从正向零交叉这一点开始,那它的起始相位就是0。如果它始于一个峰的最高点,那起始相位就是π/2。两个始于不同相位的纯音如图4所示。
图4 每个图形显示了两个不同纯音的声压随时间的变化(简化图)。该图显示了不同频率,相位和振幅对声波的影响。
对于听觉来说,相位是非常重要的,因为叠加两个纯音在一起之后的效果取决于它们的相位差。如果我们叠加两个相同频率的纯音,并且它们之间没有相位差(“同相”相加),那么波形的峰值将会重合,其结果将是一个高振幅的合成波形。然而,如果一个纯音延迟了π ,即半个周期,那么另一个波形在最高峰时,另一个波却处在波谷,反之亦然;如果两个纯音的峰值振幅是相等的,那么波峰和波谷将抵消,没有声音。这个原理用在“噪音消除”耳机中,生成一种反相位的声音来消除环境噪声,从而提供安静的聆听体验。(出于实际原因,这个效果只有在低频时很好。)
2. 振幅和强度
声波的振幅就是指声压与大气压的偏差的大小。两个振幅不同的纯音如图4所示,可以在某个时间点测量瞬时声压,瞬时声压随着波形而周期变化。然而,振幅通常指波形处于波峰时的声压。此外,振幅可以指单个压强差的平方的平均数的平方根。这就是所谓的均方根 (rms) 声压。均方根声压可视作一种平均声压,加权了声压最高值和最低值,并且将负压修正为正压。(如果只是算平均数,那么负压和正压将抵消,其结果是所有的波形是零)对于纯音,均方根声压等于1/√2(即0.707)倍的峰值声压。
图5 一个纯音波形上不同的点的相位。相位测量是相对于最左侧的正向零交叉的。注意,该波形的每个完整周期对应于2π 的间隔。该图还显示出了该声波的峰值幅度或声压。引自Moore的文章(2012)。
由扬声器产生的声波的振幅或声压,是和扬声器纸盆的移动速度成比例的。速度越高,在空气中所产生的声压就越高。这个速度取决于扬声器纸盆每个周期移动的距离和每秒运动的次数。显然,如果扬声器纸盆移动距离不变,其产生一个高频的声音所需要的移动速度一定比产生低频音的移动速度快。这意味着,如果每个扬声器纸盆在每个周期内总是移动相同的距离,高频音与低频音相比会有较高的声压,会更加响亮。相反,要生成一个与高频声振幅相同的低频声,扬声器纸盆就需要每个周期移动得更远,这就是为什么当扬声器发出低频声时,我们肉眼几乎可以看到或者感觉到扬声器在振动,同时也是低频扬声器比高频扬声器更大的原因。高频扬声器不能发出低频声音,甚至会导致扬声器损坏,因为高频扬声器没有办法使纸盆移动足够的距离,来达到所需要的高声压。
虽然压强是一个有用的单位,但它在声学中也可以指声音的强度。声强的定义是每秒钟通过单位面积(例如:一平米空气)的声音能量;功率就是每秒传输的能量;强度的单位是瓦特(功率单位)每平方米 (W/m²)。声强与声压的平方成正比,故有该公式
其中,l 是强度,P 为均方根声压,k 是常数。
3. 分贝
如果用声压或者声强来衡量我们周围的声音,则会出现巨大的数值范围,很不方便。引起痛觉的最大声强是绝对听阈(我们可以听到最小的声音)处声强的十亿倍。显然,如果我们一定要使用声强来描述的声音,这将是一个庞大而且繁杂的数字。相反,我们用一个叫做分贝 (dB) 的对数值来描述强度,声强用分贝为单位表达叫声强级。分贝需要用到两个声强的比值,具体说是强度比的对数再乘以10。如果你想用分贝表达绝对声强级,你需要用到一个参考声强或者参考声压。
其中,I 表示声强,I0 是标准参考声强,P 是均方根声压,而P0 是标准参考声压。通常,空气中的参考声压是0.00002牛顿每平方米。(2×10-5W/Mp²)对应参考声强为10-12瓦每平方米(W/M²)。声级相对于这个参考点称为声压级 (SPL)。如果一个声音的声压和参考声压一致,则声压级为0dB SPL,因为log10=1。之所以选择0dB SPL为参考声压,是因为这个声音最接近人类1000Hz所能听到的最小声音(绝对听阈)。
图6 左图显示了强度比对应的分贝数,右图显示了一些常见声音的声压级分贝数。
让我们回顾一下这些数值,我们已经知道大气压是105N/m²,以及我们能听到的最小声音约为2×10-5N/m²。这就是说我们可以听到的最小的压强变化是大气压十亿分之一。这比例相当于在1000公里深的海面上,仅1毫米高的微波。120dBSPL的声音所对应的压强变化仅是大气压强的1/5000,尽管如此,如果你傻到去听120dB SPL的声音,它不仅会使你难受而且会伤害到你的耳朵。其实,我们在日常生活中听到的声波对应的压强变化都是非常微小的。
除了dB SPL,另个一比较常用的声级单位是dB(A),或叫A计权分贝。这种计权方式基于正常人耳对不同频率的强度敏感性,相应降低低频和高频的声强。具体来说,这种计权方式是基于比较测试音的响度与40dB,1000Hz的纯音的响度的差别。对于一个1000Hz的纯音,dB(A) 和dB SPL的值是相同的,但对一个200Hz的纯音来说,dB(A) 的值小于dB SPL,这反映了耳朵对200Hz的声音的灵敏度比对1000Hz的声音灵敏度要低。dB(A) 经常被用于度量环境噪声。
图6显示强度计量对应的分贝计量。对数和分贝需要花时间去适应,但是最需要记住的一点是:在强度与分贝之间转换的时候,分贝以常量增加时相当于强度的以常量倍数增加。例如,一个很典型的分贝量级的例子是:增加10dB对应于10倍的强度(因此20分贝对应100倍,30分贝对应1000倍),增加3分贝(大约)相当于强度增加一倍,这样我们描述声音时所需要用到的数字范围就从约1000000000000减少至(单位强度)约0到120分贝的范围内。终于没那么可怕了!顺便说一句,我曾经听奥兹奥斯本(著名摇滚歌手)说他自己有听力障碍,因为他的一生一直在听300亿dB(或诸如此类的声音)。300亿分贝相当于10的2999999988次方的强度(即,1的后面有3000000000个零)瓦每平方米:那是足够摧毁宇宙的力量,更何况是他的耳朵。图6显示了声音级从0到120分贝的声音,该图也描述了日常生活中会遇到的一些声音的分贝数,包括奥兹奥斯本所能承受的最大的刺激声。
因为分贝数以常量增加代表声压或者声强以常量倍数增加,所以在形容一个声音的放大或衰减的时候,分贝这个单位是非常直观的。例如,一个线性放大器将声压和声强放大一定的倍数,不管起始声强是多少,其对应的分贝数都是以一个常量增加的。
两个声波所产生的瞬时声压会在空中叠加产生一个更复杂的波(这是一个线性叠加的一个例子)。我们用水来打比方,如果你把两个石子丢到水中,产生的两个波浪会重叠,有时会产生一个波峰,有时会产生一个波谷,有时会抵消彼此而消失。两种不同的声音的波形(例如,两个不同频率的噪音或纯音)通常会加在一起,使波形和声强(并不是声压)改变。这的确是真的,因为由于时间不同,两个声音之间的相位关系通常会不同。有时波峰与波峰重叠从而峰值增加;有时波峰和波谷叠加从而压力抵消。净效应是平均强度会线性叠加,两个同相位的相同的波的叠加(他们所有的峰重合)将使两个声压叠加。在这种情况下,该组合波形的声强要大于原来的两个波形的强度的线性之和。
回到我们关于分贝这个单位的讨论中,请记住当两个声音结合时,并不能将两个声音的分贝值直接相加。一两个40dB SPL的声音叠加不会产生80dB SPL的声音;一个80dBSPL的声音比40dB SPL的声音响10000倍。事实上,这两个声音加在一起(假设一个随机相位关系)将产生一个43dBSPL的声音。
|