耳朵对于声音识别的原理_音频制作新闻

耳朵对于声音识别的原理

更新时间：2017-8-9 8:53:02　编辑：臧成　文章来源:音响网　调整文字大小:【大中小】

人们常说的听声辨位就是人们在听到声音以后，能辨别出声音是从哪个方向传播过来的，而声音在不同环境下传播的又不一样，这就是人耳对声音方向感的作用。
　　声源方位感，是听觉器官对声音的音高、音强、音色、音长感觉之外的又一个感觉要素，它涉及到复杂的生理学心理学方面的问题。同时，声源方位感也是立体声技术的理论依据。
　　一、时间差、相位差与声级差、音色差
　　双耳效应借以定位的原理是时间差、相位差、声级差、声色差。
　　（一）时间差和相位差
　　时间差主要是指声音刚到双耳瞬间的先后差异。声波在常温下传播的速度为344m/s，当声源偏离听音人正前方中轴线时，耳A与耳B同声源之间的距离有差别，从而出现声音到达耳A与耳B之间的时间差。
　　时间差作为声源定位机理，对正面和两侧的声源定位准确性较高，对来自后面的声源定位则误差较大。其原因尚不十分清楚。可能因为声音来自背侧，会因为左耳或右耳产生耳壳遮蔽效应，使得声音因衍射而时差有变化。
　　因为人耳对声音有适应性，当声音到达基底膜的刹那间，毛细胞表现兴奋而灵敏。当声音持续刺激，毛细胞的反应相对地迟钝。因此突发声和瞬态声的声源定位准确性较高。
　　一个迅速流动的声源，会吸引听觉的注意。因此，方位不断变化的声音，人耳对其方位辨认的误差较小。这就是近代立体声节目出现声移位的原因。
　　一个连续的声音，虽然到达双耳也存在时间差，但是因为达到同一只耳朵的后续声掩盖了前面的声音，使时间差变得不明显。
　　高频声与低频声传播速度是一致的，所以时间差同声源的频率无关。但相位差同声源的频率有关。当一个声音到达双耳，在两耳之间出现时间差的同时，亦必然出现相位差。在一定的频率范围内，相位差是声源方位感的信息之一。
　　相位差定位机理在频率较低时效果较明显。例如，在常温中20Hz声音的波长是17m，200Hz为1.7m，时间差所形成的相位差人耳能够感觉出。而在声源处于高频区时，例如10kHz的波长85px，20kHz是42.5px，时间差所造成的相位差甚至超过360°，等于开始另一个波长。这时的相位差作为定位信息已无任何作用，因为已无法分辨出相位属于滞后或超前。因而高频声属于“混乱的相位差”信息。
　　（二）声级差和音色差
　　声级差指声波到达两耳出现不同的声强。形成声级差的主要原因是遮蔽效应。前进中的声波如遇到几何尺寸等于或大于声波长的障碍物，会发生遮蔽效应。其原理是：高频声在传播遇到障碍物时，因无法越过障碍物，在障碍物后面形成声阴影区；低频声波长大于障碍物而在障碍物后面形成声衍射区。对声级差起重要作用的是高频声，因为高频声波不能绕过听者头部，所以处于声阴影区的那只耳朵比能够听到直达声的那只耳朵，声强级产生差异。频率愈高，声源偏离正面中轴线愈大，声级差就愈明里。
　　从衍射效应的角度看，低频声当然也会形成声级差。但是由于头部直径为500px左右，低频声发生衍射时，多走的路程有限，因衍射而损失的能量很小，因而偏离中轴线的低频声，到达两耳的声级差几近于零，对声源定位作用不明显。
　　遮蔽效应对音级差产生作用的同时，亦必然对音色差发生作用。我们知道，构成音色的主要成分是基础音及其上方各次谐波的分量。举例说，一个基频为200Hz，入射角为45°的复合波点声源，那么，它的基础音和低次谐波遇到头部障碍后产生衍射效应，其高次谐波则被头部遮蔽而出现高频声阴影区。这时，到达一侧耳朵的声音为直达声（原音色），到达另一侧耳朵的声音因为高频损失而使音色发生变化。大脑皮质根据两耳的音色差来辨认声源方位。由此可见，音色差是高频信号声级差的另一种反映。
　　应该指出，音色差的形成主要是那些基频在60Hz以上的复合音声源。因为60Hz以下的声音高次谐波波长较大，遇到头部尺寸（直径约500px)的障碍并不产生遮蔽效应。例如基频为30Hz的声音，其16次谐波为480Hz，波长为0.716m，波长比头部直径大许多，双耳之间不会形成明显的音色差，其17、18、19次谐波，强度很弱，对音色构成意义不大。因此，60Hz以下的声音比中频、高频声的声源方位感准确率要低。
　　从强度差和音色差对双耳效应作用中，可以推想，纯音比复合音难以定位，原因在于纯音是正弦波（单个波），不能构造音色差。
　　（三）声源深度感
　　声源深度感是听音人与声源之间的距离，所以声源深度感又称声源距离定位。
　　声源深度感常常同某个数字模式相联系。当我们听到一个声音时，我们除了感觉到这个声音发生的大致方位外，还会感觉到这个声音发生的大致距离。若要精确地感觉到声源的深度，则要熟悉声场环境，熟悉声源音色，或者直接借助视觉去测量声源与自己的距离。由此说明，声源深度感是后天形成的，可训练的。
　　深度定位主要通过声波衰减的程度来判定。声波在辐射过程中，能量随传播的距离而损耗，首先是高次谐波中振幅较小的先衰减，形成音色变化。人耳听到声信号后，同大脑储存的声信号作比较，从而判断这个声信号声源的深度。
　　深度感的另一途径是声源比较法。当有数个不同距离的声源（阵声源）存在时，人耳可通过靠近的点声源来推测出其它声源的深度。多个不同距离和入射角的点声源所形成的阵声源，使听觉产生声音的宽度感和包围感。再重复一句话：声源深度感通常同视觉并联，靠视觉形成经验，靠视觉帮助精确定位。
　　（四）时间差和声级差的组合
　　双耳效应所产生的各种差别，对声源方位感都可以单独发生作用。在它们相互结合时，则产生综合作用。如果它们的作用相反（正常情况下极少发生），那未就相互抵消。近代立体声技术的实践证明，时间差和声级差的组合，对声源方位感效果十分明显。实验证明，在一定条件下，1ms时间差相当于5?12dB的声级差，其关系可互换。
　　在一个混响时间超过正常声学要求的大厅里，声源的反射声、混响声级大大超过其直达声。这时，人耳对声源的第一波阵面的刺激最为敏感，如果反射声和混响对于直达声延时40 60ms，人耳尚可能把握声源方位。如果延时超过这个范围，人耳无法分辨原发声到达双耳的时间差和声级差，就会产生分离的方向感，或混乱的方向感。这就是为什么一个回声很重的大厅里，人们常常不容易把握声源方位，需要用眼睛定位的缘故。
　　二、声源方位感机理
　　古典心理声学认为，人对声源感觉主要依靠双耳听音差别，称为双耳效应。如同双眼观察景物产生透视感、立体感一样，通过双耳对声音强弱差别的感觉，可以判断声音来向、产生立体声感。直到现代，双耳效应仍是声源方位感的主要理论根据。但近年来，专家发现单耳丧失听力的人，仍有声源方位判断能力，于是提出了耳壳效应这个新理论，使声源方位感理论更趋完善。
　　声源方位感的机理十分复杂。双耳效应的原理认为：由于双耳位置在头部两则，假如声源处于人的正前方的中轴线，则声音到达双耳的时间、声强级和相位是一样的；假如声源偏离听音人正前方的中轴线，则声音到达两耳的距离不等，因此，声音到达两耳会出现时间差和相位差。同时，因为一侧耳朵出现遮蔽效应因而两耳之间出现声级差、音色差。
　　声源方位感是先天就具备的生理功能，然而声源方位的宽度、深度及一切与数字相关的感觉，则与一个人后天的经验有关。
　　三、耳壳效应
　　早在一百多年前，就有人发现单耳失聪者，仍有辨认声源方位的能力，并提出过耳壳效应的设想，但不为人们所重视。直到本世纪六十年代，当立体声技术得到长足发展之后，人们认识到双耳效应对某些声源方位感觉难以解释，于是耳壳效应才得以被人重新认识。
　　当我们孩提时代，都可能做过一些有趣的试验，比如把耳朵往外拉成兜风耳，这时我们感觉到外界的声音突然变大变清楚了；如果把耳朵向后按到贴住头骨，又会发现声音减弱了。如前所述，耳壳有反射并聚集声音的功能。同时由于耳壳凹凸不平，因此，耳壳不同的部位所产生的反射声，比直达声稍迟进入耳鼓，形成比直达声极短延时量的重复声，重复声比直达声的延时量因入射角不同而异。
　　耳壳效应对判断来自听音人背后的声音也有效。当一个声音来自背后时，耳壳将阻挡了这个声音的高频泛音，这样，同前方的声源相比，出现了明显的音色差；同时，由于耳壳的遮蔽作用，来自背后的声音将不产生重装音。大脑听觉区将这些信息同以往掌握的信号相比较，从而得出声源出自背后定。
　　四、单耳效应
　　单耳效应是指双耳效应原理范围内的单耳聆听定位功能。毫无疑义，一个双耳听力正常人主要以双耳聆听来辨认声源方位。然而一个有趣的事实告诉我们，人们不是平均使用双耳去聆听音响，而侧重地使用一边耳朵。
　　例如，当一个点声源，出现在听音人左侧偏离中轴线35°的近处时，听音人听到声音并同时测出声源的大致方向；倘若听音人被该声源的音响所吸引，那么便会将头转向左方35°使自己的中轴线对准声源，以便用双耳（同时使用双眼）来辨认声源的准确位置；假如声源仍未准确测出而吸引力进一步加强时，听者会将头部向右转动用左耳向着声源方向，并向声源靠拢，直至找到声源准确位置为止。这个过程，亦即判断→校正→寻的三步曲，反映出听觉定位全身协调机制，同时说明单耳聆听在定位中的重要意义。
　　五、骨导定位机理
　　双耳效应、单耳效应和耳壳效应的原理，给听觉定位提供了主要依据，似乎听觉器官的声源方位感机理已经得到全面的解答。然而细细一想，发现听觉定位机理中的一些细节，仍未得到完全合理的解释。例如来自听音人背后的声源，人耳是如何辨认出来的。按照双耳效应和耳壳效应原理，来自背后声音的辨认，主要是根据耳壳遮蔽效应，形成了背后声音与正面声音的音色差，而这种音色差的感觉出自大脑听觉对以往的经验对比。试验证明，三个月的婴儿就能够判断出来自背后的声音，同样地，一个成年人可以判断出一个来自背后而从未听到过的音响。由此可见，人耳背后声源的定位不能仅仅归结为音色差。
　　专家们认为，必定还有一种听觉功能，来辅助人耳判断来自背后声源方位。这功能就是骨导定位机理。
　　关于骨导定位的可能性，历来颇有争议，争议的焦点不是颅骨能否传导声波，而是外界声波有多大比重由气导转化为骨传。有学者认为，声波在传播的过程中，从一种媒质进入另一种媒质时，在两种媒质的分界上会发生反射和入射，根据牛顿第二运动定律，可算出声波在颅骨的入射和反射的声强。经计算，反射波的声强级达99.89%dB，入射波仅为0.00003%dB，这表明外界声能量几乎全部被反射掉了，因此认定，骨导定位功能实际上不存在。
　　笔者认为，关键问题是存在不存在入射波，如果承认入射波的存在，那么能量比重即使极微量，在临界限度以上，人耳就能感觉得到。
　　耳蜗基底膜上的毛细胞既然能够感觉到位移为1/10埃（1埃相当于氮原子的直径）的振动，那么，人耳可以感觉到由骨导传入的微量声信息。
　　我们知道，耳朵处于头颅两侧约114.99999999999999px的深处，此处与头颅外表各部位距离不等，头颅外表正对声源的部位进入耳蜗的声波之间形成骨导时间差，同时两耳之间亦存在骨导时间差。声波在颅骨的传播速度为3013m/s，气导速度为344m/s，头颅外表各部位与耳朵的距离约4.6~385px,为此，骨导直达声与气导直达声之间存在时间差，大脑听觉区根据骨导时间差及骨导与气导之间的时间差，迅速判断出声源方位。
　　从理论上说，骨导的定位功能是全方位的，因此，骨导定位机理对来自正面、侧面、背面和头顶上面的声波都有作用。不过骨导定位功能又是辅助性的、次要的，是对双耳效应和单耳效应、耳壳效应的补充。

更多相关： 耳朵声音识别原理

<< 去音响网首页

　网友评论