服务热线:400-6787-160
音响网(Audio160.com) > 行业资讯 > 技术动态(音频制作) > 耳朵对于声音识别的原理
耳朵对于声音识别的原理
更新时间:2017-8-9 8:53:02 编辑:臧成 文章来源:音响网 调整文字大小:【

人们常说的听声辨位就是人们在听到声音以后,能辨别出声音是从哪个方向传播过来的,而声音在不同环境下传播的又不一样,这就是人耳对声音方向感的作用。
  声源方位感,是听觉器官对声音的音高、音强、音色、音长感觉之外的又一个感觉要素,它涉及到复杂的生理学心理学方面的问题。同时,声源方位感也是立体声技术的理论依据。
  一、时间差、相位差与声级差、音色差
  双耳效应借以定位的原理是时间差、相位差、声级差、声色差。
  (一)时间差和相位差
  时间差主要是指声音刚到双耳瞬间的先后差异。声波在常温下传播的速度为344m/s,当声源偏离听音人正前方中轴线时,耳A与耳B同声源之间的距离有差别,从而出现声音到达耳A与耳B之间的时间差。
  时间差作为声源定位机理,对正面和两侧的声源定位准确性较高,对来自后面的声源定位则误差较大。其原因尚不十分清楚。可能因为声音来自背侧,会因为左耳或右耳产生耳壳遮蔽效应,使得声音因衍射而时差有变化。
  因为人耳对声音有适应性,当声音到达基底膜的刹那间,毛细胞表现兴奋而灵敏。当声音持续刺激,毛细胞的反应相对地迟钝。因此突发声和瞬态声的声源定位准确性较高。
  一个迅速流动的声源,会吸引听觉的注意。因此,方位不断变化的声音,人耳对其方位辨认的误差较小。这就是近代立体声节目出现声移位的原因。
  一个连续的声音,虽然到达双耳也存在时间差,但是因为达到同一只耳朵的后续声掩盖了前面的声音,使时间差变得不明显。
  高频声与低频声传播速度是一致的,所以时间差同声源的频率无关。但相位差同声源的频率有关。当一个声音到达双耳,在两耳之间出现时间差的同时,亦必然出现相位差。在一定的频率范围内,相位差是声源方位感的信息之一。
  相位差定位机理在频率较低时效果较明显。例如,在常温中20Hz声音的波长是17m,200Hz为1.7m,时间差所形成的相位差人耳能够感觉出。而在声源处于高频区时,例如10kHz的波长85px,20kHz是42.5px,时间差所造成的相位差甚至超过360°,等于开始另一个波长。这时的相位差作为定位信息已无任何作用,因为已无法分辨出相位属于滞后或超前。因而高频声属于“混乱的相位差”信息。
  (二)声级差和音色差
  声级差指声波到达两耳出现不同的声强。形成声级差的主要原因是遮蔽效应。前进中的声波如遇到几何尺寸等于或大于声波长的障碍物,会发生遮蔽效应。其原理是:高频声在传播遇到障碍物时,因无法越过障碍物,在障碍物后面形成声阴影区;低频声波长大于障碍物而在障碍物后面形成声衍射区。对声级差起重要作用的是高频声,因为高频声波不能绕过听者头部,所以处于声阴影区的那只耳朵比能够听到直达声的那只耳朵,声强级产生差异。频率愈高,声源偏离正面中轴线愈大,声级差就愈明里。
  从衍射效应的角度看,低频声当然也会形成声级差。但是由于头部直径为500px左右,低频声发生衍射时,多走的路程有限,因衍射而损失的能量很小,因而偏离中轴线的低频声,到达两耳的声级差几近于零,对声源定位作用不明显。
  遮蔽效应对音级差产生作用的同时,亦必然对音色差发生作用。我们知道,构成音色的主要成分是基础音及其上方各次谐波的分量。举例说,一个基频为200Hz,入射角为45°的复合波点声源,那么,它的基础音和低次谐波遇到头部障碍后产生衍射效应,其高次谐波则被头部遮蔽而出现高频声阴影区。这时,到达一侧耳朵的声音为直达声(原音色),到达另一侧耳朵的声音因为高频损失而使音色发生变化。大脑皮质根据两耳的音色差来辨认声源方位。由此可见,音色差是高频信号声级差的另一种反映。
  应该指出,音色差的形成主要是那些基频在60Hz以上的复合音声源。因为60Hz以下的声音高次谐波波长较大,遇到头部尺寸(直径约500px)的障碍并不产生遮蔽效应。例如基频为30Hz的声音,其16次谐波为480Hz,波长为0.716m,波长比头部直径大许多,双耳之间不会形成明显的音色差,其17、18、19次谐波,强度很弱,对音色构成意义不大。因此,60Hz以下的声音比中频、高频声的声源方位感准确率要低。
  从强度差和音色差对双耳效应作用中,可以推想,纯音比复合音难以定位,原因在于纯音是正弦波(单个波),不能构造音色差。
  (三)声源深度感
  声源深度感是听音人与声源之间的距离,所以声源深度感又称声源距离定位。
  声源深度感常常同某个数字模式相联系。当我们听到一个声音时,我们除了感觉到这个声音发生的大致方位外,还会感觉到这个声音发生的大致距离。若要精确地感觉到声源的深度,则要熟悉声场环境,熟悉声源音色,或者直接借助视觉去测量声源与自己的距离。由此说明,声源深度感是后天形成的,可训练的。
  深度定位主要通过声波衰减的程度来判定。声波在辐射过程中,能量随传播的距离而损耗,首先是高次谐波中振幅较小的先衰减,形成音色变化。人耳听到声信号后,同大脑储存的声信号作比较,从而判断这个声信号声源的深度。
  深度感的另一途径是声源比较法。当有数个不同距离的声源(阵声源)存在时,人耳可通过靠近的点声源来推测出其它声源的深度。多个不同距离和入射角的点声源所形成的阵声源,使听觉产生声音的宽度感和包围感。再重复一句话:声源深度感通常同视觉并联,靠视觉形成经验,靠视觉帮助精确定位。
  (四)时间差和声级差的组合
  双耳效应所产生的各种差别,对声源方位感都可以单独发生作用。在它们相互结合时,则产生综合作用。如果它们的作用相反(正常情况下极少发生),那未就相互抵消。近代立体声技术的实践证明,时间差和声级差的组合,对声源方位感效果十分明显。实验证明,在一定条件下,1ms时间差相当于5?12dB的声级差,其关系可互换。
  在一个混响时间超过正常声学要求的大厅里,声源的反射声、混响声级大大超过其直达声。这时,人耳对声源的第一波阵面的刺激最为敏感,如果反射声和混响对于直达声延时40 60ms,人耳尚可能把握声源方位。如果延时超过这个范围,人耳无法分辨原发声到达双耳的时间差和声级差,就会产生分离的方向感,或混乱的方向感。这就是为什么一个回声很重的大厅里,人们常常不容易把握声源方位,需要用眼睛定位的缘故。
  二、声源方位感机理
  古典心理声学认为,人对声源感觉主要依靠双耳听音差别,称为双耳效应。如同双眼观察景物产生透视感、立体感一样,通过双耳对声音强弱差别的感觉,可以判断声音来向、产生立体声感。直到现代,双耳效应仍是声源方位感的主要理论根据。但近年来,专家发现单耳丧失听力的人,仍有声源方位判断能力,于是提出了耳壳效应这个新理论,使声源方位感理论更趋完善。
  声源方位感的机理十分复杂。双耳效应的原理认为:由于双耳位置在头部两则,假如声源处于人的正前方的中轴线,则声音到达双耳的时间、声强级和相位是一样的;假如声源偏离听音人正前方的中轴线,则声音到达两耳的距离不等,因此,声音到达两耳会出现时间差和相位差。同时,因为一侧耳朵出现遮蔽效应因而两耳之间出现声级差、音色差。
  声源方位感是先天就具备的生理功能,然而声源方位的宽度、深度及一切与数字相关的感觉,则与一个人后天的经验有关。
  三、耳壳效应
  早在一百多年前,就有人发现单耳失聪者,仍有辨认声源方位的能力,并提出过耳壳效应的设想,但不为人们所重视。直到本世纪六十年代,当立体声技术得到长足发展之后,人们认识到双耳效应对某些声源方位感觉难以解释,于是耳壳效应才得以被人重新认识。
  当我们孩提时代,都可能做过一些有趣的试验,比如把耳朵往外拉成兜风耳,这时我们感觉到外界的声音突然变大变清楚了;如果把耳朵向后按到贴住头骨,又会发现声音减弱了。如前所述,耳壳有反射并聚集声音的功能。同时由于耳壳凹凸不平,因此,耳壳不同的部位所产生的反射声,比直达声稍迟进入耳鼓,形成比直达声极短延时量的重复声,重复声比直达声的延时量因入射角不同而异。
  耳壳效应对判断来自听音人背后的声音也有效。当一个声音来自背后时,耳壳将阻挡了这个声音的高频泛音,这样,同前方的声源相比,出现了明显的音色差;同时,由于耳壳的遮蔽作用,来自背后的声音将不产生重装音。大脑听觉区将这些信息同以往掌握的信号相比较,从而得出声源出自背后定。
  四、单耳效应
  单耳效应是指双耳效应原理范围内的单耳聆听定位功能。毫无疑义,一个双耳听力正常人主要以双耳聆听来辨认声源方位。然而一个有趣的事实告诉我们,人们不是平均使用双耳去聆听音响,而侧重地使用一边耳朵。
  例如,当一个点声源,出现在听音人左侧偏离中轴线35°的近处时,听音人听到声音并同时测出声源的大致方向;倘若听音人被该声源的音响所吸引,那么便会将头转向左方35°使自己的中轴线对准声源,以便用双耳(同时使用双眼)来辨认声源的准确位置;假如声源仍未准确测出而吸引力进一步加强时,听者会将头部向右转动用左耳向着声源方向,并向声源靠拢,直至找到声源准确位置为止。这个过程,亦即判断→校正→寻的三步曲,反映出听觉定位全身协调机制,同时说明单耳聆听在定位中的重要意义。
  五、骨导定位机理
  双耳效应、单耳效应和耳壳效应的原理,给听觉定位提供了主要依据,似乎听觉器官的声源方位感机理已经得到全面的解答。然而细细一想,发现听觉定位机理中的一些细节,仍未得到完全合理的解释。例如来自听音人背后的声源,人耳是如何辨认出来的。按照双耳效应和耳壳效应原理,来自背后声音的辨认,主要是根据耳壳遮蔽效应,形成了背后声音与正面声音的音色差,而这种音色差的感觉出自大脑听觉对以往的经验对比。试验证明,三个月的婴儿就能够判断出来自背后的声音,同样地,一个成年人可以判断出一个来自背后而从未听到过的音响。由此可见,人耳背后声源的定位不能仅仅归结为音色差。
  专家们认为,必定还有一种听觉功能,来辅助人耳判断来自背后声源方位。这功能就是骨导定位机理。
  关于骨导定位的可能性,历来颇有争议,争议的焦点不是颅骨能否传导声波,而是外界声波有多大比重由气导转化为骨传。有学者认为,声波在传播的过程中,从一种媒质进入另一种媒质时,在两种媒质的分界上会发生反射和入射,根据牛顿第二运动定律,可算出声波在颅骨的入射和反射的声强。经计算,反射波的声强级达99.89%dB,入射波仅为0.00003%dB,这表明外界声能量几乎全部被反射掉了,因此认定,骨导定位功能实际上不存在。
  笔者认为,关键问题是存在不存在入射波,如果承认入射波的存在,那么能量比重即使极微量,在临界限度以上,人耳就能感觉得到。
  耳蜗基底膜上的毛细胞既然能够感觉到位移为1/10埃(1埃相当于氮原子的直径)的振动,那么,人耳可以感觉到由骨导传入的微量声信息。
  我们知道,耳朵处于头颅两侧约114.99999999999999px的深处,此处与头颅外表各部位距离不等,头颅外表正对声源的部位进入耳蜗的声波之间形成骨导时间差,同时两耳之间亦存在骨导时间差。声波在颅骨的传播速度为3013m/s,气导速度为344m/s,头颅外表各部位与耳朵的距离约4.6~385px,为此,骨导直达声与气导直达声之间存在时间差,大脑听觉区根据骨导时间差及骨导与气导之间的时间差,迅速判断出声源方位。
  从理论上说,骨导的定位功能是全方位的,因此,骨导定位机理对来自正面、侧面、背面和头顶上面的声波都有作用。不过骨导定位功能又是辅助性的、次要的,是对双耳效应和单耳效应、耳壳效应的补充。

更多相关: 耳朵声音识别原理
 网友评论
 编辑推荐
  • 2019视听行业万里行之走进企业武汉
  • 2019视听行业万里行之武汉
  • 北京InfoComm China 2019展会
  • 独家策划:北京IFC2019不落幕展精彩抢先看
  • dBTechnologies品牌故事:核心竞争力来自原创和性能
  • 精益求精,缔造完美品质—George Krampera,一生追求完美声音
  • Crest Audio(高峰)-站在创新的高度 俯瞰市场之所需
  • KV2 Audio:音频行业的先行者
设为首页 | 商务信息 | 音响资讯 | 本站动态 | 付款方式 | 关于音响网 | 网站地图 | 网站RSS | 友情链接
本站网络实名:音响网 国际域名:www.Audio160.com 版权所有.1999-2019 深圳市中投传媒有限公司 .
邮箱:web@audio160.com  电话:0755-26751199(十二线) 传真:0755-86024577
在线客服:点击这里给我发消息 点击这里给我发消息  点击这里给我发消息  点击这里给我发消息   视听学院-商家论坛群: 视听学院-商家论坛