声卡基本术语有哪些？_音响网(audio160.com)移动端

声卡基本术语有哪些？

2018-01-18

　　相信有些读者在看到第一部分中诸如“采样率，FM合成，波表合成”等专业词汇有些头疼吧。在以下的第二部分中，我就着重为大家解释这些专业词汇，力争做到深入浅出。
　　一、关于声音采样
　　声卡的主要的作用之一是对声音信息进行录制与回放，在这个过程中采样的位数和采样的频率决定了声音采集的质量。
　　1.采样的位数
　　采样位数可以理解为声卡处理声音的解析度。这个数值越大，解析度就越高，录制和回放的声音就越真实。
　　我们首先要知道：电脑中的声音文件是用数字0和1来表示的。所以在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之，在播放时则是把数字信号还原成模拟声音信号输出。声卡的位是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数。声卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方——256，16位则代表2的16次方——64K。比较一下，一段相同的音乐信息，16位声卡能把它分为64K个精度单位进行处理，而8位声卡只能处理256个精度单位，造成了较大的信号损失，最终的采样效果自然是无法相提并论的。
　　如今市面上所有的主流产品都是16位的声卡，而并非有些无知商家所鼓吹的64位乃至128位，他们将声卡的复音概念与采样位数概念混淆在了一起。如今功能最为强大的声卡系列——Sound Blaster Live!采用的EMU10K1芯片虽然号称可以达到32位，但是它只是建立在Direct Sound加速基础上的一种多音频流技术，其本质还是一块16位的声卡。应该说16位的采样精度对于电脑多媒体音频而言已经绰绰有余了。
　　2.采样的频率
　　采样频率是指录音设备在一秒钟内对声音信号的采样次数，采样频率越高声音的还原就越真实越自然。在当今的主流声卡上，采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级，22.05只能达到FM广播的声音品质，44.1KHz则是理论上的CD音质界限，48KHz则更加精确一些。对于高于48KHz的采样频率人耳已无法辨别出来了，所以在电脑上没有多少使用价值。
　　二、关于声道数的概念
　　声卡所支持的声道数也是技术发展的重要标志，从单声道到最新的环绕立体声，我们来仔细来探究一番。
　　1.单声道
　　单声道是比较原始的声音复制形式，早期的声卡采用的比较普遍。当通过两个扬声器回放单声道信息的时候，我们可以明显感觉到声音是从两个音箱中间传递到我们耳朵里的。这种缺乏位置感的录制方式用现在的眼光看自然是很落后的，但在声卡刚刚起步时，已经是非常先进的技术了。
　　2.立体声
　　单声道缺乏对声音的位置定位，而立体声技术则彻底改变了这一状况。声音在录制过程中被分配到两个独立的声道，从而达到了很好的声音定位效果。这种技术在音乐欣赏中显得尤为有用，听众可以清晰地分辨出各种乐器来自的方向，从而使音乐更富想象力，更加接近于临场感受。立体声技术广泛运用于自Sound Blaster Pro以后的大量声卡，成为了影响深远的一个音频标准。时至今日，立体声依然是许多产品遵循的技术标准。
　　3.准立体声
　　准立体声声卡的基本概念就是：在录制声音的时候采用单声道，而放音有时是立体声，有时是单声道。采用这种技术的声卡也曾在市面上流行过一段时间，但现在已经销声匿迹了。
　　4.四声道环绕
　　人们的欲望是无止境的，立体声虽然满足了人们对左右声道位置感体验的要求，但是随着技术的进一步发展，大家逐渐发现双声道已经越来越不能满足我们的需求。在专题的第一部分笔者就提到过，PCI声卡的大宽带带来了许多新的技术，其中发展最为神速的当数三维音效。三维音效的主旨是为人们带来一个虚拟的声音环境，通过特殊的HRTF技术营造一个趋于真实的声场，从而获得更好的游戏听觉效果和声场定位(后文会有详细介绍)。而要达到好的效果，仅仅依靠两个音箱是远远不够的，所以立体声技术在三维音效面前就显得捉襟见肘了，新的四声道环绕音频技术则很好的解决了这一问题。
　　四声道环绕规定了4个发音点：前左、前右，后左、后右，听众则被包围在这中间。同时还建议增加一个低音音箱，以加强对低频信号的回放处理(这也就是如今4.1声道音箱系统广泛流行的原因)。就整体效果而言，四声道系统可以为听众带来来自多个不同方向的声音环绕，可以获得身临各种不同环境的听觉感受，给用户以全新的体验。如今四声道技术已经广泛融入于各类中高档声卡的设计中，成为未来发展的主流趋势。
　　5.5.1声道
　　5.1声道已广泛运用于各类传统影院和家庭影院中，一些比较知名的声音录制压缩格式，譬如杜比AC-3(Dolby Digital)、DTS等都是以5.1声音系统为技术蓝本的。其实5.1声音系统来源于4.1环绕，不同之处在于它增加了一个中置单元。这个中置单元负责传送低于80Hz的声音信号，在欣赏影片时有利于加强人声，把对话集中在整个声场的中部，以增加整体效果。相信每一个真正体验过Dolby AC-3音效的朋友都会为5.1声道所折服。
　　大家千万不要以为5.1已经是环绕立体声的顶峰了，更强大的7.1系统已经跃跃欲试了。它在5.1的基础上又增加了中左和中右两个发音点，以求达到更加完美的境界。当然由于成本比较高，趋于流行还要假以时日，这里就不多介绍了。
　　三、三维音效概念谈
　　作为时下众多声卡追求的新兴技术，下面我们就来仔细看看被炒得火热的三维音效，究竟有哪些奥秘。
　　1.3D音频API与HRTF的区别与关系
　　API是编程接口的含义，其中包含着许多关于声音定位与处理的指令与规范。它的性能将直接影响三维音效的表现力。如今比较流行的API有Direct Sound 3D、A3D和EAX等。而HRTF是“头部相关转换函数”的英文缩写，它也是实现三维音效比较重要的一个因素。简单讲，HRTF是一种音效定位算法，它的实际作用在于欺骗我们的耳朵。眼下有不少声音芯片设计厂商和相关领域的研究部门参与这种算法的开发和设计工作。虽然原理大同小异，但由于在分析和研究过程中的手段稍有不同，所以各类HRTF算法之间也会有或多或少的性能差异。人们很容易将API与HRTF混淆起来，其实两者有着本质的区别，也有相互的联系。
　　举一个例子：A3D是时下最为流行的3D音频API之一，眼下大部分主流PCI声卡都表示支持A3D 1.0。但是有些用户会反映，为什么我的这块XXX声卡号称支持A3D，但实际效果却为何不如朋友的那块DIAMOND S90?原因就在于，S90采用Aureal自己的AU8820芯片，采用的HRTF算法自然也就来源于Aureal;而XXX声卡没有采用AU8820芯片，而采用了其他的HRTF算法，虽然也可以支持A3D的函数变化，但由于算法的先天不足并且需要经过函数转化，在效果上自然就不能和S90相比了。因此眼下许多声卡称自己支持A3D、EAX和DS3D，这只能表明它支持这些规范与指令，究竟实际效果如何，还要取决于芯片所采用的HRTF算法。在选购声卡前了解一下其芯片采用何种HRTF算法对于最终三维音效的实现能力是非常重要的。
　　2.主要的3D音频PAI
　　(1)Direct Sound 3D——源自于Microsoft DirectX的老牌音频API。对不能支持DS3D的声卡，它的作用是一个需要占用CPU的三维音效HRTF算法，使这些早期产品拥有处理三维音效的能力。但是从实际效果和执行效率看都不能令人满意。所以，此后推出的声卡都拥有了一个所谓的“硬件支持DS3D”能力。DS3D在这类声卡上就成为了API接口，其实际听觉效果则要看声卡自身采用的HRTF算法能力的强弱。
　　(2)A3D——美国Aureal公司所开发，分为1.0和2.0。1.0版包括A3D Surround和A3D Interactive两大应用领域，特别强调在立体声硬件环境下就可以得到真实的声场模拟。2.0则是在1.0基础上加入了声波追踪技术，进一步加强了性能，它是当今定位效果最好的3D音频技术。
　　(3)EAX——是CREATIVE的新招牌，意为“环境音效扩展集”。EAX是建立在DS3D上的，只是在后者的基础上增加了几种独有的声音效果指令。EAX特点是着重对各种声音在不同环境条件下变化和表现进行渲染，对声音的定位能力不如A3D，所以EAX建议用户配备4声道环绕音箱系统。
　　3、主要的HRTF算法。
　　诸如Aureal和Creative这样的大公司，他们既能够开发出强大指令集规范，同时也可以开发出先进的HRTF算法并集成在自己的芯片中。下面给大家介绍的CRL和QSound则是主要出售和开发HRTF算法的，自己并不推出指令集。
　　CRL开发的HRTF算法叫做Sensaura，支持包括A3D 1.0和EAX、DS3D在内的大部分主流3D音频API。并且此技术已经广泛运用于ESS、YAMAHA和CMI的声卡芯片上，从而成为了影响比较大的一种技术，从实际试听效果来看也的确不错。而QSound开发的Q3D可以提供一个与EAX相仿的环境模拟功能，但效果还比较单一，与Sensaura大而全的性能指标相比稍逊一筹。
　　四、关于MIDI
　　MIDI是电脑音乐的代名词，问世于80年代初。MIDI究竟是什么?下面让我们来共同探究。
　　1.MIDI的概念
　　MIDI是Musical Instrument Digital Interface的简称，意为音乐设备数字接口。它是一种电子乐器之间以及电子乐器与电脑之间的统一交流协议。我们可以从广义上将为理解为电子合成器、电脑音乐的统称，包括协议、设备等等相关的含义。
　　2.MIDI文件的本质
　　眼下在一些游戏软件和娱乐软件中我们经常可以发现很多以MID、RMI为扩展名的音乐文件，这些就是在电脑上最为常用的MIDI格式。MIDI文件是一种描述性的“音乐语言”，它将所要演奏的乐曲信息用字节表述下来。譬如“在某一时刻，使用什么乐器，以什么音符开始，以什么音调结束，加以什么伴奏”等等，所以MIDI文件非常小巧。
　　3.FM合成
　　既然MIDI文件只是一种对乐曲的描述，本身不包含任何可供回放的声音信息，那么一首首动听的电脑音乐又是如何被我们的声卡播放出来的哪?这就要通过形式多样的合成手段了。早先的ISA声卡普遍使用的是FM合成，既“频率调变”。它运用声音振荡的原理对MIDI进行合成处理。但由于技术本身的局限，加上这类声卡采用的大多数为廉价的YAMAHA OPL系列芯片，效果自然不好。
　　4.波表合成
　　波表的英文名称为“WAVE TABLE”，从字面翻译就是“波形表格”的意思。其实它是将各种真实乐器所能发出的所有声音(包括各个音域、声调)录制下来，存贮为一个波表文件。播放时，根据MIDI文件纪录的乐曲信息向波表发出指令，从“表格”中逐一找出对应的声音信息，经过合成、加工后回放出来。由于它采用的是真实乐器的采样，所以效果自然要好于FM。一般波表的乐器声音信息都以44.1KHz、16Bit的精度录制，以达到最真实回放效果。理论上，波表容量越大合成效果越好。
　　5.复音数的含义
　　在各类声卡的命名中，我们经常会发现诸如64、128之类的数字。有些用户乃至商家将它们误认为是64位、128位声卡。其实就现在的技术发展状况而言，声卡更本没有发展到，也没有必要发展到如此高的数据处理通道，64、128代表的只是此卡在MIDI合成时可以达到的最大复音数。所谓“复音”是指MIDI乐曲在一秒钟内发出的最大声音数目。波表支持的复音值如果太小，一些比较复杂的MIDI乐曲在合成时就会出现某些声部被丢失的情况，直接影响到播放效果。好在如今的波表声卡大多提供64以上的复音值，而多数MIDI的复音数都没有超过32，所以音色丢失的现象不会发生。
　　另外需要注意的是“硬件支持复音”和“软件支持复音”之间的区别。所谓“硬件支持复音”是指其所有的复音数都由声卡芯片所生成，而“软件支持复音”则是在“硬件复音”的基础上以软件合成的方法，加大复音数，但这是需要CPU来带动的。眼下主流声卡所支持的最大硬件复音为64，而软件复音则可高达1024，令人炸舌吧!
　　6.DLS技术的作用
　　PCI声卡的问世和普及带来了波表合成的一次小小“革命”，其关键在于DLS技术的运用。DLS全称为“Down Loadable SAMPle”，意为：可供下载的采样音色库”。其原理与软波表颇有异曲同工之处，也是将音色库存贮在硬盘中，待播放时调入系统内存。但不同点在于运用DLS技术后，合成MIDI时并不利用CPU来运算，而依靠声卡自己的音频处理芯片进行合成。其中原因在于PCI声卡的数据宽带达到133Mb/秒，大大加宽了系统内存与声卡之间的传输通道。从而既免去了传统ISA波表声卡所要配备的音色库内存，又大大降低了播放MIDI时的CPU占用率。而且这种波表库可以随时更新，并利用DLS音色编辑软件进行修改，这都是传统波表所无法比拟的优势。