您的位置: >> 首页 → 行业资讯 → 企业访谈 → 对话塞宾科技CEO张德明 体验声学科技魅力 |
对话塞宾科技CEO张德明 体验声学科技魅力 每个人对声音的感知都不一样,有人单纯感受听觉舒适,有人听的细枝末节,还有人听的是技术层面。很多人带着对声音的满腔热爱,奔赴声学领域专注研发,为音频设备相关问题提供更优质的解决方案。塞宾科技CEO张德明博士作为声音重度爱好者,一直在声学领域不断研发创新,且有着极大建树,带来了很多非常成熟的产品。近日,张德明博士受邀作为京津冀之声科创中国栏目的嘉宾,与广大听众分享他与声音的故事,以下节选自部分采访内容。 主持人:我先跟各位听众朋友说一下,其实在我们节目正式播出之前,我已经和张总聊了好长时间了,今天张总带来了很多设备,有话筒有耳机,就让我非常的兴奋,因为我很喜欢这些声音设备,今天看到您在这个声音设备的硬件的领域已经打造出了这么多非常棒,而且用我的角度来说是很神奇的产品,真的是让我耳目一新。所以我们先跟各位听众朋友分享一下,张总您自己的创业公司平常究竟是做什么的? 张博:我们有做很多的硬件,这些产品是大家平时能够用眼睛看到的东西,因为是有形的东西。但实际上塞宾真正做的事情是这些有形产品背后在芯片级里面的这些通讯的技术,通讯的算法。具体我可以给大家打一个比方,我们这些麦克风在采集一些声音,类似于模拟我们人耳的鼓膜,接收到声音,然后把信号经过一定的处理。比如把里面的噪声给滤除,把一些别的音乐还可以跟声音来进行混合,再进行一些音效的处理,然后还可以把它进行编码。因为我们现在的社会都是要进行一些数字的传输,这样处理这个事情的整个链路会变得更加有效率,然后再进行无线信道的一个传输。什么叫无线信道?我们以前对于声音的系统,从麦克风到我们的录音机,再到我们的Daw的系统,就数字音频的系统,很多的这种连接都是基于有线的。那么塞宾做了除了算法之外的另外一件事情,就是要把所有的这些音频的连接线给剪掉,变成无线。无线会给人们的工作生活或者娱乐等各种跟音频相关的事情,带来极大的便利。 主持人:无线其实大家不陌生了,我们现在很多朋友戴的耳机就是无线的,您现在做的事情跟大家司空见惯的现象之间到底有什么关系? 张博:大家接触到的这些耳机,我们先讲麦克风好了,我们在KTV里也有遇到手持的K歌麦克风,我们叫 u段的麦克风。相对来说 u段的麦克风跟我们现在跟移动手机上的无线不是一回事,它是400兆到900兆左右中间任选一个频段。所以这样的麦克风相对来说它的功耗也是比较高的,而且没有办法跟手机这样的移动设备来进行工作,因为它不适用这样的一种移动场景。 大家现在的耳机也是一样的,考虑到这种超低功耗,无线耳机它主要以聆听为主。所以这些耳机你想让它来采集很好的声音,比如说打电话、开会,是不能够期望它有很好的声音的。目前全球的蓝牙体系的声音采集最多只能做到7000赫兹单通道的声音,并且即便是7000赫兹的声音,也是经过了非常大的失真,丢失了很多细节的声音。 而塞宾在做的一件事情是基于无线蓝牙设备可以实现CD级的声音的采集,也就是说人听见的听不见的,20千赫兹附近一直到低频的20赫兹全部都能采集下来,然后做降噪做编码,分享给远程的人。 主持人:中间这些技术的难点,这些门槛都是怎么跨过的? 张博:其实很多方面有我们不同的研究者,在不同的领域深深的扎根,做持续的研究。在音频的算法方面,我们也有很多相应的积累,比如降噪。我们现在看到市面上绝大多数耳机的降噪,是降了1000赫兹以下的环境噪声,让你的耳腔里面形成一个非常小的安静环境,它跟我们通信讲的降噪是两回事。这是第一种降噪,第二种降噪就是我刚才跟您分享的一段音频也是一样的,传统的蓝牙只能传输7000赫兹以下的声音。所以他们把7000赫兹叫上行降噪,有的地方叫enc环境降噪。塞宾是做出了全球第一个片上全频的和CD级的 HIFI降噪技术。 主持人:您的意思是指在人耳听到的范围当中都可以降噪。 张博:对,都可以降噪,并且保持人声极大的还原度。而我们听到的其它真无线的耳机,它们可以用来打电话、开会等,因为无线方便。但它采集回来的声音只能是7000赫兹以下的,这种失真是非常大的。而我们可以实现高品质的全频带CD级的声音采集,并且要把全频带里的噪音去除。 主持人:这里面有个问题,声音在人耳听出来,有的是美妙的,有的是噪声。可是让一个硬件设备让一个话筒听,它可听不出来什么是好听的什么是噪声。 张博:我们有算法去分辨哪些是噪声,哪些不是噪声,我们的处理方法跟其他耳机处理还是不太一样的。其它耳机把佩戴者本身的说话声当成有用信号,把其他的所有信息都变成是干扰和噪声全部压制掉,宁可对佩戴者自己的声音形成一些损伤,也要把一切外面的声音干扰统统干掉,所以你能听到一个声音,几乎听不到外面干扰的声音,但是人的声音已经非常明显的变形了。 但我们对于声音的理解不太一样,我们从物理上到算法上模拟到数字上,通过各方面的技术,实现对人声极大的保留,并且对于背景噪音背景干扰极大的抑制。但是如果是全景声,比如需要一些非常自然的类似于同期声的时候,我们就不能对背景里一些声音进行过分的抑制。对一些比如风扇的声音,汽车发动机的声音,拍照的声音、风照的声音,这些我们在统计上评估上能够研究出来,他们一般情况下不会作为有益的声源,需要把它抑制掉。但是如果采集一个街道,比如南锣鼓巷,你从里面走过,这时候录音就一个干巴巴的声音,旁边镜头里能看到别人叫卖的声音却听不到,让人感觉非常不舒服不自然。我们需要把叫卖的声音也录下来,虽然他声音的量级非常小,我们需要很保真。但是对于比如空调的声音,我们还是需要进行一定的压制,所以我们在频谱在识别的时候,要进行模态上的分类,需要在什么场景下保留什么样的声音。 我们的第二代全景声的产品,就有全景模式、乐队模式、solo模式和音乐模式。在不同的场景下,所针对的主声源是不一样的,这时候我们就为用户设计好了,在这种场景下怎么样才能够保护你的主要声源,让一些次要被声源压制掉,而不是像传统蓝牙耳机一刀切。 主持人:简单粗暴的方式肯定是不好的,但您刚才讲到这一点我觉得很好奇,这个得要求工程师除了在算法的层面能够有很很好的技术以外,其实还需要他对于生活有理解,有各种想象,哪些东西其实是人真的愿意关注的声音,哪一些可能有没有都无所谓,哪一些是必须要去掉的。 张博:因为有很多的声源,每一个声源多么好听也好,多么有特点也好,当声源越来越多的时候,麦克风采集到的信号本身会越来越趋近于一个噪声化的东西。 主持人:这个和人耳是不一样,因为我们声音是通过大脑的处理,把声音进行了某种程度上的优化。 张博:我们的耳朵、耳廓、肩膀、头,到骨膜里面有耳蜗系统纤毛系统的感知,再到里面的感受处理,大脑对双耳的处理能够实现双耳对空间任何一个声源的聚焦,然后把其他的声源能够屏蔽掉,这个是麦克风实现不了的事情。所以我们当时创业做的第一个事情,就是模拟人类的双耳自然环境自然生长的感受,能够实现人真正的双耳听觉的传递。比如我在现场能够听到上下左右前后远近各种各样的声音,它的定位,它生产的感受是怎样,然后把这种信号进行降噪,进行编码传输,到另外一个地方再把它呈现出来。这样就可以实现身临其境的体验。 主持人:我跟大家举个例子,刚才张总说的这个是什么意思?比如说戴耳机听音乐,其实你听到的这个音乐哪怕说它的保真度很好,但是这个声音只是从你的左耳朵和右耳朵分别进去,即便是有立体声,也就是一些生产向位的变化,所谓的向位就是可能大提琴在左边,低音鼓在右边,但要是用了这种模拟人耳的方式来去听的话,你会发现这个声音除了是左耳和右耳之外,在你的前面后面左上右上等等各个方向其实都会有声音,就像是一个人或者一个乐队在绕着你。但是说到这一点我就很好奇,到底是什么原因让您决定要在声音设备或者打造一种前所未有的声音场的赛道上去进行创业? 张博:这里面其实有很多的原因,第一个原因就是我作为一个通信行业的从业者,有一些深入的思考,我们怎么样解决通信的终极体验,实现千里之外身临其境的体验传输,这是我们希望能够做到的事情。从移动互联网的层面来看,我们其实很容易在PC到PC实现这种声场,比较容易。但是我们发现PC互联网作为互联网的第一代,其实到2010年,基本上就进入了移动互联网第二代通讯,这种移动互联网是以手机作为介入终端做通讯终端。科技会让人越来越随心所欲,但这时候如果通讯系统只能绑定在固定的房间,把人限制在某个特定的地方进行某种特殊的这种活动的话,不符合人们发展的期望和诉求。对于这种科技,一定是要无线化、移动化,要非常方便使用。我们做的这套通讯系统,目前依然处于第二代移动互联网发展的平台期,也就是说我们很多的事情还是基于手机来进行的,这个时候跟移动手机进行配合,做这样的通讯体验传输,是最便利的环境。这也是为什么近几年对于音频设备的需求,会像井喷一样发展起来了。 主持人:我看到像塞宾科技这几年的成长非常好,除了您之外很多做音频硬件,做耳机做相关配件的企业,大大小小发展的都不错,为什么现在大家卖这些东西生意这么好。 张博:说明大家对声音的表达会越来越重视。以前在互联网上表达一样的信息,有写博客写文章,到后来大家发图片,再到现在发视频。但视频里面很重要的一点就是声音,因为如果视频声音不好,会给人的体验造成非常大的一种损失。为了让视频具有传播力,显得更专业,很多人会采用一些稍微专业的设备。对于播客而言,相对于以前的专业的播音主持,体量非常大,因为它没有过多的门槛要求,任何一个人都可以随时随地开一个直播的口子,哪怕只有一个人或者是没有人为自己鼓掌喝彩。这是一个全民直播的时代,这个时代大家更注重自己向世界传递信息,而不只是去聆听世界,这是个趋势性的问题。我们顺应这个趋势来研发无线化更加便利化的设备,这应该也是顺应潮流的需求。 主持人:您也看到了这些社会的变化,包括潜在的需求,所以您是决定来创业。而且创业方向就是我们刚才提到的,首先它要无线,第二是尽可能的方便,第三是要最大限度的还原真实的状态。 张博:之前讲传统的,无论是做电影还是做音乐,像这些过程我都或多或少参与过。所谓的pgc或者专业内容制作团队,这里面会有好几个层面的事情。大家认为所谓的专业,就是艺术家,其实不是的,以前唱歌的人或者主持人或者演员,他们是Artist是艺术家,他们是不负责来做这些内容操作的。他们有专业的团队,有录音师、调音师、混音师等一些专业的人。还有专业的设备,像录音棚里专业的麦克风,专业的Daw系统,这些非常昂贵,不是普通人用的,操作这些专业设备比我们操作手机要复杂得多。pgc的p就是professional,这些各种操作的专业人就叫professional。 但是到了移动互联网时代,其实我们手机上有摄像头,有麦克风,除了拿它来打电话,实现人与人之间的沟通交流之外,我们也可以拿手机拍照、拍视频、录音、采访,然后把这些内容分享到YouTube或抖音上,这样的内容叫做UGC。U就是user,用户、消费者,这样产生的内容相对来说质量比较差一些,但是核心是方便。其实现在市面上也有非常多的人,拿这样的设备,我们叫c端设备,或者是用户侧的设备去做内容,这个叫UGC。 我们塞宾准确意义上来说,不是做这种UGC的产品,很多时候也不是pgc的产品,而是我们称之为pugc的产品。Pugc实际上是这个产品的形态和使用上面来说,更接近c端的消费者,跟手机一样非常方便使用,无论是麦克风还是耳机、音箱、声卡这样的设备。 主持人:也就是说用起来不麻烦,买起来也不是很贵。 张博:但是它产生的内容的质量,是接近pgc这种制作方法或制作设备制作出来的摄影体验。 主持人:但是大家经常说一分价钱一分货十分价钱买不错,我是一个声音爱好者,在我正式从事广播这个行业之前,也在这个领域花了很多钱,知道其实好的音频设备是很贵的,但是今天您又说可以把它做成非常低的价格,这个中间是怎么实现的? 张博:以前的设备特别贵,有一些是历史性的因素。我举个例子,以前在大家听HiFi的年代,所谓的HiFi就是一对立体的箱子,人坐在等边三角形的顶点上,听立体声箱子发出来的古典音乐会的典型场景。音箱的背后它有功放,功放里面以前都是叫a类功放,有的是用这种电子管,电子管放大的声音很暖,相应的一些模拟器件的造价是比较昂贵的。如果要让它做的好,就要花很高的价钱。再举一个例子,我们当时用的这些传输线。 主持人:对,导线要用金线银线。 张博:为什么用金线银线?并不是说金线银线显得高贵,而是金银的传输传导率比较高,它能够实现声音的传输质量更好一些。当时模拟音频时代有这么个贵的道理。但是到了现在,我们其实是尽可能的非常早的把模拟音频变到数字领域。 主持人:所以您的意思是正因为我们进入到了数字领域,所以在底层的声音的编解码的层面来说,我们就已经节省了很多的成本对。其实除此之外,还有一些成本的降低,也是跟咱们国家近些年工业化的程度不断上升,而且大规模制造的程度不断上升是有关系的。那么时间的原因,我们本期科创中国只能暂且聊在这里了。今天塞宾科技的创始人兼CEO张德明先生跟我们分享了他在声音创业领域的很多故事,但是这仅仅是一个开始,未来我们还会邀请张总来节目中和大家聊一聊他所钟爱的声音设备的制造,包括传输的相关故事。 文章素材来源:塞宾科技 编辑:温情
|
|
|