AI公司为何开始争相推出AI语音芯片?
2019年02月02日 由 童童 发表
993231
0
2019年1月的AI语音芯片市场十分热闹,1月2日,云知声召开发布会推出多模态AI芯片战略,并公布今年布局的3款AI芯片。1月4日,思必驰召开发布会发布其第一代AI语音芯片TAIHANG。1月21日,猎豹移动旗下AI公司猎户星空联合瑞芯微电子宣布推出专门针对智能音箱和物联网设备的AI语音芯片。Rokid已经发布的AI语音芯片,AI语音芯片的竞争正在走向白热化。这不禁让人疑问,为什么AI公司或者说AI语音公司都开始争相推出AI芯片?
研发AI语音芯片是自然趋势
猎户星空首席战略官王兵博士在专访时表示,AI公司纷纷推出AI语音芯片有几方面的原因,一方面是语音市场需求增长非常快,仅看智能音箱,去年整个市场的出货量就超过2000万,并且还在保持增长。另一方面,AI语音算法现在已经相对比较成熟,做算法的输出竞争已经有点白热化的状态,所以许多公司就开始研发芯片,因为芯片相对而言商业化的潜力更大,这是一个非常自然的趋势。
他同时指出,由于AI语音芯片并不需要像AI视觉那么强的计算能力,也不需要最先进的工艺制程,因此相对而言AI语音芯片不仅研发的门槛低一些,开发周期也相对较短,这也是许多公司推出AI语音芯片的原因。
不过,猎户星空最终决定研发AI芯片还有更多的考虑。此前猎豹移动董事长兼CEO傅盛接受采访时提到推出AI芯片的两方面考虑,第一,没有针对某个AI场景的专用芯片,例如英伟达GPU是为游戏设计芯片,高通的SoC是为手机设计,为 AI 或者一些专属设备设计的芯片很少。第二,如今 28nm工艺已经很成熟,成本也非常低,做一款集成语音算法的芯片可能只有几美金,流片几百万元人民币。但在产品中加入这样一块芯片,主芯片的负载就可以明显降低,用原来为手机设计的芯片光语音处理可能就要消耗40%的算力。
当然,猎户星空能推出AI语音芯片也与自身的积累密不可分。王兵表示:“猎户星空已掌握麦克风阵列、语音唤醒、语音识别、语义理解和语音合成等全套远场语音技术,也拥有自研全链路的远场语音交互系统猎户语音OS,作为全技术链条的公司,芯片是必须涉足的领域,这有利于我们在垂直领域建立优势。同时,在中国人工智能产业发展联盟(AIIA)公布的国内智能音箱智能化评级结果中,猎户语音OS占据了获评产品前五强中的三席,这说明了我们在语音市场的影响力。还有,实现芯片的自主可控也是大趋势。因此,研发芯片成为了非常自然的事情。”
联合研发AI语音芯片是好选择
AI语音公司研发AI芯片是自然趋势,芯片的研发却可以有多种选择,包括完全自主研发、联合研发以及完全交由第三方设计。值得注意的是,猎户星空选择的方式是与瑞芯微联合研发,与此类似,思必驰与中芯国际下属投资公司中芯聚源成立合资公司上海深聪智能联合研发。这是否意味着联合研发AI语音芯片是个好选择?
对此,王兵表示:“对比而言,从开发周期和成本的角度,联合研发确实是一个更好的方案。因为比较成熟的芯片公司已经有积累,很多东西不需要重新去设计,能够缩短开发周期,另外,对许多公司而言,芯片的生产和管理也没必要亲自介入。”
至于为什么选择和瑞芯微合作,王兵表示,瑞芯微在低成本芯片方面有很多年的经验,我们评估了包括自行研发以及与其它厂商合作的方案之后,最终发现瑞芯微的方案成本最低,并且,我们的算法与他们的硬件能力的结合也比较合适。
具体的合作分工上,猎户星空负责芯片架构、算法以及系统软件的设计,瑞芯微提供一些硬件的成熟方案以及对后期芯片的生产和管理。王兵表示,在合作的过程中,由于猎户星空有有许多来自知名芯片公司经验丰富的工程师,因此他们对于芯片该如何去设计以及如何与瑞芯微沟通都非常清楚,双方的合作还比较顺利。
据了解,猎户星空在2018年上半年启动芯片项目,目前猎户星空语音算法团队的规模接近200人,芯片团队包括软件和系统团队大约有30人。那么,从项目启动到芯片正式推出时间还不到一年,猎户星空的AI语音芯片竞争力如何?
芯片不一定最便宜,但一站式解决方案便宜且灵活
据了解,猎户星空与瑞芯微联合研发的AI语音芯片OS1000RK基于28nm工艺,采用64位4核ARM Cortex-A35 CPU,整合高性能 CODEC(8通道ADC+2通道DAC),可以低成本地支持8个麦克风阵列,硬件语音检测模块(VAD)可实现很低的待机功能,专用指令集能让神经网络的运行更加优化。
OS1000RK主打功耗低、通用性强,能够实现从语音唤醒、语音理解、语音合成等全链条的语音交互能力。
另据了解,在功耗的降低方面OS1000RK的在没有任何声音的时候,除了VAD其他部分都不耗电,芯片还会根据需实现变频工作,让OS1000RK实现较低功耗。通用能力则是王兵重点强调的优势,他表示:“我们的AI芯片是一个通用性很强的产品,目前可以看到的规模较大的语音应用,基本都可以用它来实现,现在市面上还没有其他AI语音芯片的通用能力特别强。”
“除了芯片,作为全链条AI公司,客户需要什么算法我们都能提供,我认为目前行业内其他人还不能做到这一点。这一能力来源于我们在算法上的巨大投入,还有数据的积累,猎户星空从2016年成立之初就开始做语音的算法。”王兵补充道。
另外,有一个AI芯片公司都不得不面临的问题就是AI算法的不断更新。对此,王兵表示:“我们用互联网的思维做硬件,我们不认为一个硬件出售之后功能就不会变,而是需要不断更新,因此我们的芯片可以通过OTA在线更新,以此来保持芯片的竞争力。”
但是,芯片的通用性、性能和成本不可兼得。猎户星空高通用性还能具备成本优势吗?王兵指出,成本需要看系统成本,而不是只看芯片成本,这也是为什么我们要推出一站式解决方案的原因,这种模式能让系统成本最低。也就是说,如果只强调硬件成本,做一款特别专用的芯片成本可能是最低,但灵活性不行,这将导致最终的系统不管是从性能还是成本的角度可能都比不过一站式的解决方案。因此,我们芯片不一定最便宜,但一站式解决方案一定是最便宜,而且是最灵活的。
王兵所指的一站式方案包括从芯片到芯片上的算法以及芯片上的系统软件,再到云端的软件、应用软件、内容体系。他还举例表示,如果有客户想推出智能音箱,我们从电路板的设计到操作系统再到云端软件的算法都可以提供,客户基本上主要去做特定场景的内容优化以及渠道推广就可以。
视觉AI芯片在自研路上
目前,OS1000RK已经搭载在小雅Nano智能音箱中,预计将在今年年底达到百万的出货量。这也意味着猎户星空的AI语音芯片今年底的出货量将在百万级别。王兵也表示:“从目前的订单看我觉得百万应该没有太大问题,我们下一代的小豹AI音箱也会搭载这款芯片。除了智能音箱,语音控制的智能家电,比如美的新一代的冰箱,儿童故事机、儿童教育机器人等其他机器人等都将采用我们的语音芯片。”
不仅仅是语音芯片,猎户星空还在自主研发视觉、导航等更多领域的专用芯片。王兵表示,选择自研的原因也是因为机器人视觉和导航还处于非常早期的阶段,没有特别好的专用芯片,自己研发能够把性价比做到最优。
至于视觉和导航芯片为什么选择自研而不是联合研发,他表示,“语音芯片已经有一些公司有积累,但视觉和导航到的芯片目前成熟的东西比较少,可能都需要自己设计,因此选择自主研发。目前我们在这些领域我们也有了一些积累,也引进了一些资深人才。”
最后,在谈到AI芯片热潮以及资本寒冬是否会影响AI芯片公司的时候。王兵表示AI芯片是热在投资阶段,但AI芯片能够真正量产和商业化的比较少。资本寒冬可能对于O2O或者互联网领域会有影响,对AI、机器人、视觉、导航等不会有影响。
转自原文链接:
http://www.sohu.com/a/292972617_114877?scm=1002.590044.0.0&spm=smpc.ch30.content2-n-3.2.1549085612637hS81xCQ