从云端搬至终端,端侧语音AI芯片的三个发展阶段

2022-08-06 与非网
语音AI芯片,CI1006,CI1102,CI1103 语音AI芯片,CI1006,CI1102,CI1103 语音AI芯片,CI1006,CI1102,CI1103 语音AI芯片,CI1006,CI1102,CI1103

什么是语音AI芯片

语音AI芯片,顾名思义是处理语音的AI芯片。很多人第一次接触语音AI芯片可能是天猫精灵、小爱同学和小度等智能音箱产品,因为在这些产品中,我们可以体验到智能语音的交互,而语音AI芯片是智能语音交互的基础和核心。

图 | 语音识别示意图


都说这几年AI芯片赛道很火,事实上语音识别、自然语义理解(NLP)和机器学习在AI技术中占据重要的位置,是人机交互的基础,而前两项均与语音识别相关,这是因为语音识别不仅方便,而且是人机交互中最符合人类日常交流形态的一种技术,目前已经在智能家居和车载场景得到普遍应用。


为何语音识别要从云端搬至终端?

说到语音识别技术,还要追溯到2010年左右,当时以神经网络为代表的AI技术使得智能语音识别成为可能,并在后来的IoT和AIoT产业浪潮中不断走向成熟。


早期的智能语音识别受限于算力要求,终端没有专用的芯片可以解决算力和功耗成本的均衡问题,无法在终端处理智能语音识别,而云端处理又凭借天然自带内容和服务,模型可以快速迭代,数据收集和训练非常方便等优势,决定了当时的语音识别大都是布置在云端的。


然而,云端的语音识别也有弊端,比如无法做到稳定的实时响应,网络崩溃时更是响应无门;重要的信息都要通过网络传输,有被攻击泄露的风险,无法保障用户隐私安全;此外在成本方面也不具优势,除了持续的带宽消耗外,云端语音需要后台不间断的运行大量服务器来做语音处理,服务器的购置、后续的硬件更换和软件运维、人力费用和电费场地费等都非常昂贵。

图 | 为什么选择离线语音


面对云端语音的优劣势,以启英泰伦为代表的企业开始投入对端侧语音识别的研究。不过,我们知道光有需求点还支撑不起一个新产业的崛起,要养活一个产业需要足够的市场容量,实现资金的活流,才能有利于产品的不断迭代,形成正向循环。


根据艾瑞咨询发布数据显示,2020年中国物联网设备连接量达74亿个,预计2025年将突破150亿个。而麦肯锡则用更动态的数据表示出了物联网的增长率,预估目前每秒大约有127台设备连接到互联网。


然而,面对当前物联网的联网量,华为给出了另一个数据:当前大部分具备物联能力的消费类设备只有5%~20%的联接激活率。这是为什么呢?究其原因,还是操作交互太过于复杂。而解决这个复杂问题的方法就是加入更多“老少皆宜”的语音配合IoT连接。


有行业内人士预测,语音AI芯片将会快速发展到5-10亿颗/年左右的市场规模,随着应用面的不断拓宽和渗透率的不断提升,该规模还将持续不断地提升。


综上,不管是场景需求还是市场容量,都在推动端侧语音识别的落地。但如何落地?不是一蹴而就的。


端侧语音识别芯片的三个发展阶段

语音识别面临的挑战和图像识别不同,它对算力要求没那么高,但对算法的要求很高。启英泰伦创始人兼CEO何云鹏说:“这是因为语音识别的应用场景非常多,所以各种噪声就非常多样,有稳态噪声,也有非稳态噪声,要在这些环境中进行高准确率的语音识别是非常困难的。所以,必须掌握智能语音算法全链条技术才能实现更好的语音识别,包括智能语音信号前端降噪处理、语音智能识别、语音合成、语音解码、语音大数据处理及训练、NLP等技术。”


当然,语音识别技术在国内的发展也是在不断迭代中变得更加准确和灵活。以启英泰伦的三代自研技术平台BNPU(脑神经网络处理器),来简单概括端侧语音AI芯片的这三个发展阶段。

图 | 启英泰伦在语音AI芯片上的创新


阶段一:语音识别功能

第一代BNPU芯片实现的是端侧语音识别,是行业首款集成神经网络处理器的语音AI芯片,也是离线语音产业应用兴起的标志。


从集成度的角度来看,BNPU 1.0的方案相对分立,方案价格大约在50到90元左右(CI1006)。


阶段二:离线声纹识别+命令词自学习

第二代BNPU芯片(CI1102/CI1103CI1122),不仅实现了离线语音识别功能,还能实现离线声纹识别和命令词自学习等个性化的功能。在应用上,可以根据不同人的声纹实现基于用户个性喜好的功能配置,并能通过离线命令词的自学习实现在轻度噪声下的地方口音和方言的识别。


从集成度的角度来看,BNPU 2.0集成了Audio CODEC、Flash 等单元,以及双麦阵增强处理能力,方案价格大约在15到25元左右。


阶段三:深度降噪+深度分离+命令词自学习2.0+离线NLP

第三代BNPU芯片,除了继承第二代的语音识别、声纹识别外,还支持了基于深度学习的降噪技术(深度降噪)、人声分离技术(深度分离)、命令词自学习2.0版本技术,以及行业首次突破性的离线NLP技术。在应用上,CI1301可以实现中等噪声中的语音识别,而CI1302CI1303、CI1306和CI1312则可实现强噪声环境下的语音识别,比如当油烟机噪声高达80dB时,对于70多dB的人声依然可以良好识别。


从集成度的角度来看,BNPU 3.0不仅集成了Audio Codec的模拟 MIC接口、数字PDM麦克的DMIC接口、通用的ADC和MCU常见的串口、PWM、GPIO等接口,还进一步集成了 4线Nor Flash、3路LDO的PMU和高精度的RC振荡器等,方案价格约10元左右。


对于三代产品的方案价格一代更比一代低的疑问,何云鹏表示:“很多人认为离线语音在端侧、数据处理、语音识别和存储会产生很多的成本,实则云上的成本是持续的,传输的成本是长时间的,这个成本可以避免;此外,云端早期建设的成本很高,很多厂家会建不起,还有每年运营的成本,每台设备每年10多元,这个费用在卖设备的时候厂商会包两年,但后面就要客户自己付费,所以不太公平。而随着摩尔定律的发展,端侧语音识别方案的整体成本已呈现30%的速率下降,已经达到了一个通用MCU的成本。”


除了价格以外,更值得一提的是,原本被认为只有云端才能实现的NLP,现在轻量级的NLP在端侧智能语音芯片中也实现了,并且既保障了用户的体验感,又能降低云端搭建和运营成本,降低网络带宽消耗,也能提升用户使用的安全性。


端云融合才是语音AI芯片的最终归宿。


当然,说云端搬到端侧,实际上在很多场景下端侧和云端不是非此即彼的关系,从长期来看,端侧和云端是相互融合、相辅相成的关系。


随着端侧语音芯片功能、性能、可靠性变得越来越强大,价格越来越低,端侧语音识别将实现可靠性、隐私保护、成本和灵活性等多方面的优势,再加上集成联网功能可实现AIOT,从而实现大数据爆发时代下的有效数据分析和场景利用。


以空调为例,传统的空调大都只有调温的功能,但在差异化竞争的今天,大厂空调正在往机器人的方向发展,可以提供更多智慧化的服务,比如调整空气的温湿度、清新程度、含氧量、PM2.5值,以及在早晨起床时放音乐营造氛围、营养咨询等。而这些服务的基础是语音交互,并且一定是延迟更低、工作更稳定的端侧语音识别,而背后的服务交易、用户的习惯大数据等则更适合放在云端,达到协同的效果。


写在最后

国内语音AI芯片正呈现出爆发式增长的趋势,谁将成为领头者?何云鹏表示:“该市场领域未来发展壮大后,会呈现典型的头部领先市场通吃的局面。而启英泰伦在语料数据、算法模型、芯片架构、AI开发平台及应用方案落地等多维度的迭代已经产生了马太效应。经过长达近7年的发展后,启英泰伦已经积累了B端客户超过5000名,平台开发者超过1万名,使用启英泰伦智能语音平台的在校AI学员则超过10万名。如今,整个离线语音行业快速发展,年内装机量将突破2000万台,未来两年,年出货将朝着1亿台迈进。”

授权代理商:世强先进(深圳)科技股份有限公司
技术资料,数据手册,3D模型库,原理图,PCB封装文件,选型指南来源平台:世强硬创平台www.sekorm.com
现货商城,价格查询,交期查询,订货,现货采购,在线购买,样品申请渠道:世强硬创平台电子商城www.sekorm.com/supply/
概念,方案,设计,选型,BOM优化,FAE技术支持,样品,加工定制,测试,量产供应服务提供:世强硬创平台www.sekorm.com
集成电路,电子元件,电子材料,电气自动化,电机,仪器全品类供应:世强硬创平台www.sekorm.com
  • +1 赞 0
  • 收藏
  • 评论 1

本文由Lucius转载自与非网,原文标题为:语音AI芯片演进至第三阶段,谁将主宰下一个十年?,本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

评论

   |   

提交评论

全部评论(1

  • zwjiang Lv9. 科学家 2023-04-12
    学习
没有更多评论了

相关推荐

离线语音芯片迎来爆发,启英泰伦单月订单量突破50万片,客户项目总数突破2000+

今年9月,成都高新区企业成都启英泰伦科技有限公司(以下简称“启英泰伦”)创下了AI语音芯片单月订单破50万片的纪录,稳居同行之首, 10月20日,启英泰伦创始人何云鹏接受采访时说,此前公司对AI语音芯片做了市场预判,得出的结论是,在技术环境、消费环境的多方支持下,AI语音芯片市场将在2020年有一个大的起色。

行业资讯    发布时间 : 2020-10-24

业界权威AI芯片目录集《AI芯片技术选型目录》由AIIA正式发布,启英泰伦人工智能语音芯片入选

AIIA 2020年度首批《AI芯片技术选型目录2020年》,共收集22家企业、49款AI 芯片相关产品技术。启英泰伦作为人工智能语音芯片及产品解决方案的行业领先公司,与赛灵思、高通等6家企业共同参与了AIIA DNN benchmark测试。

行业资讯    发布时间 : 2020-08-05

启英泰伦助力中国AI芯片发展新势力,智能家居的中国“芯”超百款智能语音产品实现应用落地

启英泰伦研发的语音AI芯片已应用于智慧家居、智慧家电、智慧汽车、智慧玩具、机器人等领域。据何云鹏介绍,截止目前,客户已超300多家,其中在智慧家电领域覆盖了国内超过90%的家电厂商,包括美的、海尔、海信等龙头企业,超百款智能语音产品实现应用落地。

行业资讯    发布时间 : 2020-11-02

【产品】启英泰伦第三代语音芯片CI1306搭载BNPU 3.0,端侧支持行业突破性离线NLP技术

为了更好地满足用户需求,启英泰伦在算法攻关和芯片研发两个方面同时发力,BNPU是启英泰伦的核心技术优势之一,版本也在不断升级,从BNPU 1.0、BNPU 2.0,一直到今天推出的BNPU 3.0版本。

新产品    发布时间 : 2022-08-23

AI加速边缘计算,聚焦AIOT芯片,NPU SOC,离线语音MCU,高算力智能模组等

世强硬创联合地平线,阿普奇,启英泰伦,美格智能,普林芯驰,唯创知音,九芯电子,芯闻,VINKO,MERRY带来AI新产品,聚焦AIOT芯片,NPU SOC,离线语音MCU,高算力智能模组等,加速边缘计算。

活动    发布时间 : 2023-06-08

九芯电子NRK330X系列:智能AI专用语音识别芯片,具有识别精准、远场降噪等优势

近年来,九芯电子推出了颇受好评的NRK330X系列语音识别芯片,包括NRK3301、NRK3302和NRK3303等型号‌。该系列芯片具有识别精准、远场降噪等优势,最多可支持不超过100条离线指令,现已广泛用于智能家电、智能卫浴、智能照明、智能机电、智能家居、 智能玩具等领域。

产品    发布时间 : 2024-11-19

启英泰伦(Chipintelli)三代人工智能语音芯片/语音模块选型指南

目录- 语音识别芯片    语音模块   

型号- CI-D03GS02S,CI-D02GS07J-BT,CI-D02GS02S,CI-D02GS01J,CI-C22GS02S,CI1122,CI1301,CI1312,CI-D03GS01J,CI1302,CI1303,CI-C22GS02J,CI2305,CI2306,CI1306

选型指南  -  启英泰伦  - V1.01  - 2022/10/28 PDF 中文 下载 查看更多版本

选型指南  -  波洛斯  - 2021/12/23 PDF 中文 下载

【IC】VC系列离线语音模块,简单易上手,综合识别率高达98%,打造属于你的语音智能产品

VC系列模组是安信可开发的一款AI离线语音识别的产品,主芯片是云知声推出的离线语音识别芯片锋鸟M(US516P6),具有高可靠性,通用性强的特点。在语音识别技术上实现了高可靠的唤醒识别率、更远距离的唤醒、更低误唤醒率、更强的抗噪音能力、更快的响应识别时间,免联网的纯离线识别。

产品    发布时间 : 2024-11-08

九芯电子(NINE CHIP ELECTRON)语音芯片产品选型指南

描述- 广州市九芯电子科技有限公司,成立于2010年,注册资本1000万元人民币,九芯电子是国内知名的语音芯片方案提供商,公司是以芯片设计和音频编解码算法、智能AI算法研究为基础、面向音频播放、识别方向的人工智能以及集成电路电子产品的高新技术企业。凭借不断优化自主的音频编解码算法,先进的芯片设计,保证语音芯片高保真,高识别率,满足客户在产品应用中越来越高的技术要求。

型号- N9101,N9100,NRK,NV080D,NV040H,NV040D,N9301,N9300,N9303,NV080C,N9302,NV340D,N9300-16S,NV065A,NRK3306,NRK3301,NRK3302,NRK3303,NRK3501,NVDW-C,NV128H-X,NV020C,NV020D,NV040C,NV400F,NVG002F,N9300U,N9200,N9303-16S,N9400,NV040DS,NV512H,NV128H,N9101-16S,N9100-16S,NV035A,N9301-16S,N9397,NV170D-S,NVG008F,NV170H,NV170C,NV340H,N9400B,NV170D,N8900U,NV256H,N9302-16S,NVHW,NVG004F,NVG016F,N9400-24QS,N9200-24QS,NVF00M,NVF04M

选型指南  -  九芯电子  - 2023/8/18 PDF 中文 下载

九芯电子NRK10系列语音芯片应用于家用智能搅拌机中,让搅拌机实现“说话”

NRK10系列语音芯片是一款高性能,低成本的离线语音识别芯片,具有语音识别以及播报功能,广泛应用在智能家居、AI人工智能、玩具等多种领域。

产品    发布时间 : 2024-10-16

启英泰伦第三代AI语音芯片CI1303助力秒秒测全新智能语音闹钟,可实现10米远场语音识别

近日,启英泰伦的优秀合作伙伴秒秒测发布全新一代智能语音闹钟,搭载启英泰伦第三代AI语音芯片CI1303,通过边缘计算代替云计算,不需联网,精准识别,响应快速。可语音控制闹钟的计时、定时、亮度、音量、开关等功能;可实现10米远场语音识别,准确度高达97%以上。

应用方案    发布时间 : 2023-10-28

【应用】启英泰伦语音AI芯片CI1102用于智能暖风机,减少手动操作,方便又安全

目前,市面上的暖风机基本都是按键控制的,面临着控制麻烦的问题,同时因为暖风机的工作会带有一定的温度,可能对使用者产生伤害,而通过语音控制能很大程度上改善这些问题。 启英泰伦作为智能语音全栈式服务商,针对暖风机,启英泰伦也定制了智能语音方案。该方案内置启英泰伦自主研发的语音AI芯片CI1102,在传统的电路中增加语音控制系统,通过串口的方式进行通讯,开发相对简单,适用于短期或需快速开发的方案。

应用方案    发布时间 : 2020-10-11

九芯电子NRK10语音芯片具有语音识别以及播报功能,应用于智能语音消毒柜中,提升消费者产品运用感

智能语音消毒柜推荐芯片及模块NRK10系列语音芯片是一款高性能,低成本的离线语音识别芯片,具有语音识别以及播报功能,广泛应用在智能家居、AI人工智能、玩具等多种领域。

应用方案    发布时间 : 2024-10-15

展开更多

电子商城

查看更多

品牌:启英泰伦

品类:神经网络智能语音芯片

价格:¥19.5000

现货: 34,140

品牌:启英泰伦

品类:国产语音识别芯片

价格:¥15.0000

现货: 30,478

品牌:启英泰伦

品类:语音识别芯片

价格:¥8.0000

现货: 30,040

品牌:启英泰伦

品类:神经网络智能语音芯片

价格:¥8.6000

现货: 30,000

品牌:启英泰伦

品类:神经网络智能语音芯片

价格:¥15.0000

现货: 9,237

品牌:启英泰伦

品类:语音识别芯片

价格:¥6.5000

现货: 35

品牌:启英泰伦

品类:语音识别芯片

价格:¥7.5000

现货: 30,100

品牌:启英泰伦

品类:语音识别芯片

价格:¥10.0000

现货: 20,100

品牌:启英泰伦

品类:高性能神经网络智能语音芯片

价格:¥12.0000

现货: 10,000

品牌:启英泰伦

品类:单麦离线语音识别模组

价格:¥42.0000

现货: 637

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

现货市场

查看更多

暂无此商品

海量正品紧缺物料,超低价格,限量库存搜索料号

服务

查看更多

语音/录音芯片定制

提供语音芯片、MP3芯片、录音芯片、音频蓝牙芯片等IC定制,语音时长:40秒~3小时(外挂flash),可以外挂TF卡或U盘扩容。

最小起订量: 1pcs 提交需求>

多核计算单板和核心板定制

可支持TI AM335x/AM5718 和NXP iMX6/iMX8芯片定制核心板和计算单板;支持NXP iMX6核心模组X / F / H系列、TI AM335x核心模组X / N / H系列,与兼容的底板组合定制单板计算机。

最小起订量: 1pcs 提交需求>

查看更多

授权代理品牌:接插件及结构件

查看更多

授权代理品牌:部件、组件及配件

查看更多

授权代理品牌:电源及模块

查看更多

授权代理品牌:电子材料

查看更多

授权代理品牌:仪器仪表及测试配组件

查看更多

授权代理品牌:电工工具及材料

查看更多

授权代理品牌:机械电子元件

查看更多

授权代理品牌:加工与定制

世强和原厂的技术专家将在一个工作日内解答,帮助您快速完成研发及采购。
我要提问

954668/400-830-1766(工作日 9:00-18:00)

service@sekorm.com

研发客服
商务客服
服务热线

联系我们

954668/400-830-1766(工作日 9:00-18:00)

service@sekorm.com

投诉与建议

E-mail:claim@sekorm.com

商务合作

E-mail:contact@sekorm.com

收藏
收藏当前页面