【产品】启英泰伦发布全新第三代智能AI语音芯片CI1306,端侧NLP技术实现自然语音交互
电子发烧友网报道(文/李弯弯)语音识别是人工智能的重要分支之一,早在2010年开始就得到发展,并且逐渐在各个领域成熟应用。不过AI语音芯片和算法的研发仍然面临众多难题,不少企业为此坚持研究,不断对技术和产品进行迭代升级,以求取得突破。
启英泰伦是国内领先的AI语音芯片企业,近日,该公司正式发布了全新的第三代智能语音芯片系列,相比于上一代产品,这款芯片创下了算力更高、高度集成和算法新高的记录,进一步解决了业界长久以来难以突破的难题。
AI语音芯片研发面临哪些难题
近几年,AI语音芯片在智能家居、智能车载、智能穿戴等领域的渗透率快速提升,未来随着技术的不断迭代,AI语音芯片在各领域的渗透率和市场规模将会持续扩大。
智能家居方面,当前随着AI语音芯片的价格已经大幅下降,越来越多的厂商倾向于采用AI语音芯片,来替代传统的AP及MCU芯片和IOT芯片,如今AI语音芯片在风扇、茶吧机、取暖桌、空调、插座等众多领域已经开始大规模批量应用。根据调研数据预测,未来5年AI语音芯片在智能家居领域的市场规模将能达到每年2.5亿颗。
智能汽车方面,目前智能汽车中的语音交互多是在云端进行识别处理,然而云端的方式存在无法实时响应、网络无连接时不能使用等问题,因此业界认为端侧语音芯片将会很好的补充云端芯片的不足,预计未来端侧AI语音芯片在车载领域的市场需求每年能达到1亿颗左右。
智能穿戴方面,未来随着芯片尺寸越来越小,成本越来越低,AI语音芯片在穿戴设备上的应用将会越来越多,预计该市场对AI语音芯片的市场需求每年会在千万颗左右。
除了上述市场之外,AI语音芯片还可以在医疗设备、机器人、工业检测等领域得到应用,整体来看,预计未来几年AI语音芯片的市场规模将会快速发展到每年5到10亿颗,随着应用不断拓宽和渗透率不断提升,市场规模可能还将持续不断提升。
虽然存在较大的市场,然而企业在AI语音识别芯片和算法的研发也面临众多需要不断攻克的难题,在此次发布会上,启英泰伦创始人兼CEO何云鹏提到了几点:
1、各种应用场景存在复杂的背景噪声,会影响识别,比如厨电的烟机噪声、炒菜声,客厅的电视声、音乐声,会场的多人声、卖场的高音喇叭声等;2、人类语言种类繁多,如果考虑各地的方言口音,几乎没办法通过大数据训练模型,来满足所有地域口音的识别;3、人类语言的表达非常丰富,要想在设备端实现对任意语言表达的意图理解,也十分困难。
同时,电子设备的发展往往要求在性能或价格上,能够不断改进,这些对于AI语音芯片的研发来说,都是比较大的挑战。
算法、芯片上不断升级,攻克一个个难题
如何解决这些难题呢?一直以来,启英泰伦坚持在芯片和算法两方面不断发力,力求攻克一个个业内难题。截至目前,启英泰伦的技术平台BNPU(脑神经网络处理器)已经迭代三次,从BNPU1.0,BNPU2.0,到BNPU3.0。何云鹏表示,每一代BNPU的问世,都是离线语音芯片和算法的一次突破和语音应用的助推。
具体来看,集成BNPU1.0的一代芯片C11006/CI1002,实现的是端侧语音识别,这是行业首款集成神经网络处理器的语音AI芯片,是离线语音产业应用兴起的标志;集成BNPU2.0的二代芯片CI1102/CI1103及CI1122,不仅实现了离线语音识别功能,还实现了离线声纹识别和命令词自学习等功能。
每颗芯片的迭代,集成度不断增加,成本快速下降,算法功能不断提升。据何云鹏介绍,集成度上,二代系列芯片集成了Audio CODEC、Flash等单元,增加了双麦阵增强处理能力;成本上,一代芯片CI1006成本价为50到90元,CI1102下降到30到40元,二代芯片CI1102/CI1103为15元到25,CI1122下降到了10元到15元之间;算法上,正常安静家居环境下,识别都达到98%以上,65dB左右中强环境噪声下也能实现较好的识别效果。
发布全新三代芯片,端侧NLP技术实现自然语音交互
尽管过去几年在算法和芯片上不断提升,逐渐解决了业界面临的一些难题,然而整个行业仍然存在极难克服的问题,比如:1、离线语音仍然是以命令词为主,对于用户来说,如果命令词多的话,就会很难记住;2、电视新闻,多人声环境,以及噪声强度达到75dB以上的复杂强噪声环境的识别存在困难;3、离线命令词自学习的效果,与大数据训练模型效果仍然存在明显差距,这使得方言问题没有得到彻底解决。
为了攻克这些难题,启英泰伦经过三年时间研发,最终带来BNPU3.0版本,并基于此发布了三代两大系类芯片,一大系列是三代智能语音MCU13;另一大系列是智能语音IOT 23。
相比之前的芯片,三代系列芯片具有更高算力、更高集成度,更高性能。首先看CI13系列芯片,算力方面,该系列内置BNPU 3.0,支持DSP指令扩展的RISC CPU两大内核,主频高达240MHz,具有640KB SRAM,而二代芯片主频是160MHz,内置BNPU2.0,512KB SRAM。
集成度方面,CI13系列芯片集成了Audio Codec模拟MIC接口、数字PDM麦克DMIC接口、通用ADC及MCU常见串口、PWM、GPIO等接口,还集成了4线NOR Flash、3路LDO PMU、高精度RC振荡器等。
通过接上MIC,简单的语音识别应用,外围电路仅需十几个电阻电容,多数情况下可以不需要加晶振;通过串口可以扩展上位机MCU,或WiFi、BLE、2.4G等射频芯片;通过通用ADC或IIC可以输入温度、湿度等传感器信号;通过PWM或其它GPIO,可以实现对开关控制、电机控制、SPI屏或段码屏显示控制、红外收发控制等。这样,CI13系列芯片既可以作为语音识别或语音信号处理的专用芯片,也可以作为带语音识别功能的MCU主控芯片。
算法方面,CI13系列芯片几乎支持全部信号处理和识别技术,包括单麦自适应降噪、降混响、回声消除、DOA、波束形成、盲源分离、语音活动检测等传统信号技术。
除了具有二代芯片的语音识别、声纹识别外,三代CI13系列芯片还支持基于深度学习的降噪技术(深度降噪)、人声分离技术(深度分离)、以及离线NLP技术。深度降噪技术能在信噪比-5dB 到-10dB的环境噪声下将人声提取出来,实现良好识别。
端侧NLP技术在原来的声学模型、语言模型的基础上增加了意图模型,该意图模型采用联合规则和统计训练的模型来实现端侧语音识别+语义理解。端侧NLP技术具备上下文关联、多轮对话、意图理解等云端NLP的功能,该技术的突破,使得设备彻底不需要依赖云端,也可以实现自然随心的语音交互。
接下来看三代芯片CI23系列CI2305 和CI2306,CI23系列芯片在语音功能和性能与CI13系列芯片相同,主要增加集成了WiFi和BLE,形成语音+WiFi+BLE三合一单芯片,其中CI2305支持离线语音+IOT,CI2306还支持将语音上传,实现离线语音+在线语音+IOT功能。
何云鹏认为对设备控制交互在本地计算会更好,这样可以解决云端计算带来的响应延迟太大体验差,断网无法使用及用户隐私泄露风险,以及云端建设和运营成本太高等问题。
除了不断升级芯片算法性能,降低芯片方案成本,启英泰伦还持续提升应用开发平台和合作生态建设,努力降低AI语音应用的门槛。
据启英泰伦介绍,经过近7年发展,公司已经积累B端客户超过5000名,平台开发者超过了1万名,使用启英泰伦智能语音平台的在校AI学员超过10万名。现在,离线语音方案的年装机量超过2000万,并正快速向上亿年装机量发展。
经过过去这些年的发展,语音交互逐渐进入人们的生活,并带来极大的便利,然而不可否认的是,背景噪声大影响语音识别的准确性,命令词太多容易记不住等问题依然存在,而启英泰伦发布的第三代语音芯片,通过算力、集成度、算法的不断升级,完美解决了这些问题,随着各项难题的进一步突破,预计未来AI语音芯片将会在更多的场景中得到更好的应用。
- |
- +1 赞 0
- 收藏
- 评论 3
本文由carat转载自启英泰伦,原文标题为:离线语音进入快车道,启英泰伦发布全新AI语音芯片!,本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
相关推荐
【产品】启英泰伦第三代语音芯片CI1306搭载BNPU 3.0,端侧支持行业突破性离线NLP技术
为了更好地满足用户需求,启英泰伦在算法攻关和芯片研发两个方面同时发力,BNPU是启英泰伦的核心技术优势之一,版本也在不断升级,从BNPU 1.0、BNPU 2.0,一直到今天推出的BNPU 3.0版本。
【产品】启英泰伦第三代智能语音芯片CI130X/CI230X,实现端侧自然语言处理,覆盖端云融合语音应用
人工智能(AI)语音芯片公司「启英泰伦」发布第三代智能语音芯片,包括CI130X和CI230X两大系列,内置第三代自研技术平台BNPU(脑神经网络处理器),广泛覆盖高性能、低成本端侧语音和端云融合语音等应用。
【IC】启英泰伦新推出CI231系列AI语音BLE芯片,融合语音与BLE技术,为用户提供丰富的设备连接和个性化的语音交互体验
启英泰伦CI231系列AI语音BLE芯片不仅提供了更多连接选项和个性化交互体验,还在离线语音识别算法上实现了突破,让用户能够更加方便、安全地享受智能生活。随着其在各类终端产品中的应用推广,我们相信智能家居将迎来更加智能、便捷和个性化的未来。
AI加速边缘计算,聚焦AIOT芯片,NPU SOC,离线语音MCU,高算力智能模组等
世强硬创联合地平线,阿普奇,启英泰伦,美格智能,普林芯驰,唯创知音,九芯电子,芯闻,VINKO,MERRY带来AI新产品,聚焦AIOT芯片,NPU SOC,离线语音MCU,高算力智能模组等,加速边缘计算。
唯创知音WT2605C芯片,集成在线TTS功能,轻松赋能产品在线对话功能,让好产品会说话
WT2605C芯片作为一款集成了在线TTS功能的蓝牙语音芯片,在智能产品接入AI对话大模型方面展现出了巨大的潜力和优势。通过其丰富的功能、广泛的应用场景以及广阔的应用前景,WT2605C芯片将推动智能产品市场的创新与发展,为用户带来更加便捷和智能的语音交互体验。
九芯电子NRK330X系列:智能AI专用语音识别芯片,具有识别精准、远场降噪等优势
近年来,九芯电子推出了颇受好评的NRK330X系列语音识别芯片,包括NRK3301、NRK3302和NRK3303等型号。该系列芯片具有识别精准、远场降噪等优势,最多可支持不超过100条离线指令,现已广泛用于智能家电、智能卫浴、智能照明、智能机电、智能家居、 智能玩具等领域。
九芯电子(NINE CHIP ELECTRON)语音芯片产品选型指南
目录- 公司简介 芯片型号汇总 OTP语音芯片 MTP语音芯片 MP3音乐解码芯片 录音芯片 语音识别芯片 语音模块
型号- N9101,N9100,NRK,NV080D,NV040H,NV040D,N9301,N9300,N9303,NV080C,N9302,NV340D,N9300-16S,NV065A,NRK3306,NRK3301,NRK3302,NRK3303,NRK3501,NVDW-C,NV128H-X,NV020C,NV020D,NV040C,NV400F,NVG002F,N9300U,N9200,N9303-16S,N9400,NV040DS,NV512H,NV128H,N9101-16S,N9100-16S,NV035A,N9301-16S,N9397,NV170D-S,NVG008F,NV170H,NV170C,NV340H,N9400B,NV170D,N8900U,NV256H,N9302-16S,NVHW,NVG004F,NVG016F,N9400-24QS,N9200-24QS,NVF00M,NVF04M
启英泰伦第三代AI语音芯片CI1303助力秒秒测全新智能语音闹钟,可实现10米远场语音识别
近日,启英泰伦的优秀合作伙伴秒秒测发布全新一代智能语音闹钟,搭载启英泰伦第三代AI语音芯片CI1303,通过边缘计算代替云计算,不需联网,精准识别,响应快速。可语音控制闹钟的计时、定时、亮度、音量、开关等功能;可实现10米远场语音识别,准确度高达97%以上。
陪伴机器人AI在线语音对话方案:唯创知音蓝牙语音芯片WT2605C引领智能化交互新时代
在科技日新月异的今天,陪伴机器人作为智能家居的重要组成部分,正逐渐融入人们的日常生活。WT2605C作为一款集成了AI在线语音对话功能的蓝牙语音芯片,以其卓越的性能和广泛的应用前景,为陪伴机器人带来了全新的智能交互体验。本文唯创知音将深入探讨陪伴机器人AI在线语音对话方案,并重点介绍WT2605C芯片在该方案中的应用。
【应用】启英泰伦语音AI芯片CI1102用于智能暖风机,减少手动操作,方便又安全
目前,市面上的暖风机基本都是按键控制的,面临着控制麻烦的问题,同时因为暖风机的工作会带有一定的温度,可能对使用者产生伤害,而通过语音控制能很大程度上改善这些问题。 启英泰伦作为智能语音全栈式服务商,针对暖风机,启英泰伦也定制了智能语音方案。该方案内置启英泰伦自主研发的语音AI芯片CI1102,在传统的电路中增加语音控制系统,通过串口的方式进行通讯,开发相对简单,适用于短期或需快速开发的方案。
启英泰伦(Chipintelli)语音AI芯片、模组、算法及解决方案,为IoT人工智能开发提供一站式Turnkey服务
启英泰伦成立于2015年,专注于语音AI芯片和算法的开发和提供配套产品应用解决方案。2016年,其发布全球首款离线语音识别BNPU(脑神经网络处理单元)芯片CI1006,此芯片是全球第一款出货量超过百万的离线语音AI专用芯片。之后,启英泰伦持续研发出多款产品,2018年推出升级版离线语音AI芯片CI1002;2019年发布全球首款降噪一体多核语音AI芯片CI100X系列,发布语音AI平台;2020
九芯NRK10系列语音芯片,具有语音辨认及播报功用,助力扫地机器人真正做到有眼睛,会说话
扫地机器人引荐语音芯片和模块NRK10,该语音芯片是一款高性能,低成本的离线语音辨认芯片,具有语音辨认以及播报功用,广泛使用在智能家居、AI人工智能、玩具等多种范畴。
启英泰伦引领智能语音技术革新,将携其领先的智能语音芯片及语音解决方案,闪耀2024上海MWC展会
2024年MWC上海世界移动通信大会在上海新国际博览中心举行。启英泰伦携其领先的智能语音芯片及语音解决方案闪耀登场,向全球展示其前沿技术实力与创新能力。重点展出包括CI13XX系列AI语音芯片、CI13LC系列AI语音芯片、TTS、离线语音识别+小程序方案、声纹识别以及通话降噪等在内的多项领先技术。
电子商城
服务
提供语音芯片、MP3芯片、录音芯片、音频蓝牙芯片等IC定制,语音时长:40秒~3小时(外挂flash),可以外挂TF卡或U盘扩容。
最小起订量: 1pcs 提交需求>
可支持TI AM335x/AM5718 和NXP iMX6/iMX8芯片定制核心板和计算单板;支持NXP iMX6核心模组X / F / H系列、TI AM335x核心模组X / N / H系列,与兼容的底板组合定制单板计算机。
最小起订量: 1pcs 提交需求>
登录 | 立即注册
提交评论