【经验】智能语音产品开发前应该了解的基础知识
电子类产品方案的开发主要有硬件和软件的区别,硬件方案一般指采用了芯片等电子元器件的为该产品设计的电路板,软件方案一般指基于电路板上主控芯片的种类及产品功能需求所开发的代码,再经过编译工具等生成可下载到主控芯片中的固件,配合芯片等硬件工作,实现产品的特定功能。用户如果想开发一个新产品方案,主要步骤有硬件的选型、硬件的开发、固件的开发以及产品方案的测试等。用户对测试出现的软硬件问题进行修复后就可以完成开发,再根据需求进行后续的生产制造等环节。
下面介绍一下语音产品开发中会用到的一些基本概念:
芯片又被称为集成电路,其英语名称为integrated circuit,缩写为IC。芯片是一种将电路和一些电子元器件做微型化,通过专用设备制造在半导体晶圆表面上,并经过后道加工生成的可直接焊接使用的器件。硬件方案中采用芯片,可以极大的降低电路板的面积和设计的复杂度,有助于加快产品开发的速度和减低开发的难度,且能节省整体方案的成本,因此,目前已有大量芯片被应用到了家电、汽车、消费电子、工业控制等几乎所有电子产品领域。
智能语音芯片是芯片的一种,指通过芯片端侧的神经网络技术提供相应的算力,可以无需网络服务器,直接在终端处理语音识别等语音相关的功能。智能语音产品直接采用智能语音芯片,可以极大地提升智能语音体验,提高开发效率,降低方案的整体成本,因此目前越来越多的智能设备已经在使用专业的智能语音芯片来开发产品。
语音识别过程
一般来讲,智能语音芯片要处理语音识别时,首先需要外围的麦克风采集语音信号,将声学的信号转化为电学信号后,通过智能语音芯片上的ADC采样,将采样后的数字信号送入智能语音芯片内部的语音处理模块,同时芯片内部执行相应的识别控制和算法软件,对该声音的型号进行计算,通过软件解码后得到以文本方式输出的识别结果。
语音模块是将智能语音芯片和所需的被动元器件设计到一个小型化的PCB板上,可连接麦克风的扬声器等外围器件,模块可以下载相应的功能固件,形成具备基本语音功能的硬件电路板。
产品开发设计时如果直接采用已设计好的语音模块,可以不必学习和关心智能语音芯片设计电路时所需掌握的硬件知识,也不用设计产品中的语音电路部分,避免因对语音相关信号处理不当而造成的硬件板问题,还可以加速产品的硬件开发,因此对于新用户,推荐直接采用现成的标准模块进行产品方案的设计。
固件
固件一般是指用户开发完成功能软件后,通过编译器等工具,生成的可以直接下载到主芯片里面的二进制文件,该二进制文件主要为主芯片所能识别的机器码指令,主芯片上电后会执行固件内部的指令,从而实现用户想达到的软件功能。
在启英泰伦智能语音芯片的方案开发中,启英泰伦芯片所对应的固件,主要由软件控制部分、声学模型、语言模型、播报回馈音等组成。其中软件控制部分包含了操作系统和控制芯片各个外设执行对应功能的指令,包括任务调度、串口通讯、控制IO输入输出等;声学模型和语言模型是语音识别所需的文件,用户可以通过启英泰伦语音AI平台获取;播报回馈音指方案在执行完一条语音指令后,需要播放的声音,以通知用户该指令已执行。
在实际的产品开发中,因为启英泰伦智能语音芯片可能作为主控芯片或被控芯片,因此固件又会被分为:主控固件和从机固件,如下所述:主控固件:智能语音芯片作为产品主控,在进行语音识别和识别反馈的同时,还可以根据识别到的语音命令对产品的功能进行控制。从机固件:智能语音芯片作为被控芯片,与上位机(产品主控芯片)进行通信(如串口通信),将语音识别结果上传给上位机,同时可接受上位机的指令进行播报反馈。
硬件开发
用户完成芯片和模块硬件选型后,可以从启英泰伦语音AI平台获取硬件参考文档,包括原理图和PCB等,参考该文档里面的设计方法,进行硬件板级设计。用户也可以查看硬件设计参考文档,获取相应的设计知识,以减少自行设计出错的可能性,提升开发效果,加快开发效率。
固件开发
启英泰伦提供了基于智能语音芯片的软件SDK开发包和相应的工具,具体详细的内容请查看文档中心软件开发SDK的部分。新用户在开发固件时,首先请注册启英泰伦语音AI平台,然后从该平台中获取到所选择芯片或模块对应的SDK及工具。推荐新用户先采用启英泰伦开发板或标准模块,直接编译启英泰伦提供的SDK,采用工具生产固件,完整走一次开发流程。点击查看CI130X采用平台制作固件和下载的示例。文档中心里面有用户所选择模块的规格书,该规格书中都有模块升级的硬件连接及处理方法,用户可以按照该文档自行操作。
针对新用户,推荐用户直接采用语音AI平台的固件制作功能,直接生成可下载使用的固件。这样可以避免采用IDE工具进行代码的开发,有助于快速入门。该操作请点击语音AI平台使用指南文档,按照该文档中对应的操作方法进行使用。
如果是比较熟悉启英泰伦开发的用户,需要单独合成固件的各组件,然后打包生成固件,同时需要做一定代码开发的,可以根据选择的芯片下载对应的SDK进行开发。
- |
- +1 赞 0
- 收藏
- 评论 0
本文由水冰月转载自启英泰伦,原文标题为:【经验】智能语音产品开发前首先应了解的基础知识,看完即可上手,本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
相关推荐
【经验】启英泰伦智能语音识别模块主要的区别对比,以及配套麦克风和喇叭的组装注意事项
为了让生活更加便利,现在好多智能家电中都加入了语音控制功能。启英泰伦是一家专注于人工智能语音芯片及提供配套应用解决方案的公司,为了方便客户更好的完成产品的研发,启英泰伦提供了很多种语音识别模块,本文主要介绍各模块的区别以及如何申请Demo板的注意事项。
【经验】离线智能语音芯片CI1102/CI1103芯片的防拷贝加密技术,防止通过复制FLASH的方式抄袭生产
为了防止应用开发商辛辛苦苦开发的产品被不良厂商通过复制FLASH的方式抄袭生产,启英泰伦CI110X系列离线智能语音芯片的SDK开发了防拷贝加密技术。使用此技术加密后的产品,FLASH镜像被复制其他FLASH芯片中后,将不能正常运行。
启英泰伦引领智能语音技术革新,将携其领先的智能语音芯片及语音解决方案,闪耀2024上海MWC展会
2024年MWC上海世界移动通信大会在上海新国际博览中心举行。启英泰伦携其领先的智能语音芯片及语音解决方案闪耀登场,向全球展示其前沿技术实力与创新能力。重点展出包括CI13XX系列AI语音芯片、CI13LC系列AI语音芯片、TTS、离线语音识别+小程序方案、声纹识别以及通话降噪等在内的多项领先技术。
语音芯片NRK220X内置高性能低功耗Audio Codec模块,助力智能小风扇实现人机交互
NRK220X内置高性能低功耗Audio Codec模块[水稻]和硬件音频处理模块可以外接麦克风实现单芯片远场降噪和回声消除等功能。同时该芯片还集成多路UART、I2C、SPI、PWM、GPI0等外围控制接口可以开发 低成本的单芯片智能语音离线芯片。
【应用】启英泰伦取暖桌离线智能语音解决方案,具备强劲的回声消除和环境噪声抑制能力
启英泰伦具备成熟的取暖桌离线语音解决方案,不需要联网即可语音控制取暖桌的升降,取暖模式、温度等。该方案采用启英泰伦最新推出的第三代智能语音芯片CI130X系列(CI1301、CI1302、CI1303、CI1306)。
语音模块功放及LDO新增替代料通知函
型号- CS4871,AIP8002,LPA4890MSF,LM4890S,LN4890MME-G,LN1134A332MR-G,LTK8002D,LN1138A332MR-G
【产品】启英泰伦第三代智能语音芯片CI130X/CI230X,实现端侧自然语言处理,覆盖端云融合语音应用
人工智能(AI)语音芯片公司「启英泰伦」发布第三代智能语音芯片,包括CI130X和CI230X两大系列,内置第三代自研技术平台BNPU(脑神经网络处理器),广泛覆盖高性能、低成本端侧语音和端云融合语音等应用。
启英泰伦(Chipintelli)二代语音AI芯片/智能语音模块/智能语音模块功能底板选型指南
目录- 语音AI芯片 智能语音模块 智能语音模块功能底板
型号- CI-B03GT03S-MB,CI-B03GT02S,CI-B02GS01-H,CI-B03 GS01S,CI-B02GS04T,CI-B03GS01S,CI-B03-WM-V10,CI-B03ST01S-BK,CI-B03CS01S,CI-B02-MB-V30,CI-B03GT02S-MB,CI-C22GS02S,CI-B0*-GT-MB-B-V11,CI-B02-MB-V1-0,CI-B0XGS01S-H,CI-B02-MB-V10,CI-B02GS01S-H,CI-B03GT04S-MT,CI-B03GS01S-H,CI-B02 GS01S,CI-B03 GS01S-H,VCT1,CI-B02GS01S,CI-B0XGS01S,CI-B02 GS01S-H,CI-B02 MB-V10,GS,CI-B02GS01J,CI-B03GS01-H,CI-B02CS01S,CS,CI-B02GS04J-BT2,CI1122,CI1102,CI1103,CI-B02GS04T-MB,CI-B03GS01J
【产品】工作电压3.6~5.5V的语音识别模块CI-D0XGS01J,支持500条离线命令词识别
启英泰伦针对低成本离线语音应用方案开发出一款通用、便携、低功耗高性能的语音识别模块,型号为:CI-D0XGS01J,主芯片为CI1301、CI1302、CI1303,可以实现最大500条(型号不同支持的词条数不同)以下的离线命令词识别。
电子商城
服务
根据用户的蓝牙模块,使用Bluetooth 蓝牙测试装置MT8852B,测试蓝牙1.0至5.1,包括传输速率、功率、频率、调制和接收机灵敏度,生成测试报告。支持到场/视频直播测试,资深专家全程指导。
实验室地址: 深圳 提交需求>
根据用户的接口模块,使用是德示波器及夹具查看实时眼图演示,测试USB/MIPI/DDR/SATA/HDMI协议,支持最高到1.2GHz的实时眼图协议测试。支持到场/视频直播测试,资深专家全程指导。
实验室地址: 深圳 提交需求>
登录 | 立即注册
提交评论