【经验】如何设计语音产品中文、英文和日文的唤醒词和命令词
在实际开发语音产品过程中,要达到好的语音识别效果,除了语音算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。所以本文启英泰伦介绍一下如何设计中文、英文和日文的唤醒词和命令词。
中文唤醒词设计
一般为4-6个字,4个字最佳,过短容误唤醒高,过长不便用户呼叫和记忆;
命令词中字的音节较长且相邻汉字的声韵母区分度越大越好;
应避免重复或者相近读音的字出现在唤醒词中。相邻音节要规避连音,即避免前一个韵母与后面声母相同或近似,比如“语音”;
字要发音清晰、能量响度高、开口度大,最好带有爆破音,声调建议选择第四声,如“灌溉”;
尽量选取不常说词作为唤醒词,可以有效降低误唤醒甚至避免误唤醒;
应避免使用叠词,如:“你好你好”、“宝宝开机”;
为提高发音能量,可选择包含爆破音声母的音节,如p、b、t、d、k、g等;
韵母选择大口型,开口音的韵母,比如a、ai、an、ian、ao,避免e、i、en、in等;
中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符;
平台提供了唤醒评价功能,如唤醒词的适合度为“优”,则是一个较好的唤醒词;
一个模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能。
中文命令词设计
一般为4-6个字,4个字最佳,过短容误识高,过长不便用户呼叫和记忆;
命令词中相邻汉字的声韵母区分度越大越好;
符合用户的语言习惯,尽量采用常用说法,内容具体直接;
应避免使用日常用语,如:“吃饭啦”;
生僻字和零声母字应尽量避免,如“语音识别”中“语音”两个字均为零声母字;
命令词中的字最好不要有语气词,如“啊”、“呢”等;
应避免使用叠词,如:“你好你好”;
中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符;
命令词中的数字需要以汉字表示,如“调高一度”;
若您还未确定命令词,建议您从文档中心的“命令词推荐”中选择。
英文唤醒词设计
唤醒词建议由2-4个单词(4-6个音节)组成,过短容易出现高误唤醒,过长不便用户呼叫和记忆;
唤醒词中单词的音节较长且相邻发音区分度越大越好;
应避免重复或者相近读音的单词出现在唤醒词中,相邻音节要规避连音;
单词要发音清晰、能量响度高、开口度大;
尽量选取不常用的词作为唤醒词,避免使用日常用语,可以有效降低误唤醒甚至避免误唤醒;
应避免使用叠词,如:“HELLO-HELLO”;
一个语言模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能,具体方法可联系启英泰伦。
英文命令词设计
建议由2-4个单词(4-6个音节)组成,过短容易出现高误识,过长不便用户记忆;
命令词间音节区分度越大越好;
符合用户的语言习惯,尽量采用常用说法,内容具体直接;
应避免使用日常用语,如:“HI、HELLO”;
避免使用相似音节,词的发音清晰响度要大,如避免同时使用TURN-ON和TURN-OFF;
应避免使用叠词,如:“HELLO-HELLO”。
日文唤醒词设计
唤醒词建议由4-6个音节的日文组成,过短容易出现高误唤醒,过长不便用户呼叫和记忆;
唤醒词中单词的音节较长且相邻发音区分度越大越好;
应避免重复或者相近读音的词出现在唤醒词中,相邻音节要规避连音;
词要发音清晰、能量响度高、开口度大;
尽量选取不常用的词作为唤醒词,避免使用日常用语,可以有效降低误唤醒甚至避免误唤醒;
应避免使用叠词,如:如:“ラボ-ラボ”;
一个语言模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能,具体方法可联系启英泰伦。
日文命令词设计
一条日语命令词建议由4-6个音节的日文组成,过短容易出现高误识,过长不便用户呼叫和记忆;
命令词间音节区分度越大越好;
符合用户的语言习惯,尽量采用常用说法,内容具体直接;
应避免使用日常用语,如:“はい、おはよ”;
避免使用相似音节,词的发音清晰响度要大,如;下げて(sa ge te)、上げて(a ge te);
应避免使用叠词,如:“ラボ-ラボ”。
只要唤醒词和命令词设计得当,产品的识别率和误识别率都能改进很多。启英泰伦提供多个热门领域(包含空调、风扇、插座、窗帘、照明等)标准命令词参考,让产品开发更简单。
- |
- +1 赞 0
- 收藏
- 评论 0
本文由水冰月转载自启英泰伦,原文标题为:【经验】开发语音产品时设计唤醒词和命令词的技巧,设计巧妙能极大提升语音识别效果,本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
相关推荐
【经验】详解散热风扇噪音测试及减少风扇噪音的七大最佳方法
物理上常用的音量定义方式是声压音量,以dB为单位。但是定义风扇的噪音量时,以风扇发出来的噪音功率来定义较合适,一般通用的风扇噪音单位是Db(A)。 本文中华夏恒泰将为大家详解散热风扇噪音测试及减少风扇噪音的七大最佳方法。
【经验】启英泰伦AI语音芯片CI1102固件烧录方法及步骤
启英泰伦AI语音芯片CI1102基于NPU+MCU架构设计,内置脑神经网络处理器BNPU。广泛应用于各类语音交互的智能家电设备上。本文通过具体项目案例介绍启英泰伦AI语音芯片CI1102的烧录方法及步骤。
【经验】如何选择与测试空调电容的好坏?
空调里面也有电容,电容过大过小都会影响空调的正常运行,如何选择空调电容的大小?跟着小编接着往下看下去,你就知道了。
智能窗帘产品需要哪些分立器件?
作为一款消费类电子产品,智能窗帘产品的工作原理是基于传感器、IoT和芯片控制及处理等集成的产品,采用先进技术的窗帘可根据环境条件和用户需求智能地控制窗帘的开合。它需要哪些分立器件产品配合,如何实现强大的功能,合科泰本期来讲解一下。
【产品】启英泰伦“离线语音+IoT”语音解决方案助力AIoT,支持300ms的极速响应
启英泰伦“离线语音+IoT”方案现已融合涂鸦云、腾讯云,阿里云等IoT平台,支持WiFi,Zigbee等多协议,用户可以很便捷地进行设备的语音、手机App/小程序双控和场景联动,实现IoT、云内容、语音交互的自然融合。产品在没有联网状态下,可以通过语音控制产品自身的功能。支持300ms的极速响应,拥有100+个词条的丰富配置。
请问启英泰伦的模块如何生成语音固件?
可以在本文档中心软件开发中查看相关使用内容,并使用启英泰伦提供的语音AI平台生成固件。
启英泰伦第三代AI语音芯片CI1303助力秒秒测全新智能语音闹钟,可实现10米远场语音识别
近日,启英泰伦的优秀合作伙伴秒秒测发布全新一代智能语音闹钟,搭载启英泰伦第三代AI语音芯片CI1303,通过边缘计算代替云计算,不需联网,精准识别,响应快速。可语音控制闹钟的计时、定时、亮度、音量、开关等功能;可实现10米远场语音识别,准确度高达97%以上。
【IC】启英泰伦CI13LC系列:打造AI语音芯片性价比之王!
CI13LC系列芯片型号包括CI13081、CI13161、CI13162、CI13242、CI13322等,各型号间主要差异体现在封装形式、Flash存储、外设控制接口等,以灵活应对不同客户需求。在高端领域,持续推广第3代CI13XX系列芯片,聚焦多功能,强体验。而在中低端产品市场,则精心打造性价比出众的3.5代CI13LC系列芯片,主要面向小家电、消费类市场。
启英泰伦的语音模块如何自己定制播报音?
播报音可以通过启英泰伦提供的语音AI平台进行定制,该平台也提供语音合成。
【软件】界面友好、功能丰富的启英泰伦语音AI平台V3.0,可通过平台和工具实现无代码开发语音产品项目
今年7月,启英泰伦发布了语音AI平台 V3.0。自此,许多客户在新平台上开始了应用开发。此版本在V2.0的基础上界面更加友好、功能更加丰富、性能更加稳定、识别效果更优。同时AI平台增加了更多热门方案和工具,满足客户通过平台和工具实现无代码开发语音产品项目。
启英泰伦语音芯片选型表
启英泰伦语音芯片使用BNPUV3和BNPU V3.5的算法,主频210MHz~240MHz,Sram288KB~1000KB,内置1~6MB的Flash,词条数量100~500+条,外部用电3.3V/5V,部分支持中、英、日语言,使用MP3编码
产品型号
|
品类
|
BNPU版本
|
CPU主频
|
SRAM
|
FLASH
|
CODEC
|
UART接口数
|
I2S接口数
|
PWM接口数
|
IIC接口数
|
PDM
|
SAR ADC通道数
|
GPIO数量(含复用引脚)
|
VCC33供电&VCC11供电
|
晶振
|
封装
|
本地语音识别
|
支持语言
|
词条数量
|
单/双降噪麦克风
|
ADPCM解码
|
MP3解码
|
外置IOT模块
|
AEC播放打断
|
双麦增强
|
双麦定向
|
本地自学习
|
本地声纹识别(同时支持本地语音识别)
|
离线自然说(十万级自然说法)
|
CI13081
|
语音芯片
|
BNPU V3.5
|
210MHz
|
288KB
|
内置1MB
|
Mono Codec
SNR>95dB
|
1
|
0
|
2
|
1
|
/
|
/
|
3
|
内置
|
内置
|
SOP8
|
支持
|
中、英
|
100
|
单麦
|
不支持
|
支持
|
不支持
|
/
|
/
|
/
|
/
|
/
|
/
|
选型表 - 启英泰伦 立即选型
请问启英泰伦芯片的功耗怎样,是否支持电池应用?
因为离线语音识别要一直开启监听模式,其功耗目前较难做到非常小。例如目前启英泰伦的CI110X系列语音芯片(CI1102/CI1103)待机功耗约10mA左右, 正常运行功耗35到50mA左右。如果用于电池应用,考虑到待机时间,建议使用大容量电池。或如果有按键,可以用按键开启语音功能后再给语音模块上电,不使用语音功能时给语音模块断电以节省耗电。启英泰伦芯片方案上电后一般0.5秒左右可进入到识别状态。
【应用】启英泰伦取暖桌离线智能语音解决方案,具备强劲的回声消除和环境噪声抑制能力
启英泰伦具备成熟的取暖桌离线语音解决方案,不需要联网即可语音控制取暖桌的升降,取暖模式、温度等。该方案采用启英泰伦最新推出的第三代智能语音芯片CI130X系列(CI1301、CI1302、CI1303、CI1306)。
电子商城
登录 | 立即注册
提交评论