The Technologies Involved in Speech Recognition Chips

2022-02-12 POROSVOC

Speech recognition chips are also called speech recognition ICs. Compared with traditional voice chips, the biggest feature of voice recognition chips is that they can recognize voices. It allows machines to understand human voices and perform various actions on command, such as blinking, opening a mouth (smart doll). In addition, the speech recognition chip also has high-quality, high-compression recording and playback functions, enabling man-machine dialogue.This post POROSVOC will introduce the technologies involved in speech recognition chips.

Fig.1

The technologies involved in speech recognition chips include signal processing, pattern recognition, probability theory, information theory, sound mechanism, auditory mechanism, artificial intelligence, etc.


According to the user's restrictions, the speech recognition chip can be divided into a specific person's speech recognition chip and a non-specific person's speech recognition chip.


specific person speech recognition

The specific person speech recognition chip is used for the specific person's speech recognition. If no other person can be recognized, the user's speech reference sample must be stored in the database as a comparison database, that is, the speech recognition of a specific person must be trained on speech before use, usually following the machine prompt to train the speech input twice to use it.


Human-Independent Speech Recognition

Human-independent speech recognition is a recognition technology that does not need to target a specific person regardless of age or gender, as long as the same language is used. The application pattern was to collect about 200 people based on a dozen or so voice interaction items identified before the product was finalized. The voice samples of the PC are processed by the PC algorithm to obtain the voice model and feature database of the interactive entry and then burned into the chip. Machines using this chip (smart dolls, electronic pets, children's computers) have interactive capabilities.


Some non-human speech recognition applications are based on phoneme algorithms. In this mode, interactive recognition can be performed without collecting many people's speech samples, but the disadvantage is that the recognition rate is not high and the recognition performance is unstable.


According to the continuity of speaking mode, speech recognition chips can be divided into discontinuous speech recognition and continuous speech recognition.


Intermittent speech recognition

For discontinuous speech, each spoken word must be identified separately, and a pause is required after each word is spoken.


Continuous speech recognition

Continuous speech recognition can perform human-like speech recognition in a generally natural and fluent way of speaking, but it is difficult to achieve good recognition results due to the problem of connecting voices. 

授权代理商:世强先进(深圳)科技股份有限公司
技术资料,数据手册,3D模型库,原理图,PCB封装文件,选型指南来源平台:世强硬创平台www.sekorm.com
现货商城,价格查询,交期查询,订货,现货采购,在线购买,样品申请渠道:世强硬创平台电子商城www.sekorm.com/supply/
概念,方案,设计,选型,BOM优化,FAE技术支持,样品,加工定制,测试,量产供应服务提供:世强硬创平台www.sekorm.com
集成电路,电子元件,电子材料,电气自动化,电机,仪器全品类供应:世强硬创平台www.sekorm.com
  • +1 赞 0
  • 收藏
  • 评论 0

本文由三年不鸣转载自POROSVOC,原文标题为:Do you know the voice recognition chip?,本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

评论

   |   

提交评论

全部评论(0

暂无评论

相关推荐

What Fields are Recording Chips Generally Used in?

In order to have a recording function, a recording chip (recording ic) is of course indispensable. This article POROSVOC will share which industry equipment needs a recording chip in the future, let‘s take a look at the following.

设计经验    发布时间 : 2022-02-14

【经验】一文带你了解OTP芯片是什么?

OTP芯片是MCU的一种内存类型,意味着一次将可编程的:程序刻录到IC后不能再更改。因此,OTP语音芯片是指可以一次性刻录的语音IC,客户提供声音后,语音IC环形核心可以通过语音处理和编程后刻录工具刻录到OTP芯片上,波洛斯带你了解OTP芯片是什么?

设计经验    发布时间 : 2021-12-22

Introduction to Technical Parameters of USB Noise Reduction Microphone

Have you heard about the USB noise-cancelling microphone and its technical parameters? This article POROSVOC will introduce what is an OTP chip?

设计经验    发布时间 : 2022-02-17

选型指南  -  波洛斯  - 2021/12/23 PDF 中文 下载

数据手册  -  波洛斯  - V1.0  - 2024/1 PDF 中文 下载

波洛斯音频处理芯片选型表

波洛斯提供两种类型语音芯片:语音降噪芯片、语音识别芯片;语音降噪芯片:提供降噪、回声消除、拾音距离可达10m,接受最多8麦输入,适用65~75dB环境;语音识别芯片:提供最远8米,最多150条,超低功耗,可定制的语音识别功能,支持中英识别。

产品型号
品类
适用场景
拾音/识别距离(m)
mic数量
输入
封装
描述
应用领域
POROSVOC-PNC102
语音降噪芯片
65-75dB噪音环境
0-5m
1
模拟数字
QFN32(5x5mm)
AI语音芯片、数字音频处理器,搭载POROSVOC单麦DNN神经网络降噪算法
对讲机 • 通话耳机、话务耳机 • USB麦克风 • 降噪声卡 • 其它降噪收音类产品

选型表  -  波洛斯 立即选型

数据手册  -  波洛斯  - V1.0  - 2021/12 PDF 中文 下载 查看更多版本

基于X波段雷达芯片的微/运动感知模组MR1020,中心频率10.525GHz,适合嵌入式隐蔽安装

波洛斯POROSVOC-MR1020是一款基于X波段雷达芯片而设计的微/运动感知模组,中心频率为10.525GHz。模组设计采用定频、定向发射和接收天线(1T1R),集成中频解调、信号放大和数字处理等功能,具备延时设置、感知范围可调和光强度检测等能力。

产品    发布时间 : 2023-10-31

【产品】融合6MIC麦克风阵列技术的工业级音频处理模组POROSVOC-20X3-6,采用拔插式连接方式,即插即用

POROSVOC 20X3是波洛斯融合6MIC麦克风阵列技术,将波洛斯自主研发的DNN、AGC、AES、ASR、等多种声学处理算融入到我司自主研发SOC上,推出的一款工业级音频处理模组。该模组采用拔插式连接方式,即插即用。

产品    发布时间 : 2022-07-21

【产品】采用32bit RSIC架构的音频处理芯片PNC102S,搭载DNN神经网络降噪算法

波洛斯音频处理芯片PNC102S搭载DNN神经网络降噪算法、AGC自动增益调节算法,Ai算法+DSP完美融合,可广泛且快速应用于USB麦克风、直播设备、USB声卡、音视频设备、对讲、话务耳机、拾音器等领域。

产品    发布时间 : 2022-03-06

数据手册  -  波洛斯  - V1.0  - 2023/7 PDF 中文 下载

【应用】波洛斯PNC102降噪芯片用于对讲机,无需外挂解码芯片,信噪比达105db

波洛斯PNC102降噪芯片用于对讲机降噪,信噪比达105db,功耗30毫安,成本低,降噪效果好,外围器件简单;最多支持16个GPIO,所有GPIO均可配置为外部中断输入和唤醒源;内置1个支持外接PSRAM的SPI Master@MAX 60M等。

应用方案    发布时间 : 2022-06-15

用户指南  -  波洛斯  - V1.0  - 2021/12 PDF 中文 下载

数据手册  -  波洛斯  - VI. 0  - 2022/4 PDF 中文 下载

展开更多

电子商城

查看更多

只看有货

品牌:波洛斯

品类:降噪芯片

价格:¥22.8600

现货: 51,213

品牌:波洛斯

品类:降噪芯片

价格:¥8.5700

现货: 51,000

品牌:波洛斯

品类:离线语音识别芯片

价格:¥7.7100

现货: 51,000

品牌:波洛斯

品类:低功耗离线语音识别芯片

价格:¥8.1400

现货: 51,000

品牌:波洛斯

品类:降噪芯片

价格:¥9.0000

现货: 50,470

品牌:波洛斯

品类:回声消除芯片

价格:¥10.7100

现货: 50,000

品牌:波洛斯

品类:全功能语音模组

价格:¥299.0000

现货: 10,000

品牌:波洛斯

品类:语音芯片

价格:¥30.7500

现货: 70

品牌:波洛斯

品类:开发工具

价格:¥90.0000

现货: 31

品牌:波洛斯

品类:PCB开发板

价格:¥200.0000

现货: 30

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

品牌:

品类:

价格:

现货:

现货市场

查看更多

暂无此商品

海量正品紧缺物料,超低价格,限量库存搜索料号

服务

查看更多

EDA芯片设计软件免费使用

世强深圳实验室提供Robei EDA软件免费使用服务,与VCS、NC-Verilog、Modelsim等EDA工具无缝衔接,将IC设计高度抽象化,并精简到三个基本元素:模块、引脚、连接线,自动生成代码。点击预约,支持到场/视频直播使用,资深专家全程指导。

实验室地址: 深圳 提交需求>

2G/3G/4G射频测试

支持GSM / GPRS 等多种制式产品的射频测试,覆盖所有上行和下行的各项射频指标,包括频差、相差、调制、功率、功控、包络、邻道泄漏比、频谱、杂散、灵敏度、同道干扰、邻道干扰、互调、阻塞等等。满足CE / FCC / IC / TELEC等主流认证的射频测试需求。

实验室地址: 深圳 提交需求>

世强和原厂的技术专家将在一个工作日内解答,帮助您快速完成研发及采购。
我要提问

954668/400-830-1766(工作日 9:00-18:00)

service@sekorm.com

研发客服
商务客服
服务热线

联系我们

954668/400-830-1766(工作日 9:00-18:00)

service@sekorm.com

投诉与建议

E-mail:claim@sekorm.com

商务合作

E-mail:contact@sekorm.com

收藏
收藏当前页面