智能电视的神来一笔:在遥控器上添加语音功能!
在物联网(Internetof Things,IoT)时代,可连接设备变得越来越智能。我们拥有智能手机、智能家居、智能汽车、智能电器,甚至智能电视。但是,无法回避的现实问题是:既然电视如此智能,那为何遥控器却如此平庸无奇?
大家都有使用遥控器遥控智能电视的经验,仅仅是想观看自己喜欢的节目也许就已经觉得很繁琐了。甚至设置互联网连接都更令人气馁。你可能还忘不了在浏览器中输入URL之难。有些电视允许用户使用键盘、甚至允许使用智能手机,但这些连接方法没有一种是简单方便的。
为了提高终端用户的体验,一些电视厂商正在遥控器上实现更先进的特性,比如添加语音识别能力。带有语音功能的遥控器,互动变得更加便捷和快速,因为用户只需简单地激活遥控器并说出命令,而该命令能够完全位于电视的菜单结构之外。例如,在观看节目时,用户可以按下遥控器上的激活按钮,并且说:“录制《生活大爆炸》”,就是如此简单即可操控电视机完成工作。而在旧有模式中,用户要实现这个简单的任务需要经过费时又费力的过程。
前不久,SiliconLabs推出了语音使能的ZigBee遥控器解决方案,该完整参考设计解决方案通过在单芯片无线SoC中实现高质量的软件音频编解码器,显著降低了语音使能遥控器通常所需的高成本外部硬件,并简化了整个设计过程。针对如何为遥控器添加语音功能,SILICON LABS公司的物联网MCU和无线产品经理Matt Maupin特地撰写了一篇技术文章——“智能电视的神来一笔:在遥控器上添加语音功能”。该文介绍了遥控器语音识别的优势和运行方式,为遥控器添加语音功能的必要性,以及语音遥控器的技术和成本因素,并通过语音遥控器的实例介绍了其实现方式。
图1:智能遥控器示意图
遥控器历史及什么使得它们更加“智能”
第一个无线电视遥控器可以追溯到20世纪50年代的超声波ZenithSpace Command。20世纪80年代,这些基于RF的遥控器逐步被红外技术所取代,并且直到现在,我们使用的基于红外线的遥控器与之前相比也几乎没有什么改变。
为了提高终端用户的体验,一些电视厂商正在遥控器上实现更先进的特性,例如双向RF通信、非视线限制和QWERTY键盘接口。然而,制造商还未能提高遥控器的特性以匹配电视性能。
遥控器语音识别的优势
在电视遥控器中添加语音识别能力,能够使终端用户获得更好的用户体验。没有语音识别时,大多数当前的遥控器在按键方面的表现无法令人满意,例如传输延迟问题,在拼写方面也是缺少进步,且用起来令人不便。
带有语音功能的遥控器,互动变得更加快速,因为用户只需简单的激活遥控器并说出命令,该命令能够完全位于电视的菜单结构之外。
例如,在观看节目时,用户可以按下遥控器上的激活按钮,并且说:“录制《生活大爆炸》”,就是如此简单。而在旧有模式中,用户要实现这个简单的任务需要经过费时又费力的过程。
语音识别如何运行
如何在手持设备上实现语音识别?它并不像我们想象的那样简单。执行语音识别所需要的处理能力和数据远超出了大多数遥控器、电视甚至智能手机的能力。事实上,当今智能手机上的语音识别是通过云计算完成的。
还记得过去的语音标签吗?就是指录制语音命令并链接到一个任务(例如拨打联系人列表中的号码)时。从理论上讲,你可以说“拨打Ken的电话”,如果运气好,手机会“拨打Ken的电话”,不过,多数情况下,它会告诉你“正在拨打Ben的电话”。
近年来语音识别已取得很大进步,语音识别的领先者包括Nuance、Microsoft、Google、Amazon和其他许多公司。当我们使用Siri、Google、Alexa进行语音控制时,这些应用首先数字化我们的声音,然后发送到互联网上的某个处理中心,最后返回一个响应。图2说明了这种交换的复杂性:
图2:从用户语音到云再到用户响应的全过程
通过永远在线的特性,从Google网页或者AndroidOS手机上简单地说“OKGoogle”就能够触发搜索,在搜索中,你的语音命令被数字化、云处理,然后转换成用于搜索命令的文本。在电视市场中实现语音命令的关键因素是:智能电视已经连接到互联网,并且能够充分利用这一重要的基础设备。
遥控器语音的需求
既然智能电视已经有了互联网连接,大家可能会问“为什么还需要遥控器呢?难道不可以直接对电视说话来控制电视吗?它现在已经连接到互联网了啊!”。答案是“可以”,但是这种解决方案带来几个问题。
首先,对于不通过遥控器而直接识别语音的电视来说,它需要持续的监听。当前一些电视能够这样做,事实上也是这样做的;然而,这个功能的意想不到的后果是来自于可能泄露隐私的负面压力。
当电视为获得命令而不断的监听和解码用户会话时,它就必须不断的发送这些谈话到互联网。终端用户一般不会注意到这个问题,如果他们注意到了,他们很可能会关闭这个功能,禁用语音控制。
其次,是有关设备能力的问题。设备是否能够从周围噪声中挑选出命令声音,或者从电视音频或者背景会话中区分出语音命令。
通过使用遥控器去启动和流化语音命令,用户可以大大减少对这些问题的担忧,因为用户是主动和有意识地与电视机遥控器进行交互,并且用户手持遥控器,这样设计是为了近距离接收声音,而不是接收整个房间的声音。
技术和成本
既然好处多多,那为什么语音遥控器没有普及呢?答案涉及三个方面:基础设备、技术和成本。
基础设备:即使家中的硬件支持语音识别,支持它的后台基础设施也必须到位。这意味着电视供应商必须开发语音识别引擎或者从第三方获得付费服务。好消息是,这种方法正变得更加主流,这是由于运营商正在试图差异化以及改善用户体验。
技术:众所周知,在把语音识别正确地转换为文本命令的过程中有许多困难,但这些困难和挑战正在通过云计算而快速得到解决。其他问题是,哪种无线技术能够把语音数据从遥控器传输到电视或者可用的互联网连接上,并且不会降低电池的使用寿命。
典型的语音识别系统需要具有16kSps采样率的16位分辨率的ADC,这产生256 kbps的数据传输率。这意味着除非无线技术拥有至少256 kbps的吞吐量,否则一些压缩是必需的。通过压缩满足吞吐量的要求,采用像ZigBee Remote Control这样的无线技术能够提供足够的数据传输率和卓越的电池使用寿命。
成本:归根结底是成本:基础设施成本、电视成本和遥控器本身的成本。
关于遥控器成本的更多信息
添加语音功能到遥控器能够轻易地使标准RF遥控器的物料清单(BOM)成本翻倍。支持语音的遥控器必须支持RF,添加麦克风和编解码器,并且包括相关的支持电路。下面的框图对比了IR、RF和RF+语音的架构。每一个遥控器还是要保留IR连接能力,以便支持仍然使用IR的传统设备。
图3显示了使用极低成本MCU或ASIC实现IR控制的典型的IR遥控器设计。在一些情况下,该设计将添加额外的非易失性存储器用于包含支持不同设备(例如电视和DVD播放器)所需的IR数据库编码。(试想“万能遥控器”)
图3:IR遥控器系统的示例
在图3中,IR示例中的微控制器(MCU)被RF片上系统(SoC)器件所代替,并且添加了天线。虽然RF SoC通常比IR MCU昂贵,但是增加的额外成本能够抵消,因为事实上不需要存储较大的IR数据库,因此可以省去非易失性存储器的成本。RF遥控器能够从电视或有线电视/卫星电视机顶盒,通过双向RF链路下载所需的IR控制编码。当设备被配置时这种编码可能还不被支持时,这种双向RF链路也支持用于更新设备的最新IR编码。
图4:RF遥控器系统示例
在图4中,通过嵌入硬件编解码器和麦克风,我们能够把语音能力添加到RF遥控器。这些器件显著增加了BOM成本。然而,随着当前无线SoC芯片处理能力的提高,我们可以找到硬件编解码器的替代方案。例如,许多ZigBeeSoC包含ARM Cortex-M处理器,有足够的处理能力来满足RF遥控器的需求,而且同时也能够作为音频编码/解码的软件编解码器。
图5:语音操作遥控器系统示例
语音使能的遥控器示例
让我们来看一个全功能的遥控器参考设计(如图6所示),它支持IR、RF和语音能力。
图6:ZigBee遥控器参考设计
对于语音音频,我们需要支持256 kbps的吞吐量。ZigBee具有256 kbps的数据传输速率,但是在点对点连接上实际吞吐量通常为100 kbps或更少。这意味着我们在发送语音到云端之前需要4:1的压缩。
参考设计示例支持软件编解码器,可以显著节省成本而没有缩减功能。软件编解码器基于直连数字脉冲密度调制(PDM)麦克风到这个SoC的SPI和GPIO引脚,如图7所示。
图7:连接PDM麦克风到Silicon Labs的EM341 ZigBeeSoC
SoC中的Cortex-M3内核控制PDM以完成脉冲编码调制(PCM)滤波/抽取、均衡和压缩过程。图7显示了从PDM输出到ZigBee发射的整个过程。
图8:从PDM到ZigBee包发送的过程概述
通过使用软件编解码功能,不仅性能满足了语音到文本引擎的需求,而且极大地降低了成本。表1显示了预估的BOM节省成果。
表1:硬件/软件编解码器比较
总结
手持电视遥控器中的语音控制显著提升了用户体验。添加语音控制的过程是具有挑战性的,但近些年来随着语音识别技术的进步已经变得更加容易。此外,使用于遥控器中的嵌入式无线SoC增加的集成度和性能也能够支持诸如软件编解码器等创新功能,这减少了BOM成本和制造复杂度,并且不会降低性能。
- |
- +1 赞 0
- 收藏
- 评论 1
本网站所有内容禁止转载,否则追究法律责任!
相关研发服务和供应服务
相关推荐
【经验】借助wireshark 来调试zigbee网络
在开发zigbee设备的过程,通常要使用zigbee sniffer , 目前可以用的工具比较多,包括TI, Silicon Labs都有自己的工具,不过还有一个开源工具做的非常优秀,特别在此推荐给大家,它可以对数据包进行规则着色,在设计的过程中会更加直观。
设计经验 发布时间 : 2019-03-31
【经验】浅析Zigbee射频测试相关标准
Zigbee是很多公司目前在使用的技术,部分厂家采用现成的模组,还有大部分公司选择Layout出自己的产品。无论哪种方式,射频测试都是必须要进行的。
设计经验 发布时间 : 2018-02-26
【经验】Silicon Labs Zigbee设备入网以及离网流程
EFR32MG是Silicon labs专门针对IOT推出的Zigbee方案,具有最全的Zigbee网络协议,被广泛应用在智能家居,工业控制等行业。
设计经验 发布时间 : 2017-07-28
技术问答 发布时间 : 2024-07-15
EFR32MG的ZIGBEE测试,连接开发板无法看到开发板的IP地址,怎么解决?
DEMO 需要连接到带有DHCP服务器的局域网中,会自动分配IP地址给 DEMO板 ,再将装有simplicity studio软件的电脑和开发板接入同一个局域网内,就可以在simplicity studio中看到该DEMO板分配的IP地址,选择后就可以进行操作 。
技术问答 发布时间 : 2017-05-16
Zigbee系统包含几大模块?
Zigbee系统包含模块有:1、ZigBee网络节点,包含End Device/Router;2、ZigBee网关,带有WIFI/以太网的接口,是ZigBee网络和云端、Internet、手机连接的桥梁,里面包含有ZigBee芯片,作为Coordinater;3、云端/Web Server;4、手机APP。
技术问答 发布时间 : 2016-10-25
With an Eye on Security, CSA Releases the Latest Zigbee Specification
As one of the few vendors with a full portfolio of Zigbee reference devices that support all of these new features, Silicon Labs will continue to set the standard for providing Zigbee development tools and solutions.
原厂动态 发布时间 : 2023-05-11
AN307:EFR32无线通信模块——Zigbee(OTA客户端配置)
描述- EFR32无线通信模块,是由世强独立研发,供客户测试评估蓝牙、Zigbee、Thread、蓝牙Mesh及私有协议的平台,也可以直接嵌入到产品中做应用,同时,可以在平台上搜索到关于模块的所有资源,包括原理图、Layout。
型号- EFR32
【应用】涂鸦推出触摸遥控器智能化方案,可完美解决2.4G和5G混频路由器配网成功率低的问题
涂鸦本方案适用于触摸遥控器的设计。基于Beacon 、Bluetooth Mesh或者Zigbee通信协议,所打造的遥控器基于MCU通用对接或者SDK对接方案,能够快速实现产品智能化。 可轻松实现单灯、组灯、区域场景的智能化控制。
应用方案 发布时间 : 2022-01-26
【经验】基于Silicon Labs 无线SoC EFR32MG的Zigbee节点网络信息保存与恢复
Silicon Labs的Zigbee无线SoC EFR32MG在Zigbee的应用中占有非常多的份额,主要的优势为集成PA,最高19.5dbm的发射功率,-102.7dbm接收灵敏度,整个链路预算即122.2db,穿墙的效果非常好。全球范围内使用EFR32MG作为Zigbee网关的产品高达80%。本文讲述基于Silicon Labs 无线SoC EFR32MG的Zigbee节点网络信息保存与恢复
设计经验 发布时间 : 2019-01-18
AN308:EFR32无线通信模块——Zigbee(OTA操作)
描述- EFR32无线通信模块,是由世强独立研发,供客户测试评估蓝牙、Zigbee、Thread、蓝牙Mesh及私有协议的平台,也可以直接嵌入到产品中做应用,同时,可以在平台上搜索到关于模块的所有资源,包括原理图、Layout。
型号- EFR32
【应用】涂鸦推出旋钮遥控器智能化方案,可轻松实现单灯、组灯、的智能化控制
涂鸦本方案适用于旋钮遥控器的设计。基于Beacon 、Bluetooth Mesh或者Zigbee通信协议,所打造的遥控器基于MCU通用对接或者SDK对接方案,能够快速实现产品智能化。 可轻松实现单灯、组灯、的智能化控制。
应用方案 发布时间 : 2022-01-25
AN301:EFR32无线通信模块——Zigbee(SoC协调器工程创建)
描述- EFR32无线通信模块,是由世强独立研发,供客户测试评估蓝牙、Zigbee、Thread、蓝牙Mesh及私有协议的平台,也可以直接嵌入到产品中做应用,同时,可以在平台上搜索到关于模块的所有资源,包括原理图、Layout。
型号- EFR32
Zigbee采用无线SoC EFR32MG芯片做NCP方案,请问如何给加入网络的设备发送数据?
send发送命令,可以理解为发送缓冲buffer里面的内容。因此,在send之前,需要使用CLI命令组建一条你想发送的命令。这种场景,通常应用在ZCL命令下。首先所有的命令可以在SimplicityStudio安装目录找到详细的解释。C:/SiliconLabs/SimplicityStudio/v4/developer/sdks/gecko_sdk_suite/v1.1/protocol/zigbee_5.10/documentation/120-3023-000_AF_V2_API/group__cli.html比如发送一条on/off命令给一个节点。你可以在任意节点上输入info查看当前节点的网络信息,比如nodeID,PANID,endpotin,cluster信息等等。send [id:2] [src-endpoint:1] [dst-endpoint:1]Send a pre-buffered message from a given endpoint to an endpoint on a device with a given short address.id - INT16U - short id of the device to send the message tosrc-endpoint - INT8U - The endpoint to send the message fromdst-endpoint - INT8U - The endpoint to send the message to 假设从A节点发送on/off命令到B节点。通过info查看A节点的nodeID(0x0001),Endpoint是1。通过info查看B节点的nodeID(0x0002),Endpoint是1。那么可以在A节点的CLI使用如下命令。 ZCL on/off onSend 0x0002 1 1
技术问答 发布时间 : 2017-06-27
Zigbee全球认证产品已超4000款,了解认证流程、稳握时代商机!
CSA连接标准联盟近期公布已有超过4000款Zigbee 认证产品和兼容平台上市,其中Zigbee 3.0认证产品就达到1000 款。继2020年认证数量创纪录之后,2021年认证再次激增,并在4月初达到这一重要里程碑。
行业资讯 发布时间 : 2021-06-30
电子商城
品牌:SILICON LABS
品类:Mighty Gecko Multi-Protocol Wireless SoC
价格:¥27.0929
现货: 90,767
品牌:SILICON LABS
品类:Wireless Gecko SoC
价格:¥10.4994
现货: 61,779
品牌:SILICON LABS
品类:Wireless Gecko SoC
价格:¥11.5212
现货: 59,367
品牌:SILICON LABS
品类:Gecko Multi-Protocol Wireless SoC
价格:¥44.9692
现货: 12,980
品牌:SILICON LABS
品类:Mighty Gecko Multi-Protocol Wireless SoC
价格:¥19.4183
现货: 7,500
现货市场
服务
支持 3Hz ~ 26.5GHz射频信号中心频率测试;9kHz ~ 3GHz频率范围内Wi-SUN、lora、zigbee、ble和Sub-G 灵敏度测量与测试,天线阻抗测量与匹配电路调试服务。支持到场/视频直播测试,资深专家全程指导。
实验室地址: 深圳/苏州 提交需求>
Ignion可支持多协议、宽频段的物联网天线方案设计,协议:Wi-Fi、Bluetooth、UWB、Lora、Zigbee、2G、3G、4G、5G、CBRS、GNSS、GSM、LTE-M、NB-IoT等,频段范围:400MHz~10600MHz。
最小起订量: 2500 提交需求>
登录 | 立即注册
提交评论