为电视遥控器增加低功耗语音识别技术

2020-09-01来源: EEWORLD关键字:语音识别

虚拟助理被集成到家中更多的设备中,亚马逊最近宣布,它将为Alexa推出包括耳塞、眼镜和戒指在内的多种新型设备,为消费者提供更多获取信息的途径。在这些新的语音产品中反复出现的主题是无线和免提的,可轻松地连接到手机或其他主机上,并聆听指令。其内部技术是一个支持无线连接的蓝牙射频芯片组和运行唤醒字引擎(WWE)的专用嵌入式处理器来识别语音命令。


这种趋势的另一个例子是,每一台新的平板电视、机顶盒和媒体播放器都配备了遥控器,他们也将很快完全无线和免提。当然,当你想要语音控制的时候,很多人仍然会使用旧的红外视线遥控模式或者按键对话,但这些都很快就过时了。用户需要一个能无缝响应命令的设备,而不是像对讲机那样必须按住通话键的设备。与最近亚马逊的电子产品浪潮类似,下一代电视遥控器将是无线和免提的。


然而,遥控设计也带来了一些独特的挑战。例如,遥控器通常不可充电;它们通常使用标准的AA电池。遥控器不仅需要在嘈杂的环境中表现良好,而且需要在距离你身体3到9英尺的地方,还可以将信息以无线方式即时传输到主机设备上(如电视)。


此外,消费者更喜欢使用不需要频换更换的耐用电池,从本质上讲,遥控器的性能必须像亚马逊Echo Dot一样,但同时功耗还要比入耳式耳机更少。


设计功能强大、高效节能的遥控器是一个挑战,需要创新的蓝牙解决方案和音频处理解决方案,因为其中每一个改进都会延长电池寿命。


使用蓝牙5。0/LE解决了传统红外的几个问题。首先,蓝牙是一个符合标准的解决方案,因此设备很容易与现有的蓝牙设备进行通信。此外,蓝牙5。0/LE提供了与WiFi设备相当的传输范围,这非常适合语音遥控器。传统的蓝牙解决方案已经针对手机和笔记本电脑进行了优化,这些手机和笔记本电脑的电池容量更大,而且蓝牙的功耗也没有那么大。


Atmosic公司的创新解决方案,可以显著降低5倍功耗,与竞争解决方案相比,电池寿命可延长3至5倍。


image.png

除了极低功耗的蓝牙设计外,还可以使用一个二次唤醒接收器,该接收器功耗可以更低(比标准接收器低20到50倍),使整个蓝牙SoC进入深度睡眠状态;该设备可以通过另一台主机的特殊模式唤醒。我们不会在这里详细介绍这项技术,因为它只适用于少量的专用遥控器。


第三种低功耗技术是利用能量收集来获取射频无线能量以延长电池寿命。许多家庭和建筑物都有大量的射频能量(通常在ISM波段),当遥控器放在桌子上时,可以采集这些能量。根据能量水平,一个装置可以获得几十微瓦的能量。最终目标是在可能的情况下替代电池电源,将电池的寿命延长到几年,而目前遥控器的寿命只有6到9个月。对于工业和特殊用途的遥控器,还可以使用其他能源技术,如太阳能、热能和运动能量收集。


如前所述,要实现真正的免提操作,遥控器必须同时像智能扬声器一样工作,但也要像入耳式耳机一样节能。像QuickLogic这样的公司已经开发出高度优化、超低功耗的配套器件来配合蓝牙芯片组来应对这一挑战。


蓝牙连接的语音遥控器基本上有三种模式:待机模式、唤醒词检测模式和数据传输模式,功耗也是逐步增加。


在待机状态下,蓝牙和伴生芯片处于休眠状态,等待周围环境中的一些唤醒词。实现这一点最节能的方法之一是使用Vesper的麦克风唤醒声音功能,该功能仅消耗10µA,等待环境声超过预先配置的阈值。在一个典型的起居室用例中,系统在80%的时间内处于这种模式。


一旦达到阈值水平,就会从麦克风触发一个中断,并唤醒伴随芯片;此时进入唤醒字检测模式。伴随芯片的MCU可以启动并运行WWE一段时间,以检测关键字是否被说出。第三方解决方案(如Retune DSP的VoiceSpot WWE)可以在Cortex-M4上运行,只需使用一个麦克风,无需使用多麦克风自适应波束形成的计算密集型解决方案,而多麦克风自适应波束形成通常是中场(3到9英尺)语音识别所需的。


除了明显的节省处理器资源外,从系统中减少每一个麦克风还可节省400至650µA(有功功率)。如果检测到唤醒字,它会中断并唤醒蓝牙芯片进入数据传输模式。这是必要的,因为在唤醒字之后的用户字需要以脉冲编码调制(PCM)或压缩数据的形式传送到主机(如电视)。


如果没有检测到唤醒字,系统将恢复到初始待机模式。一些配套芯片,如QuickLogic的芯片,有专用的低功耗声音检测(LPSD)硬件,以降低唤醒字检测模式中使用的平均系统功率。例如,有些风扇声音有一个高分贝声压,但显然不是讲话。LPSD硬件有足够的智能来感知这一点,并忽略声音,以避免不必要地运行WWE额外功耗。


蓝牙5.0/LE非常适合数据传输模式,因为它可以在低功耗的按需数据包中传输数据。一个理想的伴侣应该有足够的存储空间和处理能力,以便在将语音数据发送到蓝牙设备之前对其进行压缩,一个典型的例子是运行Opus音频编码器。


本文作者:


Scott Haylock:QuickLogic的产品营销总监。他拥有超过20年的片上系统经验,并拥有密歇根州立大学的学士学位。


Srinivas Pattamatta:Atmosic Technologies业务开发的副总裁。他在无线和其他通信技术方面也有超过20年的经验。获得俄勒冈州立大学电气工程硕士学位和圣克拉拉大学工商管理硕士学位。

关键字:语音识别 编辑:冀凯 引用地址:http://news.2689mr.com/qrs/ic508555.html 本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:十五年坚持之路 2020兆易创新全国巡回研讨会-北京站
下一篇:NVIDIA收购Arm确认,迎接万物计算时代的到来

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

麦克风阵列技术在汽车座舱声音增强系统中的应用
为了寻找具有创意的智能语音设计方案,我爱方案网联合科大讯飞举办的2016讯飞智能语音设计大赛正在火热报名中,截止现在,我们已经收到了近100名参赛名额与优秀的设计方案。本文将介绍其中一位参赛者针对汽车降噪处理开发的一款汽车座舱声音增强系统,此系统旨在汽车座舱噪音,提升用户体验。目前,已经成功通过我爱方案网大赛项目初选。该参赛团队非常乐意将自己的设计思路与方案框架共享出来,供同行学习参考,接下来,我们看看该项目的具体详情!  相信大多司机肯定遇到一种情况,即驾驶时必须通过免提系统打电话。开车时想确保接电话的人可以清楚地听到自己的声音,那么他们一定期望座舱能系统排除噪音,如空调气流、风噪声和车厢内的道路噪音。这种情况下,汽车需要进行
发表于 2020-08-18
麦克风阵列技术在汽车座舱声音增强系统中的应用
语音识别市场需求旺,ST/英飞凌抢推各自解决方案
语音识别市场夯,根据市调机构Strategy AnalyTIcs研究指出,到2022年,预估全球消费市场将有超过六千两百万个装置具备个人语音助理。为插旗此一市场,半导体业纷纷推出新一代解决方案。例如英飞凌(Infineon)结合雷达、MEMS麦克风和音频处理器,进一步提升MESM麦克风语音识别效能;而意法半导体(ST)则是携手语音接口和关键词检测算法开发商--Sensory,以及通无线芯片组解决方案供货商DSP Group,共同开发高效语音检测处理麦克风技术。工研院IEK电子与系统研究组分析师吕佩如表示,语音助理目前相关服务虽仍处于起步阶段,但随着市场需求快速增长,未来将会渗透到智能家电、车载系统,甚至更多物联网设备中的应用。目前
发表于 2020-08-12
智能语音实现蜕变,不是一场数字游戏
“麻开门。”“芝麻关门。”“我要去五楼。”这几条充满童趣的语句,实际上是控制电梯的语音指令。疫情当前,电梯是非常高风险的区域,尤其是手指碰触电梯按键的时候。针对这一场景,思必驰推出了电梯语音控制模块。“在后装的电梯上也可以进行安装,而且安装起来非常简单方便。” 思必驰 IoT 商务总经理陈苇珍在演示过程中表示。 思必驰 IoT 商务总经理陈苇珍 “97%或者 99%只是实验室数据”电梯控制是一个典型的语音识别应用场景,技术的进步正在改变人机交互的方式和结果。 语音识别是人机交互中的重要技术,所涉及的领域包括信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等,近些年语音识别技术取得显著
发表于 2020-07-07
智能<font color='red'>语音</font>实现蜕变,不是一场数字游戏
贸泽电子联手Fortebit,备货语音识别和汽车物联网器件
专注于引入新品推动行业创新的电子元器件分销商贸泽电子 (Mouser Electronics) 宣布与Fortebit签署全球分销协议。该公司设计并制造高质量、高性价比的解决方案,用于嵌入式语音识别、语音播放功能和位置服务。签署此项协议后,贸泽分销的Fortebit产品线包含EasyVR 3 Plus语音识别器件和Polaris汽车物联网平台等产品。 EasyVR 3 Plus是一款多功能语音识别模块。通过它,设计人员可以轻松地将通用、强大、高性价比的语音识别功能添加到各种应用中。EasyVR 3 Plus模块可用于各种采用3.3V – 5V UART接口的主机,例如Arduino和Microchip
发表于 2020-05-26
贸泽电子联手Fortebit,备货<font color='red'>语音识别</font>和汽车物联网器件
目前语音识别的技术现状如何?
目前,主流语音识别框架还是由 3 个部分组成:声学模型、语言模型和解码器,有些框架也包括前端处理和后处理。随着各种深度神经网络以及端到端技术的兴起,声学模型是近几年非常热门的方向,业界都纷纷发布自己新的声学模型结构,刷新各个数据库的识别记录。由于中文语音识别的复杂性,国内在声学模型的研究进展相对更快一些,主流方向是更深更复杂的神经网络技术融合端到端技术。2018年,科大讯飞提出深度全序列卷积神经网络(DFCNN),DFCNN 使用大量的卷积直接对整句语音信号进行建模,主要借鉴了图像识别的网络配置,每个卷积层使用小卷积核,并在多个卷积层之后再加上池化层,通过累积非常多卷积池化层对,从而可以看到更多的历史信息。 2018年
发表于 2020-05-22
目前<font color='red'>语音识别</font>的技术现状如何?
小广播
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

换一换 更多 相关热搜器件
电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2020 2689mr.com, Inc. All rights reserved
送彩金棋牌游戏 博彩送彩金赢钱 澳客彩票 永利高网上注册送彩金 免费送彩金的棋牌 时时彩开群软件 开火车送彩金 真人娱乐平台送彩金 博彩送彩金18元 PC蛋蛋机器人