中文
EN
sales@videostrong.com
(+86) 13530628721
新闻动态
新闻动态
首页 / 新闻动态 / 了解远场语音识别技术及其应用

了解远场语音识别技术及其应用

2023-02-11
VS
1304

随着技术的发展,远场语音识别已经随着智能音箱的兴起,成为全球消费电子领域应用最成功的技术之一。

远场语音识别是语音交互领域的重要技术,主要面临着回声干扰、室内混响、多信号源干扰等,该技术在智能家居(智能音箱、智能电视等)、会议室、车载导航等场景都有重要的应用。

远场语音识别需要前后端结合去完成,在语言前端处理模块上,主要通过引入麦克风阵列技术来解决。麦克风阵列技术指的是由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。使用麦克风阵列,可以具备分辨声源方向的能力,实现声源定位,实现声源信号的提取和分离,对语音信号进行增强,同时实现去混响效果。结合人工智能算法,也就是后台识别引擎,通过软硬件的复杂结合,让远场语音实现自然人机交互,让用户远距离即可实现与智能盒子进行“对话”。

远场语音识别适合什么场景?

1. 家居场景

电视/机顶盒:媒体内容丰富使得其操作相对复杂,但又受限于遥控器这种低效的输入方式,使得电视成为最适合进行语音改造的设备。

音箱:音箱因为其低廉的成本(无需屏幕和视频资源)而率先引爆市场。

2. 车载场景

车载语音技术的独特优势——帮助驾驶者降低对车内设备的操作依赖,增加驾驶安全系数。车内开窗时风噪声大,通过用远场语音识别给出接听电话、广播音乐、路线导航等语音指令,使得驾驶更加安全,可以更专注于路况。

3. 会议场景

会议场景是语音技术应用中最有价值、同时也是最具挑战性的场景之一。因为这样的场景包含了丰富的讲话风格和复杂的声学条件,需要考虑到重叠语音、数量未知的说话人、大型会议室中的远场信号、噪音和混响等挑战。

智能远场语音是融合了AI语音搜索的一项改变用户体验的功能,让你在远距离条件下(通常1m-10m)说出指令,机器识别出人的语音后进行反馈。

视壮科技KA1智能音箱,通过连接谷歌语音助手实现远场语音操作,采用双麦克风阵列布局,3到5米距离拾音,有效降低周围环境中的噪声,是一款针对不同智能场景下推出的远场语音交互产品。

KA1 5米远场语音控制

相关信息