讯飞五麦震撼来袭
科大讯飞是国际上最早开始研究远场语音识别技术的机构之一,也是国内唯一具备成熟解决方案的厂商。自2015年3月和8月,讯飞相继对外发布四麦、二麦麦克风阵列解决方案。今天在深圳阿基米互联网公社举办的“讯飞核心技术开发日——麦入云端,引领智能交互新主义”沙龙活动中,更重磅发布了打破语音交互瓶颈的利器——4+1环形五麦克风阵列,再次引领智能交互新主义!
在科大讯飞15年底年度发布会上,在场的3000余人见证了这样的一场人机互动:演示人员在5米开外,用声音操控叮咚音箱,完成了一系列高难度的订票任务,引来台下阵阵惊叹——现场那么嘈杂,叮咚音箱却如此“听话”,要让叮咚音箱听懂这么多声音,而且具备远场识别的功能,它必须听的到,而且要听的更加清晰,人类可以带上助听器,机器需要什么呢?【麦克风阵列】就充当了助听器这样的角色。可以说,麦克风阵列犹如远场识别的心脏。有了这颗“机器之心”, 在远场场景中,就可以一举解决在了远场识别中遇到的背景噪声、其他人声干扰、回声、混响等核心问题。
图:“麦入云端,引领智能交互新主义”沙龙活动现场
定义人机交互的标准
讯飞开放平台副总经理马汉君进行了开场演讲,马汉君以”科大讯飞——人工智能引导者“为主题系统地介绍了人工智能的起源和发展,以及讯飞在人工智能领域里的最新研究成果和在人工智能+IOT时代的愿景和目标,并在演讲的最后详细的阐述了于去年底发布的人机交互界面——AIUI。
图:讯飞开放平台副总经理马汉君
马汉君说:“人工智能将助力IOT时代的蓬勃兴起,而科大讯飞的愿景则是加速这一过程。当前讯飞的自然开放交互平台上的应用已经超过90000个,连接终端超过8.8亿台。接下来讯飞将通过深度神经网络与大数据的结合,实现人工智能从“能听会说”到“能理解会思考”的突破。2014年8月,科大讯飞成为中国首个人工智能项目“类人答题机器人”的牵头单位,正式启动超脑计划。未来,讯飞超脑将能参加高考甚至取得“一本”的成绩。
在2015年,讯飞发布了AIUI,这是一个智能硬件量身定制了智能交互方案,重新定义了万物互联时代人机语音交互标准,具备了远场降噪、方言识别、语音纠错、多轮对话等功能。通过统一接口、开放的服务扩展、灵活的能力搭配实现人机交互与产品体验的结合,科大讯飞希望和合作伙伴一起,用人工智能改变世界。
智能交互,与声俱来
讯飞开放平台智能硬件产品总监张良春则从人机交互的三大痛点谈起,介绍了讯飞在这些问题的看法以及解决之道。“咬耳朵”不是智能交互,让机器人可以远场对话,需要使用麦克风阵列。现在讯飞推出有最新的环形五麦克风阵列,远场拾音距离可达5米。相比以往线性麦克风单维180°覆盖,环形五麦是360°全平面拾音角度,而且去噪效果更好,抗环境噪音的能力更强。
总的来说五麦麦克风阵列功能特性包括:二维空间拾音、抗噪能力增强、远距拾取音频、支持连续唤醒、支持回声消除、支持语音打断。麦克风阵列模块优点是迅速集成,缺点成本较高,适合小批量。所以讯飞也可以提供麦克风软核方案,包括算法SDK、录音板、加密芯片和构型说明。目前软核方案有单麦软核、双麦软核、四麦线性软核、环形五麦软核和环形七麦软核。环形七麦支持5~7米拾音距离、360°声源定位、±10°声源定位精度,阵列录入的音频信噪比更高。
图:讯飞开放平台智能硬件产品总监张良春
在演讲的中,张良春还风趣的套用了周星驰电影国产凌凌漆中的一个桥段:咱们的产品只要一开口说话,无论在哪里,都像黑暗中的一只萤火虫,那样的鲜明,那样的出众……
干货泥泞的麦克风阵列技术剖析
除了邀请讯飞开放平台的相关同事,此次发布会还特意从讯飞研究院邀请了信号处理领域的技术大牛王海坤博士。而王博士的发言无疑让此次本便干货满满发布会变得更加泥泞。王博士从信号与信号声学处理谈起,全面的剖析了讯飞的麦克风阵列与回声消除技术。
“噪声、混响、干扰和回声是声学信号处理需要解决的问题,而这些问题的解决离不开麦克风阵列。讯飞采用声源定位技术,利用麦克风阵列用基于TDOA(到达时间差)计算声源距离阵列的角度和距离,实现对目标声源的跟踪。再通过波束形成技术,即在期望方向上有效地形成一个波束,仅拾取波束的信号,从而达到同时提取声源和抑制噪声的目的。对于混响,则使用麦克风阵列+深度学习,实现有效的混响处理“。
图:讯飞研究院王海坤
“科大讯飞的回声消除技术更是达到国际顶尖水平,利用自适应滤波方法估计回声路径和利用参考信号求得麦克风拾取的喇叭声音,并将其减去。通过这一系列的技术,讯飞麦克风阵列实现了优异的声学信号处理,确保了良好的用户体验”。
智能硬件客,共享语音云
发布会最后做压轴演讲的,是讯飞开放平台智能硬件商务总监汤熙,汤熙以“生活不止眼前的苟且,还有诗和远方的田野”生动开场,着重介绍了开发者获取讯飞开放平台相关能力的一套流程。
图:讯飞开放平台智能硬件商务总监汤熙
汤熙最后表示:如果你确定与讯飞合作,讯飞将提供深入对接的全套服务。我们在深圳、北京、合肥都有支持团队,除了技术支持+商务本地化服务外,讯飞还提供包括资本服务、宣传服务、渠道服务等多种服务。我们希望在做好服务的同时,陪伴大家共同成长。讯飞会不断把核心技术做好,产品打磨好,把本地支持做好,只有这样才能陪伴大家往前走。讯飞也许不够完美,但是完美的讯飞需要大家一起缔造。
麦克风犹如远场识别的心脏和引擎,在其基础上,远场识别技术的远距离、高识别率支撑,现在用户在以家庭为单位的活动范围内,可以通过语音轻松操控家里的一切智能硬件设备,推而广之,搭载远场识别的智能硬件产品将无限扩大适用范围和应用场景。未来,科大讯飞将依靠自身强大的人工智能科研实力与优质产品,更具创造性地去改变世界,让人们的生活更加美好。
-
助听器
+关注
关注
18文章
171浏览量
40353 -
人工智能
+关注
关注
1791文章
47253浏览量
238401
发布评论请先 登录
相关推荐
评论