小米声学语音技术已经实现全面自研,4项技术实现了业内突破

电子说

1.3w人已加入

描述

小米的声学语音技术目前已经实现全面自研,并在自研部分领域持续领先,声学语音技术已迎来全新时代。

据了解,小米声学语音的 4 项技术实现了业内突破,分别是语音交互实现“情感化”、AIoT 放音技术升级、就近唤醒全新升级、两麦阵列唤醒新策略。

语音交互实现“情感化”:小米 AI 实验室在“情感数据量有限”的前提下,通过不同声学模型、不同声码器组合最终上线自然、拟人效果的情感 TTS(Text to speech,人工语音合成),成为业内首家情感化 TTS 大规模落地的企业。

此次小米小爱同学 Art 全面支持情感化语音交互,基于有限但类型不同的情感音频数据(如开心、关心、害羞、惊讶等),通过不同技术训练并迭代声学模型,最终支持情感 TTS 合成并实现“小爱同学”音色情感化、拟人化。未来,小米语音将升级此技术——支持情感 TTS 实时合成。

AIoT 放音技术升级:首次实现一句话全屋同步播放相同音频功能。据悉,小米小爱音箱 Art 是首款可以实现语音支持全屋播放的设备。用户直接对小爱同学说“全屋播放 XXX”,无需提前在 App 端进行手动设置,即可实现一句话语音交互。

就近唤醒全新升级:业内首次上线跨设备关闭闹钟功能。此次小米小爱音箱 Art 就近唤醒全新升级,可支持跨设备关闭闹钟。远处的音箱闹钟响了,唤醒近处的音箱可以直接关闭远处的闹钟。此功能在业内首次上线,小米小爱音箱 Art 也是首款支持该功能的产品。

两麦阵列唤醒新策略:兼顾低功耗与高性能,高效降噪,获得干净人声。小米小爱音箱 Art 同步支持两麦阵列唤醒技术。在麦克风阵列方面,小米采用两麦盲源分离降噪前端,通过盲源分离、降噪、回声消除等技术,在多声源的嘈杂环境、音箱自身播放音乐时,都能结合语音增强技术,消除噪音的强干扰,获得干净、准确的人声音频。

目前,小米 IoT 平台连接的智能硬件数已达到 2.5 亿台,音箱出货量已经达到 2200 万台。
       责任编辑:tzh

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分