小米声学语音技术已经实现全面自研，4项技术实现了业内突破

MEILIFENGQ 2020-06-24 2312

电子说

1.3w人已加入

描述

小米的声学语音技术目前已经实现全面自研，并在自研部分领域持续领先，声学语音技术已迎来全新时代。

据了解，小米声学语音的 4 项技术实现了业内突破，分别是语音交互实现“情感化”、AIoT 放音技术升级、就近唤醒全新升级、两麦阵列唤醒新策略。

语音交互实现“情感化”：小米 AI 实验室在“情感数据量有限”的前提下，通过不同声学模型、不同声码器组合最终上线自然、拟人效果的情感 TTS（Text to speech，人工语音合成），成为业内首家情感化 TTS 大规模落地的企业。

此次小米小爱同学 Art 全面支持情感化语音交互，基于有限但类型不同的情感音频数据（如开心、关心、害羞、惊讶等），通过不同技术训练并迭代声学模型，最终支持情感 TTS 合成并实现“小爱同学”音色情感化、拟人化。未来，小米语音将升级此技术——支持情感 TTS 实时合成。

AIoT 放音技术升级：首次实现一句话全屋同步播放相同音频功能。据悉，小米小爱音箱 Art 是首款可以实现语音支持全屋播放的设备。用户直接对小爱同学说“全屋播放 XXX”，无需提前在 App 端进行手动设置，即可实现一句话语音交互。

就近唤醒全新升级：业内首次上线跨设备关闭闹钟功能。此次小米小爱音箱 Art 就近唤醒全新升级，可支持跨设备关闭闹钟。远处的音箱闹钟响了，唤醒近处的音箱可以直接关闭远处的闹钟。此功能在业内首次上线，小米小爱音箱 Art 也是首款支持该功能的产品。

两麦阵列唤醒新策略：兼顾低功耗与高性能，高效降噪，获得干净人声。小米小爱音箱 Art 同步支持两麦阵列唤醒技术。在麦克风阵列方面，小米采用两麦盲源分离降噪前端，通过盲源分离、降噪、回声消除等技术，在多声源的嘈杂环境、音箱自身播放音乐时，都能结合语音增强技术，消除噪音的强干扰，获得干净、准确的人声音频。

目前，小米 IoT 平台连接的智能硬件数已达到 2.5 亿台，音箱出货量已经达到 2200 万台。
责任编辑：tzh

打开APP阅读更多精彩内容