电子发烧友网报道(文/李弯弯)离线语音识别是指不需要依赖网络,在本地设备实现语音识别的过程,通常以端侧AI语音芯片作为载体来进行数据的采集、计算和决策。
离线语音识别技术在诸多领域都具有广泛的应用前景,如用户可以通过语音控制智能家居设备,实现灯光、空调、电视等的自动化操作;在医疗设备领域,离线语音识别技术可以用于控制轮椅、病床等设备,为行动不便的患者提供便利;在车载系统中,离线语音识别技术可以实时识别驾驶者的语音指令,确保驾驶安全。
但是语音芯片的存储空间有限,通过传统的语音算法技术,最多也只能存储数百条词条,导致用户只能使用固定的词条来控制设备,大大降低了用户与设备之间的语音交互体验。
离线自然说,解决当前语音识别痛点
近日,在启英泰伦最新语音方案发布及技术交流会上,该公司技术支持总监孙振奎介绍了启英泰伦推出的一种轻量级NLP技术——离线自然说。
它的实现原理是,通过语义协议和语音识别构图结合,在进行语音识别同时对指令包含的意图和槽位进行解析(NLU),实现设备功能语音指令的理解和泛化。并且支持同时生成控制指令和反馈播报,完成识别、理解、播报的闭环。通过矩阵分解、权重共享等技术,保持低资源提高建模能力,支持说法突破万种。
据孙振奎介绍,离线自然说,可以很好地解决当前语音识别的诸多痛点,如需要联网、不会说、记不住词、反应慢、词条太少、普通话不标准、经常掉线等。离线自然说的价值在于,用户无需记忆固定词条,只需知道功能和唤醒词,即可语音控制设备,真正做到了自然、方便的人机交互。
具体来看,用户如果通过传统离线语音交互来打开空调,他只能说:“打开空调”。而如果通过离线自然说来打开空调,他可以说:“打开空调”、“帮我开空调”、“空调打开吧”、“开一下空调”、“我要开空调”、“空调开启”、“启动空调”、“吹空调”……
启英泰伦认为,相对于手机APP/小程序、红外遥控器、触摸按键等传统控制方式而言,自然化的语音交互更便捷、更高效、更人性化。
目前,启英泰伦离线自然说方案,已经在在风扇、吸顶灯、空调、茶吧机、油烟机、空调伴侣、窗帘电机、晾晒机、风扇灯等上完成应用,在风扇、取暖器上的应用已经非常成熟。另外,离线自然说方案在洗衣机、马桶、按摩椅、浴霸、微波炉等上的应用也在开发中。
不断迭代的语音芯片及全链条语音算法技术
启英泰伦是一家集语音芯片、语音算法、应用方案、开发平台于一体的语音解决方案供应商。其芯片产品已历经三次大迭代,四次小迭代,共计推出15款型号的智能语音芯片,涵盖AI语音芯片,AI语音Wi-Fi芯片,AI语音BLE芯片,形成系列化的芯片产品布局。
公司芯片产品现已广泛应用于智慧家居家电、智慧养老、智慧穿戴、智慧医疗、智慧酒店、智慧安防、智慧教育、智慧汽车和机器人等领域,服务客户超过5000家。
从发展历程来看,2016年,启英泰伦首度提出脑神经网络处理器(BNPU),发布全球首款AI语音芯片CI1006;2017年AI语音芯片进入家电巨头美的供应体系,支持英文语音识别;2018年发布1.5代AI语音芯片,性能不变,成本降低30%;2019年发布高性价比2代AI语音芯片(搭载BNPU V2),上线语音AI开发平台;2020年发布2.5代AI语音芯片,成本更低,支持日文等小语种语音识别;
2021年离线NLP算法取得突破,深度人声分离算法取得突破;2022年量产3代AI语音芯片、AI语音Wi-Fi Combo芯片(搭载BNPU V3),算法算力登上新台阶;2023年AIOT方案成熟,推出AI语音BLE芯片Cl231,预推出语音MCU芯片Cl132。
启英泰伦第三代CI13系列是一款极具性价比的离线AI语音芯片,包含CI1301、CI1302、CI1303、CI1306、CI1311、CI1312六款型号,据称其年装机达数千万台。
CI13系列基于启英泰伦自研BNPU 3.0,系统主频最高可达240MHz,内置高达640KByte SRAM,集成PMU电源管理单元和RC振荡器,集成双通道高性能低功耗Audio Codec和多路UART、IIC、IIS、PWM、GPIO、PDM等外围控制接口。芯片仅需少量电阻电容等外围器件就可以实现各类智能语音产品硬件方案,性价比极高。
CI13系列具有强大的自然语言交互能力,70dB噪声下,可以做到85%识别率及90%唤醒率(降噪模式),命令词数支持10001+词条,支持离线自然说。
在语音算法上,启英泰伦拥有完全自主知识产权的语音交互技术链条,包括语音识别、语音增强、深度降噪、回声消除、低功耗唤醒、本地语义理解、声纹识别、本地命令词自学习等语音算法。
此次交流会上,孙振奎还介绍了启英泰伦的多个语音算法。如,声纹识别,基于特定词条的声纹识别,可以通过注册声纹来区分讲话人,从而提供定制化的服务,如场景1:注册成人声纹,防止小孩不当操作导致危险;场景2:不同的人说“打开空调”,自动设置为不同人喜欢的模式,温度,档位等。
男女性别识别,基于声音特征,区分男女性别,进行不同的定制化功能开发,如识别到性别后,进行不同声音的播放;部分产品对性别有要求的,可以进行性别识别并进行个性化展示:例如智能马桶的洗洁方式。
特定声音检测,如鼾声识别:可用于智能床垫,智能枕头;婴儿哭声识别:婴儿监护产品,婴儿摇摇床等。
写在最后
用过语音控制产品的朋友们可能都知道,目前市面上大多数产品都需要精准通过唤醒词控制,然而如果一个设备一段时间没使用,或者其中一些唤醒词长时间没用过,当突然需要使用的时候,会忘记这个词,而无法顺利控制设备。而且对于一些功能较复杂的设备,需要记大量的唤醒词,稍有偏差都可能难以控制。而离线自然说算法技术,则打破了传统离线语音识别的这种局限性,只需要说出大意,设备就能听懂,互动更为高效。
全部0条评论
快来发表一下你的评论吧 !