离线语音蓝牙设计应用案例详解

今日头条

1151人已加入

描述

1 概述¶

随着人们生活水平的提高,对产品的功能要求也越来越高,追求舒适的体验感,特别是对操控性的要求越来越高。目前传统蓝牙产品的使用方式大部分还是局限于手动操作,例如蓝牙耳机,蓝牙音箱等,蓝牙成功连接之后还是需要手动操作控制手机或者音箱上的按键等来实现对设备的控制,例如播放音乐、有声读物等。

 

为了解决以上通病,做到真正的解放双手,可以采用纯离线语音识别进行控制,在成本增加不大的情况下,为产品带来更多的亮点和竞争力。启英泰伦已开发了整套离线语音蓝牙方案,可应用于茶吧机、按摩椅等多个产品领域下面对该方案进行介绍。


2 方案优势¶

启英泰伦离线语音蓝牙相对传统蓝牙方案,可让用户通过语音控制蓝牙设备,替换传统手机或设备上按键控制的方式,该方案有以下优势:

  • 可以直接使用语音控制蓝牙设备,连上蓝牙之后无需手动操作,自然方便,识别率可达95%以上;
  • 语音控制响应快,一般在0.2~0.8s内完成;
  • 可远场识别,安静情况下可达10米;
  • 方案功耗低,工作功耗仅为0.2W左右;
  • 可靠性好,芯片方案已通过双85测试,满足大部分产品使用环境要求;
  • 整套产品技术已成熟,具有完整的软件、硬件、结构设计方案,节省开发周期,降低开发难度;
  • 配合我司语音AI平台开发,可灵活定制唤醒词和命令词,不需要再专门收集语料训练。
应用方案

3 应用描述¶

启英泰伦离线语音蓝牙方案适用于各类带蓝牙产品方案,代表产品包括按摩椅、茶吧机等应用。

语音蓝牙产品的使用场景在普通家居环境较为普遍,在安静和中低噪音下可以达到良好的识别率。其中安静环境的环境底噪在35dB ~ 45dB之间,属于中低噪音环境;个别产品开启后环境噪音可达45dB ~ 65dB之间。该噪音环境下可以直接选用我司单麦克风语音蓝牙模块,如CI-B02GS04J-BT2或CI-B03GS04J-BT2模块,以达到比较好的性价比。

特别注意,不同的产品运行过程中,因为产品功能差异,运行产生的噪声大小也有不小的差异,为了达到最好的语音识别效果,针对不同产品对应有降噪或回声消除等处理,最大程度保障识别效果。


4 产品设计流程¶

一个基于我司芯片的标准语音产品设计流程如下图所示:

应用方案

该流程主要针对我司新用户开发产品使用,包含了前期购买样品Demo进行验证,硬件选型,语音对话逻辑、软硬件方案和结构设计,设计完成后的测试,以及生产测试准备和后续批量采购等步骤。如果是已经熟悉我司方案的老用户,可以直接从中间步骤开始,不用再重复进行Demo测试等工作。

下面针对新用户的开发,对上述流程中的各个步骤逐一描述。

4.1 DEMO测试¶

针对新用户,可以先从我司授权的经销商或直接从我司官网 ☞样品购买 处购买对应的模块或开发板套件,进行识别效果测试,相关的软硬件技术文档可以从本文档中心处获取。用户测试满意后,可以进行硬件选型。

4.2 选型指南¶

用户硬件选型可以直接参考 ☞硬件选型 ,如果用户想快速产品化,推荐直接使用我司已设计好的标准模块;如果现有标准模块无法满足产品的结构需求,也可以选用合适的芯片进行硬件板的设计。

4.3 方案设计¶

选择好合适的芯片或模块后,可根据产品的功能进行下述设计:

  • 语音UI(唤醒词和命令词)设计:设计方法可参考 ☞语音UI设计参考;
  • 硬件设计:设计方法可参考 ☞硬件设计参考;
  • 结构设计:设计方法可参考 ☞产品结构设计;
  • 软件开发:设计方法可参考 ☞软件开发。

如用户为首次进行语音方案开发,建议到 ☞启英泰伦语音AI平台 上获取基于相关芯片的语音产品方案设计Checklist文档,进行逐一检查以确保设计效果。如有技术支持需求请联系我司技术支持人员。

4.4 测试验收¶

产品方案设计完成形成样品后,建议对该样品进行相关的识别测试,相关测试方法和标准可参考 ☞识别效果测试。同时,还建议根据产品质量的要求进行各类硬件测试,如双85测试、静电测试等。为了保证最终的识别效果,还建议进行硬件底噪的测试及产品装机后的整机功能测试。

4.5 生产测试¶

样机测试完成后,会转入后续产线批量生产阶段。我司为产品的批量生产做了完善的解决方案,用户可以参考 ☞生产测试 获取更多信息。用户如需要生产测试的相关技术支持,请联系我司技术人员。

4.6 下单采购¶

用户如果要采购我司产品样品,请点击 ☞样品购买 ,也可以点击 ☞样品和批量采购 获取更多信息。


5 语音蓝牙设计方案介绍¶

用户可以用我司的芯片设计语音蓝牙一体控制板,和原电控板通过串口进行通讯,可以实现语音蓝牙的产品的快速设计。其介绍如下:

5.1 方案特点¶

语音蓝牙控制板和原电控板通过串口通讯进行控制的方案开发相对简单,可以快速对接完成产品,但成本略高,适用于需快速出产品的的方案或者第一次接触语音识别的方案。用户在熟悉我司方案后,也可以考虑直接用我司芯片设计语音蓝牙及电控的一体控制板,以降低成本,具体设计时可以联系我司技术支持人员获取帮助。

该方案的设计框图如下,语音蓝牙模块与电控模块需要串口连接,语音蓝牙模块进行语音识别及根据主控的状态进行信息播放,产品相关控制由电控模块完成。

应用方案

语音蓝牙模块内部的语音芯片和蓝牙芯片也是通过串口通信,蓝牙相关控制如音乐控制等由蓝牙芯片实现。

目前离线语音蓝牙方案支持蓝牙音乐播放控制,包括音乐上下曲切换、暂停继续操作、以及音量调整等功能,用户可语音控制自主实现蓝牙开关,主要有两种体验方案:

语音播报打断蓝牙播放:蓝牙端音乐正在播放的情况下,语音唤醒开始播报时,蓝牙音乐就暂停播放,退出唤醒之后继续蓝牙播放。

语音播报压低蓝牙播放音量:蓝牙端音乐正在播放的情况下,语音唤醒开始播报时,蓝牙音乐播放音量压低,退出唤醒之后蓝牙播放恢复正常音量。

5.2 硬件设计参考¶

用户可以使用我司芯片设计需要要求的语音蓝牙模块,但为快速开发,推荐直接使用我司的以下标准带插口单麦离线语音蓝牙模块,模块体积小巧,工作电压为 5.0V - 5.5V,两个型号管脚完全兼容,区别为主芯片型号不同。

  • CI-B02GS04J-BT2:支持本地命令词200条以内,串口接口为5V电平;
  • CI-B03GS04J-BT2:支持本地命令词300条以内,支持本地自学习功能,串口接口为5V电平;

模块形状为长方形,尺寸为37±0.3mm×40±0.15mm,PCB板厚为1.6±0.2mm,模块高度为7.6±0.4mm,用户可根据此尺寸设计结构

应用方案应用方案

用户直接使用我司标准语音蓝牙模块时,有以下注意事项:

因为CI110X芯片ESD等级较高并且模块设计为方便用户扩展,所以模块上只在麦克风位置设计ESD器件,对于ESD要求很高的产品可以再添加ESD器件。建议用户在检验、焊接生产过程中佩戴防静电手环或防静电手套、指套。在对应底板连接器位置请预留 ESD 防护器件,保障产品的质量可靠性。

使用时注意麦克风、喇叭、电源串口不能接错,注意防止背面测试点短路。

注意本模块串口是5V供电,请使用5V电平的串口进行通讯。用户可采用USB转串口工具对开发的软件进行调试,调试时需在SDK软件中相应位置加上串口打印命令,编译后生成固件并烧录,就可以进行调试验证。

5.3 串口通讯方式¶

语音蓝牙模块与电控模块通过串口进行信息交互,主要有两种方式,一种为语音蓝牙模块主动播放,同时将信息发电控模块;另一种为语音蓝牙模块被动播放,其分别描述如下:

语音蓝牙模块主动播放模式

应用方案

主动播放方式主要执行以下动作:

  1. 语音蓝牙模块识别到词条;
  2. 主动播放反馈声音;
  3. 将此条信息串口告知电控模块,若是蓝牙相关指令则将此条信息串口告知蓝牙端;
  4. 电控模块执行动作或者蓝牙端执行动作。

该方式的优点在于控制方式简单,由语音蓝牙模块单线输出信息给电控模块。但缺点在于无法根据产品的情况及按键情况进行语音反馈。

语音蓝牙模块被动播放模式

应用方案

被动播放方式主要执行以下动作:

  1. 语音蓝牙模块识别到词条;
  2. 将词条信息串口告知电控模块;
  3. 电控模块执行相关动作;
  4. 告知语音蓝牙模块需要播放的内容;
  5. 语音蓝牙模块根据电控模块反馈进行播放。
  6. 蓝牙相关指令都是主动播报。

该方式的优点在于语音蓝牙模块根据电控模块的状态进行播放对应内容,可以进行最合适的反馈,体验感好;同时如果电控模块通过按键或者遥控进行控制,语音蓝牙模块也可以进行状态播放。缺点在于会多一次串口通信的过程。

5.4 SDK包说明和蓝牙串口通讯协议¶

我司为用户提供了串口通讯方案完整的SDK包,用户可以到 ☞启英泰伦语音AI平台 上获取相关SDK开发包。

以下是语音端发给蓝牙端的一个命令词及播放控制协议参考:

对应操作 帧头 产品ID 命令 数据 累加和 帧尾
继续播放 A5 FA 00 80 01 00 XXXX FB
暂停播放 A5 FA 00 80 02 00 XXXX FB
上一曲 A5 FA 00 80 03 00 XXXX FB
下一曲 A5 FA 00 80 04 00 XXXX FB
唤醒打断 A5 FA 00 80 05 00 XXXX FB
退出唤醒恢复 A5 FA 00 80 06 00 XXXX FB
音乐大声点 A5 FA 00 80 07 00 XXXX FB
音乐小声点 A5 FA 00 80 08 00 XXXX FB
打开蓝牙 A5 FA 00 80 09 00 XXXX FB
关闭蓝牙 A5 FA 00 80 0A 00 XXXX FB

以下是一个蓝牙端发给语音端的状态同步通讯协议参考:

状态通知 帧头 产品ID 命令 数据 累加和 帧尾
蓝牙正在播放 A5 FA 00 A0 01 00 XXXX FB
蓝牙停止播放 A5 FA 00 A0 02 00 XXXX FB
蓝牙连接成功 A5 FA 00 A0 03 00 XXXX FB
蓝牙断开连接 A5 FA 00 A0 04 00 XXXX FB

注意:

ASR语言模型中文建议选择SE266,其他语种请使用对应语种的模型。若相关产品自带的运行稳态噪音大于60db,建议打开降噪功能,蓝牙相关的音乐播放控制建议打开AEC功能,可明显提升识别效果。

串口设置:

  • 波特率:9600
  • 停止位:1
  • 数据位:8
  • 奇偶校验:无
  1. 代码中通过判断接收的数据获取是什么指令和功能。

6 蓝牙固件烧录¶

6.1 烧录前准备工作¶

用户要烧录模块前,需要准备以下物品:

  • 待烧录的模块
  • USB转串口工具
  • 蓝牙强制烧录器
  • 烧录器配套USB线
  • 固件烧录工具(pack_update_tool.exe)
  • 2.0mm间距麦克风
  • 2.5mm间距喇叭
  • 杜邦线若干
应用方案

6.2 硬件连接并烧录¶

语音固件烧录

以上图的USB转串口工具为例,在烧录前需要先将USB转串口的电源、地、串口收发引脚分别和模块对应的引脚连接起来,(注意USB转串口的RXD和TXD分别对应模块的UART0_TX和UART0_RX),连接方式如下图所示,接着,短接模块的PG_EN和旁边的引脚(模块的背面有相关的丝印,可根据丝印提示查找相关的位置)。模块烧录的接线图、以及模块背面的丝印图如下图所示。

应用方案

打开固件烧录工具(该工具可以在SDK开发包中CI110X_SDK\tools目录找到PACK_UPDATE_TOOL.exe),根据芯片选择对应的型号,点击固件升级按钮,选择已制作好的固件文件,并确认电脑分配给USB转串口工具的串口端口号。准备工作就绪后,将模块的PG_EN引脚的插针与USB工具上的3.3V短接(拉高PG_EN管脚电平),模块上电后即可进入固件升级模式,开始下载固件。若电脑无法识别USB转串口工具,请首先安装对应的驱动程序。

应用方案

蓝牙固件烧录

如图所示,蓝牙烧录器的DP、DM、5V和GND分别与一体板上的USB-DP、USB-DM、5V和GND对应连接;烧录器通过附带的USB线和电脑相连接。

应用方案应用方案

单击图示按键直到绿色的灯熄灭。

应用方案

点击运行download.bat,如果出现类似下图所示表示加载进度的打印就表示烧录正常,等待烧录完成即可,其余情况则需重新烧录,用户无需重新上电或进行其他操作,即只需保证绿灯熄灭之后重新运行download.bat即可。

应用方案应用方案

蓝牙固件烧录时需注意:

  • 如果前后两次烧录的固件相同则也无法正常烧录。
  • 有概率出现烧录不成功的情况,可能需要重复操作几次,注意保证是在绿色的灯熄灭的情况下再烧录。
  • 有概率出现烧录工具插上电脑设备时串口驱动安装失败的情况,建议更换电脑设备或更换系统再次尝试。

蓝牙固件的批量烧录 请参考☞杰理AC692X芯片批量烧录方法

6.3 烧录后功能测试¶

语音功能测试:固件烧录结束后,建议对模块进行功能测试,以验证烧录固件是否成功。功能测试前待测模块需首先连接麦克风以、喇叭,通电确认是否能有上电播报音,并用唤醒词和命令词测试是否能正常唤醒和识别,如果均能正常工作,则模块功能正常,烧录成功;否则,烧录失败,需进一步探其原因。

蓝牙功能测试:
模块上电后自动开启蓝牙功能,手机打开蓝牙后可搜索到名称为“AC692x_Bluetooth”的蓝牙设备,如下图:

应用方案

图14 搜索蓝牙

点击“AC692x_Bluetooth”设备连接蓝牙,手机弹出“蓝牙配对请求”弹框,如下图:

应用方案

图15 蓝牙配对请求

点击“配对”开始连接蓝牙,连接成功后模块喇叭播“连接成功”,手机显示如下图:

应用方案

图16 连接蓝牙

自此就可用手机播放器播放音频,然后通过模块喇叭播出。

蓝牙功能测试请参考☞蓝牙功能测试

6.4 常见问题¶

本章节列举了一些模块使用中可能遇到的问题和对应的解决方法。

模块不能烧录并更新固件

出现上述问题后,请检查以下操作点:

  • 模块上电前是否已拉高PG_EN管脚(按上文3.5.2节描述和旁边的管脚短接);
  • 串口管脚是否接对,TX和RX是否有接反,电脑端USB转串口工具驱动是否正常,PC端烧录工具是否选择了正确的串口号;
  • 如以上两点检查无误后,模块还不能烧录,需要使用万用表测量模块供电电压5V、3.3V、1.2V是否正确,用示波器测量晶体是否起振,频率是否为12.288Mhz。各个硬件测量点参考下图。如果发现有电压或晶体出问题,考虑为模块硬件故障,请更换模块或针对模块硬件进行维修。如上述检查均无问题,请联系我司技术支持人员获取帮助。
应用方案

模块烧录完成,上电后无播报

出现上述问题后,请检查以下操作点:

  • 确认烧录固件是否与板子匹配;
  • 确认喇叭正确接好,供电正常;
  • 采用示波器测量主芯片的语音输出测试点。无输出需检查请固件是否正确,有输出需检查模块上的音频功放期间是否焊接出现异常,如果音频功放有异常可更换后再测试。测量点如下图。如上述检查均无问题,请联系我司技术支持人员获取帮助。
应用方案

模块烧录完成,上电后有播报但是不识别命令词

出现上述问题后,请检查以下操作点:

  • 检查麦克风和插口的连接是否完好;
  • 检查麦克风正负极方向是否与模块板上标示一致,没有插反;
  • 使用万用表测量主芯片对应的MICBIAS管脚是否为2.8V左右电压,使用示波器测量麦克风输入管脚是否有输入语音波形(示波器每格电压调整为100mv档位),若信号正常需考虑固件是否正确,若信号异常需观察板子硬件是否有物理损伤。测量点如下图。如上述检查均无问题,请联系我司技术支持人员获取帮助。
应用方案

7 相关参考资料列表¶

编号 参考资料描述 获取方式
1 标准离线SDK
CI110X_SDK_ASR_Offline
请到 ☞启英泰伦语音AI平台 上获取
2 语音蓝牙SDK Demo:
串口通讯方案SDK
请到 ☞启英泰伦语音AI平台 上获取
3 测试固件 到 ☞启英泰伦语音AI平台 上获取
4 我司芯片和模块的选型指南 请点击 ☞硬件选型指南 查看
5 我司芯片硬件设计方法参考 请点击 ☞硬件设计参考 查看
6 麦克风和喇叭器件选型 请点击 ☞外围器件兼容列表 查看
7 产品结构设计 请点击 ☞产品结构设计 查看
8 软件开发方法和标准SDK说明 请点击 ☞软件开发 查看各部分内容
9 产品识别性能测试方法 请点击 ☞识别效果测试 查看
10 生产测试的方法 请点击 ☞生产测试 查看

用户如遇到使用问题,请到启英泰伦语音AI平台上提交技术工单,或直接联系我司技术人员获取协助。

审核编辑:符乾江

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分