`
1系统概述语音识别技术是二十世纪信息技术领域十大重要的科技发展技术之一。语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机交互的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
语音识别,顾名思义,即与机器进行语音交流,就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。现在,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。 计算机语音识别过程与人对语音识别处理过程基本上是一致的。目前主流的语音识别技术是基于统计模式识别的基本理论。一个完整的语音识别系统可大致分为三部分:
(1)语音特征提取:其目的是从语音波形中提取出随时间变化的语音特征序列。
(2)声学模型与模式匹配(识别算法):声学模型通常将获取的语音特征通过学习算法产生。在识别时将输入的语音特征同声学模型(模式)进行匹配与比较,得到最佳的识别结果。
(3)语言模型与语言处理:语言模型包括由识别语音命令构成的语法网络或由统计方法构成的语言模型,语言处理可以进行语法、语义分析。对小词表语音识别系统,往往不需要语言处理部分。
声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一部分。声学模型的目的是提供一种有效的方法计算语音的特征矢量序列和每个发音模板之间的距离。声学模型的设计和语言发音特点密切相关。声学模型单元大小(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活性有较大的影响。必须根据不同语言的特点、识别系统词汇量的大小决定识别单元的大小。
打开程序,先设置系统的采集参数,然后点击开始采集按钮。如果采集的声音的幅值高于设定的阈值时,系统将对采集的语音信号进行数字信号处理,根据设置的滤波参数,生成时域和频域波形。将波形文件离散化处理(转换为数组),将采集的信息与模板中的信息进行模式匹配,当匹配成功后点亮布尔灯,表示识别成功。当点击停止采集按钮,系统停止采集。
详细设计书请下载附件
`