语音识别代表性的方法有矢量量化法(VQ)和隐马尔可夫模型法(HMM).V Q法是由Shore和Burton首先提出【1],其主要优点是无需时间规正或进行动态时间伸缩。但是,该方法对于由话者差别引起的语音特征的变化却无能为力。HMM方法则适合于非特定人语音识别系统,因为它作为统计模型能够吸收由不同说话人引起的语音特征的变化[2]。本文以语音信号的LPC倒谱系数和差值倒谱系数的混合特征参数作为识别的特征矢量集,比较了利用矢量量化(VQ)和各态经历隐马尔可夫模型(HMM) [3]]技术实现的孤立字词语音识别系统的性能。结论是各态经历HMM的识别性能好于VQ的识别性能。
2基于VQ的语音识别方法
在基 于 V Q失真测度的语音识别方法中,可以采用LBG算法设计每个待识别语音的码本。如图(1)所示,孤立字词语音识别时,任意待辨识的输入语音信号通过这些参考码本被矢量量化,从而使VQ失真值逐帧累积下来。对每种参考类别都计算其所有帧的VQ失真累积值(最终累积值要除以总帧数)。具有最小累积失真值的输入语音信号对应的参考类别即被判定为识别结果。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !