针对归一化功率倒谱系数(PNCC)在较低信噪比噪声环境下说话人识别鲁棒性不佳的问题,提出了非线性幂函数变換伽马啁啾频率倒谱系数( NPGFCO)的抗噪语音特征提取算法。相比PNCC, NPGFCO的不同之处在于其采用符合人耳听觉特性的归一化压缩 Gammachirp滤波器组代替 Gammatone滤波器组进行滤波并在特征参数中融合了分段式非线性幂函数变换的方式。另外,算法中利用了均值方差归一化和时间序列滤波等技术的方法,进一步提高了其在噪声环境下的鲁棒性,并在改进的ⅰ- vector+PLDA模型下进行了测试。实验结果表明,相较于目前常用的一些说话人语音特征提取算法,在不同噪声和不同信噪比下, NPGFCC特征具有最佳抗噪性能,特别是在信噪比较低的情况下,与其他语音特征相比, NPGFCC特征具有更大的优势。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !