基于遗传优化神经网络的电子舌在黄酒检测中的应用
采用遗传学习算法和误差反向传播(BP)算法相结合的混合算法来训练前馈人工神经网络,从而提高神经网络的收敛质量和收敛速度,并将此算法运用到电子舌对黄酒的检测上。与经典BP网络及附加动量项BP网络的训练与预测进行了比较。结果显示:遗传优化BP算法具有预测精度高、收敛速度快及运行时间短的优点,是一种快速、可靠的方法。
关键词: 黄酒; 电子舌; BP神经网络; 遗传算法
黄酒是中华民族传统酒,也是华夏瑰宝和酒中奇葩[1]。从数据显示,2000、2001和2002年全国黄酒产量均为140万吨,2003年为160万吨,2004年为180万吨,到2005年则上升为200万吨。随着黄酒产量与消费量的增加,问题也随之出现:如目前许多黄酒企业均在生产3年以上的陈酒,但其中就存在以次充好的情况,以低酒龄酒冒充所谓“五年陈酒”、“十年陈酒”等高龄酒陈酒。新国标GB/T13662-2000(黄酒)中对“标注酒龄”下了明确定义[2]:“标注酒龄”为销售包装标签上标注的酒龄,以勾兑酒的酒龄加权平均计算。酒龄在3年(或3年以上)的黄酒,应以优级酒为基酒,其中所标注酒龄的基酒不低于50 %。通过以上规定,对陈酒作出了明确的定义,从而一定程度上规范了陈年酒的生产。但要解决这些问题,实现对黄酒品质进行准确分析,维护消费者利益,改造传统黄酒和提高新工艺黄酒,迫切需要具有科学依据的简便、快速的现代检测方法。
电子舌技术是上世纪末发展起来的一种分析、识别液体“味道”的新型检测手段[3]。利用电子舌对黄酒品质进行检测,优点很突出:首先,不需要对样品进行任何预处理,直接对样品进行检测;其次,检测速度快,电子舌检测一个样品只需几十秒到几分钟,相比其他仪器要快很多;最后,电子舌获取的是对液体样本的味觉特征的总体评价,易于与其他方法或仪器(如电子鼻等)所得结果进行相关分析。
综合考虑了电子舌的以上优点,本文采用了法国阿尔法公司的Astree型电子舌对黄酒进行检测。在电子舌的模式识别数据处理方面,人工神经网络法特别是BP网络,用得比较多[4-5]。BP网络的突出优点就是具有很强的非线性映射能力和柔性的网络结构,但同时存在已陷入局部极小、收敛速度慢和引起振荡效应等。由于遗传算法具有很强的宏观搜索能力,且能以较大的概率找到全局最优解,所以本文将二者结合起来,形成遗传优化BP算法,达到优化网络的目的。
1 实验材料、仪器和方法
1.1 实验样品
分别从3个公司中获取3种品牌黄酒:女儿红、古越龙山、会稽山。女儿红分一年陈、三年陈、五年陈等3种不同洒龄的黄酒,古越龙山也分一年陈、三年陈、五年陈等3种不同酒龄的黄酒,会稽山仅一年陈1种酒龄的黄酒。这样共有7种不同组合的黄酒。
1.2 仪器
采用法国阿尔法公司的Astree型电子舌。该电子舌系统由以下几部分组成:传感器阵列、自动进样器、数据采集系统及与电子舌配套的数据分析软件。其中传感器阵列获取信号,电子舌主机里包含数据采集系统及控制自动进样器的系统,软件包可设置传感器的一些工作参数、对数据进行处理及模式识别。传感器阵列由7个味觉传感器加1个参比电极组成。这7个传感器对5种味觉:酸、甜、苦、咸、鲜都有响应。表1给出了这7个传感器对5种味觉基本物质的灵敏度。
1.3 实验方法
试验中,每种瓶装黄酒开封后,马上进行实验。倒入容量为120 mL的烧杯内,每杯为80 mL,每种黄酒做12个重复样品。用体积比为10 %的酒精做为电子舌传感器的训练和清洗过程的溶剂。
2 实验结果与分析
图1所示为电子舌7个传感器对7个样品(女儿红一年陈、女儿红三年陈、女儿红五年陈、古越龙山一年陈、古越龙山三年陈、古越龙山五年陈、会稽山一年陈)的响应曲线图。从图中可以看出这7种响应曲线是不同的。对比传感器对一年陈的3个不同品牌的黄酒样品的响应曲线可以看出:ZZ、BA、GA和HA这4个传感器对古越龙山和女儿红的响应曲线比较接近,而与会稽山的响应曲线区别较明显;CA、BB和JB这3个传感器对3种样品的响应曲线区别较大,造成它们差异的主要因素可能是3个不同品牌由3家不同公司生产,在生产工艺、所用原料等方面存在差异。对比传感器对同一品牌不同酒龄的黄酒样品的响应曲线可以看出:女儿红和古越龙山的3个酒龄传感器的响应曲线在刚开始时差异明显,在60~120 s的过程内,所有传感器的响应值逐渐趋于稳定,电势差变化很小,也即被测样品中的离子逐渐进入传感器的膜,改变传感器的膜电势,最后趋于平衡。本论文取120 s平稳值用于模式识别与分析。
3 经典BP算法及其改进算法
典型的BP网络是三层网络,包括输入层、输出层及隐含层,对于网络的训练采用反向传播BP(Back Propagation)算法[7]。这是一种有导师学习方法,其基本思想是最小二乘算法。它利用根均方误差和梯度下降法来实现对网络连接权的修正,从而使网络趋向收敛,也即使网络的全局误差趋向极小值。
BP改进算法中应用比较广泛的是附加动量项的BP算法。经典BP算法实质上是一种简单的最速下降静态寻优算法,在修正网络权值时,只是按该时刻的负梯度方式进行修正,而没有考虑以前积累的经验,从而常常使学习过程发生振荡,收敛缓慢。附加动量项的BP算法是网络在修正权值时,不仅考虑误差在梯度上的作用,而且考虑在误差曲面上的变化趋势的影响。Rumelhart、Hinton和Williams建议在权值修正表达式中加上一项“动量项”:
附加动量法的实质就是将最后一次权值变化的影响,通过一个动量因子来传递,如此防止了Δωij=0的出现,有助于使网络从误差曲面的局部极小值中跳出来。
4 基于遗传算法的BP神经网络(GA-BP算法)
4.1 基本思想
遗传算法[6]GA(Genetic Algorithm)是一种非导数优化的随机优化方法,可以对一复杂的、多峰的、非线性极不可微的函数实现全局搜索,而BP算法对局部搜索比较有效。因此为了使算法能很快地找到满意解,可以先用遗传算法对初始权值进行优化,在解空间中定位出较好的搜索空间,然后用BP算法在这些小的解空间中搜索出最优解。
4.2 实现方法及步骤
4.2.1 编码方案
对BP网络中连接权值和阈值进行编码主要有2种方法:一种是采用二进制编码方案,另一种是采用实数编码方案。这里采用实数编码。
设有三层BP网络,其拓扑结构示意图如图2所示,输入层×隐含层×输出层为n×k×m的结构,其中wij为输入层中第i个结点与隐含层第j个结点的连接权值;oij为隐含层中第j个结点与输出层第i个结点的连接权值。对该BP网络编码为:w11w12...w1kw21w22…w2k…wmko11o12…o1no21…o2n…okn。
4.2.2 适应度函数
衡量BP网络性能的主要指标是网络的实际输出值与期望输出值之间的误差平方和。该误差平方和小则表示该网络性能好。所以,本文中适应度函数表示为:
式中,S为均方根误差;n为输出层神经元个数;l为训练样本数; yi为对应第i个训练样本的网络实际输出值;Ti为对应第i个训练样本的网络期望输出值。
4.2.3 遗传操作
初始种群的群体大小(POPSIZE)对计算的搜索空间有很大的影响,这里取POPSIZE=60。确定遗传操作算子的步骤如下:
(1)选择操作:淘汰个体的操作,常用的有轮盘赌选择法和排序选择法。本文采用稳态轮盘赌选择法。具体过程为:将当代种群的个体适应度由大到小进行排序,按下式概率值选择个体:,其中fi为个体i的适应度值,N为染色体数。
(2)交叉操作:依照交叉概率,随即选择的2个父个体按照一定的规则进行某些位置上的字符交换,产生新个体。
(3)变异操作:模拟生物进化过程中的基因突变,常用方法为按位变异。
4.2.4 BP训练
经过以上的遗传运算,就得到了BP神经网络的误差最小的初始权值。将以上得到的初始权值代入BP网络进行正常的前馈训练,得到计算样本的实际输出值和期望输出的误差平方和?着BP,若达到了指定的网络训练精度,则结束,否则转入遗传算法继续优化。
5 在黄酒检测中的应用
在实验中,每类样品做了12个重复,从每类样品中随机取出7个共7×7=49个样品组成训练集(每组黄酒中各取7个样品),剩下的共5×7=35个样品组成测试集(每组黄酒中各取5个样品)。将从图2中提取的特征参数作为神经网络的输入向量。经多次试验比较后,选择BP网络的拓扑结构为7-5-3。
利用matlab7.0编程实现训练与预测。参数的选择如下:经典BP算法学习率0.9;附加动量项BP算法学习率0.9,动态项因子0.7;遗传算法初始种群60,交叉率0.8,变异率0.01;单个样本的最大误差0.003,最大循环次数为3 000。训练集的回判正确率和测试集的判断正确率如表2所示。图3所示为3种算法的训练误差平方和随训练步数的变化曲线。
从表2可以看出,虽然对训练集的回判正确率相差不大,但对测试集的判断正确率,遗传优化BP为98.2 %,比经典BP算法的89.3 %和附加动量项BP算法的94.6 %都要好。从图3的对比中可以看到:经典BP算法和附加动量项BP算法分别运行到1 502步和1 008步收敛到指定精度,而遗传优化BP学习算法收敛到相同精度只用了403步。此时的程序运行时间:前两者分别为102.874s和87.644s ,后者为29.871s。
为更好地考察与比较3种算法训练的网络优劣性,再在每类的12次重复中随机选取测试集与训练集,进行交互验证,共重复了3次,分别选取的组成测试集样本数为6、8、9,则对应的组成训练集的样本数分别为6、4、3。验证结果说明:遗传优化BP算法比现有的经典BP算法和附加动量项BP算法在预测精度、收敛速度及运行时间上都取得了较好的效果。
GA算法能以较快的速度减小搜索空间范围,而且不易陷入局部极小点;而BP算法则具有局部搜索效率高的特点,将两者结合可以得到比现有的学习算法更好的学习效果,是一种快速、可靠的方法。
GA-BP算法可以较好地运用到电子舌的模式识别中。本方法对黄酒测试样本集的判断率为98.2%,要提高预测精度,有待从算法本身的改进方面作进一步的研究。
参考文献
[1] 鲍忠定, 许荣年. 黄酒香气成分的分析. 酿酒科技,1999,95(5):66-68.
[2] 李博斌. 黄酒新国标介绍与分析. 酿酒科技, 2001,105(3):73-75.
[3] HABARA M, IKEZAKI H, TOKO K. Study of sweet taste evaluation using taste sensor with lipid/polymer membranes,Biosens. Bioelectron.2004,19(12):1559-1563.
[4] LVOVA L, LEGIN A, VLASOV Y. Electronic tongue and its application.Seensors and Actuators B, 2003,95:391-399.
[5] 滕炯华, 王磊, 袁朝辉. 基于电子舌技术的果汁饮料识别.测控技术, 2004,23(11):4-5.
[6] GOLDBERG D E. Genetic algorithm in search, optimization and Machine learning[M]. Reading, MA: Addison-Wesley, 1989.
[7] 飞思科技产品研发中心. MATLAB 6.5辅助神经网络分析与设计. 北京: 电子工业出版社, 2003.
1