采用高光谱成像技术对甘蔗茎节进行定性判别和定量分析

今日头条

1153人已加入

描述

0引 言

      甘蔗是我国主要糖料作物之一,2015 年播种面积为 159.965 万公顷,发展甘蔗生产是蔗农脱贫致富的重要途径,良种化种植与机械化耕作是甘蔗产业发展的重要手段。甘蔗通过斩种进行种植,目前国内外的甘蔗切割机均不具备茎节识别功能,切割时经常损伤茎节处的种芽,导致用种量多、出苗率少,影响甘蔗产量。因此,精确识别甘蔗茎节处的种芽,实现自动化的蔗种防伤芽切割具有重要意义。

1甘蔗茎节的识别与定位 

1.1 样本选取

所选样品为浙江省优质甘蔗生产基地主产的“义红一号”果蔗。正常品质,在运输和实验过程中尽量避免碰撞、挤压等损伤,去除甘蔗根部表面的泥污,进行高光谱数据采集。将 236 个样本( 茎节 77 个,茎间 159 个) 随机分为建模集和预测集,建模集共 177 个,预测集共 59 个。

1.2 高光谱数据采集与分析

建立如图 1 所示的高光谱图像采集系统,该系统主要由光谱仪,计算机,电控移位平台,相机,镜头,线光源和高光谱图像采集软件等组成。采集到的高光谱图像的光谱范围是 874 ~ 1734 nm,共 256 个波段,光谱分辨率为 5 nm,采集的高光谱图像大小为 320 像素 ×256 像素。进行高光谱图像采集时,需要调节移动平台的速度、相机曝光时间、镜头与光源的间距等参数,确保所获取图像清晰且不失真。 经过多次调 校,当 物 镜 高 度 19 cm,平 台 移 动 速 度14.5 mm / s,曝光时间 4 ms 时,取像效果较佳。在采集箱内完成整个图像获取,避免外界光线及其他噪声干扰。

高光谱

1. 计算机 2. 数据线 3. 光源调节器 4. 采集箱5. 高度调节装置 6. 风扇 7. 相机 8. 光谱仪 9. 镜头10. 光源 11. 载物台 12. 高精度电控移位平台

图 1 高光谱图像采集系统

在采集样本的高光谱图像前,需要校正相机暗电流对图像产生的影响,通过遮住镜头获取黑板校正图像,采集标准白色校正板得到白板校正图像,根据下式计算校正后图像:

高光谱

其中,ICorrection表示校正后高光谱图像,Iraw表示原始图像,Idark表示全黑标定图像,Iwhite表示标准白板图像。数据分析在 ENVI 4.6,Matlab R2012a 和Unscrambler X10.1 软件平台进行。实验采集甘蔗样本的近红外波段,光谱范围为874 ~ 1734 nm,原始光谱如图2 所示。从图2 可看出,在原始光谱的前后端都有明显的噪声干扰,因此采用 995 ~ 1650 nm 之间的 195 个波段进行数据分析与处理较为合适。选取蔗种的茎节和茎间位置作为研究区域,并计算它们的光谱平均值,两个样本平均光谱曲线如图 3 所示。由图 3 可知,茎节与茎间的光谱曲线具有较大的差异性,两者的平均光谱在 1170 nm 和 1450 nm 处有明显的吸收峰。查询资料可知 1450 nm 是对含水量敏感的波段,由于茎节与茎间的水分含量不同,它们的平均光谱曲线会在 1450 nm 处显示吸收峰;在 1170 nm 处 产 生 吸 收 峰 的 原 因 有 待 进 一 步研究。采用主成分分析( PCA) 对光谱数据进行处理,结果如图 4 所示。第一、二主成分( PC - 1,PC - 2) 的贡献率分别为 83 % 和 16 % ,累计贡献率达到 99% ,能够解释大部分变量。图 4 中茎间与茎节的区分非常清楚,充分证明高光谱成像技术用于茎节识别的可行性。

高光谱

图 2 甘蔗茎节和茎间样本原始光谱图

高光谱

图 3 甘蔗茎节和茎间样本平均光谱

高光谱

图 4 主成分 PC - 1 和 PC - 2 的 PCA 得分

1.3 特征波段提取

甘蔗样本的高光谱图像包含 256 个波段,大量的光谱数据间存有较大的冗余和共线性信息,增加了特征运算和提取的复杂度. 本文采用连续投影算法( SPA) 提取特征波段,该算法利用向量的投影分析,搜寻含有最低限度的冗余信息组,并最小化变量间的共线性,同时能有效减少建模所需变量数,提高建模的速率. 本研究设置 SPA 算法选择特征波长数量为 5 ~20.采用 SPA 得到 1022 nm,1062 nm,1456 nm,1609 nm 和 1649 nm 这 5 条特征波段,对应的单波段灰度图像如图 5 所示,其中 1456 nm 所对应的灰度图像中茎节信息非常显著。对提取的这 5 个波段,采用线性组合的方法进行茎节的识别与定位。

1.4 甘蔗茎节识别分类模型的建立

以 SPA 选择的特征波段为输入,建立偏最小二乘法 ( PLS) 分类模型. 与传统多元线性回归模型相比,PLS 是一种多元统计数据分析方法,能够在自变量存在多重相关性或样本数小于变量数的条件下实现回归建模; 在最终偏最小二乘回归模型中将包含原有的自变量,因此更易于识别系统的信息和噪声,也更容易解释模型每个自变量的回归系数. 为了避免过拟合问题,本文 PLS 算法采用全交叉验证.将 236 个蔗种样本随机划分为校正集( 177个样本) 和预测集( 59 个样本) . 以 SPA 算法挑选的 1022 nm,1062 nm,1456 nm,1609 nm 和1649 nm 这 5 个特征波长为 x 变量,将建模集的类别( 1 代表茎间,2 代表茎节) 作为 y 变量输入 PLS 模型,得到模型的各个系数。

高光谱

图 5 提取的 5 个特征波段所对应的灰度图像

建立 PLS模型如下:

高光谱

采用预测集验证 PLS 模型,将判断阈值设为 0.5,即如果输出结果在( 0.5,1.5 ]区间内,则设置为类别 1;输出结果在( 1.5,2.5]区间内,则为类别2。校正集和预测集的判别结果如图6 所示,纵坐标为 0.5,1.5 和 2.5 处绘制的红色阈值线。 统计校正集和预测集的误判数和准确率,结果如表 1 所示。由表 1 可知,校正集和预测集识别准确率非常高,分别为 99.44% 和 98.31% ,表明所选的 5 个光谱波段基本涵盖了蔗种茎节检测的有效信息,以非常有限的波段数量简化了模型。

高光谱

图 6 校正集和预测集的判别结果

表 1 PLS 模型检测结果

高光谱

1.5茎节定位

甘蔗茎节识别分类模型仅实现了蔗种茎节的定性判别,还需要结合图像处理技术进一步进行定量分析,从而定位茎节位置。采用公式①归一化输出图像,输出结果以0. 5 为阈值进行分类,可成功提取茎节图像,具体 过 程 见 图 7。以 上 处 理 步 骤 都 在 MatlabR2012a 中进行。从图 7b) 可见,提取的茎节图像包含了蔗芽、茎节和白色噪声斑点,茎节为粗细不一的圆弧形,需要在该情况下定位茎节。 通过分析发现,茎节在纵向的长度比蔗芽和噪声斑点要长,因此可以在纵向上统计白色像素数并绘制统计图,如图 8 所示。图 8 中的 3 个局部最大值分别对应蔗芽、茎节和噪声斑点,可以看出茎节的峰值明显高于蔗芽和噪声斑点的峰值,像素最大值所在的位置 ( 像素 105 列) 即可设定为茎节所在的位置。将图像的最左端定义为起点,建立图像像素与实际测量尺寸的关系( 像素宽度对应的长度) ,在茎节最大峰值位置绘制直线,如图 9 所示,图中红线即为茎节的位置,并设定为 x,以备后续测量验证。

高光谱

图 8 茎节、蔗芽和噪声的像素纵向统计图

高光谱

图 9 茎节定位示意图

2图像识别结果验证从大量的蔗种中随机抽取 20 个试验样品,样品采集前,在旁边放置标尺,结合标尺刻度进行人工测量。 另外,采用本文图像处理方法测量x 坐标值所对应的位置。两种方法的测量值如图 10 所示。通过对图 10 试验数据的分析可知,采用图像处理法得到的数据与人工测量的数据非常接近,茎节中心 x 的平均绝对误差为 1.0 mm,标准差为 0.7 mm,绝对误差最大值为 2.6 mm,完全在可接受的范围内。本文提取的是甘蔗的茎节信息,并在识别茎节的基础上进行茎节的定位。通常茎节的宽度为 9 ~ 15 mm,将 x 向左右两端各扩展7.5 mm 作为茎节的保护范围,该范围就包含了种芽,从而为切割蔗种时防伤芽提供保障。不同甘蔗不同位置处的茎节长度不一,是造成数据误差的主要原因,但是该误差是可接受的。因此识别定位茎节的位置可以准确确定蔗芽的范围,误差小,可信度高。

高光谱

图 10 图像测量值与人工测量值比较

为了进一步验证高光谱图像与普通图像在识别结果上的差异,采用 CCD 相机直接获取甘蔗图像,再使用传统的图像处理方法进行图像处理,即利用茎节的常态图像进行识别,与图5,图 7 和图 8 所示基于高光谱图像的茎节识别进行对比,结果如图 11 所示( 其中第 1 行为原始的普通 RGB 图像,第 2 行为灰度图像,第 3行为阈值二值化图像,第 4 行为每列像素之和的折线图) 。图 11a) 茎节图像每列像素之和左半边较小,右半边较大,无法直接定位茎节位置;图 11b) 中的折线图出现两个较低的波谷,难以准确识别茎节位置;图 11c) 相对较平缓,波谷与茎节位置有较大的偏差;图 11d) 与图11a) 相似,难以准确定位茎节。 由于茎节上的白色果粉和其他噪声的干扰,再加上 RGB 图像提供的有效信息不多,不能可靠地实现茎节的识别。可以看出,采用普通图像的识别效果较差。这也从另一面体现了本文所采用基于高光谱成像技术的甘蔗茎节识别与定位方法的优越性。

高光谱

 

高光谱

图 11 基于普通图像和传统图像处理方法的茎节识别结果

3结 论

        本文采用高光谱成像技术对甘蔗茎节进行定性判别和定量分析。运用 SPA 算法提取茎节的 5 个特征波段,建立 PLS 判别模型,校正集和预测集的识别率分别为 99.44% 和 98.31% ,对茎节定性判别效果非常好。运用该模型 5 个敏感波段组合的归一化图像进行茎节识别与定位,定量地检测出茎节的位置,其结果的标准差为0.7mm,绝对误差的最大值为 2.6 mm,并确定了蔗芽的范围。将该识别模型与定位方法应用于随机抽取的 20 个样本,同样取得良好效果,这为甘蔗茎节的识别、定位及切割蔗种时防伤芽提供了理论基础和依据。
 

  审核编辑:汤梓红
 
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分