电子说
一、引言
草原生态系统是陆地生态系统的重要组成部分。我国草地面积约为4亿hm2,每年平均可为畜牧业发展提供3.5亿吨优质牧草。但由于自然因素与人为因素影响,全球草原生态系统出现退化问题,逐渐形成荒漠草原。据统计,我国超过90%的草原出现不同程度退化现象。其中,内蒙古自治区草原总面积约为8.8×107hm2,退化面积约占73.5%。草原退化对农牧民生活及农牧业经济发展造成严重威胁。荒漠草原地表微斑块主要包括各种群植被、裸土、鼠洞。草原退化主要表现为植被矮小、植被整体覆盖度逐渐减少、鼠洞数量增加等。因此,地表微斑块精确识别与分类是荒漠草原研究的重要指标。传统荒漠草原研究主要依靠人工实地监测,精确度较高但费时费力。为满足大空间尺度观测需求,遥感技术应用于草原研究。遥感采用非接触、远距离探测技术,可实时获取图像数据,与人工调查相比具有成本低、实验不受人主观因素影响等优点。常用遥感方式为卫星遥感,分辨率在1m左右,应用于大面积植被动态监测。荒漠草原使用卫星遥感监测具有局限性。
近年来,低空无人机遥感系统逐渐兴起,弥补了卫星遥感与人工调查间尺度空缺。以无人机搭载高光谱成像仪组建无人机高光谱遥感系统拍摄图像,不仅分辨率高、数据源丰富,而且方便快捷、不损坏原有实验环境,可重复进行实验。
随着深度学习的发展,卷积神经网络不断应用于高光谱图像分类处理任务。CNN是能够进行深度学习的人工神经网络,能做到自动提取图像特征。本文通过构建无人机高光谱遥感系统,采集荒漠草原地表微斑块高光谱图像,建立轻量化卷积神经网络模型―高分辨率图像卷积神经网,用于地表微斑块识别与分类任务,为荒漠草原退化监测提供理论基础。
二、材料与方法
2.1 研究区概况
试验区域如图1,地处内蒙古自治区乌兰察布市格根塔拉草原(N41.78º、E111.88º),草原类型为荒漠草原。植被种群稀疏低矮,平均高度10cm。草类主要为短花针茅、无芒隐子草等。鼠类主要有长爪沙鼠、达乌尔黄鼠等。
图1 试验区域卫星图
2.2数据采集
高光谱图像数据采集时间:2022年的7月至8月,中午11:00~14:00。采集条件:光照充足、无云雾遮挡,少风或微风。试验区域总面积为2.5hm2。在试验区域内,随机设置50组样方,样方尺寸为1m×1m。样方内部含有植被、裸土、鼠洞,外部使用实验辅助物(地垫与小旗)进行标记。此外,实验辅助标记物还有充当草原环境中因人为活动导致外来垃圾的作用。无人机飞行高度30m,空间分辨率1.73cm,采集地物样方光谱图像尺寸大小为696lines×775samples×256bands,且对每个样方拍摄3次,以提高数据的可用性。
2.3 反射率矫正
无人机飞行拍摄过程中因受环境因素影响导致部分拍摄图像发生扭曲变形,故首先将变形及拍摄质量较差图像进行人工去除,其次,将初步筛选数据(包括黑帧、白帧、样方原始图像)导入SpecView软件进行辐射校正。校正计算如公式:
式中:R为反射率校正后图像,Iraw为原始图像,Iwhite为白帧图,Idark为黑帧图。
图像经反射率校正后,使用ENVI5.3软件提取每类地物纯净像元各100个进行空间统计(因鼠洞像元较少,故提取20个进行研究),并使用OriginPro2021软件绘制每类地物反射率曲线如图2所示。
图2 地物反射率校正图
从图2中可看出每类地物反射率差异明显,其中,地垫反射率波动较大。小旗在460Band后急剧上升,560Band后增长趋于平稳。裸土与植被反射率差异处为543~687Band,植被存在明显‘波峰’与‘波谷’。鼠洞反射率增长最为缓慢。每类地物同波段反射率变化不一为后续地物分类提供可能。
2.4 数据预处理
高光谱图像具有丰富的光谱和空间信息,通常包含几十到数百个连续光谱波段,但波段间存在较高的相关性和冗余度,这将使模型在训练阶段容易出现Hughes现象。因此,高光谱数据使用前应做数据降维处理。本文采用广泛应用于高光谱数据降维的主成分分析算法作为特征提取的方法,有效剔除冗余信息。同时为有效防止图像边缘大量扭曲混合像元对实验影响,对数据尺寸进行剪裁,最终获取高光谱图像数据。
根据研究目的,本次实验将草原地物分为植被、裸土、地垫、小旗、鼠洞共五类。通过ENVI5.3软件对图像进行ROI感兴趣区域标签处理,每类样本数量分别为31600、27419、686、179、32个,共计59916个样本。本次实验将50%的地物样本划分为训练集,为保证实验可靠性将训练集中50%的数据划分为验证集。在图像识别与分类处理任务中,深度学习效果严重依赖于样本数量,当训练样本较少时,易使网络陷入局部最优。本实验为增加训练样本数量,通过图像随机翻转方法进行数据增强,使训练集样本数量增加至14979个。此外,为一定程度上解决小样本数据集过拟合问题,对样本数据进行随机打乱处理。样本数据如表1所示。
表1 样本数据表
三、草原物种分类模型
卷积神经网络特征提取方法是影响模型优劣的关键因素。本文针对荒漠草原地表微斑块分类问题,提出高分辨率图像卷积神经网络模型。该模型主要特点包括使用带有不同大小卷积核的深度可分离卷积作为各分支结构,以降低计算量和参数量。通过逐步使用不同感受野的卷积核,将图像底层特征提取为高层语义特征。同时,引入残差结构将底层特征与高层语义特征进行融合,以防止卷积运算中的特征丢失和网络模型退化问题的发生。在卷积层最后,使用转置卷积将提取的高层语义特征图映射为高分辨率特征图像,从而降低图像中混合像元对最终分类效果的影响,并提高模型分类精度。该模型属于低参数量的轻量化网络模型,共包含两层分支结构与一层组合结构。分支结构内部包括输入层、三个深度可分离卷积层、两个残差结构、最大池化层与转置卷积层。组合结构中包括维度拼接层、全连接层与分类层。此外,每层卷积运算结束后,均进行批量归一化(BatchNormalization)与激活函数(Relu)操作,避免梯度消失与爆炸,加快模型收敛速度。具体网络模型结构如图3所示,网络模型运行参数如表2所示。
图3 高分辨率图像卷积神经网络
表2网络模型参数
结果与分析
4.1 实验结果
本模型在训练实验过程中,除模型训练初期验证集损失出现震荡外,训练集与验证集整体呈下降趋势。在第20个epoch后趋于平稳,此时共花费144s,训练集损失值稳定变化在0.023~0.025,验证集损失值稳定变化在0.062~0.065。为保证训练模型稳定,30个epoch全部训练完毕共花费214s。训练结果如图4所示。PLSR模型效果最佳。而在两种草地类型下的N和K含量以及温性草原下P含量构建的RF模型均表现最优。
图4 HR-CNN模型训练损失曲线
4.2 实验分析
为验证本模型有效性,在采用相同数据预处理及实验环境基础上,采用ResNet34、GoogLeNet两种常用高光谱图像分类算法进行对比。同时,为验证深度可分卷积与常规卷积所构模型区别,将深度可分卷积改为常规卷积,构建常规2D卷积神经网络模型(2D-CNN)进行对比验证,因二者具有相同模型结构,故在生成模型所占内存及运行参数量方面具有较大差异。
本文在不同模型分类混淆矩阵(如图5所示)基础上,通过对其进行运算,分别以整体分类精度(Overallaccuracy,OA)(公式)、F1得分(F1-score,F1)(公式)及Kappa系数(公式)作为评价指标。
其中:TP为预测正样本,TN为预测负样本,FP为真实正样本,FN为真实负样本,N为样本总数量。
为便于模型间对比验证,本文对Kappa系数进行放大100倍处理。各模型F1分类精度如表3所示,OA及Kappa系数分类精度对比结果如图6所示。此外,在相同数据预处理及图像分类预测结果条件下,模型构建优劣与训练时间、模型运行参数量所占内存有关。训练时间越短且内存占有量越小,构建模型越好。四类模型训练时间及内存占有量如表4所示。
图5 混淆矩阵对比
由表3可知,四类模型对高光谱图像中具有较大数据量的植被、裸土均具有较高识别精度。但对于小样本数据集(地垫、小旗、鼠洞),四类模型图像识别精度具有较大差异,但HR-CNN模型各地物分类精度均表现优异。其中,ResNet34、GoogLeNet网络模型对于鼠洞识别精度较低,相较HR-CNN模型精度分别降低13.40%、18.10%。
表3 F1分类精度对比表
由图6可知,(c)2D-CNN与(d)HR-CNN模型OA与Kappa值相差不大,但(a)ResNet34相较HR-CNN模型OA与Kappa值分别降低1.91%、0.97,(b)GoogLeNet相较HR-CNN模型OA与Kappa值分别降低0.47%、0.93。
图6 OA及Kappa系数分类精度
实验中,四类模型在训练阶段模型损失逐渐降低并趋于平稳(损失平稳即为模型构建完毕)。各模型构建完成时间(表4),其中HR-CNN模型训练时间最短为144s,仅占ResNet34、GoogLeNet、2D-CNN模型训练时间的34.12%、34.29%、86.23%。HR-CNN模型内存占有量最小为19.5MB,相比ResNet34、GoogLeNet、2D-CNN分别降低92.11%、79.21%、43.64%。HR-CNN模型运行参数所占内存最小为6.06MB,较ResNet34、GoogLeNet、2D-CNN分别降低92.57%、79.03%、46.18%。
表4模型训练时间及内存占有量对比表
为验证模型分类效果,对高光谱图像进行可视化分类研究。由图7可看出,HR-CNN模型对草原地物分类表现良好。
图7高光谱图像原图与模型分类预测图
结论
本文旨在通过构建无人机高光谱遥感系统,并结合深度学习中的卷积神经网络,提出一种高分辨率图像卷积神经网络(HR-CNN)用于荒漠草原地表微斑块分类识别研究。实验证明该网络模型在此类任务中具有较高的识别精度和计算效率。该模型通过引入残差结构,在高光谱图像中使用不同大小的卷积核提取各地物影像特征。转置卷积用于重组特征,以生成高分辨率的特征图,并通过通道拼接的方式减少特征丢失。此外,引入了深度可分离卷积以减少网络参数量,提升模型性能。与2D-CNN、ResNet34和GoogLeNet网络模型相比,HR-CNN在训练时间和模型内存占用方面有显著改进。本模型的轻量化设计对于荒漠草原地表微斑块的精细分类研究具有重要意义,为进一步深入研究荒漠草原地物分类、识别和反演提供了新思路。
推荐:
便携式高光谱成像系统iSpecHyper-VS1000
专门用于公安刑侦、物证鉴定、医学医疗、精准农业、矿物地质勘探等领域的最新产品,主要优势具有体积小、帧率高、高光谱分辨率高、高像质等性价比特点采用了透射光栅内推扫原理高光谱成像,系统集成高性能数据采集与分析处理系统,高速USB3.0接口传输,全靶面高成像质量光学设计,物镜接口为标准C-Mount,可根据用户需求更换物镜。
审核编辑 黄宇
全部0条评论
快来发表一下你的评论吧 !