基于高光谱数据的密云水库水生态空间地物精细分类

电子说

1.3w人已加入

描述

一、引言

水生态空间是指河流、湖泊、水库、湿地、蓄滞洪涝区的管理和保护范围,承担着维持水生态系统健康稳定、保障水安全等多重功能,是为人类提供水生态系统服务的重要生态空间。近年来,由于多重因素的影响,水生态空间的结构和功能受到威胁和破坏水生态空间范围内的地物组成是影响水生态空间健康状况的重要因素,因此了解和掌握水生态空间的重要地物类型分布可以为其健康评估以及未来生态规划起到关键性作用。遥感具有快速、实时和大范围的动态监测能力和优势,发展基于遥感技术的水生态空间范围内地物类型精细分类方法可以为其综合性治理与规划提供技术支持。

光学遥感影像是地物分类的主要数据源,可分为多光谱遥感和高光谱遥感分类。多光谱遥感数据种类和数量多,空间分辨率高,广泛应用于地物类型分类研究。但由于多光谱遥感数据获取到的波段数较少,对异物同谱的地物识别精度有限。相比之下,高光谱遥感数据能够获取到可见光到短波红外范围内数百个窄波段的反射率数据,在精细地物类型分类方面具有巨大的应用潜力。但由于高光谱数据种类和数量较少且空间分辨率一般低于多光谱遥感数据,其应用相对匮乏。近年来,随着中国多颗高光谱卫星的发射,极大提高了高光谱数据的获取能力。 目前,高光谱数据在水生态、水环境等方面的应用较少,因此亟需评估高光谱数据用于水生态空间范围内地物精细分类的可行性并探索适宜的分类方法。

研究基于高光谱数据的北京市密云水库水生态空间地物类型精细分类方法,确定水生态空间重要地物识别的最优特征子集,实现水生态空间地物精细分类。此外,通过对高光谱遥感数据与多光谱数据的分类结果进行比较,分析了高光谱遥感数据在水生态空间地物精细分类的优势。

二、研究区及数据源

2.1研究区与地面特征

选择北京市密云水库水生态空间范围作为研究区,如图1所示。根据密云水库水生态空间典型地类的分布特点,可以将地物精细分类的类别分为5类:水体、不透水面及裸土、板栗林、农田和草地、其他林地。

数据

图1 研究区地理位置

表1 训练集和验证集中的样本数量

数据

为了获取研究区地物类型的实际分布数据,于2022年8月1日至4日开展了野外调查工作,在调查同期进行地物类型的样本选择,各类别多光谱影像上获取的训练集和验证集样本数列于表1。由于各类型的包含样本量不同,所以本研究对每个类型单独进行随机划分,训练集和测试集的样本比例约为2:1。

三、研究方法

3.1 J-M距离分析

J-M距离是一种判断类别可分性的重要指标,研究表明相比于其他指标(如离散度、J-M距离)更适合用于判断类别可分性。J-M距离的取值在0~2之间,值越大代表可分性越好,其中0代表完全不可分,2代表完全可分,当J-M距离大于1.9时说明可分性较大.主要采用J-M距离判断类别之间的可分性,计算公式如下:

数据

3.2研究方法

3.2.1分类体系及样本选取

采用随机森林分类算法(RF)构建水生态空间地物精细分类模型(见图2)。RF算法是由多棵决策树组成的集成算法,与神经网络、支持向量机等机器学习算法相比,RF算法鲁棒性较强,运算效率高,具有处理高维数据和不均衡数据的优势。RF算法利用自助采样策略随机且有放回地从原始数据集中抽取一定数量的样本,对每个训练集建立决策树分类模型。

数据

图2 随机森林分类算法

RF算法中,特征选择的随机性也使得每个特征子空间存在一定差异。因此,特征选择和样本集自助采样过程共同增加了决策树构造的随机性。而RF的整体分类结果是每棵决策树分类结果的综合,泛化误差低。

根据已有研究可知,RF算法中有两个重要参数需要设置,分别为特征子集的个数和决策树的数量。两个参数的值通过交叉验证确定。其中特征子集个数的取值为1~5,步长为1,决策树的数量的取值为100~600,步长为100。通过对特征子集的个数和决策树的数量进行组合,分别构建模型,对比模型精度确定最佳的取值。最终确定特征子集的个数和决策树的数量的值分别为2和300。RF算法不仅可以输出分类结果,还能够输出分类特征的重要性排序。

四、结果与分析

4.1典型地物高光谱反射特征

图3(a)为5种地物类型的高光谱反射特征(样本平均值),可以发现每种地物类型的光谱反射曲线均符合其典型的反射光谱特性。其中林地(板栗林和其他林地)、农田和草地在近红外的混淆程度较高,但在可见光、红边波段和短波红外波段的区分度较大。图3(b)给出了5种地物类型的NDVI分布,从图3(b)可以发现,不同地物类型NDVI分布区间有一定的差别。农田和草地的NDVI分布值低于林地(板栗林和其他林地),但板栗林和其他林地的NDVI混淆程度较严重,说明仅利用红和近红外谱段无法实现板栗林的精细识别。

数据

图3 典型地物光谱曲线 (a) 及其 NDVI 分布箱形图 (b)

4.2 J-M距离可行性

根据高光谱数据得到的结果可知,不透水面及裸土和水体与其他类别具有明显的可分析,J-M距离大于1.9。板栗林、农田和草地、林地三者之间J-M距离在1.5~1.8范围内,说明三者之间存在一定的光谱可分性,但也存在一定程度的混淆。

其中,农田和草地与板栗林和其他林地之间的J-M距离分别为1.7260和1.7470,而板栗林与其他林地的J-M距离为1.5003,可分性弱于其他地物类型之间的可分性。由多光谱数据计算的JM距离可以发现,农田和草地、不透水面及裸土、其他林地和水体之间的J-M距离要略高于高光谱数据,这可能是由于多光谱数据具有较高的空间分辨率,以及高光谱数据在计算J-M距离时采用了所有波段作为输入,没有去除冗余波段和低相关波段等的影响。此外,多光谱数据计算的板栗林和其他林地之间的J-M距离仅为0.8491,说明二者之间可分性较差。

4.3分类模型对比

表2为利用多光谱数据的分类混淆矩阵,其OA和Kappa系数分别为85.91%和82%。由表2可知,水体、不透水面及裸土、农田和草地3类的分类精度较高,且农田和草地对应的UA和PA显著高于高光谱数据。这是由于密云水库水生态空间范围多以林地为主,农田和草地的面积小且分布较破碎,增加了样本选择的难度。相比之下,多光谱数据的空间分辨率较高,混合像元数量相对较少。本研究中,训练数据中农田和草地的样本个数为400,训练数据中农田和草地的样本个数为1000。

表2 验证集分类混淆矩阵

数据

因此,训练数据的数量和质量影响了分类精度,导致高光谱数据在农田和草地类型上的分类精度显著低于多光谱数据。但多光谱数据无法区分板栗林和其他林地,使得其他林地的PA仅为61.57%。根据高光谱数据构建的最佳分类特征子集可知,大部分波段集中在短波红外,而多光谱数据仅有2个短波红外波段,不足以实现精细树种分类。因此,上述结果综合表明高光谱数据不仅可以实现5种地物类型的精细区分,且能够实现板栗林的可靠识别。最终,密云水库水生态空间典型地物类型的空间分布如图4所示。

数据

图4 密云水库水生态空间典型地物类型分类结果

五、结论

分析了高光谱数据对于北京市密云水库水生态空间范围内典型地物类型的精细识别能力。研究结果表明,高光谱数据可以较好区分水体、林地(其他林地、板栗林)、农田和草地、不透水面及裸地,OA达到0.9361。其中高光谱数据在短波红外范围内成功捕捉到了板栗林与其他林地反射特征的区别,实现了二者的区分。但由于空间分辨率较低(30m)且受云覆盖影响导致板栗林的样本较少,混合像元数量多,但仍可以实现81.25%的生产者精度和73.03%的用户精度,因此在提高影像质量(无云影像)和增加样本量的情况下,高光谱数据可以实现更高精度的板栗林识别。而具有10m空间分辨率的多光谱数据无法实现板栗林的识别,也证明了高光谱数据在树种分类方面的有效性和优越性。高光谱仪器可在密云水库水生态空间范围内实现较为准确的精细地物类型分类,为相关部门提供可靠的基础数据,并且可结合相关数据实现该地区的水生态空间健康评估(例如根据板栗林的面积等信息评估水土保持情况),为水生态空间的合理规划和综合治理提供技术支持。

推荐:

便携式高光谱成像系统iSpecHyper-VS1000

专门用于公安刑侦、物证鉴定、医学医疗、精准农业、矿物地质勘探等领域的最新产品,主要优势具有体积小、帧率高、高光谱分辨率高、高像质等性价比特点采用了透射光栅内推扫原理高光谱成像,系统集成高性能数据采集与分析处理系统,高速USB3.0接口传输,全靶面高成像质量光学设计,物镜接口为标准C-Mount,可根据用户需求更换物镜。

数据

审核编辑 黄宇

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分