生态学报  2022, Vol. 42 Issue (23): 9830-9842

文章信息

李长龙, 李增元, 高志海, 孙斌, 王丝丝
LI Changlong, LI Zengyuan, GAO Zhihai, SUN Bin, WANG Sisi
基于SNIC-CNN-SVM模型的京津风沙源二期工程区土地利用/土地覆盖遥感识别研究
Remote sensing recognition of land use/land cover in the Beijing-Tianjin sandstorm source region based on SNIC-CNN-SVM model
生态学报. 2022, 42(23): 9830-9842
Acta Ecologica Sinica. 2022, 42(23): 9830-9842
http://dx.doi.org/10.5846/stxb202109262707

文章历史

收稿日期: 2021-09-26
网络出版日期: 2022-07-27
基于SNIC-CNN-SVM模型的京津风沙源二期工程区土地利用/土地覆盖遥感识别研究
李长龙1,2,3 , 李增元2,3 , 高志海2,3 , 孙斌2,3 , 王丝丝4     
1. 广州商学院信息技术与工程学院, 广州 511363;
2. 中国林业科学研究院资源信息研究所, 北京 100091;
3. 国家林业和草原局林业遥感与信息技术重点实验室, 北京 100091;
4. 国家遥感中心, 北京 100084
摘要: 稀疏植被覆盖(草地、沙地、戈壁)演变能够直接表征区域生态环境和人类活动的动态影响变化。但由于大尺度稀疏植被区一般都具有地理跨度大,景观结构复杂多样,破碎化程度高,现有地表覆盖分类产品针对性不足等问题,使得该区域内林草沙的遥感提取难度较大,精度普遍偏低,直接制约生态效应评价模型的应用效果。因此,以典型大尺度稀疏植被区--京津风沙源治理二期工程区为研究区,研建了SNIC-CNN-SVM (SCS)模型,实现了大尺度稀疏植被区林草沙典型要素的信息自动提取和主要土地利用/土地覆盖类型识别。研究结果表明:1)引入惩罚性机制优化后的SNIC分割算法,有效提升了稀疏植被区与沙地区的边界区分度,有助于分类精度的提升;2)基于改进SNIC-CNN-SVM模型方案的研究区总体分类精度达89.41%,较优化前提高了11.17%,特别是乔、灌、草、沙地和戈壁的分类识别精度显著提升,表明该优化方案在以研究区为代表的稀疏植被区域分类中具有较好的应用效果和推广价值;3)分类结果显示,2020年工程区草地面积最大,占到了一半以上(51.52%),沙地占比11.96%,稀疏植被覆盖(草地、沙地、戈壁)区域占比68.68%,表明工程区处在林地-稀疏植被-沙地的过渡地带,生态环境保护压力与防沙治沙形势依然严峻;4)近20年来,乔灌草等植被增加面积约占工程区20.64%,主要由沙化土地转化,沙化土地减少面积约占工程区的4.58%,表明研究区植被状况不断改善,实施的各项生态工程作用显著,能够更有效地服务于多维度生态系统服务功能评价。该研究以期能够为京津风沙源二期工程区的生态系统演变规律研究及生态工程评价等工作提供重要科学支撑。
关键词: 稀疏植被    京津风沙源治理二期工程区    SNIC-CNN-SVM模型    土地利用/土地覆盖    
Remote sensing recognition of land use/land cover in the Beijing-Tianjin sandstorm source region based on SNIC-CNN-SVM model
LI Changlong1,2,3 , LI Zengyuan2,3 , GAO Zhihai2,3 , SUN Bin2,3 , WANG Sisi4     
1. School of Information Technology and Engineering, Guangzhou College of Commerce, Guangzhou 511363, China;
2. Research Institute of Forest Resource Information Techniques, Chinese Academy of Forestry, Beijing 100091, China;
3. Key Laboratory of Forestry Remote Sensing and Information System, National Forestry and Grassland Administration, Beijing 100091, China;
4. National Remote Sensing Center of China, Beijing 100084, China
Abstract: The evolution of sparse vegetation cover (grassland, sandy land, Gobi) can directly characterize the dynamic changes of the regional ecological environment and human activities. However, large-scale sparse vegetation areas generally have large geographic spans, complex and diverse landscape structures, high fragmentation, and insufficient pertinence of existing land cover classification products. These problems make it difficult to extract the forest, grass, and sand in this area by remote sensing, and the accuracy is generally low, which directly restrict the application results of the ecological effect evaluation model. Therefore, this study took the typical large-scale sparse vegetation area, the Beijing-Tianjin sandstorm source region (BTSSR) as the study area, and the SNIC-CNN-SVM (SCS) model is proposed. The forest, grass, sand element information is automatically extracted and the land use/land cover types are identified in the study area. The results show that: 1) the SNIC segmentation algorithm was optimized by the penalty mechanism and can effectively increase the boundary discrimination between the sparse vegetation area and the sandy area, which is helpful to improve the classification accuracy; 2) the overall classification accuracy of the optimized model reached 89.41%, which is 11.17% higher than that before optimization, especially the classification and recognition accuracy of trees, shrubs, grasses, sandy land and Gobi is significantly improved, indicating that the optimization model has good application effect and promotion value in the classification of sparse vegetation areas represented by the study area; 3) in 2020, the grassland area in the study area was the largest, accounting for more than half (51.52%), sandy land accounted for 11.96%, and sparse vegetation coverage (grassland, sandy land, Gobi) accounted for 68.68%, indicating that the project area is in the transition zone of woodland-sparse vegetation-sandy land, and the pressure on ecological environment protection and the situation of desertification prevention and control are still severe; 4) in the past 20 years, the increased area of vegetation such as arbor, shrub and grass accounted for about 20.64% of the project, which is mainly derived from desertified land. The reduced area of desertified land accounted for about 4.58% of the project area, indicating that the vegetation conditions in the study area are continuously improving, and the implemented ecological projects have a significant effect. The method in this paper can be more effectively used for multi-dimensional ecosystem service function evaluation. This study is expected to provide important scientific support for the research on the evolution law of the ecosystem and the evaluation of ecological engineering in the BTSSR.
Key Words: sparse vegetation    Beijing-Tianjin sandstorm source region (BTSSR)    SNIC-CNN-SVM model    land use/land cover    

土地覆被信息不仅是单一地表类型的表达, 而且体现一定区域内生态环境和人类活动等自然和非自然属性的综合特征[1]。因此, 不同的土地覆盖类型代表着地球表面丰富多样的生态系统和自然人文景观, 它是生态系统内部长期动态演变的积累, 也是量变到质变的外部反映[23]。通过对土地覆被长时间序列变化研究能够分析不同生态系统内部生物和非生物的综合生态效应, 从而掌握生态系统的长期演变规律, 为全球气候变化及其人类活动影响等提供重要信息支撑[46]

随着遥感技术的飞速发展, 特别是深度学习算法的不断优化, 依靠遥感技术自动半自动地提取土地覆被信息已然成为当前的重要手段[79]。近年来, 在国家和区域尺度, 部分学者研发了多套地表覆盖遥感产品, 例如刘良云团队GLC_FCS30[10]、宫鹏团队FROM_GLC30[11]和FROM_GLC10[12]、国家自然资源部GlobeLand30[13]、欧空局全球陆地覆盖数据(ESA GlobCover)[14]等, 这些都极大地提高了气候变化和生态环境评估等综合性、大尺度深度研究的效率, 为地理国情监测等提供了重要的基础信息。

稀疏植被区主要是指植被覆盖度在10%—50%的地表区域, 包括草原、苔原、荒漠草原、荒漠、岩溶地区和部分高海拔植被区等。其中, 零星的植被由草本和(或)木质和半木质植物组成, 其余区域为自然裸地[1516]。京津风沙源治理二期工程区从东南向西北降水逐步减少, 稀疏植被分布广泛。由于稀疏植被区内的自然裸地多为反射率较高的沙砾或岩石, 而植被又零散分布在自然裸地内部, 这就造成稀疏植被的光谱信息易被淹没, 提取难度较大[1718], 而针对不同地类的有效性特征是提高地表覆盖制图精度的重要因素[19]。目前, 全球或全国的地表覆盖产品尺度较大, 针对稀疏植被区的特异性较差, 类型识别精度较低, 而且缺乏对不同沙化土地类型的精细划分[2021]。这些都极大地限制了稀疏植被区生态效应评价、系统管理和科学决策等方面的应用需求, 因此迫切需要建立基于大尺度的稀疏植被区土地覆被信息的遥感提取方法。

根据遥感分类的影像基础可以将土地覆盖分类方法细化为基于像元、基于超像素和面向对象三类[22]。基于像元的方法较为传统, 主要依靠影像的光谱信息对不同地物进行监督或非监督的聚类, 但是缺乏对几何和周围影像信息考虑[2325]。面向对象的方法主要有分水岭变换算法[26]、均值漂移算法[27]、分形网络进化算法[28]和马尔可夫随机场分割算法[29]等, 分类的基础是对遥感图像信息提取后分割成的对象, 图像分割优劣直接影响分类精度, 不同地物类型对应不同分割尺度, 计算量较大, 效率较低, 最优分割尺度的选择多以人工或人机交互方式进行, 不利于建立自动化提取模型[3031]。超像素分割则弥补两者缺点, 通过对像素进行相似性分组, 从而形成相对规则和均匀大小对象, 以类似过分割的方式对图像信息进行解析[32], 去掉了最优尺度选择和对象形状特征提取等工作量, 分析作用更强, 更有利于沙化土地类型中植被和沙地边界模糊或渐变性边界的提取和划分, 目前常用的算法包括基于图论的算法和基于梯度下降的算法等[33]。以卷积神经网络(Convolutional Neural Networks, CNN)为代表的深度学习方法解决了最邻近、极大似然等传统遥感分类方法在遥感图像中隐藏的深层次语义信息缺乏的问题, 能够从本身的深层结构中学习高度抽象的图像语义区别特征[3435], 对于稀疏植被区土地覆盖分类具有较强的适用性, 能够一定程度解决该区域类型复杂, 变化多样, 植被分布很不均一, 渐变型或混杂型地类较多等难题。

综上, 本研究以京津风沙源治理二期工程区为研究区, 基于多源遥感数据, 通过建立惩罚性机制优化超像素分割算法, 研究构建用于稀疏植被区典型土地利用/土地覆盖分类识别的SCS模型, 以期提高稀疏植被的遥感信息提取能力, 获取科学准确的土地覆被类型信息, 为研究区生态工程效应评价奠定基础。

1 研究区概况

本研究以京津风沙源治理二期工程区为研究区, 该区域东西距离约1300km, 南北距离约1000km, 总面积约为70.98万km2, 包括陕西省、内蒙古自治区、北京市、天津市、山西省和河北省的共计138个县(旗、市、区), 地理坐标为105°8′—120°59′E, 36°48′—46°47′N, 具体位置如图 1所示。

图 1 研究区位置示意图 Fig. 1 The location of the study area

研究区地貌由平原、山地、高原三大部分组成, 地形起伏较为复杂, 最低处仅有几十米, 最高处超过了3000m。区域内的沙化土地聚集分布, 形成了“三沙地一沙漠”的格局(科尔沁沙地、浑善达克沙地、毛乌素沙地和库布齐沙漠)。研究区受到降水、气温和太阳直射时间等自然条件的影响, 从东南向西北的气候分异明显, 依次包括有亚湿润区、干旱亚湿润区、半干旱区和干旱区, 植被则依次分布有森林草原、典型草原、荒漠草原、草原化荒漠和荒漠。由于降水和地形等自然因素的影响, 研究区中部和西北部呈现明显植被和荒漠交错的破碎化自然景观, 属于典型的稀疏植被区, 其中植被沿低洼处或河流周围聚集性分布, 种类多样且林灌草多混杂生长;裸露地表的差异性也较大, 依次分布有栗钙土、砂质土、粗沙、砾石等。另外, 再叠加人类活动和林农牧交错区影响, 多种地表类型在一定区域内共存或多次更迭, 光谱信息均一性较差, 遥感信息提取难度较大[3637]

2 研究方法 2.1 数据获取与处理

本研究主要获取的遥感数据为Landsat影像, 其中, 2000年和2010年采用的是Landsat 5影像, 总景数分别为274景和255景;2020年采用的是Landsat 8影像, 总景数为322景, 数量分布如图 2所示。每一年影像均选取研究区6—9月生长季影像, 然后基于像元的最小云量进行影像合成, 从而最大程度减少云对影像分类的干扰。影像的波段选择为蓝、绿、红、近红外、短波红外和热红外, 均采用经过大气校正和几何校正等预处理后的数据。

图 2 Landsat遥感影像数量分布示意图 Fig. 2 Schematic diagram of the number distribution of Landsat remote sensing images

为了能够更好地识别沙化土地, 需要去除表层植被的干扰和影响, 因此本研究采用SAR数据穿透表层植被, 强化沙化土地的识别能力。根据实验分析, 极化方式为VV+VH组合的双极化影像对沙化土地的敏感性更强, 因此数据选择Sentinel-1A中的GRD一级产品, 极化方式为VV+VH组合的双极化, 成像时间为2020年7月15日。数字高程模型(DEM)数据来自NASA的地球观测系统数据信息系统, 空间分辨率30m, 成像时间为2010年, 包含高程、坡度、坡向三类数据。为了与Landsat数据进行匹配, SAR数据经正射校正和重采样, DEM数据经过尺度转换, 均统一到空间分辨率为30m。真值数据的来源主要分为两部分:野外调查和高分辨率遥感影像判读, 各数据的数量和年份分布如表 1所示, 空间分布如图 1所示。每年份的野外调查数据采样时间均为植被的生长季(7月或8月), 影像判读数据则是基于Google Earth上更高分辨率遥感影像进行。

表 1 真值数据来源和年份分布 Table 1 The source and year distribution of true value data
样点类型
Sample type
野外调查样地点
Field survey sites
遥感影像判读点
Interpretation points of remote sensing image
年份Year 2011 2014 2015 2016 2020 2004 2011 2012 2013 2015 2019 2020 2021
数量Quantity 15 12 18 33 60 3 7 4 21 3 43 40 38
  总计Sum 138 159
2.2 研究方法

本研究在原有超像素分割算法——简单非迭代聚类(Simple Non-Iterative Clustering, SNIC)的基础上, 通过建立惩罚性机制, 将更多的植被光谱信息引入影像分割中, 增强稀疏植被遥感信息提取能力, 然后利用SAR数据本身的穿透能力建立不同纹理特征对沙化土地进行识别, 最后基于CNN机器学习方法和SVM分类器对整个研究区进行不同类别的确定, 这样就形成了SCS稀疏植被区遥感分类模型, 系统地将(稀疏)植被、沙化土地和其他类别进行精准划分。具体主要分为五步:分类体系的建立, 特征选择, 超像素分割, 影像分类和精度评价。

第一, 分类体系的建立。参考自然资源部《土地利用现状分类》(GB/T 21010—2017)和《第三次全国国土调查技术规程》(TD/T 1055—2019)分类标准, 综合Landsat遥感影像土地覆盖信息提取能力, 研究区分类体系定为8大类, 分别是:乔木林、灌木林、草地、沙地、耕地、水体、戈壁和其他, 含义如表 2所示:

表 2 土地覆盖分类体系及含义 Table 2 Land cover classification system and meaning
序号No. 类型Type 含义Meaning
1 乔木林 指以乔木为主的林地, 郁闭度≥0.2
2 灌木林地 指以灌木为主的林地, 覆盖度≥40%
3 草地 指生产草本植物为主的土地
4 沙地 指表层为沙覆盖、基本无植被的土地
5 耕地 指农作物为主要地表类型的土地
6 水体 指陆地水域, 滩涂、沟渠、沼泽、水工建筑物等地
7 戈壁 指表层土壤主要以沙砾坚土为主, 植被十分稀少
8 其他 指上述地类以外的其他类型的土地

第二, 特征选择。主要分为光谱特征、指数特征和纹理特征, 其中光谱特征为影像数据的波段信息;指数特征除了归一化水体指数(NDWI)和归一化植被指数(NDVI)外, 增加了土壤调节植被指数(SAVI), 其目的是去除稀疏植被区(特别是戈壁)背景土壤亮度较高的影响, 三者的计算公式如下:

(1)
(2)
(3)

式中, NIR、Red和Green分别为近红外、红光和绿光波段的光谱值;L为植被密度参数。纹理特征是基于SAR数据(Sentinel-1A)形成的七种, 分别为差异性、对比度、方差、角二阶矩、逆差矩、熵和相关性, 示意图如图 3所示。

图 3 SAR影像的7种纹理特征示意图 Fig. 3 The seven texture features of SAR image SAR:合成孔径雷达Synthetic Aperture Radar

第三, 超像素分割。SNIC算法是将影像转化为CIELAB颜色空间的五维特征向量, 表征空间距离, 即位置信息XY的两维数据;表征颜色距离, 即色彩信息的三维数据, 最后基于这五维特征向量建立距离度量标准, 进而对图像进行局部聚类的过程。算法的实现过程主要有四步:生成种子点;种子点优化;最优距离的求解;优先队列算法像元聚类。其中最优距离的求解如公式4—6所示, 优先队列算法则是基于K个种子点建立K个元素ei={xi, yi, li, ai, bi, k, Di, k}, 这K个元素建立最原始的优先队列Q, 然后Q每次返回队列中到第k个种子点的距离Di, k最小的元素ei, 这样可以将多次迭代优化成一次迭代, 极大地提高运行效率。

(4)
(5)
(6)

式中, DsDcD分别代表颜色距离、空间距离和最优距离, sm为颜色距离和空间距离的归一化参数。

原有SNIC算法将空间距离和颜色距离作为同等重要参数进行计算, 更易形成较为规则的分割图像, 这样在稀疏植被区土壤和植被的交界处, 高亮的背景土壤会淹没稀疏植被本身的光谱信息, 造成影像分割误差。因此, 本研究在原有算法后增加第五步, 惩罚性机制和连通性检查。即对于某个属于种子点a的像元jk, 假设它的空间距离参数属于种子点a, 而颜色距离参数属于种子点b, 且满足下面公式:

(7)

式中, DaDb分别为jk属于种子点a和种子点b的类内距离, ε1ε2为最大类内距离。经连通性检查, 如果像元jk与种子点b的类内像元相连接, 那么该像元jk将被标签为种子点b的类内元素。

第四, 影像分类。运用CNN算法挖掘深层特征, 支持向量机(Support Vector Machine, SVM)进行精确分类, 分类过程如图 4所示。CNN算法通过两次卷积, 两次采样和一次全连接算法, 获得卷积层权重参数, 将一维特征影像转换成256维。假设在CNN的卷积层中, 输入的一维特征向量表示为xk-1, 则其经过卷积计算加上偏置参数的非线性变换, 输出特征向量为xk, 计算过程可以表示为:

(8)
图 4 CNN-SVM算法分类过程示意图 Fig. 4 The classification process of CNN+SVM algorithm CNN:卷积神经网络convolutional neural networks;SVM:支持向量机support vector machine

式中, wkbk表示卷积层k的卷积核参数(5×5)和偏置参数;*表示卷积计算符号, f()表示激活函数, 本研究采用ReLU函数fx=max (0, x)进行非线性计算。

第五, 精度评价。采用混淆矩阵(Confusion matrix), 包括生产者精度(Producer accuracy)、用户者精度(User accuracy)、总体精度(Overall accuracy)和Kappa系数(Kappa coefficient)。

3 结果与分析 3.1 超像素分割结果

为了呈现超像素分割过程优化效果, 选取浑善达克沙地腹地部分区域, 对比了原始影像、SNIC算法优化前后的分割结果(图 5)。结果显示, 优化的SNIC算法在地类内部分割效果与未优化前相比, 变化不大。但在不同地类间, 特别是在稀疏植被和沙化土地类别的边界(图 5的红圈部分)区域, 原有算法区分度不够, 在多个位置的地类界限具有明显的混杂现象, 而优化算法有效解决了这一问题, 使分割效果更加清晰, 能够准确细致地对稀疏植被和沙化土地的边界进行刻画, 有利于稀疏植被和沙化土地信息的区分。

图 5 SNIC算法优化前后的影像分割对比 Fig. 5 Comparison of image segmentation before and after SNIC algorithm optimization SNIC:简单非迭代聚类Simple non-iterative clustering

整体而言, 对于整个工程区中诸如沙地和草地、沙地和戈壁、草地和灌木林地、草地和森林等易混分的土地覆盖类型, 优化算法的遥感信息提取能力更强, 分割效果更好, 特别是各易混类别的边界区分度更高, 这样更有利于下一步影像分类, 进而提升最终的信息提取精度。

3.2 分类精度评价

优化前后SCS分类结果的混淆矩阵分别如表 3表 4所示。结果表明, 基于原有SCS模型的工程区典型土地利用/土地覆盖的分类识别总体精度为78.24%, Kappa系数为0.7452, 而经过优化, 模型的总体分类精度显著提高, 达到89.41%, Kappa系数为0.8760, 总体提高了11.17%, Kappa系数提高了0.1308。其中对于工程区面积最大的两种土地利用/土地覆盖类型——草地和沙地, 两者的用户者精度分别提高了14%和9%。综合整体分类精度和典型地类单一识别精度结果发现, 本研究提出的SCS模型优化方案能够有效提高稀疏植被区域的植被与沙地信息提取精度, 能够满足大区域尺度对稀疏植被区生态效应、环境变化和人类活动等深入研究的需要。

表 3 2020年原有模型土地覆盖分类结果混淆矩阵 Table 3 The confusion matrix of the original model land cover classification results in 2020
戈壁
Gobi
乔木林
Arbor
灌木林
Shrubland
草地
Grass
耕地
Arable land
水体
Water
沙地
Sand
其他
Others
总计
Sum
戈壁Gobi 10 4 2 16
乔木林arbor 15 3 2 20
灌木林Shrubland 1 18 3 1 23
草地Grass 2 2 27 2 2 35
耕地Arable land 1 2 14 2 19
水体Water 12 12
沙地Sand 1 2 1 1 27 1 33
其他Others 1 1 10 12
总计Sum 11 18 25 36 18 13 36 13 170
生产者精度
Producer accuracy
0.91 0.83 0.72 0.75 0.78 0.92 0.75 0.77
用户者精度
User accuracy
0.63 0.75 0.78 0.77 0.74 1.00 0.82 0.83
总体精度
Overall accuracy
0.7824
Kappa系数
Kappa coefficient
0.7452

表 4 2020年优化模型土地覆盖分类结果混淆矩阵 Table 4 The confusion marix of the optimized model land cover classification results in 2020
戈壁
Gobi
乔木林
Arbor
灌木林
Shrubland
草地
Grass
耕地
Arable land
水体
Water
沙地
Sand
其他
Others
总计
Sum
戈壁Gobi 12 4 16
乔木林arbor 16 1 17
灌木林Shrubland 1 20 2 1 24
草地Grass 1 32 2 35
耕地Arable land 2 17 19
水体Water 12 12
沙地Sand 1 1 31 1 34
其他Others 1 12 13
总计Sum 12 18 21 37 20 13 36 13 170
生产者精度
Producer accuracy
1.00 0.89 0.95 0.86 0.85 0.92 0.86 0.92
用户者精度
User accuracy
0.75 0.94 0.83 0.91 0.89 1.00 0.91 0.92
总体精度
Overall accuracy
0.8941
Kappa系数
Kappa coefficient
0.8760
3.3 2020年工程区典型土地利用/土地覆盖空间分布

采用优化的SCS模型, 获得了2020年工程区典型土地利用/土地覆盖的空间分布情况(图 6)。结果表明, 总体上, 研究区多以草地、林地和沙地为主, 其中草地面积最大, 占研究区总面积的51.52%, 广布于研究区的大部, 东北部的乌珠穆沁草原区域是最重要的分布范围;林地范围次之, 乔木林和灌木林分别占研究区总面积的19.55%和7.23%, 分布范围上来说主要位于河北省北部和内蒙古锡林郭勒盟南部以及零星分布于沙地和草地周边;沙地则主要集中于一个沙漠三个沙地区域(库布齐沙漠、毛乌素沙地、浑善达克沙地和科尔沁沙地), 总面积占研究区总面积的11.96%;耕地主要分布于黄河沿岸和北京市、天津市以及河北山西的平原上, 约占研究区总面积的1.54%;戈壁则在研究区的西北部乌拉特后旗, 约占研究区总面积的5.20%。稀疏植被覆盖(草地、沙地、戈壁)区域面积占比约为68.68%, 研究区大部分区域属于脆弱生态区。

图 6 研究区2020年土地利用/土地覆盖类型分布 Fig. 6 The distribution of land use/land cover types in 2020
3.4 近20年工程区典型土地利用/土地覆盖类型空间变化格局

自2000年以来, 研究区相继实施了退耕还林还草工程、野生动植物保护及自然保护区建设工程、天然林保护工程、京津风沙源治理工程等生态保护重大工程[38], 在森林面积增加, 沙化土地减少, 区域经济发展等方面取得了丰硕的成果, 充分发挥了生态修复和改善, 维护国家生态安全等方面的重要作用。由于京津风沙源治理工程(一期)实施时间为(2001—2010年), 二期工程实施时间为(2013—2022年), 因此本研究选择2000年和2010年作为对比时间节点, 深入分析近20年京津风沙源治理二期工程区土地利用/土地覆盖类型变化情况。图 7所示为2000年和2010年土地利用/土地覆盖类型分布, 图 8所示为近20年工程区典型土地利用/土地覆盖类型的变化情况。结果表明, 整体上, 近20年来乔木林、灌木林和草地的面积增加最多, 其中, 乔木林占研究区的比例由2000年的10.17%增加到2010年的19.22%, 再到2020年的19.55%, 增加了9.38%;灌木林的面积则从1.43%(2000年)增加到6.65%(2010年)再到2020年的7.23%, 增加了5.79%;草地的面积由46.05%(2000年)下降到44.26%(2010年)再增加到51.52%(2020年), 增加了5.47%。与之相应的是, 耕地和沙地的面积明显减少, 两者占工程区总面积的比例分别由2000年的13.33%和16.54%, 减少到2020年2.43%和11.96%, 分别减少了10.89%和4.58%。

图 7 研究区2000年和2010年土地利用/土地覆盖类型分布 Fig. 7 The distribution of land use/land cover types in 2000 and 2010

图 8 研究区2000—2020年土地利用/土地覆盖类型变化统计 Fig. 8 The statistics of land use/land cover changes in the study area from 2000 to 2020

在自然条件下, 土地覆盖类型的变化是量变到质变的过程。植被逐步退化最终变为荒地或沙地, 而沙化土地随着植被的逐步改善, 最终变为草原或灌木林[39]。因此, 本研究进一步从乔灌草植被覆盖区和沙化土地两方面的相互转化情况来反映近20年来工程区的实施效果。变化情况如图 9所示。从2000年到2020年, 位于浑善达克沙地、毛乌素沙地和科尔沁沙地的腹地的沙化土地相对稳定, 而沙地边缘植被恢复明显, 特别是杭锦旗、达尔罕茂明安联合旗等沙地边缘地带, 沙地转换区域中的86.45%转换为乔灌草植被覆盖区;由其他土地利用/土地覆盖类型转为沙地的区域主要集中在锡林郭勒盟的苏尼特左旗和苏尼特右旗等地, 转换为沙地的区域中76.14%来自于原有乔灌草植被类型覆盖区。植被方面, 乔灌草土地覆盖类型不变区域主要位于研究区北部和东部大部分区域;乔灌草土地覆盖类型减少区域主要位于浑善达克沙地和科尔沁沙地边缘地带, 减少区域中的33.41%转换成沙化土地;乔灌草土地覆盖类型增加区域主要位于毛乌素沙地、库布齐沙漠区域, 增加区域的25.62%来源于沙化土地。总体来说, 京津风沙源治理工程实施的十多年时间内, 沙化土地面积大幅度降低, 乔灌草总面积大幅度上升, 土地退化的趋势得到遏制, 草地质量和生态环境改善明显, 表明研究区植被状况不断改善, 实施的各项生态工程作用显著, 能够更有效地服务于多维度生态功能的发挥和评价。

图 9 2000—2020年研究区植被类型(乔灌草) 和沙化土地变化分布 Fig. 9 The change distribution of vegetation types (arbor, shrub, grass) and desertification land in the study area from 2000 to 2020
4 讨论

前人的研究结果[4041]表明, 京津风沙源治理工程区土地利用/土地覆盖变化在2000—2010年主要表现为沙地、耕地和林地的增加, 草地的减少, 2010—2018年则表现为耕地、沙地的减少, 草地和林地的增加, 恢复区域中以鄂尔多斯高原、浑善达克沙地和科尔沁沙地为主, 这些结论都基本与本研究获得的结果一致。只是部分认为2018年研究区内草地的分布占比为55.25%, 略高于本研究51.52%(2020年)而沙地的占比略低。可能的原因是本研究利用SAR数据(Sentinel-1A)的穿透能力, 将研究区内表层具有稀疏植被, 但土壤为沙砾的土地覆盖类型划分为沙化土地, 一定程度上减少了草地占比而增加了沙地占比, 但本研究的提取结果能够更准确地表征沙化土地, 具有更强的科学性和实际意义。

全球尺度方面, 根据与刘良云、宫鹏和陈军等人研究的结果[1013]对比来看, 在各类别的区域分布上与本研究的结果基本一致, 但因三人的研究成果均基于全球尺度, 在区域尺度上并未细致研究各类别的特异性特征, 因此也缺乏对京津风沙源区域复杂的植被土壤环境的深入研究, 易出现植被和沙化土地错分的情况, 特别是在稀疏植被覆盖的沙化土地区域, 而本研究在该方面有较为明显的改善。

由于大尺度、长时间序列工程措施生态效应评价的需要, 本研究采用的超像素分割算法一方面可以增加像元分类中缺少的对象信息, 另外一方面又减少面向对象分割中最优尺度等人工参与, 实现稀疏植被区沙化土地类型识别和土地覆盖分类的自动化、全流程的快速提取, 以SAR数据表征沙化土地为基础的机器学习方法能够更加细致刻画稀疏植被区中沙化土地和稀疏植被的边界。但由于验证样本不足, 本研究在部分区域的精度还需进一步进行论证, 特别是本研究主要聚焦于稀疏植被和沙化土地等自然地表类型, 对于建筑物、道路等人工地表类型的识别能力还需深入研究。此外, 可以拓展研究该区域外非工程区土地覆盖类型的变化, 从而与本研究的结果进行对比分析, 进一步论证生态工程措施的积极作用。下一步, 通过融合更多时序信息、专题信息等对研究区的土地利用/土地覆盖类型进行更深入的分析, 进一步提高该区域的遥感识别精度。

5 结论

本研究以典型大尺度稀疏植被区——京津风沙源治理二期工程区为研究区, 通过构建惩罚性机制优化超像素分割算法, 研建了SCS模型方案, 实现了研究区典型林草沙要素信息提取和主要土地利用/土地覆盖识别。研究结果表明:

1) 引入惩罚性机制优化后的SNIC分割算法, 有效提升了稀疏植被区与沙地区的边界区分度, 有助于分类精度的提升;

2) 基于改进SNIC-CNN-SVM模型方案的研究区总体分类精度达89.41%, 较优化前提高了11.17%, 特别是针对草地和沙地这两种工程区核心类型的识别精度分别提高了14%和9%, 表明该模型具有较好的沙化土地和稀疏植被识别能力, 该优化方案在以研究区为代表的稀疏植被区域分类中具有较好的应用效果和推广价值;

3) 2020年工程区中以草地面积最大, 占研究区总面积的51.52%;沙地主要集中于一个沙漠三个沙地区域(库布齐沙漠、毛乌素沙地、浑善达克沙地和科尔沁沙地), 总面积占工程区总面积的11.96%;稀疏植被覆盖(草地、沙地、戈壁)区域面积占比约为68.68%, 表明工程区处在林地-稀疏植被-沙地的过渡地带, 生态环境保护压力与防沙治沙形势依然严峻。

4) 通过对比近20年来的典型土地利用/土地覆盖类型空间分布格局发现, 乔灌草等植被增加面积约占工程区20.64%, 主要由沙化土地转化, 沙化土地减少面积约占研究区的4.58%, 沙地减少的区域中86.45%转换为乔灌草等植被类型。植被覆盖范围增加, 质量提升, 沙化土地面积降低, 特别是在毛乌素沙地和库布齐沙漠等区域改善效果突出, 表明经过20余年的治理, 研究区土地退化趋势得到遏制, 草地质量和生态环境改善明显, 实施的各项生态工程作用显著, 能够更有效地服务于多维度生态服务功能的发挥。该研究以期能够为京津风沙源二期工程区的生态系统演变规律研究及生态工程评价等工作提供重要科学支撑。

参考文献
[1]
张磊, 吴炳方, 李晓松, 邢强. 基于碳收支的中国土地覆被分类系统. 生态学报, 2014, 34(24): 7158-7166.
[2]
Zhang C, Harrison P A, Pan X, Li H P, Sargent I, Atkinson P M. Scale Sequence Joint Deep Learning (SS-JDL) for land use and land cover classification. Remote Sensing of Environment, 2020, 237: 111593. DOI:10.1016/j.rse.2019.111593
[3]
刘立平, 刘良旭, 连杰, 卢建男, 王国林. 河套绿洲土地覆盖类型变化特征及驱动因素. 中国沙漠, 2021, 41(5): 210-218.
[4]
Li X M, Wang Y, Li J F, Lei B. Physical and socioeconomic driving forces of land-use and land-cover changes: a case study of Wuhan City, China. Discrete Dynamics in Nature and Society, 2016, 2016: 8061069.
[5]
Talukdar S, Singha P, Mahato S, Shahfahad, Pal S, Liou Y A, Rahman A. Land-use land-cover classification by machine learning classifiers for satellite observations-A review. Remote Sensing, 2020, 12(7): 1135. DOI:10.3390/rs12071135
[6]
戚丽萍, 闫丹丹, 李静泰, 么秀颖, 薛媛媛, 栾兆擎. 江苏省生态系统服务价值对土地利用/土地覆盖变化的动态响应. 北京师范大学学报: 自然科学版, 2021, 57(2): 255-264.
[7]
Vali A, Comai S, Matteucci M. Deep learning for land use and land cover classification based on hyperspectral and multispectral earth observation data: a review. Remote Sensing, 2020, 12(15): 2495. DOI:10.3390/rs12152495
[8]
刘硕珣. 遥感图像土地覆盖类型识别研究[D]. 西安: 西安电子科技大学, 2020.
[9]
Pan S Y, Guan H Y, Chen Y T, Yu Y T, Nunes Gonçalves W, Marcato J Jr, Li J. Land-cover classification of multispectral LiDAR data using CNN with optimized hyper-parameters. ISPRS Journal of Photogrammetry and Remote Sensing, 2020, 166: 241-254. DOI:10.1016/j.isprsjprs.2020.05.022
[10]
Zhang X, Liu L Y, Chen X D, Gao Y, Xie S, Mi J. GLC_FCS30:global land-cover product with fine classification system at 30 m using time-series Landsat imagery. Earth System Science Data, 2021, 13(6): 2753-2776. DOI:10.5194/essd-13-2753-2021
[11]
Gong P, Wang J, Yu L, Zhao Y C, Zhao Y Y, Liang L, Niu Z G, Huang X M, Fu H H, Liu S, Li C C, Li X Y, Fu W, Liu C X, Xu Y, Wang X Y, Cheng Q, Hu L Y, Yao W B, Zhang H, Zhu P, Zhao Z Y, Zhang H Y, Zheng Y M, Ji L Y, Zhang Y W, Chen H, Yan A, Guo J H, Yu L, Wang L, Liu X J, Shi T T, Zhu M H, Chen Y L, Yang G W, Tang P, Xu B, Giri C, Clinton N, Zhu Z L, Chen J, Chen J. Finer resolution observation and monitoring of global land cover: first mapping results with Landsat TM and ETM+ data. International Journal of Remote Sensing, 2013, 34(7): 2607-2654. DOI:10.1080/01431161.2012.748992
[12]
Gong P, Liu H, Zhang M N, Li C C, Wang J, Huang H B, Clinton N, Ji L Y, Li W Y, Bai Y Q, Chen B, Xu B, Zhu Z L, Yuan C, Ping Suen H, Guo J, Xu N, Li W J, Song L C. Stable classification with limited sample: transferring a 30-m resolution sample set collected in 2015 to mapping 10-m resolution global land cover in 2017. Science Bulletin, 2019, 64(6): 370-373. DOI:10.1016/j.scib.2019.03.002
[13]
Jun C, Ban Y F, Li S N. Open access to Earth land-cover map. Nature, 2014, 514(7523): 434.
[14]
Arino O, Gross D, Ranera F, Leroy M, Bicheron P, Brockman C, Defourny P, Vancutsem C, Achard F, Durieux L, Bourg L, Latham J, di Gregorio A, Witt R, Herold M, Sambale J, Plummer S, Weber J L. GlobCover: ESA service for global land cover from MERIS. 2007 IEEE International Geoscience and Remote Sensing Symposium. July 23-28, 2007, Barcelona, Spain. IEEE, 2007: 2412-2415.
[15]
Kosztra B, Büttner G, Hazeu G, Arnold S. Updated CLC Illustrated Nomenclature Guidelines; European Topic Centre on Urban, Land and Soil Systems, 2019.
[16]
Herold M, Gregorio A D. Evaluating land-cover legends using the UN Land-Cover Classification System. CRC Press, 2012.
[17]
吕利利. 基于光谱微分法的荒漠稀疏植被提取及变化分析——以疏勒河流域走廊平原地区为例[D]. 兰州: 兰州大学, 2018.
[18]
McGwire K, Minor T, Fenstermaker L. Hyperspectral mixture modeling for quantifying sparse vegetation cover in arid environments. Remote Sensing of Environment, 2000, 72(3): 360-374. DOI:10.1016/S0034-4257(99)00112-1
[19]
宫鹏, 张伟, 俞乐, 李丛丛, 王杰, 梁璐, 李雪草, 计璐艳, 白玉琪. 全球地表覆盖制图研究新范式. 遥感学报, 2016, 20(5): 1002-1016.
[20]
Guillevic P C, Bork-Unkelbach A, Göttsche F M, Hulley G, Gastellu-Etchegorry J P, Olesen F S, Privette J L. Directional viewing effects on satellite land surface temperature products over sparse vegetation canopies-A multisensor analysis. IEEE Geoscience and Remote Sensing Letters, 2013, 10(6): 1464-1468. DOI:10.1109/LGRS.2013.2260319
[21]
Defourny P, Schouten L, Bartalev S, Bontemps S, Bogaert E, Arino O. Accuracy assessment of a 300 m global land cover map: the GlobCover experience. new library world, 2009.
[22]
Christoulas G, Tsagaris V, Anastassopoulos V. Textural characterization from various representations of MERIS data. International Journal of Remote Sensing, 2007, 28(3/4): 675-692.
[23]
张裕, 杨海涛, 袁春慧. 遥感图像分类方法综述. 兵器装备工程学报, 2018, 39(8): 108-112. DOI:10.11809/bqzbgcxb2018.08.023
[24]
赵英时. 遥感应用分析原理与方法. 北京: 科学出版社, 2003.
[25]
Li M, Zang S Y, Zhang B, Li S S, Wu C S. A review of remote sensing image classification techniques: the role of spatio-contextual information. European Journal of Remote Sensing, 2014, 47(1): 389-411. DOI:10.5721/EuJRS20144723
[26]
Vincent L, Soille P. Watersheds in digital spaces: an efficient algorithm based on immersion simulations. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1991, 13(6): 583-598. DOI:10.1109/34.87344
[27]
Comaniciu D, Meer P. Mean shift: a robust approach toward feature space analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(5): 603-619. DOI:10.1109/34.1000236
[28]
Feng T J, Ma H R, Cheng X W, Zhang H P. Calculation of the optimal segmentation scale in object-based multiresolution segmentation based on the scene complexity of high-resolution remote sensing images. Journal of Applied Remote Sensing, 2018, 12: 025006.
[29]
Zhao Y D, Zhang L P, Li P X, Huang B. Classification of high spatial resolution imagery using improved Gaussian Markov random-field-based texture features. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(5): 1458-1468. DOI:10.1109/TGRS.2007.892602
[30]
Gu H Y, Li H T, Yan L, Liu Z J, Blaschke T, Soergel U. An object-based semantic classification method for high resolution remote sensing imagery using ontology. Remote Sensing, 2017, 9(4): 329. DOI:10.3390/rs9040329
[31]
Han J W, Zhang D W, Cheng G, Guo L, Ren J C. Object detection in optical remote sensing images based on weakly supervised learning and high-level feature learning. IEEE Transactions on Geoscience and Remote Sensing, 2015, 53(6): 3325-3337. DOI:10.1109/TGRS.2014.2374218
[32]
吴江, 刘春晓. 具有纹理感知能力的超像素分割方法. 中国图象图形学报, 2021, 26(5): 1006-1016.
[33]
Wang W, Xiang D L, Ban Y F, Zhang J, Wan J W. Superpixel segmentation of polarimetric SAR images based on integrated distance measure and entropy rate method. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 10(9): 4045-4058. DOI:10.1109/JSTARS.2017.2708418
[34]
Lindsay G W. Convolutional neural networks as a model of the visual system: past, present, and future. Journal of Cognitive Neuroscience, 2021, 33(10): 2017-2031. DOI:10.1162/jocn_a_01544
[35]
Zhou D X. Theory of deep convolutional neural networks: Downsampling. Neural Networks, 2020, 124: 319-327. DOI:10.1016/j.neunet.2020.01.018
[36]
马俊明. 基于GIS的京津风沙源林业工程监测与评价系统[D]. 北京: 北京林业大学, 2019.
[37]
刘笑冰, 李宇佳, 刘芳. 基于生态文明视角的造林工程成本核算研究——以北京市京津风沙源治理二期工程为例. 林业经济, 2019, 41(3): 119-124.
[38]
耿国彪. 砥砺20年绿满京津风沙源. 绿色中国, 2020(19): 14-21.
[39]
Huang J P, Zhang G L, Zhang Y T, Guan X D, Wei Y, Guo R X. Global desertification vulnerability to climate change and human activities. Land Degradation & Development, 2020, 31(11): 1380-1391.
[40]
雷燕慧, 丁国栋, 李梓萌, 迟文峰, 高广磊, 赵媛媛. 京津风沙源治理工程区土地利用/覆盖变化及生态系统服务价值响应. 中国沙漠, 2021, 41(6): 29-40.
[41]
迟文峰, 匡文慧, 贾静, 刘正佳. 京津风沙源治理工程区LUCC及土壤风蚀强度动态遥感监测研究. 遥感技术与应用, 2018, 33(5): 965-974.