生态学报  2014, Vol. 34 Issue (24): 7202-7209

文章信息

苑全治, 吴炳方, 张磊, 李晓松, 曾源
YUAN Quanzhi, WU Bingfang, ZHANG Lei, LI Xiaosong, ZENG Yuan
辅助数据在面向对象分类方法中的应用——以密云水库上游为例
Application of auxiliary data in the object-based classification method: a case study on the Miyun Reservoir area
生态学报, 2014, 34(24): 7202-7209
Acta Ecologica Sinica, 2014, 34(24): 7202-7209
http://dx.doi.org/10.5846/stxb201310102433

文章历史

收稿日期:2013-10-10
修订日期:2014-10-23
辅助数据在面向对象分类方法中的应用——以密云水库上游为例
苑全治, 吴炳方 , 张磊, 李晓松, 曾源    
中国科学院遥感与数字地球研究所数字地球重点实验室, 北京 100094
摘要:密云水库上游位于华北平原向蒙古高原的过渡带内,自然条件差异大,人类活动对该区域影响显著.因此,对该地区土地覆盖类型遥感监测方法的研究具有典型的指导意义.基于高分辨率遥感影像,着重探讨辅助数据在面向对象分类方法中的应用,对密云水库上游地区的土地覆盖进行分类提取.结果显示,研究区内共包含26类土地覆盖类型,其中落叶阔叶灌木林、落叶阔叶林、草丛以及旱地,这4种类型的面积占总面积的85%,是全区的主要土地覆盖类型.在分类时,采用多源异构辅助数据,研究了北方山区常绿针叶林、旱地等土地覆盖类型的识别方法,有效降低了"同物异谱"和"同谱异物"现象对分类精度的影响.
关键词面向对象    土地覆盖    密云水库上游    高分辨率    辅助数据    
Application of auxiliary data in the object-based classification method: a case study on the Miyun Reservoir area
YUAN Quanzhi, WU Bingfang , ZHANG Lei, LI Xiaosong, ZENG Yuan    
Key Laboratory of Digital Earth Science, Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100094, China
Abstract:The Miyun Reservoir area between the North China plain and the Mongolian plateau has various physical conditions and intensity of human disturbance. Thus, studying the method of monitoring the land cover of this area is important. On the basis of high-resolution remote sensing imagery, this article classified the land cover of the Miyun reservoir area and studied the application of auxiliary data in object-based classification method. The remote sensing data used were mainly high spatial-resolution images, including RapidEye and SPOT-5. Accurate geometric rectification was performed initially. To gain more object features for distinguishing the different classes more clearly, we referenced the digital elevation model and slope gradient data with spatial resolution of 25m and the thematic map of the land use with a scale of 1 ∶ 10000. Multi-temporal HJ-1 imagery was added to separate the evergreen needle forests and the dry land. A total of 687 field samples were collected from the Miyun reservoir area for classification and precision testing. The eCognition v8.7 software was also used in this study. First, the images were segmented into different image objects according to the object features in the spectra, where several parameters are needed. In RapidEye, five bands with the same weight were used for segmentation. Choosing the segmentation scales and parameters of the shape and compactness is important. Through constant experiments, we found that the suitable segmentation scale was 45. The configuration of the shape parameter will determine the weight of the spectra in the segmentation. Given that the classification was mainly based on the spectral feature, we set the shape parameter to 0.1; correspondingly, the spectra parameter was set to 0.9. The shape features of the image object included compactness and smoothness, which were both set to 0.5 because of the complex shape of the land cover. The smoothness and compactness of the objects were almost equally important. We established the sample database after segmentation. Every sample was an image object in the data base and had object features of spectra, shape, and texture. Basing on the sample database, we trained these samples and used the supervised classifier supplied by eCognition to classify the land cover automatically. However, the software still had some uncertainty in recognizing similar objects with different spectra and different objects with similar spectra. We used numerous auxiliary datasets to modify the SVM classifier results. Results revealed 26 types of land cover in the study area; 85% of which are deciduous broad-leaved shrubs, deciduous broad-leaved forests, dry lands, and grasses. This study used two methods, namely, field validation and visual validation, in evaluating the product accuracy to ensure the objectivity and comprehensiveness of the accuracy evaluation. The result of the field validation accuracy was 85%, whereas that of the visual evaluation accuracy was 86%. This study distinguished the evergreen coniferous forest and cultivated land through numerous auxiliary data. Results proved that the auxiliary data were vital for improving classification accuracy of objects, especially similar objects with different spectra and different objects with similar spectra.
Key words: object-based method    land cover    Miyun Reservoir area    high spatial resolution    auxiliary data    

近年来,遥感影像的空间分辨率逐步提高,能够帮助人们在较小的空间尺度上观察陆地表层格局与变化,进行大比例尺遥感制图,为土地资源调查、土地利用\\土地覆盖变化、生态环境监测等提供更详实、时效性更强的数据源[1]。高分辨率遥感影像与中低分辨率遥感影像相比具有更加丰富的纹理和形状信息,而且数据量更大,若利用传统的基于像素的影像分类方法,则不能充分利用更为丰富的信息,显得效率不高,而且“椒盐”效应也更为明显,数据冗余增多[2]。面向对象的分类方法将遥感影像中特征近似的相邻像素归并为同一个基本分类单元——影像对象(Image object),除了光谱信息,高分辨率影像中地物的纹理、形状和空间关系信息也能在影像对象得以体现,分类效率更高,正广泛应用于高分辨率遥感影像分类中[3]。最近的研究中通过对最优分割尺度的确定[4]、分类特征的优化[5]以及分类器的选择[6]等方面进行研究,不断提高了面向对象分类方法的精度。面向对象的分类方法对于单一类型的提取精度较高,如道路[7]、水体[8]等,但在同一影像中同时提取多种土地覆盖类型时,该方法容易受“同物异谱、同谱异物”的影响,分类中仍然存在不确定性,需要借助多源异构数据,以提供的更为丰富的信息来辅助分类。因此,本文以密云水库上游地区的为例,采用高分辨率遥感影像,着重研究辅助数据在基于面向对象分类方法中的应用。

1 研究区概况

密云水库上游地区位于东经115°24′—117°35′,北纬40°19′—41°38′,面积约为1.54万km2(图 1)。该区位于欧亚大陆东部中纬度地区,属大陆性季风气候。气候条件区域差异显著,多年平均降水量自西向东由407 mm增加到797 mm,年均气温由南部的9.0—10.0 °C,向北部以1.0—2.5 °C递减。地貌类型包括中山、低山、丘陵和谷地,地势西北高,东南低,自然植被以落叶阔叶林和旱生灌丛草类为主,农作物主要品种为玉米、谷子、小麦、莜麦等。该区土地覆盖类型复杂多样,是由华北平原向蒙古高原过渡带内山区的代表,对该地区的土地覆盖类型遥感监测方法研究具有典型的指导意义。

图 1 密云水库上游地区位置示意图 Fig. 1 Location of Miyun reservoir area
2 数据 2.1 影像预处理

本文用到的高分辨率遥感影像包括2010年植被生长茂盛期(8—9月)的5景RapidEye(5 m)和2009年9月17日的1景SPOT5(全色2.5 m,多光谱5 m)。

遥感影像空间配准和正射纠正是进行土地覆盖信息提取的基础和前提。本文采用ERDAS IMAGINE 2010软件的Geometric Correction模块,通过人工选择控制点的方式来为影像重新定位,结合DEM中的影像高程信息,进行影像的几何精校正,误差可以控制在1—2个像元以内。

此外,本文收集了多源异构数据,如:DEM(25 m)、坡度(25 m)、2005年土地利用图(1 ∶ 10000)、春季、夏季和冬季的HJ-1影像作为辅助分类数据。

2.2 野外采样

野外采样工作要为土地覆盖遥感分类提供足够的训练样本,也可以使分类人员对当地主要土地覆盖类型及其所对应的遥感影像特征有感性的认识,是整个分类工作的重要基础。为了保证所观察到地物的准确性,采样基本上在公路两旁2 km视野范围内,借助GPS,在影像中确定采样点的位置,并对采样点属性进行描述和照相,野外采样点一般选在大片、类型单一的地块中心,在密云水库上游地区的野外采样路线总长约500 km,采样687个点,涉及到落叶阔叶林、落叶阔叶灌木林、旱地、草丛等研究区主要土地覆盖类型,以及常绿针叶林、居住地等常见土地覆盖类型。

3 方法 3.1 影像初分类

本文选择常用的SVM分类器,对影像进行初分类,通过影像分割、构建样本库、训练样本等步骤来实现。

影像分割是面向对象分类方法的核心和重要基础,决定分割结果质量的是影像分割中参数的设置。经过多次试验,本文采用45作为基准分割尺度,形状因子(Shape)权重设为0.1,相应的光谱因子(Spectra)权重为0.9。分割后的效果,经目视检验,基本接近影像分割时“对象间同质性最小,异质性最大”的要求。

样本库是所有样本的集合,它能够反应出研究区内主要土地覆盖类型的影像特征。为保证每个作业块内都有足够的样本,本文在野外样本的基础上,又参考植被图,土地利用图,Google Earth等相关资料和影像,通过目视判读,增加了部分样本。

在样本库基础上,选择合适的分类特征,利用SVM分类器训练样本,进行监督分类。但SVM的自动分类结果中仍然存在以下问题:①人工表面需要进一步细分;②林地中的针阔混交林光谱特征介于落叶阔叶林与常绿针叶林之间,而且会随着针阔混交的比例不同而发生变化,较难通过样本学习的方法进行识别;③耕地的光谱特征较为复杂,作物种类不同、种植和收割时间不同、作物种植密度以及种植方式不同均显示不同的特征,尤其坡耕地以及山谷中的耕地容易与林地、草地或者裸露地混淆;④水面需要进一步细分,主要是区分河流和湖泊、或者水库/坑塘。

3.2 辅助分类

基于单一遥感影像的土地覆盖分类,会受到“同谱异物”或者“异物同谱”的影响,使得对象特征相似的两类地物混分入同一类型(图 2a),或者将对象特征相差较大的同一地物误分为两类(图 2b),为此,需要借助多时相的遥感影像,通过地物在不同时段所反映出的不同对象特征来判断土地覆盖类型;或者参考土地利用图、植被图等专题地图、坡度图等辅助分类,以满足全国38类分类系统的需求。本章借助30m分辨率HJ-1多时相、土地利用专题图等对SVM的自动分类结果进行修正。

图 2 同谱异物和同物异谱现象 Fig. 2 Different objects with same spectrum and same objects with different spectrum 相同形状里的光谱特征相近,分类时易混淆

(1)常绿针叶林识别

北方山区的常绿植被一般为常绿针叶林,冬季或者初春时期,只有常绿植被会在遥感影像中反映出植被信息,NDVI较高。因此在该作业块内,本文收集了冬季的HJ-1影像,将NDVI大于0.1的区域设置为常绿针叶林。

(2)耕地识别

密云水库上游地区受到“退稻还旱”政策影响,耕地中不存在水田,只有旱地类型。北方地区的旱地在春季农作物还未播种或者刚播种还未出苗时,影像特征显示为裸地,而在夏季农作物正处在茂盛期,影像特征与林地较为相似。本文采用两景不同时期(春季和夏季)的HJ-1影像来识别研究区的耕地,从两景影像的对比中可以发现,耕地主要分布在春季影像中NIDVI较小而在夏季影像中较大的区域。本文将两幅影像NDVI比值大于2,且农作物茂盛期NDVI大于0.6的区域设置为耕地。

(3)针阔混交林识别

依据野外采样情况并参考历史文献资料,密云水库上游地区存在一部分针阔混交林。针阔混交林在遥感影像上的光谱特征与落叶阔叶林或者落叶阔叶灌木林相近,而且不同的针阔混杂比例所显示的光谱特征也不尽相同。但是,北方山区针阔混交林在其它植物落叶的季节中显示出常绿针叶林的特征,因此,本文把SVM分类器识别的落叶阔叶林和落叶阔叶灌木林,利用冬季HJ-1识别有常绿针叶林的类型,判别为针阔混交林。

(4)园地识别

园地是指种植以采集果、叶、根、干、茎、汁等为主的集约经营的多年乔木或灌木植被的土地。其自然属性是落叶阔叶林或者落叶阔叶灌木林,因此,从遥感影像中较难与二者区分,需要更多地依靠野外调查或者相关的专题地图,本研究参考了密云水库上游地区2005年的土地利用图,对园地进行标定。

(5)人工表面分类

人工表面分为居住地、采矿场、工业用地以及交通用地,其中工业用地包括独立工厂、大型工业园区以及服务设施,其影像特征与居住地相近,二者容易混淆。采矿场包括采石、河流采沙、采矿、采油等场地。采矿场的影像特征会因为矿物性质不同而变化,大多显示为裸露的土地。因此采矿场和工业用地主要依靠野外调查资料,以及土地利用专题地图。居住地和交通用地可以利用影像对象的形状指数进行识别,如长宽比(length/width)特征,在影像对象融合之后,设长宽比大于2的对象为道路,其余则为居住地。但多数山区道路宽度较窄,在影像分割时,容易受到道路两旁林地或者其他类型的影响,形成混合对象,误分成其它类型。本文利用土地利用专题图对居住地进行定位,并通过变化检测的方法,去除不属于居住地的部分,然后再检出居住地向外扩展的部分,形成新的居住地图斑。道路变化较小,基本沿用原来土地利用图中的道路类型,并可以通过目视判别的方法识别新增加的道路。

(6)水面的分类

水面在影像中较为容易辨别,但水面的进一步细分则较难通过计算机自动完成,如水库\\坑塘与湖泊的区分,本文借助了土地利用专题图中的水体分布,去除原来水体图斑中的非水体部分,如裸地、植被等,检出了现状中在原来水体中向外扩展的部分。但此方法会漏检新增加的水体,需要通过自动方法提取,再结合人工目视去筛选。

(7)草地的识别

草原和草丛为地带性植被。中国的草原,北起松辽平原和呼伦贝尔高原,呈连续的带状向西南延展,分布于松嫩平原、西辽河平原、内蒙古高原、鄂尔多斯高原、黄土高原和青藏高原。而草丛是指中生和旱中生多年生草本植物为主要建群种的植物群落,在大多数情况下,草丛是由森林、灌丛等群落,被破坏后形成的次生植被,是中国森林区域中荒山、荒地上的主要植被类型[9]。参考《中国植被区划图(1 ∶ 6 000 000)》,密云西部地区位于草原区,而中东部则位于草丛区,本文即按此界线把自动分类结果中的草地分解成草原和草丛两部分。此外,再参考《中华人民共和国植被图(1 ∶ 1 000 000)》,从草原和草丛中提取草甸类型。

(8)裸土识别

密云水库上游地区存在裸土类型,在影像上的特征与居住地十分接近,SVM分类器很难将二者分开。根据裸土类型大多位于山区且面积较小,而居住地则主要集中在地势较为平坦的区域这一特点,本文利用坡度和面积特征,识别大部分混入居住地的裸土类型。

3.3 产品验证

土地覆盖产品验证是分类后的必要步骤。通过野外实地调查进行验证,其结果最具可信性,但野外调查一般沿道路两边采样,样点在空间上分布往往不够均匀,且不能保证每个类型都能有足够的验证点,精度评价难免偏颇;道路两旁一般也是受人类活动影响较强的区域,景观较为破碎,分类难度相对大,精度要比整个研究区分类精度略低。鉴于上述论述,本文采用两种方式对分类结果进行验证。

(1)野外样点验证分类结果

通过直接对比野外验证点与分类结果,计算分类正确百分比,作为分类结果的精度。

式中,P1表示野外验证精度;r表示分类正确的点数;t为总的验证点数。

(2)目视判别类型精度

参考野外采样点、Google Earth等高分辨率遥感影像、历史土地覆盖数据、植被图等相关资料,目视判别分类结果中的错误分类比例,并评价类型精度;然后以各类型面积比例作为权重,乘以类型精度,累加后得到最后的分类精度;如果出现主要类型大面积明显错分则暂时不会评估分类精度,需要重新分类后再进行精度评价:

4 结果 4.1 分类结果

将各个作业块的分类进行合并,形成密云水库上游地区的最终分类结果(图 3)。

图 3 2010年密云水库上游地区土地覆盖 Fig. 3 2010 Land Cover of Miyun Reservoir Area

密云水库上游地区的土地覆盖类型主要包括落叶阔叶灌木林、落叶阔叶林、草丛以及旱地,这四种类型的面积占总面积的85%(图 4)。其中落叶阔叶灌木林的面积最大,是密云水库上游地区的最主要植被类型,多以灌草丛的形式存在,面积为7424.48 km2,占总面积的41.6%;落叶阔叶林占总面积的24.4%,主要分布在研究区的中东部;林地类型中,常绿针叶林也占较大比例,达4.9%,但分布的规律性不强。耕地面积1894.71 km2,由于受密云水库上游地区“稻改旱”政策影响,耕地全部为旱地,占整个研究区的11.9%,主要分布在水库周边滩地、沟谷以及山前平原区域。草地类型中草原主要分布在研究 区的西部,占3.1%,草丛则位于中部和东部,占7.1 %,草甸非地带性植被。

图 4 密云水库上游地区各类型土地覆盖统计 Fig. 4 Land cover statistics in Miyun Reservoir Area
4.2 产品精度

为了保证精度的可靠性和客观性,本文采用两种方法验证了分类结果精度:

(1) 采用野外采样点对分类结果的验证表明产品精度为85%。其中80%的错误集中在植被的分类上,主要包括旱地与落叶阔叶灌木林、落叶阔叶灌木林与落叶阔叶林、落叶阔叶灌木林与草丛的区分等。

(2) 采用目视判别,分类型评价精度如表 1,总体精度比野外采样点验证结果略高,精度为86%。

表 1 目视精度评价表 Table 1 Visual evaluation of product accuracy
类型 Type精度 Accuracy/%类型 Type精度Accuracy/%
落叶阔叶林Deciduous broadleaf forest80湖泊 Lake90
常绿针叶林Evergreen conifer forest85水库/坑塘 Reservoir/pool90
落叶针叶林 Deciduous conifer forest85河流 River80
针阔混交林 Mixed forest70运河/水渠 Cannel80
落叶阔叶灌木林 Deciduous broadleaf shrub80旱地 Dry land85
乔木园地 Tree plantation70居住地 Residence80
灌木园地 Shrub plantation70工业用地 Industrial land85
乔木绿地 Tree greenbelt70交通用地 Road 80
灌木绿地 Shrub greenbelt70采矿场 Mining land80
草甸 Meadow70稀疏草地 Sparse grass land80
草原 Steppe80裸岩 Bare Rock75
草丛 Grass land80裸土 Bare soil80
草本绿地 Grass greenbelt70沙漠/沙地 Sand70
总计 Total86
5 结论与存在的问题

面向对象的方法比传统的基于像素的分类效率更高,但在分类系统较为复杂的情况下,从单一时期的影像中能够得到的信息较为有限,分类时也会受到“同谱异物”或者“同物异谱”现象的较大影响,导致分类精度不高。最大程度的收集相关数据,增加信息量,来辅助分类,是提高产品精度的重要手段。本文基于面向对象的自动分类方法,采用高分辨率遥感影像,重点探讨了辅助数据在对2010年密云水库上游地区的土地覆盖进行分类提取中的应用。

5.1 结论

(1)利用多时相遥感数据辅助分类,可以有效的区分物候特征不同的植被类型。本文利用冬季的影像可以有效识别北方山区的常绿针叶林,避免与其它林地类型混分;北方地区旱地在茂盛期影像特征与林地相似,收割期又与裸土相近,所以只利用一期影像对旱地的分类往往不确定性较大,多期影像同时运用,就可以很好的识别旱地。

(2)历史土地覆盖专题图有助于“同谱异物”类型的识别。本文利用历史土地利用图对居民点和水体进行定位,并通过建立规则模拟建设用地扩张和水面变化过程,确定当前的居住地和水体边界,避免了其与裸土、阴影等类型的混淆;草原和草丛均为地带性植被,且光谱特征相近,从影像中很难将二者区分,植被图是能够很好的反映植被的地带性边界,本文借助植被图确定草丛和草原的大致界线。

在多源异构数据的辅助下,本文将密云水库上游地区的土地覆盖分成了26种类型,采用野外验证法得到的产品一级精度94%,二级精度85%;采用人工目视评价法得到的产品精度比野外验证法略高,一级精度96%,二级精度为86%。该产品精度可以满足生态环境评估的需求。

5.2 存在的问题

(1)本文在分类时,以作业块为基本工作单位。作业块主要是根据影像及辅助数据集的不同来划分的,数据集的不同会使相邻作业块分类结果不同,这就给分类后的接边工作造成困难,最终也会影响到分类精度。

(2)线性地物,尤其是宽度较小,光谱特征受到旁边地物影响的河流或者道路,分类时容易被误判成其它类型,仅通过自动分类很难使其连续,需要更多的人工辅助识别。

(3)本研究借助多时相的遥感影像来辅助识别耕地。但辅助数据层越多,对于数据空间配准的要求就越高;本研究虽然对所有参与分类的辅助数据做了几何精纠正处理,但仍不可避免会有偏差,数层数据空间位置偏差的累积也会对分类准确性造成一定影响。

参考文献
[1] Hu M C. An historical account of satellite remote sensing and its recent advance. Science of Surveying and Mapping, 2000, 25(1): 25-28.
[2] Lu D, Weng Q. A survey of image classification methods and techniques for improving classification performance. International Journal of Remote Sensing, 2007, 28(5): 823-870.
[3] Nussbaum S, Menz G. Object-Based Image Analysis and Treaty Verification New Approaches in Remote Sensing-Applied to Nuclear Facilities in Iran. Heidelberg: Springer and Verlag, 2008: 16-26.
[4] Yin R J, Shi R H, Li J Y. Automatic selection of optimal segmentation scale of high-resolution remote sensing images. Journal of Geo-Information Science, 2013, 15(6): 902-910.
[5] Wang H, Chen J S, Yu X M. Feature selection and its application in object-oriented classification. Journal of Remote Sensing, 2013, 17(4): 816-829.
[6] Li C G, Shao G F. Combination multi-classifier for object-oriented classification of forest cover. Journal of Nanjing Forestry University, 2010, 34(1): 73-79.
[7] Xu G C, Bi J T, Wang X X, Qu H J. An experiment of automatic road extraction from high-resolution remote sensing image, based on object-oriented technology. Remote Sensing Information, 2012, 2(2): 108-111.
[8] Sui X Z, Ruan R Z, Ma R H, Xia S. Information extraction of object-oriented multi-scale water bodies. Geospatial Information, 2012, 10(6): 72-75.
[9] Zhang X S. Vegetation Map of China and Its Geographic Pattern: Illustration of the Vegetation Map of the People's Republic China (1: 10 000 000). Beijing: Geographical Publishing House, 2007.
[4] 殷瑞娟, 施润和, 李镜尧. 一种高分辨率遥感影像的最优分割尺度自动选取方法. 地球信息科学学报, 2013, 15(6): 902-910.
[5] 王贺, 陈劲松, 余晓敏. 面向对象分类特征优化选取方法及其应用. 遥感学报, 2013, 17(4): 816-829.
[6] 李春干, 邵国凡. 面向对象森林分类的多分类器结合方法研究. 南京林业大学学报, 2010, 34(1): 73-79.
[7] 许高程, 毕建涛, 王星星, 屈鸿钧. 面向对象的高分辨率遥感影像道路自动提取实验. 遥感信息, 2012, 2(2): 108-111.
[8] 岁秀珍, 阮仁宗, 马荣华, 夏双. 面向对象的多尺度水体信息提取. 地理空间信息, 2012, 10(6): 72-75.
[9] 张新时. 中国植被及其地理格局: 中华人民共和国植被图(1: 1000000)说明书. 北京: 地质出版社, 2007.