文章信息
- 苑全治, 吴炳方, 张磊, 李晓松, 曾源
- YUAN Quanzhi, WU Bingfang, ZHANG Lei, LI Xiaosong, ZENG Yuan
- 辅助数据在面向对象分类方法中的应用——以密云水库上游为例
- Application of auxiliary data in the object-based classification method: a case study on the Miyun Reservoir area
- 生态学报, 2014, 34(24): 7202-7209
- Acta Ecologica Sinica, 2014, 34(24): 7202-7209
- http://dx.doi.org/10.5846/stxb201310102433
-
文章历史
- 收稿日期:2013-10-10
- 修订日期:2014-10-23
近年来,遥感影像的空间分辨率逐步提高,能够帮助人们在较小的空间尺度上观察陆地表层格局与变化,进行大比例尺遥感制图,为土地资源调查、土地利用\\土地覆盖变化、生态环境监测等提供更详实、时效性更强的数据源[1]。高分辨率遥感影像与中低分辨率遥感影像相比具有更加丰富的纹理和形状信息,而且数据量更大,若利用传统的基于像素的影像分类方法,则不能充分利用更为丰富的信息,显得效率不高,而且“椒盐”效应也更为明显,数据冗余增多[2]。面向对象的分类方法将遥感影像中特征近似的相邻像素归并为同一个基本分类单元——影像对象(Image object),除了光谱信息,高分辨率影像中地物的纹理、形状和空间关系信息也能在影像对象得以体现,分类效率更高,正广泛应用于高分辨率遥感影像分类中[3]。最近的研究中通过对最优分割尺度的确定[4]、分类特征的优化[5]以及分类器的选择[6]等方面进行研究,不断提高了面向对象分类方法的精度。面向对象的分类方法对于单一类型的提取精度较高,如道路[7]、水体[8]等,但在同一影像中同时提取多种土地覆盖类型时,该方法容易受“同物异谱、同谱异物”的影响,分类中仍然存在不确定性,需要借助多源异构数据,以提供的更为丰富的信息来辅助分类。因此,本文以密云水库上游地区的为例,采用高分辨率遥感影像,着重研究辅助数据在基于面向对象分类方法中的应用。
1 研究区概况密云水库上游地区位于东经115°24′—117°35′,北纬40°19′—41°38′,面积约为1.54万km2(图 1)。该区位于欧亚大陆东部中纬度地区,属大陆性季风气候。气候条件区域差异显著,多年平均降水量自西向东由407 mm增加到797 mm,年均气温由南部的9.0—10.0 °C,向北部以1.0—2.5 °C递减。地貌类型包括中山、低山、丘陵和谷地,地势西北高,东南低,自然植被以落叶阔叶林和旱生灌丛草类为主,农作物主要品种为玉米、谷子、小麦、莜麦等。该区土地覆盖类型复杂多样,是由华北平原向蒙古高原过渡带内山区的代表,对该地区的土地覆盖类型遥感监测方法研究具有典型的指导意义。
2 数据 2.1 影像预处理本文用到的高分辨率遥感影像包括2010年植被生长茂盛期(8—9月)的5景RapidEye(5 m)和2009年9月17日的1景SPOT5(全色2.5 m,多光谱5 m)。
遥感影像空间配准和正射纠正是进行土地覆盖信息提取的基础和前提。本文采用ERDAS IMAGINE 2010软件的Geometric Correction模块,通过人工选择控制点的方式来为影像重新定位,结合DEM中的影像高程信息,进行影像的几何精校正,误差可以控制在1—2个像元以内。
此外,本文收集了多源异构数据,如:DEM(25 m)、坡度(25 m)、2005年土地利用图(1 ∶ 10000)、春季、夏季和冬季的HJ-1影像作为辅助分类数据。
2.2 野外采样野外采样工作要为土地覆盖遥感分类提供足够的训练样本,也可以使分类人员对当地主要土地覆盖类型及其所对应的遥感影像特征有感性的认识,是整个分类工作的重要基础。为了保证所观察到地物的准确性,采样基本上在公路两旁2 km视野范围内,借助GPS,在影像中确定采样点的位置,并对采样点属性进行描述和照相,野外采样点一般选在大片、类型单一的地块中心,在密云水库上游地区的野外采样路线总长约500 km,采样687个点,涉及到落叶阔叶林、落叶阔叶灌木林、旱地、草丛等研究区主要土地覆盖类型,以及常绿针叶林、居住地等常见土地覆盖类型。
3 方法 3.1 影像初分类本文选择常用的SVM分类器,对影像进行初分类,通过影像分割、构建样本库、训练样本等步骤来实现。
影像分割是面向对象分类方法的核心和重要基础,决定分割结果质量的是影像分割中参数的设置。经过多次试验,本文采用45作为基准分割尺度,形状因子(Shape)权重设为0.1,相应的光谱因子(Spectra)权重为0.9。分割后的效果,经目视检验,基本接近影像分割时“对象间同质性最小,异质性最大”的要求。
样本库是所有样本的集合,它能够反应出研究区内主要土地覆盖类型的影像特征。为保证每个作业块内都有足够的样本,本文在野外样本的基础上,又参考植被图,土地利用图,Google Earth等相关资料和影像,通过目视判读,增加了部分样本。
在样本库基础上,选择合适的分类特征,利用SVM分类器训练样本,进行监督分类。但SVM的自动分类结果中仍然存在以下问题:①人工表面需要进一步细分;②林地中的针阔混交林光谱特征介于落叶阔叶林与常绿针叶林之间,而且会随着针阔混交的比例不同而发生变化,较难通过样本学习的方法进行识别;③耕地的光谱特征较为复杂,作物种类不同、种植和收割时间不同、作物种植密度以及种植方式不同均显示不同的特征,尤其坡耕地以及山谷中的耕地容易与林地、草地或者裸露地混淆;④水面需要进一步细分,主要是区分河流和湖泊、或者水库/坑塘。
3.2 辅助分类基于单一遥感影像的土地覆盖分类,会受到“同谱异物”或者“异物同谱”的影响,使得对象特征相似的两类地物混分入同一类型(图 2a),或者将对象特征相差较大的同一地物误分为两类(图 2b),为此,需要借助多时相的遥感影像,通过地物在不同时段所反映出的不同对象特征来判断土地覆盖类型;或者参考土地利用图、植被图等专题地图、坡度图等辅助分类,以满足全国38类分类系统的需求。本章借助30m分辨率HJ-1多时相、土地利用专题图等对SVM的自动分类结果进行修正。
(1)常绿针叶林识别
北方山区的常绿植被一般为常绿针叶林,冬季或者初春时期,只有常绿植被会在遥感影像中反映出植被信息,NDVI较高。因此在该作业块内,本文收集了冬季的HJ-1影像,将NDVI大于0.1的区域设置为常绿针叶林。
(2)耕地识别
密云水库上游地区受到“退稻还旱”政策影响,耕地中不存在水田,只有旱地类型。北方地区的旱地在春季农作物还未播种或者刚播种还未出苗时,影像特征显示为裸地,而在夏季农作物正处在茂盛期,影像特征与林地较为相似。本文采用两景不同时期(春季和夏季)的HJ-1影像来识别研究区的耕地,从两景影像的对比中可以发现,耕地主要分布在春季影像中NIDVI较小而在夏季影像中较大的区域。本文将两幅影像NDVI比值大于2,且农作物茂盛期NDVI大于0.6的区域设置为耕地。
(3)针阔混交林识别
依据野外采样情况并参考历史文献资料,密云水库上游地区存在一部分针阔混交林。针阔混交林在遥感影像上的光谱特征与落叶阔叶林或者落叶阔叶灌木林相近,而且不同的针阔混杂比例所显示的光谱特征也不尽相同。但是,北方山区针阔混交林在其它植物落叶的季节中显示出常绿针叶林的特征,因此,本文把SVM分类器识别的落叶阔叶林和落叶阔叶灌木林,利用冬季HJ-1识别有常绿针叶林的类型,判别为针阔混交林。
(4)园地识别
园地是指种植以采集果、叶、根、干、茎、汁等为主的集约经营的多年乔木或灌木植被的土地。其自然属性是落叶阔叶林或者落叶阔叶灌木林,因此,从遥感影像中较难与二者区分,需要更多地依靠野外调查或者相关的专题地图,本研究参考了密云水库上游地区2005年的土地利用图,对园地进行标定。
(5)人工表面分类
人工表面分为居住地、采矿场、工业用地以及交通用地,其中工业用地包括独立工厂、大型工业园区以及服务设施,其影像特征与居住地相近,二者容易混淆。采矿场包括采石、河流采沙、采矿、采油等场地。采矿场的影像特征会因为矿物性质不同而变化,大多显示为裸露的土地。因此采矿场和工业用地主要依靠野外调查资料,以及土地利用专题地图。居住地和交通用地可以利用影像对象的形状指数进行识别,如长宽比(length/width)特征,在影像对象融合之后,设长宽比大于2的对象为道路,其余则为居住地。但多数山区道路宽度较窄,在影像分割时,容易受到道路两旁林地或者其他类型的影响,形成混合对象,误分成其它类型。本文利用土地利用专题图对居住地进行定位,并通过变化检测的方法,去除不属于居住地的部分,然后再检出居住地向外扩展的部分,形成新的居住地图斑。道路变化较小,基本沿用原来土地利用图中的道路类型,并可以通过目视判别的方法识别新增加的道路。
(6)水面的分类
水面在影像中较为容易辨别,但水面的进一步细分则较难通过计算机自动完成,如水库\\坑塘与湖泊的区分,本文借助了土地利用专题图中的水体分布,去除原来水体图斑中的非水体部分,如裸地、植被等,检出了现状中在原来水体中向外扩展的部分。但此方法会漏检新增加的水体,需要通过自动方法提取,再结合人工目视去筛选。
(7)草地的识别
草原和草丛为地带性植被。中国的草原,北起松辽平原和呼伦贝尔高原,呈连续的带状向西南延展,分布于松嫩平原、西辽河平原、内蒙古高原、鄂尔多斯高原、黄土高原和青藏高原。而草丛是指中生和旱中生多年生草本植物为主要建群种的植物群落,在大多数情况下,草丛是由森林、灌丛等群落,被破坏后形成的次生植被,是中国森林区域中荒山、荒地上的主要植被类型[9]。参考《中国植被区划图(1 ∶ 6 000 000)》,密云西部地区位于草原区,而中东部则位于草丛区,本文即按此界线把自动分类结果中的草地分解成草原和草丛两部分。此外,再参考《中华人民共和国植被图(1 ∶ 1 000 000)》,从草原和草丛中提取草甸类型。
(8)裸土识别
密云水库上游地区存在裸土类型,在影像上的特征与居住地十分接近,SVM分类器很难将二者分开。根据裸土类型大多位于山区且面积较小,而居住地则主要集中在地势较为平坦的区域这一特点,本文利用坡度和面积特征,识别大部分混入居住地的裸土类型。
3.3 产品验证土地覆盖产品验证是分类后的必要步骤。通过野外实地调查进行验证,其结果最具可信性,但野外调查一般沿道路两边采样,样点在空间上分布往往不够均匀,且不能保证每个类型都能有足够的验证点,精度评价难免偏颇;道路两旁一般也是受人类活动影响较强的区域,景观较为破碎,分类难度相对大,精度要比整个研究区分类精度略低。鉴于上述论述,本文采用两种方式对分类结果进行验证。
(1)野外样点验证分类结果
通过直接对比野外验证点与分类结果,计算分类正确百分比,作为分类结果的精度。
式中,P1表示野外验证精度;r表示分类正确的点数;t为总的验证点数。
(2)目视判别类型精度
参考野外采样点、Google Earth等高分辨率遥感影像、历史土地覆盖数据、植被图等相关资料,目视判别分类结果中的错误分类比例,并评价类型精度;然后以各类型面积比例作为权重,乘以类型精度,累加后得到最后的分类精度;如果出现主要类型大面积明显错分则暂时不会评估分类精度,需要重新分类后再进行精度评价:
将各个作业块的分类进行合并,形成密云水库上游地区的最终分类结果(图 3)。
密云水库上游地区的土地覆盖类型主要包括落叶阔叶灌木林、落叶阔叶林、草丛以及旱地,这四种类型的面积占总面积的85%(图 4)。其中落叶阔叶灌木林的面积最大,是密云水库上游地区的最主要植被类型,多以灌草丛的形式存在,面积为7424.48 km2,占总面积的41.6%;落叶阔叶林占总面积的24.4%,主要分布在研究区的中东部;林地类型中,常绿针叶林也占较大比例,达4.9%,但分布的规律性不强。耕地面积1894.71 km2,由于受密云水库上游地区“稻改旱”政策影响,耕地全部为旱地,占整个研究区的11.9%,主要分布在水库周边滩地、沟谷以及山前平原区域。草地类型中草原主要分布在研究 区的西部,占3.1%,草丛则位于中部和东部,占7.1 %,草甸非地带性植被。
4.2 产品精度为了保证精度的可靠性和客观性,本文采用两种方法验证了分类结果精度:
(1) 采用野外采样点对分类结果的验证表明产品精度为85%。其中80%的错误集中在植被的分类上,主要包括旱地与落叶阔叶灌木林、落叶阔叶灌木林与落叶阔叶林、落叶阔叶灌木林与草丛的区分等。
(2) 采用目视判别,分类型评价精度如表 1,总体精度比野外采样点验证结果略高,精度为86%。
类型 Type | 精度 Accuracy/% | 类型 Type | 精度Accuracy/% |
落叶阔叶林Deciduous broadleaf forest | 80 | 湖泊 Lake | 90 |
常绿针叶林Evergreen conifer forest | 85 | 水库/坑塘 Reservoir/pool | 90 |
落叶针叶林 Deciduous conifer forest | 85 | 河流 River | 80 |
针阔混交林 Mixed forest | 70 | 运河/水渠 Cannel | 80 |
落叶阔叶灌木林 Deciduous broadleaf shrub | 80 | 旱地 Dry land | 85 |
乔木园地 Tree plantation | 70 | 居住地 Residence | 80 |
灌木园地 Shrub plantation | 70 | 工业用地 Industrial land | 85 |
乔木绿地 Tree greenbelt | 70 | 交通用地 Road | 80 |
灌木绿地 Shrub greenbelt | 70 | 采矿场 Mining land | 80 |
草甸 Meadow | 70 | 稀疏草地 Sparse grass land | 80 |
草原 Steppe | 80 | 裸岩 Bare Rock | 75 |
草丛 Grass land | 80 | 裸土 Bare soil | 80 |
草本绿地 Grass greenbelt | 70 | 沙漠/沙地 Sand | 70 |
总计 Total | 86 |
面向对象的方法比传统的基于像素的分类效率更高,但在分类系统较为复杂的情况下,从单一时期的影像中能够得到的信息较为有限,分类时也会受到“同谱异物”或者“同物异谱”现象的较大影响,导致分类精度不高。最大程度的收集相关数据,增加信息量,来辅助分类,是提高产品精度的重要手段。本文基于面向对象的自动分类方法,采用高分辨率遥感影像,重点探讨了辅助数据在对2010年密云水库上游地区的土地覆盖进行分类提取中的应用。
5.1 结论(1)利用多时相遥感数据辅助分类,可以有效的区分物候特征不同的植被类型。本文利用冬季的影像可以有效识别北方山区的常绿针叶林,避免与其它林地类型混分;北方地区旱地在茂盛期影像特征与林地相似,收割期又与裸土相近,所以只利用一期影像对旱地的分类往往不确定性较大,多期影像同时运用,就可以很好的识别旱地。
(2)历史土地覆盖专题图有助于“同谱异物”类型的识别。本文利用历史土地利用图对居民点和水体进行定位,并通过建立规则模拟建设用地扩张和水面变化过程,确定当前的居住地和水体边界,避免了其与裸土、阴影等类型的混淆;草原和草丛均为地带性植被,且光谱特征相近,从影像中很难将二者区分,植被图是能够很好的反映植被的地带性边界,本文借助植被图确定草丛和草原的大致界线。
在多源异构数据的辅助下,本文将密云水库上游地区的土地覆盖分成了26种类型,采用野外验证法得到的产品一级精度94%,二级精度85%;采用人工目视评价法得到的产品精度比野外验证法略高,一级精度96%,二级精度为86%。该产品精度可以满足生态环境评估的需求。
5.2 存在的问题(1)本文在分类时,以作业块为基本工作单位。作业块主要是根据影像及辅助数据集的不同来划分的,数据集的不同会使相邻作业块分类结果不同,这就给分类后的接边工作造成困难,最终也会影响到分类精度。
(2)线性地物,尤其是宽度较小,光谱特征受到旁边地物影响的河流或者道路,分类时容易被误判成其它类型,仅通过自动分类很难使其连续,需要更多的人工辅助识别。
(3)本研究借助多时相的遥感影像来辅助识别耕地。但辅助数据层越多,对于数据空间配准的要求就越高;本研究虽然对所有参与分类的辅助数据做了几何精纠正处理,但仍不可避免会有偏差,数层数据空间位置偏差的累积也会对分类准确性造成一定影响。
[1] | Hu M C. An historical account of satellite remote sensing and its recent advance. Science of Surveying and Mapping, 2000, 25(1): 25-28. |
[2] | Lu D, Weng Q. A survey of image classification methods and techniques for improving classification performance. International Journal of Remote Sensing, 2007, 28(5): 823-870. |
[3] | Nussbaum S, Menz G. Object-Based Image Analysis and Treaty Verification New Approaches in Remote Sensing-Applied to Nuclear Facilities in Iran. Heidelberg: Springer and Verlag, 2008: 16-26. |
[4] | Yin R J, Shi R H, Li J Y. Automatic selection of optimal segmentation scale of high-resolution remote sensing images. Journal of Geo-Information Science, 2013, 15(6): 902-910. |
[5] | Wang H, Chen J S, Yu X M. Feature selection and its application in object-oriented classification. Journal of Remote Sensing, 2013, 17(4): 816-829. |
[6] | Li C G, Shao G F. Combination multi-classifier for object-oriented classification of forest cover. Journal of Nanjing Forestry University, 2010, 34(1): 73-79. |
[7] | Xu G C, Bi J T, Wang X X, Qu H J. An experiment of automatic road extraction from high-resolution remote sensing image, based on object-oriented technology. Remote Sensing Information, 2012, 2(2): 108-111. |
[8] | Sui X Z, Ruan R Z, Ma R H, Xia S. Information extraction of object-oriented multi-scale water bodies. Geospatial Information, 2012, 10(6): 72-75. |
[9] | Zhang X S. Vegetation Map of China and Its Geographic Pattern: Illustration of the Vegetation Map of the People's Republic China (1: 10 000 000). Beijing: Geographical Publishing House, 2007. |
[4] | 殷瑞娟, 施润和, 李镜尧. 一种高分辨率遥感影像的最优分割尺度自动选取方法. 地球信息科学学报, 2013, 15(6): 902-910. |
[5] | 王贺, 陈劲松, 余晓敏. 面向对象分类特征优化选取方法及其应用. 遥感学报, 2013, 17(4): 816-829. |
[6] | 李春干, 邵国凡. 面向对象森林分类的多分类器结合方法研究. 南京林业大学学报, 2010, 34(1): 73-79. |
[7] | 许高程, 毕建涛, 王星星, 屈鸿钧. 面向对象的高分辨率遥感影像道路自动提取实验. 遥感信息, 2012, 2(2): 108-111. |
[8] | 岁秀珍, 阮仁宗, 马荣华, 夏双. 面向对象的多尺度水体信息提取. 地理空间信息, 2012, 10(6): 72-75. |
[9] | 张新时. 中国植被及其地理格局: 中华人民共和国植被图(1: 1000000)说明书. 北京: 地质出版社, 2007. |