基于多源国产高分辨率遥感影像的山区河流信息自动提取
薛源1, 覃超1, 吴保生1, 李丹2, 傅旭东1    
1. 清华大学 水沙科学与水利水电工程国家重点实验室, 北京 100084;
2. 中国煤炭科工集团有限公司 煤炭科学研究总院有限公司, 应急科学研究院, 北京 100013
摘要:高分辨率遥感影像地理信息是研究山区河流的重要数据源。针对山区地物类型复杂、河道狭窄等原因导致的河流表面信息提取完整性差、河宽难以自动提取且精度低等问题, 结合随机森林(RF)和神经网络(ANN)算法, 建立了河流表面信息提取方法RF-ANN。该方法支持并行运算且能降低热红外数据尺度辅助去噪, 实现了对河流表面信息的像素级提取。利用Laplace算子及边缘算法改进了RivWidthCloud河宽提取算法, 使其不需要人工设定判别阈值, 提升了算法的普适性。以国产GF-1、ZY-3卫星影像为主要数据源, 选取黄河一级支流皇甫川为研究区域。利用所建立的方法提取了皇甫川流域2级及以上河流的河流表面信息和平滩河宽。结果表明:RF-ANN的河流表面信息提取精度达到94.7%。提取河宽的平均误差为1.07 m (约0.5个像素), 提取的最小有效河宽为6.1 m (约3个像素), 提取河宽与检验河宽的R2和RMSE分别为0.93和1.52, 宽度小于10 m极细河流、10~30 m细小河流、30~90 m较细河流及90 m以上较宽河流的河宽提取误差分别为18.5%、8.8%、2.0%和0.7%。该研究结果为山区河流几何形态特征提取及河流地貌空间分布研究提供了方法和数据支持。
关键词国产高分辨率卫星    山区河流表面信息    平滩河宽    自动提取    
Automatic extraction of mountain river information from multiple Chinese high-resolution remote sensing satellite images
XUE Yuan1, QIN Chao1, WU Baosheng1, LI Dan2, FU Xudong1    
1. State Key Laboratory of Hydroscience and Engineering, Tsinghua University, Beijing 100084, China;
2. Emergency Science Research Academy, China Coal Research Institute, China Coal Technology & Engineering Group Co., Ltd., Beijing 100013, China
Abstract: High-resolution geomorphic information from remote sensing images is a key part of mountain river research. However, the complete information about narrow rivers is difficult to extract automatically and accurately from complex backgrounds, especially with mountain shadows. This research uses a random forest (RF) algorithm with an artificial neural network (ANN), RF-ANN, to analyze remote sensing images. This method supports parallel operations and reduces the scale of the infrared data for noise removal to achieve pixel-level extraction of the river surfaces. The RivWidthCloud (RWC) method is improved using Laplacian and edge algorithms for automatic extraction of the bankfull river widths. The improved RWC method is generalizable since it does not require setting the discriminant threshold manually. The method is then applied to the Huangfuchuan River Basin on the Loess Plateau, China using images from the Chinese GF-1 and ZY-3 satellites as the primary data source to extract the river surfaces and widths of the rivers above level 2. The results show that the RF-ANN method has a 94.7% accuracy for extracting river surfaces. The bankfull river width extraction error is 1.07 m (about 0.5 pixels) and the minimum river width extracted by these methods is 6.1 m (about 3 pixels). R2 is 0.93 and the root men square errors (RMSE) is 1.52 for fitting the extracted river widths and the test river widths. For small rivers narrower than 10 m, the extraction error is 18.5%, for widths from 10 to 30 m the error is 8.8%, for widths from 30 to 90 m the error is 2.0%, and for rivers wider than 90 m the error is 0.7%. These results provide accurate datasets for watershed topography research in mountainous and other complex topographic regions.
Key words: Chinese high-resolution satellites    mountain river surface information    bankfull river width    automatic extraction    

近年来中国遥感技术发展迅速,采用卫星影像进行资源调查已经成为重要手段,如利用高分辨率遥感影像提取河流、湖泊等水体表面信息已在土地利用及分类等领域得到广泛应用[1-2]。对水体表面信息的提取目前主要分为从合成孔径雷达(synthetic aperture radar, SAR)数据、光学遥感数据或两者结合的数据中提取3类。由于SAR场景噪声复杂、处理难度大,不太适用于对地物类型复杂、河流形态不规则的山区河流表面信息的提取,因此多使用光学遥感数据[3-4]。目前应用较广的数据源为美国Landsat系列、欧洲航天局Sentinel系列、法国SPOT系列等国外中、高分辨率卫星影像,利用国产高分辨率卫星影像的研究仍然较少[5-9]

国内外许多学者基于光学遥感影像,利用阈值法、分类器法和自动化法开展了水体表面信息提取的研究。这3类方法以阈值法中的水体指数法、分类器法中的决策树法和面向对象法应用较广[3, 10-16]。例如,Pekel等采用水体指数法使用300万景30 m Landsat影像生成了全球水体表面(global surface water, GSW)数据集,但该数据集中的河流表面信息十分破碎且不具备河宽属性[17]。Allen等利用1 071景30 m Landsat影像生成了全球河宽数据集(global river widths from Landsat, GRWL),但该数据集仅能保证90 m以上河宽的准确性,且遗漏了一些山区河流[18]。Li等基于10 m Sentinel-2影像生成了黄河源区河宽数据集[9],虽提取了30 m以上的河宽数据,但仍遗漏了很多细小河流表面信息和河宽。面向对象法则因多使用对象间的同、异质性及纹理特征而多用于高分辨率影像[19-21],但该方法运算步骤繁琐、提取地物类型复杂区域的水体效率低[22]。近年来,基于机器学习的自动化法也逐渐被应用于水体提取。该类方法在区分大面积简单地物时具备鲁棒性,且分类效率高、分类结果较准[9, 23],如随机森林(random forest, RF)算法、人工神经网络(artificial neural network, ANN)等[24-25]。但基于这类方法的研究也多有局限性。例如,RF对拥有复杂地物类型区域的分类效果较差;ANN则依赖高分辨率影像,对大面积研究区域分类效率较低[26-27]

综上所述,现有研究数据源多为国外产品,研究对象多为地物类型简单地区或大面积水体,提取方法也仅涉及常用水体、植被指数等,未考虑引入夏季可较好区分水体及其他地物的温度数据[28-31]。河流表面信息的提取结果也多为宽度90 m以上河流,较少涉及宽度30 m以下河流[9, 17, 32-34]。基于河流表面信息提取河宽的方法则往往以人工量测为主[34-35],工作量大。现有的自动化法如河宽数据云(RivWidthCloud, RWC)算法也因依赖经验判断[36]导致普适性较差。此外,现有方法选用影像时较少考虑河流实际流量,提取的河宽不能反映平滩流量等特征流量和河道几何形态。这类河宽既不能作为基础数据应用于流域生态环境研究,如河流碳排放的估算及河流物质通量传输等[37],也不能用于河流地貌研究及基于水文模型如数字黄河流域模型(digital Yellow River integrated model, DYRIM)[38]、分布式水文模型(geomorphology based hydrological model, GBHM)[39]等的径流过程模拟。因此,对山区河流表面信息的提取既要改善对国外产品依赖的现状,也应提升信息提取能力及效率,所提取的河宽还应考虑其代表性和可推广性。

本文以黄河一级支流皇甫川流域为研究区域,以各级河流表面信息及其具有代表性的平滩河宽为提取对象,以国产GF-1、ZY-3卫星高分辨率影像为主要数据源。基于随机森林算法、神经网络算法建立了支持并行运算的提取方法,引入能反映地物温度的热红外数据及数字高程模型(digital elevation model, DEM)去除噪声数据,提取了流域平滩流量下的河流表面信息。在对RWC算法改进的基础上,从河流表面信息中自动提取河宽。本研究可为山区细小河流表面信息及河宽提取提供方法,也可为缺乏资料地区水资源调查、山区洪水监测提供技术支持,从而拓展国产高分辨率卫星产品的应用范围。

1 研究区域与数据 1.1 研究区域

皇甫川位于110°20′E~111°15′E、39°12′ N~39°59′N之间,于陕西省榆林市府谷县汇入黄河[40]。流域内设2个水文站(图 1a)。皇甫川干流总长137 km,河道平均比降2.7‰,流域面积3 246 km2。该流域多年平均降水量365 mm,年平均气温9.1℃,80%的径流量发生在汛期(6—9月)[41]。皇甫川流域支流多、河道窄,依据Li等[9]和Allen等[18]的研究及主流卫星的分辨率,将流域内河流按河宽分成4类:极细(<10 m)、细小(10~30 m)、较细(30~90 m)和较宽(>90 m)。

图 1 研究区域概况与数据

1.2 数据获取与预处理 1.2.1 数据获取

1) 皇甫川流域水文资料。

平滩流量及对应的水位和河宽是反映河道形态特征及滩槽物质交换与河漫滩生态功能的重要参数[42-43],但平滩河宽的实测资料往往要从水文站获取,十分匮乏。为了能通过遥感影像获得平滩河宽数据,首先需要确定平滩流量及其出现日期。皇甫川流域共设皇甫、沙圪堵2个水文站,且沙圪堵站建于1990年,较皇甫站晚。本文收集分析了1990—2017年两水文站的汛期径流资料,并以Mann-Kendall检验法验证了资料的一致性[44]。根据实测大断面资料及平滩流量的估算方法[40, 45],确定水位为101 m左右的洪水流量为沙圪堵站平滩流量,与此水位对应的流量范围为40~60 m3/s,重现期为1.5 a左右。由于皇甫川流域是典型的缺资料地区,因此依据缺资料地区干支流关系确定流域平滩流量的方法[46],本文以沙圪堵站平滩流量日期代表皇甫川流域平滩流量日期。

2) 卫星影像数据。

检索卫星影像数据后发现,单独使用一种国产高分辨率影像难以覆盖平滩流量日期下的研究区域,因此联合使用了GF-1和ZY-3卫星影像。GF-1全色影像分辨率为2 m、多光谱分辨率为8 m,重访周期1 d。ZY-3卫星重访周期为3 d,提供2.1 m全色、5.8 m多光谱影像产品,总体精度指标优于法国SPOT5等国外同类产品[47]。根据平滩流量日期,选择了7景GF-1卫星1A级影像,成像时间分别为2013年7月30日和8月23日、2016年7月26日和9月1日。选择了3景ZY-3卫星影像,成像时间分别为2013年7月30日和2014年9月3日。为使用热红外数据为河流表面信息的提取去噪声,需对低分辨率热红外数据进行降尺度反演,因此采集了同期的6景Landsat-8 TIRS产品。影像成像时间均为正午。研究区域GF-1、ZY-3无云层覆盖、无缝镶嵌影像见图 1b

3) 土地利用类型数据。

通过机器学习方法准确提取河流表面信息依赖于准确的学习样本及合适的分类指数。为了能准确地确定研究区域河流周围的地物类型,基于中国科学院30 m分辨率的全国土地利用类型数据(https://www.resdc.cn)和清华大学10 m FROM-GLC全球土地利用类型数据(http://data.ess.tsinghua.edu.cn)分析了2013—2020年皇甫川流域地物类型,完成了样本采集及分类指数的选取。分析结果显示,2013—2020年皇甫川流域土地利用类型变化不大,但研究所用的数据产品均在河流源区受干扰较大,河流分类效果较差。2013—2020年皇甫川流域土地利用类型叠加示意见图 1c

4) 实测数据及样本。

2017年7月在内蒙古自治区鄂尔多斯市准格尔旗对研究区域的8个测区进行了野外考察,标记了测区内的地物。考察中记录下80个样本点的位置,使用测量精度1 mm的徕卡激光测距仪测量具有滩槽结构的河流样本对应的平滩河宽。因研究区域地物类型变化不大,故这80个实测样本可作为检验样本。从Google Earth历史影像上再随机选取2013年、2014年、2016年研究区域内河流及邻近的耕地、城镇、山体、裸地5类地物制作面状样本,各类样本比例为3∶2∶2∶2∶1,占流域面积的1.5%。采样遵循随机原则[48]。样本分布见图 1b

5) DEM数据。

流域河流源区低级别河流的河宽一般较细小,提取难度大。为了准确提取河流表面信息,在河流源区采用了高分辨率无人机(unmanned aerial vehicle, UAV) DEM数据。该数据由本研究课题组基于无人机获取,水平分辨率为0.88 m。经过校准及后处理,其高程分辨率优于0.8 m,数据覆盖河流源区1 421 km2。流域内其他区域DEM数据采用2015年公布的4.1版航天飞机雷达地形测绘任务(shuttle radar topography mission, SRTM) 90 m DEM数据(http://www.gscloud.cn/),该数据经过美国航空航天局(NASA)的人工处理更为准确,其高程精度优于15 m, 局部可达3 m[49]。这两类DEM数据能最大程度确保提取的线性河网的准确性。DEM数据示意见图 1d

1.2.2 数据预处理

1) GF-1、ZY-3、Landsat-8影像预处理。

GF-1卫星1A级影像是辐射校正后的影像。为保证水体信息提取的精度,需对影像继续进行辐射定标、大气校正、几何校正、正射校正、融合和裁剪等预处理[22],完成预处理后将影像重采样至2.1 m,以匹配ZY-3卫星影像分辨率。ZY-3卫星影像预处理流程为自动校准、正射校正、融合和裁剪等[50]。影像预处理平台为ENVI 5.3,拼接精度在2个像素以内(图 1b)。Landsat-8 TIRS L2级影像预处理流程同上。

2) 线性河网提取。

以两类DEM数据为数据源,采用清华大学开发的河网提取工具(drainage network extraction tool,DNET)提取河网。经验证, DNET能最大程度地消除平行河网的错误,使提取结果更为准确[51]。使用该工具计算时,流域最小汇流面积经实验设定为0.1 km2。共提取了8级河网,下文简称DNET河网。提取结果见图 1d

2 研究方法 2.1 RF-ANN河流表面信息提取方法

RF-ANN河流表面信息提取方法由3部分组成(图 2)。

图 2 河流表面信息及河宽提取流程

1) 采用基于神经网络的并行化随机森林算法RF-ANN,提取流域内水体表面信息。

2) 采用DNET对河网去噪,去除非河流噪声(涵盖湖泊、水塘等非河流水体),初步获得河流表面信息。

3) 采用形态学后处理算法,获得内部连续的河流表面信息。

RF-ANN算法的编译环境为MATLAB,运行环境为清华大学水沙科学与水利水电工程国家重点实验室的计算机集群。

2.1.1 RF-ANN水体表面信息提取算法

通过地表温度能在夏季较好地区分水体及植被、农田等,但地表温度不能直接通过遥感影像获得,且目前的温度产品空间分辨率均较低[26-27],无法匹配高分辨率影像,未在相关研究中广泛应用。为了获取地表温度,需要对能反映地表温度且能直接从卫星产品中获取的数据,如热红外数据[52],进行降尺度反演,从而匹配相应影像。研究表明,地表温度、热红外数据与植被指数间存在相关性[53-56],因此以RF-ANN中的ANN算法基于研究区域的红光、近红外光两个光学波段和植被指数(表 1),在DNET河网2 500 m范围内,对空间分辨率30 m的Landsat-8 TIRS数据降尺度至2.1 m,反演效果采用交叉验证法评价[57]。TIRS数据反演完成后,使用RF算法并行提取ZY-3及GF-1卫星影像中研究区域的水体表面信息。

表 1 4波段高分辨率卫星产品水体、植被指数[3, 8-15, 58]
指数名称 计算公式
归一化植被指数NDVI (B4-B3)/(B4+B3)
阴影水体指数SWI B1+B2-B4
归一化水体指数NDWI (B2-B4)/(B2+B4)
增强阴影水体指数ESWI (B1+B2)/(B4+B4)
新型水体指数NCWI (7B2-2B1-5B4)/(7B2+2B1+5B4)
绿度差植被指数GNDVI (B4-B2)/(B4+B2)
比值植被指数RVI B4/B3
增强植被指数EVI 2.5(B4-B3)/((B4+6.0B3-7.5B1)+1.0)
差值植被指数DVI B4-B3
加权差值植被指数WDVI B4-0.46B3
重新归一化差值植被指数RDVI $ \left(B_4-B_3\right) / \sqrt{B_4+B_3} $
泛归一化差值植被指数PNDVI (B4-(B2+B3+B1))/(B4+(B2+B3+B1))
红绿归一化差值植被指数RBNDVI (B4-(B3+B1))/(B4+(B3+B1))
归一化蓝光差值植被指数BNDVI (B4-B1)/(B4+B1)
宽蓝波段动态范围植被指数BWDRVI (0.1B4-B1)/(0.1B4+B1)
红光/近红外比值植被指数SRRed_NIR B3/B4
调整转换的土壤调节植被指数ATSAVI 1.22(B4-1.22B3-0.03)/(1.22B4+B3-1.22×0.03+0.08×(1.0+1.222))
转换的土壤调节植被指数TSAVI (0.743(B4-0.743B3-0.323))/(B3+0.743(B4-0.323)+0.413×(1.0+0.743 2))
可见光大气耐绿指数VARIgreen (B2-B3)/(B2+B3-B1)
氧化铁指数IO B3/B1
三价铁指数Fe3 B3/B2
形状指数IF (2.0B3-B2-B1)/(B2-B1)
显色指数CI (B3-B1)/B3
发红指数RI (B3-B2)/(B3+B2)
色彩渲染指数550 CRI550 B1-1-B2-1
Difference 678/500 B4-B2
注:B1为影像蓝光波段数值、B2为影像绿光波段数值、B3为影像红光波段数值、B4为影像近红外波段数值。

RF的提取参数包括水体指数和植被指数(表 1[3, 8-15, 58])、光学波段、热红外数据以及纹理数据(灰度共生矩阵均值、方差、同质性、异质性、相关性、对比度、熵、能量)共计64个。与RF提取进程并行进行的是ANN算法基于降尺度反演TIRS的提取进程。将ANN提取的水体表面信息与RF提取结果相交后检验Kappa系数,若满足预设精度则输出至下一模块,反之将循环RF提取(预设精度可调)。循环时为提高运算效率,RF选取重要性较高的提取参数(参数量可视提取效果增减)。循环区域沿DNET河网缩小200 m/次,直至满足预设精度或运算区半径缩小至接近DEM河网缓冲区边缘的1 100 m(该范围可调)为止。

2.1.2 DNET河网约束去噪声及后处理

通过RF-ANN算法得到的水体表面信息仍会因山体阴影等地物的干扰含有背景噪声。为了得到准确的河流表面信息,基于水文站实测资料及Google Earth历史影像,按河流级别确定DNET河网缓冲区。将水体表面信息与DNET河网缓冲区叠加去除非河流地物,得到外部干扰较小、精度较高的初步河流表面信息。

对初步河流表面信息使用形态学填补、等值膨胀和等值腐蚀等算法,最终得到外部噪声小、内部连通的河流表面信息。

2.2 改进的RWC河宽自动提取算法

本文采用了由Yang等基于河宽自动化提取方法RivWidth[59]改进的自动化算法RWC[36]。在应用过程中发现虽然RWC能从Landsat影像生成的水体表面信息中提取河宽,但RWC涉及的经验参数均由Landsat产品确定,并不能直接用于国产高分辨率产品。因此,通过多次预实验对该算法进行了改进,算法流程见图 2

2.2.1 河流中心线自动提取

通过遥感影像获取河宽的自动化法多依靠河流中心线。Yang等认为在河流内部,河流中心线上的点到河岸的距离最远,且这些点的距离梯度总是局部最小且接近于0[36]。RWC也因此通过对二值化的水体掩膜与其设定的卷积核运算得到距离梯度,再根据经验设定梯度阈值提取河流中心线。但是,RWC需要人工监督及经验判断,一定程度上降低了方法的自动化程度和可推广性。本文提出利用离散的Laplace算子替代RWC预设距离卷积核得到河流表面信息的距离梯度,再结合边缘算法获取河流中心线。具体步骤如下:

1) 将二值化的河流表面信息进行距离变换。

2) 对距离集进行Laplace差分运算,获得每个像素的距离梯度(图 3)。

图 3 Laplace离散的距离梯度示意

3) 利用边缘算法去除边缘像素,保留梯度接近0的“带状”中心线。

4) 对“带状”中心线使用2次骨架化算法取坐标中值获得河流中心线。

2.2.2 按河流级别自动提取河宽

自动提取河宽需依据河流中心线。改进的RWC算法利用9阶卷积核确定与河流正交的河宽方向线,方向线在河岸间的长度即为河宽。提取步骤如下:

1) 将RWC河流中心线与二值化河流表面信息叠加,同时创建一个9阶角度卷积核(图 4)。

图 4 RWC河宽自动提取算法关键步骤示意

2) 中心线与角度卷积核卷积交于一点或两点,由式(1)得到方向线角度α。正交方向线由角度卷积核值与α最接近的像素和中心线像素连接得到(交点数大于2的个别情况由程序标记为错误并跳过)。

$ \begin{cases}\alpha=\frac{1}{2}\left(\theta_1+\theta_2\right), & \text { 交于两点; } \\ \alpha=90^{\circ}+\theta_3, & \text { 交于一点. }\end{cases} $ (1)

θ1θ2为角度卷积核与中心线交于两点时交点的角度,θ3为交于一点时交点的角度。

3) 2.1.2节提及的河网缓冲区半径为Rb,以3Rb的长度Wm沿河宽方向绘制线段与河岸相交(Wm可调)。相交线的长度与原始影像分辨率的乘积即为河宽。

4) 遍历中心线像素,提取河宽。

3 结果与分析 3.1 皇甫川流域河流表面信息提取结果 3.1.1 RF-ANN水体表面信息提取

采用RF-ANN并行算法提取GF-1及ZY-3卫星影像区域,校验Kappa系数预设为0.6。以表 1中24个解释向量,设计了前馈神经网络极限学习机(extreme learning machine, ELM)、反向传播(back propagation, BP)神经网络进行热红外降尺度反演实验。经交叉验证,BP神经网络经6次循环对DNET河网1 300 m范围内的TIRS-1的反演结果R2=0.82、RMSE=56.4,对TIRS-2的反演结果R2=0.84、RMSE=53.6,较为可靠(表 2)。

表 2 TIRS降尺度反演结果对比
反演模型 R2 RMSE
TIRS-1 TIRS-2 TIRS-1 TIRS-2
BP 0.82 0.84 56.4 53.6
ELM 0.37 0.45 109.1 99.7
RF 0.51 0.57 89.6 82.2

RF算法以TIRS的2个波段、26个水体指数(表 1)、4种光学波段、32个纹理指数为分类参数提取皇甫川流域水体。试训后设定RF棵数为1 100,次特征选取数为8。预实验基于平均精度减少法[9]评价指数重要性,经相关性分析后确定14个指数(纹理指数占50%)作为最终分类参数(图 5)。使用ELM基于TIRS波段同步提取水体表面信息。将RF结果与ELM结果取交并去掉其他类别地物,得到水体表面信息。

图 5 14个RF参数重要性排序

3.1.2 DNET河网约束及形态学处理结果

DNET缓冲区半径以Google Earth量测结果及水文站实测数据为参考,设定4级以下河流缓冲区半径为300 m、5~6级为600 m、7~8级为1 000 m。将DNET河网缓冲区与3.1.1节结果叠加去噪,得到初步河流表面信息。再通过形态学算法中的Bridge、Fill、等值膨胀及腐蚀算法对其进行填补、连接而不改变宽度,得到精确的河流表面信息。去噪及后处理结果见图 6a。由最终得到的流域河流表面信息(图 6b)可知,本方法能较完整地提取4级和部分2~3级河流。

图 6 RF-ANN河流表面信息提取结果

通过对比认可度较高的两类产品GRWL、GSW数据集可知,RF-ANN提取到的河流表面信息的完整度更优(图 6b图 7a)。在提取难度大的河流源区,基于相同数据源将本文方法与现使用率较高的面向对象法、大津(Otsu)法进行了提取效果对比,结果显示本文提出的RF-ANN方法的提取结果在源区完整度更高、抗地物干扰能力更强(图 7b)。

图 7 不同方法河流提取效果对比

3.1.3 河流中心线提取结果及河宽计算

基于河流表面信息,采用改进的RWC算法能够自动提取河宽,从而获得皇甫川流域1 km间隔平滩河宽,得到匹配3级DNET河网的河宽数据153个,4级河宽167个,5级河宽160个,6级河宽114个,7级河宽129个,8级河宽177个。河宽数据总体分布见图 8

图 8 皇甫川流域河宽数据分布

3.2 精度评价

本文从两方面评价提取精度:河流表面信息提取精度、平滩河宽提取精度。

3.2.1 河流表面信息提取精度

RF-ANN提取方法的Kappa系数达到0.89,分类整体精度为92.1%,河流表面信息提取精度为94.7%。改进的RWC算法提取到河流中心线903.2 km。流域内4级及以上DNET河网总长719.8 km,3级及以上总长1 194.1 km。可见,改进的RWC算法提取丰度优于4级DNET河网。

总体来看,本文方法的提取能力在地形复杂、支流多而细、地物干扰严重的山区较强。

3.2.2 河宽提取精度

以2个水文站资料及野外实测的80个河宽数据验证河宽提取精度,以相关系数R2、均方根误差RMSE、平均误差、平均偏差MBE等指标评价提取效果,结果见图 9

图 9 改进的RWC算法提取河宽精度评价

图 9表明,基于80个河宽数据得到提取河宽与实测河宽的平均误差为1.07 m,所使用的影像分辨率为2.1 m,故提取误差约0.5个像素;本文方法可以准确提取的最小有效河宽为6.1 m,约为3个像素,与以往研究的结论一致[9]。提取河宽与实测河宽的R2、RMSE、MBE分别为0.93、1.52、0.073。河宽提取结果整体偏宽主要源于分类时河流与其他地物混淆,导致边界识别存在误差、部分断面河流中心线并未严格垂直真实河宽断面。提取到流域内的最小、最大河宽对应到2级DNET河网分别为6.1 m和297.4 m。对提取的河宽进一步分析表明,对于宽度小于10 m的极细河流,提取平均误差为18.5%;对于宽度10~30 m的细小河流,平均误差为8.8%;宽度30~90 m较细河流的提取平均误差为2.0%;宽度90 m以上河流的平均误差为0.7%。总体来看,改进后的RWC算法在地形复杂的山区提取结果的精度有了很大提升。

4 结论

本文以平滩流量日期下的多源国产高分辨率卫星影像为主要数据源,在改进的随机森林算法的基础上,结合人工神经网络建立了RF-ANN河流表面信息提取方法。基于改进的RWC河宽提取算法,从河流表面信息中成功提取了皇甫川流域的平滩河宽。本文主要工作总结如下:

1) 基于BP神经网络及ELM,改进了随机森林算法,实现了并行运算。基于DNET河网约束及形态学算法建立了RF-ANN河流表面信息提取方法。本文方法还利用夏季能较好区分水体与其他地物的热红外数据及DNET河网缓冲区,对提取结果自动去噪,有效排除山体阴影等地物的干扰,使提取结果更准确。

2) 利用Laplace算子及边缘算法改进了RWC算法,改进后的算法不需要人工设定判别阈值,可提取不同地区、不同影像的河流中心线及河宽。

3) 采用RF-ANN河流表面信息提取方法和改进的RWC河宽提取算法,提取了皇甫川流域2级及以上河流的表面信息和平滩河宽。结果表明,提取河流表面信息的Kappa系数达0.89,精度为94.7%。提取河宽的平均误差为1.07 m(约0.5个像素),提取的最小有效河宽为6.1 m(约3个像素),提取河宽与实测河宽的R2和RMSE分别为0.93和1.52。对宽度小于10 m的极细河流、10~30 m的细小河流、30~90 m的较细河流及90 m以上较宽河流的河宽数据提取误差分别为18.5%、8.8%、2.0%和0.7%。总体来说,本文方法对山区细小河流表面信息及其河宽的提取能力较强、精度较高。

参考文献
[1]
FRIEDL M A, SULLA-MENASHE D, TAN B, et al. MODIS Collection 5 global land cover: Algorithm refinements and characterization of new datasets[J]. Remote Sensing of Environment, 2010, 114(1): 168-182. DOI:10.1016/j.rse.2009.08.016
[2]
FEYISA G L, MEILBY H, FENSHOLT R, et al. Automated water extraction index: A new technique for surface water mapping using Landsat imagery[J]. Remote Sensing of Environment, 2014, 140: 23-35. DOI:10.1016/j.rse.2013.08.029
[3]
李丹, 吴保生, 陈博伟, 等. 基于卫星遥感的水体信息提取研究进展与展望[J]. 清华大学学报(自然科学版), 2020, 60(2): 147-161.
LI D, WU B S, CHEN B W, et al. Review of water body information extraction based on satellite remote sensing[J]. Journal of Tsinghua University (Science and Technology), 2020, 60(2): 147-161. DOI:10.16511/j.cnki.qhdxxb.2019.22.038 (in Chinese)
[4]
MEDINA C, GOMEZ-ENRI J, ALONSO J J, et al. Water volume variations in Lake Izabal (Guatemala) from in situ measurements and ENVISAT radar altimeter (RA-2) and advanced synthetic aperture radar (ASAR) data products[J]. Journal of Hydrology, 2010, 382(1-4): 34-48. DOI:10.1016/j.jhydrol.2009.12.016
[5]
NATH R K, DEB S K. Water-body area extraction from high resolution satellite images: An introduction, review, and comparison[J]. International Journal of Image Processing, 2010, 3(6): 353-372.
[6]
FRAZIER P S, PAGE K J. Water body detection and delineation with Landsat TM data[J]. Photogrammetric Engineering and Remote Sensing, 2000, 66(12): 1461-1467.
[7]
毛海颖, 冯仲科, 巩垠熙, 等. 多光谱遥感技术结合遗传算法对永定河土壤归一化水体指数的研究[J]. 光谱学与光谱分析, 2014, 34(6): 1649-1655.
MAO H Y, FENG Z K, GONG Y X, et al. Researches of soil normalized difference water index (NDWI) of Yongding River based on multispectral remote sensing technology combined with genetic algorithm[J]. Spectroscopy and Spectral Analysis, 2014, 34(6): 1649-1655. DOI:10.3964/j.issn.1000-0593(2014)06-1649-07 (in Chinese)
[8]
SHARMA O, MIOC D, ANTON F. Feature extraction and simplification from colour images based on colour image segmentation and skeletonization using the quad-edge data structure[C]//Proceedings of the International Conference in Central Europe on Computer Graphics, Visualization and Computer Vision. Plzen, Czech, 2007: 225-232.
[9]
LI D, WANG G, QIN C, et al. River extraction under bankfull discharge conditions based on Sentinel-2 imagery and DEM data[J]. Remote Sensing, 2021, 13(14): 2650. DOI:10.3390/rs13142650
[10]
王航, 秦奋. 遥感影像水体提取研究综述[J]. 测绘科学, 2018, 43(5): 23-32.
WANG H, QIN F. Summary of the research on water body extraction and application from remote sensing image[J]. Science of Surveying and Mapping, 2018, 43(5): 23-32. DOI:10.16251/j.cnki.1009-2307.2018.05.005 (in Chinese)
[11]
MCFEETERS S K. The use of the normalized difference water index (NDWI) in the delineation of open water features[J]. International Journal of Remote Sensing, 1996, 17(7): 1425-1432. DOI:10.1080/01431169608948714
[12]
WANG S D, BAIG M H A, ZHANG L F, et al. A simple enhanced water index (EWI) for percent surface water estimation using Landsat data[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(1): 90-97. DOI:10.1109/JSTARS.2014.2387196
[13]
SUN F D, SUN W X, CHEN J, et al. Comparison and improvement of methods for identifying waterbodies in remotely sensed imagery[J]. International Journal of Remote Sensing, 2012, 33(21): 6854-6875. DOI:10.1080/01431161.2012.692829
[14]
SAFAVIAN S R, LANDGREBE D. A survey of decision tree classifier methodology[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1991, 21(3): 660-674. DOI:10.1109/21.97458
[15]
张红梅, 王大卫, 高杨, 等. 基于OLI数据与决策树法的去山体阴影水体信息提取研究[J]. 测绘工程, 2017, 26(11): 45-48, 54.
ZHANG H M, WANG D W, GAO Y, et al. A study of extraction method of mountain surface water based on OLI data and decision tree method[J]. Engineering of Surveying and Mapping, 2017, 26(11): 45-48, 54. DOI:10.19349/j.cnki.issn1006-7949.2017.11.010 (in Chinese)
[16]
ACHARYA T D, LEE D H, YANG I T, et al. Identification of water bodies in a Landsat 8 OLI image using a J48 decision tree[J]. Sensors, 2016, 16(7): 1075. DOI:10.3390/s16071075
[17]
PEKEL J F, COTTAM A, GORELICK N, et al. High- resolution mapping of global surface water and its long-term changes[J]. Nature, 2016, 540(7633): 418-422. DOI:10.1038/nature20584
[18]
ALLEN G H, PAVELSKY T M. Global extent of rivers and streams[J]. Science, 2018, 361(6402): 585-588. DOI:10.1126/science.aat0636
[19]
葛锦涛, 姜琦刚, 李相坤, 等. 基于高分一号影像的半干旱地区土地利用信息提取方法对比分析: 以建平为例[J]. 世界地质, 2017, 36(4): 1303-1308.
GE J T, JIANG Q G, LI X K, et al. Comparison and analysis of information extraction methods of semiarid land utilization based on GF1 image: Taking Jianping as an example[J]. Global Geology, 2017, 36(4): 1303-1308. DOI:10.3969/j.issn.1004-5589.2017.04.031 (in Chinese)
[20]
刘兆祎, 李鑫慧, 沈润平, 等. 高分辨率遥感图像分割的最优尺度选择[J]. 计算机工程与应用, 2014, 50(6): 144-147.
LIU Z Y, LI X H, SHEN R P, et al. Selection of the best segmentation scale in high-resolution image segmentation[J]. Computer Engineering and Applications, 2014, 50(6): 144-147. DOI:10.3778/j.issn.1002-8331.1206-0094 (in Chinese)
[21]
刘小丹, 于宁. 河流湿地遥感图像分层次多尺度分割[J]. 网络新媒体技术, 2016, 5(5): 51-59.
LIU X D, YU N. Hierarchical multi-scale segmentation of riverine wetland remote sensing image[J]. Journal of Network New Media, 2016, 5(5): 51-59. DOI:10.3969/j.issn.2095-347X.2016.05.009 (in Chinese)
[22]
LIANG X, HU W Y. A coupled co-occurrence matrix/multi-scale segmentation method to extract water from high resolution remote sensing image[C]//2018 26th International Conference on Geoinformatics. Kunming, China, 2018: 1-4.
[23]
薛源, 李丹, 吴保生, 等. 利用国产GF-1卫星数据实现山区细小河流河宽的自动提取[J]. 测绘通报, 2020(3): 12-16.
XUE Y, LI D, WU B S, et al. Automatic extraction of small mountain river information and width based on China-made GF-1 satellites remote sensing images[J]. Bulletin of Surveying and Mapping, 2020(3): 12-16. DOI:10.13474/j.cnki.11-2246.2020.0069 (in Chinese)
[24]
BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32. DOI:10.1023/A:1010933404324
[25]
TALUKDAR S, SINGHA P, MAHATO S, et al. Land-use land-cover classification by machine learning classifiers for satellite observations: A review[J]. Remote Sensing, 2020, 12(7): 1135. DOI:10.3390/rs12071135
[26]
ACHARYA T D, SUBEDI A, LEE D H. Evaluation of machine learning algorithms for surface water extraction in a Landsat 8 scene of Nepal[J]. Sensors, 2019, 19(12): 2769. DOI:10.3390/s19122769
[27]
PAL M, MATHER P M. An assessment of the effectiveness of decision tree methods for land cover classification[J]. Remote Sensing of Environment, 2003, 86(4): 554-565. DOI:10.1016/S0034-4257(03)00132-9
[28]
AUNG E M M, TINT T. Ayeyarwady river regions detection and extraction system from Google Earth imagery[C]//2018 IEEE International Conference on Information Communication and Signal Processing (ICICSP). Singapore, 2018: 74-78.
[29]
李玲玲. 若干典型地物温度变化特征试验研究[D]. 沈阳: 东北大学, 2009.
LI L L. Experimental study of the temperature variation characteristic of some typical ground objects[D]. Shenyang: Northeastern University, 2009. (in Chinese)
[30]
王爱辉, 杨英宝, 潘鑫, 等. 地表温度日变化模型偏差系数解算的地表温度降尺度[J]. 遥感学报, 2021, 25(8): 1735-1748.
WANG A H, YANG Y B, PAN X, et al. Research on land surface temperature downscaling method based on diurnal temperature cycle model deviation coefficient calculation[J]. National Remote Sensing Bulletin, 2021, 25(8): 1735-1748. (in Chinese)
[31]
SHEN Y, SHEN H F, LI H F, et al. Long-term urban impervious surface monitoring using spectral mixture analysis: A case study of Wuhan City in China[C]//2016 IEEE International Geoscience and Remote Sensing Symposium (IGARSS). Beijing, China, 2016: 6754-6757.
[32]
LIU T, YANG X J. Mapping vegetation in an urban area with stratified classification and multiple endmember spectral mixture analysis[J]. Remote Sensing of Environment, 2013, 133: 251-264. DOI:10.1016/j.rse.2013.02.020
[33]
ZHANG Y. A method for continuous extraction of multispectrally classified urban rivers[J]. Photogrammetric Engineering and Remote Sensing, 2000, 66(8): 991-999.
[34]
WEI H, BI F K, LIU F Q, et al. Water body extraction based on the LBV transformation analysis for China GF-1 multi-spectral images[C]//IET International Radar Conference 2015. Hangzhou, China, 2015: 1-5.
[35]
LI D, WU B S, CHEN B W, et al. Open-surface river extraction based on Sentinel-2 MSI imagery and DEM data: Case study of the upper Yellow River[J]. Remote Sensing, 2020, 12(17): 2737. DOI:10.3390/rs12172737
[36]
YANG X, PAVELSKY T M, ALLEN G H, et al. RivWidthCloud: An automated Google Earth engine algorithm for river width extraction from remotely sensed imagery[J]. IEEE Geoscience and Remote Sensing Letters, 2020, 17(2): 217-221. DOI:10.1109/LGRS.2019.2920225
[37]
RAYMOND P A, HARTMANN J, LAUERWALD R, et al. Global carbon dioxide emissions from inland waters[J]. Nature, 2013, 503(7476): 355-359. DOI:10.1038/nature12760
[38]
WANG G Q, FU X D, SHI H Y, et al. Watershed sediment dynamics and modeling: A watershed modeling system for Yellow River[M]//YANG C T, WANG L K. Advances in water re- sources engineering. Cham, Switzerland: Springer, 2015: 1-40.
[39]
YANG D W, HERATH S, MUSIAKE K. A hillslope-based hydrological model using catchment area and width functions[J]. Hydrological Sciences Journal, 2002, 47(1): 49-65. DOI:10.1080/02626660209492907
[40]
王冰洁, 傅旭东. 皇甫川流域含沙量-流量关系年内年际变化特性[J]. 应用基础与工程科学学报, 2020, 28(3): 642-651.
WANG B J, FU X D. Intra- and inter-annual variations in the relationship between suspended sediment concentration and discharge of the Huangfuchuan watershed[J]. Journal of Basic Science and Engineering, 2020, 28(3): 642-651. DOI:10.16058/j.issn.1005-0930.2020.03.012 (in Chinese)
[41]
XU H, TAYLOR R G, XU Y. Quantifying uncertainty in the impacts of climate change on river discharge in sub-catchments of the Yangtze and Yellow River Basins, China[J]. Hydrology and Earth System Sciences, 2011, 15(1): 333-344. DOI:10.5194/hess-15-333-2011
[42]
PAGE K, READ A, FRAZIER P, et al. The effect of altered flow regime on the frequency and duration of bankfull discharge: Murrumbidgee River, Australia[J]. River Research and Applications, 2005, 21(5): 567-578. DOI:10.1002/rra.828
[43]
钱宁, 张仁, 周志德. 河床演变学[M]. 北京: 科学出版社, 1987.
QIAN N, ZHANG R, ZHOU Z D. Fluvial processes[M]. Beijing: Science Press, 1987. (in Chinese)
[44]
ZHANG X B, ZWIERS F W, HEGERL G C, et al. Detection of human influence on twentieth-century precipitation trends[J]. Nature, 2007, 448(7152): 461-465. DOI:10.1038/nature06025
[45]
覃超, 吴保生, 傅旭东, 等. 时空维度拓展的河相关系研究进展[J]. 泥沙研究, 2022, 47(2): 73-80.
QIN C, WU B S, FU X D, et al. Progresses of hydraulic geometry study regarding the extension of spatiotemporal dimensions[J]. Journal of Sediment Research, 2022, 47(2): 73-80. (in Chinese)
[46]
覃超, 吴保生, 汪舸, 等. 青藏高原山区河流广义河相关系与多频率沿程河相关系[J]. 水利学报, 2022, 53(2): 176-187.
QIN C, WU B S, WANG G, et al. Generalized hydraulic geometry and multi-frequency downstream hydraulic geometry of mountain rivers originated from the Qinghai-Tibet Plateau[J]. Journal of Hydraulic Engineering, 2022, 53(2): 176-187. (in Chinese)
[47]
唐新明, 胡芬. 卫星测绘发展现状与趋势[J]. 航天返回与遥感, 2018, 39(4): 26-35.
TANG X M, HU F. Development status and trend of satellite mapping[J]. Spacecraft Recovery & Remote Sensing, 2018, 39(4): 26-35. (in Chinese)
[48]
STEHMAN S V, CZAPLEWSKI R L. Design and analysis for thematic map accuracy assessment: Fundamental principles[J]. Remote Sensing of Environment, 1998, 64(3): 331-344. DOI:10.1016/S0034-4257(98)00010-8
[49]
MUKHERJEE S, JOSHI P K, MUKHERJEE S, et al. Evaluation of vertical accuracy of open source digital elevation model (DEM)[J]. International Journal of Applied Earth Observation and Geoinformation, 2013, 21: 205-217. DOI:10.1016/j.jag.2012.09.004
[50]
唐新明, 王鸿燕, 祝小勇. 资源三号卫星测绘技术与应用[J]. 测绘学报, 2017, 46(10): 1482-1491.
TANG X M, WANG H Y, ZHU X Y. Technology and applications of surveying and mapping for ZY-3 satellites[J]. Acta Geodaetica et Cartographica Sinica, 2017, 46(10): 1482-1491. DOI:10.11947/j.AGCS.2017.20170251 (in Chinese)
[51]
WU T, LI J Y, LI T J, et al. High-efficient extraction of drainage networks from digital elevation models constrained by enhanced flow enforcement from known river maps[J]. Geomorphology, 2019, 340: 184-201.
[52]
陈桥驿, 蔡宜泳. 热红外遥感反演地表温度研究进展[J]. 安徽农业科学, 2013, 41(4): 1832-1835, 1843.
CHEN Q Y, CAI Y Y. Research progress in retrieving land surface temperature based on thermal infrared remote sensing technologies[J]. Journal of Anhui Agricultural Sciences, 2013, 41(4): 1832-1835, 1843. (in Chinese)
[53]
段四波, 茹晨, 李召良, 等. Landsat卫星热红外数据地表温度遥感反演研究进展[J]. 遥感学报, 2021, 25(8): 1591-1617.
DUAN S B, RU C, LI Z L, et al. Reviews of methods for land surface temperature retrieval from Landsat thermal infrared data[J]. Journal of Remote Sensing, 2021, 25(8): 1591-1617. (in Chinese)
[54]
QIN Z, KARNIELI A, BERLINER P. A mono-window algorithm for retrieving land surface temperature from Landsat TM data and its application to the Israel-Egypt border region[J]. International Journal of Remote Sensing, 2001, 22(18): 3719-3746.
[55]
JIMÉNEZ-MUÑOZ J C, SOBRINO J A. A generalized single-channel method for retrieving land surface temperature from remote sensing data[J]. Journal of Geophysical Research: Atmospheres, 2003, 108(D22): 4688.
[56]
LI Z L, TANG B H, WU H, et al. Satellite-derived land surface temperature: Current status and perspectives[J]. Remote Sensing of Environment, 2013, 131: 14-37.
[57]
KOHAVI R. A study of cross-validation and bootstrap for accuracy estimation and model selection[C]//Proceedings of the 14th International Joint Conference on Artificial Intelligence. Montréal, Canada: Morgan Kaufmann Publishers, 1995: 1137-1143.
[58]
FISHER A, FLOOD N, DANAHER T. Comparing Landsat water index methods for automated water classification in eastern Australia[J]. Remote Sensing of Environment, 2016, 175: 167-182.
[59]
PAVELSKY T M, SMITH L C. RivWidth: A software tool for the calculation of river widths from remotely sensed imagery[J]. IEEE Geoscience and Remote Sensing Letters, 2008, 5(1): 70-73.