2. 北京大学 政府管理学院, 北京 100871
2. School of Government, Peking University, Beijing 100871, China
传统的社会经济统计数据是以行政单元为主导的,因而与遥感图像有着数据不一、空间不一和量纲不一等问题。如果要对两者进行分析,首先需要对社会经济数据作空间化处理,使这些数据与遥感数据同空间分布,并在特定的时间把社会经济数据反演到环境单元的地理空间上[1]。
本文的研究目的着重于统计GDP数据与夜间灯光遥感数据的空间关系分析。GDP是社会经济的核心指标,可以衡量国家或地区经济的发展程度,而夜间灯光遥感数据于夜间时段收集,剔除了绝大部分自然干扰,可以更好地显示人类活动情况。因此,构建两者的空间关系模型具有实际意义,主要体现以下几方面:1) 客观地评估或者预测区域的GDP,免去大量的人力资源;2) 由于传统的GDP数据以季为单位发布,存在一定的间隔,而利用空间模型则可快速和连续地监测数据的变化;3) 通过反演手段直观地显示和分析不同地区的发展差异,可辅助相关政策的制定或导向。
目前,针对GDP统计数据空间化,国内外已有一些研究。Elvidge等在1996年率先提出对美国国防气象卫星计划(Defense Meteorological Satellite Program, DMSP)的夜间灯光数据与人口、GDP和耗电数据的空间关系进行分析研究,实验结果表明灯光数据与人类活动有着很强相关性[2]。Sutton等采用DMSP的灯光数据和土地覆盖数据评估出全球市场与非市场经济活动情况,构建出双对数化的回归模型,并描绘出了首张精度达1 km的经济活动分布图[3]。Ghosh等根据美国与墨西哥的夜间灯光与区域的经济活动数据,建立相关空间关系模型,并利用美国人口回归模型参数来估算出墨西哥非正式经济与汇款的情况,指出墨西哥经济的评估结果要比官方公布的正式经济数据更为活跃[4]。
国内方面,刘红辉等较早开展了对GDP数据的空间模拟研究,利用美国地球资源卫星Landsat TM的土地覆盖数据,分别与三大产业的GDP建立空间关系,然后生成总的GDP模型,并反演到1 km格网的地理空间上[5]。韩向娣等在文[2]基础上进行拓展,引入DMSP卫星的夜间灯光数据并细化整个处理流程,通过对分产业GDP进行空间关系分析,构建出GDP空间模型,并生成全国1 km的GDP空间密度图[6]。Shi等使用修正的Suomi美国国家极轨伙伴(Suomi National Polar-orbiting Partnership, Suomi-NPP)的夜间灯光分别对GDP和电力消耗的经济数据,建立中国省级和县级区域的空间化模型,并与DMSP灯光数据进行比较[7]。此外,柴子为等分别利用Suomi-NPP与DMSP夜间灯光数据,建立珠三角镇级GDP估算模型,比较不同数据源的性能优劣,实验指出利用Suomi-NPP数据能提供更精确的结果[8]。
除此之外,社会经济数据空间化可根据不同的统计数据应用于多个方向,其中包括[9-10]:人类活动、城市扩张、资源消耗和生态影响等。近年来的研究趋势以多种遥感数据源的结合为主,互补和提升遥感数据的表征能力,或者引入模式识别等算法,对遥感图像进行深层次的处理,提高算法的鲁棒性。
本文以2011至2014年中国内地各省级行政区的统计GDP与Suomi-NPP灯光数据作为空间建模对象。首先统计各省级行政区的灯光信息,计算出灯光指标,然后通过相关性分析选出最佳灯光指标,最后构建该指标与统计GDP的关系模型,分析灯光与GDP的空间特征,并对GDP进行预测。已有的空间模型相关研究大多采用线性或幂指数回归分析,本文为了更客观地分析灯光与GDP的空间关系,还加入了指数、对数和Logistic模型作横向比较,分析各模型的分布特点与拟合效果,以及样本点对结果的影响。分析结果表明,线性、幂指数和Logistic模型在稳定程度和平均拟合精度上,都有较好的效果,适用于对Suomi-NPP的夜间灯光数据与GDP进行空间分析。
1 算法架构与流程本文的算法主要分为3个部分:1) 对灯光数据进行信息提取,包括区域划分和灯光信息统计。2) 通过灯光信息计算出相关的灯光指标,并与GDP数据进行相关性分析,以确定最佳灯光指标。3) 利用最佳灯光指标与统计GDP建立关系模型,根据回归模型的拟合结果,分析两者间的分布关系,选出拟合优度高的模型用于GDP预测。本文整体算法流程如图 1所示。
2 研究数据与区域
Suomi-NPP是一颗对地的环境观察卫星,它是由美国国家航空航天局(National Aeronautics and Space Administration, NASA)和美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration, NOAA)等机构共同合作建造。该极轨卫星于2011年底发射,搭载先进的可见光红外成像辐射仪(visible infrared imaging radiometer, VIIRS)和另外4台最新的探测器,实现单卫星多项观测任务的功能。其中,VIIRS传感器可对大气、陆地和海洋等生态环境进行可见光和红外成像,并生成一系列辐射图像。
Suomi-NPP卫星的VIIRS传感器可以收集晚间地球表面的低光图像数据。其与DMSP中的运行线扫描系统(operational linescan system, OLS)相似,但有着相当大的性能改善与拓展。其主要优势体现在以下几个方面[11]:1) VIIRS设备对地成像的空间分辨率高,每个像素平均可达742m×742m,比OLS有着接近45倍的分辨率提升。2) VIIRS在低光成像中,光辐射亮度的检测下限从5×10-10W/(cm2·sr)提升到2×10-11W/(cm2·sr),意味着可在更微弱的光线下提供精细的灯光数据。3) VIIRS比OLS传感器新增飞行校正功能,直接在平台上进行校正处理。最重要的是VIIRS有着广泛的动态范围,它集成低、中和高增益模块,每像素可有效接收各种光源,并放大低频信号,防止灯光明亮部分过饱和。
本文使用的灯光数据源由NOAA下属的地球观测组(Earth Observation Group, EOG)所发布(http://ngdc.noaa.gov/eog/viirs/download.html)。该机构对全球范围的灯光数据进行一系列算法处理,生成高质量的稳定灯光数据,其中几个重要处理包括[12]:1) 对灯光图像进行标记法处理,以区分不同光源。2) 根据不同光源进行滤光处理,利用VIIRS多光谱特性或其他算法去除杂光干扰,如闪电、月光和薄云等影响,保留了极光、火光和渔船等光源。3) 对灯光数据进行合成和重投影处理,令数据更具通用性,便于不同科研目标的使用。图 2为中国华中地区2015年12月Suomi-NPP的灯光示意图。
本文以中国内地的各省级行政区作为研究对象,研究的行政单元为31个,当中不包括台湾地区、香港和澳门特别行政区。此外,统计GDP数据主要来自中国国家统计局数据中心,时间区间为2011至2014年,以年份作为单位,故对应于灯光数据的时间应为2012至2015年。由于NOAA预处理的灯光数据是从2012年4月起发布,并以月度合成的方式提供,因此除2012年使用该年4月18日至26日整合的数据外,2013至2015年都使用该年1月1日至31日的灯光合成数据。
3 研究方法 3.1 灯光数据的提取与统计由于本文研究对象为中国内地的省级行政区,因此使用中国国家基础地理信息中心提供的中国省级行政区边界矢量数据,对灯光数据也进行相应的分割。
首先,对中国各省级行政区的灯光面积进行统计,其表达式为
$ {I_{{\text{area}}}} = {\text{card}}\left( {G > 0} \right). $ | (1) |
其中:card表示集合元素的数量,G为各省级行政区的灯光数据集合,Iarea是指集合G中的非零元素的个数。
再者,统计各省级行政区的灯光强度,即每个省级行政区的总灯光辐射值,该式可表示为
$ {I_{{\text{light}}}} = \sum\limits_{G\left( {x,y} \right) > 0} {G\left( {x,y} \right)} . $ | (2) |
式中:G(x, y)是指灯光图像的辐射值,Ilight为统计区域内的灯光辐射值之和。
3.2 灯光指标计算本文对各省级行政区进行3项灯光指标计算,当中包括总灯光强度(total night light, TNL)、归一化总辐射值(normalized total radiance, NTR)和灯光面积比(night light area ratio, NLAR)。选择这3项指标的主要考虑是总灯光强度可直接反映出该区域的活动变化情况;而归一化总辐射值则可以使区域的总灯光强度从绝对关系转化到相对关系,同时除去量纲的问题,方便与其他区域在同一尺度下比较;灯光面积比可表示为灯光占整个区域面积的比例。具体的灯光指标表达式如下所示:
$ {\text{TNL = }}{I_{{\text{light}}}}, $ | (3) |
$ {\text{NTR = }}\sum\limits_{G\left( {x,y} \right) > 0} {\frac{{G\left( {x,y} \right)}}{{\max \left( {\sum\limits_{G\left( {x,y} \right) > 0} {G\left( {x,y} \right)} } \right)}}} , $ | (4) |
$ {\text{NLAR = }}\frac{{{I_{{\text{area}}}}}}{{{S_{{\text{area}}}}}}. $ | (5) |
式中Sarea指的是整个区域的面积。
3.3 灯光指标与统计GDP的空间模型为了获得灯光指标与GDP统计数据的空间关系,本文分别采用线性和非线性回归模型对样本进行分析比较。其中,非线性回归模型包括了指数、对数、幂指数和Logistic曲线模型。具体的回归模型表达式见表 1。当回归模型建立后,再根据拟合结果来确定灯光指标与统计GDP的相关程度,并选出较好的模型进行GDP预测分析。
模型 | 数学表达式 |
线性 | |
指数 | |
对数 | |
幂指数 | |
Logistic曲线 |
表达式(6)—(9)皆采用最小二乘法对参数a和b进行求解,再代入各自的模型,从而获得相应的回归方程。另外,式(10)的Logistic曲线模型拟合属于非线性方程求解,因此本文使用了梯度下降法来求解参数a、b和c的值。
4 结果与分析本文的实验包括两大部分:1) 计算各灯光指标,并通过比较各灯光指标与不同年份GDP数据的Pearson相关系数,选出最好的灯光指标;2) 通过建立5种不同的回归模型,探索GDP数据与灯光指标的相关关系,然后利用拟合优度作为依据来选取3个较好的回归模型对GDP进行预测,并对这些模型的预测精度进行误差分析,以及解析各样本对模型的影响,最终确定Suomi-NPP灯光数据与GDP分布的关系。
4.1 灯光指标的选取首先,以2012—2015年的灯光数据为基础,通过式(3)—(5)计算出每年各省级行政区的TNL、NTR和NLAR 3项指标,如图 3所示。然后,计算每个指标与相应年份GDP数据的Pearson相关系数,从而判断出各指标与GDP数据的相关度,详细数据见表 2。
GDP数据年份 | Pearson相关系数 | ||
TNL | NTR | NLAR | |
2011 | 0.921 | 0.911 | 0.209 |
2012 | 0.925 | 0.951 | 0.220 |
2013 | 0.919 | 0.914 | 0.217 |
2014 | 0.929 | 0.935 | 0.226 |
由表 2可见,统计GDP与TNL和NTR指标的相关度要比NLAR好得多。这也说明如果使用灯光面积比,只能表达出区域内灯光的相对范围,并不足以反映人类活动情况。相对而言,基于灯光强度的TNL和NTR与统计GDP有更好的相关性。
通过图 3可知,NTR要比TNL更接近GDP数据的分布。以图 3b为例,NTR在大部分局部点上,都比TNL好。再综合2011至2014年不同时间点的分布情况来看,灯光指标中NTR整体要比TNL更有代表性。
另外,从图 3可以看出,无论是TNL还是NTR在某些省级区域的样本点上,都与真实统计GDP有一定程度偏离。这也说明该点的灯光数据未能充分反映相应区域的发展情况,可能存在以下的影响因素:1) 部分区域灯光与GDP关系吻合度不高,包括强灯光低GDP的情况,如新疆、黑龙江、辽宁、山西和贵州等地。此外,还存在弱灯光高GDP的情况,如北京、湖南、湖北和山东等地;2) 灯光图像成像误差,由于成像过程中可能出现过灯光像元溢出和背景噪声等影响,导致灯光失真;3) 其他光源干扰误差,例如火灾、炼油燃烧和自然杂光等影响。
总体而言,除了个别样本点有误差外,灯光指标与统计GDP的趋势具有一定的相似性,而NTR要比TNL更加贴近GDP的分布。因此,本文把NTR作为最佳灯光指标,并针对该指标和GDP作相应的回归和预测分析。
4.2 回归模型的选取本文利用2011至2014年中国内地各省级行政区的NTR与统计GDP构建了线性、对数、指数、幂指数和Logistic曲线模型并作了横向对比,从而找出两者间最佳的回归关系。另外,尽管多项式模型也是常用的回归模型,但是该模型容易导致过拟合情况,故排除之。
根据式(6)—(10)建立的5种回归模型,其拟合曲线如图 4所示。从各模型的拟合曲线和优度都可清晰地看到,线性、幂指数和Logistic曲线模型效果最为显著,而对数和指数模型的拟合精度较低,明显不适用于灯光与GDP数据的关系分析。虽然线性和幂指数模型在某些年份比Logistic曲线模型拟合得要好,但各自有其不同的分布特点。基于线性和幂指数模型是一种无极限(饱和)的增长,只有在自然资源和社会资源无限支持的情况下,才会获得持续稳定和增长。然而,Logistic曲线模型更符合真实的自然增长模式,其曲线趋势可分为3个阶段,包括初期慢速提升、中期快速递增和后期趋向稳定,该模型能更真实地反映出不同模式的经济发展情况。
由图 4可以看到,线性、幂指数和Logistic曲线模型不但对2011至2014年间中国内地各省级行政区的样本数据有很好的拟合效果和精度,而且展示出该3个模型的稳定性,因此本文选定这3个模型来预测GDP,并与统计GDP对比进行误差计算与分析。
本文的线性、幂指数和Logistic模型之所以取得良好的拟合结果,很大程度上得益于使用Suomi-NPP灯光数据,以及有效的灯光指标选取。为了进一步验证拟合结果的有效性,将本文结果与其他相关研究工作进行对比。在文[6]中,利用DMSP的灯光数据与GDP进行空间化处理,使用幂指数回归模型,获得分产业GDP的拟合优度最高为0.679,但是该文直接使用灯光数据的数字值,即尚未被校准成物理意义上的单位(辐射值),这会导致拟合精度的下降。文[7, 13]的研究使用2012年Suomi-NPP的灯光数据来对GDP进行关系分析,但只提取了灯光的TNL并建立各自的线性回归模型,并未与其他模型进行对比,而且这两篇文献的拟合优度低于本文图 4b线性回归模型的拟合优度。在文[14]的研究中,直接利用DMSP灯光数据与GDP进行线性回归建模,其拟合优度达到0.964,要比一般水平高得多;实际上,该研究的真实拟合精度仅为0.620,由于作者把偏差较大的样本点删除,使拟合精度得以提升,但是这种做法会导致样本缺失,不能进行有效比较分析。
通过各模型和有关研究文献对比可以看出,Suomi-NPP的夜间灯光与GDP数据有着强相关的关系,适用于社会经济数据的研究与分析。本文通过5种不同回归模型横向对比,发现除了常用的线性和幂指数回归模型外,Logistic曲线模型也取得较好的拟合结果。
4.3 GDP的预测本文通过对比不同的拟合模型,确定了线性、幂指数和Logistic曲线模型对于中国各省级行政区的NTR与统计GDP有较高的拟合优度。为了测试这3个模型预测效果,使用2011至2013年各省级行政区的NTR与GDP数据进行参数的拟合计算,从而获得各自的回归方程,如表 3所示。然后,输入2014年各省级行政区的NTR,使各模型输出相应的GDP预测值,结果如图 5a、5c和5e所示。
模型 | 预测模型回归方程 | 平均相对误差/% |
线性 | yGDP=1.446 4+680.165xNTR | 33.9 |
幂指数 | yGDP=0.398xNTR1.135 | 26.0 |
Logistic | 51.6 |
然而,从图 5a、5c和5e这3幅不同模型的预测图明显可以看出,幂指数模型要比另外两个模型的预测精度高,部分预测值与统计GDP相当接近,如广东、吉林、江苏和辽宁等地。线性和Logistic曲线模型的预测值则更为波动,存在一定的误差。为了便于对模型整体和局部预测的误差分析,本文计算了各模型预测与统计GDP的整体平均相对误差,以及各样本点的相对误差,具体如表 3与图 5b、5d和5f所示。
从表 3中各个模型平均相对误差可以看出,幂指数模型的误差是3个模型中最低的,为26.0%,而线性和Logistic曲线模型的误差分别是33.9%和51.6%,其中Logistic曲线模型有可能因样本量少,导致过拟合现象出现,影响预测结果。因此,幂指数模型更适合通过灯光数据对中国各省级行政区GDP值进行预测。
尽管幂指数模型的预测误差低于其他两个模型,但其仍存在一定的问题。从图 5d可以看出,GDP相对误差超过30%的省份行政区有7个,分别是北京、湖北、湖南、江西、重庆、山西和新疆。结合图 5c来看,幂指数模型对于前面5个地域有一定程度的低估,对于后面2个地域则存在高估的现象。另外,从图 5b和5f不同模型的误差来看,上述7个误差高的地区同样存在,再加上线性和Logistic模型不完全符合分析对象的増长关系,以至于还有其他更高的误差样本点。综合来说,单纯使用灯光数据不能完全反映出中国大部分省级行政区GDP的空间关系,仍存在一定程度的误差。
虽然灯光数据与统计GDP的几个关系模型取得了较高的拟合结果,但在实验过程中发现灯光数据存在一定的不足。首先,光学器件在黑暗环境中对灯光进行成像,不可避免地会出现像元溢出现象,即光晕效应;还有成像过程中噪声的干扰,会引起灯光图像的成像误差。其次,Suomi-NPP的灯光成像时间约为凌晨1:30,错过了人类活动的高峰时段,灯光数据未能充分反映部分地区的真实情况。再者,由于所观察的地区不可能完全处于良好的天气环境,经常会受云层、污染物和其他光源等因素影响,容易使收集的灯光数据出现偏差。因此,对GDP或其他社会经济指标的具体估算,单靠灯光数据源难以有效实现,容易出现强灯光低GDP或者弱灯光高GDP的情况,需要结合其他的遥感数据源,比如该区域的植被覆盖、地表温度和道路网络等数据,从而充分利用不同遥感数据源的优势,提高算法鲁棒性,使灯光数据获得一定程度的修正。
5 总结与展望本文采用Suomi-NPP夜间灯光数据为遥感数据源,与社会经济中的GDP数据进行同一空间尺度的关系分析。本文以中国内地各省级行政区域作为研究对象,先后对其进行灯光信息统计和灯光指标计算,通过相关性分析,选取NTR为最佳灯光指标,然后与统计GDP构建多个空间模型,分析其空间分布关系,并选出较好的模型来预测GDP。实验结果指出,线性、幂指数和Logistic模型都有很好的拟合效果,适用于建立Suomi-NPP夜间灯光数据与GDP数据的关系模型。其中,幂指数模型无论拟合和预测都有不错的结果,这也说明该模型更适合中国内地各省级行政区的灯光数据与统计GDP的空间关系分析。
本文灯光数据与统计GDP的相关性和回归分析的结果,说明了两者存在强相关的关系,这也为进一步的GDP数据估算和预测研究奠定了基础。未来研究会继续以夜间灯光数据为主,并辅以多种遥感图像数据,再通过机器学习等技术手段,深度地获取数据源的有效信息,有针对性地建立统计模型,估算和预测GDP。除了GDP数据外,还可以扩展到多种社会经济和环境发展指标的评估,如电力消耗、人口分布和城市扩展程度等。
[1] | 李飞, 张树文, 杨久春, 等. 社会经济数据空间化研究进展[J]. 地理与地理信息科学 , 2014, 30 (4) : 102–107. LI Fei, ZHANG Shuwen, YANG Jiuchun, et al. A review on research about spatialization of socioeconomic data[J]. Geography and Geo-Information Science , 2014, 30 (4) : 102–107. (in Chinese) |
[2] | Elvidge C D, Baugh K E, Kihn E A, et al. Relation between satellite observed visible-near infrared emissions, population, economic activity and electric power consumption[J]. International Journal of Remote Sensing , 1997, 18 (6) : 1373–1379. DOI:10.1080/014311697218485 |
[3] | Sutton P C, Costanza R. Global estimates of market and non-market values derived from nighttime satellite imagery, land cover, and ecosystem service valuation[J]. Ecological Economics , 2002, 41 (3) : 509–527. DOI:10.1016/S0921-8009(02)00097-6 |
[4] | Ghosh T, Anderson S, Powell R L P L, et al. Estimation of Mexico's informal economy and remittances using nighttime imagery[J]. Remote Sensing , 2009, 1 (3) : 418–444. DOI:10.3390/rs1030418 |
[5] | 刘红辉, 江东, 杨小唤, 等. 基于遥感的全国GDP 1 km格网的空间化表达[J]. 地球信息科学学报 , 2005, 7 (2) : 120–123. LIU Honghui, JIANG Dong, YANG Xiaohuan, et al. Spatialization approach to 1 km grid GDP supported by remote sensing[J]. Geo-Information Science , 2005, 7 (2) : 120–123. (in Chinese) |
[6] | 韩向娣, 周艺, 王世新, 等. 夜间灯光遥感数据的GDP空间化处理方法[J]. 地球信息科学学报 , 2012, 14 (1) : 128–136. HAN Xiangdi, ZHOU Yi, WANG Shixin, et al. GDP spatialization in China based on nighttime imagery[J]. Journal of Geo-Information Science , 2012, 14 (1) : 128–136. DOI:10.3724/SP.J.1047.2012.00128 (in Chinese) |
[7] | Shi K, Yu B, Huang Y, et al. Evaluating the ability of NPP-VIIRS nighttime light data to estimate the gross domestic product and the electric power consumption of China at multiple scales: A comparison with DMSP-OLS data[J]. Remote Sensing , 2014, 6 (2) : 1705–1724. DOI:10.3390/rs6021705 |
[8] | 柴子为, 王帅磊, 乔纪纲. 基于夜间灯光数据的珠三角地区镇级GDP估算[J]. 热带地理 , 2015, 35 (3) : 379–385. CHAI Ziwei, WANG Shuailei, QIAO Jigang. Township GDP estimation of the Pearl River Delta based on the NPP-VIIRS night-time satellite data[J]. Tropical Geography , 2015, 35 (3) : 379–385. (in Chinese) |
[9] | Ebbensgaard C L. Urban lighting, light pollution and society[J]. European Planning Studies , 2015, 23 (7) : 1437–1440. DOI:10.1080/09654313.2015.1046613 |
[10] | Patino J E, Duque J C. A review of regional science applications of satellite remote sensing in urban settings[J]. Computers, Environment and Urban Systems , 2013, 37 (1) : 1–17. |
[11] | Elvidge C D, Baugh K E, Zhizhin M, et al. Why VIIRS data are superior to DMSP for mapping nighttime lights[J]. Proceedings of the Asia-Pacific Advanced Network , 2013, 35 : 62–69. DOI:10.7125/APAN.35 |
[12] | Baugh K, Hsu F C, Elvidge C D, et al. Nighttime lights compositing using the VIIRS day-night band: Preliminary results[J]. Proceedings of the Asia-Pacific Advanced Network , 2013, 35 : 70–86. DOI:10.7125/APAN.35 |
[13] | Li X, Xu H, Chen X, et al. Potential of NPP-VIIRS nighttime light imagery for modeling the regional economy of China[J]. Remote Sensing , 2013, 5 (6) : 3057–3081. DOI:10.3390/rs5063057 |
[14] | 王琪, 袁涛, 郑新奇. 基于夜间灯光数据的中国省域GDP总量分析[J]. 城市发展研究 , 2013, 20 (7) : 44–48. WANG Qi, YUAN Tao, ZHENG Xinqi. GDP gross analysis at province-level in China based on night-time light satellite imagery[J]. Urban Development Studies , 2013, 20 (7) : 44–48. (in Chinese) |