环境计算:概念、发展与挑战
魏泽洋1, 刘毅1, 王春艳1, 张佳2, 边江2, 姚琳洁1, 林斯杰1,3, EWE Kaijie1    
1. 清华大学 环境学院, 北京 100084;
2. 微软亚洲研究院, 北京 100080;
3. 南方科技大学 环境工程学院, 深圳 518055
摘要:环境计算是一个新的交叉学科概念, 是以解决复杂环境问题为目标, 以计算为过程载体, 进行环境过程数值分析和(或)环境数据分析的定量化研究过程的统称。这一概念支持将环境科学和计算科学的多种交叉融合方式纳入同一框架下进行讨论, 以梳理环境计算的发展脉络、归纳研究模式和识别前沿方法。该文阐述了环境计算的基本概念和主要特征, 归纳了1.0模式——基于过程机理的环境计算、2.0模式——数据驱动的环境计算和3.0模式——面向未来的融合环境计算的方法学特点和典型应用, 分析理论驱动和数据驱动相融合的环境计算发展趋势, 探讨了环境计算潜在创新与突破方向, 并提出环境计算研究面临的基础理论、关键技术及应用场景、算力以及学科交叉等方面的重要挑战。
关键词环境计算    研究范式    大数据    复杂环境系统    理论驱动    数据驱动    
Environmental computing: Concept, evolution, and challenges
WEI Zeyang1, LIU Yi1, WANG Chunyan1, ZHANG Jia2, BIAN Jiang2, YAO Linjie1, LIN Sijie1,3, EWE Kaijie1    
1. School of Environment, Tsinghua University, Beijing 100084, China;
2. Microsoft Research Asia, Beijing 100080, China;
3. School of Environmental Science & Engineering, Southern University of Science & Technology, Shenzhen 518055, China
Abstract: As an emerging interdisciplinary concept, environmental computing is a term used for the quantitative research process of environmental process numerical analysis and (or) environmental data analysis based on computing. Under this conceptual framework, various kinds of environment and computational science integrations are discussed together for ensuring development in this field as well as summarizing advanced research models and methods. This paper introduces the definition and basic characteristics of environmental computing and explains the methodological characteristics of various types of environmental computing based on typical cases. Environmental computing has transitioned from theory-driven to data-driven and then to hybrid computing. The comprehensive computing framework shows considerable advantages compared to conventional approaches or single methods. To achieve significant breakthroughs, researchers need to constantly explore basic theories, including environmental and computational theories, and promote the transformation of environmental thinking to adapt to the frontier content of computational science. Additionally, challenges such as big data theory, technical application scenarios, and computing power also need to be overcome.
Key words: environmental computing    research paradigm    big data    environmental complex systems    theory-driven    data-driven    

环境科学旨在探究社会发展与自然环境演化之间的相互作用关系,寻求可持续发展途径[1]。但环境系统是一个难以完整把握和描述的复杂系统,会受到经济、政治、文化观念、自然地理条件等各种各样不确定因素的影响。学者们试图采用各类分析手段解决复杂的环境问题。近年来,研究模式已发生巨大变化:从经典实验归纳,到基于逻辑的演绎,再到以统计理论和物理世界相互作用关系为基础的计算建模。环境科学领域的一个典型案例是空气质量预测:得益于环境科学和计算科学的进步,学者们通过整合理论机理(大气动力学等)、提高计算能力和建立观测系统(大量数据动态纳入建模系统)使得空气质量预测有了很大的改进。环境科学与计算科学进行交叉融合,可以弥补传统环境科学领域分析方法的短板,增强人们对复杂环境系统的认知与分析能力,更使得环境研究的思维、方法都产生了巨大的转变。尽管学界已经开展了环境科学与计算科学的融合研究和应用,但尚未形成一个合适和统一的概念框架来归纳和引导计算和环境的交叉融合。基于此,本文提出了“环境计算”这一概念,旨在从环境科学领域出发,全面梳理环境科学和计算科学的融合发展脉络,结合当前实际环境问题需求与相关前沿技术进展,探索“环境计算”未来发展方向,并揭示面临的主要问题和关键挑战。

1 环境计算的基本概念

计算(computation)科学与计算机密切相关,但又如图灵奖得主Dijkstra指出的“其不只是关于计算机,就像天文学并不只是关于望远镜”[2],它涵盖了众多基础理论(如计算复杂性理论、算法和数据结构等),以及如何在计算机系统中实现这些内容的实用技术(如机器学习、计算机建模和分布式计算等)。目前计算已成为环境科学研究的核心内容之一,在多个细分领域表现出多样的实践形式,如细颗粒污染物迁移过程数值模型求解[3]、大气持久性有机污染物(POPs)浓度的机器学习预测[4]、以及基于监测数据的城市交通污染排放模拟[5]等。计算科学在多个维度为环境领域研究者提供了支持,如计算硬件软件、环境数学建模、环境数据分析等。总体来看,计算科学对环境领域的影响主要体现在2方面:一是提高对环境过程的刻画和理解能力,二是提高对环境数据的获取和处理能力。已有学者提出若干概念来描述环境科学与计算科学的交叉应用。例如,Hunter[6]提出了“环境计量学(environmetrics)”,泛指环境领域使用统计、计算机、机器学习等技术进行定量分析的研究与应用。Frew等[7]提出了“环境信息学(environmental informatics)”概念,从信息技术在环境领域运用的角度出发,重点关注计算技术内容,包括“利用大量的多维且复杂的数据集来研究环境问题”,以及利用“存储硬件、数据库与接口”等,强调了数据对环境的重要意义,指出了环境研究领域存在着将数据作为计算基础的趋势。2015年,Heikkurinen等[8]首次使用“环境计算(environmental computing)”这一词汇,将与环境数值模拟相关的“模型、元数据、评价标准和政策目标等”统筹起来作为一个综合分析框架,按照一定的评价准则对计算结果进行调整,动态实现环境管理的政策目标,完成整个分析就是一次环境计算过程。但目前提出的有关环境科学与计算科学交叉应用的概念更多强调数据信息、计算技术、计算结果等,对环境机理过程、环境科学思维等环境科学的内涵考虑不足。

本文认为,环境计算是一个综合的概念,既包括环境背景和环境科学理论,也融合了计算模拟和数据分析等内容。具体地说,环境计算是以解决复杂环境问题为目标、以计算为载体,进行环境过程数值分析和(或)环境数据分析的定量化研究过程。开展这一过程有助于加深研究者对环境问题本质的理解、帮助研究者识别广泛的规律、实现合理地描述甚至预测环境的变化。环境计算的重要内容是“输入-运算-输出”过程:研究者立足环境问题和实际需求,将模型和数据输入计算机,构建虚拟的运算环境,得到运算分析结果,并解决现实世界环境问题的工作。本文将对不同类型的环境计算进行梳理和介绍,并对未来环境计算的发展趋势进行展望。

2 1.0模式:基于过程机理的环境计算

不同学术语境中,机理分析对应着多个相似概念,如基于过程(process-based)、知识引导(knowledge-guided)、理论驱动(theory-driven)及物理过程引导(physics process-guided)等。尽管表述存在差异,但其本质的分析方式相似,本文将相关概念统称为“机理分析”。环境机理分析是一种应用广泛的基础分析方法,主要是基于环境系统中物理、化学、生物机理过程进行分析研究,寻找其内在规律和相互关系,解释环境现象并解决环境问题。环境机理模型是建立在环境机理过程分析基础上、用数学符号描述复杂的机理过程、以微分或偏微分方程求得解析解的数值模型,具有高度抽象化、精简化和有限条件等特点,旨在反映事物的本质、解释环境过程。环境机理模型可以实现对环境系统中关键部分的近似描述,或对环境系统进行全面抽象概化。

基于过程机理的环境计算既强调对环境机理过程的认识,又强调对机理过程的数值化计算;既包括环境科学的理论研究,又包括数据信息、计算技术等计算科学的实践应用。其核心内容为环境系统各类要素之间的相互作用关系,追求有限性、确定性、程序化和可计算的理念也已深刻融入环境科学思维。这一领域中,学者们不断强化对环境机理的研究和增强数据与计算技术应用,实现对环境系统更精确的描述与计算,主要包括:减少模型结构带来的不确定性[9];改进数据监测与收集技术,提高数据数量与质量,减少计算输入带来的不确定性[10];借鉴不确定性、敏感性分析工具,如Monte Carlo分析[11]、HSY[12]、GLUE方法[13]以及人工神经网络等;借鉴一些跨学科分析手段,在简化模型的基础上提高特征提取、计算与预测的准确性。

基于机理的环境计算具有诸多优势,最突出的便是其对复杂环境过程的刻画能力。例如,水质模型是对水环境中污染物变化规律、影响因素及相互关系的数学描述[14]。随着计算技术的发展,经典的氧平衡模型得到优化,研究者可以纳入更多的水质计算过程并求得解析解,如纳入氧化物和底泥的交互作用进行水质预测等。如今,机理计算更加符合真实的物理化学过程和污染物形态特征,同时具有良好的可解释性和迁移性,无需对底层计算框架进行大规模改动,比如被广泛应用于不同案例地区、不同时空尺度的QUAL-II模型、WASP模型、AERMOD模型等,表 1列举了部分环境领域具有代表性的机理计算内容。

表 1 代表性机理计算模型、应用领域及案例
机理计算模型 应用领域 代表性研究案例
水质分析模拟程序(WASP)、水体低氧形成理化模型、潮汐水质模型 水质模拟 文[15-17]
余氯一级衰减模型、多物质管网水质模型、暴雨洪水管理模型(SWMM) 给水排水 文[18-20]
碳键机理(CBM)、区域酸沉降机理(RADM)、区域大气化学机理(RACM) 大气质量模拟 文[21-22]
土壤侵蚀方程(USLE)、水蚀预报模型(WEPP)、流域分布式事件模型(AGNPS) 土壤及地下水 文[23-25]
填埋场产气一级耦合反应模型、有机污染物迁移转化动力学模型、填埋场热力学沉降机理 固废处理及资源化 文[26-28]

为了与现实环境系统接近,学者们尝试设计更加复杂的计算过程,以期准确、清晰刻画环境机理的微观过程和环节[29]。但计算过程越复杂,涉及的内容越多样,包括但不限于:数据预处理、统计采样、多种输入变量的选择、参数选取及率定、环境状态的预测、不同设备与模块的衔接计算、仿真与不确定性识别等。但由于环境机理的复杂性和科学界认知的局限性,环境要素间关系及系统内部理化生过程并不完全被研究者掌握,数值计算中函数表达依赖前提假设、参数设置依赖经验规律,学者们常将机理过程与经验结合,使得基于机理的环境计算并不完全是“白箱”,更多表现出“灰箱”属性[30](见图 1)。例如,至今仍无法用单一的理论模型计算出地下水位下降对全球气候的影响[31]

图 1 基于机理的环境计算一般模式

基于机理的环境计算仍存在诸多不足,如高度依赖对环境系统机理过程的认识、环境过程概化困难、计算过程的不确定性、数据不充分等问题。在具体研究中,学者们往往适当简化环境系统机理过程、降低模型复杂性、减少计算难度,比如关注水环境系统的泥沙侵蚀过程,应着重刻画泥沙侵蚀物理过程,同时适当简化其他过程[32];关注不同尺度的水环境交互过程,就着重刻画水系统层次间的机理联系,适当简化单一尺度内部的机理过程,寻求复杂性和可解释性之间的平衡。

3 2.0模式:数据驱动的环境计算

与基于机理过程的环境计算不同,数据驱动的环境计算往往不着重刻画环境污染过程机理,而是利用大量数据、结合人工智能方法从中挖掘信息,甚至无需直接接触所研究的对象[33]。数据驱动的核心内容是数据分析,目的是“在大量的数据集中寻找模式,并从中提取出有价值的部分来生产数据产品指导实际工作”[34]。近年来,先进的数据分析技术与环境研究深度融合,在定量分析大规模环境数据、改善数据管理机制、描述和预测环境变化等方面表现出极大的优势。图灵奖得主Gray将这种数据密集型科学(data-intensive science)描述为继实验研究、理论研究、计算型研究后科学研究的“第四范式”[35],也有学者将这种理念称为“数据主义”(dataism)[36-37]。数据驱动的环境计算优势集中体现在对整体系统特征的定量识别、模式归纳和规律揭示,这类计算模型表现出“黑箱”特征,用一种类似于“暴力求解”的方式实现从环境数据输入到输出的过程(见图 2),在应对系统边界模糊、机理过程复杂、时空尺度较大的环境问题时展现出一定的相对优势。如今,史无前例的数据源、不断增强的计算能力以及数据科学的最新进展为研究者从数据中发掘环境系统的知识提供了新的机会,特别是机器学习和人工智能领域的方法和工具被广泛应用,促进了数据驱动的环境计算快速发展,展现出令人振奋的快速发展态势。本节将重点分析环境计算的数据基础,归纳数据驱动的计算方法在环境计算领域的新进展,讨论其面临的主要局限。

图 2 数据驱动的环境计算模式

3.1 环境计算2.0模式的数据、软硬件及服务基础

数据科学及数据分析技术的发展使得以数据为中心的环境研究模式越来越多地被采用,逐渐成为环境领域研究的重要内容[38],特别是进入大数据时代以来,数据科学为环境计算提供了更加全面、成体系的技术支撑,包括数据本身、软件、硬件及服务等(见表 2),在应对复杂环境模式识别、资源枯竭、全球气候变化、生物多样性等大范围和持续性环境问题时表现出巨大的优势,并表现出不同于传统数据存储分析的独特性,集中体现在:1) 数据体量更大,例如加拿大海底生态监测网络计划,每秒可记录10 GB的生态环境数据[42];2) 数据非结构化特征更明显,不仅包括表格,还包括视频、图形、文本、语音等,如环境噪声数据、生态下垫面地理信息系统(GIS)数据等;3) 数据获取方式更多样,传统数据获取依靠手动输入,大数据的获取多借助统一资源定位地址(URL)传输和应用程序接口(API),以及爬虫抓取、记录存留、信息上传和数据共享等,如爬虫抓取排污在线监测数据、无线传感网络上传的实时环境监测数据;4) 数据信息量更大,传统数据的价值局限于信息表征与传递,大数据可以记录事件发生与运转的全过程,分析对象的运作规律、挖掘对象内部的结构与特征,例如大数据驱动的工业用地识别与风险管控[43]、借助实时水质数据识别废水处理过程中的异常事件[39]、数据驱动的居民出行模拟与碳排放估算[44-45]、基于大数据的城市噪声模拟[46-47]。可以预见,大数量级、高精度和具有多元参数的环境数据在未来将成为普遍的研究基础,为环境计算提供坚实的数据基础,经典的环境机理研究中的本地化参数需求和数据输入可能不再是数据驱动的环境计算应用的约束。

表 2 环境计算2.0的数据、软硬件及服务基础
基础模块 具体内容 发展趋势 应用形式或案例
数据内容 地面监测数据
遥感影像数据
专项调查数据
实验分析数据
社会经济数据
数据来源更加多元、数据量更大、数据维度更多、数据内容更丰富 环境统计数据,污染普查数据;
全球环境监测系统(GEMS),全球陆地观测系统(CTOS),国际长期生态研究网络(ILTER),全球通量观测网络(FLUXNET)
软件及硬件 服务器
传感器
存储设备
操作系统及软件
建立专门、专业的环境数据服务器;
向云计算、边缘计算等模式发展
空气质量检测设备、生物化学传感器、无线传感器网络、遥感及环境测绘等;
中科曙光生态环境数据基础设施云平台[39],百度智慧生态环境服务系统[40],国家生态环境大数据超算云中心[41]
数据服务 数据收集
数据处理
数据调用
数据分析
流程规范化、集成化、高效化、开源化 传感器收集、环境主体运行日志、网络爬虫环境数据
环境数据批量处理
环境数据库
环境数据挖掘、人工智能、云计算等

尽管数据科学已经和环境计算的各个过程紧密结合,但研究者一方面受制于数据监测网络、数据管理硬件及算力等技术瓶颈,很难完全获得所需的环境数据;另一方面受制于数据科学的分析壁垒、环境问题认识、数学概化能力等研究者专业特长瓶颈,环境问题很难准确转换为可计算的数据分析问题。因此,在获取更多环境数据的同时,也应注重数据处理和分析技术的改进。

3.2 环境计算2.0模式的实际应用

以数据统计、机器学习为代表的数据驱动分析技术已广泛运用于环境领域,表现出优越的分析性能和应用价值。机器学习是人工智能的重要分支,也是目前实现黑箱计算的主要工具之一。更确切地说,机器学习是一个统计分析领域,借助计算机训练的算法对一组数据进行降维、分割、排序和转换等操作,以最大限度地提高分类、预测、聚类或发现目标数据集中模式的能力[48]。机器学习包含多个分支,如K近邻、层次聚类、决策树、支持向量机(SVM)、人工神经网络(ANN)等,对于基于过程机理的计算而言,处理大量数据时归纳模式、提取重要特征和识别各种变量之间的联系并不简单,此时,机器学习显示出一定潜力,并成为环境科学描述和分类的常用方法,如使用灰色聚类分析法对重大水污染源的水质进行分析[49]。机器学习另一类代表性应用是回归和预测,在环境过程参数获取和更新、环境时空预测领域表现优异,且能较好地应对部分数据稀缺、偏差等问题。例如,具有一个隐藏层的人工神经网络能够过滤噪声,预测CO2通量的变化规律,而基于机理的碳循环过程模拟则往往难以应对数据噪声问题[48]。机器学习还可部分地补充机理分析的不足,例如经典的大气化学传输模型(CTM)已被广泛用于模拟一定时空分辨率下的PM2.5浓度,但结果通常容易产生偏差和误差,而囊括一般线性模型、全连接神经网络、随机森林和梯度提升机的综合机器学习可以适应多种模拟和观测场景,并提高PM2.5预测的准确性[50];再如全球土地蒸散量对气候变化的影响,尽管存在直接观测数据的限制,但机器学习方法仍能够很好地识别蒸散对气候变化影响的关键参数[51],在一定程度上弥补机理分析的不足,甚至有可能以纯数据驱动的方式量化全球陆地自然循环和蒸散过程[52]

近年来,以循环神经网络(RNN)、卷积神经网络(CNN)为代表的深度学习在计算机视觉、自然语言处理等方面取得很大进展,并在环境领域研究中得到应用,其优势集中体现在充分利用数据信息和分类预测的高准确性。Reichstein等[48]将深度学习细分为空间数据学习(如用于分类的CNN[53])和时间序列数据学习(如环境噪声地图[47, 54]),且这些形式往往被综合运用,提供比单一方法更多的信息。环境作为一个复杂系统,其中包含的数据无论是种类还是数量都能够为深度学习的应用提供丰富的基础,并且分类、预测和动态计算也一直是环境领域研究的经典问题。深度学习在环境模式识别、长期环境预测等领域已有一些出色的研究案例,可对传统的机理计算或机器学习方法起到补充(见图 3)。例如,运用长短记忆神经网络(LSTM)可以提供更精确的水文状态预测[58];结合CNN的数据融合方法提供了低成本高效益的洪水风险识别地图,可改进现有的洪水动力学模型[59];深度学习也成功应用在地下水水质预测领域,并被证实可以提供优于随机森林等机器学习方法的预测结果[60]

图 3 典型深度学习应用(上)及相应的环境计算内容(下)举例[55-57]

数据驱动的环境计算已有较多的应用,但也存在明显的局限性:1) 数据驱动的环境计算难以充分结合环境系统状态数据的时空分异特性。例如在陆地-大气系统CO2预测中[61],机器学习可以将瞬时、局部环境条件(如温度和湿度) 映射到瞬时通量。但在现实中,时间和空间永远是连续而非离散的,环境过程总是受到系统状态的额外影响(如相邻空间干扰和时间记忆性),而机器学习依赖于有条件的输入,在数据不足的情况下将无法捕捉到这些额外信息,进而影响最终的计算可靠性。2) 数据模型的拟合需要充分的训练集和测试集,且大多数情况下的模式识别需对应的标签(labels),然而现实环境模式往往难以完全得到标记,特别是环境领域的未知模式更加复杂多样,在对这些未知的环境模式进行预测时,这种局限更加突出。3) 数据驱动的计算效果依赖数据的数量和质量,而环境领域普遍存在数据稀缺、分布不清晰及监测偏差较大情况,一定程度上制约了数据驱动方法的推广。4) 计算模式的可迁移性(或可复制性)不足。很多在测试集训练良好的计算模型迁移到其他场景时往往表现不佳,其根本原因在于数据驱动的环境黑箱模型更多地反映数据相关性,对数据背后的环境科学原理、环境变化规律及因果关系机制解释不足[62],无法建立起普适性计算模型。例如,机器学习已被用于膜分离去除微污染物的预测,但其可靠性可能会因数据不充分而降低,更重要的是机器学习无法刻画膜分离的机理,难以保证其预测稳定性[63]

数据驱动的环境计算未来仍有很大发展空间,随着基础技术的进步,或许很快将实现更大空间、更长时间跨度的计算。为了最大化数据驱动的计算价值,除了提高技术本身的水平、最大限度地从数据中获得知识,还需要提高计算的理解能力、与自然环境系统与社会环境系统的基本原理相匹配。将机理分析与数据驱动模式相结合的环境计算正在成为一个新的方向。

4 3.0模式:面向未来的融合计算模式

从研究范式上看,机理分析(或物理模型)和数据驱动计算通常被视为2个不同的领域。事实上,这二者是互补的:机理研究可直接分析观测数据并建立过程机理,通常具备一定普适性;数据驱动计算在处理数据方面非常灵活,且易于发现理论之外的现象和规律。机理计算和数据驱动计算之间存在渐进的过渡区域,图 4展示了这种过渡和交叉关系[64]:最左侧是在数据有限时,研究者可以表述所有物理世界的过程;最右侧是大数据情景,研究者可能不知道任何物理规律,此时数据驱动的方法可能是最有效的,在3.2节中已举例说明。但实际中普遍存在是中间区域:研究者掌握一部分数据和原理,但可能缺少一些参数值或偏微分方程中的某个项,例如大气环境的“平流-扩散-反应系统”[65]中的反应过程是无法完全数值化表示的,这也符合大部分环境研究的现实状况,这种理论和数据交叉的中间地带共同构成了综合性环境计算的现实基础和实际需求。

图 4 机理计算与数据驱动计算之间的过渡关系[64]

针对当前单一计算模式的不足,有学者提出了基于物理规律改进的机器学习模式(physics-informed machine learning)[64],其核心是将部分机理分析方法嵌入机器学习的计算过程,以使神经网络自动满足某些物理不变量,同时具有更好的精度、更快的训练和更强的泛化能力。例如,将一部分机理模型嵌套于神经网络层之上,对神经网络的输出结果进行校正[66];物理信息神经网络(PINNs)将偏微分方程嵌入到神经网络的损失函数中作为约束,以使其适应训练数据的同时产生符合基本物理原理(如质量守恒、动量守恒、单调性等)的预测结果[64]。基于过程引导的机器学习(process-guided machine learning)、物理引导的机器学习(physics-guided machine learning)、物理感知的机器学习(physics-aware machine learning)等前沿概念同样是基于机理过程对机器学习进行改进,在环境领域也有探索应用,例如Hanson等[67]将基于过程的湖泊磷动态模型和RNN相结合,并且用生态学原理约束预测,研究表明基于过程的湖泊磷动态模型虽然可应对大部分短期情景,但在长期趋势预测方面表现不足,而受磷循环过程和生态约束的机器学习则表现出更好的预测性能;Read等[68]设计了过程引导的湖泊温度机器学习预测模型,包含了LSTM和基于理论的反馈过程(违背能量转换原理的惩罚机制),同样表现出比单一模型更好的预测能力。

尽管目前这些基于物理或过程改进的机器学习在环境科学研究领域的应用总体上还比较少,但给研究者提供了前沿方向,帮助研究者识别不同类型的环境计算的优点,挖掘现有机理模型或数据驱动计算过程的改进路径。本文受Reichstein等[48]和Tahmasebi等[69]启发,系统地提出目前融合模式的环境计算的3个发展方向:

1) 改进机理计算模型的参数识别方式。大量的环境微观变化过程参数或交叉学科领域机制难以根据现有经典理论识别,运用机器学习方法进行量化分析具有潜在重要意义和应用前景。例如,从多个数据源获取湖泊环境属性信息,并作为机理计算模型的参数应用到其他未监测湖泊的环境预测[70];从数千个集水区学习环境变量(如降水量)到参数(如集水区流量)的映射关系,并将其迁移至更大范围的水文模拟[71]

2) 用数据驱动计算替代一部分机理计算内容。若某环境过程缺少理论方程支撑但有相对充足数据,可运用机器学习等计算方法弥补机理研究不足的局限。例如,Xing等[72]将CTM模拟的化学指标纳入深度学习神经网络模型,可快速估算空气质量响应函数中的参数,提高了深度学习方法刻画非线性大气化学和物理过程的能力。也有学者将过程机理整合进入机器学习框架,例如将物理模型作为一个特殊递归神经层纳入深度学习结构中,在流域内径流模拟和预测方面表现出良好的鲁棒性和预测精度[73]

3) 运用数据分析和机器学习修正机理模型输出。机理计算过程在理论上和认知上均存在不完善的“灰箱”部分,计算模型输出与实际观测之间存在偏差。因此,借助机器学习可以从数据中识别和归纳潜在变化规律,动态地调整机理模型的计算结果。在计算结果的获取上,由于机器学习的仿真训练可以比理论分析模型表示更多的信息,能以较低的代价重复试错,并且可以快速地进行灵敏度分析、参数校准和置信区间估计等工作[74],因此适用于一些实验条件苛刻或机理内容复杂的环境计算问题,改进模型的输出。

表 3列举了一些融合模式的环境计算案例。可以发现不同计算模式之间的方法学边界逐渐模糊,研究者会根据研究需求对融合环境计算框架进行优化。一些研究强调过程识别的意义,同时突出精细化管理的需求,往往会重视机理计算内容;还有一些研究以数据驱动为主,以满足环境管理的精准性和时效性要求。

表 3 融合模式的环境计算案例
应用领域 机理分析内容 数据驱动内容 融合计算优势 参考文献
非点源污染模拟与管控评估 构造IMPULSE分布式非点源模型刻画非点源污染形成及传输过程;SWMM暴雨管理模型刻画降水驱动的污染传输过程 机器学习方法用于参数率定;数据驱动的拓扑映射关系拟合 提高耦合多模块复杂模型的计算效率;实现更准确的模拟预测 文[75]
大气污染物扩散及预测 Gauss扩散、烟团模型刻画大气污染物扩散过程 基于粒子滤波的实时观测数据同化 环境过程描述充分;借助观测数据动态更新参数 文[76]
PM 2.5浓度预测 基于大气扩散机理的气象模式分类 差分自回归滑动平均—支持向量机组合模型(ARIMA-SVM)进行同气象模式下的PM 2.5预测 包含气象模式和时序线性关系,数据信息挖掘更充分;避免普通SVM对下降趋势的时间序列进行预测时结果偏高的问题 文[77]
瞬时洪峰流量估算与管控模拟 SWAT水文模型刻画水文过程并估计最大平均日流量 ANN、SVM等预测瞬时峰值流量 解决观测数据稀缺时的瞬时水文流量预测问题;减少与机理计算模型参数有关的不确定性 文[78]
降雨径流模拟 地表径流水文过程数值刻画;地表蒸发过程数值刻画 数据驱动的Gauss过程回归;基于潜在蒸发量和水文过程改进后的数据驱动模型 提高综合预测性能;减少与机理计算模型参数有关的不确定性 文[79]
城市地区蒸散量估计 涡流协方差法直接测量城市地标蒸散通量 使用卷积神经网络、随机森林算法和GIS数据进行高精度预测 充分考虑时间和空间数据信息;提高模型计算精度和时空外推能力 文[80]

除了机理和计算技术上的融合改进,一些更前沿的科学技术同样给环境计算3.0模式带来更大的发展契机。研究者可推动环境科学与工程领域的数字孪生(digital twin)应用,或探索建设环境科学的元宇宙(metaverse)应用体系,用数字化的方式创建真实环境的虚拟映射,借助数据模拟环境要素在现实中的变化,通过虚实交互反馈、数据融合分析和决策迭代优化等手段,拓展分析实际环境问题的能力[81],例如用数字孪生赋能水系统,可以对水厂不同工段关键参数进行监测,结合智能模型,实时优化工艺设备参数,实现智能投药、精准曝气,从而降药耗、降碳耗、降碳排[82]。美国科学家建设了哈德逊河智能生态保护恢复系统,借助分布式传感器网络搜集实时数据、使用“流计算”技术对搜集到的数据进行处理,在综合数据分析的基础上形成虚拟河流,进一步了解生态系统以支持环境管理科学决策[83]

目前环境计算3.0模式还在初步发展阶段,仍十分依赖计算机领域的前沿进展,尚未形成以环境科学为主体的方法学体系。随着基础环境理论认知的拓展和计算技术的进步以及二者进一步的深度交叉融合,环境科学研究的机理过程可解释性和数据信息挖掘能力将取得更大的突破,未来融合模式的环境计算或许将彻底打破学科与方法学边界,实现对环境复杂系统更加科学、完备和高效的计算。

5 环境计算发展面临的挑战 5.1 环境复杂性认知的挑战

现代计算科学极大提高了模拟、分类和预测能力,然而对于促进环境过程原理的系统认知与深入理解所发挥的作用仍有待加强。目前学术界对环境复杂系统的内部结构、演进机制、反馈动力等方面仍存在许多未知,这从根本上阻碍了环境机理模型与数据驱动方法的深度融合,使得环境计算基本理论、普适性方法、关键技术等方面还未能取得重要的突破性进展。数据驱动方法在提高模型精度和应用广泛性的同时也带来了解释力上的挑战,需要在增强环境复杂系统认知的基础上对计算过程和结果深入分析,进一步实现深度融合的环境计算。

5.2 学科交叉融合的挑战

环境领域为人工智能和深度学习的发展提供了丰富的应用场景,但环境计算本身仍滞后于计算科学的发展,注重计算技术和数据技术的环境应用而忽视环境科学和计算科学的交叉融合发展,存在陷入“拿来主义”的困境和风险。当前,计算科学正在从“深度学习的根本理解、自监督及小样本学习、知识和数据有机融合”3方面寻求突破[84]。相应地,如何在环境领域识别并构建典型应用场景,突破信息计算技术和环境学科之间的壁垒,推动思维方式转变、促进环境融合计算模式发展,将是未来环境计算领域所面临的重大挑战。

5.3 环境大数据应用的挑战

大规模、高时空精度的数据既是机遇,也是挑战。一方面,跨领域数据共享往往受到限制,不同数据源可能存在封闭性或关系断裂,研究者无法获取准确充分的数据集,数据公开性、透明性和可得性较差。不同部门机构掌握同一领域环境数据,数据片段化、安全性、系统性差。例如,中国水环境治理方面“九龙治水”状况至今仍未根本改变,涉水数据破碎化、零散性和重复性等问题依然十分突出。另一方面,大数据应用带来了算力上的挑战,数据量膨胀、算法设计复杂度增加,计算模型训练规模增大等均须巨量算力支撑才能有效实施;而更高的功耗、硬件损耗及服务器载荷等原因,使得算力在一定程度上已成为未来大数据科学、人工智能等计算学科及工程领域应用取得突破的关键制约因素之一。

5.4 应用场景不确定性的挑战

社会经济发展对资源环境系统压力逐渐增大、人们对环境系统的不断认知,环境问题不断演化,传统环境问题仍然突出,新兴环境问题不断显现。环境科学既要关注微观世界,如纳米材料对环境污染物的去除作用和效率,又要着眼宏观世界,如全球尺度、世纪尺度的气候变化问题。不同视角、不同尺度环境应用场景的理论框架、计算方式和思维模式具有很大差异性,并且随着认识的深入和环境复杂性的提高,环境问题场景的不确定性将进一步增强。环境计算需要在应用场景的不确定性条件下提高环境计算思维和计算方法的适应性。

5.5 环境计算人才培养的挑战

环境计算是计算科学和环境科学的交叉融合,需要专业人才既要了解环境科学的基本原理和知识,又要掌握计算科学的计算思维和技巧。现有的人才培养制度更多依托于专业学科,如环境科学与工程、计算机科学与技术。虽然近年来不少高校院系推出交叉学院或大数据学院,但其中鲜有专门针对环境领域与计算科学交叉的课程内容和人才培养体系。

6 结论

随着计算科学及技术在环境领域的应用愈发广泛,环境科学研究领域需要形成一个合适的概念框架来归纳和引导计算和环境的交叉融合。基于此,本文提出了一种环境计算概念框架,归纳了国内外已有环境计算领域研究进展,阐明了环境计算的基本内涵,提出了3种环境计算模式的主要特征、研究模式以及环境计算面临的关键挑战。计算思维与计算技术已逐步应用于环境研究各个领域,环境计算尚处于初期发展阶段,但其作为一个独立的重要研究方向已逐步显现。

本文认为,今后环境计算领域的发展重点主要包括:1) 推动数据分析与环境过程分析深度融合,促进计算学科与环境学科大交叉,支撑环境过程原理、环境系统理论等方面的创新发展;2) 辨识并构建典型环境应用场景,建立环境计算标准模式,促进环境计算应用领域不断拓展;3) 突破环境数据获取、环境数据分析、环境过程辨识、环境系统仿真等一系列环境计算关键技术,为决策管理提供更为科学可靠的科学支撑。

参考文献
[1]
CHIRAS D D. Environmental science[M]. Sudbury: Jones and Bartlett Publishers, Inc., 2001.
[2]
FELLOWS M R, PARBERRY I. SIGACT trying to get children excited about CS[J]. Computing Research News, 1993, 5(1): 7.
[3]
LI Q J, PRIGIOBBE V. Numerical simulations of the migration of fine particles through porous media[J]. Transport in Porous Media, 2018, 122(3): 745-759. DOI:10.1007/s11242-018-1024-3
[4]
ZHAO Y, WANG L, LUO J M, et al. Deep learning prediction of polycyclic aromatic hydrocarbons in the high arctic[J]. Environmental Science & Technology, 2019, 53(22): 13238-13245.
[5]
ODUYEMI K O K, DAVIDSON B. The impacts of road traffic management on urban air quality[J]. Science of the Total Environment, 1998, 218(1): 59-66. DOI:10.1016/S0048-9697(98)00201-0
[6]
HUNTER J S. 1 Environmetrics: An emerging science[J]. Handbook of Statistics, 1994, 12: 1-7.
[7]
FREW J E, DOZIER J. Environmental informatics[J]. Annual Review of Environment and Resources, 2012, 37: 449-472. DOI:10.1146/annurev-environ-042711-121244
[8]
HEIKKURINEN M, SCHIFFERS M, KRANZLMVLLER D. Environmental computing 1.0: The dawn of a concept[C]//Proceedings of International Symposium on Grids and Clouds 2015. Taipei, China: Academia Sinica, 2015.
[9]
REFSGAARD J C, VAN DER SLUIJS J P, BROWN J, et al. A framework for dealing with uncertainty due to model structure error[J]. Advances in Water Resources, 2006, 29(11): 1586-1597. DOI:10.1016/j.advwatres.2005.11.013
[10]
张质明. 基于不确定性分析的WASP水质模型研究[D]. 北京: 首都师范大学, 2013.
ZHANG Z M. Study on SWAP water quality model based on uncertainty analysis[D]. Beijing: Capital Normal University, 2013. (in Chinese)
[11]
JANSSEN H. Monte-Carlo based uncertainty analysis: Sampling efficiency and sampling convergence[J]. Reliability Engineering & System Safety, 2013, 109: 123-132.
[12]
董欣, 杜鹏飞, 李志一, 等. SWMM模型在城市不透水区地表径流模拟中的参数识别与验证[J]. 环境科学, 2008, 29(6): 1495-1501.
DONG X, DU P F, LI Z Y, et al. Parameter identification and validation of SWMM in simulation of impervious urban land surface runoff[J]. Environmental Science, 2008, 29(6): 1495-1501. DOI:10.3321/j.issn:0250-3301.2008.06.007 (in Chinese)
[13]
ESTRADA V, DIAZ M S. Global sensitivity analysis in the development of first principle-based eutrophication models[J]. Environmental Modelling & Software, 2010, 25(12): 1539-1551.
[14]
郭劲松, 李胜海, 龙腾锐. 水质模型及其应用研究进展[J]. 重庆建筑大学学报, 2002, 24(2): 109-115.
GUO J S, LI S H, LONG T R. Study and progress of water quality model and its application[J]. Journal of Chongqing Jianzhu University, 2002, 24(2): 109-115. (in Chinese)
[15]
贾海峰, 程声通, 杜文涛. GIS与地表水水质模型WASP5的集成[J]. 清华大学学报(自然科学版), 2001, 41(8): 125-128.
JIA H F, CHENG S T, DU W T. Integration of GIS with the surface water quality model WASP5[J]. Journal of Tsinghua University (Science and Technology), 2001, 41(8): 125-128. DOI:10.3321/j.issn:1000-0054.2001.08.034 (in Chinese)
[16]
SCHROEDER F. Water quality in the Elbe estuary: Significance of different processes for the oxygen deficit at Hamburg[J]. Environmental Modeling & Assessment, 1997, 2(1): 73-82.
[17]
SOHMA A, SATO T, NAKATA K. New numerical model study on a tidal flat system-seasonal, daily and tidal variations[J]. Spill Science & Technology Bulletin, 2000, 6(2): 173-185.
[18]
HUA F, WEST J R, BARKER R A, et al. Modelling of chlorine decay in municipal water supplies[J]. Water Research, 1999, 33(12): 2735-2746. DOI:10.1016/S0043-1354(98)00519-3
[19]
JONKERGOUW P M R, KHU S T, SAVIC D A, et al. A variable rate coefficient chlorine decay model[J]. Environmental Science & Technology, 2009, 43(2): 408-414.
[20]
鲁巍, 张晓健. 给水管网细菌生长的动力学模型[J]. 中国给水排水, 2006, 22(18): 8-10.
LU W, ZHANG X J. Dynamic model of bacteria growth in water distribution system[J]. China Water & Wastewater, 2006, 22(18): 8-10. DOI:10.3321/j.issn:1000-4602.2006.18.003 (in Chinese)
[21]
YARWOOD G, JUNG J, WHITTEN G Z, et al. Updates to the carbon bond mechanism for version 6 (CB6)[C]//Proceedings of the 9th Annual CMAS Conference. Chapel Hill, USA: CMAS, 2010: 11-13.
[22]
CAO L, LI S M, YI Z W, et al. Simplification of carbon bond mechanism IV (CBM-IV) under different Initial conditions by using concentration sensitivity analysis[J]. Molecules, 2019, 24(13): 2463. DOI:10.3390/molecules24132463
[23]
陆建忠, 陈晓玲, 李辉, 等. 基于GIS/RS和USLE鄱阳湖流域土壤侵蚀变化[J]. 农业工程学报, 2011, 27(2): 337-344.
LU J Z, CHEN X L, LI H, et al. Soil erosion changes based on GIS/RS and USLE in Poyang Lake Basin[J]. Transactions of the Chinese Society of Agricultural Engineering, 2011, 27(2): 337-344. (in Chinese)
[24]
FU B J, YU L, LV Y H, et al. Assessing the soil erosion control service of ecosystems change in the Loess Plateau of China[J]. Ecological Complexity, 2011, 8(4): 284-293. DOI:10.1016/j.ecocom.2011.07.003
[25]
ARNOLD J G, SRINIVASAN R, MUTTIAH R S, et al. Large area hydrologic modeling and assessment Part Ⅰ: Model development[J]. JAWRA Journal of the American Water Resources Association, 1998, 34(1): 73-89. DOI:10.1111/j.1752-1688.1998.tb05961.x
[26]
薛强, 梁冰, 刘晓丽. 有机污染物运移的动力学预测模型及模型参数分析[J]. 工程勘察, 2003(6): 17-20.
XUE Q, LIANG B, LIU X L. Dynamic predicting model of transportation of organic contaminants and analysis of model parameters[J]. Geotechnical Investigation & Surveying, 2003(6): 17-20. (in Chinese)
[27]
侯贵光, 陈家军, 吴舜泽, 等. 填埋场产气规律的模型预测[J]. 环境科学研究, 2009, 22(10): 1181-1186.
HOU G G, CHEN J J, WU S Z, et al. Modeling research on landfill gas production[J]. Research of Environmental Sciences, 2009, 22(10): 1181-1186. DOI:10.13198/j.res.2009.10.71.hougg.009 (in Chinese)
[28]
DURMUSOGLU E, CORAPCIOGLU M Y, TUNCAY K. Landfill settlement with decomposition and gas generation[J]. Journal of Environmental Engineering, 2005, 131(9): 1311-1321. DOI:10.1061/(ASCE)0733-9372(2005)131:9(1311)
[29]
韩军徽, 李正风. 计算社会科学的方法论挑战[J]. 自然辩证法研究, 2018, 34(4): 14-19.
HAN J H, LI Z F. Methodological challenges faced by computational social science[J]. Studies in Dialectics of Nature, 2018, 34(4): 14-19. DOI:10.19484/j.cnki.1000-8934.2018.04.003 (in Chinese)
[30]
MILLIE D F, WECKMAN G R, YOUNG Ⅱ W A, et al. Modeling microalgal abundance with artificial neural networks: Demonstration of a heuristic 'Grey-Box' to deconvolve and quantify environmental influences[J]. Environmental Modelling & Software, 2012, 38: 27-39.
[31]
HUANG Y Y, CIAIS P, LUO Y Q, et al. Tradeoff of CO2 and CH4 emissions from global peatlands under water-table drawdown[J]. Nature Climate Change, 2021, 11(7): 618-622. DOI:10.1038/s41558-021-01059-w
[32]
ISSAKA S, ASHRAF M A. Impact of soil erosion and degradation on water quality: A review[J]. Geology, Ecology, and Landscapes, 2017, 1(1): 1-11. DOI:10.1080/24749508.2017.1301053
[33]
BELL G, HEY T, SZALAY A. Beyond the data deluge[J]. Science, 2009, 323(5919): 1297-1298. DOI:10.1126/science.1170411
[34]
DHAR V. Data science and prediction[J]. Communications of the ACM, 2013, 56(12): 64-73. DOI:10.1145/2500499
[35]
HEY A J G, TANSLEY S, TOLLE K M. The fourth paradigm: Data-intensive scientific discovery[M]. Redmond: Microsoft Research, 2009.
[36]
LOHR S. Data-ISM: The revolution transforming decision making, consumer behavior, and almost everything else[M]. New York: Harper Business, 2015.
[37]
HARARI Y N. Dataism is our new god[J]. New Perspectives Quarterly, 2017, 34(2): 36-43.
[38]
蒋洪强, 卢亚灵, 周思, 等. 生态环境大数据研究与应用进展[J]. 中国环境管理, 2019, 11(6): 11-15.
JIANG H Q, LU Y L, ZHOU S, et al. Progress in research and application of ecological environment big data[J]. Chinese Journal of Environmental Management, 2019, 11(6): 11-15. DOI:10.16868/j.cnki.1674-6252.2019.06.011 (in Chinese)
[39]
中科曙光. 生态环境部生态环境云平台[EB/OL]. [2021-12-10]. https://www.sugon.com/case?id=113#.
SUGON. Ecological environment cloud platform of Ministry of Ecological Environment[EB/OL]. [2021-12-10]. https://www.sugon.com/case?id=113#. (in Chinese)
[40]
百度智慧云. 智慧生态环境解决方案[EB/OL]. [2021-12-10]. https://cloud.baidu.com/solution/city/eco-logyandenvironment.html.
BAIDU AI CLOUD. Smart ecological environment solutions[EB/OL]. [2021-12-10]. https://cloud.baidu.com/solution/city/ecologyandenvironment.html. (in Chinese)
[41]
山河. 国家生态环境大数据超算云中心[EB/OL]. [2021-12-10]. https://shanhe.com/casedetails/86.
SHANHE. National ecological environment big data supercomputing cloud center[EB/OL]. [2021-12-10]. https://shanhe.com/casedetails/86. (in Chinese)
[42]
ONC strategic plan[EB/OL]. (2015-01-01)[2021-12-13]. https://www.oceannetworks.ca.
[43]
WANG Z S, ZHAO J, LIN S J, et al. Identification of industrial land parcels and its implications for environmental risk management in the Beijing-Tianjin-Hebei urban agglomeration[J]. Sustainability, 2019, 12(1): 174. DOI:10.3390/su12010174
[44]
CUI Y L, XIE X, LIU Y. Social media and mobility landscape: Uncovering spatial patterns of urban human mobility with multi source data[J]. Frontiers of Environmental Science & Engineering, 2018, 12(5): 1-14.
[45]
崔一澜. 数据驱动的城市居民出行模拟与碳排放评估[D]. 北京: 清华大学, 2019.
CUI Y L. Data-driven urban resident travel demand simulation and carbon footprint accounting[D]. Beijing: Tsinghua University, 2019. (in Chinese)
[46]
彭帆. 基于大数据建模的城市噪声地图研制方法与案例研究[D]. 北京: 清华大学, 2016.
PENG F. Methods and case study of mapping urban noise via big data analysis[D]. Beijing: Tsinghua University, 2016. (in Chinese)
[47]
宋广超. 基于大数据分析的城市环境噪声动态模拟方法与案例研究[D]. 北京: 清华大学, 2020.
SONG G C. Methods and case study of dynamic simulation of urban noise based on big-data analysis[D]. Beijing: Tsinghua University, 2020. (in Chinese)
[48]
REICHSTEIN M, CAMPS-VALLS G, STEVENS B, et al. Deep learning and process understanding for data-driven earth system science[J]. Nature, 2019, 566(7743): 195-204. DOI:10.1038/s41586-019-0912-1
[49]
于欣平. 基于环保大数据的重大水污染源智能评价软件研究[D]. 大庆: 东北石油大学, 2019.
YU X P. Research on intelligent evaluation software of major water pollution sources based on big data of environmental protection[D]. Daqing: Northeast Petroleum University, 2019. (in Chinese)
[50]
LYU B, HU Y T, ZHANG W X, et al. Fusion method combining ground-level observations with chemical transport model predictions using an ensemble deep learning framework: Application in China to estimate spatiotemporally-resolved PM2.5 exposure fields in 2014—2017[J]. Environmental Science & Technology, 2019, 53(13): 7306-7315.
[51]
JUNG M, REICHSTEIN M, CIAIS P, et al. Recent decline in the global land evapotranspiration trend due to limited moisture supply[J]. Nature, 2010, 467(7318): 951-954. DOI:10.1038/nature09396
[52]
JUNG M, REICHSTEIN M, MARGOLIS H A, et al. Global patterns of land-atmosphere fluxes of carbon dioxide, latent heat, and sensible heat derived from eddy covariance, satellite, and meteorological observations[J]. Journal of Geophysical Research: Biogeosciences, 2011, 116(G3): G00J07.
[53]
LI W, WU G D, ZHANG F, et al. Hyperspectral image classification using deep pixel-pair features[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(2): 844-853. DOI:10.1109/TGRS.2016.2616355
[54]
LI J C, DAI W, METZE F, et al. A comparison of deep learning methods for environmental sound detection[C]//Proceedings of 2017 IEEE International Conference on Acoustics, Speech and Signal Processing. New Orleans, USA: IEEE, 2017: 126-130.
[55]
CHEN J L, HUANG G R, CHEN W J. Towards better flood risk management: Assessing flood risk and investigating the potential mechanism based on machine learning models[J]. Journal of Environmental Management, 2021, 293: 112810. DOI:10.1016/j.jenvman.2021.112810
[56]
VANDAL T, KODRA E, GANGULY S, et al. Generating high resolution climate change projections through single image super-resolution: An abridged version[C]//Proceedings of the 27th International Joint Conference on Artificial Intelligence. Stockholm, Sweden: IJCAI, 2018: 5389-5393.
[57]
BARZEGAR R, AALAMI M T, ADAMOWSKI J. Coupling a hybrid CNN-LSTM deep learning model with a boundary corrected maximal overlap discrete wavelet transform for multiscale lake water level forecasting[J]. Journal of Hydrology, 2021, 598: 126196. DOI:10.1016/j.jhydrol.2021.126196
[58]
AHMED A A M, DEO R C, FENG Q, et al. Deep learning hybrid model with Boruta-Random forest optimiser algorithm for streamflow forecasting with climate mode indices, rainfall, and periodicity[J]. Journal of Hydrology, 2021, 599: 126350. DOI:10.1016/j.jhydrol.2021.126350
[59]
MUÑOZ D F, MUÑOZ P, MOFTAKHARI H, et al. From local to regional compound flood mapping with deep learning and data fusion techniques[J]. Science of the Total Environment, 2021, 782: 146927. DOI:10.1016/j.scitotenv.2021.146927
[60]
SINGHA S, PASUPULETI S, SINGHA S S, et al. Prediction of groundwater quality using efficient machine learning technique[J]. Chemosphere, 2021, 276: 130265. DOI:10.1016/j.chemosphere.2021.130265
[61]
LANDSCHVTZER P, GRUBER N, BAKKER D C E, et al. A neural network-based estimate of the seasonal to inter-annual variability of the Atlantic Ocean carbon sink[J]. Biogeosciences, 2013, 10(11): 7793-7815. DOI:10.5194/bg-10-7793-2013
[62]
CALDWELL P M, BRETHERTON C S, ZELINKA M D, et al. Statistical significance of climate sensitivity predictors obtained by data mining[J]. Geophysical Research Letters, 2014, 41(5): 1803-1808. DOI:10.1002/2014GL059205
[63]
JEONG N, CHUNG T H, TONG T Z. Predicting micropollutant removal by reverse osmosis and nanofiltration membranes: Is machine learning viable?[J]. Environmental Science & Technology, 2021, 55(16): 11348-11359.
[64]
KARNIADAKIS G E, KEVREKIDIS I G, LU L, et al. Physics-informed machine learning[J]. Nature Reviews Physics, 2021, 3(6): 422-440. DOI:10.1038/s42254-021-00314-5
[65]
LANSER D, VERWER J G. Analysis of operator splitting for advection- diffusion- reaction problems from air pollution modelling[J]. Journal of Computational and Applied Mathematics, 1999, 111(1-2): 201-216. DOI:10.1016/S0377-0427(99)00143-0
[66]
DE BÉZENAC E, PAJOT A, GALLINARI P. Deep learning for physical processes: Incorporating prior scientific knowledge[J]. Journal of Statistical Mechanics: Theory and Experiment, 2019, 2019: 124009. DOI:10.1088/1742-5468/ab3195
[67]
HANSON P C, STILLMAN A B, JIA X W, et al. Predicting lake surface water phosphorus dynamics using process-guided machine learning[J]. Ecological Modelling, 2020, 430: 109136. DOI:10.1016/j.ecolmodel.2020.109136
[68]
READ J S, JIA X W, WILLARD J, et al. Process‐guided deep learning predictions of lake water temperature[J]. Water Resources Research, 2019, 55(11): 9173-9190. DOI:10.1029/2019WR024922
[69]
TAHMASEBI P, KAMRAVA S, BAI T, et al. Machine learning in geo-and environmental sciences: From small to large scale[J]. Advances in Water Resources, 2020, 142: 103619.
[70]
WILLARD J D, READ J S, APPLING A P, et al. Predicting water temperature dynamics of unmonitored lakes with meta-transfer learning[J]. Water Resources Research, 2021, 57(7): e2021WR029579.
[71]
BECK H E, VAN DIJK A I M, DE ROO A, et al. Global-scale regionalization of hydrologic model parameters[J]. Water Resources Research, 2016, 52(5): 3599-3622.
[72]
XING J, ZHENG S X, DING D, et al. Deep learning for prediction of the air quality response to emission changes[J]. Environmental Science & Technology, 2020, 54(14): 8589-8600.
[73]
JIANG S J, ZHENG Y, SOLOMATINE D. Improving AI system awareness of geoscience knowledge: Symbiotic integration of physical approaches and deep learning[J]. Geophysical Research Letters, 2020, 47(13): e2020GL088229.
[74]
CASTRUCCIO S, MCINERNEY D J, STEIN M L, et al. Statistical emulation of climate model projections based on precomputed GCM runs[J]. Journal of Climate, 2014, 27(5): 1829-1844.
[75]
东阳. 滇池流域城市和农村非点源污染耦合模拟与控制策略研究[D]. 北京: 清华大学, 2016.
DONG Y. Study on coupling modelling and control measures of urban and rural nonpoint source pollution in Dianchi Lake basin[D]. Beijing: Tsinghua University, 2016. (in Chinese)
[76]
陈彬, 王小东, 王戎骁, 等. 融合机理与数据的灰箱系统建模方法研究[J]. 系统仿真学报, 2019, 31(12): 2575-2583.
CHEN B, WANG X D, WANG R X, et al. The Grey-box based modeling approach research integrating fusion mechanism and data[J]. Journal of System Simulation, 2019, 31(12): 2575-2583. (in Chinese)
[77]
宋国君, 国潇丹, 杨啸, 等. 沈阳市PM2.5浓度ARIMA-SVM组合预测研究[J]. 中国环境科学, 2018, 38(11): 4031-4039.
SONG G J, GUO X D, YANG X, et al. ARIMA-SVM combination prediction of PM2.5 concentration in Shenyang[J]. China Environmental Science, 2018, 38(11): 4031-4039. (in Chinese)
[78]
SENENT-APARICIO J, JIMENO-SÁEZ P, BUENO-CRESPO A, et al. Coupling machine-learning techniques with SWAT model for instantaneous peak flow prediction[J]. Biosystems Engineering, 2019, 177: 67-77.
[79]
CHANG W, CHEN X. Monthly rainfall-runoff modeling at watershed scale: A comparative study of data-driven and theory-driven approaches[J]. Water, 2018, 10(9): 1116.
[80]
VULOVA S, MEIER F, ROCHA A D, et al. Modeling urban evapotranspiration using remote sensing, flux footprints, and artificial intelligence[J]. Science of the Total Environment, 2021, 786: 147293.
[81]
陶飞, 刘蔚然, 刘检华, 等. 数字孪生及其应用探索[J]. 计算机集成制造系统, 2018, 24(1): 1-18.
TAO F, LIU W R, LIU J H, et al. Digital twin and its potential application exploration[J]. Computer Integrated Manufacturing Systems, 2018, 24(1): 1-18. (in Chinese)
[82]
王爱杰. 水系统大数据——有"融"乃大[R/OL]. (2021-11-05) [2021-12-01]. https://huanbao.bjx.com.cn/news/20211105/1186039.shtml.
WANG A J. Big data of water system-"Integration" is big[R/OL]. (2021-11-05)[2021-12-01]. https://huanbao.bjx.com.cn/news/20211105/1186039.shtml. (in Chinese)
[83]
Cary Institute. Hudson River ecosystem study[EB/OL]. [2021-12-01]. https://www.caryinstitute.org/science/research-projects/hudson-river-ecosystem-study.
[84]
金榕. 从技术到科学, 中国AI向何处去?[R/OL]. (2021-08-24) [2021-10-31]. https://t.cj.sina.com.cn/articles/view/2357213493/8c803935020013o2u.
JIN R. From technology to science, where does Chinese AI go?[R/OL]. (2021-08-24)[2021-10-31].