面向海洋观测的Cyberinfrastructure原型
李秀 , 欧阳小刚 , 汤友华 , 黄容生 , 马辉     
清华大学 深圳研究生院, 深圳 518055
摘要:针对海底观测网建设过程中的多源异构数据集成、海量数据处理和科研协同工作等问题,构建了一个面向海洋观测的赛百平台(Cyberinfrastructure,CI)。通过整合底层分布式的计算、存储、数据、传感器等资源和设备,面向顶层特定的科研用户提供基于网络环境的高效计算服务、海量数据服务、科研应用服务等。通过集成科学工作流,开发数据分析模块,实现对海量观测数据的处理。运用虚拟组织技术,实现了基于网络的科研协同工作。实验结果表明:该系统可以显著提高海洋科研人员的工作效率。
关键词赛百平台(Cyberinfrastructure)     海底观测     科学工作流    
Cyberinfrastructure prototype for seafloor observations
LI Xiu , OUYANG Xiaogang , TANG Youhua , HUANG Rongsheng , MA Hui     
Graduate School at Shenzhen, Tsinghua University, Shenzhen 518055, China
Abstract:The cyberinfrastructure (CI) for seafloor observations needs to integrate multi-resource heterogeneous data, process massive amounts of data and foster cooperation to construct the seafloor observation network. Integration of distributed computing resources, storage resources, data resources and sensors in the system architecture is needed to provide network based computational services, massive data processing services and research opportunities for specific users. This paper shows how to integrate the scientific workflow and develop the data analysis modules for the massive data processing. A virtual organization is then used to achieve web-based research cooperation. Tests show that the prototype dramatically improves the efficiency of marine researchers.
Key words: Cyberinfrastructure     seafloor observation     scientific workflow    

当前海洋科学与信息技术的飞速发展,使得传统的海洋观测模式发生了巨大改变。 基于信息集成的海底观测网的建立,为研究提供了诸多便利条件: 通过布放水下仪器及传感器实现对大范围海域、 多测量变量的监测; 主干光纤网络和接驳盒可为海底仪器供电,并实时或近实时将观测数据发送给科研人员; 软件系统的数据校准和质量控制机制确保了数据的准确性; 观测网络提供的模型和计算资源可以协助研究人员进行数据分析等。 同时,海底观测网的建设也面临许多挑战如观测设备获取的海量异构观测数据的存储和集成、 观测和实验产生海量数据的在线实时处理和协同分析等。

美国国家科学基金会在2002年提出了一种名为赛百平台 (CI) 的新型科学研究架构[1]。 它可以集成底层分布式的计算、 存储、 数据、 传感器等资源和设备,面向顶层的特定用户高效地提供数据产品和服务支持; 同时支持跨部门、 学科的虚拟组织协作,可以促进信息共享和科研协同工作,加强学科交叉,从而提升科研效率和创新力。

CI的概念提出后,迅速在许多领域被用以构建新型的科学研究环境。 Cotofana 等[2]基于SOA (service-oriented architecture) 构建了一个面向大规模传感器网络观测系统的CI框架。 通过开发Web服务、 定制化工作流应用以及集成用户控制和监控界面,方便了大规模传感器网络中仪器的部署和管理。 Wang等[3]将CI架构应用到了地理信息科

学中,用于构建基于Web的地理信息系统,并行化计算地理信息,管理复杂的软件环境,从而为不同领域的用户提供获取和共享地理信息的相关服务。 Li等[4]则在生物信息学领域运用了CI架构以简化应用的开发和部署,同时利用SOA的概念使得CI的软件耦合性更加松散。 其设计的“端到端”的CI原型为用户提供了一个方便的任务处理环境,包括简洁的用户界面、 便捷的数据获取方式、 底层计算资源的集成、 基本的可视化服务和个性化的工作流管理工具等。 同时在许多其他领域如医疗保健[5]、 教育[6]、 网络游戏[7]等,CI也得到了深入的应用。

由于海洋观测的重要性和对协同工作、 数据集成、 高计算性能的要求,CI在该领域也得到了应用。 Chave 等[8]提出了海洋观测计划(ocean observatories initiative,OOI)中的CI架构,利用能力容器的概念,通过从能力容器中选取相应的功能组件,实现CI架构各部分的定制化部署。 Meisinger等[9]则提出了OOI中CI架构的部署策略,通过把一些功能组件进行绑定,形成一种称为“部署类型”的模板,再利用“适配器”的概念,按实际环境对模板进行实例化,从而使CI的部署和应用更加便捷和弹性化。 Arrott等[10]通过在云计算平台上创建CI架构,实现OOI项目与集成海洋观测系统 (integrated ocean observing system,IOOS) 项目的数据共享; 同时借助改进的科学工作流来帮助科研人员更好地获取、 分析海量海底观测数据。

在中国,海洋观测技术的研究也已经开始起步。 李立刚等[11]设计了一个海洋观测数据管理系统,通过整合现有的观测设备数据,实现海洋观测数据的智能化管理,从而降低观测系统的管理成本。 孙凯等[12]设计了一个海底观测网控制系统用以满足观测网的电能输送和监测、 观测数据与控制命令双向实时传输以及系统安全监控的功能需求。 薛志刚等[13]设计了一个海底观测网的监测信息系统用于监控数据的传输、 存储以及共享。 然而以上这些工作都未涉及海量数据尤其是视频图像数据的处理及科研协同工作环境的搭建等方面的研究。

本文构建了一个面向海底观测的CI原型系统,集成分布式的各种资源,屏蔽中间的调度和执行细节,简洁高效地为特定用户提供数据产品和服务,协助科学家快速进行模型构建和生成数据产品,从而提高工作效率。

1 原型设计

本文的目标在于设计、 搭建和完善一个面向海洋观测的CI平台,实现对海底观测产生的海量数据的存储、 分析、 处理和可视化等。 图 1显示了本文设计的CI架构的分层结构,包含4个部分:

1) 资源层。 外部数据源和水下仪器获取的数据 (包括图片) 将被发送到一个计算机集群进行备份。 集群提供计算和存储资源,并使用Hadoop执行分布式计算。 同时,岸基数据库也对水下仪器的监控数据进行存储和实时监控。 资源层中的资源经过虚拟化的资源封装和抽象,提供资源接口,可以被上层的应用和服务调用。

2) 执行层。 科学工作流引擎是这一层的重要组成部分,它可以基于底层提供的资源,执行用户定制的任务如定制协同工作流程、 构建科学模型和检测仪器等。 工作流可以根据任务的不同,调用相应的虚拟化集群资源来完成任务的执行。 本文构建了一个基于映射归约 (MapReduce) 的科学工作流组件用以进行海量观测数据的处理。 工作流的输入可以是已经集成好的本地数据源或外部数据源,同时,资源发现机制也能寻找工作流所需要的其他资源。 执行层的设计整合了海底观测网的实体资源,为架构的应用和服务提供支撑。

3) 服务层。 经过整合的实体资源可以为CI架构的各类服务提供支持,这些服务既包括面向海底观测的数据应用类服务,也包括支持数据计算及架构运行所需的基础服务。 基础服务可以分为2类: 应用执行引擎和其他基础功能。 应用执行引擎为应用层的数据检索、 分析、 处理、 可视化等功能提供支持,同时也为服务层的其他基础服务提供环境。 其他基础服务包括用户管理、 日志分析、 地理信息系统 (GIS) 功能和通讯服务等。

4) 应用层。 本文开发了一个门户网站作为获取服务的入口。 面对不同用户,提供不同形式的应用服务。 CI架构可将面向海洋观测开发的数据获取、 分析、 处理和可视化等应用以Web服务的形式集成到系统中。 其他类型的服务如Wiki工具和Blog工具等都以第三方工具或外部站点的形式接入。 同时,本文也对虚拟组织技术进行了研究,用以实现基于网络的科研协同工作。

图 1 CI原型的分层架构

2 关键技术

针对目前国内海底观测网发展的需求,本文着重研究了CI架构下的海量数据处理和基于网络的科研协同工作技术。

2.1 使用科学工作流进行数据处理

在大规模的科学研究中,以传统方式进行大型实验管理和结果分析具有协调困难、 耗时巨大、 错误率高等一系列缺点。 科学工作流可以在不同层面上对实验过程进行优化,对试验的各个步骤进行有机整合[14]。 并且,科学工作流所具有的单元复用、 重组能力允许用户根据自身的研究计划快速定制科学工作流,从而加快研究的进展,方便数据产品的定制生成[15]。 为此,本文将科学工作流集成到CI架构中,用以进行数据的分析、 处理和可视化等。

2.1.1 基于CI的科学工作流环境的搭建

本文选择Kepler[16]作为科学工作流的开源实现方案。 Kepler采用基于图形的工作流组合方式,简单方便而且可重用性高。 科研人员可以通过拖曳现有工作流组件定制符合需求的科学工作流,也可以自定义工作流程并将之保存为执行者 (actor),只需要简单的参数配置就可以应用到其他科研任务中,避免了科研流程的重复开发,提高了科研效率。 科学工作流紧密围绕数据组成,一个实例通常由不同的执行者来完成相应的数据提取、 计算和汇总,并通过引导器 (director) 来决定整个流程的执行顺序。

例如根据文[17-18],赤潮的短期预报可以通过组合观测电导率、 温度、 盐度、 无机氮浓度、 无机磷浓度等十几种主要的物理、 化学环境变量进行较为准确的预报,同时对赤潮海域立体水柱的移动进行跟踪就能够在一定程度上对赤潮的扩散进行预测,这又涉及到海水在不同水深层次的三维流速监测。 通过抽象科学工作流可以有效地组合这些异构服务,封装成网络服务,以统一的方法和框架提供给海底观测网用户。 抽象科学工作流实例化见图 2,其功能流程为:

步骤1读取传感器的观测数据并做预处理;

步骤2 过滤出绘制三维流速彩图所需要的观测量数据;

步骤3 进行溶解氧计算、 化学检测和无机物检测等;

步骤4 进行融合检测并生成三维流速彩图。

图 2 赤潮海域三维流速彩图绘制实例

2.1.2 海量数值型数据处理

海底观测网部署了大量传感器用以监测流速、 温度、 压强、 溶解氧含量等物理量的实时变化。 通过对这些物理量进行统计分析,可以进一步开展环境质量监测、 灾难预警、 气候预测等工作。 以上这些数据处理过程均可以在科学工作流环境下实现,利用科学工作流中的数据处理模块,能够实现定制化、 可复用的数据处理与分析。

本文开发了一个基于MapReduce科学工作流组件的海洋标量数据清洗及统计分析算法,对读取的海量数值型数据进行处理,以求得数据的基本统计量。 算法的映射(map)阶段主要包括: map函数将CSV文件数据逐行以字符串的形式读入,并利用opencv工具将其切分为字符串数组; 忽略文件头,将其余部分数据作为数值型数据进行读入; 读取文件的观测量名称如水温等,并将无效数据剔除; 提取出记录时间,并以观测量和时间为键,观测数值为值写入键值对。 算法的归约 (reduce) 阶段主要包括: 获取map阶段产生的中间键值对并进行解析,利用内置的统计函数(如统计最大值函数max)计算相应统计值,将结果以键值对的形式写入输出文件,并保存到HDFS(Hadoop distributed file system)中。

本文使用一个含有1个主节点和2个从节点的Hadoop集群作为仿真环境来评估算法性能。 主节点配置为四核3.3 GHz Intel Xeon CPU,8 GB内存,500 GB硬盘; 从节点配置均为四核3.1 GHz Intel i5 CPU,4 GB内存,250 GB硬盘。 整个Hadoop集群布置在实验室100 Mb/s局域网中,3个节点的操作系统均为64位的Centos6.4。 算法的对照组是使用原有海底观测网数据管理系统的代码运行功能运行的java数据统计程序,它只能在单节点上运行。 所处理的数据来源于NCEI (national centers for environment information) 提供的CSV文件。 算法的处理时间对比如图 3所示。

图 3 海洋标量数据清洗统计算法处理时间对比

由于原有代码运行模块的技术限制,在数据大于1 GB的情况下,原有模块已不能进行统计计算,而本文算法则没有这一限制。 可以看出: 当CSV文件规模较小时,本文算法并不具备优势,这是由于其在任务创建和清除阶段需要消耗部分时间; 随着CSV文件的增长,原有模块由于系统本身开发过程中的技术限制及单节点、 非并行计算范式的限制,运行时间将以接近指数曲线的方式增长,而本文算法运行时间的增长趋势则较为平缓。 因此,当待处理的数据规模较小时采用原有模块,当待处理的数据规模增大时采用本文算法,系统可以根据文件的大小在2种处理方式间自由切换。

2.1.3 海量图像数据处理

海底观测网除了部署有各种数值型传感器外,还配备了许多水下摄像头,采集了海量的图像视频数据。 开发新的算法对图像或视频数据进行分析与处理,剔除无效或重复的视频片段,保留有海洋生物活动的片段,既可以减小数据存储的压力,也有助于对数据的进一步分析和应用。 此外,也可以对图片做前景检测,将运动目标分割出来,进而开展物体分类和识别等。 以上图像数据处理过程均可以利用科学工作流的图像处理模块,实现定制化、 可复用的处理与分析。

本文以图像分割为例介绍海量海洋图像数据处理算法。 图像分割是整个水下图像研究流程的重要组成部分,为进一步的水下图像分析提供了条件。 随着图像、 视频数据规模的不断增加,使用数据并行处理技术进行图像分割以提高效率的需求越来越迫切。 为此本文提出了一个2层的图像并行分割模型。 模型的第1层将图片分成灰度分布相似的若干组,本文使用感知哈希算法(perceptual hash algorithm)来衡量图像间的灰度分布相似度,即在将图片简化为8×8像素的灰度图后,通过将图片上每一像素与图片的灰度均值进行比较,大于均值则将灰度值设为1,反之设为0,由此得到该图像灰度分布的0—1数组,再通过计算Hamming距离 (Hamming distance) 来衡量两幅图之间的灰度相似性,当距离小于预设的阈值时,将其分为同一组,并添加到一个HIB (HIPI image bundle) 文件中。 HIB文件可以方便地在HDFS上存储和被第2层的基于MapReduce的科学工作流组件直接调用。 这样,大规模的海洋图像数据便转化为若干个HIB文件。 模型的第2层对这些HIB文件进行基于MapReduce的FFCM (fast fuzzy c-means) 并行图像分割。 首先设置算法参数并读入HIB文件和同样存储在HDFS中的聚类中心文件,该聚类中心文件包含初始的聚类中心灰度值,并将在每一次的迭代过程中对其进行计算和更新。 算法映射阶段的主要工作为计算图片的灰度直方图、 更新距离矩阵及隶属度矩阵、 设定键值对、 判断目标函数是否收敛等。 若目标函数收敛将把分类结果保存到文件系统,否则转入算法的归约阶段。 归约阶段的主要工作为解析中间键值对、 更新中间矩阵及目标函数分布项、 将更新值写入文件等。 这里对具有灰度分布相似性的图片进行了“合并分割”的简化操作,即对相似的图片进行抽样,以少数几个图像样本的聚类中心均值来替代所有图像的聚类中心值进行更新,减少了大量的存储和计算,从而提高了分割效率。 随后算法对目标函数及中心矩阵是否收敛进行判断,若收敛则将像素点分类并输出分割结果,否则删除输出文件,转向算法的映射阶段重新对文件进行处理。 本文以聚类标识 (如“1”代表前景而“2”代表背景) 作为键 (key),而把一条经过组合的字符串作为值 (value),键值对形式如下:

〈key:1 value:“ik,h(ik),u1k,d1k,Ft-1”〉

〈key:2 value:“ik,h(ik),u2k,d2k,Ft-1”〉

其中数字1和2即为聚类标识,而在value值中则包含了图像灰度级、 灰度级ik下的像素点数目、 隶属度、 距离度量以及本次迭代求得的目标函数等信息。

使用节2.1.2的Hadoop集群和fish4knowledge(http://groups.inf.ed.ac.uk/f4k/index.html)项目提供的图片对标准FCM(fuzzy c-means)[19]、 标准FFCM[20]和本文算法进行比较。 图 45分别为有水生植物干扰和海水浑浊情况下的分割结果对比,可以看出尽管本文算法采取了对灰度分布相似图片进行合并分割的简化操作,其分割效果并不逊色于逐图像进行分割处理的传统算法。

图 4 有水生植物干扰时的分割结果对比

图 5 海水浑浊情况下的分割结果对比

为更进一步验证算法设计的合理性,本文选取了来自不同视频片段,但具有灰度分布相似性的图片放入同一HIB文件进行试验。 分割结果见图 6,可以看出本文算法依然能够很好地将前景识别出来。

图 6 对灰度分布相似的图片做合并分割试验

当人为把存在明显灰度差异的图片放入同一HIB文件进行试验时,试验的效果产生了一定偏差,如图 7所示。 后续试验中,将图片按灰度分布相似性进行重新分组再处理,均可以得到理想的结果。 这表明如果能把灰度分布相似的图片进行分组,再进行合并试验,能够较好地保证分割效果,同时充分发挥合并分割的优势。 因此模型的第1层先对灰度分布相似的图片进行分组是非常有必要的。

图 7 对灰度分布存在差异的图片进行合分割试验

由于标准FCM的运行效率较低,故只比较标准FFCM和本文算法的运行效率,结果如表 1所示。 本文所提出的算法在文件规模较小的时候并不具备优势,同样是因为MapReduce在启动和清除任务的阶段需要耗费一定的时间。 随着文件规模增大,这部分时间被分摊,使得其逐渐显示出效率上的优势。 从表 1可以看出: 相比标准FFCM算法,在文件规模达到一定大小后,本文算法可以提升20%以上的效率; 文件规模增大到一定程度后,本文算法的处理时间近似随文件规模的增大而线性增加,这是由于集群中的计算资源利用率已趋于饱和,使得任务执行过程中发生了拥塞而导致的。 增加集群节点数量后的试验结果显示,当集群规模增大时,运行时间随文件规模增大的增加将会呈现不同程度的放缓。 随着文件规模和集群规模的增大,本文算法的效率还会有进一步的提升,因此本文提出的算法非常适合大规模图片数据的处理。

表 1 标准FFCM和本文算法耗时对比
文件大小 标准FFCM耗时 本文算法耗时 效率提升
GBss%
0.45533621-16.5
1.782 1371 85213.3
3.574 1753 30720.8
5.366 4125 00621.9
6.257 5245 61525.4
7.158 4236 48822.9

2.2 使用虚拟组织实现科研协作和模型共享

虚拟组织是CI架构的重要组成部分,可以将地域上分散的各个研究机构聚合起来,共享各自拥有的核心科研能力,围绕一定的科研目标,创建一个动态的网络科研团体[21]。 本文运用虚拟组织技术,借助CI架构实现来自不同机构,不同学科背景的成员间的合作交流。 一方面通过优势互补来提高科研效率; 另一方面,通过产生思维碰撞来激发创新发现能力[22]

海洋观测项目由来自不同研究机构、 不同领域的人员参与,他们一起构成了项目内部的虚拟组织。 各个研究机构作为虚拟组织的子单元,其核心是项目办公室或委员会。 各个成员以不同的角色加入到虚拟组织中,包括超级管理员、 项目管理员、 普通用户和游客等。 通过这些角色的设立,能够刻画出海洋观测领域基本的虚拟组织架构,所有研究机构之间以平等的关系进行合作,管理各自平台的观测进程及仪器设备,同时由超级管理员管理整个项目范围的资源分配。

在虚拟组织内部,如何进行知识的有效共享是决定该虚拟组织能否成功的关键[23]。 用户所开发的计算函数或科学工作流可以被封装成应用服务,并为数据分析提供支持,同时也可以上传到虚拟组织的共享空间,从而被具有相应权限的成员获取和使用。

3 结 论

本文针对海底观测中海量异构数据的集成、 处理和科研协同工作等问题,构建了一个面向海洋观测的CI架构原型,并着重对海量数据处理和基于网络的科研协同工作进行了研究。 针对海量数据的处理,将Kepler科学工作流集成到CI架构中,其基于图形的工作流组合方式具有简单方便、 可重用性高等特点。 使用基于MapReduce的科学工作流组件分别开发了面向海量数值型数据和图像视频数据的科学工作流模块以提高数据处理效率。 针对协同分析问题,运用虚拟组织技术构建了动态的网络科研团体,实现了科研协同工作和模型共享。

下一步将研究传感器热插拔技术和虚拟组织内模型的在线协同修改,并开发更多灵活、 高效的计算、 分析、 可视化科学工作流模块,从而进一步完善CI。

参考文献
[1] Atkins D E, Droegemeier K K, Feldman S I, et al. Revolutionizing Science and Engineering Through Cyberinfrastructure: Report of the National Science Foundation Blue-Ribbon Advisory Panel on Cyberinfrastructure [R].Washington D C, USA: The National Science Fundation,2003. http://cn.bing.com/academic/profile?id=54461382&encoded=0&v=paper_preview&mkt=zh-cn
[2] Cotofana C, Ding L, Shin P, et al. An soa-based framework for instrument management for large-scale observing systems (usarray case study) [C]//2006 IEEE International Conference on Web Services. Los Alamitos, CA, USA: IEEE Computer Society Press,2006: 815-822. http://cn.bing.com/academic/profile?id=2106206578&encoded=0&v=paper_preview&mkt=zh-cn
[3] Wang S, Liu Y. TeraGrid GIScience gateway: Bridging cyberinfrastructure and GIScience[J]. International Journal of Geographical Information Science , 2009, 23 (5) : 631–656. DOI:10.1080/13658810902754977
[4] Li W W, Krishnan S, Mueller K, et al. Building cyberinfrastructure for bioinformatics using service oriented architecture [C]//Cluster Computing and the Grid, 2006. Los Alamitos, CA, USA: IEEE Computer Society Press, 2006, BG03. http://cn.bing.com/academic/profile?id=2096666767&encoded=0&v=paper_preview&mkt=zh-cn
[5] Reymond D, Dib K, Kromm H. Data-mining and indicators in cyberinfrastructure [C]//Global Engineering Education Conference (EDUCON), 2012 IEEE. IEEE, 2012: 1-10. http://cn.bing.com/academic/profile?id=2052392976&encoded=0&v=paper_preview&mkt=zh-cn
[6] Wang S. A CyberGIS framework for the synthesis of cyberinfrastructure, GIS, and spatial analysis[J]. Annals of the Association of American Geographers , 2010, 100 (3) : 535–557. DOI:10.1080/00045601003791243
[7] Gorlatch S, Glinka F, Ploss A. Towards a scalable real-time cyberinfrastructure for online computer games [C]//2009 15th International Conference on Parallel and Distributed Systems. Piscataway, NJ, USA: IEEE Press, 2009: 722-727. http://cn.bing.com/academic/profile?id=2110959611&encoded=0&v=paper_preview&mkt=zh-cn
[8] Chave A D, Arrott M, Farcas C, et al. Cyberinfrastructure for the US ocean observatories initiative: Enabling interactive observation in the ocean [C]//Oceans 2009- Europe. Piscataway, NJ, USA: IEEE Press, 2009: 1-10. http://cn.bing.com/academic/profile?id=2066739750&encoded=0&v=paper_preview&mkt=zh-cn
[9] Meisinger M, Farcas C, Farcas E, et al. Serving ocean model data on the cloud[M]. Piscataway, NJ, USA: IEEE Press, 2009 .
[10] Arrott M, Alexander C, Graybeal J, et al. Building transparent data access for ocean observatories: Coordination of US IOOS DMAC with NSF's OOI Cyberinfrastructure [C]//OCEANS 2011. Piscataway, NJ, USA: IEEE Press, 2011: 1-9. http://cn.bing.com/academic/profile?id=1709432615&encoded=0&v=paper_preview&mkt=zh-cn
[11] 李立刚, 赵彩云, 秦明慧, 等. 海洋观测数据管理系统的设计与实现[J]. 海洋预报 , 2010, 27 (2) : 53–57. LI Ligang, ZHAO Caiyun, QIN Huiming, et al. A design and implementation of the data management system for marine environment monitoring[J]. Marine Forecasts , 2010, 27 (2) : 53–57. (in Chinese)
[12] 孙凯, 李智刚, 秦宝成, 等. 海底观测网控制系统设计[J]. 传感器与微系统 , 2014, 33 (8) : 94–97. SUN Kai, LI Zhigang, QIN Baocheng, et al. Design on control system for ocean observatories[J]. Transducer and Microsystem Technologies , 2014, 33 (8) : 94–97. (in Chinese)
[13] 薛志刚, 金波, 李德骏, 等. 海底观测网络的监测信息系统研究[J]. 轻工机械 , 2010, 28 (4) : 83–86. XUE Zhigang, JIN Bo, LI Dejun, et al. Research on monitor information system in seafloor observatory network[J]. Light Industry Machinery , 2010, 28 (4) : 83–86. (in Chinese)
[14] 李进华. e-Science环境下的科学工作流实现及其应用研究(Ⅰ)—概念、架构与设计[J]. 情报科学 , 2009 (9) : 1394–1399. LI Jinhua. E-Science-based implement of scientific workflow and its application—concept, architecture and design[J]. Information Science , 2009 (9) : 1394–1399. (in Chinese)
[15] 张卫民, 刘灿灿, 骆志刚. 科学工作流技术研究综述[J]. 国防科技大学学报 , 2011, 33 (3) : 56–65. ZHANG Weimin, LIU Cancan, LUO Zhigang. A Review on Scientific Workflow[J]. Journal of National University of Defense Technology , 2011, 33 (3) : 56–65. (in Chinese)
[16] Altintas I, Berkley C, Jaeger E, et al. Kepler: An extensible system for design and execution of scientific workflows [C]//Proceedings of the 16th International Conference on Scientific and Statistical Database Management. Santorini Island, Greece: IEEE, 2004: 423-424. http://cn.bing.com/academic/profile?id=2123663722&encoded=0&v=paper_preview&mkt=zh-cn
[17] 丛丕福, 张丰收, 曲丽梅. 赤潮灾害监测预报研究综述[J]. 灾害学 , 2008, 23 (2) : 127–130. CONG Pifu, ZHANG Fenshou, QU Limei. Overview on monitoring and forecast of red tide hazard[J]. Joural of Catastrophology , 2008, 23 (2) : 127–130. (in Chinese)
[18] 刘雪芹, 夏新, 张建辉, 等. 赤潮监测技术的现状与发展[J]. 中国环境监测 , 2002, 18 (6) : 64–67. LIU Xueqin, XIA Xin, ZHANG Jianhui, et al. Current status and progress on red tide monitoring technology[J]. Environmental Monitoring in China , 2002, 18 (6) : 64–67. (in Chinese)
[19] Pham D L, Prince J L. An adaptive fuzzy C-means algorithm for image segmentation in the presence of intensity inhomogeneities[J]. Pattern recognition letters , 1999, 20 (1) : 57–68. DOI:10.1016/S0167-8655(98)00121-4
[20] Wang S, Xu Y, Pang Y. A fast underwater optical image segmentation algorithm based on a histogram weighted fuzzy C-means improved by PSO[J]. Journal of Marine Science and Application , 2011, 10 (1) : 70–75. DOI:10.1007/s11804-011-1043-8
[21] 董锐. 高校虚拟科研组织中Cyberinfrastructure建设的研究[D]. 浙江: 浙江大学, 2009. DONG Rui. Research in Cyberinfrastructure Construction in Virtual Scientific Research Organization of University[D]. Zhejiang: Zhejiang University, 2009.(in Chinese) http://cdmd.cnki.com.cn/article/cdmd-10335-2009090335.htm
[22] 陈凯泉, 张士洋. 研究型大学虚拟科研组织的组建模式与运行机制[J]. 现代教育技术 , 2012, 22 (10) : 5–11. CHEN Kaiquan, ZHANG shiyang. The building model and running mechanisms of virtual Research organizations in research-oriented university[J]. Modern Educational Technology , 2012, 22 (10) : 5–11. (in Chinese)
[23] 林向义, 罗洪云, 杨金保, 等. 高校虚拟科研团队知识共享能力评价研究[J]. 情报科学 , 2014, 32 (011) : 102–107. LIN Xiangyi, LUO Hongyun, YANG Jinbao, et al. Evaluation on knowledge sharing capability of virtual scientific research team in colleges and universities[J]. Information Science , 2014, 32 (011) : 102–107. (in Chinese)