基于文本挖掘的水利工程建设管理信息化专利分析
熊谦, 唐文哲    
清华大学 水利水电工程系, 水沙科学与水利水电工程国家重点实验室, 北京 100084
摘要:结合中国水利领域信息化发展背景, 该文以水利工程建设管理信息化专利为研究对象, 提出一套基于文本挖掘的专利分析流程, 对专利申请趋势、申请地域、申请人与国际专利分类号(IPC)等因素进行统计分析, 运用文本挖掘方法进行专利主题聚类, 并剖析各类专利的主题强度与演化特征。主要研究结果表明:中国水利工程建设管理信息化自2013年进入技术发展期, 2019年以来专利申请数量快速增长; 隐含Dirichlet分布(LDA)主题模型将该领域专利划分为9个技术主题, 对应4个应用分类, 其中“设备硬件”和“综合管理系统”类专利申请数量最多且持续增加, 相关技术发展前景较好。“信息监测”类专利申请总体呈现增长趋势, 但工程监测相关专利较少。“数据分析”类专利申请数量长期处于较低水平, 反映出水利工程建设管理数据分析能力亟待提升。该研究结果揭示了中国水利工程建设管理信息化领域的技术布局、发展现状与应用前景。
关键词水利工程    建设管理    信息化    专利分析    文本挖掘    隐含Dirichlet分布    技术布局    
Text mining-based patent analysis on informatization for construction management of hydraulic engineering projects
XIONG Qian, TANG Wenzhe    
State Key Laboratory of Hydroscience and Engineering, Department of Hydraulic Engineering, Tsinghua University, Beijing 100084, China
Abstract: Objective With the rapid economic and technological development in China, information technologies, such as big data and cloud computing, are being employed for the construction management of hydraulic engineering projects. However, the unbalanced technological development and the disconnection between information technology and the actual construction process still exist. Thus, exploring the research and development in the technological field is crucial. Previous studies have examined the development status of specific information technology in hydraulic engineering informatization. However, research and development status were not systematically demonstrated using quantitative analysis. Patents are critical technological achievements for hydraulic engineering informatization, providing comprehensive technical information for technological exchange and innovation. This research aims to reveal the technology layout and prospects in hydraulic engineering informatization from the patent analysis perspective. Method This study proposes a text mining-based patent analysis method to examine the patents on hydraulic engineering informatization collected from the IncoPat global patent database. Initially, the patent application trend, application regions, applicants, and international patent classification (IPC) codes were explored through descriptive statistical analysis. Subsequently, a word frequency analysis was conducted on patents' titles and technical efficacy, and word clouds were drawn to preliminarily observe their primary themes and functions. Furthermore, text mining was utilized for clustering patent topics. The topic intensity and evolution characteristics of different categories of patents were analyzed based on the clustering results. Results Results show that China has entered a period of technological development since 2013, and the number of patents has increased rapidly since 2019. The patent applicants are mainly in provinces where enterprises, universities, and research institutes are concentrated. Enterprises and individuals apply for 77.8% of the patents and emphasize the application value of technology, whereas universities and scientific research institutes contribute to 24.2% of the patents and place great importance on technological innovation. The IPC codes of these patents mainly include hydraulic engineering (E02B), data processing system or method (G06Q), electronic digital processing technology (G06F), and hydrological information monitoring (G01F), revealing interdisciplinary characteristics. The latent Dirichlet allocation (LDA) topic model divides the patents into nine technical topics corresponding to four application categories. Among these categories, the number of patents for "equipment and hardware" is the largest and rapidly increasing, indicating promising development prospects for related technologies. Next, the "comprehensive management system" serves as a crucial integrated application, with steadily improving research and development in recent years. In addition, patent applications for "information monitoring" show an increasing trend overall, but few aim to monitor the construction process, indicating that construction monitoring should be considered an important direction in future research. Moreover, the number of patents for "data analysis" has been low for a long time, reflecting the urgency to improve the data analysis ability of construction management in hydraulic engineering projects. Conclusions These findings systematically reveal the technology layout, development status, and application prospects of hydraulic engineering informatization in China, providing research method support and empirical reference for future technology development and patent application. This study also recommends improving the capability of construction monitoring for realizing the overall perception system, promoting the application of big data analysis in the construction management of hydraulic engineering projects, and encouraging industry-university-institute collaboration.
Key words: hydraulic engineering    construction management    informatization    patent analysis    text mining    latent Dirichlet allocation    technology layout    

随着中国社会经济的快速发展,传统水利工程建设管理模式难以满足自动化、现代化与智能化的发展需求[1]。借助大数据、物联网、云计算等信息技术,实现水利工程建设管理信息化,具有重要意义[2]。中国目前信息技术在水利工程建设管理中的应用尚未成熟,且明显滞后于西方发达国家[3]。水利工程建设管理信息化相关技术研发与专利申请近年来受到越来越多的关注[4]

目前,已有关于水利工程建设管理信息化情况的研究主要应用案例分析、现状调研等定性分析方法,探究特定信息技术在水利工程建设管理中的应用现状与问题[5-8],缺乏从专利分析视角,对该领域的技术发展情况与重难点进行定量、系统的梳理。因此,本研究选取中国水利工程建设管理信息化专利为研究对象,提出一套基于文本挖掘的专利分析流程,剖析相关专利申请的总体情况和发展趋势,揭示水利工程建设管理信息化领域技术布局、发展现状与应用前景。

1 水利工程建设管理信息化需求与研究现状

水利工程建设管理信息化是中国构建现代化基础设施体系的重要环节之一。自2001年起,水利部相继印发《全国水利信息化规划》《关于推进水利大数据发展的指导意见》《智慧水利总体方案》等规划与指导性文件,逐渐完善了水利工程建设管理信息化顶层设计[9]。目前,大数据、物联网、云计算等信息技术已应用于中国水利工程建设管理中,并初步实现了智能温控、智慧工地、坝体变形监测等应用[10-11],但仍存在人员专业能力不足、专业化设备与软件缺失、信息系统与实际工程施工脱节等问题[12-13]

水利工程建设管理信息化专利是信息技术在水利工程建设管理中应用与创新的重要产出。一方面,专利作为知识产权的重要组成部分,能够提供全面的技术信息,其申请与公开具有鼓励技术创新、加强技术交流、推动技术进步的作用[14-15]。另一方面,专利信息是世界上最大的公开技术信息源之一[16],专利分析作为情报分析的重要分支,已广泛应用于国家与企业的技术研发中[17-19]。因此,对水利工程建设管理信息化专利进行系统分析,能够指导相关技术研发与专利申请,有助于充分发挥专利促进技术发展的作用。

现有研究对中国水利工程建设管理信息化领域的技术现状与发展前景进行了诸多分析。例如,张社荣等讨论了数字孪生技术在水电工程中的应用现状与瓶颈[5];陈祖煜等对水利工程建设管理云平台的建设、应用与管理模式进行了分析[6];黄祚继等对水利工程自动化技术进行了现状调研,并提出了技术应用建议[7];孙少楠等阐述了建筑信息模型(building information modeling, BIM)在水利工程中的构建与应用模式,并进行了案例分析[8]。可见,已有文献主要运用定性分析,研究特定信息技术在水利工程建设管理中的应用现状与问题,尚未从专利分析的角度,揭示该领域技术的整体发展情况与重难点。

2 研究数据与方法

本研究以中国水利工程建设管理信息化专利为切入点,提出一套基于文本挖掘的专利分析流程,剖析相关专利申请的总体情况和发展趋势。

2.1 基于文本挖掘的专利分析流程

文本挖掘[20]结合专利分析方法,能够深度挖掘专利文本所蕴藏的技术内涵[21]。本文提出一套基于文本挖掘的专利分析流程,如图 1所示。

图 1 基于文本挖掘的专利分析流程

本研究专利来源于《IncoPat全球专利数据库》[22]。经过背景调研、专利检索、专利筛选和信息提取,形成《水利工程建设管理信息化技术专利数据库》。

专利特征统计分析旨在初步了解该领域的技术现状,对专利申请趋势、申请地域、申请人、国际专利分类(international patent classification, IPC)号等进行统计,以揭示该领域技术的总体发展态势,分析地区研发实力、研发相关方和各类技术的分布特征。

相比于专利特征统计分析,基于文本挖掘的专利主题分析能够对专利的应用场景进行更详细的划分,从而使研究成果与当下社会经济与市场环境更加适配。本文首先对专利标题与技术功效进行词频分析,初步观察技术主题与要点;随后,运用隐含Dirichlet分布(latent Dirichlet allocation, LDA)主题模型对专利摘要进行主题聚类,划分技术主题与应用分类;在此基础上,计算主题强度,分析各类技术的演化趋势,以揭示技术发展情况与前景;最后,根据分析结果,提出水利工程建设管理信息化发展建议。

2.2 数据收集与筛选

本研究专利数据来源于《IncoPat全球专利数据库》,该数据库收录了包括中国以及美国、日本等多个国家或地区的1.5亿余件专利信息[22]。本研究检索时间段为2005—2021年。专利检索与筛选思路侧重于专利是否使用信息技术以及是否服务于水利工程建设。数据收集与筛选的具体流程如下:

1) 背景调研。对水利工程建设管理信息化项目的业主、施工方、设计方、监理方开展实地调研与访谈,并咨询行业专家,明确水利工程建设管理信息化的技术内涵与外延,收集专利检索关键词、同义词与相关IPC号。

2) 专利检索。根据调研结果对专利的标题、摘要与权利要求进行检索,检索式为“TIAB=((水利工程or水电工程or水利水电工程) and (信息化or数字化or大数据or (自动and信息) or远程or无纸or仿真or信息模型or智能or智慧)) OR CLAIM=((水利工程or水电工程or水利水电工程) and (信息化or数字化or大数据or (自动and信息) or远程or无纸or仿真or信息模型or智能or智慧))”,初步得到1 073件专利信息。

3) 专利筛选。首先通过IPC号进行初步过滤,其次通过人工检视提取相关专利并去重,最终得到774件专利,均为中国内地申请人申请。

4) 信息提取。本研究提取样本专利的标题、摘要、申请人、申请地域、技术功效、专利类型、申请日和IPC号等方面信息,形成《水利工程建设管理信息化技术专利数据库》。

2.3 文本挖掘方法 2.3.1 数据预处理

选取2.2节所述774件专利的标题、摘要与技术功效的文本数据进行预处理,关键步骤如下:

1) 构建停用词表。文本中如“一种”“属于”“专利”等词语的出现频率高,但对主题没有贡献,却会降低主题聚类精度与可解释性。本研究构建停用词表对这类词语以及标点符号予以去除,主要包括代词、介词、连词、数词、语气词、标点符号等。

2) 构建保留词表。水利工程建设管理的专有名词较多,Python自带词库不能完整识别所有这类专有名词。本研究根据水利行业术语规范整理出专有名词,并在人工检视专利的过程中进行补充,构建保留词表。

3) 构建替换词表。替换词表能够指导程序进行同义词替换,以统一表述,提升词频统计的精度。例如,将“自动化”“自动控制”替换为“自动”,将“工作效率”“提高效率”替换为“效率”。

4) 文本分词。运用Python的Jieba库,将文本划分为词语列表。

2.3.2 词频分析

词频分析即统计文本所用词语出现的频率,通常运用词云对词频统计结果进行可视化[23]。词云中词语的字体大小、粗细等属性与词频相关,能够起到过滤冗余信息、突出文本主旨的作用[24]。本文针对样本数据库中专利的标题与技术功效进行词频统计,绘制词云,以初步观察该领域技术主题与研发目的,为后续LDA主题模型分析提供参考。

2.3.3 LDA主题模型

LDA主题模型应用非监督机器学习算法,从大量文本中提取语义结构,以实现文本分类、关键词提取和信息过滤等功能[20]。LDA主题模型分别对文本-主题、主题-主题词两个生成过程进行建模,主要基于以下假设:1) 文档集合中存在K个相互独立的主题;2) 文档与各主题相关,且文档-主题为多项分布,相关参数服从Dirichlet分布;3) 主题与各主题词相关,且主题-主题词为多项分布,相关参数服从Dirichlet分布[25]

一篇文档在LDA主题模型中的生成过程如下:1) 根据Dirichlet分布的超参数α,得到文档d的主题分布θd,主题的分布概率越高越能代表该文档的内容;2) 从主题分布θd中取样生成文档dn个词的主题Zd, n;3) 根据Dirichlet分布的超参数β,生成主题Zd, n对应的主题词分布φk,主题词的分布概率越高代表对该主题的贡献度越大;4) 从主题词分布φk中取样生成文档d的第n个词Wd, n;5) 重复上述过程即可生成一篇文档(见图 2)。

图 2 LDA主题模型文档生成过程

困惑度(perplexity)是衡量LDA主题模型的常用指标,困惑度越小代表模型的概化能力越高[26]

$ \text { perplexity }=\exp \left\{-\frac{\sum\limits_d^D \sum\limits_n^{N_d} \ln p\left(W_{d, n}\right)}{\sum\limits_d^D N_d}\right\}. $ (1)

其中:Nd代表文档d包含的词语数量,p(Wd, n)代表文档dn个词语的生成概率,D代表文档总数。本研究主要运用Python编写代码,借助Sklearn库实现LDA主题建模。

对文档集合设定不同的主题划分数量,并计算对应的困惑度,可以得到最佳主题数量。对不同超参数设置下的主题划分结果进行比选,最终确定超参数α=0.05、β=0.01。

3 研究结果与分析 3.1 专利特征统计分析 3.1.1 专利申请趋势

专利申请趋势分析反映了专利申请数量随时间的变化。2005—2021年中国水利工程建设管理信息化领域的专利申请情况如图 3所示。根据专利生命周期划分方法[16],中国水利工程建设管理信息化领域技术发展大体经历以下阶段:在2012年之前专利申请数较少,处于“技术萌芽期”,其发展受到当时信息技术水平的制约;2013年后专利申请数量逐渐增加,进入“技术发展期”,自2019年起专利申请数量加速上升,2021年专利申请已达236件,说明近年来水利工程建设管理信息化领域研究受到行业重视与广泛关注,取得了一些成果,并具有发展潜力。

图 3 水利工程建设管理信息化专利申请趋势

3.1.2 专利申请地域

专利申请地域分析可以反映各省份的研发实力情况。图 4列举了水利工程建设管理信息化领域申请专利数量排名前十的省份,其中江苏省(122件,15.8%)、山东省(84件,10.9%)、北京(60件,7.8%) 和浙江省(58件,7.5%) 拥有专利最多。可见,水利工程建设管理信息化领域的专利申请与技术研发主要集中在相关企业、高校或科研单位聚集的省份。

图 4 水利工程建设管理信息化专利申请排名前十的省份

3.1.3 专利申请人

水利工程建设管理信息化专利申请人类别及各类申请人的具体申请情况如表 1所示。相关技术专利申请人以企业和个人为主,分别为386件和216件,合计占全部专利的77.8%,其发明专利与实用新型专利比值偏低,表明企业及相关从业者在水利工程建设管理信息化领域技术研发与专利申请上占据重要地位,且注重技术的行业应用价值。

表 1 水利工程建设管理信息化专利申请人类别及其申请情况
类别 专利数/件 发明专利数/件 实用新型专利数/件 发明专利数/实用新型专利数
企业 386 224 162 1.38
个人 216 93 124 0.75
高校 137 104 33 3.15
科研单位 50 38 12 3.17
政府机关 12 9 3 3.00
其他 7 4 3 1.33

高校和科研单位分别申请专利137件和50件,合计占全部专利的24.2%,其发明专利与实用新型专利比值较高。可见,高校和科研单位作为人才培养的重要基地[27],重视技术创新研发与理论贡献。

政府机关申请专利数量较少,共12件,占全部专利的1.6%,可归因于政府机关主要通过制定政策、标准等方式推进水利工程建设管理信息化发展,技术研发实力有限[28]

3.1.4 专利技术领域

专利技术领域分析旨在观察技术的IPC号分布,分析结果如图 5所示。水利工程建设管理信息化专利涉及的技术主要分布在E02(水利工程;基础;疏浚)、G06(计算;推算或计数)、G01(测量;测试)、G05(控制;调节)、G08(信号装置)、H04(电通信技术)、H02(发电、变电或配电)7个大类中。

图 5 水利工程建设管理信息化专利IPC分布

图 5中,属于E02B、G06Q、G06F、G01F这4个小类的专利申请数量最多,共占全部专利的60.5%。E02B为水利工程类,相关专利主要用于优化水利工程施工技术、设备与装置,该小类专利数量在全部专利中占比最大。G06Q为专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法,G06F为电数字处理技术,两类专利主要为大数据处理方法与系统架构设计提供技术支撑。G01F为容积、流量、质量流量或液位的测量技术,主要应用于水利信息的采集与监测。

图 5结果表明,中国水利工程建设管理信息化专利涉及的技术领域广泛,具备较强的学科交叉特性。但是,信息技术在水利工程建设管理中的具体应用场景仍不明确,需要运用文本挖掘进行更加详细的专利主题分析。

3.2 基于文本挖掘的专利主题分析 3.2.1 专利词频统计

本研究对水利工程建设管理信息化专利的标题与技术功效进行词频分析,绘制词云,如图 6所示。

图 6 水利工程建设管理信息化专利词频统计

标题的高频词包括“装置”“系统”“方法”“智能”与“监测”等,表明智能装置研发、系统开发、数据分析方法以及信息监测是当前水利工程建设管理信息化专利主要关注的内容。技术功效的高频词包括“自动”“效率”“实时”“监测”与“成本”等,表明该领域技术研发目的主要为:提升自动化水平,提高工作效率,实现实时监测和降低人力、物力成本等。

3.2.2 专利主题聚类

LDA主题模型的准确度通常使用困惑度(perplexity)衡量,困惑度越小代表训练所得主题模型更合理地提炼文本主题。使用预处理后的专利摘要文本进行训练,计算不同主题数下主题模型的困惑度,如图 7所示。当主题数为9个时困惑度达到局部最小,且当主题数继续增加后困惑度没有明显减少。考虑到主题数过大会导致模型过拟合,本研究最终选取主题数为9个。

图 7 LDA主题模型困惑度-主题数折线图

因此,本研究运用LDA主题模型将中国水利工程建设管理信息化专利划分为9个主题,并计算各主题下的关键词分布,整理每个主题下排名前8的高概率关键词。根据高概率关键词以及专利摘要,进行技术主题标识,并将其进一步整合为4个应用分类,如表 2所示。技术主题与应用分类结果均与行业专家讨论,得到专家的认可,以确保其合理性。

表 2 水利工程建设管理信息化专利主题-关键词分布与应用分类
编号 技术主题 高概率关键词 应用分类
1 水利设施 装置  闸门  智能  传感器  自动  测量  灌溉  控制器 设备硬件
2 施工设备 装置  机构  驱动  电机  组件  调节  表面  本体
3 水文监测 水位  监测  检测  装置  传感器  远程  水质  控制器 信息监测
4 给排水监测 结构  系统  水流  传感器  壳体  智能  水体  水管
5 工程监测 测量  电机  螺纹  表面  本体  齿轮  闸门  智能
6 水资源调度方法 模型  调度  方法  步骤  仿真  系统  分析  水库 数据分析
7 风险分析方法 装置  边坡  评价  方法  稳定性  预警  变形  指标
8 管理信息系统 模块  数据  采集  监测  系统  管理  信息  监控 综合管理系统
9 数字建筑平台 信息  系统  管理  数据  方法  三维  施工  混凝土

“设备硬件”类专利包括“水利设施”与“施工设备”2个技术主题,为水利工程建设管理信息化提供自动化、智能化硬件设施。“水利设施”主题专利旨在提升水利工程设施或结构的自动化与信息化程度,以实现远程控制与精准操作,包括智慧泵站、自动闸门和智慧灌溉设施等;“施工设备”主题专利旨在应用信息技术优化设备功能,包括多功能清淤装置、吊装设备和碎石装置等,以降低人员劳动强度、减少安全隐患。

“信息监测”类专利包括“水文监测”“给排水监测”和“工程监测”3个主题,通过对水利工程信息进行全面实时的监控,为水利工程建设管理的大数据分析提供数据基础。“水文监测”主题专利旨在运用信息技术实时监测水位、水质、流量等水文信息,并及时进行安全预警;“给排水监测”主题专利旨在对供水、排水、取水等过程进行监测,以确保生产、生活、生态用水量,包括智能给排水系统、管道压力监测和泵站控制系统等;“工程监测”主题专利旨在对施工质量、安全与运维进行全面监测,为现代化工程施工管理提供数据基础,包括电气监视、温度监测和混凝土表面平整度测量等。

“数据分析”类专利包括“水资源调度方法”和“风险分析方法”2个主题,通过结合水利专业知识与大数据分析手段,深度挖掘水利工程信息的价值与内涵,是实现建设管理智慧应用的关键。“水资源调度方法”主题专利旨在实现水资源配置优化,提高水资源综合利用效率,降低梯级水库、泵站等运行成本,包括水资源优化配置方法、梯级水库调度方法和智能供水调控方法等;“风险分析方法”主题专利旨在运用大数据分析方法及时发现风险,提高监测预警效率与准确度,以确保工程安全,包括滑坡稳定性预测方法、拱坝变形特性分析方法和机泵健康综合评价方法等。

“综合管理系统”类专利包括“管理信息系统”和“数字建筑平台”2个主题,基于设备硬件、水利工程大数据与数据分析算法,构建综合管理系统是信息技术在水利工程建设管理中的集成应用。“管理信息系统”主题专利旨在对水利工程信息进行整理、分析、归纳与反馈,以提高管理效率与可靠性,包括施工进度实时演示系统、湖泊网格化管理系统等;“数字建筑平台”主题专利主要基于数字建筑模型、地理信息系统(geographic information system, GIS)、虚拟现实等技术,对施工、地质、建筑物、设备与人员等信息进行三维模拟与跟踪仿真,从而降低设计、施工、运维成本,包括基于BIM的水利水电工程管理云平台、基于GIS+BIM的水利工程建设管理系统等。

3.2.3 专利主题强度

对每一专利取概率最大的主题与之对应。主题强度的大小取决于该主题下的专利申请数量。专利主题强度分析结果如图 8所示。

图 8 水利工程建设管理信息化专利主题强度

总体上,“设备硬件”类专利申请数量最多,占总专利数的30.1%,主要申请人为个人(40.3%)与企业(39.1%)。其中,“施工设备”与“水利设施”主题强度均排名靠前,表明如何提升施工设备与水利设施的自动化、信息化水平,受到从业者与企业的更多关注。

“综合管理系统”类专利占总专利数的29.3%,主要申请人为企业(63.0%)。其中,“管理信息系统”与“数字建筑平台”主题强度排名分别为第1和第4。可见,“综合管理系统”作为开发难度较高的应用集成产品,受到企业的高度重视。

“信息监测”类专利占总专利数的27.3%,主要申请人为企业(43.2%)与个人(40.4%)。其所含主题中,“工程监测”主题强度最低,专利申请数为40件。这表明中国水利工程建设管理的信息监测技术体系已初步构建,但在施工过程与运维监测方面的专利成果较少,“工程监测”是未来技术研发的重点之一。

“数据分析”类专利申请数量最少,占总专利数的13.3%,主要申请人类别为企业(43.0%)与高校(33.3%)。其中,“水资源调度方法”和“风险分析方法”主题强度均较低。结合当下水利工程建设管理工业模型、软件与开发工具仍需依赖进口的状况[29-30],中国水利工程建设管理数据分析能力存在较大的提升空间。

3.2.4 专利主题强度演化

中国水利工程建设管理信息化专利在“技术发展期”(2013—2021年)的主题强度演化如图 910所示。其中:图 9展示了4个专利应用分类的强度演化,图 10展示了9个专利技术主题的强度演化。

图 9 水利工程建设管理信息化专利应用分类强度演化折线图

图 10 水利工程建设管理信息化专利技术主题强度演化热力图

“设备硬件”类专利申请数量在技术发展期内提升明显,表明近年来中国重视水利工程设施与施工设备的自动化与信息化,相关技术具有较大的发展潜力。

“综合管理系统”类专利申请数量在技术发展初期最多,近年呈现较为平稳的增长趋势。工程综合管理系统较早应用于西方发达国家建筑业,引入中国后受到了行业的重视。近年中国水利工程综合管理系统的开发能力得到稳步提升,行业应用价值较大。

“信息监测”类专利申请数量在技术发展期内显著增长。其中,“水文监测”和“给排水监测”主题强度提升明显,“工程监测”主题强度不断波动。可见,中国水利工程建设管理信息监测技术总体得到有效发展,但工程监测技术方面的研发相对滞后。

“数据分析”类专利申请数量在技术发展期内不断波动,未呈现明显增长趋势,且自2017年在各应用分类中专利申请数量最低。这表明大数据分析方法与中国水利工程建设管理尚未实现深度融合,信息挖掘与数据分析能力有待提升。

4 水利工程建设管理信息化发展建议

结合本研究结果提出如下建议:

1) 应重视水利行业工程监测能力的提升。中国“工程监测”主题专利成果较少,技术发展相对缓慢,是当下水利工程建设管理信息化的短板之一。应加大在水库安全监测、施工安全风险监测等方面的研发投入,促进科技成果转化,以实现对水利信息的全面感知,为水利工程建设管理信息化发展提供数据基础。

2) 应促进大数据分析技术在水利工程建设管理中的应用。中国“数据分析”类专利申请数量较少,相关软件与开发工具仍依赖进口。可通过建设水利工程与数据学科交叉专业、加强国内外技术交流等方式,提升数据分析与挖掘能力,以实现智慧调度、水文预测等智慧应用。

3) 应鼓励企业、高校与科研单位开展产学研合作。中国企业申请专利涉及范围广,重视技术的行业应用价值,而高校与科研单位技术创新能力较强。可通过建设企业培训基地、邀请企业参与授课、设计科研实训课程等产学研合作方式,推动企业、高校与科研单位之间的技术交流与互补,加快创新成果的应用与推广。

5 结论

本研究以中国水利工程建设管理信息化专利为研究对象,提出了一套基于文本挖掘的专利分析流程,剖析了专利申请的总体情况和发展趋势。

专利特征统计分析结果表明,中国水利工程建设管理信息化领域在2012年及以前处于“技术萌芽期”,自2013年进入“技术发展期”,2019年以来专利申请数量快速增长。相关专利申请主要集中在企业、高校或科研单位聚集的省份。企业与个人申请专利数最多,其发明专利与实用新型专利比值较低,表明注重技术的行业应用价值;高校与科研单位申请专利数其次,其发明专利与实用新型专利比值较高,表明重视技术创新;政府机关申请专利数较少,其研发能力有限。该领域专利主要涉及的IPC号为水利工程(E02B),数据处理系统或方法(G06Q),电数字处理技术(G06F),容积、流量、质量流量或液位的测量(G01F),具有较强的学科交叉特性。

采用文本挖掘方法进一步将中国水利工程建设管理信息化专利划分为“水利设施”“施工设备”“管理信息系统”“数字建筑平台”“水文监测”“给排水监测”“工程监测”“水资源调度方法”“风险分析方法”9个技术主题,对应“设备硬件”“综合管理系统”“信息监测”“数据分析”4个应用分类(见表 2)。各应用分类与技术主题的发展现状与前景如下:

1) “设备硬件”应用分类的专利申请数量最多,主要申请人为个人与企业,近年专利申请数量明显提升,技术发展与应用前景较好。

2) “综合管理系统”应用分类的专利申请数量排名第2,主要申请人为企业,该类专利较早受到行业重视,近年来研发水平稳步提升。

3) “信息监测”应用分类的专利申请数量排名第3,主要申请人为企业与个人。其中,“水文监测”“给排水监测”主题强度明显提升,受到行业重视,而“工程监测”主题强度不断波动,专利成果较少,是未来技术研发的重点之一。

4) “数据分析”应用分类的专利申请数量最少,且始终位于较低水平,主要申请人为企业与高校,反映出中国水利工程建设管理信息挖掘与数据分析能力亟待提高。

对此,本研究提出应重视水利行业工程监测能力的提升,促进大数据分析技术在水利工程建设管理中的应用,并鼓励企业、高校与科研单位开展产学研合作,以优化技术布局、促进科研成果转化、推进中国水利工程建设管理信息化发展。

未来研究方向包括:1) 国内外水利工程建设管理信息化专利与技术的发展趋势与侧重点对比;2) 运用动态主题模型,探究同一技术主题的内涵随时间的变化;3) 运用知识图谱,探究技术主题之间的相关关系,揭示技术创新路径。

参考文献
[1]
张建云, 刘九夫, 金君良. 关于智慧水利的认识与思考[J]. 水利水运工程学报, 2019(6): 1-7.
ZHANG J Y, LIU J F, JIN J L. Understanding and thinking of smart water conservancy[J]. Hydro-Science and Engineering, 2019(6): 1-7. DOI:10.16198/j.cnki.1009-640x.2019.06.001 (in Chinese)
[2]
黄晓东. 水利工程信息化建设必要性及发展趋势[J]. 河南水利与南水北调, 2017, 46(12): 85-86.
HUANG X D. Necessity and development trend of informatization construction of water conservancy project[J]. Henan Water Resources and South-to-North Water Diversion, 2017, 46(12): 85-86. (in Chinese)
[3]
刘武艺, 邵东国, 张鹏. 我国水利信息化建设的难点与对策[J]. 水利水电科技进展, 2005, 25(1): 67-70.
LIU W Y, SHAO D G, ZHANG P. Some problems in water conservancy informatization construction in China and countermeasures[J]. Advances in Science and Technology of Water Resources, 2005, 25(1): 67-70. DOI:10.3880/j.issn.1006-7647.2005.01.021 (in Chinese)
[4]
朱修海. 信息化技术在水利工程建设管理中的应用[J]. 中国高新科技, 2022(2): 149-150.
ZHU X H. Application of information technology in water conservancy project construction management[J]. China High and New Technology, 2022(2): 149-150. DOI:10.13535/j.cnki.10-1507/n.2022.02.66 (in Chinese)
[5]
张社荣, 姜佩奇, 吴正桥. 水电工程设计施工一体化精益建造技术研究进展: 数字孪生应用模式探索[J]. 水力发电学报, 2021, 40(1): 1-12.
ZHANG S R, JIANG P Q, WU Z Q. Advances in research of lean construction technology of integrated design and construction for hydropower projects: Exploration of digital twin application mode[J]. Journal of Hydroelectric Engineering, 2021, 40(1): 1-12. (in Chinese)
[6]
陈祖煜, 杨峰, 赵宇飞, 等. 水利工程建设管理云平台建设与工程应用[J]. 水利水电技术, 2017, 48(1): 1-6.
CHEN Z Y, YANG F, ZHAO Y F, et al. Construction and engineering application of cloud platform for construction management of water resources project[J]. Water Resources and Hydropower Engineering, 2017, 48(1): 1-6. (in Chinese)
[7]
黄祚继, 黄忠赤, 马浩. 水利工程自动化现状与适应技术分析研究[J]. 水利建设与管理, 2012, 32(10): 53-55.
HUANG Z J, HUANG Z C, MA H. Analysis and research on current situation and adaptive technology of hydraulic engineering automation[J]. Water Resources Development and Management, 2012, 32(10): 53-55. (in Chinese)
[8]
孙少楠, 张慧君. BIM技术在水利工程中的应用研究[J]. 工程管理学报, 2016, 30(2): 103-108.
SUN S N, ZHANG H J. Research on the application of BIM technology in water conservancy project[J]. Journal of Engineering Management, 2016, 30(2): 103-108. (in Chinese)
[9]
蔡阳. 智慧水利建设现状分析与发展思考[J]. 水利信息化, 2018(4): 1-6.
CAI Y. Status analysis and development thinking of smart water conservancy construction[J]. Water Resources Informatization, 2018(4): 1-6. (in Chinese)
[10]
连彬, 魏忠诚, 赵继军. 智慧水利关键技术与应用研究综述[J]. 水利信息化, 2021(5): 6-18, 31.
LIAN B, WEI Z C, ZHAO J J. Review on key technologies and applications of smart water conservancy[J]. Water Resources Informatization, 2021(5): 6-18, 31. (in Chinese)
[11]
胡延丰. 信息化技术在农村水利工程现代化建设中的应用[J]. 科技创新与应用, 2022, 12(8): 141-143.
HU Y F. Application of information technology in modernization of rural water conservancy project[J]. Technology Innovation and Application, 2022, 12(8): 141-143. (in Chinese)
[12]
韩能霞. 水利水电工程信息化建设中常见的问题及措施探究[J]. 中国设备工程, 2022(3): 240-241.
HAN N X. Common problems and measures in informatization construction of water conservancy and hydropower projects[J]. China Plant Engineering, 2022(3): 240-241. (in Chinese)
[13]
刘志明, 刘辉. 现阶段对水利工程信息化发展的思考[J]. 水利规划与设计, 2021(10): 1-3, 19.
LIU Z M, LIU H. Consideration of the development of water conservancy project informatization at the present stage[J]. Water Resources Planning and Design, 2021(10): 1-3, 19. (in Chinese)
[14]
周煊, 程立茹, 王皓. 技术创新水平越高企业财务绩效越好吗?基于16年中国制药上市公司专利申请数据的实证研究[J]. 金融研究, 2012(8): 166-179.
ZHOU X, CHENG L R, WANG H. Is higher the level of technological innovation, better the financial performance? An empirical analysis of patent applications of the listed Chinese pharmaceutical company[J]. Journal of Financial Research, 2012(8): 166-179. (in Chinese)
[15]
徐竹青. 专利、技术创新与经济增长: 理论与实证[J]. 科技管理研究, 2004, 24(5): 109-111.
XU Z Q. Patents, technological innovation and economic growth: Theory and evidence[J]. Science and Technology Management Research, 2004, 24(5): 109-111. (in Chinese)
[16]
郭婕婷, 肖国华. 专利分析方法研究[J]. 情报杂志, 2008, 27(1): 12-14, 11.
GUO J T, XIAO G H. The study of patent information analysis[J]. Journal of Information, 2008, 27(1): 12-14, 11. (in Chinese)
[17]
贾俊生, 伦晓波, 林树. 金融发展、微观企业创新产出与经济增长: 基于上市公司专利视角的实证分析[J]. 金融研究, 2017(1): 99-113.
JIA J S, LUN X B, LIN S. Financial development, corporation innovation and economic growth: Empirical analysis from the patent perspective[J]. Journal of Financial Research, 2017(1): 99-113. (in Chinese)
[18]
吕峥, 宋佳丽, 孙峙, 等. 中国锂离子电池回收技术知识产权分析[J]. 清华大学学报(自然科学版), 2019, 59(7): 551-557.
LÜ Z, SONG J L, SUN Z, et al. Intellectual property analysis of lithium-ion battery recycling methods in China[J]. Journal of Tsinghua University (Science and Technology), 2019, 59(7): 551-557. (in Chinese)
[19]
EVANGELISTA A, ARDITO L, BOCCACCIO A, et al. Unveiling the technological trends of augmented reality: A patent analysis[J]. Computers in Industry, 2020, 118: 103221.
[20]
KIM B S, CHANG S, SUH Y. Text analytics for classifying types of accident occurrence using accident report documents[J]. Journal of the Korean Society of Safety, 2018, 33(3): 58-64.
[21]
TSENG Y H, LIN C J, LIN Y I. Text mining techniques for patent analysis[J]. Information Processing & Management, 2007, 43(5): 1216-1247.
[22]
北京合享智慧科技有限公司. IncoPat全球专利数据库[DB/OL]. [2022-06-06]. https://www.incopat.com/advancedSearch/simpleInit.
Beijing IncoPat Co., Ltd. IncoPat global patent database[DB/OL]. [2022-06-06]. https://www.incopat.com/advancedSearch/simpleInit. (in Chinese)
[23]
包琛, 汪云海. 词云可视化综述[J]. 计算机辅助设计与图形学学报, 2021, 33(4): 532-544.
BAO C, WANG Y H. A survey of word cloud visualization[J]. Journal of Computer-Aided Design & Computer Graphics, 2021, 33(4): 532-544. (in Chinese)
[24]
FELIX C, FRANCONERI S, BERTINI E. Taking word clouds apart: An empirical investigation of the design space for keyword summaries[J]. IEEE Transactions on Visualization and Computer Graphics, 2018, 24(1): 657-666.
[25]
BLEI D M, KUCUKELBIR A, MCAULIFFE J D. Variational inference: A review for statisticians[J]. Journal of the American Statistical Association, 2017, 112(518): 859-877.
[26]
BLEI D M, NG A Y, JORDAN M I. Latent Dirichlet allocation[J]. The Journal of Machine Learning Research, 2003, 3: 993-1022.
[27]
吴画斌, 许庆瑞, 陈政融. 数字经济背景下创新人才培养模式及对策研究[J]. 科技管理研究, 2019, 39(8): 116-121.
WU H B, XU Q R, CHEN Z R. Research on cultivation mode and countermeasures of innovative talents under background of digital economy[J]. Science and Technology Management Research, 2019, 39(8): 116-121. (in Chinese)
[28]
左鹏飞. 信息化推动中国产业结构转型升级研究[D]. 北京: 北京邮电大学, 2017.
ZUO P F. Research on the promoting effect of informatization on transformation and upgrading of China's industrial structure[D]. Beijing: Beijing University of Posts and Telecommunications, 2017. (in Chinese)
[29]
谢丽芳, 邵煜, 马琦, 等. 国内外智慧水务信息化建设与发展[J]. 给水排水, 2018, 54(11): 135-139.
XIE L F, SHAO Y, MA Q, et al. Development and analysis of smart water system in China and abroad[J]. Water & Wastewater Engineering, 2018, 54(11): 135-139. (in Chinese)
[30]
吕铁. 传统产业数字化转型的趋向与路径[J]. 人民论坛·学术前沿, 2019(18): 13-19.
LÜ T. Trend and path of digitalized transformation of the traditional industries[J]. Frontiers, 2019(18): 13-19. (in Chinese)