2. 清华大学 公共管理学院,北京100084
2. School of Public Policy and Management, Tsinghua University, Beijing 100084, China
安全管理是大型工程建设的核心问题之一,对工程现场的安全隐患进行有效管理是保障施工安全的重要前提。因此,实时了解安全隐患管理的特征和状态并采取相应的管理措施,具有重要的研究价值和实践意义。
在建设管理领域,对安全管理的研究主要可以分为两个视角:管理驱动视角和技术驱动视角[1]。管理驱动视角下的研究,旨在探索建筑行业安全管理中的组织学、管理学乃至心理学机理,以提高安全管理的绩效。Leung等[2]通过问卷调研的方法,研究了建筑工人个体特征对安全事故发生的影响; Zhou等[3]研究了组织层面安全环境的测量以及提升安全环境的组织策略; 蒋中铭等[4]通过仿真模型和实验,研究了奖惩措施对工人安全行为的影响; 许树生等[5]采用演化博弈的方法,研究了发包人、承包人和保险人在安全风险治理中的多方协同策略。技术驱动视角下的研究,旨在利用各种技术手段帮助开展安全规划、监控及信息管理。这些技术主要包括:用于采集身份信息、位置信息、环境信息乃至人员行为信息的激光扫描技术、射频识别(radio frequency identification, RFID)技术、全球定位系统(global positioning system, GPS)技术、传感器技术等[6-9]; 用于人员和设备之间实时传达安全信息的无线网络技术[10]; 用于数据分析、处理和可视化的技术,如增强现实技术、建筑信息模型(building information modeling, BIM)等[11-12]。然而,无论从管理视角还是技术视角出发,这些研究大多基于行业、公司、项目或个人层面展开[13],而聚焦于安全管理任务、基于实际数据的研究相对较少。
近年来,随着数据挖掘技术的进步以及安全管理信息系统在工程项目中的应用,基于数据挖掘的安全管理方法研究得到了重视,以实现管理的定量化和科学化。Guo等[14]通过分析大量的安全规范、操作流程和事故案例等,建立了地铁建设中工人不安全行为的知识库。林鹏等[15]采用深度卷积神经网络建立学习和挖掘模型,研究了工程现场典型安全隐患的自动识别方法。Li等[16]基于对项目经理的调研数据,采用关联规则分析的方法,挖掘了影响工作倦怠等职业危害的各方面因素。Amiri等[17]应用多重对应分析和决策树等方法挖掘了21 864条建筑领域安全事故数据,提取了事故发生的主要模式。
工地现场的安全隐患管理是安全管理的具体任务,是避免安全事故发生的重要手段。目前,建设管理领域对基于安全隐患管理实际数据的研究相对较少,这主要是因为缺乏对隐患管理任务的全流程记录,而安全管理信息系统的逐步普及解决了此问题。本文基于某大型工程信息系统3年多记录的安全隐患管理协作数据,利用文本挖掘技术,研究了安全隐患的动态特征提取和分类方法; 交互分析了隐患特征和隐患类型、单位角色的关系; 而后,进一步探索了隐患特征对整改效率的影响。
1 数据采集为提高现场安全隐患管理的实时性和有效性,某大型工程研发了专门的管理信息系统,实时记录并积累了大量针对工程现场安全隐患管理协作的实况数据。
在该系统中,项目团队中的所有工作人员均可以对现场的安全隐患进行排查、上报和协作整改(如图 1所示)。该系统记录了工作人员对于安全隐患的描述和整改要求,以及隐患上报时间、要求整改完成时限和实际整改完成时间。该系统不仅规范了现场安全隐患的管理过程,促进了全员参与,还为项目中的所有个体和组织提供了一个隐患管理的协作平台。本文采集了2015年10月至2019年12月期间,共44 315条安全隐患的管理协作数据。
2 隐患特征挖掘方法
对安全隐患的描述和整改要求是以文本的形式记录和存储的。隐患特征挖掘方法主要包括数据预处理、特征赋权和特征分类3部分。
2.1 数据预处理对文本的数据预处理包括4个步骤:
1) 自动分词。采用结巴(jieba)分词技术[18],结合工程领域的专用词库,对每一条隐患文本进行分词操作。
2) 去停用词。根据“哈工大停用词表”[19],去除常见的停用词,如数字、空格、英文字母、标点符号等; 在此基础上,去除在此特定场景下的高频无效词汇,如“安全”“隐患”“整改”等。
3) 去低频词。为得到有效的特征词词库,采用文本预处理的通常做法,进一步去除出现频率小于文档总数0.025%的词语。
4) 词性标注。采用jieba分词技术,结合隐Markov模型(hidden Markov model, HMM),对词语的词性进行自动标注。为提取隐患的有效特征,词性标注后,只保留名词、动词、形容词和副词,形成有关安全隐患的特征词库。
2.2 特征赋权本文采用词频-逆向文件频率(term frequency-inverse document frequency, TF-IDF)算法对隐患的特征词进行权重计算。TF-IDF算法是一种文本挖掘算法,用于评估某特定词语在某特定文档中的重要性。其基本原理是:词语的权重(TF-IDF值)与词语在某特定文档中出现的次数成正比,但与它在所有文档(即“语料库”)中出现的频率成反比。
假设总共有D个文档,则某特定词语t在文档d中的TF-IDF值的计算公式如下:
$ \begin{array}{c} {\rm{TF}} - {\rm{IDF}}(t,d,D) = {\rm{TF}}(t,d) \cdot {\mathop{\rm IDF}\nolimits} (t,D),{\kern 1pt} \\ {\mathop{\rm IDF}\nolimits} (t,D) = {\log _2}\frac{D}{{\left| {\left\{ {j:t \in {d_j}} \right\}} \right|}}. \end{array} $ |
其中:TF(t, d)是词语t在文档d中出现的次数; IDF(t, D)是词语t的逆向文本频率,其计算过程为先用文档总数除以包含词语t的文档数,再将得到的商取以2为底的对数。
假设词库中有V个词语,通过TF-IDF算法可将所有文档表达成一个D×V维的矩阵,矩阵中第d行第t列的元素,即为词语t在文档d中的TF-IDF值。为使文档之间具有可比性,对矩阵每一行(即每个文档的TF-IDF向量)进行归一化处理,使每一行向量的Euclid长度为1。
本文的语料库包含44 315条安全隐患文本,每一条文本对应于一个文档,经节2.1的数据预处理后提取出2 054个隐患特征词。因此,最终生成的TF-IDF矩阵维度为44 315×2 054,表征了在不同安全隐患文本中不同特征词的权重。
2.3 特征分类通过文献调研以及对安全隐患文本的分析,本文将隐患特征(词)分为诱因特征(词)和管理特征(词)两类:诱因特征指的是导致安全隐患的人员、设备和环境(即“人机环”)等因素[20]; 管理特征指的是工作人员对隐患管理的评价和要求[21]。
1) 诱因特征。诱因特征是工作人员对安全隐患的客观描述和解释,可进一步分为“实体类”和“行为类”。“诱因特征-实体类”对应于特征词中的名词(如“栏杆”),为工地现场可能诱发安全事故的人员、设备和环境等实体。“诱因特征-行为类”对应于特征词中的动词(如“坠落”),为现场人员(或设备)与环境之间的交互行为。
2) 管理特征。管理特征是工作人员对安全隐患的主观评价和要求,可进一步分为“评价类”和“要求类”。“管理特征-评价类”对应于特征词中的形容词(如“严重”),表达了工作人员对安全隐患状态的主观评价。“管理特征-要求类”对应于特征词中的副词(如“立即”),表达了工作人员对隐患整改的要求。
3) 特征示例。在本文获取的隐患数据中,安全隐患分为18类。对每类隐患的TF-IDF向量求平均值,可得到该类隐患的特征权重向量,从而获取该类隐患最具代表性的各类特征。其中,“高空坠落”和“文明施工”是出现次数最多的两类隐患。囿于篇幅限制,下面仅展示这两类隐患的特征提取结果。
图 2和3分别是两类隐患的特征词云图(以TF-IDF值为权重)。可以看出,大部分特征词反映的是安全隐患的诱因,而反映管理特征的词语则相对较少,符合工程现场的实际情况。
表 1和2分别是两类隐患在不同类别特征下的前10个代表性特征词(按TF-IDF值从大到小排序)。可以看出,本文方法较好地提取出了两类隐患的代表性特征。例如,“高空坠落”隐患的代表性特征是施工人员在高空作业时,由于防护措施或设置不到位等原因,而导致存在坠落的风险。
诱因特征 | 管理特征 | |||
实体类 | 行为类 | 评价类 | 要求类 | |
临边 | 坠落 | 不到位 | 立即 | |
栏杆 | 设置 | 较大 | 及时 | |
通道 | 封闭 | 牢固 | 必须 | |
平台 | 搭设 | 符合要求 | 正确 | |
爬梯 | 绑扎 | 简易 | 重新 | |
人员 | 安装 | 不足 | 尽快 | |
安全带 | 封堵 | 严重 | 完全 | |
高处 | 固定 | 不够 | 随意 | |
排架 | 拆除 | 不严 | 立刻 | |
模板 | 通行 | 过长 | 非常 |
诱因特征 | 管理特征 | |||
实体类 | 行为类 | 评价类 | 要求类 | |
垃圾 | 清理 | 凌乱 | 及时 | |
文明 | 堆放 | 较差 | 立即 | |
材料 | 抽排 | 干净 | 尽快 | |
积水 | 通行 | 严重 | 随意 | |
现场 | 照明 | 整齐 | 重新 | |
杂物 | 堆积 | 畅通 | 随地 | |
形象 | 摆放 | 不足 | 随处 | |
通道 | 规整 | 废旧 | 长期 | |
淤泥 | 回收 | 混乱 | 必须 | |
人员 | 清除 | 不到位 | 定时 |
在大型工程建设过程中,传统的安全隐患管理主要依赖特定监管者对不安全“人机环”因素的排查,难以全面掌握现场的隐患特征和工作人员的状态。基于本文的隐患特征挖掘方法,进一步将“人机环”因素细分为“实体类”和“行为类”,并通过“管理特征”囊括了工作人员对隐患整改的认知、评价和要求,有助于开展对各方面隐患特征的细粒度管控。对于“诱因特征-实体类”,如“栏杆”“通道”等,应增加相关设施的日常维护和检修; 对于“诱因特征-行为类”,如“坠落”“绑扎”等,应完善施工行为规范的制定和实施; 对于“管理特征”所反映出的安全隐患管理状态,应针对性地加强对工作人员的安全教育,确保安全制度的落实。
3 隐患特征动态交互分析 3.1 隐患特征与隐患类型的交互分析该工程定义的18类安全隐患,可分为两种类型:事件型和规范型。事件型指的是该隐患若不处理,随时可能诱发安全事件(如“高空坠落”); 规范型指的是该隐患虽然不符合相关规范,但不会造成即时性的安全后果(如“文明施工”)。
下面对隐患特征和隐患类型进行交互分析,以探讨不同类型隐患的特征差异。
3.1.1 不同类型隐患的特征权重均值对比基于节2.2特征赋权生成TF-IDF值矩阵,将矩阵每行中属于各类别特征的词语权重加总,得到维度为44 315×4的矩阵,可反映每条安全隐患数据中4类特征的权重。而后,分别针对4类特征,计算两种类型隐患(即“事件型”和“规范型”)的TF-IDF权重均值,并进行T检验,结果如表 3所示。
事件型 | 规范型 | P值 | |
诱因特征-实体类 | 1.434 | 1.271 | 0.000 |
诱因特征-行为类 | 0.775 | 0.747 | 0.000 |
管理特征-评价类 | 0.070 | 0.136 | 0.000 |
管理特征-要求类 | 0.094 | 0.125 | 0.000 |
注:P值表示T检验中,接受零假设(两种类型无显著差异)的概率; P值接近0表示两种类型隐患之间存在显著差异。 |
由表 3可以发现,与规范型隐患相比,事件型隐患的“诱因特征”权重显著更高,“管理特征”权重显著更低。从与现场工作人员的访谈中得知,这是因为事件型隐患需要对现状和处理办法进行详细描述,因此更注重客观的“诱因特征”; 而规范型隐患主要是指出不合规之处,处理办法参照安全制度执行即可,因此工作人员更着重于提出主观的评价和要求。
3.1.2 不同类型隐患的特征权重随时间的变化基于每条安全隐患中4类特征的权重,可分析不同类型隐患的特征权重随时间的动态变化,结果如图 4所示。可以发现,两种类型隐患的各类别特征权重,在时间趋势上基本一致,说明现场的隐患管理状态存在系统性变化。例如,在某些法定节假日(如2019年2月),两种类型隐患的“管理特征”权重都有所上升,而“诱因特征”的权重则有所下降,即主观评价增加了而客观描述却减少了。这是因为节假日期间,工程进度放缓及人员减少使得对安全管理的重视程度下降,这一点也可从隐患上报数量的减少(2019年2月相比1月,减少了29%)得到佐证。
根据不同类型,乃至不同类别的隐患特征动态变化,安全管理人员可以结合工程现场的实际情况,动态地调整管理策略。
3.2 隐患特征与单位角色的交互分析由于职责和权限的不同,不同单位角色(业主、监理和承包商)对安全隐患的管理侧重点可能有所不同。下面对隐患特征与单位角色进行交互分析。
3.2.1 不同单位角色的特征权重均值对比基于反映每条安全隐患数据中4类特征权重的矩阵(维度为44 315×4),分别针对这4类特征计算3种单位角色(业主、监理和承包商)上报隐患的TF-IDF权重均值,并进行ANOVA检验,结果如表 4所示。
业主 | 监理 | 施工 | P值 | |
诱因特征-实体类 | 1.516 | 1.475 | 1.340 | 0.000 |
诱因特征-行为类 | 0.921 | 0.761 | 0.765 | 0.000 |
管理特征-评价类 | 0.095 | 0.090 | 0.081 | 0.000 |
管理特征-要求类 | 0.083 | 0.090 | 0.122 | 0.000 |
注:P值表示ANOVA检验中,接受零假设(3种单位角色无显著差异)的概率; P值接近0表示3种单位角色之间存在显著差异。 |
由表 4可以发现,对于“诱因特征”和“管理特征-评价类”权重,业主>监理>施工,并存在显著差异; 对于“管理特征-要求类”权重则正好相反,施工>监理>业主,也存在显著差异。在工程实践中,施工单位本应当是安全管理的实施主体,但在中国现行的法律框架下,安全事故一旦发生,业主单位也对后果负有不可推卸的责任。因此,该项目依然采取了“大业主”的建设管理模式,即:业主对安全隐患管理更加重视,对隐患的描述、解释更加详细,且更倾向于对隐患状态进行“评价”; 而施工单位虽然提的“要求”多,但客观描述却较少; 监理单位的表现则介于业主和施工单位之间。
3.2.2 不同单位角色的特征权重随时间的变化图 5展示了不同单位角色所上报隐患的各类特征权重随时间的动态变化。可以发现,在项目建设前期,业主上报隐患的“诱因特征”权重很高,之后有所下降并趋于平稳,但依然高出监理单位和施工单位。根据对现场工作人员的访谈,这主要是因为业主与承包商之间存在一个信任建立的过程:业主前期在安全隐患管理方面投入了大量精力,而随着信任关系的逐步建立,业主开始“逐步放权”,将更多的职责委派给监理和施工单位。然而,即使如此,受当前法律的限制(如节3.2.1所述),业主最后依然保留了大部分的安全管理权限。
不同单位上报隐患特征的变化可反映各单位管理状况的动态调整,有助于项目管理机构合理地协调各方资源,促进现场的安全管理。
4 隐患特征对整改效率的影响为进一步分析隐患特征对整改效率的影响,本文构建了面板数据和计量经济学模型进行回归分析。
4.1 模型设定正如节3所述,不同类型、不同单位角色以及不同时期的隐患存在系统性差异。因此,建立的模型分别控制了隐患类型、上报人员以及时间的固定效应,并加入隐患文本的长度作为控制变量,回归方程为
$ {\rm{D}}{{\rm{V}}_{\mathit{kcjt}}} = \mathit{\gamma } \cdot {\rm{t}}{{\rm{f}}_ - }{\rm{id}}{{\rm{f}}_{kcjt}} + {\rm{ control }} + {\mathit{\varphi }_c} + {\mathit{\alpha }_j} + {\mathit{\delta }_t} + {\mathit{\varepsilon }_{kcjt}}. $ |
其中:DV是因变量,代表该条隐患的整改是否超过要求的时限,超时记为1,没有超时则记为0[22]。下标kcjt中,k表示隐患编号,c表示隐患类型, j表示上报人员,t表示时间,即在时间t人员j上报的c类型隐患的第k条。tf_idf为本文关注的自变量,即4类特征的TF-IDF权重; control为控制变量,取文本长度的自然对数值; φc是隐患类型的固定效应; αj是上报人员的个体固定效应; δt是时间的固定效应; εkcjt是残差项。
4.2 结果为避免“诱因特征”和“管理特征”之间相互关联导致有偏估计,本文分别分析各类特征的TF-IDF权重对整改效率的影响。
4.2.1 “诱因特征”对整改效率的影响从表 5可以看出,对于“诱因特征”,工作人员对“行为类”更加敏感,即“行为类”的特征权重越大,整改越不容易超时,见(1)列; 但是,“实体类”特征对隐患整改效率无显著影响,见(2)列。这可能是因为行为比实体更容易引起警觉,与安全管理理论相符[23]。而且,将两类特征同时加入模型,见(3)列,系数估计基本一致,说明分析结果稳健。
(1)是否超时 | (2)是否超时 | (3)是否超时 | |
诱因特征-实体类 | 0.004(0.006) | -0.006(0.007) | |
诱因特征-行为类 | -0.012*(0.006) | -0.016**(0.008) | |
ln(文本长度) | 0.011(0.009) | 0.018*(0.009) | 0.022**(0.011) |
类型固定效应 | Yes | Yes | Yes |
个体固定效应 | Yes | Yes | Yes |
时间固定效应 | Yes | Yes | Yes |
N | 44188 | 44188 | 44188 |
R2 | 0.148 | 0.149 | 0.149 |
注:括号中数据为个人层面的聚类稳健标准误。*P < 0.1, **P < 0.05, ***P < 0.01。 |
4.4.2 “管理特征”对整改效率的影响
从表 6可以看出,对于“管理特征”,工作人员对“评价类”和“要求类”特征权重有不同的响应。“要求类”权重越高,整改越不容易超时,见(2)列; 但是,“评价类”权重越高,反而不利于隐患的按时整改,见(1)列。进一步将两类特征同时加入模型,见(3)列,系数估计基本一致,说明分析结果稳健。这说明与难以落实的评价相比,工作人员更倾向于对具体的要求和指令做出反应,这种情况与工程实践相符。
(1)是否超时 | (2)是否超时 | (3)是否超时 | |
管理特征-评价类 | 0.027**(0.013) | 0.026**(0.013) | |
管理特征-要求类 | -0.033*(0.018) | -0.030*(0.018) | |
ln(文本长度) | 0.012(0.009) | 0.013(0.009) | 0.013(0.009) |
类型固定效应 | Yes | Yes | Yes |
个体固定效应 | Yes | Yes | Yes |
时间固定效应 | Yes | Yes | Yes |
N | 44188 | 44188 | 44188 |
R2 | 0.149 | 0.149 | 0.149 |
注:括号中数据为个人层面的聚类稳健标准误。*P < 0.1, **P < 0.05, ***P < 0.01。 |
5 结论
本研究采集了某大型建设工程信息系统记录的安全隐患管理协作数据,聚焦于安全隐患的特征挖掘。主要工作和结论如下:
1) 利用文本挖掘技术,提出了用于隐患特征提取和分类的方法;
2) 基于该方法,分析了隐患特征与隐患类型、单位角色之间的动态交互关系,发现了不同类型和不同单位角色上报的隐患都存在显著的差异;
3) 进一步探讨了隐患特征对整改效率的影响,发现“诱因特征-行为类”和“管理特征-要求类”的权重越高,隐患整改越不容易超时。
工程现场的隐患管理对保障施工过程安全至关重要。传统管理手段依赖于特定监管者对“人机环”等安全诱因的人工排查,且难以获取工作人员实际的现状。本文提出的隐患特征挖掘方法不仅将“人机环”等因素进一步细分为“实体类”和“行为类”,还能获取项目人员对隐患整改的认知、评价和要求,有助于在工程实践中动态分析、实时掌握隐患状态的变化,并作出相应的策略调整,以提高安全管理效率。同时,还进行了一系列关于隐患特征的交互分析和机理探讨,不仅佐证了本文方法的合理性和有效性,还基于实际的观察数据完善了安全管理理论,对理论创新和工程实践均有重要意义。
[1] |
ZHOU Z P, GOH Y M, LI Q M. Overview and analysis of safety management studies in the construction industry[J]. Safety Science, 2015, 72: 337-350. DOI:10.1016/j.ssci.2014.10.006 |
[2] |
LEUNG M Y, CHAN Y S, YUEN K W. Impacts of stressors and stress on the injury incidents of construction workers in Hong Kong[J]. Journal of Construction Engineering and Management, 2010, 136(10): 1093-1103. DOI:10.1061/(ASCE)CO.1943-7862.0000216 |
[3] |
ZHOU Q, FANG D P, MOHAMED S. Safety climate improvement: Case study in a Chinese construction company[J]. Journal of Construction Engineering and Management, 2011, 137(1): 86-95. DOI:10.1061/(ASCE)CO.1943-7862.0000241 |
[4] |
蒋中铭, 方东平, 张铭宗. 基于实验设计的建筑工人安全相关行为仿真[J]. 清华大学学报(自然科学版), 2014, 54(10): 1327-1332. JIANG Z M, FANG D P, ZHANG M Z. Experiment-based simulations of construction worker safety behavior[J]. Journal of Tsinghua University (Science and Technology), 2014, 54(10): 1327-1332. (in Chinese) |
[5] |
许树生, 王雪青, 徐志超. 城市地下工程核心安全风险治理: 多方协同策略的形成与演化[J]. 土木工程学报, 2017, 50(9): 90-103. XU S S, WANG X Q, XU Z C. Governance of core safety risks of urban underground engineering: The formation and evolution of multi-party collaborative strategies[J]. China Civil Engineering Journal, 2017, 50(9): 90-103. (in Chinese) |
[6] |
TEIZER J, ALLREAD B S, FULLERTON C E, et al. Autonomous pro-active real-time construction worker and equipment operator proximity safety alert system[J]. Automation in Construction, 2010, 19(5): 630-640. DOI:10.1016/j.autcon.2010.02.009 |
[7] |
LEE H S, LEE K P, PARK M, et al. RFID-based real-time locating system for construction safety management[J]. Journal of Computing in Civil Engineering, 2012, 26(3): 366-377. DOI:10.1061/(ASCE)CP.1943-5487.0000144 |
[8] |
CARBONARI A, GIRETTI A, NATICCHIA B. A proactive system for real-time safety management in construction sites[J]. Automation in Construction, 2011, 20(6): 686-698. DOI:10.1016/j.autcon.2011.04.019 |
[9] |
ZHANG M Y, CAO T Z, ZHAO X F. Applying sensor-based technology to improve construction safety management[J]. Sensors, 2017, 17(8): 1841. DOI:10.3390/s17081841 |
[10] |
WU W W, YANG H J, CHEW D A S, et al. Towards an autonomous real-time tracking system of near-miss accidents on construction sites[J]. Automation in Construction, 2010, 19(2): 134-141. DOI:10.1016/j.autcon.2009.11.017 |
[11] |
PARK C S, KIM H J. A framework for construction safety management and visualization system[J]. Automation in Construction, 2013, 33: 95-103. DOI:10.1016/j.autcon.2012.09.012 |
[12] |
ZHANG S J, SULANKIVI K, KIVINIEMI M, et al. BIM-based fall hazard identification and prevention in construction safety planning[J]. Safety Science, 2015, 72: 31-45. DOI:10.1016/j.ssci.2014.08.001 |
[13] |
LEI Z, TANG W Z, DUFFIELD C F, et al. Qualitative analysis of the occupational health and safety performance of Chinese international construction projects[J]. Sustainability, 2018, 10(12): 4344. DOI:10.3390/su10124344 |
[14] |
GUO S Y, LUO H B, YONG L. A big data-based workers behavior observation in China metro construction[J]. Procedia Engineering, 2015, 123: 190-197. DOI:10.1016/j.proeng.2015.10.077 |
[15] |
林鹏, 魏鹏程, 樊启祥, 等. 基于CNN模型的施工现场典型安全隐患数据学习[J]. 清华大学学报(自然科学版), 2019, 59(8): 628-634. LIN P, WEI P C, FAN Q X, et al. CNN model for mining safety hazard data from a construction site[J]. Journal of Tsinghua University (Science and Technology), 2019, 59(8): 628-634. (in Chinese) |
[16] |
LI X D, FEI Y F, RIZZUTO T E, et al. What are the occupational hazards of construction project managers: A data mining analysis in China[J]. Safety Science, 2021, 134: 105088. DOI:10.1016/j.ssci.2020.105088 |
[17] |
AMIRI M, ARDESHIR A, FAZEL ZARANDI M H, et al. Pattern extraction for high-risk accidents in the construction industry: A data-mining approach[J]. International Journal of Injury Control and Safety Promotion, 2016, 23(3): 264-276. DOI:10.1080/17457300.2015.1032979 |
[18] |
SUN J. Jieba Chinese word segmentation tool[Z]. 2012.
|
[19] |
官琴, 邓三鸿, 王昊. 中文文本聚类常用停用词表对比研究[J]. 数据分析与知识发现, 2017, 1(3): 72-80. GUAN Q, DENG S H, WANG H. Chinese stopwords for text clustering: A comparative study[J]. Data Analysis and Knowledge Discovery, 2017, 1(3): 72-80. (in Chinese) |
[20] |
ABDELHAMID T S, EVERETT J G. Identifying root causes of construction accidents[J]. Journal of Construction Engineering and Management, 2000, 126(1): 52-60. DOI:10.1061/(ASCE)0733-9364(2000)126:1(52) |
[21] |
PERLMAN A, SACKS R, BARAK R. Hazard recognition and risk perception in construction[J]. Safety Science, 2014, 64: 22-31. DOI:10.1016/j.ssci.2013.11.019 |
[22] |
BAI Y, JIA R X. Elite recruitment and political stability: The impact of the abolition of China's civil service exam[J]. Econometrica, 2016, 84(2): 677-733. DOI:10.3982/ECTA13448 |
[23] |
LI H, LU M J, HSU S C, et al. Proactive behavior-based safety management for construction safety improvement[J]. Safety Science, 2015, 75: 107-117. DOI:10.1016/j.ssci.2015.01.013 |