突发事件协同研判行为的演化博弈分析
袁晓芳1,2, 于鸿志1, 曹玉静1, 王新平1    
1. 西安科技大学 管理学院, 西安 710054;
2. 西安科技大学 人因与管理工效学研究中心, 西安 710054
摘要:突发事件协同研判中多个主体决策立足的收益路径不同, 易导致突发事件研判失效、风险事件损失扩大, 是目前亟待解决的关键性问题。该文以前景理论-心理账户(PT-MA)为基础, 应用演化博弈模型研究了突发事件协同研判的参与主体(公众、一线人员、应急指挥部)之间复杂行为的互动机制, 分析了各博弈主体策略选择的稳定性, 并对关键参数变化下的行为演化路径进行仿真分析。模型分析结果表明:三方主体的协同研判策略选择存在3个平衡点; 当应急指挥部的感知收益提高且处罚力度加大时, 系统将达到最优。仿真分析结果表明:通过调整初始概率、收获感知参照点和惩罚力度3个参数, 主体策略趋于正向, 且收敛速度随着参数的增加而显著提升。因此可以通过加大奖励措施, 提升决策初始概率值; 通过表彰先进个人和组织公益宣讲等, 降低收益感知参考点; 通过完善相关惩罚条例并增加监督举报措施, 提高消极策略的惩罚力度。以此促进协同研判主体的策略选择向积极方向演化。
关键词突发事件    协同研判    前景理论    心理账户    演化博弈    
Analysis of evolutionary game regarding emergency sensemaking behavior
YUAN Xiaofang1,2, YU Hongzhi1, CAO Yujing1, WANG Xinping1    
1. School of Management, Xi'an University of Science and Technology, Xi'an 710054, China;
2. Research Center for Human Factors and Management Ergonomics, Xi'an University of Science and Technology, Xi'an 710054, China
Abstract: [Objective] Emergency sensemaking can control a situation by identifying the warning signs early and before the situation deteriorates further. However, the different benefit paths of multiagents in emergency sensemaking can easily lead to sensemaking failure and additional escalation of risk event losses. Therefore, it is vital to study how to influence the strategic choice of the relevant agents in sensemaking in the real world. [Methods] Based on the prospect theory-mental account, this report applied the evolutionary game model to study the following complex behavior mechanism among the multiagents in emergency sensemaking: the public (truthfully providing information or falsely providing information), frontline personnel (efficiently reporting or inefficiently reporting), and emergency command (group wisdom or group myth). According to different strategic choices, the payoff matrix is constructed, and the evolutionary replication dynamic equation is obtained using the matrix; however, the three evolutionary replication dynamic equations cannot directly determine the equilibrium point of the tripartite strategy. In this study, the Jacobian matrix is obtained by partial derivation of the forward decision probability of three differential equations, and the stability of the strategy choice of each game agent is analyzed by calculating the eigenvalues of the matrix. In order to further analyze the influence of key elements on the evolution process and results of the game. The computer simulation software MATLAB was used to establish a game model and assign initial values to each parameter in the model. The key parameters affecting the evolution path of decision-making behavior are extracted and analyzed by adjusting the initial values of the parameters. [Results] Solving the game model provides the following findings: 1) When the labor cost of frontline personnel is high, or the punishment is weak, the cost of the emergency command choosing a speculative strategy is substantially reduced. In this case, emergency sensemaking completely depends on the spontaneous behavior of the public, resulting in a lack of coordination efficiency and accurate judgment from frontline personnel and the emergency command. 2) By increasing the reward subsidies for positive decision-making by frontline personnel and increasing the penalties for negative decision-making, the signs of emergencies can be better understood and constructed by multiagents, and the emergency command can respond more rapidly. 3) When the perceived benefit of the emergency command to fully respond to the emergency is increased, the penalty of being tracked for choosing the speculative strategy is increased, and the system will stabilize at the optimal equilibrium point (1, 1, 1). 4) Simulation studies of the game model reveal that by adjusting the initial probabilities of the agents' strategies, perceptual reference points, and the intensity of punishment, the agents' strategic choices gradually tend toward positive choices. The convergence speed improves substantially with the increase of these parameters. [Conclusions] The results of this study showed that the perception of benefits influences the initial probability of the agents' strategy choice, and the initial probability of the choice is the factor that affects the agents' positive strategy choice. While expanding the incentive policy to encourage the agents' positive sensemaking behavior, the supervision and reporting measures should be increased to neglect the public interest behavior, and the corresponding agent should be severely punished. In addition to the established reward and punishment measures, subjective factors significantly influence decision-making. In practice, excellent individuals should be commended, and public welfare campaigns should be organized to reduce the perceptual reference points of income, allowing the agents to understand the necessity of emergency sensemaking work and make positive decisions spontaneously.
Key words: emergency    sensemaking    prospect theory    mental accounts    evolutionary game    

突发事件研判是指在灾情发生前或发展过程中捕捉可能导致灾难性后果的事件征兆,为采取相应的控制和减缓措施提供决策依据,以避免形势的进一步恶化[1]。突发事件协同研判是指不同主体在研判过程中对突发事件形成共同认识和能力的过程[2],是我国应急管理机制建设的重要组成部分。然而,近年来发生的多起突发事件均暴露出部门间协同机制不畅[3-4]、风险研判[5]和决策效率低[6]等问题。例如,2013年青岛输油管道泄漏事故中,原油泄漏到爆炸期间,企业和政府的有关部门对事故风险研判失误,没有及时下达启动应急预案的指令,导致应急处置不力[7];2022年疫情防控工作中,长春市九台区的卫生健康局与教育局等对疫情防控形势认识不足、研判不够,未对学校集中授课提出有效的防范和管控意见,造成疫情在属地某中学内传播[8]。突发事件协同研判在国外的开展同样存在不足,Combe等[9]指出领导研判能力的缺失导致面临突发事件时团队对危机达成共识的效率低下,并利用因果认知图谱探究了领导在团队的协同研判能力中的重要性。Comfort等[10]依据新闻报道针对Katrina飓风造成灾害的过程进行分析,发现不同权利和责任级别的组织对灾害行动的了解出现严重的信息不对称,导致了协同研判及处置行动的崩溃。

突发事件应急管理在理论研究和实务工作方面的种种不力,对加强突发事件协同研判的相关研究提出迫切需求[11]。国内相关研究主要关注协同研判系统机制的构建[12]、风险研判的流程[13]和研判的方法[14],鲜有学者研究参与协同研判的主体之间存在的冲突。参与协同研判的主体存在不同的利益动机和收益路径,会在利益驱动下做出不如实、不积极、不负责等行为,导致协同研判工作的停滞,而主体行为选择的过程可视为一场动态博弈。

经典博弈论尽管被广泛应用,但以完全理性的假设为基础,即假设参与者一直追求个人利益最大化,同时具有绝对正确的判断力,这有违现实,存在局限性[15]。Kahneman等[16]从心理学视角在施工安全管理群体决策行为中引入前景理论(prospect theory,PT),使决策更具真实性。胡欢等[17]采用基于PT理论的演化博弈模型,对网络谣言管控中政府和网络运营商的决策过程进行博弈分析。Thaler[18]在PT理论的基础上提出了心理账户(mental accounts,MA)理论,MA理论能更真实地展现各主体的决策行为。Hui等[19]将前景理论-心理账户(PT-MA)应用到网络谣言治理的博弈模型中,探究了微博谣言制造者、微博用户和政府之间的复杂决策过程。张子鸣等[20]也采用PT-MA构建了煤矿工人的前景效价-成本感知矩阵,对煤矿安全行为主体进行博弈分析。至今,已有众多学者将PT-MA与演化博弈相结合,并对行为主体的决策机理做出更优解释[21-23]

本文基于PT-MA,搭建具有有限理性的参与主体(公众、一线人员与应急指挥部)的演化博弈模型,借助MA中“得-失”账户的概念,将传统演化博弈中的收益函数代替为更切实的前景价值函数,构建安全收益感知矩阵,并基于该矩阵对公众、一线人员和应急指挥部的突发事件协同研判过程进行演化博弈分析,以期对研判过程中各主体的行为决策做出更加科学、切实的解释。

1 模型假设与构建 1.1 问题描述

在突发事件协同研判中,公众、一线人员和应急指挥部存在不同的利益动机,可能隐瞒灾情的真实情况,亦或是未能充分考虑、感知、认识到突发事件对社会的危害性,从而做出不如实上报事件信息的行为。公众从自身利益出发,为了避免原本生活节奏被打乱,可能延迟上报灾情,延长研判时间;一线人员,尤其是置身于险情前线的人员,作为将突发事件预警信息从基层传递给应急指挥部的主要载体,理应在发现或接收到报警信息后即刻递送至上级部门,但在面对情境的不确定性和模糊性时,容易趋向追求安全,即为确保无误报而放弃效率,最终延长研判时间;应急指挥部应当群策群力,对突发事件的关键风险点进行研判,但出于快速响应和节省成本的目的,可能受到群体迷思,即部门内部出现遏制相异观点提出的现象的影响,从而作出较差甚至错误的判断,导致研判失误。公众能否如实上报灾情?一线人员能否向上级部门高效递送信息?应急指挥部能否采用群体智慧进行协同研判?这三方的行为选择过程可视作一场动态博弈,根据协同研判的关联行为,描述各主体决策博弈的因果关系如图 1所示。其中:f1f2f3分别为公众选择不如实上报、一线人员选择低效传递信息,以及公众和一线人员均选择上述不负责行为,造成应急指挥部未能对突发事件进行及时研判的时间拖延系数。本文将从“收益-成本”的视角对各主体协同研判的策略选择过程进行博弈分析。

图 1 各主体决策博弈的因果关系

1.2 PT-MA

PT描述的是决策者通常会依据预设的、相对于实际收益的参照点,对行为的收入或成本进行衡量,且决策者在前景不明确的情况下,其风险偏好和敏感度缺失会导致作出的决策价值与期望价值不一致,最终影响决策的结果[24]

前景的期望价值函数为

$ O=T(\Delta \omega) w(\varepsilon) $

其中:Tω)表示决策者的主观价值感知函数,Δω表示决策行为中实际收益与参照点的差值;w(ε) 表示决策者的决策权重函数,ε表示事件发生的概率。Δω>0时,Tω)具有凹函数的特征;Δω<0时,Tω) 具有凸函数的特征;Δω=0表示实际收益与预期参照点相等。w(ε)的函数特征如下:w(0)=0,w(1)=1;当ε趋近于0时,w(ε)>ε;当ε趋近于1时,w(ε)<ε

MA描述的是决策者在心理层面会将收入更细致地划为收获和失去这2个账户分别进行管理。收获和失去账户包含的自身感知参照点分别为U0U1,对应的感知价值函数分别为V(x)和Z(x)。

$ V(x)=\left\{\begin{array}{cl} \left(x-U_0\right)^\beta, & x \geqslant U_0 ; \\ -\lambda\left(U_0-x\right)^\theta, & x<U_0 ; \end{array}\right. $ (1)
$ Z(x)= \begin{cases}\delta\left(x-U_1\right)^\nu, & x \geqslant U_1 ; \\ -\left(U_1-x\right)^\sigma, & x<U_1 .\end{cases} $ (2)

其中:x为价值变量;λ为收获损失规避灵敏度;δ为失去损失规避灵敏系数;βθνσ均为风险偏好参数,越大表示对风险的感知越敏感。

MA理论中决策者的决策权重函数为

$ \begin{aligned} & w^{+}(\varepsilon)=\frac{\varepsilon^\gamma}{\left[\varepsilon^\gamma+(1+\varepsilon)^\gamma\right]^{\frac{1}{\gamma}}}, \\ & w^{-}(\varepsilon)=\frac{\varepsilon^\gamma}{\left[\varepsilon^\gamma+(1-\varepsilon)^\gamma\right]^{\frac{1}{\gamma}}} . \end{aligned} $ (3)

其中:w+(ε)为收获决策权重函数,w-(ε)为失去决策权重函数,γ为决策灵敏系数。决策者的风险偏好及客观决策环境是影响感知价值函数和决策权重函数的重要因素,不同条件下的相关参数可能会有所差异。为便于验算,后续公式统一用w(ε)表示决策权重函数,γ取值为0.75。

1.3 基本假设

假设1 感知价值函数中所有系数均为大于0的固定值。

假设2 公众、一线人员和应急指挥部均为始终具备有限理性的博弈主体,满足PT-MA所构建的期望价值函数O

假设3 公众在遭遇突发事件时面临2种选择:如实提供信息(如实),不如实提供信息(不实);一线人员在接收到突发事件相关信息后面临2种选择:高效处理并上报突发事件情况(高效),低效上报处理并上报突发事件情况(低效);应急指挥部在收到突发事件情况上报后有2种选择:群体智慧进行研判(群智),群体迷思进行研判(群迷)。

假设4 各博弈主体只有同时满足“如实”“高效”和“群智”时,才能确保整个突发事件协同研判过程快速且有效地进行,否则研判结果仍将存在风险。

假设5 p为公众选择“如实”的概率;q为一线人员选择“高效”的概率;g为应急指挥部选择“群智”的概率;I0为公众选择“如实”付出的机会成本;I1为公众选择“不实”付出的心理成本;C0为一线人员选择“高效”付出的劳动成本;ψC0为一线人员选择“低效”付出的劳动成本,0<ψ<1;C1为一线人员选择“高效”付出的心理成本;K0为应急指挥部选择“群智”付出的时间及劳动成本;φK0为应急指挥部选择“群迷”付出的时间及劳动成本,0<φ<1;K1为应急指挥部选择“群迷”付出的心理成本;S为政府部门对积极配合应急管理工作的公众的奖励;D为一线人员选择“高效”而得到的感知收益(处理突发事件的事后补贴、获得上级的赏识等);E为应急指挥部选择“群智”而得到的感知收益(公民财产损失减少、社会稳定等);W为公众被判定为谎报险情、疫情、警情等面临的行政处罚;X为一线人员被追查发现有意地低效上报面临的处罚;G为应急指挥部群体迷思被追查将面临的处罚(对相关负责人进行记过处罚、革职等);L为3方对灾情、险情未得到有效处理所需承担的损失;Q为突发事件未得到有效处置的概率。

1.4 模型构建

结合PT-MA中V(x)和Z(x)构建三方主体的演化博弈策略组合及收益,如表 2所示。

表 2 三方主体的演化博弈策略组合及收益
三方主体策略 收益
(如实, 高效, 群智) $\begin{gathered} \left(V(S)-Z\left(I_0\right), V(D)-Z\left(C_0\right),\right. \\ \left.V(E)-Z\left(K_0+S+D\right)\right) \end{gathered}$
(如实, 高效, 群迷) $\begin{gathered} \left(V(S)-Z\left(I_0+L w(Q)\right)\right. \\ V(D)-Z\left(C_0+L w(Q)\right) \\ \left.-Z\left(\varphi K_0+K_1+(G+L) w(Q)+S+D\right)\right) \end{gathered}$
(如实, 低效, 群智) $\begin{gathered} \left(V(S)-Z\left(I_0+L w(Q)\right),\right. \\ V(D w(1-Q))- \\ Z\left(\psi C_0+C_1+(X+L) w(Q)\right), \\ V(E w(1-Q)+X w(Q))- \\ \left.Z\left(f_2 K_0+S+(D+L) w(Q)\right)\right) \end{gathered}$
(如实, 低效, 群迷) $\begin{gathered} \left(V(S)-Z\left(I_0+L w(Q)\right)\right. \\ V(D w(1-Q))- \\ Z\left(\psi C_0+C_1+(X+L) w(Q)\right), \\ V(X w(1-Q))- \\ \left.Z\left(f_2 \varphi K_0+K_1+S+(G+D+L) w(Q)\right)\right) \end{gathered}$
(不实, 高效, 群智) $\begin{gathered} \left(V(S w(1-Q))-Z\left(I_1+(W+L) w(Q)\right),\right. \\ V(D)-Z\left(C_0+L w(Q)\right), \\ V(E w(1-Q)+W w(Q))- \\ \left.Z\left(f_1 K_0+D+(S+L) w(Q)\right)\right) \end{gathered}$
(不实, 高效, 群迷) $\begin{gathered} \left(V(S w(1-Q))-Z\left(I_1+(W+L) w(Q)\right),\right. \\ V(D)-Z\left(C_0+L w(Q)\right), \\ V(W w(Q))- \\ \left.Z\left(f_1 \varphi K_0+K_1+D+(G+S+L) w(Q)\right)\right) \end{gathered}$
(不实, 低效, 群智) $\begin{gathered} \left(V(S w(1-Q))-Z\left(I_1+(W+L) w(Q)\right),\right. \\ V(D w(1-Q))- \\ Z\left(\psi C_0+C_1+(X+L) w(Q)\right), \\ V(E w(1-Q)+(W+X) w(Q))- \\ \left.Z\left(f_3 K_0+(S+D+L) w(Q)\right)\right) \end{gathered}$
(不实, 低效, 群迷) $\begin{gathered} \left(-Z\left(I_0+W+L\right),\right. \\ -Z\left(\psi C_0+C_1+X+L\right), \\ \left.V(W+X)-Z\left(f_3 \varphi K_0+K_1+G+L\right)\right) \end{gathered}$

2 模型分析 2.1 策略稳定性

公众选择“如实”的价值感知为Tp1、选择“不实”的价值感知为Tp0。整个公众群体的平均价值感知为Tp,其复制动态方程为

$ \begin{aligned} T_{\mathrm{pl}}= & T(\Delta w) w(\varepsilon)= \\ & w(q) w(g)\left[V(S)-Z\left(I_0\right)\right]+ \\ & w(q) w(1-g)\left[V(S)-Z\left(I_0+L w(Q)\right)\right]+ \\ & w(1-q) w(g)\left[V(S)-Z\left(I_0+L w(Q)\right)\right]+ \\ & w(1-q) w(1-g)\left[V(S)-Z\left(I_0+L w(Q)\right)\right], \end{aligned} $ (4)
$ \begin{aligned} T_{\mathrm{p} 0}= & T(\Delta w) w(\varepsilon)= \\ & w(q) w(g)[V(S w(1-Q))- \\ & \left.Z\left(I_1+(W+L) w(Q)\right)\right]+ \\ & w(q) w(1-g)[V(S w(1-Q))- \\ & \left.Z\left(I_1+(W+L) w(Q)\right)\right]+ \\ & w(1-q) w(g)[V(S w(1-Q))- \\ & \left.Z\left(I_1+(W+L) w(Q)\right)\right]+ \\ & w(1-q) w(1-g)\left[-Z\left(I_0+W+L\right)\right], \end{aligned} $ (5)
$ T_{\mathrm{p}}=p T_{\mathrm{p} 1}+(1-p) T_{\mathrm{p} 0} . $ (6)

公众策略选择演化的复制动态方程为

$ \begin{aligned} F(p)= & \mathrm{d} p / \mathrm{d} t=p\left(T_{\mathrm{p} 1}-T_{\mathrm{p}}\right)= \\ & p(1-p)\left(T_{\mathrm{p} 1}-T_{\mathrm{p} 0}\right)= \\ & p(1-p)\left[w(q) w(g) M_1+\right. \\ & w(q) w(1-g) M_0+ \\ & w(1-q) w(g) H_1+ \\ & \left.w(1-q)(1-g) H_0\right] . \end{aligned} $ (7)

其中:M1M0分别代表一线人员选择“高效”时,应急指挥部在“群智”和“群迷”情境下,公众选择“如实”与“不实”的价值函数之间的差值;H1H0分别代表一线人员选择“低效”时,上述价值函数之间的差值。

一线人员选择“高效”的价值感知为Tq1、选择“低效”的价值感知为Tq0。整个一线人员群体的平均价值感知为Tq,其复制动态方程为

$ \begin{aligned} T_{\mathrm{qq}}= & T(\Delta \omega) w(\varepsilon)= \\ & w(p) w(g)\left[V(D)-Z\left(C_0\right)\right]+ \\ & w(p) w(1-g)[V(D)- \\ & \left.Z\left(C_0+L w(Q)\right)\right]+ \\ & w(1-p) w(g)[V(D)- \\ & \left.Z\left(C_0+L w(Q)\right)\right]+ \\ & w(1-p) w(1-g)[V(D)- \\ & \left.Z\left(C_0+L w(Q)\right)\right], \end{aligned} $ (8)
$ \begin{aligned} T_{q p}= & T(\Delta \omega) w(\varepsilon)= \\ & w(p) w(g)[V(D w(1-Q))- \\ & \left.Z\left(\psi C_0+C_1+(X+L) w(Q)\right)\right]+ \\ & w(p) w(1-g)[V(D w(1-Q))- \\ & \left.Z\left(\psi C_0+C_1+(X+L) w(Q)\right)\right]+ \\ & w(1-p) w(g)[V(D w(1-Q))- \\ & \left.Z\left(\psi C_0+C_1+(X+L) w(Q)\right)\right]+ \\ & w(1-p) w(1-g)\left[-Z\left(\psi C_0+\right.\right. \\ & \left.\left.C_1+X+L\right)\right], \end{aligned} $ (9)
$ T_{\mathrm{q}}=q T_{q_1}+(1-q) T_{q 0} . $ (10)

一线人员策略选择演化的复制动态方程为

$ \begin{aligned} F(q)= & \mathrm{d} p / \mathrm{d} t=q\left(T_{q 1}-T_q\right)= \\ & q(1-q)\left(T_{q 1}-T_{q 0}\right)= \\ & q(1-q)\left[w(p) w(g) R_1+\right. \\ & w(p) w(1-g) R_0+ \\ & w(1-p) w(g) U_1+ \\ & \left.w(1-p) w(1-g) U_0\right] . \end{aligned} $ (11)

其中:R1R0分别代表公众选择“如实”时,应急指挥部在“群智”和“群迷”情境下,一线人员选择“高效”与“低效”的价值函数之间的差值。U1U0分别代表公众选择“不实”时,上述价值函数之间的差值。

应急指挥部选择“群智”的价值感知为Tg1、选择“群迷”的价值感知为Tg0。应急指挥部的平均价值感知为Tg,其复制动态方程为

$ \begin{aligned} T_{\mathrm{g} 1}= & T(\Delta \omega) w(\varepsilon)= \\ & w(p) w(q)\left[V(E)-Z\left(K_0+S+D\right)\right]+ \\ & w(p) w(1-q)[V(E w(1-Q)+X w(Q))- \\ & \left.Z\left(f_2 K_0+S+(D+L) w(Q)\right)\right]+ \\ & w(1-p) w(q)[V(E w(1-Q)+W w(Q))- \\ & \left.Z\left(f_1 K_0+D+(S+L) w(Q)\right)\right]+ \\ & w(1-p) w(1-q)[V(E w(1-Q)+ \\ & (W+X) w(Q))- \\ & \left.Z\left(f_3 K_0+(S+D+L) w(Q)\right)\right], \end{aligned} $ (12)
$ \begin{aligned} T_{\mathrm{g} 0}= & T(\Delta \omega) w(\varepsilon)= \\ & w(p) w(q)\left[-Z\left(\varphi K_0+K_1+\right.\right. \\ & (G+L) w(Q)+S+D)]+ \\ & w(p) w(1-q)\left[V(X w(Q))-Z\left(f_2 \varphi K_0+\right.\right. \\ & \left.\left.K_1+S+(G+D+L) w(Q)\right)\right]+ \\ & w(1-p) w(q)[V(W w(Q))- \\ & Z\left(f_1 \varphi K_0+K_1+D+\right. \\ & (G+S+L) w(Q))]+ \\ & w(1-p) w(1-q)[V(W+X)- \\ & Z\left(f_3 \varphi K_0+K_1+G+L\right), \end{aligned} $ (13)
$ T_{\mathrm{g}}=g T_{\mathrm{g} 1}+(1-g) T_{\mathrm{g} 0} . $ (14)

应急指挥部策略选择演化的复制动态方程为

$ \begin{aligned} F(g)= & \mathrm{d} g / \mathrm{d} t=g\left(T_{\mathrm{g} 1}-T_{\mathrm{g}}\right)= \\ & g(1-g)\left(T_{\mathrm{g} 1}-T_{\mathrm{g} 0}\right)= \\ & g(1-g)\left[w(p) w(q) Y_1+\right. \\ & w(p) w(1-q) Y_0+w(1-p) w(q) N_1+ \\ & \left.w(1-p) w(1-q) N_0\right] . \end{aligned} $ (15)

其中:Y1Y0分别代表公众选择“如实”时,一线人员在“高效”和“低效”情境下,应急指挥部选择“群智”与“群迷”的价值函数之间的差值。N1N0分别代表公众选择“不实”时,上述的价值函数之间的差值。

2.2 策略组合稳定性

多主体间的协同研判存在很大的不确定性,当各主体选择不履行职责时,可能意识不到失职对灾情的影响,然而当灾情扩散,牵扯到各主体的利益时,所承担的损失往往高于感知的损失。为保障灾情得到有效的控制,各主体都应该履行职责,进行有效的协同研判。

令所有演化复制动态方程等于0,即F(p)=0、F(q)=0、F(g)=0,得到(0, 0, 0)、(1, 0, 0)、(0, 1, 0)、(0, 0, 1)、(1, 1, 0)、(1, 0, 1)、(0, 1, 1)、(1, 1, 1) 这8个局部平衡点。通过各主体的演化复制动态方程的3个微分方程可以对3方演化策略进行描述,但是无法直接确定3方策略的均衡点。解决办法为:依据Friedman提出的判定方法[25],分别对式(7)、(11)和(15)求出pqg的偏导,得到Jacobi矩阵J,计算得到矩阵特征值,进一步分析演化系统的局部稳定性。

$ \begin{aligned} & \boldsymbol{J}= {\left[\begin{array}{lll} \frac{\partial F(p)}{\partial p} & \frac{\partial F(p)}{\partial q} & \frac{\partial F(p)}{\partial g} \\ \frac{\partial F(q)}{\partial p} & \frac{\partial F(q)}{\partial q} & \frac{\partial F(q)}{\partial g} \\ \frac{\partial F(g)}{\partial p} & \frac{\partial F(g)}{\partial q} & \frac{\partial F(g)}{\partial g} \end{array}\right]=} \\ & {\left[\begin{array}{lll} F_{11} & F_{12} & F_{13} \\ F_{21} & F_{22} & F_{23} \\ F_{31} & F_{32} & F_{33} \end{array}\right] . } \end{aligned} $ (16)

J中每个元素的PT-MA函数式如下:

$ \begin{aligned} F_{11}= & (1-2 p)\left[w(q) w(g) M_1+\right. \\ & w(q) w(1-g) M_0+w(1-q) w(g) H_1+ \\ & \left.w(1-q) w(1-g) H_0\right], \\ & F_{12}=\left(p-p^2\right)\left[\frac{\mathrm{d} w(q)}{\mathrm{d} q} w(g) M_1+\right. \\ & \frac{\mathrm{d} w(q)}{\mathrm{d} q} w(1-g) M_0-\frac{\mathrm{d} w(q)}{\mathrm{d} q} w(g) H_1- \\ & \left.\frac{\mathrm{d} w(q)}{\mathrm{d} q} w(1-g) H_0\right], \\ & F_{13}=\left(p-p^2\right)\left[\frac{\mathrm{d} w(g)}{\mathrm{d} g} w(q) M_1-\right. \\ & \frac{\mathrm{d} w(g)}{\mathrm{d} g} w(q) M_0+\frac{\mathrm{d} w(g)}{\mathrm{d} g} w(1-q) H_1- \\ & \left.\frac{\mathrm{d} w(g)}{\mathrm{d} g} w(1-q) H_0\right] \text {, } \\ & F_{21}=\left(q-q^2\right)\left[\frac{\mathrm{d} w(p)}{\mathrm{d} p} w(g) R_1+\right. \\ & \frac{\mathrm{d} w(p)}{\mathrm{d} p} w(1-g) R_0-\frac{\mathrm{d} w(p)}{\mathrm{d} p} w(g) U_1- \\ & \left.\frac{\mathrm{d} w(p)}{\mathrm{d} p} w(1-g) U_0\right], \\ & F_{2 z}=(1-2 q)\left[w(p) w(g) R_1+\right. \\ & w(p) w(1-g) R_0+w(1-p) w(g) U_1+ \\ & \left.w(1-p) w(1-g) U_0\right] \text {, } \\ & F_{23}=\left(q-q^2\right)\left[\frac{\mathrm{d} w(g)}{\mathrm{d} g} w(p) R_1-\right. \\ & \frac{\mathrm{d} w(g)}{\mathrm{d} g} w(p) R_0+\frac{\mathrm{d} w(g)}{\mathrm{d} g} w(1-p) U_1- \\ & \left.\frac{\mathrm{d} w(g)}{\mathrm{d} g} w(1-p) U_0\right] \text {, } \\ & F_{31}=\left(g-g^2\right)\left[\frac{\mathrm{d} w(p)}{\mathrm{d} p} w(q) Y_1+\right. \\ & \frac{\mathrm{d} w(p)}{\mathrm{d} p} w(1-q) Y_0-\frac{\mathrm{d} w(p)}{\mathrm{d} p} w(q) N_1- \\ & \left.\frac{\mathrm{d} w(p)}{\mathrm{d} p} w(1-p) N_0\right], \\ & F_{32}=\left(g-g^2\right)\left[\frac{\mathrm{d} w(q)}{\mathrm{d} q} w(p) Y_1-\right. \\ & \frac{\mathrm{d} w(q)}{\mathrm{d} q} w(p) Y_0+\frac{\mathrm{d} w(q)}{\mathrm{d} q} w(1-p) N_1+ \\ & \left.\frac{\mathrm{d} w(q)}{\mathrm{d} q} w(1-p) N_0\right], \\ & F_{33}=(1-2 g)\left[w(p) w(q) Y_1+\right. \\ & w(p) w(1-q) Y_0+w(1-p) w(q) N_1+ \\ & \left.w(1-p) w(1-q) N_0\right] . \end{aligned} $ (17)

策略的组合稳定性分析见表 3,其中“+”表示具有正实部,“-”表示具有非正实部,“×”表示无法判断,当且仅当特征值符号均为“-”时,当前策略为演化稳定策略,否则为演化不稳定策略。

表 3 策略组合稳定性分析
平衡点 特征值 特征值符号 稳定性
(0, 0, 0) H0, U0, N0 (+, ×, ×) 不稳定
(1, 0, 0) -H0, R0, Y0 (-, ×, ×) 鞍点
(0, 1, 0) M0, -U0, N1 (+, ×, ×) 不稳定
(0, 0, 1) H1, U1, -N0 (+, ×, ×) 不稳定
(1, 1, 0) -M0, -R0, Y1 (-, ×, ×) 鞍点
(1, 0, 1) -H1, R1, -Y0 (-, +, ×) 不稳定
(0, 1, 1) M1, -U1, -N1 (+, ×, ×) 不稳定
(1, 1, 1) -M1, -R1, -Y1 (-, -, ×) 鞍点

2.3 结果分析

由于博弈模型中参数设置的数量较多且关系复杂,依据Friedman提出的判定方法,分析三方博弈主体的策略选择逐渐演化达到策略平衡状态的条件。若满足式(18)则这3个特征值均为负值,此时的平衡点(1, 0, 0)为演化稳定点。

$ \left\{\begin{array}{l} V(D-D w(1-Q))-Z\left(\psi C_0+C_1+\right. \\ \quad(X+L) w(Q)-Z\left(C_0+L w(Q)\right)<0, \\ V(E w(1-Q))-Z\left(f_2 \varphi K_0+K_1+\right. \\ \quad G w(Q))-Z\left(f_2 K_0\right)<0 . \end{array}\right. $ (18)

该结果表明,当公众的收益感知平衡时,公众会稳定选择如实向一线人员上报信息;当一线人员劳动成本较高或受到处罚力度较小时,一线人员会稳定选择低效收集并处理信息;应急指挥部则需投入更多时间来进行研判,由于突发事件的急迫性,应急指挥部在策略选择上的投机性大幅提高,系统最终稳定于“如实,低效,群迷”;此时突发事件协同研判完全依赖于公众的自发行为,一线人员和应急指挥部协同效率和研判准确性较低。为避免稳定策略“如实,低效,群迷”的出现,应加强应急指挥部对一线人员的管理力度并设立信息上报制度规范,定期对一线人员进行考核培训,使其能够灵活高效应对各类突发事件的协同研判。

当且仅当满足式(19)时,平衡点(1, 1, 0)为复制动态系统的稳定点。

$ \left\{\begin{array}{l} Z\left(C_0+L w(Q)\right)-Z\left(\psi C_0+C_1+(X+L) w(Q)\right)- \\ \quad V(D-D w(1-Q))<0, \\ V(E)-Z\left(\varphi K_0+K_1+(G+L) w(Q)\right)- \\ \quad Z\left(K_0\right)<0 . \end{array}\right. $ (19)

该结果表明,当公众感知到参与协同研判工作得大于失时,公众选择正向策略的积极性进一步提高;对一线人员高效收集并处理信息的奖励补贴提高且对于低效作业被追查的处罚增加时,一线人员投入到突发事件现场进行勘测和与公众沟通了解情况的积极性较高,同时也能更有效地将信息报送给所属部门,系统将稳定于“如实,高效,群迷”;此时突发事件的征兆能很好地被各主体理解与阐释,应急指挥部可根据准确的数据信息对突发事件进行更快速的响应。因此,完善对一线人员的奖惩机制对协同研判中的意义给赋过程有重要帮助。

当且仅当满足式(20)时,平衡点(1, 1, 1)为复刻动态系统的稳定点。

$ \begin{gathered} Z\left(K_0\right)-Z\left(\varphi K_0+K_1+(G+L) w(Q)\right)- \\ V(E)<0 . \end{gathered} $ (20)

该结果表明,当应急指挥部充分应对突发事件的感知收益提高且被追查组内群体迷思的处罚加大时,系统将稳定于“如实,高效,群智”,即发生突发事件时,公众如实提供有关突发事件的详细信息,一线人员高效地把收集到有关突发事件的信息报送给当地应急指挥部门,应急指挥部群策群力,各主体积极且高效地进行协同研判以应对突发事件。

3 仿真分析

运用计算机仿真软件MATLAB(2020年版)对三方主体的演化轨迹进行数据仿真,进一步分析关键要素对博弈演化过程和结果的影响。结合前人基础、本文研究和突发事件的实际情况,依据Tversky等[26]和Gurevich等[27]得出的随机实验数据,风险偏好参数βθ均赋值为0.88,δλ均赋值为2;由PT可知,决策主体在面对失去时的偏好表现为风险追求,风险偏好νσ赋值为0.98;从主体有限理性视角出发,高效研判行为的失去价值感知要大于低效研判行为的,收获价值感知则相反,将I0C0K0均赋值为5,I1ψC0C1φK0K1均赋值为4,SDE初始值均赋值为3;根据Heinrich理论1∶300原则[28],将Q赋值为0.03;pqgU0WXG的初始值会作为探究影响规律的变量进行设置,其余初始值均在保证行为选择相对稳定的前提下进行随机设置。基于PT-MA的三方博弈收益函数中的各参数设置如表 4所示。

表 4 初始参数设置
参数 初始值 参数 初始值 参数 初始值
p 0.20、0.50、0.70、0.90 W 4、20、40、60 C1 4.00
q 0.20、0.50、0.70、0.90 X 4、20、40、60 K0 5.00
g 0.20、0.50、0.70、0.90 G 4、20、40、60 φK0 4.00
U0 1.00、25.00、50.00 S 3 K1 4.00
U1 1.00 D 3 δ 2.00
f1 1.40 E 3 θ 0.88
f2 1.50 I0 5 ν 0.98
f3 1.60 I1 4 σ 0.98
L 100.00 C0 5 λ 2.00
Q 0.03 ψC0 4 β 0.88

3.1 决策初始概率的影响

将公众选择如实提供有关突发事件信息的初始概率p0分别设定为0.2、0.5、0.7和0.9,其余参数不变,观察公众策略演化过程。类似地,分别对一线人员高效处理并上报突发事件的初始概率q0和应急指挥部群体智慧进行研判的初始概率g0进行设定,三方主体的策略演化过程如图 2所示。可以看出,随着初始概率的提升,演化系统收敛于1的速度提升,即公众趋向选择如实提供信息、一线人员趋向选择高效上报、应急指挥部趋向选择群体智慧。说明在实践中,应积极采取个人表彰、公益宣讲等措施,切实提高主体对协同研判工作的认知度和参与度,面临危机时能更多地考虑公共利益,做出正向策略的选择。

图 2 决策初始概率对各方策略演化的影响

3.2 参照点的影响

将三方主体策略选择的U0的初始值分别设定为1、25、50,其余参数不变,观察到三方主体的策略演化过程如图 3所示。可以看出,随着收获感知参照点的初始值增加,公众、一线人员和应急指挥部的策略选择趋向于1的速度显著提升。说明提高收获感知能够促使协同研判主体的研判行为向积极方向演化,即在突发事件协同研判中,调节各决策者对待收益的态度有助于突发事件的有效解决。

图 3 初始参照点对各方策略演化的影响

3.3 惩罚力度的影响

将公众被查出谎报实情所面临的处罚的初始值W0分别设定为4、20、40、60,其余参数不变,观察公众策略演化过程。类似地,分别设定一线人员和应急指挥部所面临的处罚的初始值(X0G0),得到三方主体的策略演化过程(见图 4)。可以看出,随着对公众谎报信息、一线人员低效上报以及应急指挥部群体迷思的惩罚力度的增加,公众、一线人员和应急指挥部的策略选择逐渐趋近1,即公众趋向选择如实提供信息、一线人员趋向选择高效上报、应急指挥部趋向选择群体智慧;且收敛速度随着惩罚力度的加大而提高。这说明惩罚的力度对三方主体均有明显影响,主体对于消极策略选择所带来经济、声誉、资质等方面损失较为关切。因此,在实践中通过增加对研判主体选择消极策略的惩罚力度促使研判策略向积极方向演化。

图 4 初始惩罚力度对各方策略演化的影响

4 结论

本文基于前景理论和心理账户理论,对突发事件协同研判中立足不同收益路径的三方主体策略选择进行了演化博弈分析。结果表明:1) 初始决策概率是影响主体协同研判策略向积极方向演化的因素之一,应加大对正向研判行为的奖励措施,强化主体的收获价值感知,促使各方自发地选择积极策略;2) 主体的心理参照点会显著影响最终的行为选择,通过嘉奖优秀个体、组织公益宣讲等手段,引导各主体对风险后果形成深刻认识,并充分了解协同研判的必要性,降低收获感知参照点,有助于促进主体选择积极决策;3) 惩罚力度的合理设置能有效地保障各主体策略演化趋于正向。在确保各主体不敢逾越底线的同时,也要避免过度惩罚导致决策过程中的利益冲突。实践中可以增加监督举报措施,以削弱决策主体对严查严惩概率的低估。

本文研究是在理想状态下开展的,仅验证了惩罚力度的调整会左右主体的策略选择。作为一种相较简单的调控方法,过度的惩罚是否会导致主体策略向“倒U”形演化?什么样的设置区间能最大程度地保障研判行为的科学性?对这2个问题的客观分析将是下一步研究的重点。

参考文献
[1]
闪淳昌, 薛澜. 应急管理概论: 理论与实践[M]. 北京: 高等教育出版社, 2012.
SHAN C C, XUE L. Introduction to emergency management: theory and practice[M]. Beijing: Higher Education Press, 2012. (in Chinese)
[2]
LU X L, XUE L. Managing the unexpected: sense-making in the Chinese emergency management system[J]. Public Administration, 2016, 94(2): 414-429. DOI:10.1111/padm.12261
[3]
莎日娜. 公共卫生重大风险研判机制的完善之策[J]. 领导科学, 2020(12): 120-122.
SHA R N. Measures to improve the mechanism of critical public health risk assessment[J]. Leadership Science, 2020(12): 120-122. (in Chinese)
[4]
刘美萍. 重大突发事件网络舆情协同治理机制构建研究[J]. 求实, 2022(05): 64-76, 111.
LIU M P. Research on mechanism construction of collaborative governance of online public opinion on major emergencies[J]. Truth Seeking, 2022(05): 64-76, 111. (in Chinese)
[5]
刘冰, 肖高飞, 晁世育. 重大突发公共卫生事件风险研判与决策模型构建研究[J]. 信息资源管理学报, 2021, 11(05): 17-26, 37.
LIU B, XIAO G F, CHAO S Y. Research on the construction of risk assessment and decision-making model of major public health emergency[J]. Journal of Information Resources Management, 2021, 11(05): 17-26, 37. (in Chinese)
[6]
王剑, 司徒陈麒, 袁胜强. 基于多主体和前景理论的应急风险决策仿真研究[J]. 系统仿真学报, 2020, 32(03): 353-361.
WANG J, SITU C Q, YUAN S Q. Research on emergency risk decision simulation based on multi-agent and prospect theory[J]. Journal of System Simulation, 2020, 32(03): 353-361. (in Chinese)
[7]
新华社. 国务院调查报告揭示青岛输油管道泄漏事故教训[EB/OL]. (2014-01-11)[2023-01-05]. https://www.gov.cn/govweb/jrzg/2014-01/11/content_2564654.htm
Xinhua News Agency. State Council investigation report reveals lessons from Qingdao oil pipeline leakage accident[EB/OL]. (2014-01-11)[2023-01-05]. https://www.gov.cn/govweb/jrzg/2014-01/11/content_2564654.htm. (in Chinese)
[8]
南京邮电大学通达学院纪委办公室. 以案为鉴: 近期疫情防控工作不力被问责的典型案例[EB/OL]. (2022-04-20) [2023-02-27]. https://jw.nytdc.edu.cn/2022/0420/c314a26376/pagem.htm.
Office of Discipline Commission of Tongda College of Nanjing University of Posts and Telecommunications. Taking the case as a reminder: A typical case of accountability for ineffective epidemic prevention and control[EB/OL]. (2022-04-20) [2023-02-27]. https://jw.nytdc.edu.cn/2022/0420/c314a26376/pagem.htm. (in Chinese)
[9]
COMBE I A, CARRINGTON D J. Leaders' sensemaking under crises: Emerging cognitive consensus over time within management teams[J]. The Leadership Quarterly, 2015, 26(3): 307-322. DOI:10.1016/j.leaqua.2015.02.002
[10]
COMFORT L K, HAASE T W. Communication, coherence, and collective action: The impact of hurricane Katrina on communications infrastructure[J]. Public Works management & policy, 2006, 10(4): 328-343.
[11]
吕孝礼, 付帅泽, 朱宪, 等. 突发事件协同研判行为研究: 研究进展与关键科学问题[J]. 中国科学基金, 2020, 34(6): 693-702.
LÜ X L, FU S Z, ZHU X, et al. Joint crisis sensemaking: A review and research agenda[J]. Bulletin of National Natural Science Foundation of China, 2020, 34(6): 693-702. (in Chinese)
[12]
刘冰, 肖高飞, 霍亮. 重大突发疫情风险研判与决策柔性协同机制研究: 基于信息聚合与知识发现[J]. 图书与情报, 2021(05): 1-8.
LIU B, XIAO G F, HUO L. Research on flexible collaboration mechanism of risk assessment and decisionmaking for major epidemics: Based on information aggregation and knowledge discovery[J]. Library & Information, 2021(05): 1-8. (in Chinese)
[13]
European Centre for Disease Prevention and Control. Operational tool on rapid risk assessment methodology-ECDC 2019[EB/OL]. (2019-03-14) [2023-08-28]. https://ecdc.europa.eu/en/publications-data/operational-tool-rapid-risk-assessment-methodology-ecdc-2019.
[14]
白羽轩. 双信度下考虑专家风险态度和研判调整行为的群体性突发事件等级确定方法[D]. 大连: 大连理工大学, 2022.
BAI Y X. A method for determining the level of mass emergencies considering experts' risk attitude and adjustment behavior under double reliability[D]. Dalian: Dalian University of Technology, 2020. (in Chinese)
[15]
赫伯特·A. 西蒙. 管理决策新科学[M]. 李柱流, 汤俊澄, 译. 北京: 中国社会科学出版社, 1982.
SIMON H A. The new science of management decision[M]. LI Z L, TANG J C, Trans. Beijing: China Social Sciences Press, 1982. (in Chinese)
[16]
KAHNEMAN D, TVERSKY A. Prospect theory: An analysis of decision under risk[M]//MACLEAN L C, ZIEMBA W T. Handbook of the Fundamentals of Financial Decision Making. Hackensack: World Scientific Publishing, 2013: 99-127.
[17]
胡欢, 郭晓剑, 梁雁茹. 基于前景理论的重大疫情网络谣言管控三方演化博弈分析[J]. 情报科学, 2021, 39(07): 45-53.
HU H, GUO X J, LIANG Y R. Game analysis of the three-way evolution of network rumor control under the major epidemic based on prospect theory[J]. Information Science, 2021, 39(07): 45-53. (in Chinese)
[18]
THALER R. Mental accounting and consumer choice[J]. Marketing Science, 1985, 4(3): 199-214. DOI:10.1287/mksc.4.3.199
[19]
ZHAO H, LIU X, WANG Y T. Tripartite evolutionary game analysis for rumor spreading on Weibo based on MA-PT[J]. IEEE Access, 2021, 9: 90043-90060. DOI:10.1109/ACCESS.2021.3091325
[20]
张子鸣, 王新平, 苏畅. 差序氛围视角下知识型矿工安全行为研究--基于PT-MA理论的演化博弈分析[J]. 安全与环境工程, 2022, 29(06): 1-9.
ZHANG Z M, WANG X P, SU C. Research on the safety behavior of knowledge miners from the perspective of chaxu climate- An evolutionary game analysis based on PT-MA theory[J]. Safety and Environmental Engineering, 2022, 29(06): 1-9. (in Chinese)
[21]
庄丽, 马婷婷, 刘硕, 等. 基于PT-MA理论的装配式建筑施工安全管理行为演化博弈分析[J]. 工业工程, 2021, 24(02): 68-76, 118.
ZHUANG L, MA T T, LIU S, et al. An evolutionary game analysis of behaviors management of prefabricated building safety groups based on PT-MA theory[J]. Industrial Engineering Journal, 2021, 24(02): 68-76, 118. (in Chinese)
[22]
ZHANG Z M, WANG X P, SU C, et al. Evolutionary game analysis of shared manufacturing quality synergy under dynamic reward and punishment mechanism[J]. Applied Sciences, 2022, 12(13): 6792. DOI:10.3390/app12136792
[23]
WU B, CHENG J, QI Y Q. Tripartite evolutionary game analysis for "Deceive acquaintances" behavior of e-commerce platforms in cooperative supervision[J]. Physica A: Statistical Mechanics and Its Applications, 2020, 550: 123892. DOI:10.1016/j.physa.2019.123892
[24]
马婷婷. 基于前景理论的建筑施工安全群体行为演化博弈分析[D]. 青岛: 青岛理工大学, 2020.
MA T T. Evolutionary game analysis of construction safety group behavior based on prospect theory[D]. Qingdao: Qingdao University of Technology, 2020. (in Chinese)
[25]
FRIEDMAN D. On economic applications of evolutionary game theory[J]. Journal of Evolutionary Economics, 1998, 8(1): 15-43. DOI:10.1007/s001910050054
[26]
TVERSKY A, KAHNEMAN D. Advances in prospect theory: Cumulative representation of uncertainty[J]. Journal of Risk and Uncertainty, 1992, 5(4): 297-323. DOI:10.1007/BF00122574
[27]
GUREVICH G, KLIGER D, LEVY O. Decision-making under uncertainty-A field study of cumulative prospect theory[J]. Journal of Banking & Finance, 2009, 33(7): 1221-1229.
[28]
HEINRICH H W, PETERSON D, ROOS N. Industrial accident prevention[M]. New York: Mcgraw-Hill Book Company, 1980.