基于多元自适应回归样条的汇合决策行为模型
李根1, 翟伟1, 黄海博1, 任皎龙2, 王登忠3, 邬岚1    
1. 南京林业大学 汽车与交通工程学院, 南京 210037;
2. 山东理工大学 建筑工程学院, 淄博 255000;
3. 浙江省交通运输科学研究院, 杭州 310023
摘要:为研究高速公路车辆汇合决策行为, 采用一种非参数回归模型——多元自适应回归样条(multiple adaptive regression splines, MARS)模型建立了汇合决策行为模型。同时, 采用美国下一代仿真(next generation simulation, NGSIM)项目中搜集的车辆轨迹数据US-101数据集, 提取了速度差、纵向间距、横向位置和车线碰撞时间等参数作为影响变量, 进行训练和预测, 并与分类回归树、梯度提升决策树、随机森林、逻辑回归等模型进行对比。研究结果表明:汇合车辆与主线车道前车之间的速度差对汇合决策行为影响最大; MARS模型和梯度提升决策树模型对汇合决策行为的预测错误率分别低至0.141和0.138, 准确性略高于分类回归树、随机森林和逻辑回归模型, 但MARS模型的复杂度远低于梯度提升决策树模型, 且能够生成显性表达式, 反映影响变量之间的交互作用, 利于工程应用。MARS模型能够准确预测汇合决策行为, 可用于车辆辅助驾驶及自动驾驶系统。
关键词公路运输    汇合决策行为    多元自适应回归样条    交织区    自动驾驶    
Merging decision behavior model based on multivariate adaptive regression splines
LI Gen1, ZHAI Wei1, HUANG Haibo1, REN Jiaolong2, Wang Dengzhong3, WU Lan1    
1. College of Auto and Traffic Engineering, Nanjing Forestry University, Nanjing 210037, China;
2. School of Civil and Architectural Engineering, Shandong University of Technology, Zibo 255000, China;
3. Zhejiang Scientific Research Institute of Transport, Hangzhou 310023, China
Abstract: [Objective] Weaving areas are bottlenecks of freeways, and lane-changing behavior is one of the main reasons for the capacity decline and traffic congestion in weaving areas. Frequent merging behaviors may lead to traffic flow disturbance upstream from the weaving area, affect the normal running of surrounding vehicles, and in severe cases may even lead to multi-vehicle accidents. An in-depth understanding of merging decision behavior in the weaving area is essential to reduce the vehicle collision risk and improve the traffic safety level. A newly developed nonparametric regression model—multiple adaptive regression splines (MARS)—is adopted to model the gap selection decision during merging to study the merging behavior in the freeway weaving area. [Methods] This study investigates complex interactions between merging and surrounding vehicles during merging. Trajectory data are extracted from the US-101 dataset provided by the dataset of next generation simulation program, and the symmetric exponential moving average filter method is used to smooth the data. Merging vehicles are influenced by surrounding vehicles in the auxiliary and adjacent main lanes. Thus, explanatory variables such as speeds, speed differences, gaps, and locations are calculated. Longitudinal and lateral collision risk indicators and time-to-collision are also considered to study the influence of collision risk on merging behaviors. Finally, 925 observations are obtained and randomly divided into two subdatasets to train and test the model. The MARS model is compared with four state-of-the-art machine learning techniques: classification and regression tree, gradient boosting decision tree (GBDT), random forest, and logistic regression models. [Results] The speed difference between the merging vehicle and vehicles in the adjacent main lane played the most important role in gap selection. Interactions of influencing variables were observed. In particular, the best interaction level was 4 in the final model. The comparison showed that GBDT and MARS had the lowest rates of prediction error at 0.138 and 0.141, respectively. However, MARS could provide explicit expression functions that reflect the interaction between the influencing variables, which was beneficial to engineering applications. [Conclusions] By using the optimal variable transformation and potential variable interaction in the regression modeling scheme, MARS could easily handle complex nonlinear relationships in merging behaviors. This model could accurately predict the gap selection behavior and provide explicit expression functions, thus simplifying its understanding and application to driver assistance systems and autonomous driving systems.
Key words: highway transportation    merging decision behavior    multiple adaptive regression splines    weaving area    autonomous driving    

高速公路匝道车辆的汇合换道行为对主线交通流的运行和交通安全影响较大,不仅会造成交通流紊乱,引发交通拥堵[1],还会导致交织区车辆追尾等交通事故[2]。因此,深入研究车辆的汇合决策行为,对提高交织区内的交通安全水平、完善先进驾驶辅助系统和下一代智能网联车系统具有重要意义。

近几十年来,汇合决策模型已引起研究人员的广泛关注。Gipps[3]基于车辆的期望速度、行驶路径提出了可能性、必要性和满意性等指标,并构建了最早的汇合决策模型。此后,基于规则的汇合决策模型因简单易用性被广泛用于MITSIM [4]等微观交通仿真模型,其核心思想为间距接受理论。此外,离散选择模型也被广泛用于换道行为研究,Singh等[5]使用离散选择模型对车辆汇合的变化概率进行建模,并将建立的模型嵌入状态空间模型。Sun等[6]利用5种离散选择模型分析汇合决策行为,建立了2个多项logit(multi-nominal logit,MNL)模型和2个巢式logit(nested logit,NL)模型,用于识别引发斜坡瓶颈路段交通拥堵的主要因素。以上都是基于参数化模型的研究,具有可解读性高和应用性强的特点,但其预测精度具有一定的局限性。

为研究汇合决策行为,国内外研究人员使用了机器学习等方法建立了非参数模型。Hou等[7]利用Bayes网络和梯度提升决策树研究了汇合决策行为,并将预测精度提高至94%。Zheng等[8]使用神经网络对驾驶员的汇合决策行为进行建模和预测。Motamedidehkordi等[9]引入随机森林对汇合决策行为进行建模。Díaz-Álvarez等[10]利用神经网络,从城市场景中预测特定驾驶员的汇合意图,以及周围环境对汇合接受程度的影响。Xie等[11]使用深度信念网络和长短期记忆神经网络建立基于深度学习的数据驱动换道决策模型。王俊彦等[12]利用径向基函数(radial basis function,RBF)神经网络对车辆汇合时机决策的影响因素进行建模,以预测车辆汇合的安全性。徐兵等[13]提出了一种基于梯度提升决策树进行特征变换的融合决策模型,用于仿真高速公路自由汇合场景。曹波等[14]基于环境车辆偏离车道程度识别运动模式的方法,建立了动态环境车辆横纵向轨迹综合决策模型。崔洁茗等[15]使用基于门控循环单元的改进方法分析和预测强制换道决策行为。赵树恩等[16]运用反向传播(back propagation,BP)神经网络对复杂汇合场景下汇合终止时刻及目标位置进行预测,确定了汇合决策过程中车辆换道的轨迹簇。非参数模型虽然可以显著提高汇合决策模型的预测精度,但复杂度较高且具有黑箱特性,不能给出显性表达式,因此难以用于工程领域。

李根等[17]基于多元自适应回归样条(multiple adaptive regression splines,MARS)模型深入分析了汇合过程中车辆之间及车辆与环境之间的交互作用,发现该模型同时具有参数化模型和非参数模型的优点,能够深入挖掘变量之间的隐藏交互作用和非线性关系,并能给出显性表达式。

本文采用MARS模型进一步研究汇合决策行为,采用美国下一代仿真(NGSIM)项目中的车辆轨迹数据进行训练和预测,并与以往研究进行对比与分析,深入探索汇合决策行为变量间的交互影响,为辅助驾驶和无人驾驶技术的理论和应用两方面提供支撑。

1 MARS模型的建立

MARS模型的基本原理是通过样条函数在局部进行回归建模,以预估目标变量预测值随影响变量取值变化而变化的趋势。该模型能够获得目标变量与影响变量之间的最佳转换和潜在交互,通过增加结点将数据集划分为具有阶梯状的不同分段线段,从而标记数据集的上一个区域的结束和下一个区域的开始[18],如图 1所示。

图 1 MARS模型基本原理

1.1 正向传递

MARS模型的正向传递是一个不断迭代的过程,通过不断形成基函数并添加到模型中,进而寻找变量与结点的最佳组合。基函数是一种可变区间的形式,如图 2所示。

图 2 MARS模型基函数形式

当迭代次数I=0时,第i个基函数Hi(xt)可表示为

$ H_i\left(x_t\right)=\left\{\begin{array}{l} \max \left(0, E-x_t\right), \\ H_i\left(x_t\right) \text { 为左侧样条函数; } \\ \max \left(0, x_t-E\right), \\ H_i\left(x_t\right) \text { 为右侧样条函数. } \end{array}\right. $ (1)

其中:xt为第t个样本的影响变量的真实值, E为影响变量的阈值。

将自适应分段线性回归的线性组合和交互作用的基函数作为基本单元,MARS模型可表示为

$ f\left(x_t\right)=\alpha_0+\sum\limits_{i=1}^N \alpha_i H_i\left(x_t\right) . $ (2)

其中:f(xt)为第t个样本的目标变量的预测值,α0为截距,αiHi(xt)的系数,N为基函数的个数。

1.2 反向传递

MARS模型的反向传递是指删除对模型贡献最小的基函数,以获得最优模型。MARS模型采用广义交叉验证准则(generalized cross validation principle, GCVP)对贡献度进行评估,其评判标准表示为

$ \mathrm{GCV}=\frac{1}{n} \frac{\sum\limits_{t=1}^T\left[y_t-f\left(x_t\right)\right]}{\left[1-\frac{(N+1)+b N}{n}\right]}. $ (3)

其中:n为影响变量的个数;b为惩罚系数;T为样本个数;yt为第t个样本的目标变量的真实值。

由于GCV越小,模型的拟合效果越好,因此可确定最佳模型为

$ \begin{gathered} f(x)=y_t^{\max }-n \min (\mathrm{GCV}) \cdot \\ {\left[1-\frac{(N+1)+b N}{n}\right]-\sum\limits_{t=1}^{T-1}\left[y_t-f\left(x_t\right)\right] .} \end{gathered} $ (4)

其中:ytmaxyt的最大值;min(GCV)为最小广义交叉验证值。

2 研究区域与数据 2.1 数据描述与处理

本文采用美国联邦公路管理局(Federal Highway Administration,FHWA)在下一代仿真(next generation simulation,NGSIM)项目中搜集的车辆轨迹数据进行模型训练和验证[17]。NGSIM项目中数据集共包含4种不同道路场景的车辆轨迹数据,其中US-101数据集具有较好的准确性和一致性[19],因此本文采用US-101数据集进行研究。如图 3所示,US-101数据集研究区域共包含5条主线车道和1条辅助车道及2条匝道,全长共640.00 m,主线车道使用1—5进行编号,最内侧主线车道编号为1,最外侧主线车道编号为5,辅助车道编号为6,进口和出口匝道编号分别为7和8。本文研究的范围是2个匝道之间的交织区,即图 3中黄色区域。

图 3 US-101数据集研究区域

US-101数据集采集于2005年6月15日7∶50—8∶35,天气晴朗。US-101数据集被划分为3个数据子集,子集1代表自由流状态的交通状况,子集2和3代表拥堵状态的交通状况。交通量和平均速度统计如表 1所示。为减少数据噪声和误差对研究的影响,本文采用对称指数移动平均滤波[19]方法对数据进行处理。

表 1 US-101数据集的交通量和平均速度统计
子集 时间 主线车道 辅助车道
交通量/辆 平均速度/(km·h-1) 交通量/辆 平均速度/(km·h-1)
1 7∶50—8∶05 8 148 44.00 464 63.99
2 8∶05—8∶20 7 552 38.80 464 59.26
3 8∶20—8∶35 7 108 33.61 496 55.44

2.2 数据提取与分析

汇合车辆通常需要几秒的时间评估周围的交通状态,从而决定是否接受以相邻间距汇入主线车道。因此,本文采用0-1的决策方式划分汇合车辆的汇合决策行为。当时刻c汇合车辆M在辅助车道选择相邻间距汇入主线车道时,则Pc,M=1,表示汇合车辆M在时刻c完成汇入;当时刻c汇合车辆M拒绝相邻间距,选择其他间距汇入主线车道时,则Pc,M=0,表示汇合车辆M在时刻c继续调整,如图 4所示。其中,车辆PF表示主线车道后车,车辆PL表示主线车道前车,车辆PLL表示PL的前车。

图 4 汇合决策行为

在汇合过程中,主线车道与辅助车道的交织区会影响交通流。因此,影响汇合车辆的主要因素包括汇合车辆与主线车道和辅助车道车辆的相对速度差、纵向间距和汇合车辆的横向位置。由于选取的US-101数据集中辅助车道后车的数量相对较少,且辅助车道对汇合车辆的影响极小[20],因此本文不考虑辅助车道后车对汇合车辆的影响。近几年,汇合车辆与周围交通流的碰撞风险成为研究的重点之一[21],本文引入车线碰撞时间(time-to-collision, TTC)以开展研究,变量选取如图 5所示。其中,Y表示交通流的纵向间距,XM表示汇合车辆的横向位置,VM表示汇合车辆的瞬时速度,VPL表示主线车道前车的瞬时速度,VPF表示主线车道后车的瞬时速度,VL表示辅助车道前车的瞬时速度,TTCPL表示汇合车辆与主线车道前车的车线碰撞时间,TTCPF表示汇合车辆与主线车道后车的车线碰撞时间,TTCL表示汇合车辆与辅助车道前车的车线碰撞时间。

图 5 变量选取

车线碰撞时间计算如下:

$ \mathrm{TTC}=\frac{\Delta Y-l}{\Delta V} . $ (6)

其中:ΔY为前后车的距离差;ΔV为前后车的速度差,l为前车车长。

TTC作为安全影响因素,其取值可能为负或无限大。TTC取值为负时,汇合车辆速度小于领先车辆,这意味着汇合车辆将不会与主线车道交通流发生碰撞;TTC取值为无限大时,汇合车辆速度等于领先车辆。因此,为了研究方便,本文将对TTC取值进行限制,TTC∈(0, 100 s],即当TTC取值为负或无限大时,取值100 s。这是因为当TTC取值为负或无限大时,理论意义上汇合车辆将不会与主线车道交通流发生碰撞,而在现有的行驶经验中,100 s是车辆之间极大的安全时距,车辆与车辆之间不会发生碰撞。表 2给出了所有影响变量的提取方式和含义,本文一共获取了925组观测数据,其中552组观测数据为车辆选择完全汇入(Pc,M=1),373组观测数据为车辆选择继续调整(Pc,M=0)。

表 2 影响变量提取方式和含义
符号 提取方式 影响变量的含义 单位
VM 汇合车辆的瞬时速度 m·s-1
ΔVPL VPL-VM 汇合车辆与主线车道前车的速度差 m·s-1
ΔVPF VM-VPF 汇合车辆与主线车道后车的速度差 m·s-1
ΔVL VL-VM 汇合车辆与辅助车道前车的速度差 m·s-1
ΔYPL YPL-YM-lPL 汇合车辆与主线车道前车的纵向间距 m
ΔYPF YM-YPF-lM 汇合车辆与主线车道后车的纵向间距 m
ΔYL YL-YM-lL 汇合车辆与辅助车道前车的纵向间距 m
XM 汇合车辆的横向位置 m
TTCPL 汇合车辆与主线车道前车的车线碰撞时间 s
TTCPF 汇合车辆与主线车道后车的车线碰撞时间 s
TTCL 汇合车辆与辅助车道前车的车线碰撞时间 s

表 3为汇合决策行为影响变量统计特征。可以看出:汇合车辆在采取汇合决策行为时其速度会降低,且降低趋势会持续较长时间,速度差变化反映了该降低趋势;ΔYPL平均值远大于ΔYPF平均值,且TTCPL平均值远小于TTCPF平均值和TTCL平均值,这意味着汇合车辆极易与前车发生交通冲突,尤其是主线车道前车。

表 3 影响变量统计特征
影响变量 Pc,M=0 Pc,M=1
平均值 标准偏差 最大值 最小值 平均值 标准偏差 最大值 最小值
VM/(m·s-1) 12.477 3.610 23.389 1.539 12.086 3.269 23.265 2.481
ΔVPL/(m·s-1) 1.480 2.233 13.089 -5.481 1.092 1.928 10.895 -5.247
ΔVPF/(m·s-1) -2.157 2.247 4.344 -12.554 -1.175 1.845 4.113 -11.484
ΔVL/(m·s-1) -2.103 3.135 5.656 -13.708 -3.173 3.396 -15.255 7.837
ΔYPL/m 13.699 16.781 172.256 0.491 13.821 15.507 152.789 0.631
ΔYPF/m 9.616 13.660 129.836 0.202 16.081 14.100 134.491 0.410
ΔYL/m 54.270 38.870 186.940 1.030 56.080 39.540 189.460 2.260
XM/m 82.960 68.450 350.860 0.050 94.500 74.490 361.150 0.970
TTCPL/s 38.630 42.670 100.000 0.020 42.980 42.960 100.000 0.380
TTCPF/s 80.540 35.920 100.000 0.010 71.210 41.170 100.000 0.820
TTCL/s 85.940 29.090 100.000 0.360 83.070 30.990 100.000 0.420

3 汇合决策模型建立与验证 3.1 模型参数标定

本文利用数据挖掘软件SPM(salford predictive modeler)及US-101数据集中的车辆轨迹数据,建立了MARS模型。该模型有5个关键参数,包括N、交互程度k、结点数Jb及附加变量惩罚d。其中,N一般设置为影响变量个数的2倍。当k=1.000时,代表影响变量之间无交互作用;相反,当k≥2.000时,影响变量间产生交互,但随着k增大,模型的复杂程度和可解读性降低。本文使用均方误差(mean-square error,MSE)、方差(sum of square error,SSE)和R2等评价指标进行评价,如表 4所示。b设置为3.000,可以降低模型预测变量之间的共线性。为在现有变量中增加结点而非增加新的因变量,MARS模型在训练过程中对增加新的因变量设置了附加变量惩罚,d=0.001,该附加变量惩罚的设置会影响MARS模型的正向传递速度。需要特别指出的是,与之前针对车辆交互作用的研究[17]不同,本文研究的是分类问题而非回归问题。因此,模型结果是一个0-1决策的逻辑值,J设为0即可,无需自适应选择J以降低函数的局部适应性。

表 4 最佳交互程度选择
k MSE SSE R2 GCV
2.000 0.108 79.349 0.558 0.113
3.000 0.092 68.033 0.621 0.109
4.000 0.095 69.875 0.611 0.106
5.000 0.095 69.875 0.611 0.106

为测试MARS模型的有效性,随机选取740组观测数据用于训练,剩余的185组观测数据用于测试。由表 4可知,当采用三重(k=3.000)交互时,MARS模型的精度最高,但拟合效果并非最佳。当采用四重(k= 4.000)和五重(k=5.000)交互时,MARS模型的GCV最小,并趋于稳定,拟合效果较佳。

因此,本文选择对影响变量进行四重交互作用,从而确定了MARS模型的最优参数组合为(NkJbd)=(22.000,4.000,0.000,3.000,0.001)。

3.2 模型结果分析

通过添加基函数,MARS模型的规模急剧增加,同时,MARS模型的复杂程度迅速提高。然而,在该过程中,MARS模型会按照删除贡献度最小的顺序删除基函数,直至获得最佳模型。表 6给出了删除贡献度相对较小的基函数后其他基函数的表达式及显著性水平(P值),从而确定了最佳模型的表达式。可以发现:2个较复杂的基函数可以交叉相乘,从而构成新的基函数;重新构建的基函数与汇合车辆的决策选择存在显著的相关性,说明在汇合决策过程中,变量之间存在潜在的交互作用。

表 6 MARS基函数
Hi 基函数 参数估计 P
H1 (0,ΔVPL-10.253 5) 0.083 2 0.000
H2 (0,10.253 5-ΔVPL) -0.055 7 0.000
H4 (0,26.807 5-ΔYPL) 0.045 3 0.000
H5 (0,XM-19.420 1)H2 0.025
H6 (0,19.420 1-XM)H2 0.000
H7 (0,ΔVPL-7.766 3)H4 -0.004 5 0.000
H8 (0,7.766 3-ΔVPL)H4 -0.001 8 0.000
H9 (0,XM-19.315 5)H4 -0.007 8 0.000
H10 (0,19.315 5-XM)H4 -0.023 4 0.000
H11 (0,ΔYPF-46.956 9)H8 0.003
H12 (0,46.956 9-ΔYPF)H8 -4.551 9×10-5 0.000
H13 (0,TTCPL-1.212 8)H7 0.027 9 0.000
H15 (0,TTCL+6.481 2)H11 -8.727 9×10-6 0.003
H17 (0,ΔYPF+1.747 7)H5 0.001 9 0.150
H18 (0,ΔVPF+5.419 3)H6 0.003 7 0.000
H21 (0,112.133 1-ΔYL)H5 0.000 9 0.019
H22 (0,ΔYPF+1.747 7)H21 2.790 4×10-5 0.072

为进一步解释汇合决策行为之间的交互作用,本文选取ΔYPL、ΔVPLXM的交互作用项进行分析:

$ \begin{gathered} -0.0045 H_7=-0.0045 \times \max \left(0, \Delta V_{\mathrm{PL}}-\right.\\ 7. 7663) \times \max \left(0, 26.8075-\Delta Y_{\mathrm{PL}}\right), \end{gathered} $ (7)
$ \begin{gathered} -0.0018 H_8=-0.0018 \times \max (0, 7.7663- \\ \left.\Delta V_{\mathrm{PL}}\right) \times \max \left(0, 26.8075-\Delta Y_{\mathrm{PL}}\right) \end{gathered} $ (8)

由式(7)和(8)可知:ΔYPL和ΔVPL交互作用的最终估计值分别为-0.004 5和-0.001 8,表明只有当ΔVPL>7.766 3 m/s或ΔYPL>26.807 5 m时,汇合车辆才可能采取汇合决策,以保证汇合决策行为的相对安全。

$ \begin{gathered} -0.0078 H_9=-0.0018 \times \max \left(0, X_{\mathrm{M}}-\right. \\ 19.3155) \times \max \left(0, 26.8075-\Delta Y_{\mathrm{PL}}\right), \end{gathered} $ (9)
$ \begin{gathered} -0.0234 H_{10}=-0.0234 \times \max (0, 19.3155- \\ \left.X_{\mathrm{M}}\right) \times \max \left(0, 26.8075-\Delta Y_{\mathrm{PL}}\right) . \end{gathered} $ (10)

由式(9)和(10)可知:ΔYPLXM交互作用的最终估计值分别为-0.007 8和-0.023 4,表明如果汇合车辆想改变车道进入主线车道,则需要与主线车道前车保持约26.807 5 m的距离,因此汇合车辆与主线车道前车的最小可接受间距应控制在26.8 m以上。

MARS模型表示如下:

$ \begin{gathered} f(x)=0.4629+0.0832 H_1-0.0557 H_2+ \\ 0.0453 H_4-0.0045 H_7-0.0018 H_8- \\ 0.0078 H_9-0.0234 H_{10}-4.5519 \times 10^{-5} H_{12}+ \\ 0.0279 H_{13}-8.7279 \times 10^{-6} H_{15}+0.0019 H_{17}+ \\ 0.0037 H_{18}+0.0009 H_{21}+2.7904 \times 10^{-5} H_{22} . \end{gathered} $ (11)

MARS模型不仅能够反映影响变量之间的交互作用,而且能够对2个变量进行可视化处理。因此本文选取ΔVPL、ΔYPLXM进行可视化处理,如图 6所示。可以看出,ΔVPL、ΔYPLXM的贡献度均达到1.4,说明ΔVPL与ΔYPLXM之间具有潜在的交互作用。

图 6 交互作用变量三维图

与逻辑回归模型相比,MARS模型提供了经典模型结构的线性组合方程,任何MARS模型都可以分解为由单个或多个变量组成的结构组件集合。在没有交互作用的情况下,MARS模型会被分解为一组由原始变量定义的单变量组。而在有交互作用的情况下,基函数将被归纳为由特定变量创建的独立结构成分,以进行分析。表 7中,第3列为从现有模型中排除1组基函数而造成不可恢复的模型性能损失,即该组变量对模型拟合效果的影响程度;第4列为与该组基函数有关的影响变量。

表 7 MARS模型的基函数方差分析
组号 标准差 性能损失 影响变量
1 0.265 0.117 ΔVPL
2 0.353 0.131 ΔYPL
3 0.147 0.109 ΔVPL、ΔYPL
4 0.090 0.107 ΔYPLXM
5 0.089 0.106 ΔVPL、ΔYPL、ΔVPF
6 0.049 0.107 ΔVPL、ΔYPL、TTCPL
7 0.112 0.106 ΔVPL、ΔYPFXM
8 0.074 0.107 ΔVPL、ΔVPFXM
9 0.173 0.119 ΔVP、ΔYLXM
10 0.049 0.107 ΔVPL、ΔYPL、ΔYPF、TTCL
11 0.167 0.108 ΔVPL、ΔVL、ΔYPLXM

影响变量重要性排序如图 7所示。可以看出,在MARS模型中,影响汇合车辆汇合决策行为的重要依据是ΔVPL,说明汇合车辆与主线车道前车的交互作用比较强。ΔYPLXM、ΔYL对汇合决策也存在显著影响,重要性超10%;未列出的3个变量ΔVL、TTCPFVM在模型中对汇合车辆影响程度最小。本文结论与文[20]一致,此外,辅助车道前车对汇合车辆的影响也很大,甚至超过主线车道后车。这说明在汇合过程中驾驶员更倾向于观察前方交通流状态,从而进行适当的控制和决策。

图 7 影响变量重要性排序

为确定模型的预测精度,本文基于相同的数据集分别构建了分类回归树(classification regression tree,CART)、梯度提升树(gradient boosting decision tree,GBDT)、随机森林(random forest,RF)和逻辑回归(logistic regression,LR)模型进行比较。

为检验复杂度对这5种模型精确度的影响,本文采用了不同的度量标准。MARS模型的复杂度主要由基函数的数量度量,CART模型的复杂度主要由回归树的结点数度量;GBDT和RF模型的复杂度由决策树的数量度量,而LR模型的复杂度则由影响变量的数量度量。由图 8可知,当CART、GBDT、RF、MARS、LR模型的最优复杂度分别为6、120、200、22、11时,对应的预测错误率分别为0.177、0.138、0.151、0.141、0.156。因此,MARS与GBDT模型的预测错误率较低,其预测性能较好。但GBDT模型需要的决策树数目较多,计算效率较低,复杂度也相对较高。相比GBDT模型,MARS模型的复杂度较低,既可以提供简单的显性表达式又具有较高的准确性,更适合辅助驾驶和自动驾驶系统的应用。

图 8 模型复杂度与精确度关系

4 结论

本文论证了MARS模型在模拟汇合决策行为中处理多维非线性问题的可行性,MARS模型能够在回归建模中获得最佳的变量转换和潜在的变量交互,并轻松处理高维数据中隐藏的复杂数据结构。此外,MARS模型还可以通过在预测变量空间的不同区间中使用独立的回归斜率近似模型的非线性。

相比CART、GBDT、RF和LR模型,MARS模型具有以下特点:1) MARS模型主要利用最小二乘损失函数进行建模,直接将目标变量解释为只有2个观测值0和1的连续变量;2) MARS模型直接控制影响变量相互作用的顺序和结构,并实现分段线性连续响应。该特点使MARS模型对汇合决策行为的描述更符合实际经验。本文通过方差分析获得了汇合车辆与主线车道前车速度差、汇合车辆与主线车道前车纵向间距和汇合车辆横向位置的重要性程度,反映了三者之间的交互作用,并提供了相应的显性表达式。MARS模型能提高微观交通仿真的准确性,更利于辅助驾驶和自动驾驶系统的应用。

本文仅研究了MARS模型在汇合决策行为中的应用,并且应用场景和所采用的数据均有一定的局限性。下一步将采集不同地点的车辆轨迹数据对模型进行验证,同时也将进一步研究车辆自由换道、匝道汇出等行为。

参考文献
[1]
CHEN D J, AHN S. Capacity-drop at extended bottlenecks: Merge, diverge, and weave[J]. Transportation Research Part B: Methodological, 2018, 108: 1-20. DOI:10.1016/j.trb.2017.12.006
[2]
ZHENG Z D, AHN S, MONSERE C M. Impact of traffic oscillations on freeway crash occurrences[J]. Accident Analysis & Prevention, 2010, 42(2): 626-636.
[3]
GIPPS P G. A model for the structure of lane-changing decisions[J]. Transportation Research Part B: Methodological, 1986, 20(5): 403-414. DOI:10.1016/0191-2615(86)90012-3
[4]
YANG Q, KOUTSOPOULOS H N. A microscopic traffic simulator for evaluation of dynamic traffic management systems[J]. Transportation Research Part C: Emerging Technologies, 1996, 4(3): 113-129. DOI:10.1016/S0968-090X(96)00006-X
[5]
SINGH K, LI B B. Discrete choice modelling for traffic densities with lane-change behaviour[J]. Procedia-Social and Behavioral Sciences, 2012, 43: 367-374. DOI:10.1016/j.sbspro.2012.04.110
[6]
SUN J, OUYANG J X, YANG J H. Modeling and analysis of merging behavior at expressway on-ramp bottlenecks[J]. Transportation Research Record: Journal of the Transportation Research Board, 2014, 2421(1): 74-81. DOI:10.3141/2421-09
[7]
HOU Y, EDARA P, SUN C. Modeling mandatory lane changing using Bayes classifier and decision trees[J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(2): 674-655.
[8]
ZHENG J, SUZUKI K, FUJITA M. Predicting driver's lane-changing decisions using a neural network model[J]. Simulation Modelling Practice and Theory, 2014, 42: 73-83. DOI:10.1016/j.simpat.2013.12.007
[9]
MOTAMEDIDEHKORDI N, AMINI S, HOFFMANN S, et al. Modeling tactical lane-change behavior for automated vehicles: A supervised machine learning approach[C]// 2017 IEEE International Conference on Models and Technologies for Intelligent Transportation Systems (MT-ITS). Naples, Italy: IEEE, 2017: 268-273.
[10]
DÍAZ-ÁLVAREZ A, CLAVIJO M, JIMÉNEZ F, et al. Modelling the human lane-change execution behaviour through multilayer perceptrons and convolutional neural networks[J]. Transportation Research Part F: Traffic Psychology and Behaviour, 2018, 56: 134-148. DOI:10.1016/j.trf.2018.04.004
[11]
XIE D F, FANG Z Z, JIA B, et al. A data-driven lane-changing model based on deep learning[J]. Transportation Research Part C: Emerging Technologies, 2019, 106: 41-60. DOI:10.1016/j.trc.2019.07.002
[12]
王俊彦, 蔡骏宇. 基于RBF神经网络的车辆安全换道时机决策模型研究[J]. 重庆理工大学学报(自然科学版), 2019, 33(11): 47-51, 80.
WANG J Y, CAI J Y. Research on modelling vehicle safety lane-changing timing decision based on RBF neural network[J]. Journal of Chongqing Institute of Technology, 2019, 33(11): 47-51, 80. DOI:10.3969/j.issn.1674-8425(z).2019.11.007 (in Chinese)
[13]
徐兵, 刘潇, 汪子扬, 等. 采用梯度提升决策树的车辆换道融合决策模型[J]. 浙江大学学报(工学版), 2019, 53(6): 1171-1181.
XU B, LIU X, WANG Z Y, et al. Fusion decision model for vehicle lane change with gradient boosting decision tree[J]. Journal of Zhejiang University (Engineering Science), 2019, 53(6): 1171-1181. (in Chinese)
[14]
曹波, 李永乐, 赵凯, 等. 基于行为识别的智能车纵向决策研究[J]. 交通运输系统工程与信息, 2020, 20(3): 61-66.
CAO B, LI Y L, ZHAO K, et al. Intelligent vehicle longitudinal decision making based on behavior recognition[J]. Journal of Transportation Systems Engineering and Information Technology, 2020, 20(3): 61-66. (in Chinese)
[15]
崔洁茗, 余贵珍, 周彬, 等. 基于神经网络的车辆强制换道预测模型[J]. 北京航空航天大学学报, 2022, 48(5): 890-897.
CUI J M, YU G Z, ZHOU B, et al. Mandatory lane change decision-making model based on neural network[J]. Journal of Beijing University of Aeronautics and Astronautics, 2022, 48(5): 890-897. (in Chinese)
[16]
赵树恩, 王金祥, 李玉玲. 基于多目标优化的智能车辆换道轨迹规划[J]. 交通运输工程学报, 2021, 21(2): 232-242.
ZHAO S E, WANG J X, LI Y L. Lane changing trajectory planning of intelligent vehicle based on multiple objective optimization[J]. Journal of Traffic and Transportation Engineering, 2021, 21(2): 232-242. (in Chinese)
[17]
李根, 翟伟, 邬岚, 等. 基于多元自适应回归样条的交织区合流交互作用研究[J]. 东南大学学报(自然科学版), 2022, 52(4): 796-805.
LI G, ZHAI W, WU L, et al. Research on merging interactions in weaving area based on multiple adaptive regression splines[J]. Journal of Southeast University (Natural Science Edition), 2022, 52(4): 796-805. (in Chinese)
[18]
DAS A, KHAN N, AHMED M M. Nonparametric multivariate adaptive regression splines models for investigating lane-changing gap acceptance behavior utilizing strategic highway research program 2 naturalistic driving data[J]. Transportation Research Record: Journal of the Transportation Research Board, 2020, 2674(5): 223-238.
[19]
PUNZO V, BORZACCHIELLO M T, CIUFFO B. On the assessment of vehicle trajectory data accuracy and application to the next generation simulation (NGSIM) program data[J]. Transportation Research Part C: Emerging Technologies, 2011, 19(6): 1243-1262.
[20]
LI G, FANG S, MA J X, et al. Modeling merging acceleration and deceleration behavior based on gradient-boosting decision tree[J]. Journal of Transportation Engineering, Part A: Systems, 2020, 146(7): 05020005.
[21]
LI M, LI Z B, XU C C, et al. Short-term prediction of safety and operation impacts of lane changes in oscillations with empirical vehicle trajectories[J]. Accident Analysis & Prevention, 2020, 135: 105345.