随着中等城市建设的不断加速和机动化出行需求的不断增加,交通矛盾增多、通行效率偏低等问题日益凸显,这阻碍了城市的健康和绿色发展。只有深入了解和分析出行特征,才能制定针对性的政策,建立绿色、可持续发展的城市交通体系[1]。大数据能有效弥补传统调查数据在样本量等方面的不足,为政策制定提供更全面、精细的思路[2]。随着通信技术的进步和服务水平的提高,通过信令数据提取海量、完整时间序列的居民出行特征成为可能[3-4]。目前手机已成为人们日常生活的必需品,因此基于信令获取的出行特征更加客观。通过挖掘适当的方法,信令数据能够以较低的成本为城市规划、工程项目等提供可靠的支持。
交通方式的构成是衡量城市绿色出行水平的重要指标,基于信令数据对交通方式进行识别一直是研究的热点,识别的核心是对时空信息进行挖掘。对于空间信息,文[5-6]使用Euclid距离确定出行距离,而文[7-8]则采用基于基站与路网的映射计算最短出行距离。信令是对居民出行的不精确表达,根据定位原则,居民可能出现在基站覆盖范围内的任意位置。然而,现有研究缺乏对路网结构和选路策略的考量,使测得的距离偏小,误差在基站稀疏区域更为明显,接近40%。对于信令时间,Gu等[9]在识别城际出行方式时,由于路线相对固定,利用铁路和航空时刻表进行辅助研究,并未利用信令时间。文[10-11]在研究城市内小规模、带标记数据时,聚焦于轨迹匹配,也未利用信令时间。Chen等[12]在对城市内大规模、无标记数据的识别中使用了信令时间戳。然而,当前研究对于信令时间的挖掘较少,根据信令更新机制,居民在出发或到达一段时间后,信息才被更新,导致得到的出行时间偏大。
1 研究框架与数据特征考虑基站密度、出行距离等因素,此前研究多集中在数据较丰富的超大城市和大城市,对出行途经点信息和特征数据进行研究。例如,文[13-15]分别基于巴黎、上海和北京的信令,从轨迹匹配的角度进行交通方式识别。然而,研究中有关中等城市大规模、无标记数据的交通方式识别较少,因为这些城市的信令数据大多集中于起讫点,对于基于轨迹的方法较难适用。本文将围绕基于信令数据的中等城市交通方式识别展开研究,从出行结构入手,助力城市绿色出行;通过扩展时空信息,利用地图API(application programming interface)和速度区间进行调整,确定可能的交通方式,并使用Logit模型完成识别;选取荆州市中心城区作为研究实例,并给出相关政策建议。研究框架如图 1所示。
数据源为记录于2022年4月11日5时至22时移动、联通和电信的信令数据,包含IMEI (international mobile equipment identity)、时间戳、基站名称和经纬度位置等信息,涉及189 833个用户,总计913万余条。这些数据是在进行20%的抽样后得到的。
对停留、漂移、乒乓和缺失信息等噪声数据进行清洗,保留起讫点和途经点等能反映出行信息的记录。结合信令特点,将一次出行定义为:出行者为完成某一目的从起点到终点,采用一种以上交通方式,且时间大于5 min、小于4 h的非闭环移动。共得到102 326位居民214 431次的出行数据,出行次数累计分布如图 2所示。日出行2次的居民占比最高,超七成居民日出行小于等于2次。
出行量时间分布如图 3所示,图中早高峰为7:00—8:00,晚高峰为17:00—19:00。
2 交通方式识别方法
本文提出一种基于扩展信令时空信息并结合地图API和Logit模型的交通方式识别方法,包括出行距离和时间确定、地图API模拟、速度区间调整和交通方式识别4个方面。
2.1 出行距离确定用出行距离(非固定距离)描述出行,有利于挖掘出行特征。遵照单基站定位(cell of orign, COO)原则构造Thiessen多边形,确定基站覆盖范围。当某点落入一个Thiessen多边形,且该点与中心点最近,则该空间关系与COO原则一致,表示居民每次向距离最近(信号最强)的基站报送信息,表示如下:
$ D_{\mathrm{ll}}=L_{\mathrm{OD} \min } \theta_{\mathrm{OD}}, $ | (1) |
$ D_{\mathrm{ul}}=L_{\mathrm{ODmax}} \theta_{\mathrm{OD}} . $ | (2) |
其中:Dll、Dul分别表示出行距离的下限和上限;LODmin、LODmax分别表示基站间最短和最长直线距离;θOD表示基站间路网非直线系数。
式(1)和(2)分别计算起讫点基站间最短和最长直线距离与路网非直线系数的乘积,确定距离。有关最短直线距离的计算分为2种情况:基站若相邻,最短直线距离则为基站间Euclid距离;若不相邻,则采用旋转卡壳法进行计算。同时,最长直线距离也采用旋转卡壳法进行计算。在计算过程中,得到起讫点基站范围内多组交通起止点(origin destination, OD)信息,结合地图API获取路网距离即可计算非直线系数。
2.2 出行时间范围确定用户向基站报送信息的原则通常如下:
1) 进行网络交互,如接打电话、收发短信、上网等;2) 移动过程中发生位置区切换;3) 进行开关机操作;4) 达到时间阈值未发生交互,上报位置信息。原则4是信令时间被压缩的主要原因,当居民离开始发地或到达目的地后,数据更新不及时,以致时间戳差值得到的出行时间偏大。一般情况下,商业区、居民区等基站密集区的报送频率较高,阈值范围为10~30 min;郊区等基站稀疏区的报送频率较低,阈值范围为30~60 min。出行时间上限为起讫点信令时间戳差值,代表信任信令时间戳,也是此前研究多采用的方法;出行时间下限由数据报送频率缩减得到。
2.3 基于地图API的不同交通方式速度获取以实时路况为基础调用地图API时,需要考虑信令对应的时段、日期属性(如周一)等因素,并选择适当的驾车计算路线、公交换乘等策略,为提高识别准确性,需要还原路网环境因素。具体策略如下:
1) 对于使用个体化机动交通工具出行的居民,高峰时段选择躲避拥堵且速度最快的策略,平峰时段选择高德地图推荐的策略。
2) 对于使用公交车出行的居民,高峰时段选择花费时间最短的换乘策略,平峰时段选择综合权重后推荐的换乘策略。
3) 个体化机动交通工具的车辆类型为普通燃油车。
4) 对于步行的居民,不考虑横穿建筑物的策略。
5) 对于骑行的居民,不做特殊约束。
这些策略旨在根据不同的出行方式,获取其在不同时段、不同路段的速度数据,为下一步交通方式识别提供支持。使用API进行数据调用时,需要输入起讫点的经纬度信息,本文使用信令数据中的起点和终点基站的经纬度信息,并计算基站间最短和最长距离点对的经纬度作为输入。调用API后,可以获得不同交通方式下的出行距离、时间和速度的均值,为识别提供参考。
2.4 速度区间调整通过扩展时空信息,得到基于原始信令数据计算速度区间时的数据,速度的时空对应关系如表 1所示。
表 1中,vul、vll分别表示速度上限与下限;vmid1、vmid2分别表示中间速度1与中间速度2;tul、tll分别表示时间上限与下限。
用vdrive、vbus、vbike、vwalk分别表示通过API获取的驾车、公交、骑行和步行速度。通过对速度区间进行调整,确定出行方式选择集,为Logit模型识别做准备。
首先选取最大区间[vll, vul]进行匹配,不同交通方式与区间所属情况,如图 4所示。
在最大速度区间内,仅有24.1%的比例包含1种交通方式,因此可以直接确定该区间的交通方式。而17.9%的区间内不包含任何交通方式,原因如下:情况①是该区间的速度上限低于最小出行速度;情况②是该区间的速度下限高于最大出行速度;情况③是该区间的速度处于某2种交通方式的速度区间内。这3种情况分别对应图 5中的①、②、③。
对于情况①和②,分别将其识别为速度最低和最高的交通方式;对于情况③,按照区间包含的2种交通方式进行识别。
区间包含3种及以上交通方式的比例为17.3%,此时的时空信息被过度扩展。由于时间滞后,对速度下限的影响较大,因此需要对区间进行调整,对区间的调整即对下限调整,直至区间内包含的交通方式小于等于2种,具体调整方法如图 6所示。
2.5 基于Logit模型的交通方式识别
本文采用朱顺应等[16]构造的模糊Logit模型进行识别。模型基于问卷调查收集到的居民在不同时段选择各种出行方式所需时间,并采用可靠度校准效用函数进行计算。
选用该模型的原因在于模糊Logit模型能够考虑居民在选择出行方式时所面临的不确定性和总效用估计误差的不确定性,从而得出较符合实际情况的计算结果。此外,模型还可以扩大选择集中2种交通方式的效用差值[16]。
以公交为例,问卷内容如图 7所示。
数值越大代表该交通方式越可靠,即居民更倾向于选择该交通方式。信令数据是加密的,不包含如性别、年龄等决策主体的个人信息,仅包含压缩后的时空信息。在模型中,将时间作为决策变量。通过本地化校准效用函数,根据时间可靠度均值对参数进行选择,提高了识别精度。通过问卷调查共得到237份有效问卷,问卷结果如表 2所示。
由表 2可知,高峰和平峰时段,骑行均具有最高的可靠度;高峰时段,公交比个体化机动交通工具出行可靠度略高;平峰时段,个体化机动交通工具可靠度高于公交出行。
在2.4节得到的选择集中,根据区间包含的交通方式存在3种组合,分别为个体化机动交通工具与公交出行、公交与骑行、个体化机动交通工具出行与骑行。根据文[15],效用函数和选择概率分别表示如下:
$ V(f)=\alpha T(f), $ | (3) |
$ V(s)=\alpha T(s)+\gamma, $ | (4) |
$ P(i)=\frac{\exp \left(V_i\right)}{\sum\limits^2 \exp \left(V_2\right)} . $ | (5) |
其中:V(f)、V(s)分别表示高速和低速交通方式的效用函数;T(f)、T(s)分别表示高速和低速交通方式的出行时间;α表示时间感知参数;γ表示常数项;P(i)表示选择不同交通方式的概率;Vi表示交通方式i的效用;V2表示共2种交通方式的效用参与计算。
Logit模型参数如表 3所示。
3 方法验证
对识别结果进行验证是一项具有挑战性的工作。本文研究不仅与政府出行结构数据进行对比,还通过NOx的排放量和实测流量进行验证。
3.1 基于政府出行结构数据验证采用本文提出的交通方式识别方法得到的结果,如图 8所示。其中,步行占比36.71%,地面公交占比28.34%,个体机动化出行占比24.12%,骑行占比10.83%。荆州市没有地铁,同时水上交通占比仅为0.40%,可忽略不计。
2022年的数据为识别结果,与文[17]中2015、2020和2030年的规划数据进行对比,如表 4所示。
% | |||||||||||||||||||||||||||||
年份 | 公共交通 | 个体化机动交通 | 步行和自行车 | ||||||||||||||||||||||||||
2015 | 19.21 | 25.44 | 55.35 | ||||||||||||||||||||||||||
2020 | 35.00 | 25.00 | 40.00 | ||||||||||||||||||||||||||
2022 | 28.34 | 24.12 | 47.54 | ||||||||||||||||||||||||||
2030 | 40.00 | 20.00 | 40.00 |
2022年是城市规划中的重要节点,涉及近期和远期规划。与2020年相比,本文研究对个体化机动交通的识别表现最好,对公共交通的识别结果偏低,对步行和自行车的识别结果偏高。根据数据预处理结果,67.58%的数据无有效的途经点,但在此情况下本文研究方法仍具有较好的识别效果。
3.2 基于NOx排放数据验证采用平均单车排放因子及其修正方法,计算机动车NOx排放量。该方法具有较好的研究基础和有效测算能力[18]。排放因子是指车辆以一定的平均速度行驶的单位距离污染物排放量,在不同车型、燃料类型、排放标准和平均速度的影响下,排放因子各异。机动车NOx日排放总量表示如下:
$ V_{\mathrm{NO}_x}=\sum\limits_{i=1}^m \mathrm{EF}_q . $ | (6) |
其中:VNOx表示范围内机动车NOx日排放总量,g;EF表示单车平均排放因子,g/km;lq表示车辆行驶里程,km,q表示不同路线;m表示出行总量。
考虑车型、车速、排放标准、环境和行驶里程等因素的影响,对文[19]进行本地化修正,得到了平均单车排放因子的取值,如表 5所示。行驶里程和速度区间通过地图API获取,荆州市新能源汽车比例为1.15%。在计算时假设机动车均为汽油车。
由文[20]可知,研究区域内的机动车NOx日排放量为1.727t,经本文研究方法计算得到排放总量为1.451t,识别效果较好。
3.3 基于交叉口流量数据验证基于个体化机动交通工具和公交出行数据的识别结果,使用TransCAD软件进行OD反推,与范围内重点交叉口实测流量进行对比,结果如图 9所示。图中交叉口流量误差均低于12%,且流量误差低于5%的交叉口约占50%,识别效果良好。
4 绿色出行政策建议
荆州市是湖北省的中等城市,本文选取案例的研究范围为该市中心城区,如图 10所示。为提出更精细的出行政策,根据用地性质和路网结构等因素划分交通小区,如图 11所示。
根据识别结果,使用3.2节中的方法计算每次机动交通出行的NOx排放。结合起讫点基站所属的交通小区集、出行时段和距离等因素,得出以小区为单位的机动交通出行强度不同情境的时空分布,为政策制定提供可视化支撑。
4.1 出行结构时空特性在空间上,将出行划分为城区内部、进城、出城3种类型,各类型出行结构空间特征,如图 12所示。在城区内活动的居民,步行占比最高;进城和出城的居民出行结构相似,个体化机动交通出行占比最高,公交次之。
在时间上,将出行分为早高峰、平峰和晚高峰3种类型,各类型出行结构时间特征,如图 13所示。早高峰时段公交车出行比例最高,均高于全天整体水平,平峰时段人们更青睐步行。
4.2 加强医区和学区交通组织管理
荆州市中心城区的早期道路规划和建设系统性较差,学区、医区等重要区域的交通组织贯通性存在一定问题,城市道路的交通流通性不够顺畅,末端客流的快速集散效果不够明显。
城区内的学校和医院分布如图 14所示。图中JINGZHOU表示荆州,SHASHI表示沙市,YINGCHENG表示郢城,LUOCHANG表示锣场,BUHE表示埠河,CENHE表示岑河。学校主要分布在城区西侧,医院主要分布在城区东侧。
高峰时段个体化机动交通和公交NOx排放如图 15所示。污染物NOx排放的时空分布可用来判断该地区机动交通的出行强度,污染物含量越高代表个体化机动交通和公交出行的强度越大。由图 15可知,西侧出行强度与学校分布情况接近,东侧出行强度与医院分布情况接近,识别结果较好地反映了高峰时段学区、医区周围交通拥堵的情况,因此需要加强交通组织管理。
在高峰时段,由于集中的上下班交通需求和医院周围的停车问题,会加剧交通拥堵,迫使机动车行驶缓慢(低于20 km/h),导致较多的污染物排放。通过合理的交通组织管理,可以改善学校、医院附近的微循环,提高路网运行效率。因此,应在医院周围增设出租车专用停车点,提高停车位周转率;加强学校、医院附近的停车管理,减少路内违停;加强学校、医院附近支路的建设,减轻主干道路的交通压力。
4.3 开设需求响应式公交根据文[17]的目标,荆州市计划落实公交优先政策,大力发展公共交通,加快公交系统建设,以实现公交占比在2030年达到40%的目标;同时,合理控制私人小汽车的增长,鼓励居民乘坐公交出行,优化交通方式结构。根据识别结果,目前公交出行占比为28.34%。为实现目标,还需进一步减少个体化机动交通的占比,明确政策目标群体。在这一背景下,荆州市计划开设需求响应式公交,以提升公共交通的分担率。
根据调研数据,71.96%的居民出行在城区内部,进出城区的占比为28.04%(该数据未在图中展示)。其中,37%为个体化机动交通,远高于整体水平(24.12%);34%为公交出行,也高于整体水平(28.34%)。进出城区时,整体公交使用比例为28.34%(见图 8),而进出城区的公交使用比例更高,为34%。虽然有不少居民选择公交出行,但传统公交对居民的吸引力有限,仍有大部分居民选择舒适性更好、更快速的个体化机动交通。即进出城作为一个整体,其不同交通方式比例高于图 8的整体水平。使用个体化机动交通和公交进出城区的NOx排放时空分布,如图 16所示。由图可知,城区东部的沙市区作为经济核心,排放强度明显高于西部以古城为核心的荆州老城区,居民进出城的行为集中在区域1、2,此区域的用地性质为居住及商业用地。
为了提高公交占比,可引入新型公交模式。在交通运输业和“互联网+”融合的背景下,需求响应式公交符合共享经济发展趋势,可满足个性化出行需求,是促进城市可持续、绿色发展的有效途径。
区域1、2的居民在高峰时段使用个体化机动交通工具进出城的分布,如图 17所示。需求响应式公交的核心是对相似出行需求的整合,这部分居民起讫点集中在区域1、2和城区东部,出行时段集中在早高峰和晚高峰,为合乘站点的布设提供了有利条件。采用“一人一座”的模式可提高居民出行的舒适性,预约出行的模式可保障居民出行时效。结合宣传,有望吸引更多居民使用公交,进一步提升公交分担率,优化出行结构。
4.4 引导特定人群使用非机动车
荆州市重视对慢行交通系统的规划建设,旨在创造良好的慢行交通环境。在识别结果中,使用个体化机动交通的居民有转变为骑行的潜力。因为在高峰时段,起讫点基站相同的情况下,二者速度较接近,如表 6所示。对这部分居民加以引导,不仅能降低个体化机动交通的占比,还能迎合规划目标。
如图 18所示,建议在标记的投放区域内适量投放共享非机动车,并加强管理,以减少相关干线机动车和非机动车混行,同时适当拓宽非机动车道,清理占用非机动车道的路内停车,从而降低个体化机动交通的占比。
5 结论
基于中等城市信令数据的特点,本文提出了一种不依赖轨迹匹配的适用于中等城市大规模、无标记数据的交通方式识别方法。通过扩展信令数据时空信息获取出行速度区间,使用地图API并基于Logit模型完成识别,利用污染物排放量、实测交通量验证识别效果,为城市绿色出行提供建议。
以荆州市为案例,提出了提升公交分担率、减少污染物排放的可能政策,包括引入需求响应式公交,加强医区和学区的交通组织管理,以及在特定区域投放共享非机动车等措施。
未来,出行数据将更加全面、公开,多种来源的数据结合将更好地支持绿色、可持续的城市交通系统。下一步将考虑在周末、节假日、疫情和不同天气情况下,构建出行结构情景库,以提升政策的精准性和灵活性,改善居民出行体验,促进城市发展。
[1] |
HUANG H S, CHENG Y, WEIBEL R. Transport mode detection based on mobile phone network data: A systematic review[J]. Transportation Research Part C: Emerging Technologies, 2019, 101(4): 297-312. |
[2] |
ZHU L, YU F R, WANG Y G, et al. Big data analytics in intelligent transportation systems: A survey[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(1): 383-398. DOI:10.1109/TITS.2018.2815678 |
[3] |
GADZIŃSKI J. Perspectives of the use of smartphones in travel behaviour studies: Findings from a literature review and a pilot study[J]. Transportation Research Part C: Emerging Technologies, 2018, 88(5): 74-86. |
[4] |
BURKHARD O, BECKER H, WEIBEL R, et al. On the requirements on spatial accuracy and sampling rate for transport mode detection in view of a shift to passive signalling data[J]. Transportation Research Part C: Emerging Technologies, 2020, 114(5): 99-117. |
[5] |
QU Y C, GONG H, WANG P. Transportation mode split with mobile phone data[C]// Proceedings of 2015 IEEE 18th International Conference on Intelligent Transportation Systems. Gran Canaria, Spain: IEEE, 2015: 285-289.
|
[6] |
YAMADA Y, UCHIYAMA A, HIROMORI A, et al. Travel estimation using control signal records in cellular networks and geographical information[C]// Proceedings of 2016 9th IFIP Wireless and Mobile Networking Conference. Colmar, France: IEEE, 2016: 138-144.
|
[7] |
PHITHAKKITNUKOON S, SUKHVIBUL T, DEMISSIE M, et al. Inferring social influence in transport mode choice using mobile phone data[J]. EPJ Data Science, 2017, 6(1): 11. DOI:10.1140/epjds/s13688-017-0108-6 |
[8] |
PENG Z H, BAI G K, WU H, et al. Travel mode recognition of urban residents using mobile phone data and map API[J]. Environment and Planning B: Urban Analytics and City Science, 2021, 48(9): 2574-2589. DOI:10.1177/2399808320983001 |
[9] |
GU M C, SUN S, JIAN F, et al. Analysis of changes in intercity highway traffic travel patterns under the impact of COVID-19[J]. Journal of Advanced Transportation, 2021, 2021(1): 7709555. |
[10] |
DANAFAR S, PIORKOWSKI M, KRYSCZCUK K. Bayesian framework for mobility pattern discovery using mobile network events[C]// Proceedings of 2017 25th European Signal Processing Conference. Kos, Greece: IEEE, 2017: 1070-1074.
|
[11] |
SUN H D, CHEN Y Y, WANG Y, et al. Trip purpose inference for tourists by machine learning approaches based on mobile signaling data[J]. Journal of Ambient Intelligence and Humanized Computing, 2023, 14(2): 923-937. DOI:10.1007/s12652-021-03346-y |
[12] |
CHEN J T, XIONG C, CAI M. A travel mode identification framework based on cellular signaling data[J]. Mobile Information Systems, 2022, 4: 1-19. |
[13] |
CHEN X X, WAN X, LI Q, et al. Trip-chain-based travel-mode-shares-driven framework using cellular signaling data and web-based mapping service data[J]. Transportation Research Record: Journal of the Transportation Research Board, 2019, 2673(3): 51-64. DOI:10.1177/0361198119834006 |
[14] |
ZHAO P J, LIU D, YU Z, et al. Long commutes and transport inequity in China's growing megacity: New evidence from Beijing using mobile phone data[J]. Travel Behaviour and Society, 2020, 20(7): 248-263. |
[15] |
AGUILÉRA V, ALLIO S, BENEZECH V, et al. Using cell phone data to measure quality of service and passenger flows of Paris transit system[J]. Transportation Research Part C: Emerging Technologies, 2014, 43: 198-211. DOI:10.1016/j.trc.2013.11.007 |
[16] |
朱顺应, 邓爽, 王红, 等. 具有模糊特性变量的出行方式预测Logit模型[J]. 交通运输工程学报, 2013, 13(3): 71-78. ZHU S Y, DENG S, WANG H, et al. Predictive LOGIT model of trip mode with fuzzy attribute variables[J]. Journal of Traffic and Transportation Engineering, 2013, 13(3): 71-78. (in Chinese) |
[17] |
荆州市人民政府. 荆州市城市综合交通体系规划(2015—2030)[R/OL]. (2015-09-25)[2022-09-17]. http://www.jingzhou.gov.cn. Jingzhou Municipal People's Government. Comprehensive transportation system planning of Jingzhou city (2015-2030)[R/OL]. (2015-09-25)[2022-09-17]. http://www.jingzhou.gov.cn. (in Chinese) |
[18] |
ZHAI Z Q, SONG G H, LIU Y, et al. Characteristics of operating mode distributions of light duty vehicles by road type, average speed, and driver type for estimating on-road emissions: Case study of Beijing[J]. Journal of Intelligent Transportation Systems, 2019, 23(2): 191-202. |
[19] |
生态环境部. 关于发布《大气可吸入颗粒物一次源排放清单编制技术指南(试行)》等5项技术指南的公告[EB/OL]. (2014-12-31)[2022-09-17]. https://www.mee.gov.cn/gkml/hbb/bgg/201501/t20150107_293955.htm. Ministry of Ecological Environment of the People's Republic of China. Technical guidelines for the preparation of air pollutant emission inventory for road vehicles (trial)[EB/OL]. (2014-12-31)[2022-09-17]. https://www.mee.gov.cn/gkml/hbb/bgg/201501/t20150107_293955.htm. (in Chinese) |
[20] |
荆州市生态环境局. 2020年荆州市生态环境统计公报[R/OL]. (2022-04-25) [2022-09-17]. http://sthjj.jingzhou.gov.cn/fbjd/xxgkml/hjgh/202204/t20220425_723263.shtml. Jingzhou Municipal Ecological Environment Bureau. 2020 Jingzhou city ecological environment statistical bulletin[R/OL]. (2022-04-25) [2022-09-17]. http://sthjj.jingzhou.gov.cn/fbjd/xxgkml/hjgh/202204/t20220425_723263.shtml. (in Chinese) |