大数据驱动的地铁留乘行为分析
王静1, 刘锴1, 王江波1, 宫磊2    
1. 大连理工大学 交通运输学院, 大连 116024;
2. 深圳技术大学 城市交通与物流学院, 深圳 518118
摘要:近年来地铁系统客流量急剧增加, 时空上的过度拥挤造成留乘问题日益严峻。留乘严重影响了地铁运行效率, 但目前缺少相关的行为学机理研究。该文使用深圳通刷卡数据, 从乘客个体层面细化地铁出行过程, 以乘客理性出行时间为基础识别留乘, 并观测其时空分布特征。统计结果表明:深圳地铁1号线平均留乘率为12.0%, 平均留乘时间为4.20 min。该文从个人、车站和线路3个层面挖掘城市地铁留乘的影响因素, 提取乘客多日出行的留乘决策数据构建面板logit模型(panel logistic regression model, PLM), 进一步以留乘乘客为研究对象, 构建考虑个体特定效应的面板数据随机效应回归模型, 探究留乘时间影响因素作用机理。结果表明:长距离出行、起始站上车和高峰时段的乘客留乘概率高, 频繁出行的乘客留乘概率低; 起始站上车的乘客虽有更高留乘概率, 但留乘时间未显著增加, 晚高峰下行方向和早高峰上行方向留乘时间分别增加0.61和0.88 min, 相对运行方向留乘时间不增反降。该文挖掘了留乘行为决策机理, 提高了个体留乘行为决策及留乘持续时间的预测精度, 能为列车精细化调度和发布面向乘客的定制化引导策略提供依据。
关键词城市交通    留乘识别    面板logit模型    智能卡数据    
Analysis of urban subway passengers' detention behavior based on big data
WANG Jing1, LIU Kai1, WANG Jiangbo1, GONG Lei2    
1. School of Transportation and Logistics, Dalian University of Technology, Dalian 116024, China;
2. College of Urban Transportation and Logistics, Shenzhen Technology University, Shenzhen 518118, China
Abstract: [Objective] As an irreplaceable green travel mode, urban subway involves considerable daily travel. However, the passenger flow of subway systems has recently increased remarkably, resulting in overcrowding in space and time. Many trains operate at the highest frequency and maximum capacity during peak hours and still cannot meet passenger demand. Thus, detention is becoming increasingly severe, affecting the basic performance indicators of the subway systems while reducing the service quality and reliability perceived by subway passengers. However, research on the behavioral mechanism of detention is currently inadequate. Based on bus smart card data, supplemented by data mining technology, this study aims to quantify the difference between the rational travel time and the actual travel time of passengers. It reproduces the waiting process of each passenger as realistically as possible and predicts the occurrence and duration of the detention. The study provides a reference with application value for improving the future subway operation status evaluation index system and lays a research foundation for refined passenger flow distribution simulation, depending on the individual level of passengers. [Methods] The bus smart card data record the spatiotemporal information of each subway passenger's travel start and end station at a low cost. Furthermore, data mining technology is used to mine the travel information of passengers from the bus smart card data. This study uses the Shenzhen Tong data from september 2019. First, a suitable pretreatment method is adopted for the problems existing in the original data. Through an analysis of the fluctuation of each time component of the travel time, the travel time is redivided into the entry time, waiting time, in-car time, and outbound time. Second, the rational travel time value of the passenger is obtained by estimating the time of each part individually. Then the passenger's detention is identified based on the maximum rational travel time of the passenger. The influencing factors of detention are excavated from the three levels of individuals, stations, and lines. Frequent passengers are selected as research objects, and nonequilibrium panel travel data are used. Finally, a panel logistic regression model and panel data random effect regression model are established to achieve a prediction of detention and detention time. [Results] The study results, based on Shenzhen Metro Line 1, showed that the average detention rate of each station was 12.0%, the detention time was concentrated in 1.00-8.00 min, and the average detention time was 4.20 min. The travel time in the downward direction of the evening peak and the upward direction of the morning peak increased by 0.61 and 0.88 min, respectively, while the travel time in the downward direction decreased. The study also found that long-distance passengers had longer detention time than others, and they were willing to sacrifice their time in exchange for a comfortable ride. They had more choices at the starting station and were willing to wait for one or more trains to obtain seats. However, the passengers who took the subway less had cognitive bias, leading to the detention time increased. [Conclusions] Detention is a common problem during the morning and evening rush hours, which affects a passenger's travel time. This research clarifies the mechanism of detention behavior, provides a basis for generating operation management plans and issuing customized guidance strategies and is conducive to maximizing the operational efficiency of a subway transit system.
Key words: urban traffic    detention identification    panel logistic regression model    smart card data    

城市轨道交通作为不可替代的绿色低碳交通工具,为大量乘客的日常出行提供了相对便捷的交通方式。但近年来地铁系统的客流量急剧增加,空间和时间上均出现过度拥挤现象,许多地铁列车在高峰时段以最高频率和最大容量运行仍无法满足乘客需求。公共交通系统的供需不平衡将导致客流向私人交通方式迁移,不利于低碳交通系统可持续发展[1]。高峰时段,由于列车容量限制,许多候车乘客难以登上第一趟列车而必须等待后续列车[2],造成大量乘客滞留。Li等[3]研究发现,1.00 min站立候车的出行负效用相当于不拥挤条件下2.04 min的行程时间负效用,在非常拥挤的站台候车1.00 min相当于在中等拥挤的站台候车1.70~2.50 min。留乘不仅增加了乘客的站内等待时间和出行不确定性,而且影响客流时空分布估计和路网客流分配等。因此,研究个体留乘行为及其对运营调度的影响迫在眉睫。

目前关于留乘问题的大部分研究均基于车站的统计分析。Sipetas等[4]通过使用图像处理和目标检测技术从监控视频中估计留乘乘客数量,该模型可正确识别出93%的留乘人数,但无法获取对车辆调度更加有效的信息。除此之外,城市轨道交通自动售检票(automatic fare collection, AFC)系统数据具有易获取、内容详细完备、实时性强的特点,既为公共交通客流特征研究提供了数据基础[5],也为留乘研究开辟了新思路。国内外很多学者从供需失衡的角度解析留乘现象,Li等[6]将站台上车乘客分为随机到达乘客、换乘乘客和留乘乘客,将乘客乘车过程分为4个阶段,通过模拟仿真获得各站台滞留乘客数量。Mo等[7]利用基于分配的路径选择估计框架,获得不同车站间拥挤度的内在相关性,以及路径选择和留乘之间的相互作用。同样,可以使用AFC和自动车辆定位系统(automatic vehicle location, AVL)数据中的乘客到达时间和列车发车时间建立回归模型[8],用最大似然估计[9]和Bayes推理[10]2种方法实现留乘率函数估计。AFC数据可为留乘研究提供数据支撑,但这些研究都依赖于精确的列车运行时刻表,且集中关注车站层面,缺少对个体行为的深入分析。

虽然基于乘客个体留乘识别的研究较少,但也有一些尝试。Paul[11]根据仅有一趟可行列车的乘客出站时间数据,进行了出站时间分布的计算,假设行程时间参数与人工调查得到的平均进、出站时间比例相同,进而估计每个车站的进站时间分布。在此基础上,田婉琪[12]通过挖掘乘客乘车特征确定可行列车集合,将到达时间与理论下车时间最接近的列车定为匹配列车,进而估计乘客留乘次数。该研究发现,多数乘客在站点滞留次数为0或1次,少数可达2~3次,而发生4次以上留乘的可能性极小[13]。但上述研究都忽视了乘客个体差异,无法明确乘客选择内在机理,也无法对留乘状况作出预测。

站点客流的精细化管理对轨道交通低碳可持续发展具有重要意义,留乘问题的现有研究多关注大范围的时空统计分析和估计,或面向乘客进行聚类分析。本文通过细化地铁乘客出行过程剖析乘客留乘行为产生机理,通过提取时间序列下的面板数据,构建面板logit模型(panel logistic regression model,PLM)和随机效应回归模型,挖掘留乘行为决策机理并估计留乘持续时间。

1 模型构建 1.1 留乘识别

地铁留乘产生的原因:1) 列车和站台拥堵,或为配合地铁的运营管理,乘客无法登上列车,被迫选择继续等待;2) 乘客因个人原因而主动选择继续等待,如不愿忍受车内拥挤等。本研究聚焦于无换乘乘客,此类乘客出行行为简单,无须为其匹配出行路径,图 1为无换乘乘客乘车时距。当无留乘发生时乘客会登上列车3,其出行时间包含4部分:进站刷卡后步行至站台时间、候车时间、乘车时间、下车后出站步行时间,分别对4部分时间进行测算,进而获得乘客理性最大出行时间,得出留乘发生的判断阈值。

图 1 无换乘乘客乘车时距

1) 进出站步行时间。

具有相同出行起终点(origin-destination)车站的乘客,车内时间是相同的,因此可认为具有同一出行起终点且行程时间最短的乘客具有最短的候车时间。当数据量足够大时,行程时间最短的乘客的候车时间可近似为0。本研究聚焦于无换乘乘客,无须考虑换乘过程中的候车时间。基于行程时间最短乘客的候车时间为0的假设,行程时间最短的乘客的出行时间模型可表示如下:

$ T_{\text {travel }}^{O D, \text { fastest }}=T_{\text {in }}^O+T_{\text {vehicle }}^{O D}+T_{\text {out }}^D . $ (1)

其中:O为起始车站,D为目的车站;TtravelOD, fastestOD中行程时间最短的乘客的行程时间,TinO为乘客从O进站的进站步行时间,TvehicleODOD间的列车运行时间,ToutD为乘客从D出站的出站步行时间,单位均为min。

通过列车的运营时间表可以获得车站间的运行时间,乘客的进出站步行时间TwalkOD可表示为

$ T_{\text {walk }}^{O D}=T_{\text {in }}^O+T_{\text {out }}^D=T_{\text {travel }}^{O D, \text { fastest }}-T_{\text {vehicle }}^{O D}. $ (2)

2) 候车时间。

地铁运营过程根据客流需求,划分了不同的运营时段,并为不同运营时段的列车开行设置了发车时间间隔、车站停车时间。乘客进站步行至站台后希望尽快上车,情况允许下他们会选择登上到达站台的第一趟列车。假设车内拥挤度低且无留乘发生,候车时间最长的乘客是在前一趟列车刚刚驶离站台后到达站台的乘客,最长的候车时间近似于相邻2趟列车到达时间差,即列车发车时间间隔Tinterval

3) 乘客理性最大出行时间。

通过地铁刷卡数据记录的时间,可获得乘客i从进站刷卡到出站刷卡的时间间隔Ti,表示如下:

$ T_i=t_{i, \text { out }}-t_{i, \text { in }}. $ (3)

其中:ti, outi的出站刷卡时刻,ti, ini的进站刷卡时刻。

若无留乘发生,则乘客的行程时间由进出站步行时间、候车时间、乘车时间构成,i的最大行程时间(候车时间最长情况下)TiOD, max可表示如下:

$ T_i^{O D, \max }=T_{\text {walk }}^{O D}+T_{\text {vehicle }}^{O D}+T_{\text {interval }} . $ (4)

TiTiOD, max,则乘客在站内出现滞留。

1.2 留乘行为分析

由于站台和列车拥挤,因此乘客在高峰时段进入地铁系统后并不处于完全自由的状态。受站内拥堵和自身认知与偏好的影响,乘客会确定是否选择登上当前到达的列车。以持卡人多日出行留乘识别结果作为因变量,使用离散选择模型揭示出行距离、出行频率等对留乘决策的影响机理,进一步以留乘行程为研究对象,探究各因素对留乘持续时间的影响。

1) 面板logit模型。

面板数据能够跨时间跟踪个体信息,提取使用纯截面或时间序列数据无法获取的信息,提高复杂模型估计精度。面板数据包括两大类:第1类面板数据是指在不同的时间重复相同的调查;第2类面板数据由多日数据组成,即在一段时间内收集同一单位样本的重复测量数据。本研究使用的数据属于第2类,指一位乘客(持卡人)在多次乘坐地铁过程中的选择。

一位乘客在多个场景下的选择会在对其的重复观测中产生个体特定效应。个体偏好对行为选择至关重要[14],PLM[15]可获取不同情景下的个体特定效应,进而表现出不同个体间的异质性。乘客在时刻t发生留乘的效用yit*表示如下:

$ \begin{gathered} y_{i t}^*=\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta}+u_i+\varepsilon_{i t}, \\ i=1, 2, \cdots, n, t=1, 2, \cdots, T . \end{gathered} $ (5)

其中:xitK维与留乘相关的特征变量组成的向量,β为总效用值的K维待估计参数向量,ui为个体特定效应,εit为随机误差。

个体的选择规则为

$ y_{i t}= \begin{cases}1, & y_{i t}^*>0 \\ 0, & y_{i t}^* \leqslant 0\end{cases} $ (6)

其中:yit为乘客的留乘选择,1表示发生留乘,0表示没有发生留乘。

给定xitβui, 则

$ \begin{gathered} P\left(y_{i t}=1 \mid \boldsymbol{x}_{i t}^{\prime}, \boldsymbol{\beta}, u_i\right)=P\left(y_{i t}^*>0 \mid \boldsymbol{x}_{i t}^{\prime}, \boldsymbol{\beta}, u_i\right)= \\ P\left(\boldsymbol{x}_i^{\prime} \boldsymbol{\beta}+u_i+\varepsilon_{i t}>0 \mid \boldsymbol{x}_{i t}^{\prime}, \boldsymbol{\beta}, u_i\right)= \\ P\left(\varepsilon_{i t}>-u_i-\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta} \mid \boldsymbol{x}_{i t}^{\prime}, \boldsymbol{\beta}, u_i\right)= \\ P\left(\varepsilon_{i t}<u_i+\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta} \mid \boldsymbol{x}_{i t}^{\prime}, \boldsymbol{\beta}, u_i\right)= \\ F\left(u_i+\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta}\right) . \end{gathered} $ (7)

其中:P为留乘行为选择概率;F(·)为εit的密度函数,并假设εit的密度函数关于原点对称。若εit服从标准logistics分布,P可表示如下:

$ \begin{gathered} P\left(y_{i t}=1 \mid \boldsymbol{x}_{i t}^{\prime}, \boldsymbol{\beta}, u_i\right)=F\left(u_i+\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta}\right)= \\ \frac{\exp \left(u_i+\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta}\right)}{1+\exp \left(u_i+\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\beta}\right)} . \end{gathered} $ (8)

2) 随机效应回归模型。

不同时间粒度下乘客的留乘时间存在不同的波动,当波动较小时,乘客和运营管理人员对留乘时间不敏感;一旦波动超过一定值,留乘时间就会对乘客的出行体验造成极大影响。乘客的个体偏好会导致留乘时间具有差异性,此外,经Hausman检验[16],时间对个体行为变化的影响也不可忽视。因此,本文利用面板数据随机效应回归模型,分析了各因素对留乘时间的作用机理。随机效应回归模型中,乘客i在时刻t的留乘时间zit表示如下:

$ z_{i t}=\boldsymbol{x}_{i t}^{\prime} \boldsymbol{\gamma}+a_i+\xi_{i t} . $ (9)

其中:γ为留乘时间的K维待估计参数向量;ai为不可观测的个体特定效应,是完全随机的;ξit表示剩余的随机扰动。

2 留乘行为特征分析 2.1 数据来源

本研究使用2019年9月1—30日的深圳市地铁刷卡数据,单日刷卡量超过1×106条。深圳市是公共交通导向型城市,超过40%的出行由地铁承担,尤其是在通勤高峰时段,轨道交通客运量在公共交通客运量中的占比高达56.1%[17]。截至2019年底,全市地铁线路全长315.10 km,共计201个车站(包括换乘站),日均客流量达556.8万人次,约2/3的地铁车站分布于主城区(福田、南山、罗湖3区),客流量较大的车站往往集中分布在城市近郊。选取深圳最先开通的地铁1号线为研究对象,该线路全长41.04 km,共设置30个车站(包括10个换乘车站),东起罗湖站,西至机场东站,跨越福田区和南山区,覆盖区域客流密度大,是东西方向客流运输的主干线[18]

为获取乘客完整的出行信息,基于唯一的地铁集成电路(integrated circuit, IC)卡身份标识(identity document,ID)设计算法,匹配进出站信息,得到每位乘客的起始和目的车站。刷卡数据在进行采集、存储和传输的过程中,受乘客异常行为、闸机故障、数据收集系统异常等影响,会存在缺陷。对于本研究使用的数据而言,缺陷主要是数据集中存在缺失、无用、异常数据,异常数据又包括进出站时间异常、出行时间异常、进出站关系异常。应用大数据处理技术完成原始数据的清洗,获得如表 1所示的预处理后数据,主要包含行程记录的持卡人ID、进出站车站、进出站时间和交易金额。

表 1 预处理后数据
ID 进站时间 进站车站 出站时间 出站车站 交易金额/元
3XXXX0101 2019/9/1 6∶18 侨城东站 2019/9/1 7∶03 罗湖站 5.00
6XXXX7849 2019/9/1 6∶19 竹子林站 2019/9/1 6∶57 华强路站 3.00
6XXXX2144 2019/9/1 6∶19 竹子林站 2019/9/1 6∶49 岗厦站 3.00

2.2 留乘时空分布特征

图 2为深圳地铁1号线一周(2019年9月2—8日)内每日的分时段客流量分布。由图 2可知,工作日客流量分布呈双峰型,高峰时段集中在7 ∶ 00—9 ∶ 00和17 ∶ 00—19 ∶ 00,非工作日的客流量明显减少。深圳地铁1号线一周(2019年9月2—8日)内客流量与留乘率分布如图 3所示,留乘率与客流量呈相同变化趋势,但星期五客流量增加,留乘率并没有明显变化。周末留乘率大幅度降低,星期五与星期六的客流量相近,留乘率却相差了6.0%,说明周末乘客出行时间较为分散,不易发生留乘。

图 2 深圳地铁1号线一周内每日的分时段客流量分布

图 3 深圳地铁1号线一周内客流量与留乘率分布

图 4是2019年9月深圳地铁1号线上行(机场东站—罗湖站)和下行(罗湖站—机场东站)方向各车站的单日留乘率(发生留乘的行程数与总行程数之比)。上行方向客流量分布不均匀,留乘高发车站集中在桃园到机场东段,其中留乘率最高的车站为坪洲站,达55.6%;其次是西乡站,留乘率也超过了50.0%。

图 4 2019年9月深圳地铁1号线上、下行方向各车站单日留乘率

从空间分布看,留乘高发车站固戍、西乡、坪洲500 m范围内都以居住用地为主,人口密度高、出行时间集中,造成高峰时段客流量远超地铁运力。高新园站和深圳大学站周围高新技术产业密集,是许多通勤乘客的目的地,当列车运行至此段时大量乘客下车,缓解了车厢内的拥挤,降低了下游车站的留乘率。下行方向留乘率超过20%的车站有国贸站和深圳大学站。此外,国贸、老街、会展中心、车公庙作为换乘车站,受换乘客流影响的同时,站内复杂的结构也会增加乘客滞留概率。

以小时为划分单位计算留乘率,使用2019年9月共30 d数据得到留乘率时空分布热力图。2019年9月深圳地铁1号线留乘率时空分布热力图(上行)如图 5所示,上行方向中不同车站和时段留乘率差异明显,7 ∶ 00—9 ∶ 00深圳大学站—机场东站留乘最严重,超过50%的乘客在站内发生了一次及以上滞留,其中8 ∶ 00—9 ∶ 00西乡站留乘率高达81.3%;与早高峰时段不同的是,晚高峰时段留乘率没有明显的增长。2019年9月深圳地铁1号线留乘率时空分布热力图(下行)如图 6所示,下行方向18 ∶ 00—20 ∶ 00留乘严重,其中18 ∶ 00—19 ∶ 00车公庙站留乘率最高,达42.1%,高新园站和深圳大学站作为就业岗位分布密集区域,留乘率均超过了30%;车公庙站各时段留乘率均较高,因为该站是国内第2个四线换乘车站,深圳最繁忙的地铁站之一。

图 5 2019年9月深圳地铁1号线留乘率时空分布热力图(上行)

图 6 2019年9月深圳地铁1号线留乘率时空分布热力图(下行)

3 模型结果分析 3.1 影响因素设定

深圳通刷卡数据记录了时间和空间2个维度的信息,可用于分析留乘在特定时刻的状态及变化,也可用于分析特定站点和线路不同时间的留乘状态及变化,因此留乘的影响因素可以分为个体、车站和线路,留乘影响因素如表 2所示。

表 2 留乘影响因素
类别 影响因素 含义
是否留乘 乘客在本次行程中是否发生了滞留,哑元变量(1—是;0—否)
留乘时间 乘客在本次行程中的滞留时间/min
个体 乘坐站点数 乘客乘坐地铁1号线经过的车站数,取值[1, 29]
月乘坐次数 乘客所持IC卡一个月内进入地铁的次数,取值[5, 50]
月留乘次数 乘客所持IC卡一个月内留乘的次数,取值[0, 50]
是否换乘站 乘客进站车站是否为换乘车站,哑元变量(1—是;0—否)
是否起点 乘客进站车站是否为线路起点,哑元变量(1—是;0—否)
是否工作日 乘客乘坐日期是否为工作日,哑元变量(1—是;0—否)
车站 进站客流量 乘客进站车站客流量/(万人次·h-1)
出站客流量 乘客出站车站客流量/(万人次·h-1)
线路 早高峰下行 7∶00—9∶00进站且乘坐方向为罗湖站—机场东站
晚高峰下行 17∶00—19∶00进站且乘坐方向为罗湖站—机场东站
早高峰上行 7∶00—9∶00进站且乘坐方向为机场东站—罗湖站
晚高峰上行 17∶00—19∶00进站且乘坐方向为机场东站—罗湖站

3.2 留乘行为选择

通过对一个月的数据进行处理,共提取687 481位地铁1号线无换乘乘客。地铁乘客包括常乘客(当月乘坐地铁5次及以上的乘客)与随机乘客,本文不仅关注不同因素对留乘影响,也关注乘客间个体差异,选择地铁1号线的常乘客为研究对象,随机抽取1 000名常乘客,构建30 d非平衡面板数据,以是否发生留乘为因变量,使用Stata15.0完成参数估计。留乘行为选择模型估计结果如表 3所示。一般用伪决定系数度量拟合优度,当伪决定系数为0.2~0.4时,即可认为模型具有较高精度。传统多项logit(multi-nominal logit,MNL)模型的伪决定系数为0.160,PLM提升至0.243,表明留乘决策存在明显的个体特定效应。

表 3 留乘行为选择模型估计结果
影响因素 面板logit模型 多项logit模型
估计值 t 估计值 t
乘坐车站数 0.092*** 13.120 0.093*** 25.980
月乘坐次数 -0.013*** -3.770 -0.012*** -6.260
是否换乘站(1—是;0—否) 0.222 0.200 -0.272*** -4.930
是否起点(1—是;0—否) 0.177*** 5.230 0.202** 2.380
进站客流量/(万人次·h-1) 0.248*** 6.570 0.224*** 11.070
出站客流量/(万人次·h-1) 0.312*** 9.580 0.239*** 15.930
是否工作日(1—是;0—否) 0.008 0.150 0.030 0.030
早高峰下行(以平峰时段为基准) 0.006 0.040 0.800 0.800
晚高峰下行(以平峰时段为基准) 0.432*** 3.990 5.400*** 5.400
早高峰上行(以平峰时段为基准) 0.916*** 7.940 11.010*** 11.010
晚高峰上行(以平峰时段为基准) -0.291 -1.920 -2.180** -2.180
截距 -3.133*** -25.750 -38.340*** -38.340
个体效应标准差 0.980
卡方检验的概率值 0.000 0.000
对数似然函数值 -6 451.181 -6 855.821
伪决定系数 0.243 0.160
注: ***表示p < 0.01,**表示p < 0.05,*表示p < 0.10。

从个体层面看,乘客乘坐站点数越多,即出行距离越长时,越易发生留乘,这表明长出行距离的乘客对出行过程的舒适性要求更高,他们更愿意多等一趟列车以换取更大的舒适性。出行频率高的乘客经验丰富,更加熟悉站内设施布局、列车运营时间和不同车厢的拥挤程度,故不易发生留乘。

从车站层面看,换乘站上车对留乘没有显著影响,但起点站上车的乘客留乘概率显著增加,这表明:起点站上车的乘客有更多选择,在发车时间间隔可接受的前提下,愿意牺牲时间获得座位。

从线路层面看,以平峰时段为基准,早高峰上行方向和晚高峰下行方向更易发生留乘。

3.3 留乘时间估计

选取发生留乘的行程,利用随机效应回归模型进行留乘时间估计,同一时间不同个体的差异表现为组间差异,不同时间同一个体的差异表现为组内差异,各拟合指标和参数估计结果如表 4所示。由表可知,乘坐次数多的乘客留乘时间短,此外,乘客每多乘坐一站,乘客在进站车站的平均留乘时间就增加0.01 min。

表 4 留乘时间估计结果
影响因素 估计值 t
乘坐车站数 0.011*** -3.710
月乘坐次数 -0.058*** -7.840
月留乘次数 0.218*** 7.700
是否换乘站(1—是;0—否) 0.103 0.800
是否起点(1—是;0—否) 0.055 0.300
进站客流量/(万人次·h-1) 0.164*** 2.990
出站客流量/(万人次·h-1) 0.104 1.880
是否工作日(1—是;0—否) 0.250*** -4.070
早高峰下行(以平峰时段为基准) -0.373** -1.990
晚高峰下行(以平峰时段为基准) 0.612*** -2.460
早高峰上行(以平峰时段为基准) 0.878*** 6.100
晚高峰上行(以平峰时段为基准) -0.388*** -3.090
截距 -0.729 -1.570
个体效应标准差 1.768
组内拟合度 0.266
组间拟合度 0.203
总体拟合度 0.112
个体效应占比 0.180
卡方检验的概率值 0.001
注: ***表示p < 0.01,**表示p < 0.05,*表示p < 0.10。

进出站站点类型不同,留乘时间也存在明显差异,起始站有充足空间,上车乘客虽有更高的留乘率但并没有更长的留乘时间。进站客流量每增加万人次,留乘时间会增加0.16 min,出站客流量每增加万人次,留乘时间会增加0.11 min。

晚高峰下行方向和早高峰上行方向留乘时间分别增加0.61和0.88 min,但早高峰下行方向和晚高峰上行方向留乘时间显著缩短。乘客对高峰时段的出行体验不仅体现在出行时间上,还体现在对拥挤客流的排斥心理。站内拥挤程度高、出行体验差,容易产生候车时间错误感知,频繁留乘将降低乘客持续乘坐意愿,需引起足够重视。

4 结论

城市轨道交通的低碳运行效率面临乘客精细化引导和管理等挑战,留乘不但会影响乘客的出行时间预估,频繁留乘也将降低乘客持续乘坐意愿,不利于城市公共交通系统低碳可持续发展。研究结果明确了留乘行为产生机理,为生成运营调度方案和发布面向乘客的定制化引导策略提供依据,有利于缓解地铁供需时空分布不均衡,提高轨道交通系统的运行效率。

通过分解乘客出行过程,预测乘客理性最大出行时间,进而实现留乘识别,明确其发生的时间、地点和规模。深圳地铁1号线各站平均留乘率为12.0%,平均留乘时间为4.20 min,但各车站存在明显差异,周边以居住用地为主的车站单日留乘率高达55.6%,工作日高峰时段,最繁忙车站的留乘率超过75.0%,平均留乘时间达18.60 min,给高峰时段出行增加了严重不确定性。

使用一个月乘客数据进行留乘行为分析,发现频繁出行乘客留乘概率较低,这与他们的认知偏差有关。同时,起始站上车、长距离出行的乘客易出现短时留乘。

本研究仅使用了深圳通地铁刷卡数据,今后研究中可以结合手机信令数据、列车运行自动定位等多源大数据,以及乘客个人属性、车站周围建筑与环境等信息,从更多维角度探究留乘行为的产生机理;站台拥堵导致的留乘尚未得到足够重视,今后可精细刻画留乘行为及轨迹,提供更加精细化的大数据处理流程。

参考文献
[1]
WANG J B, YAMAMOTO T, LIU K, et al. Built environment as a precondition for demand-responsive transit (DRT) survival: Evidence from an empirical study[J]. Travel Behavior and Society, 2023, 30: 271-280. DOI:10.1016/j.tbs.2022.10.008
[2]
FURTH P G, HEMILY B J, MULLER T H J, et al. Using archived AVL-APC data to improve transit performance and management[R]. Washington, DC: Transportation Research Board, 2006.
[3]
LI Z, HENSHER D A. Crowding and public transport: A review of willingness to pay evidence and its relevance in project appraisal[J]. Transport Policy, 2011, 18(6): 880-887. DOI:10.1016/j.tranpol.2011.06.003
[4]
SIPETAS C, KEKLIKOGLOU A, GONZALES E J. Estimation of left behind subway passengers through archived data and video image processing[J]. Transportation Research Part C: Emerging Technologies, 2020, 118: 102727. DOI:10.1016/j.trc.2020.102727
[5]
黄洁, 王姣娥, 靳海涛, 等. 北京市地铁客流的时空分布格局及特征: 基于智能交通卡数据[J]. 地理科学进展, 2018, 37(3): 397-406.
HUANG J, WANG J E, JIN H T, et al. Investigating spatiotemporal patterns of passenger flows in the Beijing metro system from smart card data[J]. Progress in Geography, 2018, 37(3): 397-406. (in Chinese)
[6]
LI W J, YAN X D, LI X M, et al. Estimate passengers'walking and waiting time in metro station using smart card data (SCD)[J]. IEEE Access, 2020, 8: 11074-11083. DOI:10.1109/ACCESS.2020.2965155
[7]
MO B C, MA Z L, KOUTSOPOULOS H N, et al. Assignment-based path choice estimation for metro systems using smart card data. [J/OL]. arXiv preprint arXiv. (2020-01-09)[2022-10-15]. https://arxiv.org/abs/2001.03196.
[8]
MILLER E, SÁNCHEZ-MARTÍNEZ G E, NASSIR N. Estimation of passengers left behind by trains in high-frequency transit service operating near capacity[J]. Transportation Research Record: Journal of the Transportation Research Board, 2018, 2672(8): 497-504. DOI:10.1177/0361198118794291
[9]
ZHU Y W, KOUTSOPOULOS H N, WILSON N H M. Inferring left behind passengers in congested metro systems from automated data[J]. Transportation Research Procedia, 2017, 23: 362-379. DOI:10.1016/j.trpro.2017.05.021
[10]
ZHU Y W, KOUTSOPOULOS H N, WILSON N H M. A probabilistic passenger-to-train assignment model based on automated data[J]. Transportation Research Part B: Methodological, 2017, 104: 522-542. DOI:10.1016/j.trb.2017.04.012
[11]
PAUL E C. Estimating train passenger load from automated data systems: Application to London underground[D]. Cambridge: Massachusetts Institute of Technology, 2010.
[12]
田婉琪. 城市轨道交通运力运量综合匹配评估研究[D]. 北京: 北京交通大学, 2018.
TIAN W Q. Research on evaluation of adaptability between transport capacity and passenger flow in urban rail transit[D]. Beijing: Beijing Jiaotong University, 2018. (in Chinese)
[13]
李婉君. 基于地铁刷卡数据的乘客列车分配算法及运营状态特征分析研究[D]. 北京: 北京交通大学, 2020.
LI W J. Research on passenger-to-train assignment algorithm and operation status features analysis using AFC data[D]. Beijing: Beijing Jiaotong University, 2020. (in Chinese)
[14]
ULLAH I, LIU K, YAMAMOTO T, et al. Modeling of machine learning with SHAP approach for electric vehicle charging station choice behavior prediction[J]. Travel Behaviour and Society, 2023, 31: 78-92. DOI:10.1016/j.tbs.2022.11.006
[15]
BLIEMER M C J, ROSE J M. Construction of experimental designs for mixed logit models allowing for correlation across choice observations[J]. Transportation Research Part B: Methodological, 2010, 44(6): 720-734. DOI:10.1016/j.trb.2009.12.004
[16]
AMINI S, DELGADO M S, HENDERSON D J, et al. Fixed VS Random: The hausman test four decades later[M]//BALTAGI B H, CARTER HILL R, NEWEY W K, et al. Essays in Honor of Jerry Hausman. Bingley: Emerald Group Publishing Limited, 2012: 479-513.
[17]
李博闻, 黄正东, 蒯希, 等. 基于空间公平理论的公共交通服务评价: 以深圳市为例[J]. 地理科学进展, 2021, 40(6): 958-966.
LI B W, HUANG Z D, KUAI X, et al. Evaluation of public transport services based on the spatial equality theory: A case study of Shenzhen City[J]. Progress in Geography, 2021, 40(6): 958-966. (in Chinese)
[18]
YANG J W, CHEN J X, LE X H, et al. Density-oriented versus development-oriented transit investment: Decoding metro station location selection in Shenzhen[J]. Transport Policy, 2016, 51: 93-102. DOI:10.1016/j.tranpol.2016.04.004