基于多尺度地理加权回归模型的城市道路骑行流量分析

引用本文

黄颙昊, 杨新苗, 岳锦涛. 基于多尺度地理加权回归模型的城市道路骑行流量分析[J]. 清华大学学报(自然科学版), 2022, 62(7): 1132-1141.

HUANG Yonghao, YANG Xinmiao, YUE Jintao. Urban street bicycle flow analysis based on multi-scale geographically weighted regression model[J]. Journal of Tsinghua University (Science and Technology), 2022, 62(7): 1132-1141.

基于多尺度地理加权回归模型的城市道路骑行流量分析

黄颙昊¹, 杨新苗¹, 岳锦涛²

1. 清华大学土木工程系, 北京 100084;
2. 中国城市建设研究院有限公司, 北京 100120

收稿日期：2021-10-29

作者简介：黄颙昊(1997—), 男, 硕士研究生

通讯作者：杨新苗, 副研究员, E-mail：xmyang@tsinghua.edu.cn

摘要：居民对城市慢行交通的服务品质需求不断提高, 然而传统的慢行系统研究多关注大尺度和既有道路, 无法充分满足城市街区慢行系统发展需求。以此为背景, 该文提出了基于空间设计网络分析(spatial design network analysis, sDNA)的多尺度地理加权回归模型(multi-scale geographically weighted regression, MGWR), 考虑土地开发利用情况、道路路网结构和周边公共交通状况对路段自行车流量的影响, 对城市道路骑行流量进行分析。通过对京张铁路沿线区域内共享单车出行数据分析, 结果表明：该模型相较于经典地理加权回归模型和多元线性回归模型, 有更好的回归效果, 拟合优度R²分别提高0.087和0.113。最后, 借助该模型数据分析影响骑行流量的主要因素及其作用尺度范围, 拓展了基于定量分析方法的慢行交通规划维度。

关键词：交通规划慢行交通空间句法多尺度地理加权回归交通流量预测

Urban street bicycle flow analysis based on multi-scale geographically weighted regression model

HUANG Yonghao¹, YANG Xinmiao¹, YUE Jintao²

1. Department of Civil Engineering, Tsinghua University, Beijing 100084, China;
2. China Urban Construction Design & Research Institute Co., Ltd., Beijing 100120, China

Abstract: Residents are demanding better conditions for urban non-motorized traffic. However, the classical forecasting model for non-motorized traffic has mainly focused on large city areas and existing roads, which cannot fully meet planning demands for the construction or extension of urban bicycle paths. This study used an improved multi-scale geographically weighted regression (MGWR) model to predict the flow of non-motorized traffic. The MGWR model includes the influence of land development and utilization, road network structure, and the nearby public transport on the bicycle flows. The area along the Beijing to Zhangjiakou Railway was used as an example for a case study using bike sharing data in this region. The results show that the MGWR model has better predictive ability with the geographically weighted regression model R² increased by 0.087 and the multiple linear regression with R² increased by 0.113. Finally, this paper gives an approach for non-motorized traffic planning and management based on key factors affecting non-motorized traffic with appropriate ranges of the independent variables.

Key words: transportation planning non-motorized traffic space syntax multi-scale geographically weighted regression traffic flow predictions

进入21世纪以来，我国城镇化率持续提高，城镇规模和面积不断扩大，地区经济和社会得到飞速发展。然而，随着城市人口的增加和资源的消耗，多种城市问题逐渐出现。2020年全国机动车保有量已达3.72亿辆。城市机动车数量的增加，使得高峰期交通拥堵、环境污染和夜间停车空间不足等问题更加突出，也极大地限制了城市未来的可持续发展。

一般认为，5 km以下是慢行交通(非机动化交通)的优势出行距离，《2020年度全国主要城市通勤检测报告》^[1]所选取的36个城市中，路网通勤距离5 km以内的平均占比为54.5%，自行车在城市中作为通勤工具的发展潜力巨大。此外，在应对气候变化和实现2060年“碳中和”目标的大背景下，推进以自行车骑行为代表的绿色出行方式，成为解决城市交通、环境、能源等问题的关键。

我国部分城市在早期快速发展阶段，为了满足机动车出行需求，交通设计人员压缩了非机动车和行人出行空间，导致现在慢行交通出行服务水平受到很大影响^[2]。快速路、铁路线对城市的分割造成慢行交通系统通行不畅，使得原有路网设计不足以满足日益增长的绿色出行需求。近年来，我国城市规划设计工作已从增量扩张转向存量优化，以前慢行交通系统规划中的问题逐渐得到重视。在交通治理过程中，一些慢行交通系统逐渐得到恢复或者改造。2021年，北京市对二环路进行了改造, 其中林荫骑行环线建设优先关注和保障骑行路权，自行车优先的标识让骑行者在车流量大的道路上更能放心地骑车。需要强调的是，分析预测路段自行车流量并优先改造具有高通行量的重点道路是城市更新研究的重要内容。

目前骑行流量方面的研究大多围绕骑行影响因素分析和出行量预测展开。影响因素分析方面，主要的研究对象包括人口特征、土地利用特征、道路基础设施水平、公共交通服务水平、出行时间、天气、坡度等^[3-5]。分析模型的使用较为多样，比如：林堉楠等^[6]以接驳出行为主要对象，建立空间滞后模型，探讨轨道交通站点周边建成环境与接驳骑行量的关系。Chen等^[7]建立广义线性混合模型，分析出行者特征、出行时间、坡度、土地混合程度、自行车保有量和基础设施水平对道路交叉口自行车流量的影响。Shen等^[8]借助新加坡共享单车定位数据建立空间误差模型，分析共享单车数量、建筑环境、天气对自行车使用的影响。Yang等^[9]建立半参数地理加权回归模型，将全局变量和局部变量同时引入回归模型，对公共自行车系统流量进行分析。

在骑行流量预测方面，现有研究大体可分为改进传统方法的预测模型和基于机器学习算法的预测模型。传统方法以回归分析^[10]和行为选择模型^[4]为主，同时也有学者针对自行车特有的出行特点，从规划层面提出一种改进四阶段法预测城市路网的自行车流量^[11]。机器学习方法的研究近年来出现的越来越多^[12-13]。Gao等^[14]提出一种基于模糊C均值聚类的遗传算法，将数据分组并输入反向传播网络预测器进行训练，实现对公共自行车站点未来需求交通量进行预测。王凌苏^[15]利用共享单车数据建立考虑长短期记忆的图卷积神经网络，对地图划分的网格区域内共享单车短时交通量进行预测，并能很好地捕捉站点空间相关性和时间动态性。

综上所述，既有的研究更多关注于站点或面域的流量变化，或是基于现有路网在城市尺度的分析，而对于路段流量或街区尺度新建慢行系统的评价研究相对较少。本文对新建慢行系统需要关注的骑行流量进行分析，提出一种基于空间设计网络分析的地理加权回归改进方法，并选取案例对象进行验证分析。该方法的实现方式是，利用共享单车数据，以北京市海淀区京张铁路沿线区域为例，借助地理信息系统(geographic information system, GIS)、空间设计网络分析(sDNA)和多尺度地理加权回归(MGWR)等方法，建立街区层面路段自行车流量分析模型，对比模型的输出结果，分析影响骑行流量的主要因素。

1 研究方法与模型构建 1.1 空间设计网络分析模型

空间网络分析模型可以结合GIS平台完成城市规划、交通规划领域的空间网络分析^[16]。sDNA与传统空间句法(space syntax)类似，两者均以数学领域的图论为基础，从几何构造和相关关系角度分析事物间的相互作用。目前已有部分学者将空间句法的理论和方法运用于交通领域的网络分析^[17-19]。在传统空间句法中，通常围绕轴线图或线段图进行分析。路网建模方法见图 1。在图 1a中，每一条不转向的道路构成一条轴线，数字表示对应轴线；在图 1b中，转角和道路交叉口将路网分为不同线段，数字代表不同线段编号；在图 1c中，路网被交叉口划分为不同路段，2个路口间的道路被视为同一路段。sDNA模型使用路段作为分析对象，与传统空间句法相比，取代了原有的轴线或线段分析模式，更加符合出行者的择路决策习惯^[20]。sDNA模型输出变量主要包括2个指标：接近度(closeness)和选择度(betweenness)。

图 1 3种路网建模方法图示

图选项

1) 接近度。

sDNA模型中的接近度指标与交通可达性(accessibility)相似，用于衡量给定半径内其他路段的接近难易程度。接近度是用路段权重与相邻路段距离之比的期望值来衡量的，即考虑距离作为惩罚因素的网络平均权重(network quantity penalized by distance，NQPD)，表示如下^[21]：

${\mathop{\rm NQPD}\nolimits} (x) = {\mathit{\Sigma }_{y \in {R_x}}}\frac{{W(y)P(y)}}{{d(x,y)}}.$

(1)

式中：x为待计算的路段；R_x为从路段x出发，在给定半径R内可达的其他路段集合；W(y)为路段y的权重，可表示路段长度或兴趣点数量等；d(x, y)为路段x和y之间的距离，包括Euclid距离或角度距离等；P(y)表示路段y在R_x中的比例。离散空间中，P(y)=1, y∈R_x; P(y)=0, y∉R_x；连续空间中，P(y)为路段y在半径R内部分的长度占比。

2) 选择度。

选择度指标用于衡量一定计算半径内的不同路段之间，在最短出行时选择某一路段的可能性大小。最短出行路径的计算通常采用物理距离或角度距离等度量方式。选择度表示如下^[21]：

$\begin{array}{c} {\mathop{\rm TPBt}\nolimits} (x) = \\ {\mathit{\Sigma }_{y \in N}}{\mathit{\Sigma }_{z \in {R_y}}}{\rm{OD}}(x,y,z)\frac{{W(z)P(z)}}{{{\mathop{\rm total}\nolimits} \;{\rm{ weight }}(y)}}; \end{array}$

(2)

${\rm{OD}}(x,y,z) = \left\{ {\begin{array}{*{20}{l}} {1,}&{x{\rm{在从}}y{\rm{到}}z{\rm{的最短路上; }}}\\ {1/2,}&{x = y \ne z;}\\ {1/2,}&{x = z \ne y;}\\ {1/3,}&{x = y = z;}\\ {0,}&{{\rm{ 其他}}{\rm{. }}} \end{array}} \right.$

(3)

式中：N为研究区域内的全部路段集合；R_y为从路段y出发，在给定半径R内可达的其他路段集合；W(z)为路段z权重；P(z)表示路段z在R_y中的比例；total weight(y)表示从路段y出发在给定半径R内的所有路段总权重；OD(x, y, z)为不同条件下最短路经的赋值规则。

1.2 地理加权回归及其改进模型 1.2.1 经典地理加权回归模型

城市的经济和社会活动通常具有空间异质性，使得城市各个区域间的发展存在细微的变化。地理加权回归(geographically weighted regression, GWR)模型是基于线性回归模型进行改进的模型，添加了反映地理位置差异的参数，在局部范围内对变量进行差异化回归。GWR模型表示如下^[22]：

${Y_i} = {\beta _{i0}} + {\mathit{\Sigma }_k}{\beta _{ik}}{X_{ik}} + {\varepsilon _i},\quad i = 1,2, \cdots ,n.$

(4)

式中：β_ik为样本点i的响应关于第k自变量的回归系数，ε_i为随机误差项，k为自变量参数下标，n为待计算样本量。

若回归系数β的取值不随样本点i的变化而变化，则地理加权回归等同于线性回归。地理加权回归模型的回归系数可以通过引入权重矩阵W_i，采用最小二乘法计算，表示如下：

${\beta _i} = {\left[ {{\mathit{\boldsymbol{X}}^{\rm{T}}}{\mathit{\boldsymbol{W}}_i}\mathit{\boldsymbol{X}}} \right]^{ - 1}}{\mathit{\boldsymbol{X}}^{\rm{T}}}{\mathit{\boldsymbol{W}}_i}\mathit{\boldsymbol{Y}}.$

(5)

式中：β_i为样本点i回归系数估计值，X为输入的自变量观测矩阵，Y为因变量的观测向量，W_i是由权重w_ij组成的空间权重对角矩阵。W_i表示如下：

${\mathit{\boldsymbol{W}}_i} = \left( {\begin{array}{*{20}{c}} {{w_{i1}}}&0& \cdots &0\\ 0&{{w_{i2}}}& \cdots &0\\ \vdots & \vdots &{}& \vdots \\ 0&0& \cdots &{{w_{in}}} \end{array}} \right).$

(6)

式中：w_ij, j=1, 2, …，n为样本点j相对于样本点i的权重取值。

1) 空间权重函数选择。

一般认为，当地理空间样本点之间的距离足够远时，相互之间的影响会变得很小。为了加快回归系数计算的速度，在计算权重矩阵时可以把距离超过设定值的点排除在外。常用的权重函数是bi-square函数，表示如下：

${w_{ij}} = \left\{ {\begin{array}{*{20}{c}} {{{\left( {1 - {{\left( {\frac{{{d_{ij}}}}{b}} \right)}^2}} \right)}^2},}&{{d_{ij}}\leqslant b;}\\ {0,}&{{d_{ij}} > b.} \end{array}} \right.$

(7)

式中：d_ij为样本点i和j之间的距离，b为计算时选择的带宽。带宽通常分为固定带宽和可变带宽。对于样本数据分布较为均匀的区域，常选择固定带宽，而样本分布不均匀时，采用可变带宽。

2) 确定最优带宽和模型优化。

式(7)中，带宽b的取值将决定不同样本点之间的权重大小，会直接影响到模型的运行效果。常见的带宽优化准则有AIC(Akaike information criterion)准则、Bayes信息准则和交叉验证方法^[23]。AIC准则应用比较广泛，通过对样本数据的不断迭代，得到使AIC值最小的地理加权回归权重函数对应的带宽，即为最优带宽。除此之外，AIC准则也是一种常用的检验GWR模型显著性的方法。一般认为，对于包含相同自变量的模型，AIC值越小表示模型的拟合效果越好。

1.2.2 多尺度地理加权回归模型

多尺度地理加权回归(MGWR)模型是在经典地理加权回归(GWR)模型的基础上，改进了带宽选择的缺陷，使得不同变量可以选择不同的带宽取值，更好地体现变量间的空间异质性特点，并提高回归分析的准确性，表示如下^[24]：

${Y_i} = {\beta _{i0,b}} + {\mathit{\Sigma }_k}{\beta _{ik,b}}{X_{ik}} + {\varepsilon _i},\quad i = 1,2, \cdots ,n.$

(8)

式中β_{ik, b}表示在b带宽条件下第k个变量的回归系数。

与GWR模型相比，MGWR模型参数的求解通常采用反向拟合算法(back-fitting algorithm)^[24]。

首先，利用GWR模型进行参数初始化，得到初始回归系数。其次，令f_k表示第k个变量回归值(f_k=β_{k, b}X_k)，并计算初始化残差ε=y-Σ_kf_k。然后，从第1个自变量开始，将该残差与第1个变量回归值相加，并将求和结果ε+f₁作为响应变量，与自变量X₁进行地理加权回归计算，得到第1个自变量的最优带宽和新的估计参数；随后，更新MGWR模型中对应的估计参数、计算新的残差，将新的残差加上第2个自变量回归值f₂，并重复之前的步骤，直到计算出所有自变量的最优带宽和回归系数估计值。最后，在完成每一循环计算后，判断是否满足收敛条件：若满足收敛条件，则跳出循环，迭代过程终止；否则，则从第1个自变量开始，继续迭代，改进回归系数估计值。

常用的收敛准则为计算残差平方和(residual sum of squares，RSS)的变化率(score of change，SOC)，表示如下：

${\rm{SO}}{{\rm{C}}_{{\rm{RSS}}}} = \frac{{\left| {{\rm{RS}}{{\rm{S}}_{{\rm{new }}}} - {\rm{RS}}{{\rm{S}}_{{\rm{old }}}}} \right|}}{{{\rm{RS}}{{\rm{S}}_{{\rm{new }}}}}}.$

(9)

式中：RSS_old表示上一循环的残差平方和，RSS_new表示本循环的残差平方和。当SOC_RSS小于某个给定的控制参数时，算法判定迭代过程满足收敛条件，否则，视为不满足收敛条件。本研究选择的SOC_RSS阈值为10^-5。

2 研究区域与数据准备 2.1 研究目的与区域界定

京张铁路建成于1909年，是中国人自主设计修建的第一条铁路，为满足2022年北京—张家口冬奥会的出行需要，京张高速铁路于2016年4月开工，2019年12月修建完成，城区线路转入地下运行，区域内原京张铁路地面部分被同期拆除，形成北起清河，南至西直门长度约7 km的狭长廊道。

目前北京自行车专用路南展工程已逐步启动方案设计工作，未来将利用这部分铁路空间构建连通西直门和清河的自行车廊道，形成一条完整的慢行通道。由于整个废弃铁路空间暂无道路，相对整个城市覆盖范围较小，沿线可获取出行数据较少，使得传统交通规划中的四阶段法难以充分满足街区层面交通分析或预测需要。已有研究对于此类新建道路项目的自行车流量预测与影响因素研究存在部分局限，难以解决现有问题。本文尝试一种新方法，基于已有数据，建立路段共享单车流量回归分析模型，为开展慢行廊道规划和建设工作提供理论和技术支撑。

根据自行车出行的特点，综合考虑北京市路网结构，选择铁路沿线5 km以内区域进行研究，并以高速公路或城市干路作为区域边界，如图 2所示。研究区域覆盖清华大学、北京大学、北京交通大学等的10余所高等院校，中国科学院、农业科学院等国家级科研机构，步行和自行车出行潜力较大。

图 2 研究区域概况

图选项

2.2 数据采集和预处理

本文使用的自行车流量评价数据，是基于摩拜单车2017年10月1日至31日的实际订单数据生成的。在进行同时期路网的起讫点坐标匹配后，考虑实际路网的通行方向，依据Dijkstra算法求得理想条件下的出行最短路，根据路段进行统计，得出路段流量评价数据。

骑行路网数据来源于OpenStreetMap历史数据库，借助QGIS软件依据属性值提取可以通行自行车的路段^[25]，并进行人工校准和修改，删除不符合要求的道路。地理对象的研究借助兴趣点(point of interest，POI)数据进行分析，采用Python编写网络爬虫的方法从高德地图开放平台获取数据，并导入地理信息系统进行分类整理。

2.3 变量选择

结合已有文献中关于自行车流量影响因素的研究，同时综合考虑研究区域自行车出行的特征和经济、社会、人文、教育等实际情况，以及数据的获取难易程度，本文从以下3类中分别选取对应的变量进行分析筛选。

1) 土地利用和开发。

交通的派生性特性显著，交通出行需求常伴随其他活动产生。兴趣点的类型、数量和多样性在一定程度上能够反映土地利用和开发强度。考虑到道路宽度和覆盖面影响，研究时采用道路中线50 m范围内的兴趣点进行统计。

2) 道路路网结构。

城市路网作为交通载体，道路设施等级、路网密度、路段在区域路网中的结构都会对自行车交通的流量产生影响。本研究主要采用sDNA模型中不同半径的接近度和选择度表示路段在路网中的关系。为保证sDNA模型能够相对准确地反映实际情况，路段两侧兴趣点数量将作为权重，参与计算。

3) 公共交通服务水平。

考虑到共享单车作为接驳工具的出行需求，其他交通设施的分布会对自行车出行交通量产生间接影响。模型选择公共汽车站点、地铁站点的分布和距离，作为衡量公共交通服务水平的变量。

基于以上准则，选取影响自行车流量的控制性变量。表 1列出了主要待选变量及其描述和统计信息，其中接近度和选择度变量仅代表半径选择的2种特殊情景，实际计算中以500 m为间隔，对0.5~6 km范围内的接近度和选择度进行分析。对所有待选变量进行相关性分析，计算得到的Pearson相关系数如表 2所示。通过相关系数可初步确定住宅、公司、餐饮、公交站点的数量、接近度与选择度以及最近地铁站距离，都会对自行车流量产生显著影响。此外，这些变量之间不存在明显的多重共线性问题，能够保障自变量的有效性，可以作为备选变量进一步分析。

表 1 自变量与描述

共享单车流量影响因素	变量	变量缩写	描述	最小值	最大值	平均值
土地利用和开发	住宅数量	RN	道路两侧50 m范围内的兴趣点数量	0	12	1.43
	体育设施数量	SPN		0	8	0.97
	公司数量	CN		0	17	3.44
	公园数量	PN		0	6	0.4
	商业数量	BN		0	163	12.5
	娱乐设施数量	AMN		0	15	1.31
	科研设施数量	SCN		0	24	3.16
	餐饮数量	REN		0	76	10
道路路网结构	接近度(3.5 km)	NQPD3500	不同半径条件下的接近度和选择度	1.145	15.040	7.370
	选择度(3.5 km)	TPBt3500		7.169	1 100.571	215.581
	接近度(5 km)	NQPD5000		2.634	18.167	10.119
	选择度(5 km)	TPBt5000		10.133	1 285.598	321.452
公共交通服务水平	公交站点	BUS	路段公交站点数量	0	6	1.41
公共交通服务水平	地铁站距离	SUB	路段到达最近地铁站距离	43	2 479	756.81

表选项

表 2 自变量与因变量的Pearson相关系数

	RN	SPN	CN	PN	BN	AMN	SCN	REN	NQPD3500	TPBt3500	NQPD5000	TPBt5000	BUS	SUB
BV	0.26	0.19	0.37	-0.03	0.38	0.19	0.34	0.51	0.33	0.56	0.42	0.57	0.36	-0.27
RN		0.19	0.09	-0.04	0.09	0.03	0.15	0.14	-0.03	-0.01	0.08	0.00	0.10	0.17
SPN			0.44	0.01	0.22	0.38	0.31	0.43	0.21	0.09	0.26	0.08	0.07	0.07
CN				-0.09	0.26	0.27	0.53	0.31	0.40	0.30	0.46	0.26	0.32	-0.05
PN					0.03	0.04	0.08	0.03	-0.06	-0.08	-0.08	-0.10	0.05	0.00
BN						0.45	0.24	0.55	0.37	0.40	0.40	0.31	0.25	-0.13
AMN							0.26	0.55	0.22	0.24	0.23	0.16	0.16	-0.08
SCN								0.33	0.22	0.31	0.24	0.28	0.25	-0.02
REN									0.30	0.34	0.35	0.30	0.20	-0.15
NQPD3500										0.57	0.96	0.47	0	-0.44
TPBt3500											0.56	0.93	0.15	-0.32
NQPD5000												0.49	0.07	-0.41
TPBt5000													0.18	-0.27
BUS														0.06
注：BV为共享单车流量(因变量)。

表选项

3 模型结果对比与分析 3.1 模型回归结果分析

本文对研究区域内189条路段的共享单车流量进行统计。为减少误差，选择2017年10月19日—25日内各路段共享单车日流量平均值作为计算数据，分别建立多元线性回归模型、经典地理加权回归模型和多尺度地理加权回归模型，并进行模型间对比、分析影响自行车骑行流量因素。选择回归变量时，采用SPSS软件中，逐步向多元线性回归模型添加变量的方法。根据方差分析(ANOVA)中F值对应的概率p值，是否小于显著性水平α=0.05，作为添加新变量的参考依据。最终选取的变量为：住宅、公司、娱乐设施、餐饮、公交站点的数量、3 500 m半径的接近度、5 000 m半径的选择度和到达最近地铁站的距离共8个变量。多元线性回归和地理加权回归模型系数的计算，采用亚利桑那州立大学(Arizona State University)开发的MGWR2.2软件实现。计算中各变量进行了标准化处理，回归系数如表 3—5所示，3种模型回归效果对比如表 6所示。

表 3 多元线性回归系数

变量	回归系数	标准误差	p值
常数	0.000	0.048	1.00
住宅数量	0.218	0.05	0.00
公司数量	0.132	0.058	0.02
娱乐设施数量	-0.152	0.058	0.01
餐饮数量	0.36	0.062	0.00
NQPD3500	-0.053	0.064	0.41
TPBt5000	0.39	0.057	0.00
公交站点数量	0.185	0.053	0.00
地铁站距离	-0.187	0.055	0.00

表选项

表 4 经典地理加权回归(GWR)系数

变量	平均值	标准差	最小值	中位数	最大值
常数	-0.046	0.074	-0.183	-0.056	0.083
住宅数量	0.204	0.049	0.112	0.214	0.303
公司数量	0.120	0.075	0.016	0.101	0.308
娱乐设施数量	-0.181	0.03	-0.219	-0.193	-0.098
餐饮数量	0.370	0.64	0.279	0.385	0.476
NQPD3500	0.020	0.164	-0.144	-0.082	0.410
TPBt5000	0.368	0.086	0.230	0.376	0.529
公交站点数量	0.141	0.083	-0.001	0.141	0.281
地铁站距离	-0.252	0.073	-0.452	-0.260	-0.105

表选项

表 5 多尺度地理加权回归(MGWR)系数

变量	平均值	标准差	最小值	中位数	最大值
常数	-0.041	0.032	-0.086	-0.038	0.003
住宅数量	0.214	0.087	-0.061	0.216	0.554
公司数量	0.113	0.072	0.002	0.096	0.287
娱乐设施数量	-0.156	0.015	-0.176	-0.16	-0.125
餐饮数量	0.353	0.049	0.277	0.357	0.427
NQPD3500	0.126	0.331	-0.263	-0.033	1.109
TPBt5000	0.38	0.053	0.283	0.378	0.482
公交站点数量	0.135	0.069	0.009	0.133	0.236
地铁站距离	-0.222	0.028	-0.266	-0.22	-0.168

表选项

表 6 多元线性回归、GWR、MGWR模型对比

评价指标	多元线性回归	GWR	MGWR
拟合优度R²	0.582	0.669	0.695
残差平方和	78.939	62.51	57.716
AICc	392.583	383.977	377.557

表选项

在回归分析的结果中，拟合优度R²值越高、AICc、残差平方和越小，表示模型的拟合效果越好、精度越高^[26]。从表 6中的结果可以看出，GWR和MGWR模型中的拟合优度R²均高于多元线性回归模型中的拟合优度，分别提高了0.087和0.113；AIC值也显著低于线性回归模型。可以认为MGWR模型优于经典GWR模型和多元线性回归模型。此外，MGWR的残差平方和较小，说明其预测值更接近真实值。因此，基于本研究数据分析得到的结果，MGWR模型相较于GWR模型和多元线性回归模型具有较高的准确性，同时可用于自行车流量预测研究。根据模型得到的共享单车流量预测值如图 3所示。

图 3 研究区域共享单车每天流量预测结果

图选项

3.2 路段共享单车骑行流量影响因素分析

由表 7中经典地理加权回归模型和多尺度地理加权回归模型带宽的对比可知，MGWR模型可以反映不同变量作用尺度大小的差异性，而经典GWR模型仅能反映影响范围的平均值。从结果可以看出，住宅数量和接近度指标的作用尺度很小，说明这2个指标对自行车流量的影响在空间上差异较大；娱乐设施数量和路段到地铁站距离2个变量的作用尺度很大，对流量大小的影响相对平稳；其他指标的作用尺度中等，说明存在一定的空间异质性。

表 7 GWR模型与MGWR模型带宽对比

变量	MGWR带宽	GWR带宽
住宅数量	77	146
公司数量	126	146
娱乐设施数量	188	146
餐饮数量	154	146
NQPD3500	71	146
TPBt5000	133	146
公交站点数量	143	146
地铁站距离	186	146

表选项

图 4和表 5展示了自变量回归系数的统计描述及其在空间中的分布情况，以下将从3个方面对其进行分析。

图 4 MGWR模型回归系数空间分布

图选项

1) 土地利用和开发方面。

住宅数量对共享单车流量的影响表现出极强的空间异质性，住宅数量回归系数中位数0.216，整体呈正相关关系。影响程度较高的区域主要集中在中关村、五道口和西直门3个商业圈周边，回归系数在0.24左右，说明这些区域的社区距离商业中心较近，自行车更能满足日常出行需求。路段流量与公司数量间的回归系数保持在0.002~0.287之间。大钟寺、魏公村地铁站周边商务区分布密集，且距离地铁站较远，共享单车的接驳需求明显。五道口和中关村虽然也存在密集的商务区，但是由于周边轨道交通完善，步行即可以到达，相关关系并不强。娱乐设施数量的空间异质性不明显，模型回归系数分布在-0.176~-0.125，且随地理空间变化范围较小。娱乐设施主要包含网吧、酒吧等兴趣点，一方面顾客使用共享单车出行意愿不强，另一方面这些兴趣点的分布常远离主要路段，因此回归系数取值为负数。餐饮数量对共享单车骑行流量的影响高度相关，回归系数为正值并保持在0.277~0.427，在研究区域内呈现西北高、东南低的分布特点。五道口、中关村区域的回归系数取值较大，说明餐饮的分布通常与共享单车出行热点区域相重合。

2) 道路路网结构方面。

3 500 m半径的接近度指标对共享单车流量影响具有显著的空间异质性，研究区域内回归系数取值在-0.263~1.109。接近度体现的是一条路段到达半径内其他路段潜力大小，因此，既可以代表周边兴趣点对该道路的流量吸引能力，又可以表示从该路段出发到达目的地的难易程度。北太平庄社区及周边由于古城墙的阻隔，跨区交通阻抗大，社区内交通出行多，相关关系较强。5 000 m半径的选择度的回归系数为0.283~0.482，表现出较强的正向相关关系。选择度指标能够体现特定路段在实际出行中被选择的潜力，选择度的半径与骑行出行距离分布相吻合，符合自行车的出行特点。研究区域北部由于五环路、京张高速铁路的存在，选择度对骑行流量的影响尤为突出，从侧面反映该区域城市干路对慢行交通的阻碍，需要强化慢行设施建设。

3) 公共交通服务方面。

公交站点数量与共享单车流量正相关，回归系数取值0.009~0.236，且距离市中心越近或公共交通越发达的区域，系数取值越大。到最近地铁站的距离与流量呈现负相关，距离地铁站较近的路段，每日共享单车交通量更多。到最近地铁站距离这一变量带宽较宽，相关性不随空间改变而剧烈变化，这一结果也充分证明共享单车作为接驳工具发挥的作用。

4 结论

本文以北京市共享单车真实数据为基础，借助地理信息系统(GIS)，构建一种基于多尺度地理加权回归(MGWR)和空间设计网络分析方法(sDNA)的共享单车路段流量分析模型。模型包含了接近度和选择度指标作为变量，描述路网结构对骑行流量的影响，并通过真实数据验证其准确性。

沿线住宅、公司、餐饮、公交站点数量、以及该路段的选择度，与路段共享单车流量呈现正相关关系；娱乐设施数量、路段到地铁站的距离，与流量呈负相关关系；而路段的接近度变量，在城市不同区域，影响效果有所差异。模型带宽分析方面：住宅数量和路段接近度的作用带宽较窄，变量空间异质性突出；公司、餐饮、公交站点数量、以及选择度的带宽中等，地理位置对回归系数有一定影响；娱乐设施数量和路段到地铁站距离的带宽较宽，空间异质性相对较弱。

从回归结果来看，MGWR模型相较于GWR模型有更高的拟合优度，同时能够反映不同预测变量的影响尺度。目前将空间设计网络分析方法应用于慢行交通领域的研究相对较少；除此之外，由于多尺度地理加权回归模型计算软件开发尚不完全，以及存在数据限制，暂时未能对预测真实自行车流量进行完整分析，未来可围绕流量预测进一步开展研究。在本文提出模型的基础上，可尝试结合实地调查获得的共享单车分担率，实现对路段自行车流量预测评估，为新建、改建慢行交通网络的可行性分析和交通规划提供新的视角和理论支持。

参考文献

[1]	中国城市规划设计研究院. 2020年度全国主要城市通勤监测报告[R/OL]. [2022-04-18]. http://www.chinautc.com/20200520.pdf. China Academy of Urban Planning and Design. 2020 annual report on major cities' daily commute monitoring in China[R/OL]. [2022-04-18]. http://www.chinautc.com/20200520.pdf. (in Chinese)
[2]	姜超. 基于人本化分析的北京慢行空间研究[D]. 北京: 北京工业大学, 2016. JIANG C. The research on pedestrian and bicycle space design in Beijing based on people-oriented analysis[D]. Beijing: Beijing University of Technology, 2016. (in Chinese)
[3]	LIN Z J, FAN W. Modeling bicycle volume using crowdsourced data from Strava smartphone application[J]. International Journal of Transportation Science and Technology, 2020, 9(4): 334-343. DOI:10.1016/j.ijtst.2020.03.003
[4]	ZIMMERMANN M, MAI T, FREJINGER E. Bike route choice modeling using GPS data without choice sets of paths[J]. Transportation Research Part C: Emerging Technologies, 2017, 75: 183-196. DOI:10.1016/j.trc.2016.12.009
[5]	PAZDAN S. The impact of weather on bicycle risk exposure[J]. Archives of Transport, 2020, 56(4): 89-105. DOI:10.5604/01.3001.0014.5629
[6]	林堉楠, 徐媛, 杨家文. 轨道交通车站周边建成环境对骑行的影响: 基于深圳市ofo数据的实证研究[J]. 城市交通, 2020, 18(1): 83-94, 58. LIN Y N, XU Y, YANG J W. Built environment on linking bicycle to rail transit: Case study based on ofo data in Shenzhen[J]. Urban Transport of China, 2020, 18(1): 83-94, 58. (in Chinese)
[7]	CHEN P, ZHOU J P, SUN F Y. Built environment determinants of bicycle volume: A longitudinal analysis[J]. Journal of Transport and Land Use, 2017, 10(1): 655-674.
[8]	SHEN Y, ZHANG X H, ZHAO J H. Understanding the usage of dockless bike sharing in Singapore[J]. International Journal of Sustainable Transportation, 2018, 12(9): 686-700. DOI:10.1080/15568318.2018.1429696
[9]	YANG H T, ZHANG Y B, ZHONG L Z, et al. Exploring spatial variation of bike sharing trip production and attraction: A study based on Chicago's Divvy system[J]. Applied Geography, 2020, 115: 102130. DOI:10.1016/j.apgeog.2019.102130
[10]	YANG F, DING F, QU X, et al. Estimating urban shared-bike trips with location-based social networking data[J]. Sustainability, 2019, 11(11): 3220. DOI:10.3390/su11113220
[11]	胡元. 城市道路慢行交通需求预测研究[D]. 成都: 西南交通大学, 2019. HU Y. Research on the non-motorized traffic demand forecasting of the urban road[D]. Chengdu: Southwest Jiaotong University, 2019. (in Chinese)
[12]	许淼, 刘宏飞, 初凯. 基于AM-LSTM模型的共享单车时空需求预测[J]. 湖南大学学报(自然科学版), 2020, 47(12): 77-85. XU M, LIU H F, CHU K. Spatiotemporal demand prediction of bike-sharing based on AM-LSTM model[J]. Journal of Hunan University (Natural Sciences), 2020, 47(12): 77-85. (in Chinese)
[13]	YANG Z D, HU J, SHU Y C, et al. Mobility modeling and prediction in bike-sharing systems[C]//Proceedings of the 14th Annual International Conference on Mobile Systems, Applications, and Services. Singapore: ACM, 2016: 165-178.
[14]	GAO X H, LEE G M. Moment-based rental prediction for bicycle-sharing transportation systems using a hybrid genetic algorithm and machine learning[J]. Computers & Industrial Engineering, 2019, 128: 60-69.
[15]	王凌苏. 共享单车交通量预测与停放点选址研究[D]. 北京: 北京交通大学, 2020. WANG L S. Traffic flow prediction and rental location of bike-sharing system[D]. Beijing: Beijing Jiaotong University, 2020. (in Chinese)
[16]	段进, 杨滔, 盛强, 等. 空间句法教程[M]. 北京: 中国建筑工业出版社, 2019. DUAN J, YANG T, SHENG Q, et al. Introduction to space syntax[M]. Beijing: China Architecture & Building Press, 2019. (in Chinese)
[17]	ZHANG L Z, CHIARADIA A, ZHUANG Y. A configurational accessibility study of road and metro network in Shanghai, China[M]//Recent Developments in Chinese Urban Planning. Guangzhou: Springer, 2015: 219-245.
[18]	COOPER C H V. Using spatial network analysis to model pedal cycle flows, risk and mode choice[J]. Journal of Transport Geography, 2017, 58: 157-165. DOI:10.1016/j.jtrangeo.2016.12.003
[19]	MCCAHILL C, GARRICK N W. The applicability of space syntax to bicycle facility planning[J]. Transportation Research Record, 2008, 2074(1): 46-51. DOI:10.3141/2074-06
[20]	宋小冬, 陶颖, 潘洁雯, 等. 城市街道网络分析方法比较研究: 以Space Syntax、sDNA和UNA为例[J]. 城市规划学刊, 2020(2): 19-24. SONG X D, TAO Y, PAN J W, et al. A comparison of analytical methods for urban street network: Taking space syntax, sDNA and UNA as examples[J]. Urban Planning Forum, 2020(2): 19-24. (in Chinese)
[21]	COOPER C. Spatial Design Network Analysis (sDNA) version 4.1 Manual[EB/OL]. [2021-03-04]. https://sdna.cardiff.ac.uk/sdna/wp-content/downloads/documentation/manual/sDNA_manual_v4_1_0.
[22]	BRUNSDON C, FOTHERINGHAM A S, CHARLTON M E. Geographically weighted regression: A method for exploring spatial nonstationarity[J]. Geographical Analysis, 1996, 28(4): 281-298.
[23]	叶显严. 基于地理加权回归的城市出租车客流影响因素分析及建模[D]. 成都: 西南交通大学. 2017. YE X Y. The model and facter analysis of effect on the urban taxi ridership based on geographically weighted regression[D]. Chengdu: Southwest Jiaotong University, 2017. (in Chinese)
[24]	FOTHERINGHAM A S, YANG W B, KANG W. Multiscale geographically weighted regression (MGWR)[J]. Annals of the American Association of Geographers, 2017, 107(6): 1247-1265. DOI:10.1080/24694452.2017.1352480
[25]	宋青, 李晓磊, 李猛. 基于OpenStreetMap的城市自行车网建模与多判据路径规划[J]. 交通运输系统工程与信息, 2017, 17(3): 143-149. SONG Q, LI X L, LI M. OpenStreetMap-based modeling and multi-criteria routing of urban cycleway network[J]. Journal of Transportation Systems Engineering and Information Technology, 2017, 17(3): 143-149. (in Chinese)
[26]	杨逍遥, 王建军, 李国栋, 等. 基于GWR模型的共享单车空间分布影响因素分析[J]. 交通运输研究, 2021, 7(1): 81-94. YANG X Y, WANG J J, LI G D, et al. Factors impacting spatial distribution of bike sharing based on GWR model[J]. Transport Research, 2021, 7(1): 81-94. (in Chinese)

文章信息

工作空间