基于多片段语义时空图卷积网络的大学生校园日常行为预测
喻宏伟, 周东波, 徐雯慧, 余雅滢, 王小梅, 涂悦    
华中师范大学 人工智能教育学部, 武汉 430079
摘要:当前大学生校园日常行为预测与挖掘研究中,一般采用统计、聚类、关联关系等浅层挖掘和学习算法,对学生校园行为的时序性、空间位置及其相关性缺乏深层与高阶应用分析。该文基于时空图网络结构,提出考虑校园活动时间序列与层次相关性和空间语义特征相关的多片段语义时空图卷积网络(MFSTGCN)模型。通过构建大学生校园行为数据集并进行实验,该模型达到了90.4%行为预测准确率,优于典型预测模型。最后,以学生个体成长监测为目标,预警日常行为异常的学生;挖掘学生行为习惯等高阶信息,为构建个性化培养提供有意义的参考。
关键词校园活动数据    图卷积网络    时空数据挖掘    行为预测    异常行为    行为习惯    
Daily behavior prediction of college students on campus based on multifragment semantic spatiotemporal graph convolutional network
YU Hongwei, ZHOU Dongbo, XU Wenhui, YU Yaying, WANG Xiaomei, TU Yue    
Faculty of Artificial Intelligence in Education, Central China Normal University, Wuhan 430079, China
Abstract: Shallow algorithms of mining and learning such as statistics, clustering, and association relationships are generally used in current research on the prediction and mining of college students' daily behaviors on campus, and there is a lack of in-depth and high-level analysis of the applications in time series, spatial location, and correlation of students' behaviors on campus. Based on the network structure of spatio-temporal graphs, this paper proposes a multifragment semantic spatiotemporal graph convolutional network (MFSTGCN) model that considers the time series of campus activities and the correlation between hierarchy and spatial semantic features. By constructing a data set of college students' campus behaviors and conducting experiments, the model in this paper achieves 90.4% behavior prediction accuracy, which is better than typical prediction models. Finally, we provide students with early warning of abnormal daily behaviors to monitor students' individual growth and excavate high-level information such as student's behaviors and habits to provide a meaningful reference for the construction of personalized education.
Key words: campus activity data    graph convolutional network    spatiotemporal data mining    behavior prediction    abnormal behavior    behavior habit    

大学生校园行为分析,特别是校园数据的时空建模与行为规律挖掘,是当前计算机科学、行为心理学、教育学等交叉学科的研究热点。作为全社会最关注的群体之一,大学生出现越来越多的校园安全问题、心理健康问题以及辍学退学等问题,发现并研究形成这些问题背后的校园日常行为变得极为迫切和重要[1]。分析大学生在校行为和活动规律是大学教育开展的重要保障,对大学生规范自身的学习和生活、高校制定教学计划和规章制度,乃至国家制定高等教育的方针和政策都具有重要意义[2]。校园日常行为预测在学生的校园安全建设、心理健康教育、异常行为检测、教育成才培养等方面具有重要理论和应用价值[3]

以大数据分析、人工智能等信息技术为支撑的智慧教育模式已成为教育信息化的趋势[4]。大学生的日常行为被多种设备全过程化持续记录,形成了海量的反映学生各方面信息的多源融合数据[5]。大学生的校园日常行为数据具有高度的非线性和相关性,提取活动特征、关联分析并挖掘其活动习惯的时空过程,能够实现行为的预测和对校园异常行为的推理,为判断学生的行为变化奠定基础。

大学生校园日常行为预测是典型的时空数据预测问题,一方面,校园数据按时间记录着学生日常行为活动;另一方面,从学生活动轨迹来看,其轨迹数据具有很强的语义信息,体现出一定时间序列下不同活动的轨迹位置关联。因而,充分考虑轨迹位置点之间连通性、时间序列性与语义含义,是提高时空行为预测准确率的有效方法。图 1是将学生校园日常行为数据按时空相关性以时间切片进行表达。时间维上,学生在不同时刻的行为内容会对该节点未来时刻的行为产生一定的影响;空间维上,在校园路网中不同的位置节点间具有很强的语义关系,节点之间会产生一系列的相互影响;同时,位置节点在不同的时刻也会对其相关联的节点产生影响。可见,学生行为活动在时间和空间维度上都具有很强的相关性,并且不同位置点之间具有独特的语义关联关系。从这些复杂的、非线性的、具有语义的时空数据中挖掘出行为特性实现行为预测,是校园日常行为数据挖掘的一项极大挑战。

图 1 校园日常行为数据时空相关性示意图

近年来,时空数据挖掘研究中利用卷积神经网络可以有效提取二维网格数据的空间特性,但是对于图结构数据的时空相关性分析目前仍在探索中。将大学生校园日常行为数据与图结构相结合的方法具有很强的开创性和挑战性。本文首先定义了大学生校园日常活动、行为和行为预测的层次数理关系,结合行为数据位置间强语义关系和时空相关性,构建语义路网和特定周期片段;然后,提出多片段语义时空图卷积网络(MFSTGCN)模型,建立大学生校园日常活动的图结构表达,将多个时间片段的输出进行卷积融合得到行为预测结果;最后,采集并构建在校大学生校园行为数据集,分析行为预测实验结果,识别学生校园异常行为,挖掘个人活动习惯信息。

1 相关工作

本文研究内容与教育数据挖掘相关,而核心在于时空数据预测。因此,本节从教育数据挖掘和时空行为预测2方面介绍相关工作。

1.1 教育数据挖掘

近年来,随着教育信息化的发展和教育大数据的指数型增长,教育数据挖掘(education data mining,EDM)已成为新兴跨学科研究领域,旨在运用数据挖掘技术探索不同教育环境下的独特数据,更好地理解学生及其学习环境,完善学生学习过程与教育管理[6-7]

因数据来源受限,教育数据挖掘研究大多关注学生线上学习活动所产生的数据,建模与分析学生的在线学习过程与学习表现[8-10]。随着智慧校园的建设和校园大数据的多源采集,学生校园日常行为分析也成为了研究趋势。文[11]以学生基本信息数据为基础,使用人工神经网络、决策树、支持矢量机和朴素Bayes四种基础预测模型,实现学生学业成绩的预测。文[12]分析学生的校园刷卡、WiFi访问、轨迹变化等复杂行为数据,构建隐私保护的多模式多标签学习模型,有效预测应给予学生的补助等级。文[13]利用学生校园签到行为数据,基于异构图方法编码学生个体、兴趣点和活动之间的相关性,实现学生兴趣点的预测并推理学生兴趣点之间的相似性。这些研究大多围绕某个具体问题或一类现象的数据进行分析与预测,缺乏对学生校园日常行为的预测及其规律的挖掘。

1.2 时空行为预测

对人类时空行为规律的探索一直以来都是自然、经济、社会等各个学科领域关注的研究方向。随着越来越多的行为数据被精确记录,学者得以从定量角度分析人类行为的时空规律及其动力学机制,并由此提升了对人类行为的传统认识[14]

文[15]用轨迹熵的方法证明了人类行为具有93%的可预测性,该研究结果受到了广泛的关注。传统的人类行为数据分析常用方法有动态Bayes网络、隐Markov模型、条件随机场等[16-19], 这类方法无法同时有效考虑到数据的时空相关性。深度学习由于在图像处理、语音识别、自然语言处理等领域取得了显著的成果,越来越多地被应用于人类行为数据挖掘问题。文[20]设计了一种基于残差卷积单元的ST-ResNet对城市人群流量时空数据进行预测,虽然提取了数据的时空特性,但是输入限制为标准的结构化数据,因此不能用于图结构的行为预测问题。

图卷积网络可以直接在图结构数据上实现卷积操作,主要包括空间方法和谱方法。空间方法直接把卷积核应用到图上节点及其邻域。文[21]以中心节点启发式线性进行邻域的选择并实现卷积,在社交网络任务中效果较好。谱方法通过图数据的Laplace矩阵将网格数据上的卷积操作推广到图结构数据上。文[22]提出了一个通用的图卷积框架, 将图的Laplace矩阵的特征向量变换到谱域, 实现问题的近似求解。文[23]首次提出了时空图卷积网络(STGCN)模型,利用参数量更少的时域和空域卷积结构解决时间序列预测问题。文[24]提出了基于注意力机制的时空图卷积网络(ASTGCN)模型来解决交通数据预测问题,并结合多组件的思想获取数据的时空相关性。文[25]通过设计时空同步图卷积网络(STSGCN)模型,利用同步建模机制有效捕获了复杂数据的时空相关性。这些模型虽然在时空数据挖掘中取得了不错的效果,但是没有充分考虑到数据在空间维度的强语义性或时间维度的强周期性。文[26]研究语义轨迹提取方法,证明了对时空行为数据进行语义增强的有效性。

综上所述,基于大学生校园日常活动数据的行为预测问题关键在于有效捕获路网中位置点的语义相关性和数据的时空特征相关性。语义图卷积可以提取出校园位置点的语义特征,挖掘出活动数据的强空间语义关系。多片段时间维卷积可以提取活动的周期规律特性,构建出数据周期性时间关联关系。因此,本文采用MFSTGCN模型,同时捕获校园活动数据的空间语义特性和时间周期特性,有效解决了大学生校园日常行为预测问题。

2 问题定义 2.1 活动、行为、行为预测

本文通过对采集的数据构建数据库管理,包含了活动对象、时间、空间和活动属性等具体信息。设数据中所有学生的集合为U,所有地点集合为L,所有活动的具体描述集合为D,本文将一条数据记录看成最小数据单元,定义为一个活动ai(i=1, 2, …, n; n为活动的总数)。

活动(action)是指某学生在特定行为条件影响下具体的操作,即人的任何行为都是由一系列相关活动构成的。活动包含的属性有学号、时间、地点和活动的具体描述。

${{a}_{i}}=\left( {{u}_{i}}, \text{ }{{t}_{i}}, \text{ }{{l}_{i}}, \text{ }{{d}_{i}} \right), $ (1)
$A=\left\{ {{a}_{1}}, \text{ }{{a}_{2}}, \text{ }\ldots , \text{ }{{a}_{n}}~ \right\}.$ (2)

其中:uiU表示活动的执行者,ti表示产生活动的时间,liL表示产生活动的地点,diD表示活动的具体描述,A表示数据中所有活动的集合。

行为(behavior)是指在特定思想支配的条件下表现出来的外显活动集合,由共同目的联合起来并完成一定职能的活动总和,具体的行为由一系列具有相同要素的活动构成。行为形式化表达包含构成该行为的活动、不同活动之间的关系以及该行为的特定语义。行为Bj的形式化定义如下:

${{B}_{j}}=\{\left( a, \text{ }r, \text{ }s \right)|a\in {{A}_{j}}, \text{ }r\in {{R}_{j}}, \text{ }s\in {{S}_{j}}\}.$ (3)

其中:Aj表示与第j种行为Bj相关的活动集合,本文利用聚类算法将具有相同地点或者相同描述的活动归类为同种行为的活动集合;Rj表示构成该行为的所有活动之间的语义关系集合,可以表示活动间的时间顺序关系,也可以表示活动间语义描述关联关系;Sj表示该行为的语义特征集合,不同类型的行为有不同的语义表达,由算法将活动归类为一个特定行为时生成该行为的语义描述,如上课行为、借阅行为、饮食行为等。

行为预测(behavior prediction)是指基于行为活动序列提取时空特征、周期特征实现未来时刻的行为预测。行为具有可预测性,研究一系列活动构成的行为特征进而实现行为的预测,这种方法满足利用数据驱动技术挖掘人类生活模式的基本原理[27]。对未来某一时刻的行为$ {\hat{B}}$的预测表达如下:

${{{\hat{B}}}{}}=f(B_m), $ (4)
${{B}_{m}}=\{\text{ }\left( a, \text{ }r, \text{ }s \right)|a\in {{A}_{m}}, \text{ }r\in {{R}_{m}}, \text{ }s\in {{S}_{m}}\}.$ (5)

其中:Bm表示学生校园生活中与预测行为$ {\hat{B}}$相关的所有m种行为构成的集合;Am表示m种行为中所有的活动集合;Rm表示m种行为中所有活动之间的语义关系集合;Sm表示m种行为所具有的语义特征集合;f(·)表示对行为集合Bm进行时空特征、周期特征提取的函数,本文利用多片段语义时空图卷积方法进行特征的提取,最终输出为未来某一时刻的具体行为$ {\hat{B}}$

2.2 校园空间位置语义路网

校园空间位置路网代表着各个校园建筑之间学生活动的关系,具有丰富的语义信息。图 2为基于校园空间位置信息的语义路网构建,将学生校园空间位置路网定义为一个带有语义规则的图数据结构:

$G=\left( V, \text{ }E, \text{ }R, \text{ }X \right).$ (6)
图 2 校园主要位置点语义路网构建

其中: V表示为校园区域位置节点集合;E为边集,表示节点之间的连通性;R表示所有节点上学生校园日常行为数据间语义关系类型的集合;X={xv}v=1|V|表示大学生校园活动所有节点的行为特征集合,xv表示第v个节点的行为特征,包括时间特征、地点特征、活动内容特征等,|V|表示节点的个数,代表学生校园活动区域的个数。

在本文的研究问题中,将大学生校园空间活动路网中的节点间语义关系按照活动类型大致分为:去宿舍区休息、去教学科研区上课、去教学科研区自习、去就餐消费区消费、去图书馆借阅、去图书馆自习、去体育活动区锻炼等7类,依次用S1、S2、…、S7表示。按照以上的语义规则结合时间维度对大学生活动数据进行扩充,可以很好地增加大学生校园路网的语义表达能力,进而构建基于语义关系的校园路网。

3 基于多片段语义时空图卷积网络行为预测 3.1 行为预测流程

图 3为本文大学生校园日常行为预测模型整体流程。首先,采用数据聚类的方法处理海量的大学生校园日常活动数据,构建出基于活动聚类的行为表达数据集。同时行为的表达具有活动间的关系特性,具有专属校园路网行为语义特性。然后,利用多片段语义时空图卷积网络方法进行学生行为预测。将校园行为数据集作为模型的数据输入,用语义空间维图卷积提取行为特征的语义空间相关性,用多片段时间维标准二维卷积提取特征的时间相关性。结合预测时间点的设置,输出未来某一时间点的具体行为,实现行为的预测。

图 3 大学生校园行为预测整体流程

3.2 基于活动聚类的校园行为数据集构建

大学生校园日常行为数据可以表达为不同时间维度下一系列相关活动序列。对于复杂的校园活动数据要充分考虑到以下2方面问题:一方面,数据库中记录复杂多样的数据,如何提取出特定行为的活动数据;另一方面,如何利用校园行为数据的时空特性、校园路网的语义特性实现对未来行为的准确预测。

本文依据不同活动数据时间、地点、具体描述等方面的相关性,构建出特定行为序列集合,为行为预测提供数据的支撑。利用聚类的方法将复杂多样的活动数据汇聚为具有语义关系的集合化行为数据,有利于行为特征提取与融合,进一步提高数据分析的准确率。图 4显示了将活动数据聚类为行为集合的算法过程,其中:B表示所有的行为集合;Aj在聚类过程中依据具有相同地点或描述的活动生成。

图 4 基于校园活动数据的行为聚类

3.3 多片段语义时空图卷积网络结构

图 5展示了本文提出的多片段语义时空图卷积网络结构,输入数据为算法1得到的行为数据集,网络结构主要由多个结构一致的周期片段组成,每个片段包括语义空间维图卷积(S-GCN)、标准时间维卷积(T-Conv)和全连接层(FC)。

图 5 多片段语义时空图卷积网络行为预测流程

多周期片段结构用于获取学生校园日常行为数据的强周期特征,S-GCN将校园语义路网和图卷积结合提取行为数据的空间语义特征,T-Conv捕获行为数据的时间序列特征。FC进行多维度特征融合,实现对学生未来行为的预测。

3.3.1 多片段结构提取行为数据周期特征

由于大学生校园日常活动具有重要的时间维度规律性,时间的周期性对于行为预测问题的研究显得尤为重要。因此,在本文的研究中,以3个时间周期片段为主要结构,分别是日片段、周片段、月片段,每个周期片段结构都具有一致的S-GCN、T-Conv和FC。在不同的周期维度进行卷积操作,提取行为数据语义时空相关性,进一步优化行为预测方法的准确性和高效性。这种组合结构充分考虑了大学生校园日常行为数据在时间层面的周期特性,同时降低了不相关历史数据带来的干扰和开销。例如对某学生某天具体时间点的行为进行预测,与预测时间点相邻的前一天、对应的前一周、对应的前一个月该时间点的校园行为都会提供有用信息。

设预测的未来时间点为t,沿时间维度分别取时间长度TdTwTm,按照这3个时间长度截取行为数据作为模型输入数据的日片段、周片段和月片段。

日片段为

${{X}_{\text{d}}}=({{X}_{t-{{T}_{\text{d}}}+1}}, \text{ }{{X}_{t-{{T}_{\text{d}}}+2}}, \cdots , \text{ }{{X}_{t-{{T}_{\text{d}}}+p}}).$ (7)

其中:本文取Td=24,表示时间长度为一天。Xd表示预测时间点的前一天对应的该时间点所有行为数据的p个特征。在大学生日常生活中某一天的一个时间点的行为必然与前一天该时间点行为相关,具有行为上的强关联,显示了日常行为以天为周期的规律性。

周片段为

${{X}_{\text{w}}}=({{X}_{t-{{T}_{\text{w}}}+1}}, \text{ }{{X}_{t-{{T}_{\text{w}}}+2}}, \text{ }\ldots , \text{ }{{X}_{t-{{T}_{\text{w}}}+q}}).$ (8)

其中:本文取Tw=7×24,表示时间长度为一周。Xw表示预测时间点的前一周对应的该时间点所有行为数据的q个特征。大学生的日常生活具有很强的以周为单位的周期性,如学校对不同专业的学生进行课程安排,学生自我学习和学业管理等方面都是以周次开展。

月片段为

${{X}_{\text{m}}}=({{X}_{t-{{T}_{\text{m}}}+1}}, \text{ }{{X}_{t-{{T}_{\text{m}}}+2}}, \text{ }\ldots , \text{ }{{X}_{t-{{T}_{\text{m}}}+o}}).$ (9)

其中:本文取Tm=4×7×24,表示时间长度为一个月。Xm表示预测时间点的前一个月对应的该时间点所有行为数据的o个特征。大学生在校学习生活中有很多事件都是以月为单位进行的,如活动的举办、考试的组织等。

3.3.2 语义空间维图卷积和标准时间维卷积

在利用大学生校园行为数据时,首先考虑单一周期片段上的语义时空特性。图 6为语义时空特征提取网络结构图,输入数据为日、周、月周期片段中的行为数据XdXwXm,首先将输入的行为数据与校园语义路网G=(V, E, R, X)关联,经过S-GCN获取行为数据的语义空间相关性,然后利用T-Conv获取时间相关性,最后经过FC输出该周期片段行为预测结果y

图 6 单一片段语义时空特征提取网络结构图

在语义空间维图卷积部分,本文采用谱方法[22]将卷积操作扩展到图结构化数据中,捕获空间中有意义的模式和特征。由于该方法要考虑图结构中节点间的连通关系及相互影响,因此将图数据用其对应的Laplace矩阵来表示,图结构的性质分析就转换成对Laplace矩阵的性质特征分析。

图数据的Laplace矩阵L定义为

$\mathit{\boldsymbol{L}} = \mathit{\boldsymbol{D}} - \mathit{\boldsymbol{A}}.$ (10)

其中:D为度矩阵,是由节点度数组成的对角矩阵;A为校园空间语义空间路网G的图邻接矩阵,表示节点间语义连接关系。语义空间维图卷积操作为

$\mathit{\boldsymbol{X}}^{(g)}=\sigma ({\mathit{\boldsymbol{D}}^{-\frac{1}{2}}}\left( \mathit{\boldsymbol{D}}-\mathit{\boldsymbol{A}} \right){\mathit{\boldsymbol{D}}^{-\frac{1}{2}}}\mathit{\boldsymbol{X}}{{~}^{(l)}}{\mathit{\boldsymbol{W}}^{(l)}}).$ (11)

其中:X(l)作为第l层的行为特征矩阵,维度为N×M,表示第l层的N个节点分别所具有的M维特征值;X(g)为经过一次语义空间维图卷积操作得到的空间特征提取结果;W(l)表示为该卷积操作所使用的权重参数矩阵。在图卷积操作中利用Laplace矩阵来获取节点本身的特征值,利用数据的正则化操作使特征提取过程更加合理,最后利用激活函数σ得到模型的训练结果。

针对输入数据的时间特征,通过语义空间维图卷积操作之后获取了数据的语义空间相关性,再用标准的二维卷积获取数据的时间相关性。卷积操作中使用线性修正单元激活函数ReLU,以获取时间层面特征。时间维卷积操作为

$\mathit{\boldsymbol{X}}^{(l+1)}=\text{ReLU}({\mathit{\boldsymbol{W}}_{l}}(\text{ReLU}({\mathit{\boldsymbol{W}}_{g}}\mathit{\boldsymbol{X}}^{(g)}+{\mathit{\boldsymbol{b}}_{0}}))+{\mathit{\boldsymbol{b}}_{1}}).$ (12)

其中:X(l+1)表示由X(g)经过时间维卷积操作得到的第(l+1)层行为特征矩阵,WgWlb0b1表示卷积过程中的参数。经过一层时间卷积之后,节点的信息被相邻时间点的信息更新。因此,通过语义时空卷积操作之后就可以捕获到空间维和时间维特征以及数据语义时空相关性。该时间片段上经过时空卷积操作得到的行为特征矩阵X(l+1)即为该片段的行为预测结果y

该模型进一步使用多层时空图卷积,以提取更加全面的周期时空信息。最后通过全连接操作进行多时空片段输出数据融合。多片段融合的最终行为预测结果为

$\mathit{\boldsymbol{Y}}={\mathit{\boldsymbol{W}}_{1}}\odot {\mathit{\boldsymbol{y}}_{1}}+{\mathit{\boldsymbol{W}}_{2}}\odot {\mathit{\boldsymbol{y}}_{2}}+\ldots +{\mathit{\boldsymbol{W}}_{\varepsilon }}\odot {\mathit{\boldsymbol{y}}_{\varepsilon }}.$ (13)

其中:⊙表示矩阵的对应元素相乘的Hadamard积运算;ε为模型使用的片段数量;y1, y2, …, yε为不同片段结构中输出的预测值;W1, W2, …, Wε是多片段融合的学习参数,反映不同时间片段对行为预测结果的影响程度。

4 实验分析与应用 4.1 行为数据集构建与数据预处理

为了验证本文提出的方法在校园数据挖掘中的有效性,利用真实的数据进行了实验。本文使用的数据来源于中国某中部大学学生在校数据,包括学生日常行为轨迹的WiFi探针数据、食堂刷卡数据、超市刷卡数据、选课数据、图书馆进出刷卡数据、图书馆借阅数据、宿舍楼进出数据、成绩数据等,数据中所有学号是经过隐私保护而生成的学生学号编码。此外,考虑到有些个体行为时空模式的独特性,在数据构建阶段进一步降低了数据的可识别度,例如将具体信息匿名化、将具体室内编号模糊化、将位置区域化等。经过原始数据的处理之后,重新准确识别学生个体相当困难[28]。具体学生校园日常活动数据实例如表 1所示。

表 1 数据库中活动数据实例及行为标签
学号 日期 时间 区域 位置 描述 行为
abc123 2018/9/6 7:31 宿舍区 东一区3栋宿舍 休息 休息行为
abc123 2018/9/6 8:07 就餐消费区 东一餐厅 安庆馄饨 饮食行为
abc123 2018/9/6 8:08 就餐消费区 东一餐厅 稀食 饮食行为
abc123 2018/9/6 8:11 宿舍区 东一区3栋宿舍 休息 休息行为
abc123 2018/9/6 9:52 图书馆区 图书馆 我喜欢这世界 借阅行为
abc123 2018/9/6 9:52 图书馆区 图书馆 爱与美的礼赞 借阅行为
abc123 2018/9/6 9:52 图书馆区 图书馆 我喜欢这世界 借阅行为
abc123 2018/9/6 10:15 教学科研区 八号楼教室 教育学基础 上课行为
abc123 2018/9/6 11:39 教学科研区 八号楼教室 教育学基础 上课行为

依据本文对活动和行为的公式化定义,首先对活动数据进行聚类,构建校园行为数据集,为校园语义信息融合奠定基础。利用数据库中活动时间、区域、位置、描述等字段信息,结合算法1得到具有准确行为含义的校园行为数据集,如表 1中最后一列所示,为之后的数据预处理以及网络输入提供基础。算法1是根据活动字段信息创建的,在构建数据集的同时筛选了具有明确含义的活动记录,删去了没有实际意义的活动数据。

在对数据集的预处理中,本文分为3步进行。

1) 将数据标签数值化。具体步骤是:将原始数据中的类别标签特征进行数值化。例如对学生校园行为数据中的区域类别标签数值化、对学生课程标签数值化。这种方法保持了数据基本特性,不改变数据原始信息,但数据中的奇异点将会对实验精度造成很大的影响,因此要对数据进一步处理。

2) 将数据进行标准化。数据分析中一般要求原始数据满足正态分布,保证数据分析精确和降低计算复杂度,要保证不同范围特征对结果影响程度的一致性,数据标准化的公式为

$z=\left( x-\mu \right)/\sigma .$ (14)

其中:μσ分别为原始数据集中特征的均值和标准差。例如对学生校园行为数据中的活动时长、消费金额等数值型特征进行标准化处理,使数据规范化,更有益于数据的分析。

3) 将数据进行归一化。对原始数据中的类别标签特征数值化之后,再进行线性函数归一化:

${{X}_{\text{norm}}}=(X-{{X}_{\text{min}}})/({{X}_{\text{max}}}-{{X}_{\text{min}}}).\text{ }$ (15)

其中:X为原始数据,XmaxXmin分别为原始数据中的最大值和最小值,Xnorm为归一化后的特征结果。以此实现数据的等比例缩放,避免异常值对数据分析造成的影响。

实验过程中,使用了一个学院396名学生从2018年9月1日到2019年1月20日总计约140 d、20周、5个月的数据,共计7 609 048条活动记录。其中消费记录1 293 538条、借阅记录989 176条、WiFi记录3 271 892条、门禁刷卡记录1 369 628条、其他记录684 814条,占比分别为17%、13%、43%、18%、9%。

另外,在构建校园语义路网时,为了更好地联系时间序列数据之间的关联,依据数据集中行为特征将语义路网构造为包含时间点和空间位置的图数据结构,即7个校园活动区域、24个时间点,图结构的邻接矩阵维度为168×168,以此为基础实现3个时间片段的行为特征图卷积操作。

4.2 实验方法与实验分析

由于现有关于学生校园行为预测的研究较少,因此本文采用几种典型的机器学习预测模型如随机森林(random forest)、决策树(decision tree)和Gauss朴素Bayes模型与本文方法进行实验结果对比分析。同时将STGCN、ASTGCN和STSGCN也作为对比对象。

本文基于Pytorch框架实现了MFSTGCN模型,网络结构包括3个时间片段,每个时间片段有1层时间维标准二维卷积和2层空间维图卷积。在数据集上进行实验,将80%行为数据设为训练集,将20%行为数据设为验证集,主要评价指标有准确率Acc、精确率Pre、召回率Rec和F1。计算公式如下:

$\text{Acc}=\frac{\text{TP}+\text{TN}}{\text{TP+FP+FN+TN}}, $ (16)
$\text{Pre}=\frac{\text{TP}}{\text{TP+FP}}, $ (17)
$\text{Rec}=\frac{\text{TP}}{\text{TP}+\text{FN}}, $ (18)
$\text{F1}=\frac{2\times \text{Pre}\times \text{Rec}}{\text{Pre}+\text{Rec}}.$ (19)

其中:TP表示正类行为标签被模型预测为正类的样本数量,FP表示负类行为标签被模型预测为正类的样本数量,FN表示正类行为标签被模型预测为负类的样本数量,TN表示负类行为标签被预测为负类的样本数量。

本文实验中不同模型行为预测的Acc和F1如表 2所示。MFSTGCN模型的准确率和F1均最高,证明了综合考虑时间周期相关性和空间语义相关性之后的MFSTGCN模型对数据的分析更有效。对比随机森林、决策树和Guass朴素Bayes三种典型机器学习预测模型,MFSTGCN模型以及其他基于图网络的方法具有明显的优势,证明了用图网络解决校园路网数据问题更加符合数据的基本结构,有效获取了数据间图结构关系。与STGCN、ASTGCN和STSGCN相比,MFSTGCN行为预测准确率最优。这是因为MFSTGCN在空间层面考虑了校园语义特征,同时,在时间层面上考虑了学生行为日、周、月片段的周期特征,实现了行为预测过程中更加精准的特征提取。

表 2 不同算法在数据集中的实验结果
模型 Acc/% F1/%
随机森林 84.37 82.38
决策树 81.01 80.16
Guass朴素Bayes 78.67 75.31
STGCN 86.49 85.19
ASTGCN 87.91 86.36
STSGCN 88.53 86.72
MFSTGCN 90.40 90.23

图 7为不同模型对于不同类别的行为预测的Acc。MFSTGCN在不同的行为类别预测结果都优于其他模型,对上课行为的预测准确率最高,证明了它可以有效获取学生校园活动中上课行为数据的周期性,提高了行为预测的准确率。

图 7 不同类别行为预测准确率对比

表 3对比了上述7种方法的参数个数以及获得最优行为预测效果的训练时间,随机森林、决策树和Guass朴素Bayes作为三种机器学习模型,不参与可训练模型的参数对比。训练过程使用的GPU为NVIDIA GeForce GTX1080TI。由于MFSTGCN模型在构建邻接矩阵时考虑路网的语义特征信息,因此参数量大于其他模型,其训练过程也是最耗时的。ASTGCN模型在STGCN模型中添加了注意力机制,增加了一定的参数量,同时也提升了预测的准确率。STSGCN将时间和空间卷积同步处理,提高了算法效率。但是MFSTGCN模型更适合可构建语义路网的学生校园行为预测,可以提取更有价值的校园语义信息,精度优于其他方法,较长的训练时长对于海量的校园日常行为数据挖掘也是可以接受的。

表 3 训练时间和模型参数对比
模型 训练时间/s 参数个数
随机森林 370
决策树 130
Guass朴素Bayes 130
STGCN 956.8 7 914
ASTGCN 1 030.6 7 643
STSGCN 757.9 7 776
MFSTGCN 1 239.6 10 267

4.3 校园异常行为预警

在构建的测试集中选取一个典型的学生一天行为数据作为研究对象。图 8为测试集中该学生一天行为活动记录。其中,蓝色线代表该学生的实际行为;灰色线代表该学生的校园预期行为,是由学生的基本信息如课表安排、活动安排等数据构成;红色线代表该学生所预测的异常行为。该学生在食堂吃完早餐之后,本应该去图书馆自习,但根据异常行为分析,其返回宿舍并停留一段时间,该行为归类于异常行为。该学生在吃完午饭之后,依据课表安排本应该去教学楼上课,但测试集中的预测数据显示其行为发生在体育馆中,该数据作为上课相关的异常行为预警。以个体为研究对象分析具体时刻的异常行为,为管理者有效管理提供了基础。

图 8 学生异常行为预警

校园大数据中记录的学生校园行为数据,能够为衡量学生整体校园生活和学业表现提供依据。行为预测的意义在于对未来时刻行为是否异常做出预测,使教学管理工作更具有前瞻性,意义更加重大。

结合对未来时刻行为预测的数据整体统计分析是衡量某一具体未来时间段内个体行为是否规律的有力依据。教育管理者通过对异常行为预警与未来时刻行为预测,可以更加精准对行为异常的学生开展辅导与帮助。图 9为某学生放假前最后一个月上课、饮食以及休息行为统计占比。其中第1周、第2周和第3周为数据中学生已发生的相关行为统计,第4周为模型的行为预测结果统计,即学生未发生的行为。上课异常行为是指学生不能按时上课,在规定的上课时间内WiFi访问数据、刷卡数据等却活跃在其他非教学区域,表明学生未正常出勤,是检测学生是否正常上课学习的重要依据;饮食异常行为是指在早、中、晚就餐时间段内学生未就餐的行为,本文依据数据库中的时间字段和学校时间安排,定义7:00至9:00为早餐时间、11:00至13:00为午餐时间、17:00至19:00为晚餐时间;休息异常行为是指学生在晚上23:00至次日6:00有刷卡数据、WiFi访问数据的产生。可以看出,该学生上课异常行为仅在第2周、第3周出现并且占比很少;该学生的饮食行为虽然有异常的出现但相对较规律;针对休息行为,该学生异常行为随时间逐渐增多,需要引起教育管理者的重视,尤其是第4周的预测结果统计,后续可进行有目的性的行为干预和管理,以矫正学生异常行为,使其更好的完成学业。

图 9 学生行为统计占比

4.4 个体行为习惯信息挖掘

以具体一个学生为研究对象,从数据集中筛选出该学生共计6 845条校园活动数据,通过训练效果较佳的MFSTGCN模型对该学生进行日、周、月的行为预测,用数据相关性分析的方法发现其行为规律。图 10表示一天中不同时间段的行为统计分析,可以发现该学生在0:00到7:00之间发生的行为主要是休息行为,8:00到12:00之间发生的行为主要是上课行为和饮食行为,14:00到20:00主要为上课行为、自习行为、饮食行为。图中黑点代表偏离均值的数据,在统计分析不同时间段的行为规律中有较少偏离均值的行为出现,整体对均值的统计没有产生影响。宏观角度证明了该学生具有良好的日常行为习惯。

图 10 学生日常行为习惯分析

习惯是指规律性的行为方式[29-30],由周期重复、时空重叠的行为序列泛化形成。本文将个体习惯发现与校园行为数据建立强关联分析,从行为本质上利用数据驱动方法进行推导,并得到了个性化行为习惯与学业成长的相关性,由此为大学生个性化培养提供了基于日常行为级别的建议与参考。

5 结论

针对大学生校园活动数据挖掘不充分以及现有研究方法对时空相关性考虑不足的问题,本文基于时空图网络结构,通过构建校园语义路网的方法,提出考虑校园空间语义相关性和时间周期相关性的MFSTGCN模型用以预测学生校园行为。对760万条以上的活动数据进行实验,深入探究提高行为预测准确性的影响因素。实验表明,该方法对行为预测有较好的准确率,并可以根据行为预测结果判断是否为异常行为。

下一步将提高数据集的丰富性,增加数据粒度。同时尝试更多的数据预处理手段,使预测更加精确。

参考文献
[1]
李有增, 曾浩. 基于学生行为分析模型的高校智慧校园教育大数据应用研究[J]. 中国电化教育, 2018(7): 33-38.
LI Y Z, ZENG H. Smart campus big data education application based on students' behavior analysis model[J]. China Educational Technology, 2018(7): 33-38. DOI:10.3969/j.issn.1006-9860.2018.07.005 (in Chinese)
[2]
杨倍倍, 曲英杰, 王金鑫. 基于移动数据和时间地理学的大学生行为模式构建与分析[J]. 地理信息世界, 2018, 25(1): 77-81.
YANG B B, QU Y J, WANG J X. Construction and analysis of college students' behavior patterns based on mobile data and time geography[J]. Geomatics World, 2018, 25(1): 77-81. DOI:10.3969/j.issn.1672-1586.2018.01.016 (in Chinese)
[3]
崔聪, 涂庆华, 束乾倩, 等. 基于大数据的高校安全与维稳系统设计与实践[J]. 中国教育信息化, 2020(3): 61-65.
CUI C, TU Q H, SHU Q Q, et al. Design and practice of university security and stability system based on big data[J]. The Chinese Journal of ICT in Education, 2020(3): 61-65. (in Chinese)
[4]
郑庆华, 董博, 钱步月, 等. 智慧教育研究现状与发展趋势[J]. 计算机研究与发展, 2019, 56(1): 209-224.
ZHENG Q H, DONG B, QIAN B Y, et al. The state of the art and future tendency of smart education[J]. Journal of Computer Research and Development, 2019, 56(1): 209-224. (in Chinese)
[5]
武法提, 黄石华. 基于多源数据融合的共享教育数据模型研究[J]. 电化教育研究, 2020, 41(5): 59-65.
WU F T, HUANG S H. Research on shared education data model based on multi-source data fusion[J]. e-Education Research, 2020, 41(5): 59-65. (in Chinese)
[6]
李宇帆, 张会福, 刘上力, 等. 教育数据挖掘研究进展[J]. 计算机工程与应用, 2019, 55(14): 15-23.
LI Y F, ZHANG H F, LIU S L, et al. Research progress on educational data mining[J]. Computer Engineering and Applications, 2019, 55(14): 15-23. DOI:10.3778/j.issn.1002-8331.1903-0153 (in Chinese)
[7]
ALYAHYAN E, DüŞTEGöR D. Predicting academic success in higher education: Literature review and best practices[J]. International Journal of Educational Technology in Higher Education, 2020, 17(1): 3. DOI:10.1186/s41239-020-0177-7
[8]
朱天宇, 黄振亚, 陈恩红, 等. 基于认知诊断的个性化试题推荐方法[J]. 计算机学报, 2017, 40(1): 176-191.
ZHU T Y, HUANG Z Y, CHEN E H, et al. Cognitive diagnosis based personalized question recommendation[J]. Chinese Journal of Computers, 2017, 40(1): 176-191. (in Chinese)
[9]
TOMASEVIC N, GVOZDENOVIC N, VRANES S. An overview and comparison of supervised data mining techniques for student exam performance prediction[J]. Computers & Education, 2020, 143: 103676.
[10]
孔啸, 刘乃嘉, 张梦豪, 等. COVID-19疫情前后高校在线教学数据分析[J]. 清华大学学报(自然科学版), 2021, 61(2): 104-116.
KONG X, LIU N J, ZHANG M H, et al. Analysis of online college teaching data before and after the COVID-19 epidemic[J]. Journal of Tsinghua University (Science and Technology), 2021, 61(2): 104-116. (in Chinese)
[11]
MENGASH H A. Using data mining techniques to predict student performance to support decision making in university admission systems[J]. IEEE Access, 2020, 8: 55462-55470. DOI:10.1109/ACCESS.2020.2981905
[12]
YE H J, ZHAN D C, LI X L, et al. College student scholarships and subsidies granting: A multi-modal multi-label approach[C]//Proceedings of the 16th International Conference on Data Mining. Barcelona, Spain: IEEE Press, 2016: 559-568.
[13]
HANG M, PYTLARZ I, NEVILLE J. Exploring student check-in behavior for improved point-of-interest prediction[C]//Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. New York, NY, USA: ACM, 2018: 321-330.
[14]
王德, 谢栋灿, 王灿, 等. 个体时空行为的规律性与可预测性研究——以上海市居民工作日活动为例[J]. 地理科学进展, 2021, 40(3): 433-440.
WANG D, XIE D C, WANG C, et al. Regularity and predictability of individual spatiotemporal behavior: A case study ofresidents working day activities in Shanghai[J]. Progress in Geography, 2021, 40(3): 433-440. (in Chinese)
[15]
SONG C M, QU Z H, BLUMM N, et al. Limits of predictability in human mobility[J]. Science, 2010, 327(5968): 1018-1021. DOI:10.1126/science.1177170
[16]
ABIDINE M B, FERGANI B. Evaluating C-SVM, CRF and LDA classification for daily activity recognition[C]//Proceedings of the 2012 International Conference on Multimedia Computing and Systems. Tangiers, Morocco: IEEE Press, 2012: 272-277.
[17]
TRABELSI D, MOHAMMED S, CHAMROUKHI F, et al. An unsupervised approach for automatic activity recognition based on hidden markov model regression[J]. IEEE Transactions on Automation Science and Engineering, 2013, 10(3): 829-835. DOI:10.1109/TASE.2013.2256349
[18]
RONAO C A, CHO S B. Human activity recognition using smartphone sensors with two-stage continuous hidden Markov models[C]//Proceedings of the 10th International Conference on Natural Computation. Xiamen, China: IEEE Press, 2014: 681-686.
[19]
RONAO C A, CHO S B. Recognizing human activities from smartphone sensors using hierarchical continuous hidden Markov models[J]. International Journal of Distributed Sensor Networks, 2017, 13(1): 1-16.
[20]
ZHANG J B, ZHENG Y, QI D K, et al. Predicting citywide crowd flows using deep spatio-temporal residual networks[J]. Artificial Intelligence, 2018, 259: 147-166. DOI:10.1016/j.artint.2018.03.002
[21]
NIEPERT M, AHMED M, KUTZKOV K. Learning convolutional neural networks for graphs[C]//Proceedings of the 33rd International Conference on Machine Learning. New York, NY, USA: JMLR, 2016: 2014-2023.
[22]
BRUNA J, ZAREMBA W, SZLAM A, et al. Spectral networks and locally connected networks on graphs[C]//Proceedings of the 2nd International Conference on Learning Representations. Banff, AB, Canada: IEEE Press, 2014: 1-14.
[23]
YU B, YIN H T, ZHU Z X. Spatio-temporal graph convolutional networks: A deep learning framework for traffic forecasting[C]//Proceedings of the 27th International Joint Conference on Artificial Intelligence. Stockholm, Sweden: Morgan Kaufmann, 2018: 3634-3640.
[24]
GUO S N, LIN Y F, FENG N, et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting forecasting[C]//Proceedings of the 33rd AAAI Conference on Artificial Intelligence. Palo Alto, CA, USA: AAAI, 2019: 922-929.
[25]
SONG C, LIN Y F, GUO S N, et al. Spatial-temporal synchronous graph convolutional networks: A new framework for spatial-temporal network data forecasting[C]//Proceedings of the 34rd AAAI Conference on Artificial Intelligence. Palo Alto, CA, USA: AAAI, 2020: 914-921.
[26]
骆歆远, 陈欣, 寿黎但, 等. 面向室内空间的语义轨迹提取框架[J]. 清华大学学报(自然科学版), 2019, 59(3): 186-193.
LUO X Y, CHEN X, SHOU L D, et al. Semantic trajectory extraction framework for indoor space[J]. Journal of Tsinghua University(Science and Technology), 2019, 59(3): 186-193. (in Chinese)
[27]
周涛, 韩筱璞, 闫小勇, 等. 人类行为时空特性的统计力学[J]. 电子科技大学学报, 2013, 42(4): 481-540.
ZHOU T, HAN X P, YAN X Y, et al. Statistical mechanics on temporal and spatial activities of human[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(4): 481-540. DOI:10.3969/j.issn.1001-0548.2013.04.001 (in Chinese)
[28]
DE MONTJOYE Y A, RADAELLI L, SINGH V K, et al. Unique in the shopping mall: On the reidentifiability of credit card metadata[J]. Science, 2015, 347(6221): 536-539. DOI:10.1126/science.1256297
[29]
LALLY P, VAN JAARSVELD C H M, POTTS H W W, et al. How are habits formed: Modelling habit formation in the real world[J]. European Journal of Social Psychology, 2010, 40(6): 998-1009. DOI:10.1002/ejsp.674
[30]
NEAL D T, WOOD W, QUINN J M. Habits-A repeat performance[J]. Current Directions in Psychological Science, 2006, 15(4): 198-202. DOI:10.1111/j.1467-8721.2006.00435.x