基于动态自适应策略的SSVEP快速目标选择方法
王春慧1, 江京1, 李海洋2, 许敏鹏3,4, 印二威5, 明东3,4     
1. 中国航天员科研训练中心 人因工程重点实验室, 北京 100092;
2. 白城兵器试验中心, 白城 137001;
3. 天津大学 精密仪器与光电子工程学院, 神经工程与康复实验室, 天津 300072;
4. 天津大学 医学工程与转化医学研究院, 天津神经工程国际联合研究中心, 天津 300072;
5. 军事科学院 国防科技创新研究院, 无人系统技术研究中心, 北京 100081
摘要:基于稳态视觉诱发电位(SSVEP)的脑-机接口(BCI)系统具有高速、大指令集等优点,其信息传输率(ITR)的进一步提升对系统走向实际应用具有重要意义。该文采用包含35名被试的公开数据集,使用任务相关成分分析的分类模型识别脑电图数据中的SSVEP成分,进而运用基于Bayes估计的动态自适应策略评估分类结果的置信度。实验结果表明:动态自适应策略所得到的平均ITR(230 b/min)比传统的静态自适应策略(204 b/min)提升了12.7%,基于Bayes的动态自适应策略可以进一步提升SSVEP-BCI的性能。
关键词脑-机接口    稳态视觉诱发电位    脑电图    动态自适应策略    任务相关成分分析    
High-speed target selection method for SSVEP based on a dynamic stopping strategy
WANG Chunhui1, JIANG Jing1, LI Haiyang2, XU Minpeng3,4, YIN Erwei5, MING Dong3,4     
1. National Key Laboratory of Human Factors Engineering, China Astronaut Research and Training Center, Beijing 100092, China;
2. Baicheng Ordnance Test Center, Baicheng 137001, China;
3. Laboratory of Neural Engineering and Rehabilitation, College of Precision Instrument and Opto-Electronics Engineering, Tianjin University, Tianjin 300072, China;
4. Tianjin International Joint Research Center for Neural Engineering, Academy of Medical Engineering and Translational Medicine, Tianjin University, Tianjin 300072, China;
5. Unmanned Systems Research Center, National Institute of Defense Technology Innovation, Academy of Military Sciences China, Beijing 100081, China
Abstract: The steady-state visual evoked potential (SSVEP) based brain-computer interfaces (BCIs) are very fast and have huge instruction sets. However, the information transfer rate (ITR) needs to be increased for practical applications. A classification model of the task-relevant component analysis is used on a public data set of 35 subjects to recognize the SSVEP component in the electroencephalography data. A dynamic stopping strategy based on Bayes estimation is used to evaluate the confidence of the classification results. The results show that the dynamic stopping strategy (230 b/min) improves the average ITR by 12.7% compared with the conventional fixed stopping strategy (204 b/min). Thus, this result shows how SSVEP-BCI can be further improved by the Bayes-based dynamic stopping strategy.
Key words: brain-computer interface     steady-state visual evoked potential     electroencephalography     dynamic stopping strategy     task-related component analysis    

脑-机接口(brain-computer interface, BCI)系统可以在不依赖外周神经肌肉系统的前提下,建立起人脑和外界环境之间直接交流通路,即通过分析大脑活动中的意图,然后将其翻译成控制外部设备的指令。BCI在许多领域有着广阔的应用前景,比如为那些有运动疾病的人提供与外界环境交流的能力(脑控轮椅、机械臂、字符拼写器等[1-4])。用于非侵入式BCI系统的控制信号包括P300、感觉运动节律(sensorimotor rhythm, SMR)、稳态视觉诱发电位(steady-state visual evoked potential,SSVEP)以及它们之间的组合[5-6],其中,基于SSVEP的BCI具有高信噪比和高信息传输率(information transfer rate, ITR)等优点。在典型的基于SSVEP的BCI系统中,多个刺激以不同的频率闪烁(如图形或者闪光刺激,一般大于6 Hz),当用户注视其中一个靶刺激时,大脑视觉皮层会在靶刺激频率的基频和倍频处产生SSVEP特征成分,通过检测SSVEP中的显性频率就可以识别出靶刺激。

评价BCI系统的性能有很多指标,比如ITR、准确率、输出指令的速度以及指令集的大小等,其中ITR是目前最常用的评价指标[7]。用于提高SSVEP-BCI信息传输率的方法有很多,比如优化刺激的编码方式和解码SSVEP的算法等。通过优化刺激范式可以增加指令集的数目,并保证SSVEP信号识别的准确率。Zhang等提出多重频率序列编码方法,实现了用少量频率设计出较多控制指令的目的[8]。Wang等提出了以更灵活的频率来产生稳健闪烁刺激的频率近似法[9]。Chen等提出联合频率-相位调制(joint frequency-phase modulation, JFPM)方法,设计出有40个字符的拼写器[10];并结合视觉刺激的颜色和亮度特征开发出相互调制的频率编码方式,实现了更好的分类表现[11]。另外,Yin等将行/列P300和两步SSVEP范式整合在一起,提出了混合刺激呈现范式,得到了64个可选指令[12]。用于目标识别的SSVEP检测算法的进步同样可以提高ITR,比如早期的以快速Fourier变换为代表的能量谱密度分析方法,实现了27.15 b/min的平均ITR[13];后来的研究证明空间滤波技术更加有效,且可以提高SSVEP信号的信噪比,其中应用最为广泛的是典型相关分析(canonical correlation analysis,CCA)方法,实现了58 b/min的平均ITR[14]。许多基于CCA的算法大幅提升了SSVEP-BCI的性能。比如,Wang等[15]和Chen等[10]分别将个体模板和滤波器分析整合到CCA方法中,将平均ITR分别提升到104.6 b/min和270 b/min。最近出现的任务相关成分分析(task-relevant component analysis, TRCA)算法更是将平均ITR提升到325.33 b/min [16]

在保证准确率和指令集的前提下,缩短单个指令的输出时间(即缩短数据长度)可以得到更高的ITR。传统的优化时间方法是静态自适应(fixed stopping, FS)策略,即根据离线分析结果,将最高ITR所对应的单试次呈现刺激的时间选定为最优目标选择时间。但是,由于脑电图(electroencephalography, EEG)数据信号的非线性和不稳定性,每个试次的最优时间是不同的,因此更优的解决方案是动态地为每个试次确定时间。为此,可以将以前只有单次检测SSVEP并输出分类结果的过程,分解为多时间点的顺序检测,在每个时间点都作如下判断:若分类结果可信,则输出指令,顺序检测停止;若不可信,则不输出指令,顺序检测继续,并等待下一个时间点继续判断。相比于单次检测并输出的过程,这种顺序检测的过程可以充分利用传统SSVEP检测算法的累积效应,并有效减小噪声的干扰。Schreuder等提出的基于P300的BCI系统的动态自适应(dynamic stopping, DS)策略,就是一个顺序检测过程[17]。分类结果的置信度通过基于Bayes的概率模型进行评估,这种自适应DS策略的有效性已经在很多研究中得到了验证[17-22]。然而,目前还没有基于Bayes的DS策略对于提高SSVEP-BCI性能的可行性和有效性的相关研究。本文通过公开数据库对所提出的方法和用固定数据长度的FS策略进行了模拟在线测试,并将分类准确率、所用的数据长度以及ITR作为评价指标,以验证所提出方法的有效性。

1 方法与实验 1.1 受试者

本文采用Wang等公开的数据库来测试所提出的方法[23]。被试共有35名(其中:17名女性,18名男性;年龄在17~34岁,平均年龄为22岁),健康且视力正常或者校正之后正常。在这些被试中,有8名被试之前参加过SSVEP-BCI拼写器的相关实验,其余27名被试是初次参加此类实验。全部被试在实验之前均被要求阅读和签署清华大学研究伦理委员会认可的知情同意书。

1.2 实验设计和流程

用户界面是一个包含40个字符(26个英文字母、10个数字和4个字符)的5×8刺激矩阵。每个刺激是一个140×140像素的方块,呈现在液晶显示屏上,显示屏的屏幕尺寸为23.6 cm,屏幕长宽比为16: 9,分辨率为1 920×1 080像素,刷新频率为60 Hz。字符呈现在刺激中间一个32×32像素的方块中。每两个相邻刺激的水平和垂直距离均为50像素。此外,刺激频率与相位均为线性递增;刺激按照从上到下、从左到右的方式依次排列,对应的频率和相位依次按0.2 Hz和0.5 π的步长增加,第一个刺激的频率和相位为8 Hz和0 π,最后一个刺激的频率和相位为15.8 Hz和1.5 π。在本研究中,采用正弦采样的刺激方法,并用JFPM方法编码视觉闪烁[10]。刺激程序是使用Psychophysics Toolbox Version 3在MATLAB(MathWorks, Inc.)环境下开发的。

实验包含6轮,每一轮包含40个试次,分别对应于40个字符。每个试次开始于持续时间为0.5 s的用于提示目标字符的红色方块,被试被要求在这0.5 s的提示时间内尽可能快地将视线转移到屏幕上的目标字符,提示时间结束的同时,所有字符对应的方块开始以相应的频率闪烁5 s,然后屏幕出现0.5 s的空白。对于每一轮,被试被要求在刺激闪烁的时间内尽量避免眨眼。为了减缓视觉疲劳,相邻轮次之间会有几分钟的休息。实验被安排在一个微暗、有照明的隔音实验室中进行。

1.3 数据收集和信号处理

EEG数据采集的为Pz、PO5、PO3、POz、PO4、PO6、O1、Oz和O2导联的数据,采样率是1 000 Hz,脑电放大器是Synamp2系统(Neuroscan, Inc.)。参考电极放在头顶,接地电极放在前额叶。所有的数据首先被降采样到250 Hz,然后根据时间触发器进行提取。

一个50 Hz的陷波滤波器被用来去除电源工频噪声干扰。除此之外,还用到了滤波器组分析,所用到的滤波器是Chebyshev Ⅰ型无限脉冲响应滤波器,对于第n个频带,其上截止频率和下截止频率分别是90 Hz和n×8 Hz (n=1,2,…,5),并且使用MATLAB中的filtfilt()函数进行正向和反向滤波。

1.4 模拟在线实验

模拟在线实验模拟的是真实在线实验的过程。在真实在线实验中,数据是被实时收集的,并随着时间的推移对一个个数据片段进行处理。相比于真实在线实验,模拟在线实验的优点在于可以在同一测试数据上进行不同方法的对比。考虑到视觉通路上的延迟,本文将刺激呈现之后0.14~5.14 s之间的数据段定义为一个试次,并用于后面的分析。所有试次的前5轮被分别用来建立基于TRCA的分类模型,剩下的1轮被用来进行模拟在线测试。在测试过程中,每个试次被一个接一个片段地送到建立好的分类模型中。在动态自适应策略中,每处理完一个数据片段,预测的分类结果和相应的置信度就会被更新。数据片段的原始长度是0.5 s,接下来每次增加的数据长度Δt是0.1 s。一旦预测结果的置信度达到了输出阈值或者输入的数据长度超过了预设的最大值tmax(比如1 s),那么这个数据片段输入过程将会停止,并且输出当前预测结果。

1.5 分类模型

最近,整合TRCA方法在识别SSVEP上展现了杰出的性能[16]。在TRCA中,空间滤波器u可以通过最大化试次之间的协方差得到,

$ \begin{align} & \sum\limits_{\begin{smallmatrix} {{h}_{1}}, {{h}_{2}}=1 \\ \ \ {{h}_{1}}\ne {{h}_{2}} \end{smallmatrix}}^{{{N}_{\text{t}}}}{{{C}_{{{h}_{1}}, {{h}_{2}}}}}=\sum\limits_{\begin{smallmatrix} {{h}_{1}}, {{h}_{2}}=1 \\ \ \ {{h}_{1}}\ne {{h}_{2}} \end{smallmatrix}}^{{{N}_{\text{t}}}}{\sum\limits_{{{j}_{1}}, {{j}_{2}}=1}^{{{N}_{\text{c}}}}{{{u}_{{{j}_{1}}}}{{u}_{{{j}_{2}}}}}}\text{Cov}\left( \mathit{\boldsymbol{x}}_{{{j}_{1}}}^{\left( {{h}_{1}} \right)}, \mathit{\boldsymbol{x}}_{{{j}_{2}}}^{\left( {{h}_{2}} \right)} \right)= \\ & \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ {{\mathit{\boldsymbol{u}}}^{\text{T}}}\mathit{\boldsymbol{Su}}. \\ \end{align} $ (1)

其中:xRNs, Ns是每个试次中采样点的数目,j表示通道的索引,Nc是通道的总数目,h表示训练试次的索引,Nt是训练试次的数目,

$ \mathit{\boldsymbol{S}}={{\left( {{S}_{{{j}_{1}}, {{j}_{2}}}} \right)}_{1\le {{j}_{1}}, {{j}_{2}}\le {{N}_{\text{c}}}}}, {{S}_{{{j}_{1}}{{j}_{2}}}}=\sum\limits_{\begin{smallmatrix} {{h}_{1}}, {{h}_{2}}=1 \\ \ \ {{h}_{1}}\ne {{h}_{2}} \end{smallmatrix}}^{{{N}_{\text{t}}}}{\text{Cov}\left( \mathit{\boldsymbol{x}}_{{{j}_{1}}}^{\left( {{h}_{1}} \right)}, \mathit{\boldsymbol{x}}_{{{j}_{2}}}^{\left( {{h}_{2}} \right)} \right)}. $

为了得到一个有限的解,将$ \sum\limits_{j=1}^{{{N}_{\text{c}}}}{{{u}_{j}}{{\mathit{\boldsymbol{x}}}_{j}}} $之间的协方差限制为1,

$ \sum\limits_{{{j}_{1}}, {{j}_{2}}=1}^{{{N}_{\text{c}}}}{{{u}_{{{j}_{1}}}}{{u}_{{{j}_{2}}}}}\text{Cov}\left( \mathit{\boldsymbol{x}}_{{{j}_{1}}}^{{}}, \mathit{\boldsymbol{x}}_{{{j}_{2}}}^{{}} \right)={{\mathit{\boldsymbol{u}}}^{\text{T}}}\mathit{\boldsymbol{Qu}}=1. $ (2)

其中:Q=(Qj1j2)1≤j1, j2Nc, Qj1j2=Cov(xj1, xj2)。最终的目标函数是

$ \mathit{\boldsymbol{\hat u}} = \arg \mathop {\max }\limits_\mathit{\boldsymbol{u}} {\kern 1pt} \frac{{{\mathit{\boldsymbol{u}}^{\rm{T}}}\mathit{\boldsymbol{Su}}}}{{{\mathit{\boldsymbol{u}}^{\rm{T}}}\mathit{\boldsymbol{Qu}}}}. $ (3)

最优解$ \mathit{\boldsymbol{\hat{u}}} $是矩阵Q-1S的特征向量。整合的空间滤波器U定义为

$ \mathit{\boldsymbol{U}}=\left[ {{{\mathit{\boldsymbol{\hat{u}}}}}_{1}}, {{{\mathit{\boldsymbol{\hat{u}}}}}_{2}}, \cdots , {{{\mathit{\boldsymbol{\hat{u}}}}}_{{{N}_{\text{f}}}}} \right]. $ (4)

其中:${{\mathit{\boldsymbol{\hat{u}}}}}$k(k=1, 2, …, Nf)代表第k个刺激的空间滤波器,Nf表示刺激的数目。被用来识别目标字符的特征系数为

$ \tilde{r}=\rho \left( {{\mathit{\boldsymbol{X}}}^{\text{T}}}\mathit{\boldsymbol{U}}, {{{\mathit{\boldsymbol{\bar{X}}}}}^{\text{T}}}\mathit{\boldsymbol{U}} \right). $ (5)

其中:ρ()表示Pearson相关系数,X表示测试数据的试次,X表示训练数据试次的均值。

通过使用滤波器组分析的方法[10],可以更好地利用嵌入到SSVEP谐波成分中的信息。原始的SSVEP信号X会首先被分解为不同的子频带成分(X(n), n=1, 2, …, N),然后根据式(6)对所有子带成分的特征系数(如${\tilde{r}}$k(1), ${\tilde{r}}$k(2), …, ${\tilde{r}}$k(N))的平方进行加权求和:

$ {{{\tilde{r}}}_{k}}=\sum\limits_{n=1}^{N}{w\left( n \right)}\cdot {{\left( \tilde{r}_{k}^{\left( n \right)} \right)}^{2}}, k=1, 2, \cdots , {{N}_{\text{f}}}. $ (6)

其中:n表示子带的索引,N表示子带的总数目,k表示刺激的索引,加权系数w(n)被定义为w(n)=n-1.25+0.25。在所有的指令类别中,预测的目标类别为最大的累加特征系数所对应的类别。

1.6 动态自适应策略

静止自适应策略对所有的试次使用固定的数据长度,而动态自适应策略动态地为每一个试次优化数据长度。由于不同试次之间的SSVEP特征存在着差异,因此每个试次都存在着各自的最优数据长度,动态自适应策略旨在为每个试次找到最优的数据长度,从而得到更高的信息传输率。本研究探讨了可能应用于SSVEP-BCI的基于Bayes估计的动态自适应策略。

就像1.5节所介绍的那样,预测的分类结果通过累加特征系数决定,因此假设特征系数值和分类准确率之间存在着相关性。基于Bayes的动态自适应策略试图通过计算给定特征系数值下正确预测的概率,来确定分类结果的置信度。特别地,就像图 1所显示的那样,利用所有的训练试次,分别为正确预测和错误预测构建关于特征系数的似然概率密度函数(probability density function, PDF)。这里的特征系数是经过标准化的最大累加相关系数,

$ {{d}_{\text{m}}}=\frac{{{{\tilde{r}}}_{\text{m}}}}{\sum\limits_{i=1}^{{{N}_{\text{f}}}}{{{{\tilde{r}}}_{i}}}}. $ (7)
图 1 基于Bayes动态自适应策略的流程图

其中${\tilde{r}}$m是所有类别中最大的累加特征系数。假设正确预测写作H1,错误预测写作H0。似然概率密度函数p(dm|H1, t)和p(dm|H0, t)用Gauss核密度估计来生成,其中t表示用于分类的数据长度。对不同的数据长度,正确预测和错误预测所对应的先验概率密度分布p(H1|t)和p(H0|t)用训练数据在不同数据长度下的分类准确率来估计。

在模拟在线实验过程中,对于每一个新的数据片段,先计算出预测的目标字符所对应的标准化累加特征系数,然后通过Bayes推论更新对应的被正确预测的后验概率,

$ \begin{align} &\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ P\left( {{H}_{1}}|{{d}_{\text{m}}}, t \right)= \\ &\frac{P\left( {{d}_{\text{m}}}|{{H}_{1}}, t \right)P\left( {{H}_{1}}|t \right)}{P\left( {{d}_{\text{m}}}|{{H}_{1}}, t \right)P\left( {{H}_{1}}|t \right)+P\left( {{d}_{\text{m}}}|{{H}_{0}}, t \right)P\left( {{H}_{0}}|t \right)}. \\ \end{align} $ (8)

一旦后验概率达到了阈值Pthre,预测的结果就会被输出,而阈值是通过网格法搜索离线确定的。如果当前的试次一直达不到阈值,那么预测结果也会在数据片段的长度达到预设最大值tmax之后被输出。

1.7 性能评估

除了分类准确率之Ac外,ITR也是目前最常用的评估BCI性能的参数之一,它同时考虑了准确率、刺激的数目和时间3个指标[7]

$ \begin{align} &\text{ITR}=\left( {{\log }_{2}}{{N}_{\text{f}}}+{{A}_{\text{c}}} \right.{{\log }_{2}}{{A}_{\text{c}}}+\left( 1-{{A}_{\text{c}}} \right)\cdot \\ &\left. \ \ \ \ \ \ \ \ \ \ {{\log }_{2}}\left( \frac{1-{{A}_{\text{c}}}}{{{N}_{\text{f}}}-1} \right) \right)\times 60/T. \\ \end{align} $ (9)

其中T是完成一次输出所需要的时间,包括目标注视时间(即所用到的数据长度),以及本文中额外的用于实际应用的视线转移时间0.55 s[23]。除了实际的数据长度,还存在一个理论的数据长度,它可以在最短时间内提供正确的分类结果。如果动态自适应策略中基于Bayes的概率估计方法对分类结果的正误判断不出错的话,那么错误就只会发生在预设的最大数据长度所对应的时刻。对所有的模拟在线测试的试次,可以计算出最优的平均数据长度、准确率,进而计算出理论信息传输率。

2 结果 2.1 模拟在线测试结果

图 2为动态自适应策略与整合TRCA分类模型的分类准确率和ITR的对比。本文并没有使用JFPM方法将刺激的相位间隔从0.5π改成0.35π。从图 2a中可以看出,由于DS策略在相同的数据长度上得到了比整合TRCA更高的准确率,因此图 2b中DS策略得到了更高的信息传输率。整合TRCA得到了一个峰值为(169.14±14.95)b/min的平均ITR,而DS策略得到的平均ITR为(230.2±65.8) b/min。配对t检验显示DS策略所得到的最高ITR显著优于整合TRCA(t34=11.55, p<0.001)。

图 2 DS策略与整合TRCA分类模型的对比

表 1显示的为FS策略、DS策略以及理论值的对比。如表 1所示,DS策略比FS策略有更高的平均ITR。配对t检验显示,对于ITR和准确率,DS策略要显著优于FS策略(ITR: t34=8.3, p<0.001;准确率: t34=4.7, p<0.001)。但是,对于所用到的数据长度,两种方法在统计上没有显著差异(t34=-1.7, p=0.1)。另外,DS策略的结果,包括数据长度、准确率和ITR,都显著差于理论值(所有的情况p<0.001)。

表 1 模拟在线测试结果
被试序号 FS策略 DS策略 理论值
t/ms Ac/% ITR/(b·min-1) t/ms Ac/% ITR/(b·min-1) t/ms Ac/% ITR/(b·min-1)
1 700 98 241 563 98 271 520 100 298
2 500 100 304 500 100 304 500 100 304
3 700 93 218 535 88 228 535 98 278
4 700 98 241 608 98 260 535 98 278
5 700 85 188 728 95 224 585 98 265
6 600 78 175 570 85 210 580 93 241
7 700 100 255 510 100 301 503 100 303
8 500 98 287 500 98 287 505 100 303
9 600 88 215 625 98 256 548 98 275
10 500 88 235 603 98 261 535 98 278
11 500 78 192 640 98 253 548 100 291
12 700 60 107 930 83 151 683 83 181
13 500 98 287 515 100 300 505 100 303
14 600 90 226 580 98 267 540 98 276
15 700 88 198 543 93 249 538 100 294
16 1 000 88 159 865 88 175 625 90 221
17 500 98 287 530 100 296 513 100 301
18 800 80 157 635 80 179 605 85 204
19 500 95 273 523 100 298 508 100 302
20 600 95 249 585 98 265 523 98 281
21 900 88 170 818 95 209 595 95 250
22 1 000 43 50 910 43 53 835 50 73
23 1 000 63 92 1 000 63 92 743 68 125
24 800 73 134 800 78 149 668 85 193
25 800 85 174 843 98 216 618 98 258
26 500 83 213 610 90 224 560 95 258
27 600 90 226 543 93 249 523 100 298
28 900 95 197 518 95 268 520 100 298
29 600 100 278 573 100 284 508 100 302
30 600 88 215 680 100 260 530 100 296
31 500 93 259 505 95 271 518 98 282
32 700 88 198 635 95 242 553 98 273
33 700 90 208 668 98 247 550 100 290
34 900 93 188 823 95 209 603 100 277
35 1 000 40 46 985 40 46 875 53 76
均值 689 86 204 657 90 230 575 93 258
标准差 166 15 63 151 15 66 90 13 61

2.2 ITR提升分析

图 3展示的是DS策略比对应的FS策略的ITR提升情况。可以发现,不同的被试有着不同的ITR提升比例,所有被试提升比例的均值是13.5%,其中提升比例最高的是第12名被试,达到40.8%。并且,使用DS策略,所有被试的ITR比使用FS策略的都没有出现负增长。这些结果表明, 使用TRCA分类模型的DS策略能够进一步提升被试的BCI表现。

图 3 各被试DS策略相对FS策略的ITR提升比例

2.3 输出过程分析

图 4显示的是在模拟在线测试期间使用DS策略在不同时刻的累计输出比例。为了对比,理论值的输出情况也显示了出来。对于正确的输出比例,在各个时刻,理论情况的输出都要显著高于DS策略(所有的情况p<0.001)。但是,DS策略对应的输出比例有更快的增长趋势,而且在1 s处实现了和理论值相当的输出比例。图 4b所示为不同方法的错误输出比例。在理论情况下,1 s以前没有错误输出;在1 s处,使用DS策略的错误输出显著多于理论情况(t34=5.2, p<0.001)。

图 4 DS策略和理论值的累积输出比例随时间的变化

3 讨论

关于DS策略的研究主要集中在基于P300的BCI系统中,将其引入到SSVEP-BCI的相关研究相对较少。自适应的方法在早期被用来根据被试当前的在线实时表现,动态地限制子试次呈现的数目,从而减少刺激呈现的时间,进而达到优化ITR和准确率的目的[18-20]。随后,Mainsah等提出了基于Bayes推断的用于P300拼写器的数据驱动算法,它基于用户EEG数据的信噪比,自适应地选择子试次的数量,从而提高拼写速度[21]。最近,Aydin等提出了动态自适应算法来确定所需要的刺激序列的数目,并用受试者工作特征(receiver operating characteristics, ROC)曲线的最优工作点来确定阈值,结果显示动态自适应策略能够显著提升系统性能,并降低刺激序列的数目和出现错误的比例[22]。至于DS策略在SSVEP-BCI上的应用,Yin等提出了一个动态优化刺激时间以提升系统性能的方法[6]。在本研究中,基于Bayes估计的DS策略被整合到SSVEP-BCI中,除了以累加的相关系数作为特征,还使用了依赖于时间的信息来计算分类结果的置信度。另外,有3名被试的数据在使用DS策略处理之后所得到的ITR,与使用FS策略的情况相比并没有提高(见图 3中的第2、8和23名被试),这可能是由于相对较低的分类准确率并没有能提供足够的信息用来评估分类的置信度。

4 结论

本文提出的Bayes动态自适应策略能够显著提升SSVEP-BCI的性能。该方法通过建立关于EEG特征值的正确预测和错误预测概率分布模型,结合相应的先验概率分布,从而利用Bayes推论估计未知EEG片段的正确预测概率,并与预设的阈值进行比较,以决定是否在当前时刻输出预测的分类结果,最终实现了自适应地为每个个体的每个试次优化数据长度的目的。结果显示:相比于传统的FS策略,本文方法可以在几乎不损失分类准确率的基础上,缩短了所用到的平均数据长度,从而得到更高的ITR。未来的研究将聚焦于将动态自适应策略整合到实际的在线SSVEP-BCI系统中。

参考文献
[1]
ABDULKADER S N, ATIA A, MOSTAFA M S M. Brain computer interfacing:Applications and challenges[J]. Egyptian Informatics Journal, 2015, 16(2): 213-230. DOI:10.1016/j.eij.2015.06.002
[2]
KÜBLER A, MVLLER-PUTZ G, MATTIA D. User-centred design in brain-computer interface research and development[J]. Annals of Physical and Rehabilitation Medicine, 2015, 58(5): 312-314. DOI:10.1016/j.rehab.2015.06.003
[3]
CHEN X G, CHEN Z K, GAO S K, et al. A high-ITR SSVEP-based BCI speller[J]. Brain-Computer Interfaces, 2014, 1(3-4): 181-191. DOI:10.1080/2326263X.2014.944469
[4]
GAO S K, WANG Y J, GAO X R, et al. Visual and auditory brain-computer interfaces[J]. IEEE Transactions on Biomedical Engineering, 2014, 61(5): 1436-1447. DOI:10.1109/TBME.2014.2300164
[5]
XU M P, QI H Z, WAN B K, et al. A hybrid BCI speller paradigm combining P300 potential and the SSVEP blocking feature[J]. Journal of Neural Engineering, 2013, 10(2): 026001. DOI:10.1088/1741-2560/10/2/026001
[6]
YIN E W, ZHOU Z T, JIANG J, et al. A dynamically optimized SSVEP brain-computer interface (BCI) speller[J]. IEEE Transactions on Biomedical Engineering, 2015, 62(6): 1447-1456. DOI:10.1109/TBME.2014.2320948
[7]
YUAN P, GAO X R, ALLISON B, et al. A study of the existing problems of estimating the information transfer rate in online brain-computer interfaces[J]. Journal of Neural Engineering, 2013, 10(2): 026014. DOI:10.1088/1741-2560/10/2/026014
[8]
ZHANG Y S, XU P, LIU T J, et al. Multiple frequencies sequential coding for SSVEP-based brain-computer interface[J]. PLoS One, 2012, 7(3): e29519. DOI:10.1371/journal.pone.0029519
[9]
WANG Y, WANG Y T, JUNG T P. Visual stimulus design for high-rate SSVEP BCI[J]. Electronics Letters, 2010, 46(15): 1057-1058. DOI:10.1049/el.2010.0923
[10]
CHEN X, WANG Y, NAKANISHI M, et al. High-speed spelling with a noninvasive brain-computer interface[J]. Proceedings of the National Academy of Sciences of the United States of America, 2015, 112(44): E6058-E6067. DOI:10.1073/pnas.1508080112
[11]
CHEN X G, WANG Y J, ZHANG S G, et al. A novel stimulation method for multi-class SSVEP-BCI using intermodulation frequencies[J]. Journal of Neural Engineering, 2017, 14(2): 026013. DOI:10.1088/1741-2552/aa5989
[12]
YIN E W, ZEYL T, SAAB R, et al. A hybrid brain-computer interface based on the fusion of P300 and SSVEP scores[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2015, 23(4): 693-701. DOI:10.1109/TNSRE.2015.2403270
[13]
CHENG M, GAO X R, GAO S K, et al. Design and implementation of a brain-computer interface with high transfer rates[J]. IEEE Transactions on Biomedical Engineering, 2002, 49(10): 1181-1186. DOI:10.1109/TBME.2002.803536
[14]
BIN G Y, GAO X R, YAN Z, et al. An online multi-channel SSVEP-based brain-computer interface using a canonical correlation analysis method[J]. Journal of Neural Engineering, 2009, 6(4): 046002. DOI:10.1088/1741-2560/6/4/046002
[15]
WANG Y J, NAKANISHI M, WANG Y T, et al. Enhancing detection of steady-state visual evoked potentials using individual training data[C]//Proceedings of the 36th Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Chicago, USA, 2014: 3037-3040.
[16]
NAKANISHI M, WANG Y J, CHEN X G, et al. Enhancing detection of SSVEPs for a high-speed brain speller using task-related component analysis[J]. IEEE Transactions on Biomedical Engineering, 2018, 65(1): 104-112. DOI:10.1109/TBME.2017.2694818
[17]
SCHREUDER M, HÖHNE J, BLANKERTZ B, et al. Optimizing event-related potential based brain-computer interfaces:A systematic evaluation of dynamic stopping methods[J]. Journal of Neural Engineering, 2013, 10(3): 036025. DOI:10.1088/1741-2560/10/3/036025
[18]
LENHARDT A, KAPER M, RITTER H J. An adaptive P300-based online brain-computer interface[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2008, 16(2): 121-130. DOI:10.1109/TNSRE.2007.912816
[19]
LIU T, GOLDBERG L, GAO S K, et al. An online brain-computer interface using non-flashing visual evoked potentials[J]. Journal of Neural Engineering, 2010, 7(3): 036003. DOI:10.1088/1741-2560/7/3/036003
[20]
JIN J, ALLISON B Z, SELLERS E W, et al. An adaptive P300-based control system[J]. Journal of Neural Engineering, 2011, 8(3): 036006. DOI:10.1088/1741-2560/8/3/036006
[21]
MAINSAH B O, COLLINS L M, COLWELL K A, et al. Increasing BCI communication rates with dynamic stopping towards more practical use:An ALS study[J]. Journal of Neural Engineering, 2015, 12(1): 016013. DOI:10.1088/1741-2560/12/1/016013
[22]
AKMAN AYDIN E, BAY Ö F, GVLER AI·U. A dynamic stopping algorithm for P300 based brain computer interface systems[C]//Proceedings of the International Conference on Medical and Biological Engineering 2017. Singapore: Springer, 2017: 723-728.
[23]
WANG Y J, CHEN X G, GAO X R, et al. A benchmark dataset for SSVEP-based brain-computer interfaces[J]. IEEE Transactions on Neural Systems and Rehabilitation Engineering, 2017, 25(10): 1746-1752. DOI:10.1109/TNSRE.2016.2627556