形态复杂词加工的认知神经机制
阿布都克力木·阿布力孜 1,2 , 江铭虎 1,2 , 姚登峰 1,2 , 哈里旦木·阿布都克里木 3     
1. 清华大学 人文学院, 计算语言学实验室, 北京 100084;
2. 清华大学 心理学与认知科学研究中心, 北京 100084;
3. 清华大学 智能技术与系统国家重点实验室, 北京 100084
摘要:该文使用事件相关电位(event-related potentials,ERPs)以词汇判断的实验范式探讨了维吾尔语形态复杂词加工的认知神经机制。实验刺激材料设计了4个因素,分别为单语素词(没有带任何词缀)、单语素假词(真词中替换2个音构成)、屈折词(单语素名词后加格附加成分构成)、屈折假词(假词干真词缀的词)。实验材料的长度严格控制在平均词长为6个字母。脑电实验数据显示,屈折词和屈折假词在350~550 ms时间窗口出现比较明显的N400效应。其中屈折假词的N400效应是被试加工假词时词汇搜索失败的标志,但屈折词的N400效应则反映了词汇通达时词干和词缀之间的交互作用。另外还发现单语素词、屈折词和屈折假词这三者的认知神经基础也不同。在大脑右半球屈折词引发的负波平均振幅比左半球要大。结果表明:母语为维吾尔语者的被试在加工维吾尔语屈折词时按其语素分解加工,但是加工维吾尔语单语素词时是整体加工及存储的。
关键词形态复杂词汇    维吾尔语    ERPs    假词    
Neurocognitive mechanism for morphological complex word processing
ABULIZI Abudukelimu1,2, JIANG Minghu1,2, YAO Dengfeng1,2, ABUDUKELIMU Halidanmu3     
1. Laboratory of Computational Linguistics, School of Humanities, Tsinghua University, Beijing 100084, China;
2. Center for Psychology and Cognitive Science, Tsinghua University, Beijing 100084, China;
3. State Key Laboratory of Intelligent Technology and Systems, Tsinghua University, Beijing 100084, China
Abstract: Event-related potentials (ERPs) were used to investigate electrophysiological correlates of Uyghur morphological word processing in lexical decision paradigms. Four stimuli were used with monomorphemic words, bimorphemic inflected nouns (case suffix is added to the stem), monomorphemic pseudowords (changing one or two letters in monomorphemic nouns) and inflected pseudowords (changing one or two letters in stems). The mean phonemic length of all the words was controlled to be six letters long. EEG data showed N400 effects for the bimorphemic complex words and pseudowords in the 350-550 time windows. The N400 effects for the bimorphemic pseudoword were demonstrated that subjects failed all lexical searches when processing bimorphemic pseudowords. The effect for the bimorphemic complex words most probably reflects the access and possible interaction of the stems and suffixs. The EEG data also showed the differences in the neurocognitive underpinning that supports monomorphemic words, bimorphemic inflected words and both types of pseudoword processing. The mean amplitudes for bimorphemic words are more negative in the right hemisphere electrodes than for monomorphemic words. The experimental results reveal that native Uyghur speakers represent and access inflected Uyghur words in a morphologically decomposed form, while monomorphemic words are accessed as a single form.
Key words: morphological complex word     Uyghur     ERPs     pseudoword    

众所周知,词汇是自然语言处理中最核心的因素,当我们要表达某种思想时,它们会迅速从庞大的心理词典中搜索并提取出合适的词汇,然后通过发音完成言语交流,而且所有这一切都是在很短的时间内发生的。语言理解也经历了类似的过程。言语交流及理解过程给我们的印象是大脑心理词典是由一个个独立的、具体的单词组成的。虽然一些语言研究证明并支持这一观点[1],实际上心理词典中词汇信息的存储及提取形式并非如此,尤其是词汇形态变化复杂的黏着语更是如此。

数十年的心理语言学、认知神经科学研究表明,人类认知系统对语言的形态结构特别敏感[2]。人类大脑如何描述语言形态结构,特别是理解复杂词汇的形成原则,一直是心理语言学领域的一个关键问题。研究表明心理学上的形态并不完全映射到语言学上的形态,因为形态复杂词的表征及加工由绩效 (performance) 因素决定,包括词干和词缀的出现顺序、语义透明度、词频等因素[3]。鉴于此,语言学上屈折词和派生词等形态复杂词之间的关系并不完全与心理语言学中词汇加工之间的关系对应。因此“work+s”,“house+s”等形态复杂词在大脑中的表征及加工问题引起了心理语言学及认知神经科学学者的兴趣。形态复杂词在大脑心理词典中以整体形式表征及加工还是以其形态结构分解词基、词干之类的词素来表征及加工?如果是后者,那么“workless”,“working”,“homework”等之类的复杂形态词在分解时是不是会分解成相同的“work”及其他形态变化词素,换句话说形态复杂词在分解形态结构时,大脑发生了什么样的词法分析过程?这一过程中生成了何种表征形式?

要回答上述问题,必须要研究由2个或2个以上语素构成的形态复杂词的大脑心理词典表征及加工过程。本文通过ERPs实验探讨了维吾尔语形态复杂词的认知神经机制,分析维吾尔语形态复杂词和单语素在心理词典中的表征及加工方式是否是相同的,还是各自以独立的词条存储及加工的,从而解释我们为何具备理解和生成形态复杂词的能力。

1 形态词的加工模型

为了描述形态复杂词在心理词典中表征及存储形式,学术界已经提出了不同的模型。整体表征模型认为,不管形态复杂词的形态结构如何,每个词汇在心理词典中是各自独立的表征形式[4-7]。这意味着一个词汇不管具备多少形态单位,大脑心理词典将会对它进行完全独立的表征及存储。无论词汇在形态结构上是超级简单,还是多么复杂,他们在心理词典中的表征及存储形式是相互独立的。因此人类大脑在存储和通达形态复杂词时,单个形态词素起不到任何作用。Feldman[8]还认为形态词的认知是通过输入刺激和词汇表征之间的匹配程序实现的。如果它们相同,则输入形式被认定为属于心理词典中的词汇。在此模型下,有形态变化的词汇“walked”和无形态变化的词汇“dog”的认知方式是一样的。匹配过程一般被认为是通过词汇通达单位调解的[9]。词汇通达单位对词汇出现的相对频率比较敏感。因此在加工过程中它调解不同词汇的获取速度。

相对于整体表征模型,基于语素表征模型认为[10-11],在形态复杂词汇的认知过程中,像词缀这样的附加成分首先从词干中剥离出,之后对词干进行词汇表征搜索。若词干被成功地搜索到,则整词从所谓的主文件 (master file) 中获取,其中有相同词干的词汇聚类在一起[12-13]。Taft等[10]认为形态复杂词的形态结构对大脑表征及加工过程影响很大,因为在心理词典中包含着词汇的形态信息,词缀和词根是以相互独立的形式分别存储在心理词典中。因此所有的形态复杂词 (单语素词除外) 的词根与词缀分别有各自独立的词条。大脑表征形态复杂词时,先对目标复杂词进行拆分,然后在大脑心理词典中分别找出对应的词干和词缀,通过计算,最后获取整个复杂词的概念意义。

Taft等[10]提出了一个假设:形态分解假说 (morphological decomposition hypothesis),例如:“unlucky”和“cats”等词汇都是以词基 (指所有能添加曲折词缀的词素) 形式存储在心理词典当中,即“luck”和“cat”。分析时,大脑将会首先搜索各自的词基形式,这种分析过程被称为词缀剥离 (prefix-stripping)。

双路或混合模型则认为,在形态复杂词的加工过程中整体加工和基于语素加工都可以发生。根据AAM (augmented addressed morphology)[14]模型,分解加工路线和整体加工路线是并行进行的。Caramazza等[14]认为该模型有整体通达和分解通达2个竞争通达程序系统,当被试对一个词特别熟悉时,整体通达程序胜出,即进行整体表征及加工;当被试遇到不熟悉的词时,则启用分解加工模式。整体加工所需要的时间比分解加工所需要的时间短。在双路或混合模型中,词频、透明度等因素在形态复杂词的加工过程中起着重要的作用。

芬兰语的词干语素变体/屈折分解模型 (stem allomorph/inflectional decomposition,SAID)[15]认为芬兰语中的屈折词是分解加工的 (除了高频屈折词外) 而芬兰语中的派生词是进行整体加工的。SAID模型认为在语言生成过程中屈折词和派生能力比较强的派生词均进行分解加工。对词干变体来说,该模型表明词干是通过其变体表征的而不是通过单个语素表征的。

大部分有关形态复杂词的表征及加工的电生理学研究都是以英语、法语、德语、荷兰语等西方语言为研究材料的。这些语言的词汇结构一般没有那么复杂,形态变化也没有那么丰富。这些研究主要比较了规则动词和不规则动词的加工过程。近年来,对汉语这种词汇结构极为简单的语言 (只有复合词),我们已经有了较多的了解[16],但对于词汇结构复杂和形态变化丰富的语言,还知道得相对较少。具有词汇结构复杂的语言很多属于黏着语系。在这种语系的语言中,词缀 (主要是后缀) 可以比较自由地附着在上一个词缀上,构成一个具有多词缀的多词素词,如突厥语族。土耳其语是一个典型的突厥语。有学者指出土耳其语多词素词的词汇通达几乎肯定是分解式的,而非整词形式[17],但是也有学者证明突厥语中的形态复杂词是整体加工的[18]

维吾尔语属于阿尔泰语系突厥语族,也是一种黏着语言。它使用了基于波斯语、阿拉伯语的字母系统,并且具有丰富的形态变化,有主—宾—谓词序。名词有数、人称、格等附加成分,动词的形态变化比名词还复杂。其特征如下:1) 其词干绝大部分是自由词干,可以作为单词独立使用;2) 词缀多为后缀,前缀比较少;3) 词干可后接若干个词缀,构成多语素词;4) 名词有数、从属人称、格等语法范畴;5) 动词有态、肯定否定、时、人称等附加成分;6) 表示各种情态的助动词比较发达。因此维吾尔语的这些特征为我们提供了研究形态变化复杂词在大脑心理词典中如何表征及存储的机会。

2 实验 2.1 实验材料

实验总共选了640个维吾尔语名词,分成4种条件 (实验材料从清华大学计算机系人工智能实验室的语料库中挑选出来):1) 是单语素词,没有带任何词缀;2) 是单语素假词,通过替换单语素真词中2个音构成,同时遵守维吾尔语语音系统规则;3) 是屈折名词,由单语素名词后面加名词格的附加成分构成 (比如:“” (即“从马路”) 分成2个语素:“”(即“马路”) 和“”(即“从”);4) 是屈折假词,由假词干和真词缀组成。每一个条件有160个词。实验材料的词长严格控制在平均6个字母 (如表 1所示)。

表 1 实验材料类型
类型 词汇 翻译
单语素词 新闻
单语素假词
屈折词 (2个语素) 在眼睛上
屈折假词

2.2 被试

共招募了21名维吾尔族大学生,其年龄在18~25岁之间,平均年龄为21.3岁,均为中央民族大学维吾尔语系或预科部学生,均出生在维吾尔语家庭,从小接受维吾尔语教育。所有被试裸视或矫正视力正常,均为右利手 (实验前通过爱丁堡手利测试),无失语症和精神障碍等症状。

2.3 实验过程

整个实验在清华大学心理学与认知科学研究中心完成。所有实验材料提前输入到E-prime刺激呈现程序中。实验开始之前让每位被试阅读并签署知情通知书,并被告知实验过程及注意事项。实验分成2个部分,首先是练习部分,让被试熟悉整个实验过程,然后进行正式实验。正式实验开始时被试前面的灰色屏幕中央呈现34号字体的红色“+”注视点,呈现时间为800 ms,提醒被试观看注视点,接着呈现24号字体的维吾尔语刺激材料,呈现时间为400 ms,目标词的出现顺序是随机的,接着呈现双问号“??”的灰底白字探测界面,呈现时间为1500 ms,要求被试尽快且尽量正确地判断屏幕中央出现的词在维吾尔语里面是否为真词?若屏幕上出现的是真词,则被试按手中游戏手柄的右边按钮;若出现的是假词就按手柄的左边按钮。最后出现1000 ms的间隔灰屏,供被试眨眼放松,以减少被试在刺激呈现和反应过程中眨眼造成的脑电噪音。整个实验延续40 min,每7 min休息一次,然后接着做下面的实验。

2.4 ERPs数据记录与分析

脑电实验仪器采用德国BP公司的直流式64导诱发脑电位仪,实验利用Brain Vision Recorder Version1.05脑电记录软件和64导电极帽收集被试脑电数据。其参考电极置于鼻尖处,前面Gnd电极接地,并以水平眼电 (HEOL和HEOR) 和垂直眼电 (VEOL和VEOU) 监测眼电变化。脑电信号由放大器放大,滤波带通为0.05~40 Hz,采样频率为500 Hz,离线分析处理ERPs数据。各电极点头皮电阻均为10 kΩ以下。利用Brain Vision Analyzer Version 1.05脑电分析软件,完成连续记录脑电后离线处理数据,对连续记录的原始数据进行预处理:实验中反应错误或信号干扰严重的脑电事件被剔除,不予统计分析。

分析时程为刺激材料出现后的800 ms,基线为刺激材料出现前100 ms,自动删除眼电、肌电等伪迹,并在实际的脑电分析中删除伪迹过多和记录数据不全的被试数据。

2.5 ERPs结果

根据以往的研究和本文研究的目的,本文选取了9个电极进行总平均,分别是额叶处的F3F4Fz,顶叶处的C3C4Cz,枕叶处的P3P4Pz。其脑电数据如图 1所示,对应曲线分别是单语素词、单语素假词、屈折词 (双语素词)、屈折假词。刺激材料呈现的100 ms为基线矫正,负波时向上绘制。

图 1 9个电极的ERPs总平均

图 2所示,350~550 ms时间窗口N400词汇性效应统计学上显著[F (1,19)=15.17,p=0.004],假词比真词引发比较大的负波。形态性主效应显著[F (1,19)=11.66,p=0.008],双语素词的平均波幅比单语素词引发更大的负波。形态性与大脑半球交互作用显著[F (2,18)=9.97,p=0.002],因为在大脑右半球对双语素词引发较大的负波。对词汇性进行单因素方差分析,结果显示:双语素真词在大脑右半球引发负波波幅比假词更大。但在550~800 ms时间窗口里,词汇性和大脑半球之间交互作用显著[F (2,36)=10.9,p < 0.046],在大脑右半球假词的平均波幅比真词更大。

图 2 4种刺激材料开始呈现的350~550 ms,550~800 ms窗口之间不同波形的大脑地形图

词性和大脑区域之间交互作用显著[F (2,36)=8.98,p < 0.003],对假词的加工过程中大脑中央、枕叶区域出现较大的负波,而且这些负波相对于大脑左半球,右半球表现更为强烈。对每个电极分别进行独立方差分析,结果显示:负波效应在右半球的中央区域电极和顶叶区域电极上更为明显。

3 结论

本文通过ERPs来研究维吾尔语屈折词在心理词典中的表征及存储形式。比较单语素词和屈折词的加工过程发现,屈折词和单语素词引发各自不同的ERPs效应。屈折词的加工过程中出现明显的N400效应。这是因为被试加工复杂形态词时,首先要分解词根和词缀,最后整合此两者时引发了N400效应。类似的效应也出现在英语[19]、西班牙语[20]、德语[21]等语言中,这些语言研究表明,规则动词加工过程中会被分解为词基和词缀。但是不规则动词是整体形式进行获取。本文实验中,除了屈折词外,在350~550 ms的时间窗口里,屈折假词也引发出强烈的N400效应,因为形态复杂假词也有可能进行形态分解。N400效应的出现,表明维吾尔族被试搜索屈折假词的时候也会进行分解形态结构,当被试找不到相应的词基形式时 (因为实验中的屈折假词由假词干真词缀组成的),就会出现N400效应,从而没有必要继续对词缀进行形态加工。这是本实验中没有发现P600效应的主要原因。另一方面,单语素词、单语素假词、屈折词和屈折假词的神经认知机制也不同,屈折词和屈折假词在大脑右半球的主效应比单语素词显著。假词的负波波幅在右半球区域比左半球更为显著。总的来说,本文认为母语为维吾尔语的被试在加工维吾尔语形态复杂词时,大脑对屈折词进行形态结构分解,以便进行表征及加工,但是对维吾尔语单语素词进行整体加工。

下一步工作将通过功能核磁共振等手段来研究维吾尔形态复杂词加工的认知神经机制,以便对形态复杂词的加工进行更为透彻的认识。

参考文献
[1] Coltheart M, Curtis B, Atkins P, et al. Models of reading aloud: Dual-route and parallel-distributed-processing approaches?[J]. Psychological Review, 1993, 100(4): 589–608. DOI:10.1037/0033-295X.100.4.589
[2] Post B, Marslen-Wilson W, Randall B, et al. The processing of English regular inflections: Phonological cues to morphological structure[J]. Cognition, 2008, 109(1): 1–17. DOI:10.1016/j.cognition.2008.06.011
[3] Mcqueen J M, Cutler A. Morphology in Word Recognition[M]. Oxford: Blackwell Publisher, 1998.
[4] Butterworth B. Lexical representation[C]//Language Production. London: Academic Press, 1983: 257-294.
[5] Bradley D. Lexical representation of derivational relation[C]//Juncture. Saratoga, CA: Anma Libri, 1980: 37-55.
[6] Kempley S, Morton J. The effects of priming with regularly and irregularly related words in auditory word recognition[J]. British Journal of Psychology, 1982, 73(4): 441–454. DOI:10.1111/bjop.1982.73.issue-4
[7] Lukatela G, Gligorijevi Ac'5 B, Kosti Ac'5 A, et al. Representation of inflected nouns in the internal lexicon[J]. Memory & Cognition, 1980, 8(5): 415–423.
[8] Feldman L B. Morphological Aspects of Language Processing[M]. Hillsdale, NJ: Lawrence Erlbaum Associates Inc., 1995.
[9] Morton J, Marshall J C. Psycholinguistics 2: Structures and Processes[M]. Cambridge, MA: MIT Press, 1979.
[10] Taft M, Forster K I. Lexical storage and retrieval of prefixed words[J]. Journal of Verbal Learning and Verbal Behavior, 1975, 14(6): 638–647. DOI:10.1016/S0022-5371(75)80051-X
[11] Taft M. Prefix stripping revisited[J]. Journal of Verbal Learning and Verbal Behavior, 1981, 20(3): 289–297. DOI:10.1016/S0022-5371(81)90439-4
[12] Mackay D G. Derivational rules and the internal lexicon[J]. Journal of Verbal Learning and Verbal Behavior, 1978, 17(1): 61–71. DOI:10.1016/S0022-5371(78)90529-7
[13] Jarvella R J, Meijers G. Recognizing morphemes in spoken words: Some evidence for a stem-organized mental lexicon[C]//The Process of Language Understanding. New York, USA: Wiley, 1983: 81-112.
[14] Caramazza A, Laudanna A, Romani C. Lexical access and inflectional morphology[J]. Cognition, 1988, 28(3): 297–332. DOI:10.1016/0010-0277(88)90017-0
[15] Niemia J, Laineb M, Tuominenc J. Cognitive morphology in finnish: Foundations of a new model[J]. Language and Cognitive Processes, 1994, 9(3): 423–446. DOI:10.1080/01690969408402126
[16] 玛依拉·亚克甫, 周晓林. 词素效应到底是什么?——来自维吾尔语的证据[J]. 心理学报, 2004, 36(5): 515–524. YAKUP Mahire, ZHOU Xiaolin. What are really morphological effects in lexical processing? Evidence from the Uyghur language[J]. Acta Psychologica Sinica, 2004, 36(5): 515–524. (in Chinese)
[17] Hankamer J. Morphological parsing and the lexicon[C]//Lexical Representation and Process. Cambridge, MA, USA: MIT Press, 1989: 392-408.
[18] Gürel A. Decomposition: To what extent? The case of Turkish[J]. Brain and Language, 1999, 68(1-2): 218–214. DOI:10.1006/brln.1999.2085
[19] Münte T, Say T, Clahsen H, et al. Decoposition of morphologically complex words in English: Evidence from event-related brain potentials[J]. Cognitive Brain Research, 1999, 7: 241–253. DOI:10.1016/S0926-6410(98)00028-7
[20] Linares R E, Rodriguez-Fornells A, Clahsen H. Stem allomorphy in the Spanish mental lexicon: Evidence from behavioral and ERP experiments[J]. Brain and Language, 2006, 97(1): 110–120. DOI:10.1016/j.bandl.2005.08.008
[21] Weyerts H, Münte T F, Smid H G, et al. Mental representations of morphologically complex words: An event-related potential study with adult humans[J]. Neuroscience Letters, 1996, 206(2-3): 125–128. DOI:10.1016/S0304-3940(96)12442-3