母语为粤语和英语的普通话学习者的话语基频偏误特征
顾文涛     
南京师范大学 语言科技研究所, 南京 210097
摘要:语音的自然度在很大程度上取决于韵律特征如声调、句调、轻重音等,而普通话、粤语与英语在这些特征上形成了鲜明对比。该文以普通话为研究对象,采用声学分析比较了普通话母语被试以及母语分别为标准粤语和美式英语的2组普通话二语被试的基频特征。通过一组句类、目标字调、焦点位置受控的语句,考察了每组被试的句调、声调、焦点重音的基频编码方式以及三者间的交互作用。研究发现,2组二语被试的偏误特征有同有异,很大程度上可归因于语言负迁移效应,这为汉语的二语语音韵律教学提供了启示。
关键词声调     句调     焦点重音     普通话     粤语     英语     二语韵律偏误    
Error patterns in fundamental frequency contours of L2 Mandarin utterances by Cantonese and English learners
GU Wentao     
Institute of Linguistic Science and Technology, Nanjing Normal University, Nanjing 210097, China
Abstract:Natural speech strongly depends on the prosodic features such as tone, intonation and stress, which are very different in Mandarin, Cantonese and English. This study compares the fundamental frequency (f0) contours of Mandarin speech between native speakers and 2 groups of L2 learners who were native in HK Cantonese and American English. The f0 manifestations in tone, intonation and emphatic stress as well as their interactions are evaluated for a set of controlled sentences varying in sentence type, tone identity, and focus position. The results show that most L2 errors can be ascribed to negative transfers from the L1. The findings have pedagogical implications for learners with particular L1s to improve their L2 Mandarin prosody.
Key words: tone     intonation     emphatic stress     Mandarin     Cantonese     English     L2 prosodic error    

语音的自然度在很大程度上取决于韵律特征如声调、 句调、 重音(包括词重音和句重音)等。这些韵律元素各自的声学编码方式以及相互间的作用方式往往因语言而异。已有很多研究显示[1],很大部分的二语韵律偏误可以归因于跨语言差异导致的语言负迁移效应。

近年来有不少关于二语普通话字调偏误的研究,但是在语句层面上考察二语普通话韵律的研究仍是凤毛麟角[2]。本文研究二语普通话的话语音高(即基频)的偏误特征。除目标语言普通话外,涉及的2个背景语言是港澳地区的标准粤语(下文简称为粤语)和通用美式英语(下文简称为英语)。普通话、 粤语、 英语这3种语言在韵律音系特征(包括声调、 句调、 重音等)上形成了鲜明对比。

普通话和粤语都是汉语言的成员,自然也都是声调语言。按照汉语音韵学的传统,每个音节划分为声母和韵母两部分,而声调主要由韵母承载,其主要音征是基频f0表 1给出了普通话和粤语声调系统的详细描述,包括调类、 音高特征、 以及五度制调值。其中,普通话有4个调类(音高特征分别是高、 升、 低、 降; 其中T3只在句尾或者突显音节上是降升调)以及一个轻声T0(其音高特征随前字调而变); 粤语则有6个调类。普通话音节有轻重之分(不存在音位意义上严格的轻重音对比,但是轻声的存在起到了轻音节的作用),粤语的音节则没有轻重之分。英语不是声调语言,每个音节的音高没有区别词义的作用; 但是,英语是重音语言,每个词的各个音节有不同的突显程度。

表 1 普通话和粤语的声调系统
普通话粤语
调类音高特征调值调类音高特征调值
T155TC1高平55
T235TC2高升25
T3低 / 降升21(4)TC3中平33
T451TC4低降21
TC5低升23
T0轻声TC6低平22

在这3种语言中(事实上在绝大多数语言中都是如此),陈述句的句调一般是降调,不带疑问词的是非疑问句(或者称为语调疑问句)的句调一般是升调。但是,疑问句升调的具体表现因语言而异。英语和粤语疑问句调的提升几乎全集中在句尾[3-5],对此,自主音段节律(autosegmental-metrical)理论引入的边界调可给出有效的描述[3]。普通话疑问句调的提升则具有全局性,从句首起疑问句的音高就比陈述句的高[6-7],虽然音高提升的幅度往往还是在句尾达到峰值[8]

对于与话语焦点相关联的强调重音(即焦点重音),其音高编码方式因语言而异。普通话和英语的编码方式都是非对称的,即焦点前无变化、 焦点内提升并扩展、 焦点后抑制[9-10]; 而粤语的编码方式不同,焦点内和焦点后都提升并扩展(没有焦点后抑制现象),或者有些人音高几乎不变、 仅通过音长音强编码[11-13]。此外,Liu等[8]发现,普通话的疑问句调与焦点重音的交互作用方式表现为疑问句基频提升是从焦点音节开始的。

1 实验语料

为了在相同条件下做对比实验,本文以朗读语料为实验对象,设计了一组严格受控的句子,文字和拼音如下所示(句子以句号或者问号结束):

他帮[朱/竺/祖/祝]科长[发/砸/打/炸][包/桃/枣/炮]。/?

“Ta1 bang1 [zhu1/zhu2/zu3/zhu4] ke1zhang3 [fa1/za2/da3/zha4] [bao1/tao2/zao3/pao4]。/?”

可见,在固定的载体句中嵌入了3个设定音节(方括号内),分别是句中音节的姓氏、 倒数第二音节的动词、 句尾音节的名词。每个设定音节含韵母相同(分别为“u”“a”“ao”)而声调各异的4个选项。全句所有音节的声母都是清辅音,由于声调主要由韵母承载,这样的设计不仅便于声韵切分,而且让辅音对声调的影响减至最小。所有句子都是有意义的文本,系统变化的是以下3个变量:

1) 句子类型(2个选项): 陈述句、 不带疑问助词的是非疑问句(或称语调问句)。

2) 3个设定音节的字调(每个音节4个选项): T1—T4; 这里不考虑轻声。

3) 焦点位置(4个选项): 宽焦点(即中性句)以及分别对应于3个设定音节位置的窄焦点(句中、 倒数第二音节、 句尾)。

因此,一共有512个句子。

实验选取了3组被试,分别是普通话母语者(母语组)、 出生于港澳地区的粤语母语者(粤语组)和出生于美国的英语母语者(英语组)。每组被试均为年龄相近的6位大学生(3男3女),各组平均年龄分别为25,19,24岁。普通话母语组被试都是南京师范大学文学院的硕士研究生,普通话水平测试均达到二级甲等。粤语组与英语组被试都有一至两年的普通话课堂学习经历,普通话能力中等,汉语水平考试HSK都通过了5级,实验期间都在南京学习汉语。

在录音过程中,宽焦点的句子由被试直接说出,而窄焦点的句子则放在简单对话中,由主试说出引导句后,被试说出目标句,从而自然地引导出窄焦点。例如,下面2段简单对话,分别引导被试的陈述和疑问句将窄焦点置于目标字“朱”上。

主试问:“他帮李科长发包吗?”

被试答:“他帮科长发包。”

主试说:“他不是帮李科长,而是帮朱科长发包。”

被试问:“他帮科长发包?”

在被试充分熟悉语料并确认掌握各字的正确读音以后,主试与被试同时进入专业隔音录音棚,以正常语速录音。录音过程由实验人员全程监听,一旦发现有口误或者停顿之处,就要求重新录制该句或该段对话,直到内容无误且发音流畅为止。

使用Praat软件对录音语料进行手工切分与标注。根据语谱图和波形,将每句话切分为各个音节的声母段与韵母段。使用Praat软件的自相关算法以10 ms为间隔自动提取语音基频值后,手动检查修正各类误测点。对基频曲线做轻微平滑以消除局部扰动,在韵母段内对断点做线性内插以获得连续曲线。为便于基频的比较,对时长规整,在每个韵母段等间距地取10个点,形成时长归一的基频曲线。将基频由Hz值转化为半音(st)值以后,对每一组被试的若干语句求取平均的基频曲线。

2 数据分析

图 13给出了时长归一化的以半音st为单位的平均基频曲线。每幅图中,3行子图分别对应3组被试; 左列的子图对应于宽焦点语句,右列的子图对应于窄焦点在目标音节上的语句。这里取平均的做法是: 图 123分别以句中音节、 倒数第二音节、 句尾音节为目标音节,4种粗细深浅不同的曲线分别对应于目标音节取4个声调,而对另2个设定音节的所有声调组合做平均。实线与虚线则分别表示陈述与疑问句。通过3幅图所示母语组被试与2组二语被试的对比,可以总结出二语学习者在普通话基频特征上的偏误规律。

图 1 平均基频曲线,显示句中目标音节“z(h)u”的四声变化

图 2 平均基频曲线,显示倒数第二目标音节“·a”的四声变化

图 3 平均基频曲线,显示句尾目标音节“·ao”的四声变化

2.1 声调

基频曲线在3个目标音节上的特征显示,2组二语被试基本上掌握了普通话四声的基频模式,即T1高、 T2升、 T3低或降升(分别对应于非句尾与句尾位置)、 T4降。与以往的声调偏误研究结果类似,最明显的声调偏误体现在调域上,粤语组和英语组的四声构成的调域均小于母语组,尤其是升调T2与降调T4的基频动态范围偏小。相比而言,英语组的调域更窄,这与他们的非声调母语背景有关,因为非声调语言的基频动态范围一般比声调语言的窄[14]

其次,在调型上有一个重要偏误,可以看到3组被试的T3调型各不相同。在句中的T3音节,英语组产生的是一个降升调,而另外两组几乎没有上升的拖尾; 在陈述句尾的T3音节,母语组产生的是降升调,而英语组产生的降升调的升尾更高(降与升的幅度几乎相当)。这种T3调(尤其在非句尾)的过度发音现象,很大程度是因为普通话课堂上教给外国学生的往往只是孤立音节的T3调型,学习者甚至教师都没有意识到非句尾音节的T3无需升尾。此外,外国学生由于对声调不够熟悉,过于注意每个字调的发音准确,也会导致整句话生硬不自然。

同时,在陈述句尾的T3音节,粤语组产生的调型升尾没有母语组高。对此的一个合理解释是,粤语里面没有降升调(见表 1,只有低降调21,没有21(4)),因此影响到他们普通话的T3发音。

而且,调型偏误还体现在上声连读变调上。从图 23可见,目标音节为T3时的前一音节,母语组和粤语组均显示变异的调型(f0抬升),体现了上声变调T3变T2的结果,当然母语组尤为明显; 而英语组无明显变化,说明他们由于非声调的母语背景,未能很好掌握连读变调。

2.2 句调

首先看陈述句。比较宽焦点语句中的几个T1音节,可以发现二语被试的基频下倾现象比母语被试更加明显,尤其是英语组。这很可能是因为母语者的基频曲线不仅遵循语音产生的生理规则,还要对语法、 语义、 语用等高层元素编码,往往通过基频重置对话语结构加以灵活的调整,使得陈述句没有表现出简单划一的基频下倾现象; 而二语学习者语言能力受限,尚未熟练掌握通过基频变化对语法、 语义、 语用编码的策略,因此基本上只遵从语音产生的生理规则,使得陈述句表现出较典型的基频下倾现象。

再看疑问句。 最明显的句调偏误,还是体现在疑问句上。前文已经提及,语调疑问句是通过提升音高与陈述句加以区别的,但是音高提升的具体编码方法因语言而异。表 2列出了本实验中疑问句相对陈述句在每个音节内的基频均值的增量(以半音st为单位),并标出了基频差异有统计显著性的项。

表 2 疑问句相对于陈述句的各音节f0/st增量
组别焦点位置ta1bang1z(h)uke1zhang3·a·ao
母语组宽焦点 0.7 1.0 1.2* 1.4* 2.6* 2.7* 4.1*
句中 2.4 2.7 1.5* 2.3* 3.0* 3.0 4.1
倒二 2.8 2.9 2.0 2.6 2.42.2* 3.9*
句尾 2.5 2.8 2.0 2.6 2.62.6* 3.1*
粤语组宽焦点0.00.00.30.20.2 0.8* 1.7*
句中 0.3* 0.3* 0.3 0.5* 0.50.9* 2.0*
倒二 0.5* 0.5*0.5 0.6* 0.4*0.7* 1.7*
句尾 0.5* 0.5*0.1 0.5*0.30.7 1.8*
英语组宽焦点-0.1 0.00.00.30.3-0.3 0.3
句中 0.50.30.4 0.80.6-0.40.6
倒二-0.1-0.00.4 0.20.40.61.1
句尾0.40.40.30.20.5-0.20.6
注: *p<0.01; 0.01<p<0.05.

先看母语组。在宽焦点条件下,疑问句相对于陈述句的基频提升在全句范围内都有,只是提升的幅度随位置而变,越往后基频提升幅度越大,最终在句尾音节提升幅度达到最大。在窄焦点条件下,这种全局性的基频提升表现得更加明显,甚至句首就以较高基频值开始(这时基频提升幅度不再是越往后越大,只是在句尾音节仍有明显的跃升)。

与母语组相比,2组二语被试在所有的焦点条件下,疑问句相对陈述句的基频提升,发生位置都更为滞后,提升幅度也都更小。事实上,英语组的疑问句与陈述句之间没有显著意义的基频差异。粤语组虽然有显著的基频提升(提升幅度明显低于母语组),但是基频提升几乎集中在句尾,尤其是在句尾音节的后半部。

这些句调偏误,可以用语言负迁移效应来解释。在粤语与英语中,疑问调的编码方式都是基频在句尾局部提升而不是全句提升[3-5],因此2组二语被试说普通话时,容易保持他们母语的这一编码策略。特别是,与普通话和英语相比,粤语含有非常丰富的句尾语气助词,而粤语的句调在很大程度上由这些句尾语气助词的音高决定[15-16]。粤语组说普通话时,保持了母语的这一编码策略,因此在句尾音节上的基频提升尤为明显。

2.3 焦点重音

表 34分别针对陈述句和疑问句,列出了3种窄焦点条件下各音节内基频均值与宽焦点条件之间的差值。从图 13表 34可见,母语组的结果与以往的研究结论一致,表征窄焦点的强调重音在基频曲线上的表现为: 焦点音节基频提升及调域变宽,焦点后音节基频压低及调域变窄。需要说明的是,当窄焦点在句中音节“z(h)u”上时,焦点后基频压低并没有出现在焦点后紧邻音节上,而是在句尾2个音节表现得最明显。这是因为“z(h)u 科长”组成一个人称专用名词,因此在强调“z(h)u”的时候“科长”很容易也受到一定程度的强调。

表 3 陈述句的窄焦点句相对于宽焦点句各音节f0/st差值
组别焦点位置ta1bang1z(h)uke1zhang3·a·ao
母语组句中-1.7-1.4 1.4-0.6-0.7-4.4-4.6
倒二-2.2-2.1-1.2-1.6-0.11.9-1.8
句尾-2.0-1.9-1.1-1.5-0.00.71.7
粤语组句中-0.2-0.2 0.4 0.4-0.2-0.6-1.0
倒二-0.3-0.30.2-0.10.10.5-0.2
句尾-0.3-0.30.4-0.1-0.00.20.1
英语组句中-0.0-0.7 0.2-0.2-0.7-0.9-1.4
倒二0.30.3-1.10.40.51.3-0.5
句尾0.30.2-0.2-1.1-0.50.90.7

表 4 疑问句的窄焦点句相对于宽焦点句各音节f0/st差值
组别焦点位置ta1bang1z(h)uke1zhang3·a·ao
母语组句中 0.0 0.3 1.8 0.2-0.2-4.1-4.6
倒二-0.2-0.2-0.3-0.4-0.21.4-2.1
句尾-0.3-0.2-0.3-0.3-0.00.60.8
粤语组句中 0.1 0.1 0.5 0.7 0.1-0.5-0.6
倒二0.20.20.40.30.30.4-0.3
句尾0.10.10.20.20.00.10.2
英语组句中 0.5-0.4 0.6 0.4-0.4-1.0-1.1
倒二0.40.2-0.80.40.62.20.3
句尾0.70.60.1-1.1-0.41.01.0

相比之下,英语组的焦点重音对基频的作用方式与母语组类似,但是效果明显比母语组要弱。粤语组的效果则更为微弱。这种效果上的差异,与他们的母语对焦点重音的不同编码方式有关: 英语的方式与普通话的类似[9-10],而粤语的则恰恰相反[11-13]

2.4 交互作用

声调、 句调、 焦点重音这3种重要的韵律元素需要同时在语音的基频曲线中编码,它们之间存在复杂的交互作用。

声调与句调的交互作用方式是声调语言研究的一个关键问题。Chao[17]曾将声调与句调的叠加关系分为“同时叠加”和“连续叠加”2种。 可以看到,最突出的交互作用发生在语调疑问句的句尾音节。对于母语组,疑问句调没有改变句尾音节四声的相对模式,而是提升了整个音节的基频值,并且越往后提升得越多。因此,这里的边界调,既不是简单的“同时叠加”也不是简单的“连续叠加”,而是两者的组合; 而且对于不同声调,叠加的方法也不相同。对于粤语组,表现出的交互作用与母语组的相似,这可能是因为普通话和粤语都是汉语声调语言,声调与句调的组合编码策略类似。至于英语组,因为疑问句调对基频曲线无显著效应,所以无需讨论句调与声调的交互作用。

另一个交互作用在焦点重音与疑问句调之间。对于母语组,当疑问句有窄焦点时,相对陈述句的基频提升会出现得更早、 提升幅度也明显更大(与Liu等[8]的研究结果不同,不是从焦点音节才开始提升)。相比之下,粤语组显示出类似的交互作用,但是比母语组的要弱很多。英语组因为疑问句调无显著效应,无需讨论其交互作用。

最后,声调与焦点重音之间的交互作用,在3组被试之间表现得几乎一致(虽然作用强度不同),即焦点重音并不改变各调类的相对基频模式,但是会拓宽调域(尤其升调T2与降调T4)、 增强各调类之间的对比。更具体地说,焦点重音对高音调的提升作用大于对低音调的。这是由于发声生理上的限制,高音调有更自由的调控空间,这与以前普通话和粤语的研究结果都是一致的[9, 12, 18]

3 结 论

普通话、粤语、英语这3种语言在韵律音系上形成鲜明对比,本文系统地比较了母语分别为普通话、粤语、英语的3组被试说普通话时的话语基频特征。通过一组条件严格受控的语句,考察了每组被试的声调、句调、焦点重音这3种韵律元素的基频编码方式、以及三者间的交互作用。研究发现,2组二语被试的基频偏误特征有同有异,很大程度上可归因于各自母语的负迁移效应。

需要强调的是,教学方法对学习者的二语韵律偏误模式有重要影响。如果学习者掌握韵律规则,有些偏误就容易避免或纠正。例如,了解普通话上声在不同位置有低调与降升调2种变体,就能减少上声调型偏误;了解普通话疑问句调实现方式与英语、粤语的不同,就能对症下药,提早拉升基频。总之,通过系统研究事先了解特定语言背景人群常见的二语韵律偏误规律,有针对性地教导与纠偏,将有助于改善二语语音韵律教学的效果。

参考文献
[1] Trouvain J, Gut U (eds). Non-Native Prosody:Phonetic Description and Teaching Practice[M]. Berlin: Mouton de Gruyter, 2007 .
[2] JIAN Huali. Prosodic challenges faced by English speakers reading Mandarin[J]. Acta Linguistica Hungarica , 2015, 62 (1) : 35–62. DOI:10.1556/ALing.62.2015.1.2
[3] Ladd D R. Intonational Phonology[M]. Cambridge: Cambridge University Press, 1996 .
[4] Ma J K, Ciocca V, Whitehill T L. Effect of intonation on Cantonese lexical tones[J]. The Journal of the Acoustical Society of America , 2006, 120 (6) : 3978–3987. DOI:10.1121/1.2363927
[5] Xu B R, Mok P. Final rising and global raising in Cantonese intonation[C]//Proceedings of the 17th ICPhS. Hong Kong, China, 2011:2173-2176.
[6] SHEN Xiaonan. The Prosody of Mandarin Chinese[M]. Berkeley: University of California Press, 1990 .
[7] YUAN Jiahong. Mechanisms of question intonation in Mandarin[C]//Proceedings of the 6th ISCSLP. Singapore, 2006:19-30.
[8] LIU Fang, XU Yi. Parallel encoding of focus and interrogative meaning in Mandarin intonation[J]. Phonetica , 2005, 62 (2-4) : 70–87. DOI:10.1159/000090090
[9] Xu Y. Effects of tone and focus on the formation and alignment of f0 contours[J]. Journal of Phonetics , 1999, 27 : 55–105. DOI:10.1006/jpho.1999.0086
[10] Xu Y, Xu C X. Phonetic realization of focus in English declarative intonation[J]. Journal of Phonetics , 2005, 33 : 159–197. DOI:10.1016/j.wocn.2004.11.001
[11] GU Wentao, Hirose K, Fujisaki H. Modeling the effects of emphasis and question on fundamental frequency contours of Cantonese utterances[J]. IEEE Transactions on Audio, Speech and Language Processing , 2006, 14 (4) : 1155–1170. DOI:10.1109/TASL.2006.876132
[12] Gu W T, LEE T. Effects of tone and emphatic focus on f0 contours of Cantonese speech:A comparison with standard Chinese[J]. Chinese Journal of Phonetics , 2009, 2 : 133–147.
[13] WU Wingli, XU Yi. Prosodic focus in Hong Kong Cantonese without post-focus compression[C]//Proceedings of the 5th Speech Prosody. Chicago, IL, USA, 2010.
[14] CHEN Shenghwa. The effects of tones on speaking fundamental frequency and intensity ranges in Mandarin and Min dialects[J]. The Journal of the Acoustical Society of America , 2005, 117 (5) : 3225–3230. DOI:10.1121/1.1872312
[15] Law S P. The Syntax and Phonology of Cantonese Sentence-Final Particles[D]. Boston:Boston University, 1990.
[16] Wong W Y P, Chan M K M, Beckman M. An autosegmental-metrical analysis and prosodic annotation conventions for Cantonese[C]//Jun S. Prosodic Typology:The Phonology of Intonation and Phrasing. Oxford, UK,:Oxford University Press, 2005.
[17] Chao Y R. Tone and intonation in Chinese[J]. Bulletion of the Institute of History and Philology, Academia Sinica , 1993, 4 (3) : 121–134.
[18] JIA Yuan. Phonetic Realization and Phonological Analysis of Focus in Standard Chinese[M]. Beijing: China Social Sciences Press, 2012 .