2. 南开大学 文学院, 天津 300071;
3. 北京语言大学 语言科学院, 语言病理与脑科学研究所, 北京 100083
2. School of Literature, Nankai University, Tianjin 300071, China;
3. Institute of Language Pathology and Brain Science, Faculty of Linguistic Sciences, Beijing Language and Culture University, Beijing 100083, China
不同说话人说出来的同一语音、同一个说话人在不同时间地点说出来的同一语音都是存在差异的[1],同时语音又是时刻处于变化当中的。那么,听话人如何感知这些纷繁复杂的语音,排除其中的变异因素,从而正确获取其中的目标音,这是语音感知的一个基础而重要的问题。文[2]研究表明,听者能利用自身的范畴感知机制将这些纷乱的语音归并到自身母语所具有音位范畴中,尤其是辅音。
对于声调语言来说,音高的变化会导致词义发生变化[3]。而目前对于声调感知的研究主要集中在范畴化感知和非范畴化感知的讨论上,孔江平[4]以汉藏语系中的藏语拉萨话为研究对象,将频率和时长作为实验参数,以拉萨人为被试,发现藏语拉萨话的4个声调间均存在范畴化感知。Abramson[5]对泰语的高中低3个平调进行感知实验,实验结果表明辨认曲线表现出明显的范畴性态势,区分曲线则没有明显的区分峰值,因而最终推断泰语声调感知是非范畴性的。Hallé等[6]对中国台湾话的阴平—阳平、阳平—去声、上声—去声进行了声调感知实验,认为被试在感知过程中呈现出类范畴 (quasi-categorical) 的模式。这些研究在一定程度上揭示了声调感知的特点,对感知模式进行了探讨,但是对于声调的听感空间和听感边界的具体表现以及影响听感边界的因素的考察则略有不足,而这对于声调感知来说是极为重要的。
广州话的声调系统包含高中低3个平调,这对于声调感知研究来说具有得天独厚的条件[7]。另有研究表明[8],广州话的这3个平调正处于变化当中,这为声调演变的共时考察又提供了极佳的视角。因此,本文利用“对角/半空间测试法”[9],通过低平调 (阳去)—中平调 (阴去) 和中平调 (阴去)—高平调 (阴平)2组辨认实验以及区分实验考察广州话高中低3个平调的单字音和双字词的听觉感知情况及其听感空间,并进一步对广州话3个平调的演变情况和影响平调听感边界的因素进行深入剖析,对广州话3个平调的听感空间和演变机制进行探索。
1 研究方法 1.1 广州话的声调格局“六声九调”是广州话声调格局总的特征,六声分别为阴平、阳平、阴上、阳上、阴去、阳去6个舒声调和上阴入、下阴入、阳入3个入声调[10]。图 1为本文通过南开大学“桌上语音工作室”(Minispeech-lab) 做出的广州话单字调声调格局,发音人为本研究听感实验语音材料的录音人。可以看出:阴平调为调值55的高平调,阳平调为调值21的低降调,阴上调为调值35的中升调,阳上为调值23的低升调,阴去调为调值33的中平调,阳去调为调值22的低平调[11]。关于音高五度值的具体测算,详见文[12]。
![]() |
图 1 广州话舒声调 (男性) |
然而,现在广州话的声调系统并不稳定,尤以平调显著。在进行听辨实验的声学预实验中,随机对一位女性被试所做声调格局分析也发现这一点,如图 2所示,其低平调和中平调在声学上多有重叠。
![]() |
图 2 广州话舒声调 (女性) |
1.2 实验流程 1.2.1 辨认实验
辨认实验中被试会看到一个选择界面,屏幕左右各出现一个选项,左边选项为F、右边选项为J,要求被试判断所听到的是屏幕左边的字词还是右边的字词。如果是左边的就按F键,如果是右边的就按J键,要求又快又准地作出判断。被试进行选择后,选择界面消失,进入下一题的流程。实验分为正序和反序,不同按键反应差异通过不同被试组进行组间平衡。正式实验单字组时长约10 min,双字组时长约15 min。
1.2.2 区分实验区分实验采用AX式,由2个单字音或双字词组成一个刺激对,每个刺激对由相隔的2个刺激组成,2个刺激间相差2个半音 (如8-10, 10-8等20对)。同一刺激对的2个刺激音之间相隔500 ms。具体实验流程与辨认实验基本一致,只是在听到刺激音后被试看到的选择界面略有不同,屏幕左右会各出现一个提示,如“相同 (请按F)、不同 (请按J)”,要求被试判断所听到的刺激对是否相同,如果相同就按F键,如果不同就按J键。反应界面有“不同—相同”和“相同—不同”2种顺序,不同按键反应差异通过不同被试组进行组间平衡。正式实验单字组和双字组时长均约15 min。
1.3 数据统计本实验使用Excel和SPSS20软件对数据进行统计分析,计算各平调的听辨率、区分率、反应时,求出各平调的边界位置、区分峰值和听感范围。
2 单字组实验 2.1 语音材料单字组实验以yi、si、se为语音材料,选取自然语言中的“医 (yi55)”“意 (yi33)”“二 (yi22)”,“师 (si55)”“嗜 (si33)”“事 (si22)”和“些 (se55)”“卸 (se33)”“射 (se22)”作为目标字进行实验。
请一位广州话标准的男性发音人进行录音,他是老广州人,现为南开大学学生,也是上文舒声调格局的男性发音人。录音在南开大学语音实验室进行,采用单声道录制,采样率为11 025 Hz。实验采用负载句的方法,由发音人以自然语速说出“我宜家读嘅系医”,每个句子说3遍,各句乱序出现,共得到27个句子。运用Cool Edit软件从中切出目标词语。合成采用Praat自编脚本,制作的刺激音时长均为450 ms,每组由8~19 st、步长为1 st的平调连续统组成。
2.2 实验被试参加实验的被试均为广州人,9名男生,11名女生,平均年龄 (21.29±2.45) 岁。身体健康,听力正常,均为右利手,母语为广州话。
2.3 实验结果根据“中平—低平”“高平—中平”的实验结果,可以得出yi、si、se这3组实验各平调的辨认曲线、区分曲线和辨认反应时曲线,如图 3所示。关于单字音实验的更为详细的结果见文[13]。
![]() |
图 3 单字组“中平—低平”“高平—中平”实验 |
可以看出,3组辨认实验的分界点位置大体一致,其分界点的位置都呈现出按“中平—低平”“高平—中平”的顺序小幅递增态势,其中si的“中平—低平”分界点和“高平—中平”分界点重合为一点,中平的听辨范围被无限挤压为一个点。除此之外,yi、si、se 3组的“中平—低平”“高平—中平”实验辨认边界位置与区分峰值位置并未明显对应。
“中平—低平”辨认实验中,se组辨认曲线出现了2个交点,yi、si 2组辨认曲线在交点前均呈现边缘相交态势,且3组低平调在音高较低刺激音处的辨认率均未达到100%(除yi组在8 st处),再结合3组在该音高区域低区分率情况来看,可认为被试难以对音高较低的刺激音进行中低平调的辨认。与“中平—低平”不同,“高平—中平”辨认实验的3组辨认曲线均达到了100%。
yi、si、se 3组实验中,“中平—低平”的反应时总体上呈现出递增的趋势;“高平—中平”的反应时总体上呈现出先增后减的趋势,其波峰位置与辨认曲线的边界所在处大体对应,范畴内的刺激音被试能够很快进行判断,而处在范畴边界的刺激音被试的反应速度变慢。
3 双字组实验 3.1 语音材料双字组实验选用自然语言中的双字词作为听辨内容。声母、韵母相同且声调相互对立的字,称为目标字;声韵调完全相同的字,称为参照字。同时,按目标字在词中的位置分为前字组 (目标字居前) 和后字组 (目标字居后),具体实验词如表 1所示。
参照字声调 | 前字组目标字声调 | 参照字声调 | 后字组目标字声调 | |||||
高平 | 中平 | 低平 | 高平 | 中平 | 低平 | |||
中平 | 煲碎 | 布碎 | 暴税 | 低平 | 大张 | 大涨 | 大象 | |
高平 | 冬天 | 冻天 | 洞天 | 上阴入 | 一堆 | 一对 | 一队 |
其中前字组语音材料为bou seoi (简称bs) 和dung tin (简称dt);后字组语音材料为daai zoeng (简称dz) 和jat deoi (简称yd)。其中bs组参照字seoi为阴去调 (中平调),dt组参照字tin为阴平调 (高平调),dz组参照字daai为阳去调 (低平调),yd组参照字jat为上阴入,音高相当于阴平调 (高平调),可看作其变体[1]。
发音人、录音方式以及合成方法与单字组相同,共得到36个句子。运用Cool Edit软件从中切出目标词语。参照单字调听感范畴的数据以及发音人目标词语实际发音的平均音高,将作为参照字的高平调合成为19合成为12合成为8 st,上阴入合成为16~14 st的降调。Wong等[14]实验发现音节时长 (duration) 因素对于广州话平调的发音 (production) 和感知 (perception) 均无显著影响,因此,为了使合成刺激音更为自然,保留各语料音节的时长特征,其中,包含入声字的实验刺激yd声调间距设为130 ms。
3.2 实验被试双字组的被试为另一批广州人,11名男生,11名女生,平均年龄 (21.29±2.45) 岁。身体健康,听力正常,均为右利手,母语为广州话。
3.3 实验结果根据辨认实验和区分实验结果,可以得出前字组bs、dt和后字组dz、yd 4组实验各平调的辨认曲线、区分曲线和辨认反应时曲线,如图 4所示。
![]() |
图 4 双字词“中平—低平”“高平—中平”实验 |
总体上,前后字4组的“中平—低平”“高平—中平”实验辨认边界位置与区分峰值位置呈现出明显对应的态势。值得一提的是,前后字4组辨认实验的边界位置并非位于同一半音处,4组之间存在较大差异,这与单字组表现并不相同。
前后字4组辨认实验的边界宽度中,bs组和dz组较小,dt组和yd组较大,尤其是dt组和yd组“中平—低平”的辨认边界宽度甚至达到整个调域的一半,虽然“中平—低平”辨认曲线出现了交点,但是被试对边界宽度内刺激音的判断依旧较为模糊。
前后字4组实验中“中平—低平”组的反应时总体上是呈现出递增的趋势,这是受“中平—低平”组实验无高平调选项影响的;“高平—中平”组的反应时总体上在辨认边界位置处会出现一个波峰,范畴内的刺激音被试能够很快进行判断,而处在范畴边界的刺激音被试的反应速度变慢。
4 讨论与分析 4.1 广州话单字音平调听感范畴根据“对角/半空间测试法”的测算方法,由“中平—低平”辨认实验结果,可以得到中低平调之间的听感边界及其状态;由“高平—中平”辨认实验结果,可以得到高中平调之间的听感边界及其状态。综合二者结果,可以分别得出yi、si、se 3组的听感范围,如图 5所示。
![]() |
图 5 广州话平调听感范围 |
可以看出,高平调的听感范围最大,si、se都超过50%;低平调的听感范围次之,yi、si超过40%;中平调的稳态听感范围最小,si的中平调稳态听感范围甚至无限趋近于0%,yi的中平调与高平调存在着模糊的听感区域,se的中平调与低平调存在着模糊的听感区域,在模糊听感区域,被试的辨认是随机的。
4.2 广州话平调演变广州话中高平调听感范畴yi、si、se 3组大致相同,听感空间占据较大区域;3组的高平调辨认曲线与中平调的边界宽度较窄,听感范畴稳定明确,容易辨认,这与金健[15]的实验结果一致。结合广州话的声学格局可以发现,广州话高平调处在调域中的最顶端,基本上没有与其他声调存在重叠的区域,这与其声学特征相对应,高平调的听感范畴稳定而明确,相对其他声调来说是最容易感知的。儿童也存在类似的情况,Lydia等[16]就发现广州话母语的儿童对于高平调的感知要比其他声调的感知容易得多。广州话高平调听感范畴稳固可能与其演变有关,施其生[17]认为高平调的出现不是阴平调分化的信号,而是阴平调从调值53的高降调向调值55的高平调转化的信号。正因为阴平调处在或正完成向高平调演化的过程中,而使得高平调的听感范畴稳定而明确,难以与其他声调混淆,对于音变具有较强的抵抗能力。事实上,高平调具有稳定性,在汉语方言中是具有一定的普遍性的[18-19],其独立性较强。
与高平调稳定明确的听感范畴相比,yi、si、se 3组的中平调和低平调的听感范畴则相对模糊,尤其是中平调,si的中平调听感空间无限趋近于0%;yi的中平调稳态听感空间为4%,并与高平调存在着16%模糊边界;se的中平调稳态听感空间为5%,并与低平调存在着16%模糊边界。Peng等[20]就指出中平调和低平调的辨认是有一定难度的,这对于机器识别和母语者来说都是成立的。王士元[21]认为声调系统的演变主要产生于感知的相似性,曹志耘[22]提出调类合并的唯一依据就是调值的相近度,中平调和低平调均为平调,且调值相近均居于调域的低频区,这为二者之间的混淆提供了条件。
从反应时也能看出高平调听感范畴稳固而中低平调听感范畴模糊的迹象。无论是单字组还是双字组的辨认实验,在“中平—低平”的实验中,最大反应时均出现在音高较高的刺激音处,该实验并没有“高平调”的选项,被试在听到音高较高的刺激音时会花费较多的时间去进行判断,最终被迫在中低平调间进行选择,这说明被试并没有将高平调简单地辨认为中低平调中的任意一个,可以推断高平调的听感范畴是较为稳固的,中平调的听感范畴并未向其扩展。而“高平—中平”的反应时则不同,总体上呈现出先增后减的趋势,音高较低的刺激音被试也能很快辨认为中平调,并不会因为音高低而像“中平—低平”实验因为没有低平调选项而犹豫最终被迫选择中平调,对于被试来说,或许音高较低的刺激音也并非难以感知为中平调。
王士元[21]提出“汉语声调的发展是合并而不是分化”,这些合并中的一部分声调“正以上千年的时间扩散到词汇中去”;曹志耘[22]也认为汉语音系简化的大趋势显示了调类系统合并的必要性。基于广州话平调的听感格局可以推断,或许广州话的低平调 (阳去) 正挤占中平调 (阴去) 的声学和听感范畴,并与其开始相混处在词汇扩散演化当中。
4.3 广州话双字词平调听感范畴前后字4组高中低3个平调均有明显的听感边界和听感空间。若不考虑单字音平调模糊听感区,bs组和单字调yi组基本相似。李书娴[8]以双音节词为材料,通过听辨实验发现年轻广州人对中平调和低平调会出现听和说的混淆。同样是双音节词和年轻的广州人,在本实验中却表现出中低平调明确的听感边界,并未出现将二者混淆听辨的模糊区,这与实验语音材料有关。本文使用的语音材料为合成刺激音,8~19 st区间内,每一个半音步幅都有对应的刺激音;而文[8]使用的是发音人原始的录音材料,并未经过加工合成处理。一个调位或调值或许在声学上表现为不同的音高半音数值,前面分析提到,虽然中低平调边界位置清晰,但是却存在着一段不小的边界宽度,尤其是dt组和yd组,在边界宽度内,实际上被试的辨认还是比较模糊的,存在一定的随机性。因此,表面上本文的结果与文[8]相悖,实际上却存在内在统一性,即中低平调呈现出混淆的迹象,但是与单字音相比,在参照字的作用下,这种混淆得到一定程度的改善。
4.4 影响听感范畴边界因素通过对比单双字组实验,发现前后字4组呈现出边界偏移的态势。边界偏移的出现,主要有以下3个方面的原因:
1) 参照字的调类:目标字在前时 (前字对比组),参照字为高平调的目标字比参照字为中平调的,更易感知为低平调和中平调。和参照字为中平调 (bs组) 的目标字相比,参照字为高平调 (bt组) 的,其中平调听感边界提高17%,高平调听感边界提高32%。高调的背景更容易将嵌入的目标词感知为低调,反之,低调的背景更容易将目标词感知为高调[23]。并且本文的研究进一步证明:高调对于低调的反衬作用在参照字居后时更为显著,参照字居前时相对较弱,因为还会受到“降阶”的作用。
2) 降阶 (downstep) 机制:下倾 (declination) 和降阶属于人说话时的普遍现象,它们都与人的发音生理密切相关,前者是由说话时整体的气流机制决定的,是全局性的;后者是由于低音成分的介入而导致的声带振动频率的降低,是局部的[9]。由于下倾的作用,在对句末或词末音节音高进行辨认时,被试会将目标字的音高提高进行感知补偿,否则的话,被试很有可能会将目标字的音高辨认错误,辨认成音高低于说话者本想说的字的音高[24]。
3) 协同发音的顺向同化作用:发音时前字声调对后字具有同化作用[23],前字参照字的终点越低,后字被听成低平调的可能性越低,因为即使后字声调较低,听者也可能将其归结于从前字而来的协同发音。同为后字组,yd组 (参照字为高调) 由于受下倾机制的影响,虽只有8 st,被试还不能完全将其辨认为低平调,而在dz组 (参照字为低调) 被试却完全能将其辨认为低平调,这要归结于前字低平调的顺向同化作用。同时,受到下倾机制作用,dz组中低平调的听感范畴并不大,高平调则占据了相当大的比率达到了60%。
5 结论本文利用广州话自然语言中的单字音和双字词语料,采用“对角/半空间测试法”,通过“中平—低平”和“高平—中平”2组实验得到广州话各平调的听感空间。单字音试验中,高平调听感空间稳定,中平调的听感空间与低平调大幅重叠,呈现出与低平调混淆的迹象。双字词实验中,广州话高中低3个平调都具有明确的听感范畴,辨认边界和区分峰值存在明显的峰界对应。在参照字音高语境的帮助下,中低平调的混淆得到一定程度改善。另外,研究还发现语境音高的对立参照、降阶机制和协同发音作用等因素都会在一定程度上影响听感空间的边界位置。
[1] | Johnson K. Speaker normalization in speech perception[C]//Pisoni D B, Remez R E. The Handbook of Speech Perception. Malden, UK:Blackwell Publishing Ltd., 2008:363-389. |
[2] | Liberman A M, Harris K S, Hoffman H S, et al. The discrimination of speech sounds within and across phoneme boundaries[J]. Journal of Experimental Psychology, 1957, 54(5): 358–368. DOI:10.1037/h0044417 |
[3] | Ladefoged P, Johnson K. A Course in Phonetics[M]. 5th Edition, Stamford: Cengage Learning, 2014. |
[4] | 孔江平. 藏语 (拉萨话) 声调感知研究[J]. 民族语文, 1995(3): 56–64. KONG Jiangping. Perception research on Tibetan tones[J]. Minority Languages of China, 1995(3): 56–64. (in Chinese) |
[5] | Abramson A S. Noncategorical perception of tone categories in Thai[J]. Journal of the Acoustical Society of America, 1977, 61(S1): S66–S66. |
[6] | Hallé P A, Chang Y C, Best C T. Identification and discrimination of Mandarin Chinese tones by Mandarin Chinese vs. French listeners[J]. Journal of Phonetics, 2004, 32(3): 395–421. DOI:10.1016/S0095-4470(03)00016-0 |
[7] | Wong P C, Diehl R L. Perceptual normalization for inter-and intratalker variation in Cantonese level tones[J]. Journal of Speech Language & Hearing Research, 2003, 46(2): 413–21. |
[8] | 李书娴. 关于广州话阴去调和阳去调的听辨实验[J]. 方言, 2008, 30(1): 34–39. LI Shuxian. Auditory discrimination of yinqu vs. yangqu tones of Cantonese[J]. Dialect, 2008, 30(1): 34–39. (in Chinese) |
[9] | 王萍, 石锋, 荣蓉, 等. 汉语普通话上声的听感范畴[J]. 中国语文, 2014, 361(4): 359–370. WANG Ping, SHI Feng, RONG Rong, et al. The perceptual category of shangsheng in Mandarin[J]. Studies of the Chinese Language, 2014, 361(4): 359–370. (in Chinese) |
[10] | 詹伯慧. 广东粤方言概要[M]. 广州: 暨南大学出版社, 2002. ZHANG Bohui. An Outline of Yue Dialects in Guangdong[M]. Guangzhou: Jinan University Press, 2002. (in Chinese) |
[11] | Bauer R S, Benedict P K. Modern Cantonese Phonology[M]. Berlin: Mouton de Gruyter, 1997. |
[12] | 石锋. 论五度值记调法[J]. 天津师范大学学报 (自然科学版), 1990(3): 67–72. SHI Feng. On the pitch notation of five degree values[J]. Journal of Tianjin Normal University (Natural Science Edition), 1990(3): 67–72. (in Chinese) |
[13] | 谢郴伟, 石锋, 温宝莹. 广州话单字音平调听感实验初探[C]//第十一届中国语音学学术会议. 中国, 乌鲁木齐, 2014: 294-300. XIE Chenwei, SHI Feng, WEN Baoying. Perceptual research on monosyllabic level tones in Cantonese[C]//The 11th Phonetics Conference of China. Urumqi, China, 2014:294-300. (in Chinese). |
[14] | Wong P C M, Diehl R L. The effect of duration on the perception of Cantonese level tones[J]. The Journal of the Acoustical Society of America, 1999, 106(4): 2150–2150. |
[15] | 金健. 广州方言和东海方言平调的感知研究[J]. 方言, 2010, 32(2): 145–155. JIN Jian. A perception research of level tone patterns of Cantonese and Donghai dialect[J]. Dialect, 2010, 32(2): 145–155. (in Chinese) |
[16] | Lydia K H, Soand B J, Dodd A B J. The acquisition of phonology by Cantonese-speaking children[J]. Journal of Child Language, 1995, 22(3): 473–495. |
[17] | 施其生. 一百年前广州话的阴平调[J]. 方言, 2004, 26(1): 34–46. SHI Qisheng. Notes on yinping tone of Cantonese one-hundred-years ago[J]. Dialect, 2004, 26(1): 34–46. (in Chinese) |
[18] | 李小凡. 汉语方言连读变调的层级和类型[J]. 方言, 2004, 26(1): 16–33. LI Xiaofan. Levels and classes of tone sandhi in the Chinese dialects[J]. Dialect, 2004, 26(1): 16–33. (in Chinese) |
[19] | 石锋, 冉启斌. 普通话上声的本质是低平调——对《汉语平调的声调感知研究》的再分析[J]. 中国语文, 2011, 345(6): 550–556. SHI Feng, RAN Qibin. A comment on Mandarin tone perception:A report on a low level tone[J]. Studies of the Chinese Language, 2011, 345(6): 550–556. (in Chinese) |
[20] | PENG Gang, WANG Shiyuan. Tone recognition of continuous Cantonese speech based on support vector machines[J]. Speech Communication, 2005, 45(1): 49–62. DOI:10.1016/j.specom.2004.09.004 |
[21] | 王士元. 声调发展方式一说[J]. 语文研究, 1988, 8(1): 38–42. WANG Shiyuan. A note on tone development[J]. Linguistic Researches, 1988, 8(1): 38–42. (in Chinese) |
[22] | 曹志耘. 汉语方言声调演变的两种类型[J]. 语言研究, 1998, 18(1): 89–99. CAO Zhiyun. Two types of evolution of tones in Chinese dialects[J]. Linguistics Study, 1998, 18(1): 89–99. (in Chinese) |
[23] | 林焘, 王士元. 声调感知问题[J]. 中国语言学报, 1984, 2(2): 59–69. LIN Tao, WANG Shiyuan. Perception of tones[J]. Bulletin of Chinese Linguistics, 1984, 2(2): 59–69. (in Chinese) |
[24] | Francis A L, Ciocca V. Stimulus presentation order and the perception of lexical tones in Cantonese[J]. The Journal of the Acoustical Society of America, 2003, 114(3): 1611–1621. DOI:10.1121/1.1603231 |