元音部分对中日被试汉语普通话鼻韵母知觉的影响
张劲松 1,2 , 王祖燕 1     
1. 北京语言大学 对外汉语研究中心, 北京 100083;
2. 北京语言大学 信息科学学院, 北京 100083
摘要:学习汉语普通话的日语母语者普遍存在着难以分辨汉语前后鼻韵母的问题。为了揭示他们与汉语母语者前后鼻韵母知觉机制的异同,根据鼻韵母3段划分--元音、鼻化元音及鼻韵尾,利用拼接合成语音样本的方法,合成出包含不同成分的语音样本来研究两类人群的鼻韵母知觉分辨特点。实验结果表明:鼻化元音段对汉语母语被试判断鼻音类型起决定作用,对日语母语者却不是。缺少鼻化元音段时,元音段对中日被试感知鼻韵母的影响相似:元音段的声学差异越大,两类被试判断鼻韵母类型的准确率都越高。该研究结果不仅增进了对汉语鼻韵母知觉特点的认识,也有助于改进对日学生的鼻韵母语音教学。
关键词鼻韵母     感知     元音稳定段     鼻化元音     日本学生    
Influences of vowels on the perception of nasal codas in Mandarin for Japanese and Chinese natives
ZHANG Jinsong1,2, WANG Zuyan1     
1. Center for Studies of Chinese as a Second Language, Beijing Language and Culture University, Beijing 100083, China;
2. College of Information Science, Beijing Language and Culture University, Beijing 100083, China
Abstract:Japanese natives often have difficulties discriminating between the Chinese alveolar and velar finals. The perceptual differences between Japanese and Chinese natives are studied using different speech stimuli synthesized by concatenating speech segments including the vowel, the nasalized vowel and the nasal coda in different ways for use in a series of sound discriminating experiments. The results show that the nasalized vowels play key roles in cueing Chinese subjects to judge the nasal coda but have less effect for Japanese subjects. When the nasalized vowel portions are missing, the vowel nuclei have similar influences on the perceptions of the Chinese and Japanese. Larger acoustic differences between the vowel nuclei for alveolar/velar pairs enable both the Chinese and Japanese subjects to more accurately distinguish them. These findings can clarify the perceptual cues for Chinese nasal finals and will lead to more efficient methods to teach Chinese to Japanese students.
Key words: nasal final     perception     vowel nucleus     nasal vowel     Japanese students    

汉语普通话的鼻韵母后接两种鼻辅音,即前鼻音尾/n/及后鼻音尾/ŋ/。带不同鼻音尾的音节具有区别意义的作用,如班/ban/和帮/baŋ/。普通话中有16个鼻韵母,占韵母总数39个的41%;含鼻韵母音节177个,占基本音节(不考虑声调和轻声) 总数405个的44%。现代汉语常用3 000字[1]中共有1 387个鼻韵母构成的汉字,约占总数的46%。因此,鼻韵母在普通话语音系统中具有十分重要的地位。对于将汉语作为第二语言的学习者来说,能否正确习得普通话鼻韵母是掌握普通话语音成功与否的关键之一。

在对日本学生的汉语教学活动中,日语母语背景的学生普遍被发现难以正确分辨普通话的前后鼻韵母,进而难以掌握它们的正确发音方法。对比研究日语母语背景被试和汉语母语背景被试关于鼻韵母的知觉特性,不仅有助于揭示汉语鼻韵母的知觉规律,还有助于研究针对日本学生的汉语语音教学方法及计算机辅助发音教学技术。

根据前人的研究,鼻韵母的音段结构可以分为元音稳定段、鼻化元音段和鼻韵尾3个部分[2],这3个部分因鼻音尾的区别都存在着不同程度的声学参数差异。这些差异中哪些部分是区分鼻音类型的关键声学线索,哪些是次要线索,对于不同母语背景的人群是否有相同作用,这些问题语音学界有着不同的观点。

就鼻韵尾的知觉分辨作用而言,关于加泰罗尼亚语及英语等语言的研究[3-5]主张鼻韵尾含有区分前后鼻音尾类型的位置线索信息,另一些研究[6-7]则认为鼻韵尾载有重要或绝对重要的区分性信息。但是,也有不少学者认为鼻韵尾只是承载了发音方式信息(即是否带有鼻音尾),对区分鼻音类型不起作用[8-10]。根据普通话中时有出现鼻韵尾脱落的现象,林茂灿等推测它们不是鼻韵母的必要特征[11]。通过基于切韵尾音节刺激的感知实验,本文作者前期研究表明普通话鼻韵尾对中日被试判断鼻音类型没有作用,但是对于日本被试判断所听音节是否是鼻韵母音节具有一定的作用[12-15]

就鼻化元音段而言,根据鼻韵尾易脱落、鼻化元音段共振峰存在统计上的差异显著性等特点,吴宗济、林茂灿等推测鼻化元音段是区分/n/和/ŋ/的最重要依据[2]。通过基于切分音段的听辨实验[12, 15],本文作者证实了这个推测--鼻化元音段含有对于汉语母语者而言听辨鼻音类型的充分线索,同时发现其对于日语母语者的听辨影响不明显。

关于鼻韵母中元音段的知觉分辨作用,王韫佳的研究发现,前后鼻韵母的元音声学差异越大,日本母语背景的汉语学习者感知正确率越高[13],从而揭示鼻韵母中的元音段声学差异亦会影响鼻韵母类型的听辨。但是,MOU的研究却显示元音稳定段只包含少量的鼻音位置信息,对汉语母语者感知判断鼻音类型的作用不大[14]。在本文作者前期的切分音段实验中,发现在没有过渡段的情况下,中国被试会依赖元音稳定段及鼻韵尾来判断鼻音类型,但是日本被试却不明显[12, 15]

综上所述,已有研究关于鼻韵母各组成部分对于鼻音知觉的作用尚存在一些分歧,为此本文设计了两种声学刺激材料:自然音节和剪切拼接合成音节,通过对2组各15名中日被试进行知觉听辨实验,试图揭示鼻韵母3个组成部分在听觉分辨中的作用。

1 实验内容

本研究采用听辨自然音节和拼接合成鼻韵母音节的方法,考察中日被试在感知“an/ang”及“en/eng”两对前后鼻韵母时利用鼻化元音段、元音稳定段及鼻韵尾信息的情况,以揭示中日被试感知普通话鼻韵母的相同或不同。

1.1 被试

参加感知实验的被试共30人,分为2组。实验组共15名(7男,8女) 日本人,他们平均在中国学习汉语的时间为5个月,平均年龄22岁,听力皆正常。另外一组为对照组,共15名(7男,8女) 中国人,平均年龄25岁,皆无听力障碍。中国被试中,1名女生为南方人,但普通话标准(普通话水平一级乙等),其余14人都是中国北方人。

1.2 实验语料 1.2.1 自然语料

本研究的语料来自清华语音合成语料库(Corpus of Speech Sythesis-1,TH CoSS-1) 中1男1女的语料。该语料库是在录音室环境下完成的高信噪比(SNR>60 dB) 数字录音。声音采样频率为16 000 Hz,双声道,量化精度为16 bit,录音存为波形文件。

从中选取韵母为“an/ang”和“en/eng”的单音节。因为前人研究发现普通话鼻韵母“ing”的实际音值为/iəŋ/[13],因此本研究没有选择韵母“in/ing”的音节。在挑选音节时遵循以下原则:前后鼻韵尾音节对应且声调一致(如现代汉语中没“den”,则“deng”就相应被排除);具有同一个发音部位声母的音节尽可能有4个不同的声调(轻声除外)。最后每个发音人各选取26对“an/ang”、20对“en/eng”音节。

1.2.2 合成语料

在本研究中,对于每个自然音节进行了3种拼接合成处理。令大写字母“I/V/T/N”分别代表原始音节的“声母/元音稳定段/鼻化元音段/鼻韵尾”各段,令小写字母“t/n”代表对立鼻韵母的“鼻化元音段/鼻韵尾”,再令“+”号表示“音段互换”,“-”号表示“音段删除”。3种拼接合成方法为:

1)  “IV+t-N”:原始音节切除鼻韵尾后再交换前后鼻化元音段,如图 1所示;

图 1 语料合成方法1 (IV+t-N) 示例

2)  “IV-T+N”:原始音节切除鼻化元音段,如图 2所示;

图 2 语料合成方法2 (IV-T+N) 示例

3)  “IV-T+n”:原始音节切除鼻化元音段后交换前后鼻韵尾,如图 3所示。

图 3 语料合成方法3 (IV-T+n) 示例

在示例图 1-3中,左边两个语图分别为一个发音人的原始声音文件ban1和bang1,右边两个语图为拼接修改后的声音文件的语图。

为了使拼接后的声音更自然,在拼接时,会特别注意声波的对接。林茂灿等[2]指出在鼻韵母中鼻辅音的起点较易确定,因为“鼻辅音起点就是口腔通道开始完全关闭之时。口腔通过完全受阻时,在语图上可以看到其频谱和/或振幅的跃变。”但是,元音稳定段和鼻化段的界限较难确定。为了保证拼接效果,在确定元音稳定段与鼻化段、鼻化段与鼻韵尾的分界点时综合考虑了共振峰、频谱、波形3方面特征。当三者中有两者表现一致时,即确定此处为分界点;当三者表现各异时,以波形来确定分界点;如果三者一致,那是最好的情况。在合成实验过程中,还是存在一些音节的拼接音段在听感上有些许的不自然,但是基本不会影响听辨人的感知判断。

通过拼接,共得到552 (2发音人×3种拼接×46组×2种鼻韵母) 个合成语音刺激。加上184(2人×46组×2种鼻韵母) 个自然音节,共计有736个音节刺激。

1.3 实验过程

听辨实验的语料利用E-PRIME软件播放,呈现顺序采取随机的方式。被试对播放语料的听辨结果进行3择1强迫选择,选项为:

1) 前鼻音,如“ban”;

2) 后鼻音,如“bang”;

3) 无韵尾音节,如“ba”。

在实验过程中,被试需尽快判断所听到的音节属于哪一类型,并在键盘上按下相应键。当被试完成一次选择后,屏幕上会出现星形图案并持续500 ms,然后播放下一个声音文件。为了减少被试手误带来的实验误差,在键盘的选择键上贴上了相应的标签:前鼻音用“n”表示,后鼻音用“ng”表示,无韵尾音节用“x”表示。在正式实验开始前会有一个练习阶段,让被试学习和熟悉实验过程。

2 实验结果

图 4-7分别给出了中日被试关于“an/ang”、“en/eng”的听辨结果。8个柱图从左往右根据声学刺激生成方法分成4组:自然音节、“IV+t-N”、“IV-T+N”及“IV-T+n”,每组含“n”和“ng”两个柱。“n”表示被试感知为前鼻音,“ng”表示后鼻音,“x”表示无韵尾音节。

2.1 “an/ang”对的感知听辨 2.1.1 汉语母语被试听辨结果

图 4显示汉语母语被试对自然音节的听辨基本完全正确:“an”的正确率为99.1%,“ang”为94%。经被试反馈,在听辨选择过程中,难免还是会出现一些手误,但数量不多。因此,可以认为汉语母语被试能够正确区分鼻韵母“an/ang”对。

图 4 中国被试“an/ang”对感知结果

从“IV+t-N”合成语料的听辨结果来看,汉语母语被试将“an”判断为“ang”的比例占87.9%,将“ang”判断为“an”的比例占93.6%。这个结果表明汉语母语被试有着明显的倾向性:在无鼻韵尾、元音段和鼻化元音段相矛盾的场合下,汉语母语者的鼻韵母判断主要由鼻化元音段的来源决定,即鼻化元音段的作用大于元音段。

“IV-T+N”的结果显示中国被试将87.9%的“an”判断为“an”,85.6%的“ang”听辨为“ang”。可见,在失去鼻化元音段线索的情况下,元音段及鼻韵尾段仍然包含较充分的鼻韵母分辨线索,中国被试仍然可以取得较高的判断准确率。

“IV-T+n”的声学刺激令汉语母语者的听辨遇到了困难:“an”和“ang”分别只有57.8%和56.4%的正确率。这组刺激是原始音节切除鼻化元音段后交换前后鼻韵尾所得到,元音段保持原来鼻音尾信息,鼻韵尾则持有对立信息。稍高于50%的正确率提示元音段持有稍大于鼻韵尾的听辨信息。

2.1.2 日语母语被试听辨结果

图 5显示即使是自然音节,日语母语被试对于“an/ang”鼻韵母的听辨仍然存在较大困难:“an”的正确率为43.3%,“ang”为57.3%。这也证实了鼻韵母的习得的确是日语母语背景的汉语学习者的难点问题之一。后鼻韵母“ang”的正确率要高于前鼻韵母“an”。

图 5 日本被试“an/ang”对感知结果

“IV+t-N”语料的听辨结果中,“an”有45.9%被判断为“ang”,而“ang”只有33.8%被判断“an”, 显示日语母语者倾向于选择更多的后鼻韵母“ang”判断。在“IV-T+N”语料听辨中,“an”有50.4%的正确率,而“ang”仅有37.7%。这显示鼻化元音段的切除对于日语母语被试判断后鼻韵母造成了显著困扰。在“IV-T+n”语料听辨中,日语母语被试取得了54.1%的“an”正确率,而“ang”则进一步下降到32.6%。可见,在缺少鼻化元音段的情况下,日语母语被试的“ang”判断受到了较大干扰。

从日语母语被试的听辨结果中还可以看到,无论是自然音节还是合成音节,被判断为无韵尾音节的比例都不低。自然音节被判断为无韵尾音节的比例高达20%(ang) 及14.7%(an);拼接合成音节被判断为无韵尾音节的比例最高达25.9%,最低也为19.6%。根据汪航的研究结果[12],日语母语者在感知一个音节是否是鼻音尾音节时对鼻韵尾有一定的依赖性,鼻韵尾时长越短,越易将听到的音节判断为无韵尾音节。日语母语被试在此次实验中出现这种情况,可能跟所用语音样本有不少鼻韵尾都较短的事实有关。

比较图 45的中日被试听辨结果不难发现,日语母语者不能像汉语母语者一样很好地区分前后鼻韵母,他们还没能形成如汉语母语者一样的前后鼻音范畴化。

2.2 “en/eng”对的感知听辨 2.2.1 汉语母语被试听辨结果

图 6显示在自然音节情况下,汉语母语被试听辨“en”的正确率为94.8%,“eng”为96%,保持了很高的准确度。在“IV+t-N”情况下,“en”有85%被判断为后鼻音,“eng”有81%被判断为前鼻音,显示鼻化元音段载有“en/eng”鼻韵母类型的关键信息。在“IV-T+N”情况下,“en”正确辨别的比例为91.5%,“eng”为88.5%,显示去除鼻化元音段后残留的元音加鼻韵尾仍保留充足的鼻韵母辨别信息。在“IV-T+n”情况下,“en”有85%被判断为前鼻音,“eng”有73.7%被判断为后鼻音,显示在对立鼻韵尾的干扰下,残留的元音段仍然持有较充分的鼻音类型信息。

图 6 中国被试“en/eng”对感知结果

与汉语母语者被试“an/ang”对的听辨结果相对比可以发现,“en/eng”对的结果与之基本一致。只是在“IV-T+n”情况下,“en/eng”对的元音部分比“an/ang”对的保留了更多的鼻音类型听辨信息。

2.2.2 日语母语被试听辨结果

图 7显示日语母语被试关于“en/eng”对自然音节的听辨正确率都接近70%,说明相对于“an/ang”,他们能更好地区分这对鼻韵母。在“IV+t-N”情况下,和自然音节相比,前鼻音“en”的听辨率下降36.3%,后鼻音“eng”的听辨率下降35.5%,说明拼接的对立鼻化元音段造成了显著干扰。但是,相对于残存的元音段而言,拼接的对立鼻化元音段也未取得鼻音类型辨别的主导优势。在“IV-T+N”情况下,“en”的准确度为71.7%,“eng”为50.5%,显示切除鼻化元音段对于前鼻韵母影响不大,对于后鼻韵母类型判断影响较大。在“IV-T+n”情况下,“en”的听辨率为59.7%,“eng”为48.2%,表明对立鼻韵尾会干扰基于缺省元音段的鼻音感知。在这组实验中,被判断为无韵尾音节的比例依然很高,最多达到24.5%,最低为9.3%。

图 7 日本被试“en/eng”对感知结果

3 讨论

自然语料的听辨结果表明,鼻韵母确实是日语母语者学习普通话语音的一大难点,他们不能像汉语母语者一样很好地区分前后鼻音类型。在“an/ang”、“en/eng”两对鼻韵母中,日语母语者更难掌握前者的听辨。其原因可能如王韫佳所发现的[13],韵母对元音的声学差异会影响日本学习者普通话鼻韵母的感知正确率,声学差异越大,感知正确率越高。相比于“en/eng”,“an/ang”对的元音部分声学差异对感知正确率的影响要小一些。

在元音、鼻化元音及鼻韵尾3个音段中,本文拼接合成语音的实验结果表明,对于汉语母语者而言,鼻化元音段载有原鼻韵母的充分分辨信息,“an/ang”和“en/eng”对皆是。在鼻化元音段缺失的“IV-T+N”情形下,元音和鼻韵尾中的信息也能够保障汉语母语者有较高准确率(>85%) 的鼻音类型判断。在仅保留元音且鼻韵尾为对立的情形下,汉语母语者仍能取得超过50%的听辨准确率。这说明元音和鼻韵尾中都含有供汉语母语者听辨鼻音类型的信息,且元音中的更多一些。由于“en/eng”对的元音声学差异大于“an/ang”对,在鼻韵母对立的“IV-T+n”情形下,汉语母语者取得了高于70%的准确率。

对于日语母语者而言,鼻化元音段对于鼻韵母辨别的重要作用没有体现出来。就前鼻韵母“an”和“en”而言,当音节中包含鼻化元音段时,不管是原有的或是对立的,都会导致更多的后鼻音判断。这两个前鼻韵母最高的听辨准确率都是在缺少鼻化元音段的“IV-T+N”情形下获得的。同时,当缺少鼻化元音段时,“IV-T+N/n”都会显著降低后鼻音的判断。与此相对比,元音段则显然是他们听辨前后鼻韵母的重要依据,尤其是前鼻韵母判断的依据。在没有鼻韵尾的情况下,他们判断无韵尾音节的比率有显著上升,尤其是前鼻韵母音节。这个结果再次证实本文作者前期工作的结论[12, 15],即鼻韵尾对于他们感知一个音节是否是鼻音尾音节具有较大的作用。

4 结论

本文研究结果表明:对于汉语母语者而言,鼻化元音段包含的鼻音类型信息最丰富,丰富到足以掩蔽其他部分所包含的鼻音类型信息。元音段和鼻韵尾都包含一定的鼻音类型信息,但是前者比后者要多一些。并且,前后鼻韵母元音段的声学差异越大,其所含类型信息就越丰富。鼻韵母3部分的作用大小可以总结为:鼻化元音段>元音稳定段>鼻韵尾。

对于日语母语者而言,鼻化元音段不再是鼻韵母听辨的关键线索,而是后鼻音判断的有利线索。当鼻化元音段和元音段共存时,被试会有更多的后鼻韵母判断。当鼻化元音段不存在时,不论鼻韵尾如何,被试都会有更多的前鼻音韵母判断。因此,对于他们而言,前后鼻韵母判断线索的作用大小可总结为:鼻化元音段>元音稳定段>鼻韵尾。虽然顺序与汉语母语者相同,但是鼻韵母3部分的作用有本质差别。和汉语母语者相比,他们还有另外一个显著特点:前后鼻韵母元音部分的声学差异越大,听辨准确率越高。

以上的发现提示:在对日汉语语音教学中,通过强调韵母对元音段声学特征的差异,以及增强日语母语学生对于鼻化元音段声学差异的感知敏感性,可能有助于他们习得汉语普通话鼻韵母。同时,这些发现也有助于研究基于听知觉特征的语音处理技术[16]

参考文献
[1] 刘英林, 马箭飞. 研制《音节和汉字词汇等级划分》:探寻汉语国际教育新思维[J]. 世界汉语教学, 2010, 24(1): 82–92. LIU Yinglin, MA Jianfei. The development of the "Graded Chinese Syllables, Characters and Words":Exploring the new prospective of global Chinese education[J]. Chinese Teaching in the World, 2010, 24(1): 82–92. (in Chinese)
[2] 林茂灿, 颜景助. 普通话带鼻尾零声母音节中的协同发音[J]. 应用声学, 1994, 13(2): 12–20. LIN Maocan, YAN Jingzhu. Coarticulation in the zero-initial syllable with nasal ending in Standard Chinese[J]. Applied Linguistics, 1994, 13(2): 12–20. (in Chinese)
[3] Recasens D. Place cues for nasal consonants with special reference to Catalan[J]. Journal of the Acoustical Society of America, 1983, 73(4): 1346–1353. DOI:10.1121/1.389238
[4] Repp B H. Perception of the-distinction in CV syllables[J]. Journal of the Acoustical Society of America, 1986, 79(6): 1987–1999. DOI:10.1121/1.393207
[5] Kurowski K, Blumstein S E. Perceptual integration of the murmur and formant transitions for place of articulation in nasal consonants[J]. Journal of the Acoustical Society of America, 1984, 76(2): 383–390. DOI:10.1121/1.391139
[6] Malécot A. Acoustic cues for nasal consonants:An experimental study involving a tape-splicing technique[J]. Language, 1956, 32(2): 274–284. DOI:10.2307/411004
[7] Recasens D, Martí J. Perception of unreleased final nasal consonants[J]. J Acoustique, 1990, 3: 287–299.
[8] Dellattre P. From acoustic cues to distinctive features[J]. Phonetica, 1968, 18: 198–230. DOI:10.1159/000258610
[9] Pickett J M. Some acoustic cues for synthesis of the/n-d/distinction[J]. Journal of the Acoustical Society of America, 1965, 38(3): 474–477. DOI:10.1121/1.1909721
[10] Mermelstein P. On detecting nasals in continuous speech[J]. Journal of the Acoustical Society of America, 1977, 61(2): 581–587. DOI:10.1121/1.381301
[11] 吴宗济, 林茂灿. 实验语音学概要[M]. 北京: 高等教育出版社, 1989. WU Zongji, LIN Maocan. Essentials of Experimental Phonetics[M]. Beijing: Higher Education Press, 1989. (in Chinese)
[12] 汪航.日本留学生对汉语普通话鼻音尾韵母的感知[D].北京:北京语言大学, 2012. WANG Hang. The Perception of Japanese Learners on Standard Chinese Nasal Finals[D]. Beijing:Beijing Language and Culture University, 2012. (in Chinese)
[13] 王韫佳. 日本学习者感知和产出普通话鼻音韵母的实验研究[J]. 世界汉语教学, 2002, 16(2): 47–61. WANG Yunjia. An experimental study on the perception and production of nasal codas by Japanese learners of Chinese Putonghua[J]. Chinese Teaching in the World, 2002, 16(2): 47–61. (in Chinese)
[14] MOU Xiaomin. Nasal Codas in Standard Chinese:A Study in the Framework of the Distinctive Feature Theory[D]. Boston:Massachusetts Institute of Technology, 2006.
[15] 张劲松, 汪航, 王祖燕, 等.元音部分对日本学习者感知普通话鼻韵母的影响[C]//第12届全国人机语音通讯学术会议(NCMMSC2013) 论文集.贵阳, 2013. ZHANG Jinsong, WANG Hang, WANG Zuyan, et al. The influence of vowel segments on Japanese learners' perception of Chinese nasal codas[C]//Proceedings of NCMMSC2013. Guiyang, 2013. (in Chinese)
[16] 徐敬德, 崔慧娟, 唐昆. 结合信源和信道的多级矢量量化联合优化算法[J]. 清华大学学报:自然科学版, 2015, 55(8): 826–830. XU Jingde, CUI Huijuan, TANG Kun. Joint optimization algorithm combining source and channel coding for multi-stage vector quantization[J]. Journal of Tsinghua University:Science and Technology, 2015, 55(8): 826–830. (in Chinese)