2. 天津大学 建筑工程学院, 天津 300072 ;
3. 天津大学 计算机学院, 天津 300072
2. School of Civil Engineering, Tianjin University, Tianjin 300072, China ;
3. School of Computer Science and Technology, Tianjin University, Tianjin 300072, China
在经济高速发展的今天,国际间交流日益频繁、 广泛。由于教学质量与母语迁移等因素的影响,现阶段大学生往往会因不准确的发音而影响会话双方的交流与理解。因此对大学生英语语音的矫正是英语语音教学中不可或缺的重要环节。
语音可分为元音和辅音2大类,其中元音是核心和主干。它不仅是音节的中心核,而且也是主要超音段语流特征(如重音和语调)的直接承载[1]。因此,对元音的矫正是英语语音矫正的中心环节,其准确性直接影响到语言交际[2]。
目前,国内针对英语语音矫正的教学方法一般为教师指导和跟读模仿,但这种最为普遍的方法有着很大的局限性。由于教师自身语音水平有限,学生可能会受到教师语音的影响,加之人耳听辨的主观性,教师往往无法及时发现学生语音上的不足。跟读模仿同样也无法达到矫正语音的效果。蒋超[3]在其针对江苏英语专业大学生英语语音感知及产出模式的调查研究中指出,英语语音的感知和产出水平是不平衡的,因此跟读模仿不一定能达到矫正语音的效果。
现在随着科技发展,英语语音的矫正开始向更便捷、 更高效、 可视化的方向发展。现有的语音学习、 矫正软件一般基于音位分析,如Praat、 Speedlingua、 Rosetta Stone等。这类软件可获取共振峰、 语调等声学特征,基于前后数据的对比,使用者可以通过改变口型、 舌位、 声调等来实现矫正发音。美国Kay公司开发的言语运动分析软件通过其内置的口腔轮替运动速率、 第二共振峰过渡、 嗓音与抖动、 语调模拟、 音节速率5种分析模式来实现测试和矫正神经性和生理性的言语病理,可以基于舌位与第二共振峰变化规律来进行元音的矫正[4]。Sona-Match软件可用语音信号进行线性预测编码(linear predictive coding,LPC)分析并进行共振峰的实时显示,从而进行元音的矫正[5]。
此类可视化软件虽然能够实现共振峰的动态变化或数值变化,但使用者仍然无法建立共振峰数据与舌位的直观联系,因此此类软件存在上手困难、 矫正效果有限等问题。
本文通过调查藏语语者英语语音学习现状,了解其需求,利用“藏族人说汉语普通话、 英语、 藏语”声学特征语料库(CETTS)中的英语音频语料,借助语音分析软件Praat提取相关声学参数,建立直观易懂的舌位图模型,并设计舌位自我纠正软件,辅助学习者有针对性地改善其英语发音现状。
1 藏语语者英语语音学习现状调查藏语作为藏语语者的母语对其学习汉语或英语都会产生部分影响,其中对于汉语来说,藏语语者在发汉语单元音时,其元音空间相较于汉语语者来说,普遍右移[6]; 而在其说英语时,藏语语者倾向于混淆某些英语单元音,如[e]和[æ][7]。由于英语在藏区的使用范围十分有限,藏区师资力量不足,缺少对学生英语语音学习的有效指导[8]。藏语语者缺少系统的语音学习方法,导致其语音面貌落后的局面[9]。
通过对48名大学在读藏语语者进行走访和网上问卷调查,发现在英语语音学习改进方法方面,90%以上的受访对象有意愿改善自己的语音面貌,78%的被试倾向于通过跟读和模仿来达到这一目的。近50%的被调查者没有听说过Praat语音分析软件,其中仅有8%的受访对象能够简单操作该软件并认为可视化语音矫正对其发音有较大改善。其中43%的藏语语者认为目前网络上的语音学习软件对自己帮助不大,其效果不如直接跟读方便; 21%的藏语语者认为软件太难,影响操作。受访者均表示希望尝试简单易学且直观的软件来有针对性地辅助自身的语音学习。
2 舌位模型建立及应用为了切实解决藏语语者在英语语音学习中的问题,本文试图通过构建直观的舌位模型软件来辅助其语音学习和语音矫正。
2.1 前提以舌中纵剖面为轴对称面,舌位形状在发音过程中为对称形状,因此以舌根为原点建立二维平面直角坐标xOy。
在整个发音过程中,舌根作为参考系,其位移对发音影响微小,可以假定舌根固定不动,舌面最高点和舌尖对于舌根的相对空间位置不随舌根移动而变化[10]。
2.2 模型假设1) 根据文[10]中8个单元音的标准发音的真人舌部的侧面解析图,按照1∶16的缩尺比以舌根为原点建立平面直角坐标系,得到在8个元音标准发音舌形中,舌位最长为无量纲数100(对应[i:]),最短为80(对应[u:]); 舌尖最高位无量纲数50(对应[u:]),最低为30(对应[ɑ:])。
2) 大量的声学分析和语音合成实验证明元音的音质是由前3个共振峰的数值来区分,元音产出时舌位和唇形与共振峰数值有非常稳定的关系[1, 11]。第一共振峰数值与舌位的高低成反比,第二共振峰与舌位的前后有着密切的联系。一般情况下,第一、 第二共振峰的数值已经足够用以进行元音的声学分析。因此本文探究对发音者影响时,只考虑2个因素,舌面高低和舌尖前后,因此舌面最高点位置只考虑其纵坐标变化规律(以表 2中[i:]发音为例,舌面最高点纵坐标为$50+\frac{280-{{F}_{1}}}{21.5}$),认为其横坐标不变(舌面最高点纵坐标为50); 舌尖位置只考虑其横坐标变化规律(舌尖最前点的横坐标为1$100+\frac{{{F}_{2}}-2250}{70}$),认为其纵坐标不变(舌尖最前点纵坐标为10)。
3) 假设根据标准发音舌位图,按照一定的缩尺比求得A,B的坐标A(xA0,yA0),B(xB0,yB0)。
4) 假设对于共振峰F1,比例系数为
${{k}_{1}}=\frac{280-710}{100-80}\text{=}-21.5.$ |
其中: F1min=280 Hz,F1max=710 Hz(8个单元音标准发音对应的第一共振峰最小值为F1min,最大值为F1max)。对于共振峰F2,比例系数为
${{k}_{2}}=\frac{2250-870}{50-30}=70.$ |
其中: F2max=2 250 Hz,F2min=870 Hz(8个单元音标准发音对应的第二共振峰最小值为F2min,最大值为F2max)[1],其坐标数值与共振峰数值一次线性相关。
2.3 英语单元音的舌位模型1) 计算学习者舌面最高点方程:
$y={{y}_{{{A}_{0}}}}+\frac{{{F}_{1}}{{F}_{1s}}}{{{k}_{1}}}.$ | (1) |
其中k1表示共振峰差值与舌面位移的比例系数。
2) 计算学习者舌尖位置计算方程:
$x={{x}_{{{B}_{0}}}}+\frac{{{F}_{2}}{{F}_{2s}}}{{{k}_{2}}}.$ | (2) |
其中k2表示共振峰差值与舌尖位移的比例系数。
根据式(1)和(2)计算出的英语单元音舌位模型数据见表 1,其对应的舌位图如图 1所示。
发音 | (F1s,F2s) | 标准舌面位置A | 标准舌尖位置B | ||
xA0 | yA0 | xB0 | yB0 | ||
[i:] | (280,2 250) | 50 | 50 | 100 | 20 |
[i] | (400,1 920) | 65 | 44 | 95 | 10 |
[e] | (550,1 770) | 50 | 37 | 93 | 10 |
[æ] | (690,1 660) | 40 | 31 | 92 | 10 |
[u:] | (310,870) | 20 | 32 | 80 | 25 |
[u] | (450,1 030) | 15 | 42 | 82 | 25 |
[ɔ:] | (590,880) | 25 | 36 | 80 | 18 |
[ɔ] | (710,1 100) | 20 | 30 | 84 | 20 |
按照式(1)、 (2)及表 1所给的数据,任意学习者舌位计算公式见表 2。
舌面位置公式 | 舌尖位置公式 | |
[i:] | $A\prime \left( 50,50+\frac{280-{{F}_{1}}}{21.5} \right)$ | $B\prime \left( 100+\frac{{{F}_{2}}-2\text{ }250}{70},10 \right)$ |
[i] | $A\prime \left( 65,44+\frac{400-{{F}_{1}}}{21.5} \right)$ | $B\prime \left( 95+\frac{{{F}_{2}}-1\text{ }920}{70},10 \right)$ |
[e] | $A\prime \left( 50,37+\frac{550-{{F}_{1}}}{21.5} \right)$ | $B\prime \left( 93+\frac{{{F}_{2}}-1\text{ }770}{70},10 \right)$ |
[æ] | $A\prime \left( 40,31+\frac{690-{{F}_{1}}}{21.5} \right)$ | $B\prime \left( 92+\frac{{{F}_{2}}-1\text{ }660}{70},10 \right)$ |
[u:] | $A\prime \left( 20,32+\frac{310-{{F}_{1}}}{21.5} \right)$ | $B\prime \left( 80+\frac{{{F}_{2}}-870}{70},25 \right)$ |
[u] | $A\prime \left( 15,42+\frac{450-{{F}_{1}}}{21.5} \right)$ | $B\prime \left( 82+\frac{{{F}_{2}}-1\text{ }030}{70},25 \right)$ |
[ɔ:] | $A\prime \left( 25,36+\frac{590-{{F}_{1}}}{21.5} \right)$ | $B\prime \left( 80+\frac{{{F}_{2}}-880}{70},18 \right)$ |
[ɔ] | $A\prime \left( 20,30+\frac{710-{{F}_{1}}}{21.5} \right)$ | $B\prime \left( 84+\frac{{{F}_{2}}-1\text{ }100}{70},18 \right)$ |
3 智能舌位绘制工具
根据节2中建立的舌位模型,本文通过编程软件Visual Basic设计出简单的舌位绘制工具,如图 2所示,实线表示标准舌位,虚线表示发音者舌位。藏语语者在得知各自的共振峰F1,F2后,就可以自行判断自己发音时和标准语音间的舌位差异,从而有意识地调整舌位达到可视化矫正的目的。
智能绘制舌位软件功能为学习者可以根据标准舌位进行单个单元音的矫正,实现自我反馈学习。同时,学习者可以观察自己的单元音发音整体结构与标准舌位的差距,并根据自己发音特征来调整改善。
每个标准发音的舌位有2个控制点(xbi1,ybi1),(xbi2,ybi2),学习者每个发音舌位对应控制点为(xi1,yi1),(xi2,yi2),其中,(xbi1,ybi1)表示单元音标准发音舌尖最前点坐标值,(xbi2,ybi2)表示单元音标准发音舌面最高点坐标值,(xi1,yi1)表示学习者发音对应的舌尖最前点坐标值,(xi2,yi2)表示学习者发音对应的舌面最高点坐标值。利用Euler距离算法,定义单元音发音空间结构指标如下:
$\begin{align} & S=\sum\limits_{i=1}^{8}{\left[ {{({{x}_{b{{i}_{1}}}}{{x}_{{{i}_{1}}}})}^{2}}+{{({{y}_{b{{i}_{1}}}}{{y}_{{{i}_{1}}}})}^{2}} \right]}+ \\ & \sum\limits_{i=1}^{8}{\left[ {{({{x}_{b{{i}_{2}}}}{{x}_{{{i}_{2}}}})}^{2}}+{{({{y}_{b{{i}_{2}}}}{{y}_{{{i}_{2}}}})}^{2}} \right]}. \\ \end{align}$ | (3) |
S反映了学习者发音结构整体的准确性,学习者发音结构准确性与指标S成反比,通过智能绘制舌位软件进行长期矫正之后,学习者可以通过指标S来反馈自己语音矫正情况。
3.1 软件检验模型设计出之后,从CETTS语料库中选取藏语语者进行验证。
1) 以A为研究对象,利用Praat软件记录A发[ɔ]的音,提取共振峰F1,F2;
2) 将共振峰值输入智能舌位绘制工具中,点击[ɔ]按键,绘制舌位图像;
3) 通过舌位图像发现与标准发音相比,A的舌面低于标准舌面,且舌尖位置相近;
4) 根据研究结果对A做相应调整,抬高舌面,保持舌尖位置不变,再次记录发音,提取共振峰F1,F2;
5) 利用智能舌面绘制工具录入矫正后的共振峰值,绘制相应舌位,运行结果如图 3和4所示(其中实线表示目标音的位置,虚线表示发音人矫正前后的发音舌位)。
3.2 结果与分析
从CETTS语料库中提取5位藏语语者语料,计算出共振峰F1,F2后,应用任意学习者舌位公式,计算其每个发音的舌面最高点和舌尖位置。通过与标准音比对,提出有针对性的矫正建议。以这5位藏语语者的英语单元音[i:]和[i]为例(如表 3和表 4所示,TF表示藏语语者女性发音,TM表示藏语语者男性发音):
发音 编号 | A(舌面最 高点) | B(舌尖 位置) | 矫正建议 | |
舌面 | 舌尖 | |||
标准音 | (50,50) | (100,20) | ||
TF01 | (50,44) | (101,20) | 抬高 | 靠后 |
TF02 | (50,47) | (104,20) | 抬高 | 靠后 |
TF03 | (50,39) | (103,20) | 抬高 | 靠后 |
TM04 | (50,44) | (95,20) | 抬高 | 靠前 |
TM05 | (50,48) | (100,20) | 抬高 | 靠后 |
发音 编号 | A(舌面最 高点) | B(舌尖 位置) | 矫正建议 | |
舌面 | 舌尖 | |||
标准音 | (65,44) | (95,10) | ||
TF01 | (65,42) | (102,10) | 抬高 | 靠后 |
TF02 | (65,46) | (88,10) | 降低 | 靠前 |
TF03 | (65,45) | (100,10) | 降低 | 靠后 |
TM04 | (65,48) | (92,10) | 降低 | 靠前 |
TM05 | (65,48) | (95,10) | 降低 | 靠后 |
由表可知,藏语语者在学习[i:]时,普遍需要抬高舌面,在学习[i]时,需要降低舌面,在学习这2个元音时,学习者的舌尖需靠后者居多。
3.3 软件优点1) 量化分析: 将语音通过语谱图和舌位模型可视化,对学习者实际发音情况进行量化分析,改善了目前英语语音教学基本上停留在“口耳之学”的单纯模仿与矫正的缺点。
2) 操作简单: 开发的舌位软件,方便语言学习者使用。学习者可以自行将发音数据调入舌位软件,直观了解自身语音面貌。
3) 针对性强: 通过舌位模型,语言学习者通过对比英语语音与标准语音,从模型中找出差异,并进行有针对性的调整,使自己的发音更趋向标准发音。
3.4 未来工作1) 研究发音时将舌头形状等效成一次折线形的做法还有待进一步改进以提高其精度,可以根据更多数据将模型形状与舌形进行高次非线性拟合。
2) 在研究舌形时只考虑舌面最高点和舌尖位置、 并认为舌面最高点横坐标和舌尖位置纵坐标不变,这一假设没有充分考虑因舌长一定而引起的关联性变化,对模型精度可能会造成一定影响。今后研究中可以借助发音时舌头的生理数据来进一步调整模型。
4 结 论本文以问卷方式调查藏族语者单元音发音现状,并了解到大多数藏语语者并没有系统化的方法矫正其语音,而且不会操作语音分析软件。由此,在语音分析软件Praat提取声学数据基础上,建立简单易懂的舌位模型,并设计出智能舌位绘制工具。以可视化的方法,让藏族语者直观地理解自身在语音矫正时努力的方向,从而对舌位进行相应调整,达到有效改善语音面貌的目的。在后续研究中,将通过更多数据将模型形状与舌形进行高次非线性拟合,以精确反映发音时的舌头形状,进一步完善现有二维模型的精准度,为语言学习者提供更好的用户体验,从而更加有效地改善学习者现有语音面貌,提高语音教与学的针对性,为更顺畅的交流提供帮助。
[1] | Ladefoged P, Johnstone K. A Course in Phonetics (7th Ed)[M]. Stamford: Cengage Learning, 2014 . |
[2] | 周卫京, 邵鹏飞, 陈红. 英语专业大学生对RP英语元音感知的实证研究[J]. 解放军外国语学院学报 , 2010, 33 (6) : 45–49. ZHOU Weijing, SHAO Pengfei, CHEN Hong. The RP English vowels perception of China college students[J]. Journal of PLA University of Foreign Languages , 2010, 33 (6) : 45–49. (in Chinese) |
[3] | 蒋超. 江苏英语专业大学生英语语音感知及产出模式调查[D]. 南京:南京师范大学, 2006. JIANG Chao. The English Sounds Perception and Production Mode of China College Students from Jiangsu[D]. Nanjing:Nanjing Normal University, 2006. (in Chinese) |
[4] | 王建斌, 于洪志, 胡阿旭. 言语运动分析软件在言语生理研究中的应用[J]. 生命科学仪器 , 2011, 9 (4) : 50–54. WANG Jianbin, YU Hongzhi, HU A'xu. The application of MSP5141 in the field of speech physiology[J]. Life Science Instruments , 2011, 9 (4) : 50–54. (in Chinese) |
[5] | 方华萍, 李永宏, 张金爽. Sona-Match软件在言语构音障碍生理矫正中的应用[J]. 生命科学仪器 , 2011, 9 (1) : 64–67. FANG Huaping, LI Yonghong, ZHANG Jinshuang. Applications of Sona-Match in speech dysarthria physiological correcting and treatment[J]. Life Science Instruments , 2011, 9 (1) : 64–67. (in Chinese) |
[6] | ZHAO Lu, FENG Hui, WANG Huixia, et al. Acoustic features of mandarin monophthongs by Tibetan speakers[C]//2014 International Conference on Asian Language Processing (IALP). Kuching:Malaysia, 2014:147-150. |
[7] | AN Shourong, FENG Hui, WANG Huixia, et al. An acoustic analysis of English monophthongs by Tibetan speakers[C]//2014 International Conference on Asian Language Processing (IALP). Kuching, Malaysia, 2014:144-146. |
[8] | 田家乐. 西藏三语教学的昨天、今天和明天[J]. 西藏大学学报(汉文版) , 2001, 16 (4) : 75–79. TIAN Jiale. The yesterday, today and tomorrow of trilingual teaching in Tibet[J]. Journal of Tibet University (Chinese Edition) , 2001, 16 (4) : 75–79. (in Chinese) |
[9] | 强巴央金. 西藏中小学英语教学现状及对策研究[J]. 西藏大学学报(社会科学版) , 2011, 26 (3) : 163–169. CHAMPA Yangchin. On the situation of teaching in primary and secondary schools of Tibet[J]. Journal of Tibet University , 2011, 26 (3) : 163–169. (in Chinese) |
[10] | University of Iowa, Sounds of Speech[EB/OL].[2016-03-15]. http://soundsofspeech.uiowa.edu/. |
[11] | 陈红. 可视化英语语音教学改革研究——Praat软件在英语语音教学中的应用[J]. 兰州教育学院学报 , 2013, 29 (9) : 53–54. CHEN Hong. Reformation research of visualization of English phonetics teaching-The application of Praat in phonetics English teaching[J]. Journal of Lanzhou Institute of Education , 2013, 29 (9) : 53–54. (in Chinese) |