清华大学学报(自然科学版)  2017, Vol. 57 Issue (9): 945-951    DOI: 10.16511/j.cnki.qhdxxb.2017.26.045
  电子工程 本期目录 | 过刊浏览 | 高级检索 |
姚云1, 吴西愉2, 孔江平2
1. 河南大学 文学院, 开封 475001;
2. 北京大学 中国语言文学系, 北京 100871
Radius vector-driven 3-D Mandarin vocal tract model
YAO Yun1, WU Xiyu2, KONG Jiangping2
1. College of Chinese Language and Literature, Henan University, Kaifeng 475001, China;
2. Department of Chinese Language and Literature, Peking University, Beijing 100871, China
摘要 为得到更加精确的声道共鸣特性,人们越来越关心说话时声道的结构及其形状变化。该文从MRI 3-D图像数据中提取了汉语普通话7个单元音[a]、[o]、[r]、[i]、[u]、[y]、[e]的声道边缘、中线和矢量半径数据,并沿着声道中线从唇到声门等间距截取声道的36个截面,对于每个截面,根据矢量半径的大小使同一个位置的截面形状作线性过渡,从而建立用矢量半径驱动的汉语普通话立体声道模型。计算模型的共振峰并合成语音样本,在与自然语音对比的听辨实验中,该模型取得了较好的语音合成效果。
关键词 汉语普通话声道建模矢量半径    
Abstract:Analyses of the vocal tract resonant characteristics need accurate models of the vocal tract shape. This article presents a three-dimensional Mandarin vocal tract model using vocal tract shape data and midsagittal radius vector data from MRI images for seven Mandarin sustained vowels[a],[o],[r],[i],[u],[y] and[e]. The vocal tracts images were cut into 36 sections of equal distances along the midline of the vocal tract. The Mandarin vocal tract model for each section is then driven by the length of the radius vector in the cross-sectional images. The sound synthesized by this model sounds very much like natural speech.
Key wordsMandarin    vocal tract model    radius vector
收稿日期: 2016-05-06      出版日期: 2017-09-15
ZTFLH:  H017  
通讯作者: 孔江平,教授,     E-mail:
姚云, 吴西愉, 孔江平. 矢量半径驱动的汉语普通话立体声道模型[J]. 清华大学学报(自然科学版), 2017, 57(9): 945-951.
YAO Yun, WU Xiyu, KONG Jiangping. Radius vector-driven 3-D Mandarin vocal tract model. Journal of Tsinghua University(Science and Technology), 2017, 57(9): 945-951.
  表1 磁共振设备扫描参数列表
  图1 汉语普通话元音[a]的声道截面
  图2 汉语普通话单元音[a]、[i]、[u]的立体声道
  表2 汉语普通话声道从唇到声门36个截面矢量半径
  图3 声道不同位置的截面边缘线
  图4 汉语普通话立体声道网格模型
  图5 汉语普通话[a]到[i]过渡声道面积函数和声道传递函数
  表3 自然语音与计算模拟的语音共振峰数据
