基于多重判定的纯音听阈测定方法
吴育昊 , 贾珈 , 张秀龙 , 蔡莲红     
清华大学 计算机科学与技术系, 人机语音交互实验室, 北京 100084
摘要:听觉感知特性在听力评估中占有重要地位。该文面向嵌入式平台,基于人耳听觉特性,提出振幅到声压级的声学参数转换模型,实现标准纯音测试信号的自动生成;设计基于人耳听觉感知的测试音强度调整规则,提出基于多重判定的听阈值高信度确定方法和基于噪声掩蔽效应的听阈值修订算法;设计并实现面向嵌入式平台的纯音听阈测定方法和系统,实验对比了听力正常者的纯音听力曲线和标准听力范围。结果表明:该系统可方便快捷地及时检查听力变化,且具有较好的信度,也可用于听力筛查和疗效的评估。
关键词听觉感知    纯音听阈    听力评估    噪声掩蔽    嵌入式    
Assessment of pure tone audiometry based on multiple judgments
WU Yuhao, JIA Jia, ZHANG Xiulong, CAI Lianhong     
Human Computer Speech Interaction Research Group, Department of Computer Science and Technology, Tsinghua University, Beijing 100084, China
Abstract: A auditory perception plays an important role in hearing assessments. A model was developed to transform amplitudes to sound pressure using acoustic parameters based on the auditory characteristics for automatic generation of standard pure tone test signals. The sounds were adjusted based on human auditory perception for a reliable algorithm to compute the hearing threshold based on multiple judgments. A correction algorithm for the hearing threshold is given for noise masking. A pure tone test was developed for an embedded platform to compare the hearing curves of normal people with standard hearing ranges. The results show that the system can quickly and easily check hearing changes, is reliable, and can be used for hearing screening.
Key words: hearing perceptual     pure tone audiometry     hearing evaluation     noise masking     embedded platform    

听觉 (hearing) 是声音作用于听觉系统引起的感觉。听力学是研究人类生理和病理状态下听觉功能的学科[1]。听力是听觉器官接收语音信号的能力,通常以听阈的高低表示。听阈 (auditory threshold) 是人耳恰能听到的最小声,属于感觉阈 (sensation threshold)。听力学中,将正常青年的听阈平均值定为基准阈声压级即“0 dB”,并将这种声级称为听力级 (hearing level,HL)[1]

“听阈测试”是指绝对听阈的测定。临床中的“听阈”,都是指“测听听阈”(hearing threshold) [1]。测听听阈的测定需选择适合聆听的环境,采用规定的测试步骤,排除不利的影响因素,并用规定的测听流程和声信号进行测试。

纯音听阈测定的国际标准对仪器设备、测听环境和测听流程等都给出了严格的规定,中国已等效采用,如GB/T 16403《纯音气导和骨导听阈基本测定法》[2]和GB/T 7583《声学纯音气导听阈测定听力保护用》[3]等。通常医院需配置符合标准的测听室和测听设备进行纯音听阈测定。但全国听障人数超过3 000万,显然医疗机构难以满足听力测试的需求。

为了提供便捷式的听力评估,本文面向嵌入式平台,研究便捷式纯音听阈测定的方法。听阈测试是一个心理声学问题,主要研究声刺激与受试者听觉的关系。测定的准确性受到外部和内在可变因素的影响。在嵌入式平台上,用扬声器发出声信号,在声场中测试听阈,因此测试环境、测试音的校准、测试音调整 (频率、声强、音长) 方法以及来自受试者的状态均会影响测试结果的准确性。

针对以上难点,本文提出一种声学信号数字振幅到声压级的参数转换模型,实现嵌入式设备准确测试音的自动生成;基于人耳听觉特性设计测试音的自动调整规则,提出一种多重判定的纯音听阈的测定方法。基于以上关键技术的研究,本文设计并实现嵌入式平台纯音听阈评估系统 (E-Hear),测试后给出受试者纯音听力曲线和评估报告。采用本文测听系统,对多名受试者测试,并与标准听力水平范围对比,结果表明:本文研制的便捷式纯音听阈测定方法可以完成纯音听阈评估,具有较好的效度和信度,可满足一般听力筛查的需要。

1 嵌入式平台纯音测听系统设计

本文参照国家标准[2-3],设计了一套面向嵌入式平台的纯音听阈测定系统[4],见图 1。该系统主要包括测试音生成、听力评估和信息管理3个部分。

图 1 嵌入式平台纯音测听系统框架

测试音生成部分依据测试需求和信号参数转换模型,由嵌入式设备自动生成准确的测试音;听力评估部分通过系统采集受试者反馈信息并智能调整测试音强度,分析并计算出受试者的听阈值;信息管理部分,系统在测听流程之后给出纯音听阈评估结果,并管理受试者个人信息和历史测试信息。考虑到稳定的声卡状态和良好的频响度,本文选择iPad 2作为嵌入式平台的案例设备[5]

2 测试音生成算法

听觉是一个心理感知过程。人耳对声音的感知与频率和声压级相关。因此在医用听力检查中,国际统一标准《纯音气导和骨导听阈基本测定法》[2]规定声音的强度使用声压级 (sound pressure level,SPL),并选用6个频率测试点。

纯音听阈评估中,准确的测试音是测听与评估的基础。案例设备生成纯音信号的强度受硬件设备的影响[3]。嵌入式平台信号的振幅 (amplitude)A可以通过计算机进行调控。如何满足测试音声压级的需求成为一个挑战。

本文采用理论与实验相结合的方法,建立一种声学信号数字振幅到声压级的参数转换模型,并基于此模型设计了测试音的生成算法。同时考察同型号不同设备测试音的差异以及嵌入式设备声源随距离增大的衰减。

2.1 测试音信号

本文在生成测试音之前检查案例设备生成纯音信号的谐波失真度、信号准确度和频率响应。

在程序中调整振幅、频率的数值,生成测试音信号。根据国家标准,选用250、500、1 000、2 000、4 000和8 000 Hz测试频率;控制振幅的数值选择100~30 000之间不等距离的10个点。

利用示波器观察测试音的波形并记录测试音信号,纯音信号以标准正弦波的形式均匀分布。将示波器显示的波形电压值进行数学拟合,结果表明:各测试频率的测试音信号幅度在0.5~3.5 V之间,与控制数值呈线性关系,波形标准无失真。

2.2 测试音振幅到声压级的参数转换模型

心理声学研究表明,人耳对声音强弱的反应表现为主观感觉的不同,感觉增量与刺激增量表现为对数关系[6]。在听力学中,通常采用对数刻度的分贝值如声压级来表示声刺激的强弱。

声压级变量SSPL与电压有效值V的关系如下:

SSPL=20lgV+C.

其中C是与参考声压和设备相关的系数。

本文在医用隔音室内,测量了案例设备信号幅度和相应的声压级。实验过程中,案例设备平放于桌子上,声级计固定在距案例设备30 cm的位置。案例设备的振幅设置参数从10到1 000,先后生成6个频率下不同振幅的纯音信号,使用型号为Bruel Kjaer 2250的声级计来记录信号的声压级 (单位:dB SPL)。

实验记录了多次测量的平均声压级。将实验结果数据进行整理,如图 2所示。可以看出:案例设备在500 Hz以上的高频区具有较好的频响曲线[5];但在250 Hz声压级较低,6个频率声压级有所差异。

图 2 测听频率区振幅与声压级

因此本文提出案例设备相关的纯音信号声压级SSPL与振幅A的参数转换模型如下:

SSPL=αi(20lgA)+σi, (i=1, 2, …, 6).

其中:i是按250、500、1 000、2 000、4 000、8 000 Hz排序的序号;σi是本文对特定设备不同频率声压级的参数标定。此外,本文增加了不同频率点的声压级转换加权系数αi。将实验结果进行数学拟合,得出案例设备生成的纯音信号声压级SSPL与振幅A的对应关系,见表 1

表 1 案例设备振幅与声压级转换模型参数
i σi αi
1 -12.437 0.958
2 2.587 1.002
3 2.621 0.989
4 0.241 0.963
5 5.194 1.047
6 6.093 0.933

在听阈测试中,基于上述振幅到声压级的参数转换模型,通过算法完成对案例设备的标定和对不同频率输出声压级差异的补偿,实现标准纯音测试信号的自动生成。

2.3 声音信号强度的一致性检测

本文在不同设备间进行多次比对测量,结果表明,不同设备在相同频率、相同振幅下平均相差1.62 dB SPL。考虑到声级计的精准度为1.5 dB SPL,并且纯音听阈测定国际标准中,5 dB SPL是最小计量值,所以本文采用的同型号案例设备是可以换用的。

在声场中,声源发出的信号强度随着传播距离的增长呈现不同衰减。典型的点声源,声强随距离的衰减符合反平方率的关系。本文设计实验对该问题进行探究。实验环境、信号频率和振幅与节2.2相同。在隔音室中,案例设备先后生成同一频率不同振幅的纯音信号,使用声级计分别在距离声源25、30、35 cm处测量声压级。

将实验数据进行整理,以1 000 Hz为例,结果见图 3

图 3 声源不同距离时纯音信号的声压级对比

由上述数据得出:纯音信号到达距离声源25 cm处比30 cm处平均高1.285 dB SPL,35 cm处比30 cm处平均低1.356 dB SPL,可见以嵌入式设备作声源不是典型的点声源。实际测听中,由于受试者的操作,双耳与声源的距离可能偏离30 cm,造成测试误差。建议双耳与设备声源的距离尽量在 (30±5) cm范围内。

2.4 基于特征值修正的测试音生成算法

纯音测听中,测试音信号的声压级以人耳基准听阈为0 dB进行标定。基准听阈即正常人的听力水平,国标对声场纯音测听的基准听阈作出了规定[7]。在本文设计的嵌入式平台测听系统中,扬声器和人耳中心的连线与扬声器在人耳正前方 (0°) 连线成45°入射角,遵循国标中相关规定[8]设计基于基准值修正的测试音生成算法,准确生成纯音信号。算法描述如下:

SSPLpost=SSPLpre-RETSPLiωi,

(i=1, 2, …, 6).

其中:SSPLpost是纯音测听中实际生成的测试音声压级;SSPLpre由节2.2中的参数转换模型所得;RETSPLi是针对基准听阈的修正系数;Δωi是针对入射角的修正系数,具体见表 2

表 2 测试音生成算法中的修正系数
i Δωi RETSPLi
1 1 11.4
2 3 4.4
3 4 2.4
4 3 -1.3
5 4 -5.4
6 5.5 12.6

本文提出的算法可以由案例设备精确生成所有纯音信号,提供纯音听阈测定中所需的6个频率点任一听力级下的测试音信号。

3 纯音听阈测定方法

纯音听阈测定过程是在安静环境下,由测试者对受试者给出特定频率不同声强的纯音信号,分析受试者对声音信号的反应,调整测试音强度,利用判定算法计算受试者在测试中音频点处的纯音听阈值,进而分析受试者的听力水平。

“测听听阈”的测定中,除保证适合聆听的环境、准确的测试音外,测试音调整方法和听阈测定方法也是非常重要的。

目前国家标准中列出了测试音的给音和听阈测定方法[2]如升降法、上升法等。这些方法中关于测试音强度的调整,均为根据受试者当前的反馈信息,作出下一步测试音的强度调整决定。例如上升法中,受试者作出反应,则调整测试音强度下降10 dB;受试者未作出反应,则调整测试音强度上升5 dB。同时,上升法要求5次上升过程中最多有3次是在同一纯音级作出反应;而升降法则要求扩大测试音的强度范围。

上述方法是测试员手动调整测试音强度、记录和计算纯音听阈值。本文方法自动调整测试音强度、自动计算测听听阈,并完成测试过程;不仅考虑受试者的当前听觉状态,还考虑了受试者的历史听觉状态,优化了测试音强度调整规则,提高了听阈测试的效度和信度。

3.1 基于听觉特性的测试音调整算法

人类听觉不仅是复杂的生理过程,同时也是复杂的心理过程。听觉疲劳会引起暂时性的阈移即听阈值的暂时假象提高,听力测试应避免受试者出现听觉疲劳,消除可变因素的干扰[9-10]。人耳的差别感受阈在30~130 dB区间内,且可分辨声强差为10%。

本文充分考虑受试者测听的历史状态和当前状态,提出一种基于受试者听觉特性的测试音强度调整算法。该算法与现有调整方法不同的是:当受试者当前最低反应级与上一次相等时,调整为5 dB一档下降。算法流程如图 4所示。

图 4 基于听觉特性的测试音强度调整算法

本文采用算法模拟测听中受试者的反馈信息和测试音强度的调整步骤,来验证本文提出的测试音强度调整算法对测听效度的改善。考虑到人耳正常水平的听力范围,验证算法以-10和70 dB为上下界,以概率性事件模拟受试者的反馈信息,分别采用本文和上升法中的强度调整方法,测试其间所有的测试音强度调整步骤。

算法模拟结果显示:在受试者数据规模较大时,本文提出的基于听觉特性的纯音测试音强度调整算法比上升法中的减少13.6%的步数,表明该算法一定程度上优化了测定纯音听阈值的进程。

3.2 基于多重判定的听阈值高信度计算方法

纯音听阈值是指当前频率下,受试者能听到50%声信号的最低声压级。上升法要求对每一耳每一频率,找出在5次上升中最多有3次 (或简短法中3次上升中有2次) 的最低反应级相同的声压级,这一最低反应级即听阈值。

本文设计的便捷式纯音测听方法中,所有测听流程全由受试者独立完成,为避免引起受试者听觉疲劳,同时采用标准中简短法和普通法判定规则[2];也考虑到人耳的听阈在短时间内具有稳定性,以及突发干扰或受试者注意力不集中的问题。因此本文设计了一套基于多重比对的判定规则,即在标准判定规则之外,加入对多次听阈值的对比。具体描述如下:

1) 如果前2次最低反应级相同,则确定其为当前音频的听阈值;

2) 如果前3次最低反应级中2次相同,则确定其为当前音频的听阈值;

3) 如果前4次最低反应级的最大最小音强相差小于10 dB,则对这4个听力级做算数平均,取平均值为当前音频的听阈值;

4) 如果连续5次最低反应级中3次相同,则确定其为当前音频的听阈值;

5) 最低反应级达到5次且不满足以上4条者,去除比最小听力级高10 dB (包括10 dB) 以上的最低反应级,对剩余数据做算数平均,取平均值为当前音频的听阈值。

依据此规则,提出听阈值的计算方法:在每一次得到最低反应级之后进行阈值判定,如果满足判定规则,则得到当前频率的听阈值;否则,再次进入节3.1中所述的强度调整流程进行测听,如图 5所示。

图 5 多重判定确定听阈值计算流程

4 噪声环境下的阈值修正算法

听觉掩蔽指一种声音信号对听觉系统感受另一种声音信号的影响。测听过程中,环境噪声引起的掩蔽效应会提高受试者的听阈值[1]。白噪声对纯音信号的掩蔽效应随频率的变化而不同,在不同频率下分别对应不同的掩蔽曲线[11]

本文提出的便捷式纯音听阈测听方法不仅可以在静音室中进行测听,还可以在多种扩散声场中进行测听。扩散声场中的环境噪声属宽带噪声,本文探究了测试环境噪声对不同频率下纯音信号听阈值的影响。

本文分别在噪声环境下测试了20名不同受试者的纯音听阈值,并根据测听结果提出3种噪声强度下阈值的修正算法。该算法在不同强度的噪声环境下,对测听音频点分别进行修正

HLpost=HLpre-τi, (i=1, 2, …, 6).

其中: HLpost为测听结束后未修正的听阈值;HLpre为修正后的听阈值;τi为修正系数,如表 3所示。

表 3 噪声环境下纯音听阈值修正系数τi
噪声强度/(dB SPL) 音频点/Hz
250 500 1 000 2 000 4 000 8 000
27±1 8.0 6.0 7.0 6.0 8.0 7.0
33±1 10.9 8.0 9.0 8.0 10.0 8.0
45±1 17.8 11.3 16.5 14.0 15.0 8.0

5 系统实现

本文选用iPad 2作为嵌入式平台的案例设备,在该平台上实现了纯音听阈评估系统,系统在iOS 4.0以上版本都可以使用。该系统要求测听过程中,受试者双耳中心距离设备中心30 cm,受试者不得手动调整设备音量[12]

5.1 纯音测听系统功能

本文完善和优化了纯音听阈测定系统[4]。测试音生成部分中,系统根据纯音听阈测听流程的需求,利用节2中提出的基于基准值修正的测试音生成算法,生成任一听力级的准确纯音信号。

听力评估部分中,系统与受试者进行互动,采集并分析受试者的反馈信息,基于受试者的听觉特性调整测试音强度。使用本文设计的基于多重判定的纯音听阈值测定方法,计算受试者在各频率处的听阈值。在该部分,系统以1 000、500、250、2 000、4 000、8 000 Hz的音频顺序进行测听,令受试者以人耳最熟悉的频率进入测听状态,一定程度上改善纯音测听的信度。

信息管理部分,将受试者的纯音听阈值以可视化的形式展现给受试者,系统生成受试者的听力曲线图,并给出听力水平评估报告。该部分还管理用户信息和测听数据。系统记录用户姓名、年龄、测听时间和结果等信息;用户可随时查询测试数据和结果,并进行添加和删除。

5.2 案例与信度

本文设计测试案例对该纯音测听系统做信度评估。

案例的测试环境为一间10 m2左右的类隔音室,该房间两面墙壁为吸音壁,另两面为厚布帘,环境噪音大约为26 dB SPL。测试设备为一台iPad 2。受试者是20位拥有正常听力的志愿者。案例中,每一位受试者使用iPad 2进行3遍听力测试。期间,测听流程全由受试者独立完成,测试人员无需提供任何提醒或帮助。测听数据整理结果如图 6所示。

图 6 案例纯音听力曲线

其中:HLpre为该案例中直接测出未修正的纯音听力曲线;HLpost为使用修正算法后得到的纯音听力曲线,即为该案例设备使用本文提出的纯音测听方法得到的纯音听力曲线图。

人耳正常水平的听力级范围是-10~15 dB HL[1]。可以看出,便捷式纯音测听系统的纯音听力曲线图分布在正常范围内,符合人耳听觉特性。因此,本文提出的方法具有较好的信度,可用于听力筛查。

6 结论

本文面向嵌入式平台研究纯音听阈评估,研究纯音测听所需的关键技术,提出基于特征值修正的测试音生成算法,自动生成准确的纯音测试音信号;设计基于人耳听觉特性的测试音强度调整方法,提出基于多重判定的阈值确定算法,加快测听进程的同时,保证测听流程的收敛性和测听结果的信度;在噪声环境下对听阈值做修正,提高测听信度。基于以上研究,本文完善并优化了以iPad 2为案例设备的纯音听阈评估系统,该系统自动生成准确的测试音作为声刺激传输给受试者;自动调控测听流程,智能采集受试者反馈信息,计算受试者的纯音听阈值;并作出合理的听力水平评估。测试案例表明:该方法具有较好的信度和稳定的效度,可以较好的进行纯音听阈评估和听力筛查,供受试者及时检查自己听力水平的变化或评估疗效。

参考文献
[1] 韩东一, 翟所强, 韩维举. 临床听力学[M]. 北京: 中国协和医科大学出版社, 2008. HAN Dongyi, ZHAI Suoqiang, HAN Weiju. Clinical Audiology[M]. Beijing: Peking Union Medical College Press, 2008. (in Chinese)
[2] GB/T 16403-1996. 纯音气导和骨导听阈基本测定法[S]. 北京: 国家技术监督局, 1996. GB/T 16403-1996. Basic pure tone air and bone conduction threshold audiometry[S]. Beijing:CSBTS, 1996. (in Chinese)
[3] GB/T 7583-87. 声学纯音气导听阈测定听力保护用[S]. 北京: 国家技术监督局, 1987. GB/T 7583-87. Acoustics-Pure tone air conduction threshold audiometry-For hearing conservation purposes[S]. Beijing:CSBTS, 1987. (in Chinese)
[4] 吴育昊, 贾珈, 蔡莲红, 等. 基于纯音听阈测定的便捷听力评估方法[C]//全国人机语音通讯会议, 中国, 贵阳, 2013. WU Yuhao, JIA Jia, CAI Lianhong, et al. A convenient method of audiologic assesement based on pure tone audiometry[C]//NCMMSC. Guiyang, China, 2013. (in Chinese)
[5] 赵宇为. 苹果iPad2音质测评报告. [2011-6-20]. http://www.soomal.com/doc/10100002140.htm. ZHAO Yuwei. Sound Quality Evaluation Report of Apple iPad2.[2011-6-20]. http://www.soomal.com/doc/10100002140.htm. (in Chinese)
[6] 马大猷. 现代声学理论基础[M]. 北京: 科学出版社, 2004. MA Dayou. The Foundation of Modern Acoustics Theory[M]. Beijing: Science Press, 2004. (in Chinese)
[7] GB/T 4854. 7-2008. 自由场与扩散场测听的基准听阈[S]. 北京: 国家技术监督局, 2008. GB/T 4854. 7-2008. Reference threshold of hearing under free-field and diffuse-field listening conditions[S]. Beijing:CSBTS, 2008.
[8] GB/T 16296-1996. 用纯音及窄带测试信号的声场测听[S]. 北京: 国家技术监督局, 1996. GB/T 16296-1996. Sound field audiometry with pure tone and narrow-band test signals[S]. Beijing:CSBTS, 1996.
[9] 王乃怡. 听觉疲劳的安全界限[J]. 心理学报, 1987, 3: 235–238. WANG Naiyi. Safety margin of auditory fatigue[J]. Journal of Psychology, 1987, 3: 235–238. (in Chinese)
[10] 王娜. 基于人耳主观反应的听觉特征量及其在目标识别中的应用[D]. 西安: 西北工业大学, 2006. WANG Na. Human Auditory Characteristics and Applications of Acoustic Targets Recognition[D]. Xi'an:Northwestern Polytechnical University, 2006. (in Chinese) http://cdmd.cnki.com.cn/Article/CDMD-10699-2006127038.htm
[11] Zwicker E, Jaroszewski A. Inverse frequency dependence of simultaneous tone-on-tone masking patterns at low levels[J]. JASA, 1982, 71: 1508–1512. DOI:10.1121/1.387850
[12] Yoshinaga-Itano C, Gravel J S. The evidence for universal newborn hearing screening[J]. American Journal of Audiology, 2001, 10(2): 62. DOI:10.1044/1059-0889(2001/013)