?

聲帶息肉患者持續元音及連貫言語聲的倒頻譜聲學分析△

2016-02-23 08:40余明強周莉徐新林潘晗莊佩耘
聽力學及言語疾病雜志 2016年1期

余明強 周莉 徐新林 潘晗,2 莊佩耘

?

聲帶息肉患者持續元音及連貫言語聲的倒頻譜聲學分析△

余明強1周莉1徐新林1潘晗1,2莊佩耘1

【摘要】目的探討倒頻譜聲學分析法與連貫言語聲學信號用于鑒別病理性聲信號的價值。方法分別采集26例成人聲帶息肉患者(息肉組,男10例,女16例)及27例正常嗓音者(正常組,男13例,女14例)持續元音和連貫言語聲信號,采用MDVP(multi dimensional voice program)軟件分析各組持續元音頻率微擾(jitter)和振幅微擾(shimmer),采用ADSV(analysis of dysphonia in speech and voice)軟件分析各組持續元音和連貫言語的倒頻譜參數:倒頻譜峰值突出(cepstral peak prominence,CPP)、低高頻譜能量比(the mean ratio of singnal energy below 4 000 Hz to the energy above 4 000 Hz,L/HSR)、CPP的標準差(STD CPP)、L/HSR的標準差(STD L/HSR)及發音障礙倒頻譜指數(the cepstral/spectral index of dysphonia,CSID),分析擾動參數和倒頻譜參數對鑒別病理聲學信號的敏感性。結果正常組持續元音的jitter和shimmer值均小于聲帶息肉組(P<0.05);除STD L/HSR外,正常組持續元音的倒頻譜參數值均高于息肉組(P<0.05);連貫言語的倒頻譜參數中,男性聲帶息肉組的CPP、L/HSR均低于男性正常組(P<0.05),女性聲帶息肉組CPP值明顯低于女性正常組(P<0.05)。男女性持續元音聲信號的倒頻譜參數CPP和CSID在ROC曲線下的面積與參考值0.5相比,差異有統計學意義(P<0.05);男性連貫言語聲的CPP及L/HSR、女性CPP ROC曲線下的面積與參考值0.5的差異有統計學意義(P<0.05)。結論連貫言語聲和持續元音的擾動參數和倒頻譜參數均可用于區別正常與聲帶息肉患者的噪音聲學信號,倒頻譜參數CPP對區別正常和聲帶息肉患者嗓音信號有較好的特異度和靈敏度。

【關鍵詞】倒頻譜峰值突出;持續元音;連貫言語;聲帶息肉

網絡出版時間:2015-12-2815:12

網絡出版地址:http://www.cnki.net/kcms/detail/42.1391.R.20151228.1512.004.html

聲學評估是嗓音客觀評估中的重要部分,目前嗓音聲學評估的聲學信號樣本包括持續元音和連貫言語(句子)。聲學信號的分析方法包括基于提取穩定頻率的擾動方法和基于頻譜二次分析的倒頻譜方法;擾動方法主要分析頻率微擾(jitter)、振幅微擾(shimmer),該方法一般只能用于分析持續元音,而在分析不規則的聲信號時,其提取的聲學特性可能與原信號不相關,出現較大的偏差[1,2]。倒頻譜方法主要分析:倒頻譜峰值突出(cepstral peak prominence,CPP)、低高頻譜能量比(the mean ratio of singnal energy below 4 000 Hz to the energy above 4 000 Hz,L/HSR)、CPP的標準差(STD CPP)及L/HSR的標準差(STD L/HSR),該方法在分析嗓音信號的頻譜時,無需識別信號的穩定周期邊界,對發音障礙嚴重程度的評估更加可靠,并且可以分析連貫言語聲信號,而連貫言語聲較元音聲信號更能反映正常的發聲功能[3]。Awan等[3]發現嗓音障礙的嚴重程度和連貫言語的倒頻譜參數顯著相關,并設計發音障礙倒頻譜指數(the cepstral/spectral index of dysphonia ,CSID)作為評估發音障礙的一個指標[4,5]。本研究的目的在于研究擾動方法和倒頻譜方法分析持續元音和連貫言語聲學信號對于鑒別聲帶息肉和正常嗓音的應用價值,并探索各參數的敏感性和特異性。

1資料與方法

1.1研究對象聲帶息肉組選取2011年3月至2013年11月由廈門大學附屬中山醫院經頻閃喉鏡檢查具有典型體征并最終經病理檢查確診為聲帶息肉的患者26例,男10例,女16例,年齡17~60歲,平均35.1±7.8歲。正常嗓音組選取志愿受試者27例,男13例,女14例,年齡20~50歲,平均31.2±5歲,正常組的入選標準為模擬視覺尺度定量評估(consensus auditory preceptual evaluation-voice,CAPE-V)為無聲音嘶啞,嗓音障礙指數(voice handicap index-10,VHI-10)≤3分,頻閃喉鏡檢查聲帶形態及運動正常,排除了聽力異常、鼻部疾病、咽部疾病、呼吸系統疾病。

1.2研究方法

1.2.1嗓音聲學信號采集持續元音聲學信號采集:兩組對象均于屏蔽室內,采取站位,口距話筒15 cm左右,麥克風與水平線成15°角,采樣頻率為44.1 kHz;囑受試者舒適平穩的發/a/音2次,每次3~5秒,采用視頻反饋控制聲強在75±5 dB,收集聲學信號。

連貫言語聲學信號收集:兩組對象在上述環境中以相同的發聲方法誦讀句子“我愛北京天安門”收集聲學信號。

1.2.2嗓音聲學信號的分析采用基于擾動方法編制的MDVP(multi dimensional voice program)軟件Model5105分析持續元音聲學信號的擾動參數頻率微擾(jitter)、振幅微擾(shimmer)。

采用基于倒頻譜方法編制的連貫言語(analysis of dysphonia in speech and voice, ADSV) Model 5109系統分析持續元音聲學信號和連貫言語聲學信號的倒頻譜參數: CPP、L/HSR、STD CPP、STD L/HSR及CSID。

1.3統計學方法使用SPSS18.5版本軟件對數據進行統計分析,差異比較采用獨立樣本t檢驗、兩個獨立樣本的Mann-Whitney U非參數檢驗分析,各檢測采用受試者工作特征曲線(receiver operating characteristic curve,ROC曲線)分析參數的診斷價值。

2結果

2.1正常組不同性別受試者持續元音和連貫言語聲學信號分析結果正常組男性的持續元音聲學信號的擾動參數jitter和shimmer低于女性,男女間shimmer的差異有統計學意義(P<0.05)(表1)。

正常組男性的持續元音聲學信號的倒頻譜參數CPP及L/HSR高于女性(P<0.05),其余各參數值的男女間差異無統計學意義(表1)。

正常組男性的連貫言語信號的倒頻譜參數STD CPP高于女性,L/HSR高于女性(均為P<0.05),余參數值的差異無統計學意義(表2)。

2.2聲帶息肉組和正常組間持續元音和連貫言語分析結果正常組男性和女性持續元音聲學信號的jitter、shimmer均小于聲帶息肉組(均為P<0.05)(表1)。

持續元音聲學信號倒頻譜聲學分析顯示正常組CPP、L/HSR值大于聲帶息肉組, STD CPP、STD L/HSR及CSID值小于聲帶息肉組,除STD L/HSR外,兩組間的差異均有統計學意義(均為P<0.05)(表1)。

連貫言語聲的倒頻譜聲學分析可見,男性聲帶息肉組和男性正常嗓音組之間STD CPP及STD L/HSR差異無統計學意義(P>0.05),男性聲帶息肉組CPP、L/HSR值均低于正常組(均為P<0.05);女性聲帶息肉組CPP值明顯低于女性正常組(P<0.05)(表2)。

±s)

注:*與同組女性比較,P<0.05;△與聲帶息肉組同性別比較,P<0.05

±s)

注:*與同組女性比較,P<0.05;△與聲帶息肉組同性別比較,P<0.05

2.3持續元音和連續言語聲學信號倒頻譜參數ROC曲線分析結果持續元音聲學信號的倒頻譜參數ROC曲線分析,可見CPP和CSID在ROC曲線下的面積與參考值0.5相比,差異均有統計學意義(P<0.05)(圖1)。

連貫言語聲學信號倒頻譜參數的ROC曲線分析,可見男性CPP及L/HSR曲線下的面積分別為0.22及0.14,女性CPP曲線下的面積為0.79,曲線下的面積與參考值0.5的差異有統計學意義,其余參數的曲線下面積與參考值0.8比較差異無統計學意義(圖2)。

3討論

研究認為連貫言語符合正常說話的習慣,在主觀聽感知評估與聲學評估中使用連貫言語優于使用元音[6,7]。目前,中文連貫言語聲評估多運用聽感知評估方法[8~10],其在聲學客觀評估中的應用研究較少。本研究進行了元音及中文連貫言語的聲學分析,中文連貫言語選擇了中科院提供的句子“我愛北京天安門”,結果顯示持續元音與連貫言語聲的倒頻譜聲學分析參數可以很好地區分正常和聲帶息肉患者的嗓音,連貫言語聲的倒頻譜參數具有較好的敏感性,該結果與Lowell等[11]研究結果相似。

嗓音聲學分析方法有很多,主要含頻域方法、擾動方法和非線性方法,其中倒頻譜分析是頻域分析方法中的一種,是指對嗓音信號的頻譜進行傅里葉逆變換,對嗓音信號進行兩次分析的結果[12]。由于倒頻譜是對嗓音信號的頻譜進行頻譜分析,并計算頻譜信號的基頻上的峰值和平均值的差值,因此,倒頻譜分析較擾動方法(需要提取穩定F0分析對異常的嗓音信號進行鑒別)更加可靠,適用于分析連貫言語信號[13,14]。倒頻譜分析參數主要為倒頻譜峰值突出(CPP)、低頻高頻比值(L/HSR);CPP為倒頻譜峰值的高度與倒頻譜的其余分量的差值,表示除去噪聲信號后和諧音的振幅幅度,嗓音信號中噪聲成分越多,CPP值越低[15,16]。正常嗓音具有更多的周期性成分,CPP值較大,而聲帶疾病患者因嘶啞音的存在,嗓音信號中存在更多的噪聲成分,其倒頻譜的峰值將會降低[17]。文中研究結果證實,聲帶息肉組的CPP低于正常組,連貫言語聲的CPP低于元音。L/HSR為嗓音信號中低于4 000 Hz的能量與高于4 000 Hz的能量的比值,正常嗓音信號的能量主要集中在4 000 Hz以下,異常嗓音信號中由于噪聲成分(各個頻率能量基本相同的聲音信號)的增加,頻率在4 000Hz以下的信號能量相對減少,L/HSR值變低,因此,不規則嗓音信號的L/HST更低。從文中結果看,正常組L/HSR高于聲帶息肉組,但差異無統計學意義,故L/HSR在嗓音質量評估中須慎重應用。

CSID是定量評估發音障礙的一個度量,它是根據聲學的四個變量(CPP、STD CPP、L/HSR和STD L/HSR)的數值計算得來的嗓音障礙倒頻譜指數[3~5]。文中結果顯示正常組CSID明顯低于聲帶息肉組,差異有統計學意義(P<0.05),表明CSID也可用于臨床預估聲帶息肉患者發音障礙的嚴重程度。目前,國內尚沒有根據中文句子的聲學特性與主觀評估相關性而計算CSID的公式,可作為下一步研究的方向。

圖1 連續元音倒頻譜參數的ROC曲線分析

a為男性,b為女性,其中男性聲帶息肉患者的CPP、STD CPP、CSID及女性聲帶息肉患者的CPP、STD CPP、CSID曲線下的面積與參考面積0.5相比,差異有統計學意義(P<0.01)

圖2 連貫言語倒頻譜參數的ROC曲線分析

a為男性,b為女性,其中男性聲帶息肉患者的CPP及L/HSR參數曲線下的面積分別為0.22及0.14,女性聲帶息肉患者的STD CPP曲線下的面積為0.79,與參考面積0.5的差異有統計學意義

文中結果顯示正常組女性CPP值低于男性,與Balasubramanium等[18]的研究相似,可能是由于大約80%的女性發聲時聲門后端存在縫隙,因而與男性相比,女性發出的聲音存在更多的氣息音,導致其嗓音具有更低的CPP值[18]。

從文中結果看,ROC曲線分析顯示元音與連貫言語聲的聲學分析參數在區別正常和聲帶息肉患者嗓音信號時都具有較好的特異性和敏感性。然而,與前期研究的擾動參數(jitter、shimmer在ROC曲線下的平均面積為0.96、0.86)[19]相比,倒頻譜參數在ROC曲線下的面積更小,說明倒頻譜聲學分析方法并不比擾動方法的診斷價值更大,是否與使用的中文句子的合理性或者樣本量大小有關,需要進一步研究,但由于倒頻譜分析法可以分析連貫言語聲信號,仍可以作為擾動分析方法的重要補充。

參考文獻4

1Titze IR, Liang H. Comparison of F0 extraction method for high-precision voice perturbation measurements[J]. J Speech Hear Res,1993,36:1120.

2Packard NH, Crutchfield JP, Farmer JD, et al. Geometry from a time series[J]. Phys Rev Lett, 1980, 45: 712.

3Awan SN, Roy N. Toward the development of an objective index of dysphonia sverith: a four-factor acoustic model[J]. Clin linguist phon, 2006, 20:35.

4Awan SN, Roy N, Jette ME, et al. Quantifying dysphonia severity using a spectral/cepstral-based acoustic index:comparisons with auditory-perceptual judgements from the CAPE-V[J]. Clin Linguist Phon, 2010, 24:742.

5Awan SN, Roy N. Outcomes measurement in voice disorders: application of an acoustic index of dysphonia severity[J]. J Speech Lang Hear Res, 2009, 52:482.

6Mors C. Vowel- and text-based cepstral analysis of chronic hoarness[J]. Journal of Voice, 2012, 26:416.

7Lowell SY. The acoustic cssessment of voice in continuous speech[J]. Perspectives on Voice and Voice Disorders, 2012, 22: 57.

8王剛,于萍,徐文,等.嗓音主觀聽感知評估穩定性的研究[J].中華耳鼻咽喉頭頸外科雜志,2011,46:485.

9李進讓,孫雁雁,徐文,等.嗓音障礙主觀聽感知評估中標準化朗讀文本的設計[J].中華耳鼻咽喉頭頸外科雜志,2010,45:719.

10趙逸,王偉,鄭宏良,等,嗓音障礙聽感知評估漢語普通話朗讀文本的設計[J],聽力學及言語疾病雜志,2014,22:130.

11Lowell SY, Colton RH, Kelley RT, et al. Spectral- and cepstral-based measures during continuous speech: capacity to distinguish dysphonia and consistency within a speaker[J]. Journal of Voice,2011, 25: 223.

12韓德民,Sataloff RT. 嗓音醫學[M].北京:人民衛生出版社,2007.132~136.

13Hillenbrand JM. A methodological study of perturbation and additive noise in synthetically generated voice signals[J]. J Speech Hear Res,1987, 112: 324.

14Watts CR, Awan SN. Use of spectral/cepstral analyses for differentiating normal from hypofunctional voices in sustained vowel and continuous speech contexts[J]. Journal of Speech, Language, and Hearing Research, 2011, 54:1523.

15Adrian F, 張家騄.嗓音質量評價與測量(2)[J].聽力學及言語疾病雜志,2008,16:439.

16Heman-Acka YD, Michael DD, Goding GS. The relationship between cepstral peak prominence and selected parameters of dysphonia[J]. Journal of Voice, 2002,16: 20.

17Zhang Y, Jiang JJ. Nonlinear dynamic analysis in signal typing of pathological human voices[J]. Electronics Letters, 2003,39:1021.

18Balasubramanium RK, Bhat JS, Fahim S, et al. Cepstral analysis of voice in unilateral adductor vocal fold palsy[J]. J Voice, 2011, 25: 326.

19余明強,徐新林,張賽,等.非線性動力學方法在分析聲帶息肉、囊腫患者嗓音信號中的應用[J].聽力學及言語疾病雜志,2013,21:244.

(2015-06-17收稿)

(本文編輯周濤)

·臨床研究·

A Cepstral Analysis of Sustained Vowels and Continuous

Speech in Patients with Vocal Polyps

Yu Mingqiang*, Zhou Li, Xu Xinlin, Pan Han, Zhuang Peiyun

(*Department of Otorhinolaryngology, Zhongshan Hospital Affiliated

Xiamen University, Xiamen, 361004,China)

【Abstract】ObjectiveTo study vowels and related speech cepstral parameters, and to explore the role of identification between the voice of normal and vocal polyps using the vowel and speech cepstral parameters.MethodsMDVP and ADSV software were used to analyze vowels and sustained speech cepstral parameters of patients with vocal fold polyps and subjects with normal voice. The continued vowel acoustic signal disturbance, and sustained speech cepstrum parameters of acoustic signals were studied.ResultsIn the normal group, the continued vowel acoustic signal jitter disturbance parameters and shimmer value were smaller them those of in the vocal fold polyps group. The differences between the two groups had statistical significance (P<0.05). For sustained vowel's acoustic signal cepstrum parameters, the acoustic parameters for males and females, except STDL/H, had statistical significant differences of between the two groups (P<0.05). There were significant differences between the group of

△國家自然科學基金(NSFC81371080)、福建省衛生系統中青年骨干人才培養項目(2013-ZQN-JC-35)聯合資助

1廈門大學附屬中山醫院耳鼻咽喉科(廈門361004);2廈門大學

the male vocal fold polyp and the normal males for the sustained speech cepstrum parameters except for the STDCPP and STDL/H parameters. There were differences between the female vocal fold polyp group and normal female group for the sustained speech cepstrum parameters in comparison. Only the CPP parameters had statistically significant differences (P<0.05).ConclusionThe continuous speech cepstrum analysis for vowels could be used to distinguish voices of the normal from patients with vocal polyps with a good degree of specificity and sensitivity.

【Key words】Cepstral peak prominence (CPP);Sustain vowel;Continuous speech;Vocal polyps

通訊作者:莊佩耘(Email:peiyunzhuang@yahoo.com)

作者簡介:余明強,男,福建人,副主任醫師,主要研究方向為咽喉疾病及嗓音醫學。

【中圖分類號】R767.4;R767.92

【文獻標識碼】A

【文章編號】1006-7299(2016)01-0015-05

DOI:10.3969/j.issn.1006-7299.2016.01.004

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合