?

基于自適應多任務學習的睡眠生理時序分類方法

2024-03-21 02:25宋鈺丹王雪徽馬朝陽林友芳
計算機應用 2024年2期
關鍵詞:集上通氣樣本

宋鈺丹,王 晶,3*,王雪徽,馬朝陽,林友芳,3

(1.北京交通大學 計算機與信息技術學院,北京 100044;2.北京交通大學 交通數據分析與挖掘北京市重點實驗室,北京 100044;3.民航旅客服務智能化應用技術重點實驗室,北京 101318)

0 引言

睡眠對人體健康至關重要,高質量的睡眠可以補充人體能量,增強機體免疫力,幫助人體保持健康的生理和心理狀態。即使睡眠模式的短暫改變,如急性睡眠剝奪,也可能損害人類的判斷和認知能力[1],而長期的睡眠異常與疾病的發展密切相關,因此,睡眠質量的研究對生物醫學實踐有重要意義。睡眠醫師通常利用多導睡眠圖(PolySomonGraphy,PSG)評估睡眠質量,其中包括腦電圖(ElectroEncephaloGram,EEG)、眼電圖、肌電圖和心電圖(ElectroCardioGram,ECG)等。PSG 包含豐富的生理信號,但要求受試者在睡眠實驗室中佩戴多種儀器監測,限制了它的應用場景。本文考慮基于單導EEG和單導ECG的睡眠質量評估,設置只需少量電極片,不會給受試者帶來強烈不適,并且可以快速部署到可穿戴設備等家庭醫療和移動醫療場景中。

睡眠分期與睡眠呼吸暫停低通氣綜合征(Sleep Apnea Hypopnea Syndrome,SAHS)檢測是全面評估睡眠質量的重要任務。睡眠分期是指睡眠醫師利用PSG 中的生理信號,根據睡眠分期標準,如R&K(Rechtschaffen 和Kales)標準[2]和美國睡眠醫學會(American Academy of Sleep Medicine,AASM)標準[3],對睡眠階段進行分類。EEG 會隨睡眠階段的變化而變化,常被用于睡眠分期。正常的人類睡眠包含快速眼動(Rapid Eye Movement,REM)睡眠和非快速眼動(Non-REM,NREM)睡眠,這兩種狀態循環交替。具體地,根據R&K 標準,非快速眼動階段可以按照睡眠的程度由淺到深進一步分為N1、N2、N3 和N4,在AASM 標準中則把N3 與N4 合并為N3。睡眠專家根據不同階段的占比和循環過程評估受試者的睡眠狀況。睡眠呼吸暫停低通氣指睡眠期間持續10 s 及以上的呼吸暫?;虻屯?,并伴有血氧飽和度降低或覺醒。ECG 中包含了呼吸節律,常用于SAHS 檢測。臨床上,SAHS可分為阻塞性、中樞性和混合性,通過每小時呼吸暫停和低通氣次數,即呼吸暫停低通氣指數(Apnea-Hypopnea Index,AHI)來定量評估該綜合征的嚴重程度。SAHS 是最常見的睡眠呼吸障礙,在人群中發病率較高但不易察覺,可引起覺醒、重復呼吸短促和睡眠片段化,嚴重影響睡眠質量[4]。長期的睡眠呼吸暫停低通氣可能導致心血管疾病和神經系統疾病,增加患高血壓的風險,因此,研究睡眠分期和SAHS 檢測對全面評估、改善睡眠質量具有重要意義。

目前已經有很多自動睡眠分期算法和SAHS 檢測算法,但未考慮二者之間的相互作用關系。實際上,睡眠階段和呼吸暫停低通氣是相關的。從臨床醫學來看,SAHS 是一種睡眠障礙,它會導致睡眠階段頻繁變化,擾亂正常的睡眠周期。圖1 顯示了健康受試者和重度SAHS 患者的睡眠時相圖,其中:WAKE 表示清醒,REM 表示快速眼動睡眠期,N1~N3 分別表示非快速眼動階段中的不同時期。與健康受試者相比,患者頻繁醒來,深度睡眠較少。在睡眠分期與睡眠呼吸暫停低通氣的人工判讀過程中,睡眠醫師需參考另外一個任務的標簽確定本任務的標簽。此外,通過對數據集的統計分析,發現不同睡眠時期發生呼吸暫停低通氣的頻率不同。睡眠階段的變化會影響阻塞性睡眠呼吸暫停的易感性[5]。具體地,膽堿能介導的舌下神經抑制導致頦舌肌張力降低,REM 期內上氣道塌陷的趨勢增加[6],因此許多患者的阻塞性睡眠呼吸暫停在REM 期會趨于惡化。在SAHS 患者中,REM 期的呼吸暫停比NREM 期持續時間更長。在阻塞性睡眠呼吸暫?;颊咧?,REM 期每小時血氧飽和度下降的頻率比NREM 期高,血氧飽和度水平也更低;相反,如果患者進入慢波睡眠,通常會保持一段較長時間的穩定呼吸[7]??傊?,睡眠分期和睡眠呼吸暫停低通氣相互作用,但尚未利用該相關性提升睡眠生理任務的性能。

圖1 不同受試者的睡眠時相圖Fig.1 Hypnograms of different subjects

因此,本文設計多任務學習(Multi-Task Learning,MTL)框架建模睡眠階段和睡眠呼吸暫停低通氣之間的相關性。具體地:1)提出一種MTL 框架,用于睡眠分期和SAHS 檢測,對睡眠質量的全面評估具有重要意義;2)設計自適應任務間關聯性學習模塊,捕獲任務間的相互作用關系,構造雙流時間依賴學習模塊,從EEG 和ECG 中提取共享特征,建模時間依賴性;3)在兩個公開數據集上進行實驗,實驗結果表明,與基準方法相比,所提方法可以同時完成這兩項任務,在睡眠分期方面,性能與基準方法相當,在SAHS 檢測方面,能檢測出更多的患病片段。

1 相關工作

自動睡眠分期、SAHS 檢測算法以及高效的MTL 方法是與本文工作相關的3 個研究領域。

1.1 自動睡眠分期

睡眠醫師通過識別EEG 等生理信號中的一些典型波確定睡眠階段。然而,這一過程繁瑣耗時,且評分結果取決于專家的專業知識。在早期的研究中,從生理信號中手動提取特征,再利用支持向量機(Support Vector Machine,SVM)和隨機森林等分類器分類睡眠階段。文獻[8]中基于單通道腦電信號,利用小波變換算法提取節律波的能量作為第一部分特征,利用多尺度熵算法選取第二部分特征,隨后輸入分類器實現睡眠階段識別。但傳統方法中的數據處理、特征設計和特征選擇依賴專家的先驗知識,耗費大量時間。近年來,深度學習技術迅猛發展,并在多個領域取得了較好的效果。深度學習方法從輸入數據中自動提取特征并分類,是一種端到端的學習方法。文獻[9]中利用卷積神經網絡(Convolution Neural Network,CNN)提取單通道EEG 中的時不變特征,通過雙向長短期記憶(Bi-directional Long Short-Term Memory,BiLSTM)網絡學習睡眠階段之間的過渡規則。文獻[10]中針對現階段可用睡眠腦電數據皆為類不平衡小數據集,深度學習模型的直接應用進行分期效果較差的問題,分別從數據集重構和模型訓練優化兩方面入手,提出可用于少量類不均衡原始睡眠腦電數據集的深度自動睡眠分期模型。GraphSleepNet[11]是一種用于睡眠分期的深度圖神經網絡,它的主要優點是能自適應學習不同腦電通道之間的內在聯系。此外,Eldele 等[12]設計多分辨率CNN 和自適應特征重新校準提取單導EEG 中的特征,并使用時間上下文編碼器捕獲所提特征之間的時間相關性,進而對樣本進行分類。這些深度學習模型從多通道或單通道EEG 中提取特征并進行分類,多通道EEG 包含更多的信息,但過多的電極片會給受試者帶來強烈的不適。相反,單通道EEG 的采集不會對受試者的睡眠產生很大影響,更適用于家庭監測和移動醫療場景。本文沿用深度學習方法,基于單導EEG 對睡眠階段進行分類。

1.2 睡眠呼吸暫停低通氣檢測

PSG 是診斷SAHS 的金標準。根據PSG 中的ECG、血氧飽和度、口鼻氣流和胸腹呼吸等信號,專家可以判斷受試者是否有呼吸暫?;虻屯獾陌l生。由于PSG 不易獲取,人工判讀的復雜性較高,許多研究基于單導ECG 進行SAHS 檢測。大多數研究對ECG 波形、ECG 衍生的心率變異性(Heart Rate Variability,HRV)和ECG 衍生呼吸(ECG-Derived Respiratory,EDR)進行分析。Almazaydeh 等[13]提取了RR 間期(RR Interval,RRI)的特征并進行組合,使用SVM 分類器檢測呼吸暫停。與睡眠分期類似,越來越多的研究人員通過神經網絡自動提取特征。Wang 等[14]提出了一種改進的LeNet-5 卷積神經網絡檢測SAHS。這些方法需要對數據進行預處理,例如從ECG 中提取R 波進而獲得RRI。Sharan等[15]將原始ECG 輸入殘差網絡檢測睡眠呼吸暫停,直接從原始信號學習時間特征,避免了數據預處理和特征工程造成的信息損失。

通常,EEG 用于睡眠分期,ECG 則在SAHS 檢測中起主要作用。然而,人體是一個整體,生理狀態的變化可以反映在多種生理信號中。ECG 可以提供與睡眠相關的生理信息[16],揭示睡眠結構,部分研究已經使用ECG 信號進行睡眠分期。同理,當睡眠呼吸暫停發作時,EEG 會移動到δ 頻帶以上[17],當呼吸暫停結束時,EEG 也會出現突然的頻率偏移,即EEG 和ECG 都可用于睡眠分期和SAHS 檢測。

1.3 多任務學習

現有研究分別執行睡眠分期和SAHS 檢測,未考慮它們之間的相關性,實際上這兩項任務相關。因此,本文利用MTL 建模睡眠階段和睡眠呼吸暫停低通氣之間的復雜相互作用關系,同時完成這兩項任務,利用相關性提升分類性能。

Caruana[18]總結了MTL 的定義和優勢:MTL 是一種歸納遷移的方法,并行學習多個任務,為解決一個任務學到的知識,也可用于解決框架內的另一個任務。通過并行學習多個任務,學習相關任務間的共享表示,能夠利用相關任務的訓練信號中包含的關于域的額外信息,并使模型能夠在原始任務上更好地泛化。

在MTL 中,確定網絡結構是由多個任務共享還是特定于單個任務、如何優化多個任務的損失函數是兩個關鍵問題。近期關于MTL 在深度學習中的研究集中在兩個方面:網絡結構設計和損失函數優化策略。在網絡結構設計方面,Misra 等[19]提出了十字繡單元,它可以自動學習共享表示和特定任務表示的最佳線性組合。常用的MTL 模型的性能通常對任務之間的關系敏感,因此Ma 等[20]提出了一種新的MTL 方法,即多門混合專家,該方法顯式地從數據中建模任務關系。在優化策略方面,Kendall 等[21]利用每個任務的同方差不確定性對多個任務的損失函數進行加權,允許網絡同時學習具有不同數量級損失函數的多個任務。

近期,MTL 已初步應用于各種生物醫學任務中。在預測情緒、壓力和健康方面,Taylor 等[22]使用MTL 技術訓練個性化機器學習模型,并解釋了個體差異。Pang 等[23]利用深度多任務循環神經網絡,將抑郁癥分類主任務與一類度量學習和異常排序兩個輔助任務聯合優化。Bendjoudi 等[24]提出了一種基于上下文的多標簽多任務情感識別的深度學習架構,并設計了一個新的多標簽焦點損失函數。

總之,已有方法分別執行睡眠分期或SAHS 檢測,未將MTL 方法應用在睡眠生理任務中,探索任務間的相關性提升性能。本文設計MTL 框架,建模睡眠分期與睡眠呼吸暫停低通氣之間的相互作用關系,并利用相關性提升分類性能。

2 本文方法

本文方法的總體架構如圖2 所示,包含3 個主要模塊:1)雙流時間依賴學習模塊;2)自適應任務間關聯性學習模塊;3)分類。首先,利用兩流CNN 并行提取共享EEG 與ECG特征,將它們融合獲得多模態共享特征;其次,利用全連接(Fully Connected,FC)層和激活函數實現兩個分類器分支,進而實現睡眠分期和SAHS 檢測。在得到睡眠分期的預測結果后,利用自適應任務間關聯性學習模塊建模兩者之間的相互作用關系,輔助SAHS 檢測。

圖2 本文方法總體架構Fig.2 Overall framework of proposed method

2.1 雙流時間依賴學習模塊

雙流時間依賴學習模塊是所提方法的第一個關鍵部分。在睡眠分期和SAHS 檢測兩個任務的聯合監督下,該模塊分別從EEG 和ECG 提取共享特征,學習時間依賴性,用于后續分類。特征提取模塊的具體結構如圖3 所示,輸入信號是單通道EEG 或ECG,相鄰epoch 的信息可以幫助網絡更好地建模睡眠評分規則,檢測到更多的呼吸暫停事件,所以輸入信號還包含當前樣本前后的各兩個epoch,學習生理信號中的時間依賴性。該結構由7 層一維CNN 和殘差連接組成,提取腦電與心電信號中的波形特征。前6 層中的每一層都包含卷積層、批歸一化(Batch Normalization,BN)層、ReLU 激活函數和最大池化層,逐層降維。為了降低過擬合風險,每兩個卷積層后都加入了概率為0.5 的dropout 層。第7 層的卷積核大小為1、通道數為5,將輸入特征從32 通道降到5 通道。為了提高網絡的表示能力,在第2 層和第6 層之間添加殘差連接,利用卷積池化等操作將輸入特征的尺寸與第6 層輸出的特征尺寸進行匹配,以進行相加,最終得到每個30 s EEG epoch 對應的5 通道特征。對于輸入的多個epoch,先逐個epoch 提取特征,再進行拼接聚合,以獲得整體特征。假設有5 個30 s 的EEG epoch {si-2,si-1,si,si+1,si+2},用腦電特征提取模塊提取第i個epoch 的特征fi,整體特征為,該過程如式(1)與式(2)所示:

圖3 時間依賴學習模塊Fig.3 Time-dependency learning module

腦電與心電都是電極片測得的人體體表的電信號,它們的數值在量級上也比較相近,約為幾百微伏,采樣頻率也相同,所以本文采用圖3 的通用結構并行地處理EEG 與ECG,獲得心電特征。獲得相同尺寸的共享EEG 與ECG 特征后,如式(3)所示按元素相加進行特征融合,得到最終特征Fi,實驗結果表明按元素相加方法優于按通道拼接的方法。

2.2 自適應任務間關聯性學習

如引言中所述,睡眠分期與睡眠呼吸暫停低通氣相關,在不同的睡眠時期,呼吸暫停低通氣的發生概率和嚴重程度也不同??紤]到該相關性,設計了自適應任務間關聯性學習模塊,建模睡眠時期與呼吸暫停低通氣它們之間的相互作用關系,將該相互作用關系與提取的共享特征相結合,提升分類性能。

具體地,許多患者的阻塞性睡眠呼吸暫停嚴重程度在REM 期趨于惡化。在呼吸暫?;颊咧?,REM 期的呼吸暫停持續時間比NREM 期更長;相反,如果患者能進入慢波睡眠,他們通常能保持較長時間的穩定呼吸[7],即在不同的睡眠階段,患者發生睡眠呼吸暫停低通氣的概率和嚴重性不同。根據數據集的統計分析,在REM 期更易發生呼吸暫停低通氣,在N3 期則較少。如圖4 所示,本文將通道注意力機制應用于多任務學習框架,學習任務間的關聯性,建模不同睡眠時期發生呼吸暫停和低通氣的可能性輔助SAHS 檢測。

圖4 自適應任務間關聯性學習模塊Fig.4 Adaptive inter-task correlation learning module

注意力機制在人類感知中起著重要作用。人類通常不會試圖一次性處理整個場景,而是選擇性地關注較為突出的部分。從廣義上講,注意力機制是一種工具,它為不同的部分分配不同的權重,將處理資源更多地分配給信息量較大的部分。Hu 等[25]提出了“擠壓和激勵”結構,顯式建模信道之間的相互依賴性,自適應地重新校準信道特征響應,通過全局平均池化將全局空間信息壓縮至信道描述符。隨后用全連接層和sigmoid 激活函數實現激勵操作,利用擠壓操作中聚集的信息,建模信道依賴性。

本文旨在利用通道注意力機制學習不同睡眠時期發生呼吸暫停低通氣的概率。如2.1 節所述,首先提取到5 通道的共享腦電與心電特征,隨后將特征輸入由FC 和Softmax 激活函數實現的分類器分支,獲得長度為5 的概率向量,確定該樣本的睡眠階段。該過程可以描述為式(4):

2.3 損失函數

在MTL 中,如何聯合優化多個任務的損失函數至關重要,如式(8)所示,聯合損失的常見形式是多個任務損失函數的加權和:

其中:k是任務數,wi和Losstaski分別代表第i個任務的權重和損失函數。在訓練過程中,合適的權重能平衡各個任務,防止模型偏向于數值較大的損失函數[26],使網絡參數收斂到對所有任務都有用的魯棒的共享特征。由于睡眠分期的損失函數和SAHS 檢測的損失函數具有相同的數量級,并且這兩個任務同等重要,因此如式(9)所示,所提方法的目標函數是兩個損失函數之和:

3 實驗與結果分析

3.1 數據集與預處理

為了評估所提方法的性能,在兩個公開數據集上使用都柏林大學學院睡眠呼吸暫停數據庫和ISRUC睡眠數據集實驗。

3.1.1 都柏林大學學院睡眠呼吸暫停數據庫(UCD數據集)

都柏林大學學院睡眠呼吸暫停數據庫[27]包含25 名疑似睡眠呼吸障礙患者的整晚PSG,這些患者是從都柏林圣文森大學醫院睡眠障礙門診隨機選擇的,平均年齡50±10 歲。PSG 中包含128 Hz 的EEG 信號、128 Hz 的ECG 信號、眼電信號、下頜肌電信號等其他多模態生理信號。每個30 s 的epoch 被標記為6 個睡眠階段(WAKE、N1、N2、N3、N4 和REM)之一或UNKNOWN,排除了UNKNOWN 數據,因為該標簽不屬于睡眠分期研究的任何一個階段,通常出現在一整晚記錄的首尾,并根據AASM 標準將N3 和N4 階段合并為N3。此外,睡眠醫師對呼吸事件的開始時間和持續時間進行了標注。呼吸事件包括阻塞性、中樞性、混合性呼吸暫停和低通氣,以及周期性呼吸事件。忽略了周期性呼吸事件,合并了呼吸暫停和低通氣的不同類別。為了與睡眠分期標簽一致,以每30 s 為一個epoch,如果在30 s 內有超過5 s 的呼吸暫?;虻屯?,該epoch 將被標記為陽性。

3.1.2 ISRUC-sleep數據集

ISRUC-sleep 數據集[28]包括3 個子集,其中每個PSG 記錄都是在科因布拉大學醫院睡眠醫學中心采集的記錄中隨機選擇的。本文采用了子集I進行實驗,因為大多數受試者都檢測到了呼吸暫停低通氣事件。子集I 包含100 個受試者的整晚PSG記錄,平均年齡51±16歲,每個記錄包含多通道生理信號,如100 Hz的EEG 信號、100 Hz的ECG 信號和眼電信號等。該子集的所有記錄被劃分為30 s的epoch,每個epoch標記了對應的睡眠時期(WAKE、N1、N2、N3和REM)和呼吸事件(混合性、中樞性、阻塞性低通氣和中樞性、阻塞性呼吸暫停),合并了不同類型的呼吸暫停和低通氣,并將該epoch標記為陽性。

3.1.3 數據預處理

由于PSG 采集成本較高,在日常生活中不易獲取,本文基于單導EEG 和單導ECG 進行睡眠質量評估。睡眠階段之間的過渡遵循一定的原則,睡眠呼吸暫停低通氣事件通??缭蕉鄠€epoch。因此,使用當前和相鄰時期窗口(前兩個和后兩個epoch)的數據作為輸入,來預測當前時期的睡眠分期標簽和呼吸暫停低通氣標簽。將每個受試者的數據(C3-A2 導聯EEG、V2 導聯ECG,對應的睡眠分期標簽和睡眠呼吸暫停低通氣標簽)平均分成5 部分,每個部分的前80%作為訓練片段,后20%作為測試片段。對于每個訓練或測試片段,使用長度為5 個epoch 的窗口進行滑動,步長為一個epoch,最終獲得包含上下文信息的輸入樣本,且訓練片段和測試片段之間沒有重疊。將所有受試者的數據拼接起來,獲得最終的訓練集和測試集。在一整晚的睡眠中,不同時期睡眠階段的分布是不同的,開始和結尾多WAKE 期,前半夜多N3 期,后半夜多N2 期和REM 期。同理,睡眠呼吸暫停事件在整夜睡眠中也不是均勻分布的,因此分層抽樣的方式使得訓練集數據更加均衡。數據集的詳細統計信息如表1 和表2 所示。表1 給出了UCD 和ISRUC 兩個數據集在上述的數據劃分方式下,睡眠分期5 類標簽的樣本量和占比;表2 給出了UCD 和ISRUC 兩個數據集在上述的數據劃分方式下,SAHS 檢測中兩類標簽的樣本量和占比。劃分完成后,在訓練集和測試集內部對每個通道的生理信號進行z-score 標準化,以消除受試者差異性對生理信號數值的影響。z-score 標準化定義如式(10)所示:

表1 數據集睡眠分期統計信息Tab.1 Statistics of datasets about sleep stages

表2 數據集睡眠呼吸暫停低通氣統計信息Tab.2 Statisticss of datasets about sleep apnea hypopnea

其中:x是待標準化的數據,μ和σ分別是x的均值和標準差。

3.2 評估指標

采用總體準確率(Accuracy,ACC)、宏F1 分數(Macro F1-score,MF1)和受試者特性曲線下面積(Area Under Curve of Receiver Operating Characteristic,ROC-AUC)這3 個指標評估睡眠分期的性能。ROC-AUC 是ROC 曲線與坐標軸包圍的區域,其中橫軸是假陽性率,縱軸是真陽性率,它可以全面衡量分類器的性能,ROC-AUC 越高,分類性能越好。

對于SAHS 檢測,采用ACC、宏F2 分數(Macro F2-score,MF2)、ROC-AUC 和召回率(Recall)來進行評估。在機器學習的二分類問題中,值得關注的類通常被視為陽性(如呼吸暫停和低通氣),另一類則為陰性。雖然假陽性(False Positive,FP)和假陰性(False Negative,FN)都是疾病初篩中的誤診,假陽性只需要進一步檢查,而假陰性可能會導致患者錯過最佳診斷和治療機會,因此,在SAHS 檢測中,召回率比精確率更重要,它可以反映陽性樣本被正確分類的比例。如式(13)所示,F-score 是同時考慮精確率(Precision)和召回率的指標,P是正確預測為正類的占全部預測為正類的比例,R是正確預測為正類的占全部實際為正類的比例??梢酝ㄟ^修改β改變精確率和召回率之間的相對重要性。如果β<1,精確率更重要;如果β=1,二者同等重要;如果β>1,則召回率更重要。因此,如式(14)所示在睡眠分期任務上選取MF1 來評估分類性能,如式(15)所示,在SAHS 檢測中,使用MF2 來評估性能,重點關注本文方法和基準方法對患病片段(陽性樣本)的檢測能力。給定真陽性(True Positive,TP)、FP、真陰性(True Negative,TN)、FN,上述指標的定義如式(11)~(15)所示:

3.3 實驗設置

采用PyTorch 1.4 構建并復現了基準方法,批大小設置為64,選用Adam 優化器最小化損失函數,學習率設置為0.001,進行300 輪訓練,以獲得穩定的性能。

3.4 對比算法

為了驗證本文方法的有效性,將所提方法與近年先進的單導EEG 睡眠分期單任務學習(Single-Task Learning,STL)方法、單導ECG 的SAHS 檢測STL 方法進行對比。

3.4.1 基準方法

盡管已有很多MTL 方法,但這些方法可能不適用于EEG和ECG 等生理信號和睡眠生理任務,或者對網絡結構有特定要求,不便應用到本文方法中。因此,將本文方法與以下單通道EEG 的睡眠分期STL 基準方法和單導聯ECG 的SAHS檢測STL 基準方法進行了比較。這些STL 基準方法的簡要描述如下:

DeepSleepNet 一種基于原始單通道EEG 的CNN-LSTM模型,提取時不變特征并學習睡眠階段的過渡規則[9]。

12-layer CNN 基于單通道EEG 的12 層CNN 睡眠分期模型[15]。

TinySleepNet DeepSleepNet 模型的改進版本,該模型利用CNN 和LSTM 更有效地對睡眠階段進行分類[29]。

AttnSleep 基于單通道EEG 進行睡眠分期,使用多分辨率CNN、自適應特征重新校準提取特征,用時間上下文編碼器捕獲所提取特征之間的時間相關性[12]。

6-layer CNN 基于CNN 架構,使用單導ECG 記錄對正常、阻塞性睡眠呼吸暫停和低通氣進行分類[30]。

1D-ResNet 使用單導ECG 信號檢測睡眠呼吸暫停的一維殘差神經網絡,采用加權交叉熵損失函數,解決呼吸暫停樣本和正常樣本之間的類不均衡情況[15]。

為了對比不同方法的性能,使用了AttnSleep[12]公開的代碼,并復現了其他基準方法。一些已發布的基準方法代碼基于Tensorflow 框架實現,公平起見,使用PyTorch 框架進行復現,在相同的數據集和實驗設置下評估了所有方法的性能。

3.4.2 性能比較

在兩個公開數據集上比較了本文方法與STL 基準方法在睡眠分期任務上的ACC、MF1 和ROC-AUC,以及SAHS 檢測任務上的ACC、MF2、ROC-AUC 和Recall 指標。

為了使實驗結果更具說服力,在5 個隨機種子下測試了所有方法,并記錄了5 次實驗中所有評估指標的均值和標準差。若將長度為5 個epoch 的樣本全部打亂再隨機分成k折進行交叉驗證,每個樣本中相鄰epoch 的數據也會出現在其他樣本中,即部分數據可能同時出現在訓練集和測試集,造成數據泄漏。并且,將樣本全部打亂也會切斷睡眠的連續性,也會切斷一個連續的呼吸暫停低通氣事件。因此在輸入樣本需要包含相鄰epoch 的情況下,本文選擇了前文所述的數據劃分和實驗設置。此種數據劃分方式下訓練集和測試集已經包含了不同的數據分布,在一定程度上消除了數據分布對方法性能波動性的影響;同時,在實驗過程中發現在不同的隨機種子下,實驗結果也會隨著初始化過程中的隨機因素而波動,因此隨機選取了5 個種子進行實驗,探究方法在不同種子(即不同初始化)情況下的分類性能和魯棒性。

所提方法從單通道EEG 和單導聯ECG 信號中提取共享特征,進行睡眠分期以及SAHS 檢測,而STL 基準方法基于單通道EEG 或單導聯ECG 分別完成兩個任務。公平起見,使用腦電特征提取器提取EEG 特征進行睡眠分期,使用心電特征提取器提取ECG特征進行SAHS檢測。在UCD數據集上的結果表明,采用與STL基準相同的輸入輸出設置時,所提方法的特征提取模塊可以實現與STL基準方法相當的性能。以睡眠分期為例,UCD 數據集上基于EEG 的睡眠分期任務中ACC、MF1 和ROC-AUC 分別為74.13%、73.01%和0.933 2,這些指標表明,MTL 框架的有效性主要歸功于MTL 機制和任務間關聯性學習模塊,而不是引入更多的生理信號。

表3、4 分別報告了本文方法與睡眠分期STL 基準方法和SAHS 檢測STL 基準方法在UCD 數據集和ISRUC 數據集上的性能比較。在睡眠分期任務上,本文方法在兩個數據集上實現了與基準方法相當或更好的分類性能。如表3 所示,在UCD 數據集上,與基準方法相比,本文方法在所有評估指標上都達到了更好的分類性能,其中一次實驗的混淆矩陣如圖5 所示,矩陣中每個元素代表實際類別為縱坐標值并且預測類別為橫坐標值的樣本數量,以此來評估分類性能。

表3 UCD數據集和ISRUC數據集上基準方法與本文方法的睡眠分期性能比較Tab.3 Sleep stage classification performance comparison between proposed method and baseline methods on UCD and ISRUC datasets

圖5 UCD數據集睡眠分期混淆矩陣Fig.5 Confusion matrix of sleep staging on UCD dataset

對于SAHS 檢測,本文方法在兩個數據集上都獲得了較好的結果。盡管所提方法的ACC 略低于其他方法,但獲得了更高的MF2、ROC-AUC 和Recall,UCD 數據集上一次實驗的混淆矩陣如圖6 所示,即所提方法檢測到了更多的呼吸暫停和低通氣片段。在一整晚的睡眠中,呼吸暫停低通氣的標簽通常比正常標簽少得多,高的ACC 可能無法全面證明某方法的優越性。例如,100 個樣本中有10 個呼吸暫停低通氣樣本和90 個正常樣本,不作任何學習,將所有樣本預測為正常,ACC 仍然高達90%,然而,該方法不具備區分呼吸暫停低通氣樣本和正常樣本的能力。

圖6 UCD數據集睡眠呼吸暫停低通氣檢測混淆矩陣Fig.6 Confusion matrix of SAHS detection on UCD dataset

根據表1、2 所示的數據集統計結果,以30 s 的epoch 為一個樣本,UCD 數據集中的呼吸暫停低通氣樣本與正常樣本的比例約為1∶4,ISRUC 數據集中的比例約1∶12。與基準方法相比,本文方法側重于檢測更多的呼吸暫停和低通氣,這對于SAHS 的初步篩查具有重要意義,因此,本文方法的ACC 雖略低于基準方法,但從睡眠疾病初篩的角度,本文方法優于STL基準方法。由于ISRUC 上的呼吸暫停和低通氣樣本數較少,ISRUC 數據集上各方法的總體性能比UCD 數據集上的性能略差。然而與基準方法相比,本文方法仍達到了相當或更好的性能。如表4 所示,在ISRUC 數據集上本文方法與6-layer CNN模型具有相當的ACC,但Recall提高到了39.11%。

表4 UCD數據集ISRUC數據集上基準方法與本文方法的SAHS檢測性能比較Tab.4 SAHS detection performance comparison between proposed method and baseline methods on UCD and ISRUC datasets

在SAHS 檢測研究中,大多數研究人員在Apnea-ECG 數據集上進行實驗,該數據集包含35 個訓練記錄的17 010 個樣本(其中6 514 個呼吸暫停樣本)和35 個測試記錄的17 268個樣本(其中6 550 個呼吸暫停樣本)。每個樣本長度為1 min,并標記有阻塞性呼吸暫停、低通氣、混合性呼吸暫?;蛘撕?。然而Papini 等[31]發現,在該數據集上成功訓練的呼吸暫停檢測算法,在其他包含呼吸暫停事件的數據集上表現不佳。該研究表明,用于訓練模型的數據集會影響SAHS 檢測算法的性能。Apnea-ECG 數據集不包含復雜多樣的睡眠呼吸暫停和低通氣樣本,用該數據集訓練的模型不能輕易遷移到復雜的睡眠呼吸暫停場景中。因此,大部分論文中報告的呼吸暫停檢測方法在Apnea-ECG 數據集上的表現更好,但是本文選擇的兩個數據集更接近患者的實際情況,能夠反映算法在實際應用場景中的性能。

在兩個公開數據集上的實驗結果表明,本文方法可以同時實現睡眠分期和SAHS 檢測。在睡眠分期上,本文方法達到了與基準方法相當的水平,在SAHS 檢測任務上,檢測到了更多的患病片段,對于SAHS 的初步篩查和睡眠質量的綜合評估具有重要意義。

3.5 消融實驗

雙流時間依賴學習模塊、多任務學習機制和自適應任務間關聯性學習是該方法的關鍵部分,為了進一步分析每個模塊的有效性,在UCD 數據集上進行了消融實驗,表5 顯示了實驗結果。3 種變體如下。

表5 UCD數據集上消融實驗結果Tab.5 Ablation study results conducted on UCD dataset

1)A:基于單導EEG 和單導ECG 的雙流STL 方法,用于SAHS 檢測。

2)B:基于單導EEG 和單導ECG 的雙流MTL 方法,用于睡眠分期和SAHS 檢測。

3)C:本文提出的基于單導EEG 和單導ECG 的雙流MTL方法,具有自適應任務間關聯性學習模塊,用于睡眠分期和SAHS 檢測。

如表5 所示,使用單導EEG 和單導ECG 進行SAHS 檢測的STL 方法的性能優于基準方法,表明雙流時間依賴學習模塊提取到了有效的特征,用于檢測呼吸暫停和低通氣。

基于該STL 方法引入MTL 機制,共享特征提取模塊,設置兩個特定任務的分類器分支,實現睡眠分期和SAHS 檢測。通過并行訓練兩個任務,提取共享特征,利用任務間的相關性提升性能。如表7 所示,引入睡眠分期后,SAHS 檢測的性能有所提升,同時,睡眠分期的性能與基準方法持平。這種在所有任務之間共享隱藏層并保留多個特定任務輸出層的方式是硬參數共享,是神經網絡中最常用的MTL 結構。硬參數共享大幅降低了過度擬合的風險,并行學習的任務越多,就越需要學到一個能夠滿足所有任務的表示,在原始任務上過擬合的可能性就越?。?6]。

如引言所述,睡眠分期和睡眠呼吸暫停低通氣是相關的,因此設計了自適應任務間關聯性學習模塊,學習不同睡眠時期發生呼吸暫停低通氣的概率。與方法B 相比,方法C在睡眠分期上表現更好,在SAHS 檢測任務中,也取得了更高的MF2 和Recall。實驗結果表明,自適應任務間關聯性學習模塊可以建模睡眠分期和呼吸暫停低通氣之間的相互作用關系,利用當前輸入樣本的睡眠分期結果和該時期發生呼吸暫停低通氣的概率輔助SAHS 檢測。

為了驗證自適應任務間關聯性學習模塊的有效性,訓練完成后,記錄了該模塊分配給各睡眠時期的權重,并統計了UCD 數據集的訓練集中每個睡眠時期發生阻塞性呼吸暫停低通氣的頻率,結果如表6 所示。

表6 UCD數據集上訓練集中各時期發生睡眠呼吸暫停低通氣的頻率以及訓練過程中最后五輪的平均權重Tab.6 Probability of sleep apnea hypopnea of each stage and average weight in last five rounds on training set in UCD dataset

研究結果表明,呼吸暫停更易發生在REM、N1 和N2 期,而較少發生在WAKE 和N3 期。表6 為訓練過程中最后5 輪的平均權重,其中REM、N1 和N2 期的權重較大,而WAKE 期的權重較小。由于N3 的樣本較少,分配給N3 的權重未得到充分學習,因此該權重略高于預期??傮w來看,自適應任務間關聯性學習模塊學到的權重與數據集中統計的不同睡眠時期發生呼吸暫停低通氣的頻率基本一致。計算權重向量與呼吸暫停低通氣頻率向量之間的相關系數為0.908 4,表明它們之間存在較強的正相關性,也說明自適應任務間關聯性學習模塊可以自動建模任務之間的相互作用關系,提升分類性能。

3.6 時間復雜度分析

在時間復雜度方面,計算并比較了本文所提方法和STL基準方法的浮點運算數(Floating-point Operations Per second,FLOPs)、參數量、訓練占用的GPU 顯存以及在UCD數據集上的訓練時間,各方法的指標對比如表7 所示。

表7 本文MTL方法和STL基準方法的時間復雜度對比Tab.7 Time complexity comparison between proposed MTL method and baseline STL methods on UCD dataset

根據表7 所示的結果,本文的方法能夠同時完成兩個任務,與STL 基準方法中效率較高的兩個方法體量之和(TinySleepNet+6-layer CNN)相比,本文方法有更少的參數量,占用GPU 顯存更小,訓練時間相當。本文的方法以單導腦電和心電作為輸入,相比更多導的信號,信號采集成本較低,較為輕量級的方法也便于部署在家庭醫療和移動醫療等小型設備上。同時,多任務學習機制和自適應任務間關聯性學習模塊學到了兩個任務間的相關性,利用相關性提升了方法的分類性能和泛化性,最終實現便捷高效的睡眠分期與SAHS 檢測,對受試者的睡眠質量進行全面評估,輔助醫生對睡眠疾病進行診斷和治療。

4 結語

本文提出了一種新的MTL 框架,基于單導EEG 和單導ECG 進行睡眠分期和SAHS 檢測。由于睡眠階段和睡眠呼吸暫停低通氣是相關的,構建了雙流時間依賴學習模塊,在兩個任務的聯合監督下學習共享的EEG 和ECG 特征。設計了自適應任務間關聯性學習模塊,將注意力機制應用于多任務學習框架中,捕獲睡眠時期和呼吸暫停低通氣之間的相互作用關系,對不同睡眠時期發生呼吸暫停低通氣的概率進行建模。在兩個公開數據集上進行了實驗,并與STL 基準方法進行了對比。實驗結果表明,本文方法在睡眠分期任務上達到了與基準方法相當或更好的分類性能,在SAHS 檢測任務上優于基準方法,能檢測更多的患病片段,對于SAHS 的初步篩查具有重要意義。此外,本文方法只需要單通道EEG 和單導聯ECG 作為輸入,單導信號的采集不會嚴重影響患者的正常睡眠,采集成本也低于多通道數據,因此,本文方法可以應用于家庭監測和移動醫療設備中的睡眠質量評估以及睡眠疾病的初步篩查[32],輔助睡眠醫師診斷和治療睡眠疾病。

本文方法在一個框架中訓練睡眠分期與SAHS 檢測兩個任務并取得了較好的效果,但是當前方法未特別處理呼吸暫停檢測中的類別不均衡問題。在多任務學習設置下如何解決其中單個任務的類別不均衡問題,進而提升總體的分類性能,還需進一步地探討與分析。另外,本文的實驗設置是不跨受試者的,受試者之間的差異會影響方法的性能,如何解決個體差異問題,提升方法的魯棒性和泛化性,也是值得深入探究的。

猜你喜歡
集上通氣樣本
用樣本估計總體復習點撥
Cookie-Cutter集上的Gibbs測度
鏈完備偏序集上廣義向量均衡問題解映射的保序性
不通氣的鼻孔
實用無創機械通氣技術進修班招生簡介
推動醫改的“直銷樣本”
復扇形指標集上的分布混沌
隨機微分方程的樣本Lyapunov二次型估計
村企共贏的樣本
通氣湯聯合艾灸防治婦產科術后腹脹40例
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合