?

基于樸素貝葉斯增量學習算法的個體熱舒適預測模型*

2021-12-02 10:44重慶大學韓爾東李百戰杜晨秋姚潤明
暖通空調 2021年11期
關鍵詞:準確度增量受試者

重慶大學 韓爾東 李百戰 杜晨秋 秦 碩 姚潤明

0 引言

20世紀70年代,Fanger教授基于人體熱平衡理論,通過大規模人群實驗,建立了預測人員熱舒適的PMV-PPD模型[1],并被多部國內外標準采用[2-3]。隨著PMV-PPD模型的廣泛應用,該模型的局限性也日益凸顯。一方面,PMV-PPD模型是在大規模的人群實驗中得到的,預測的是大量個體在特定熱環境下的平均熱感覺[4]。但是性別[5]、年齡[6]和心理狀態[7]等因素都會造成個體之間熱舒適狀態的差異。另一方面,PMV-PPD模型不具備自學習和自糾正的能力[8],一旦使用場景發生變化,PMV-PPD模型的預測性能將會下降。Cheung等人[9]和Jiang等人[10]分別使用ASHRAE全球熱舒適數據庫和氣候倉實驗數據驗證了PMV模型的預測性能,結果表明PMV模型的預測準確度僅分別為34.0%和49.7%。同樣,目前的適應性模型[11]、aPMV模型(適應性PMV模型)[12]預測的也是大量人群的平均舒適范圍和平均熱感覺。建立個體熱舒適模型是指收集單一個體的熱舒適數據,通過機器學習算法或其他方法建立符合單一個體需求的熱舒適預測模型(personalized thermal comfort model),以實現空調系統供給與個體需求的匹配。

在建筑環境領域,室內人員的熱舒適與環境因素、心理因素和行為因素存在復雜的相關性,而機器學習算法善于從繁多的數據中學習各變量與人體熱舒適之間隱含的、有價值的或者規律性的知識,并將其應用到實踐中[13]。熱舒適預測的本質是機器學習中的分類問題,常見分類算法如決策樹[13]、隨機森林[14]、K最近鄰算法[15]、樸素貝葉斯算法[16]和人工神經網絡算法[17]都可以用于熱舒適的預測?,F有研究首先在氣候倉[18-19]和實際環境[20-21]中,通過侵入式[5]、半侵入式[16]和非侵入式[22-23]的方法,收集環境數據、受試者生理數據和主觀反饋信息。在數據清洗后,匹配客觀參數與主觀反饋,按照一定比例劃分訓練集和測試集。使用訓練集完成模型訓練,使用測試集檢驗模型對“未見數據”的預測能力。在建立個體熱舒適預測模型后,還可以通過模擬[24]和現場實測[25]的方式檢驗模型在提升用戶舒適度和節能方面的潛力。根據Xie等人的綜述[26],通過機器學習建立的熱舒適預測模型的準確度可以達到84%,將模型應用到暖通空調系統的控制中平均可以提升29.1%的舒適度和降低22.0%的能源消耗??梢娛褂脵C器學習建立個體熱舒適模型可以準確預測個體需求,實現供給與需求的匹配,顯著提升用戶的舒適度和降低建筑能耗。

在已有的研究中,建立個體預測模型之前需要獲得大量的熱舒適數據,這不符合實際數據產生的方式。并且考慮到季節更替[27-28]等因素,新產生的樣本可能包含個體熱舒適偏好發生變化的信息,因此通過新增樣本更新模型以適應這種變化十分有必要,但現有更新方法的成本很高。例如現有研究將新樣本直接與已保存的歷史樣本組合,重新訓練模型。這種建模方式需要存儲模型及所有歷史樣本,時間和空間成本巨大,不利于部署到小型的輕量化終端設備。Liu[17]等人在研究中提出,當產生新的樣本后,用新樣本代替歷史樣本中相同數量的舊樣本,重新訓練模型。這種方式雖然減少了部分空間成本,但仍然需要保留一定量的歷史樣本重新訓練,并且模型的準確度可能也會因訓練樣本數量不足而降低。

因此亟需開發新的模型更新方法,既可以使用增量數據在線更新模型,減少更新的時間與空間成本,也可以保持模型具有較高的預測性能。

1 研究方法

1.1 增量學習算法

為實現“使用增量數據在線更新模型”,本文采用了基于樸素貝葉斯的增量學習算法。樸素貝葉斯算法是源于貝葉斯定理的監督學習算法,使用貝葉斯公式計算標簽Ai在特征X的前提下出現的概率P(Ai|X),哪個標簽出現的概率大,就認為待分類樣本是這個標簽。計算公式如式(1)所示。

(1)

式中P(Ai)為樣本標簽為Ai的先驗概率,不依賴于樣本特征X;P(X|Ai)為在標簽為Ai時特征X出現的概率;P(X)為特征X的先驗概率,是一個常數[29]。

本文借助Scikit-learn機器學習庫[30]實現了一種基于樸素貝葉斯的增量學習算法,如圖1所示。先使用基礎訓練集(約5~10組樣本)訓練一個基礎模型,即計算一個初始的P(Ai)和P(X|Ai)。完成訓練后丟棄所有歷史樣本,當產生增量樣本后,使用增量樣本對P(Ai)和P(X|Ai)進行修正,修正公式如式(2)~(6)所示。

圖1 基于樸素貝葉斯算法的增量學習流程

(2)

P*(xj|Ai)=

(4)

(5)

(6)

每次完成修正后,丟棄當前增量樣本,直至完成對所有增量樣本的學習,該方法只需保存模型即可。將該方法簡稱為方法A。

為了驗證本文提出的增量學習算法的性能,將其與以往研究中已經出現的模型更新方法(方法B和方法C)進行對比,如表1所示。

1.2 數據收集

利用機器學習算法建立個體熱舒適模型,需要收集個體在特定熱濕環境下的主觀評價。本文從在氣候倉進行的實驗中收集環境參數、受試者生理參數和主觀評價。

具體的實驗工況設置如表2所示。溫度在22~32 ℃之間漸變,溫度變化率控制在0.5 ℃左右;相對濕度在50%~80%范圍內波動;風速分為無風速、固定1擋風速和可調風速3種情況;著裝分為固定著裝和可調著裝2種情況。受試者在可調風速、可調著裝2種工況下可以根據自身需求調節風速和增減衣物,在其余工況下不得調節風速和增減衣物。

表1 3種模型更新方法

表2 實驗工況設計

本研究測量的環境參數包括:干球溫度、相對濕度和風扇擋位。為防止受試者所處環境的參數與測量得到的參數有較大誤差,溫濕度傳感器置于距離受試者50 cm范圍以內、高度75 cm左右的位置。溫濕度傳感器1 s記錄1次環境參數。本研究測量的人體生理參數包括:心率、皮膚溫度(手腕和腳踝)、耳溫和血壓。皮膚溫度1 s記錄1次,心率、耳溫和血壓10 min記錄1次。測量設備相關信息見表3。

表3 測量設備與精度

本次實驗在重慶大學人工氣候室進行。通過自愿的方式共招募到9位受試者,基本信息如表4所示。實驗開始前,受試者在中性的環境中(26 ℃)消除此前熱環境暴露的影響。進入實驗室后,受試者保持靜坐,可以進行正常的文案工作,并在實驗人員的提醒下每10 min填寫1次主觀調查問卷,受試者的主觀評價通過電子問卷的形式收集。在實驗過程中,受試者可以根據工況要求和自身需求調節著裝和局部風扇風速。整個實驗流程持續3 h。

表4 受試者基本信息

1.3 數據預處理

1.3.1準備樣本

機器學習的訓練樣本由輸入特征和標簽組成。鑒于實驗中所收集的變量均與受試者熱舒適狀態有潛在聯系,因此將實驗中收集到的所有環境參數(干球溫度、相對濕度和風扇擋位)和生理參數(皮膚溫度、血壓、心率和耳溫)均作為輸入特征。此外,Cosma等人的研究表明,身體各部位的皮膚溫度差異對人員熱舒適狀態也有影響[21],因此將手腕和腳踝的皮膚溫度差也作為輸入特征。研究表明,相比熱感覺,熱期望更能體現出特定環境下受試者希望環境變化的方向[32],因此選擇熱期望作為樣本的標簽,即“希望環境暖一些”(-1)、“希望環境保持不變”(0)、“希望環境涼一些”(1)。將輸入特征與對應時刻的標簽組合即為一組樣本。本文將70%的樣本作為訓練集,30%的樣本作為測試集。并且將訓練集劃分為基礎訓練集和增量訓練集,基礎訓練集用于訓練基礎模型,增量訓練集中的樣本用于模擬用戶在實際使用中產生的增量樣本。

1.3.2模擬產生增量數據

本文和其他研究一樣,也是在實驗中一次性獲得大量數據。為了模擬單一個體在實際生活中產生的新樣本,采用了一種名為“數據流迭代器”的方法。將1.3.1節所述的增量訓練集輸入到“數據流迭代器”,“數據流迭代器”可以在每次循環時從增量訓練集中導出一組新樣本,這組新樣本就被認為是模型在實際生活中得到的增量樣本,直至將增量訓練集中的所有樣本全部導出,流程如圖2所示。

圖2 模擬用戶產生新數據樣本的過程

1.4 模型評價指標

現有研究多采用準確度作為模型分類性能的評價指標,即預測正確的樣本占總樣本的比例。但采用準確度作為評價指標會存在“隨機正確”的現象:如有一個不平衡的數據集,中性標簽的樣本占90%,其余標簽的樣本占10%。剛好存在一個模型M,不論輸入如何,其輸出均為中性,如果用M來預測這個不平衡的數據集,其準確度可以高達90%,但是從模型表現來看,這并不是一個性能良好的模型。本研究收集到的數據是一個不平衡的樣本集,詳見2.1節。因此本研究引入Kappa系數作為評價指標,Kappa系數基于混淆矩陣(如圖3所示)計算模型性能,適用于評價模型預測不平衡數據集時的性能[16,33],其計算公式為

(7)

式中k為Kappa系數;p0為觀測的一致性,p0=[A(-1,-1)+A(0,0)+A(1,1)]/S,其中A(i,j)表示實際標簽為j,但被模型預測成i的樣本數量,當i=j時表示模型預測正確(A(-1,-1)、A(0,0)、A(1,1)),i≠j時表示模型預測錯誤,S為混淆矩陣所有元素之和(∑A(i,j));pe為偶然的一致性,pe=[R1C1+R2C2+R3C3]/S2,其中Ri和Ci分別為混淆矩陣中第i行和第j列的和。

圖3 混淆矩陣的結構

Kappa系數的數值與對應的一致性如表5所示[34]。

2 結果分析

表5 Kappa系數對應的一致性程度

2.1 樣本分布

本次實驗共有9位受試者(編號為Sub 1~Sub 9)參與,排除包含數據缺失值、異常值的樣本后,共收集有效樣本1 925組。統計了每位受試者所有樣本的熱期望標簽分布,如圖4所示??傮w來看,“希望環境保持不變”(0)占56.4%,“希望環境涼一些”(1)占26.8%,“希望環境暖一些”(-1)占16.8%。每位受試者的樣本標簽均呈現不均勻分布的狀況,因此1.4節提出使用Kappa系數來衡量模型性能是十分必要的。圖5為所有受試者在不同熱期望下的變量分布圖。在本次實驗中,環境溫度、手腕溫度和腳踝溫度在不同熱期望下的分布具有明顯的差異,可以初步判斷這3個變量對熱期望有較大影響。當風扇擋位為3擋時,基本不會出現“希望環境暖一些”的情況;當著裝熱阻超過0.5 clo時,基本不會出現“希望環境涼一些”的情況。而其他單個變量在3種熱期望下分布的差別較小,基本呈現相近的趨勢。

圖4 受試者熱期望分布

2.2 模型性能評價

按照1.1節提出的增量學習算法(表1的方法A),先使用5組樣本訓練得到基礎模型。再通過“數據流迭代器”模擬實際應用時產生的增量樣本,每產生一組增量樣本,都對現有模型進行修改,直至完成對所有樣本的學習。圖6顯示了使用該方法對9位受試者的數據進行增量學習的結果,可以看出所有受試者的熱舒適模型性能均隨著樣本數的增加而上升。當增加的樣本數達到一定數目后,模型性能開始趨于穩定。表6統計了各受試者的熱舒適模型在學習了所有樣本后的Kappa系數,可以看出除Sub 2以外,其余所有受試者熱舒適模型的Kappa系數均超過了0.6,平均Kappa系數達到了0.699 4,表明模型結果與實際結果存在高度一致性。此外,表6顯示該算法建立的模型平均僅需26組增量樣本,即可達到最終Kappa系數的90%。綜合圖6和表6,可知本文所提出的算法訓練得到的模型不僅具有較高的預測性能,而且需要的樣本量較少。

圖6 各受試者熱舒適模型性能變化曲線

表6 受試者熱舒適模型的Kappa系數

由圖6和表6可知,9位受試者熱舒適預測模型的Kappa系數整體均低于準確度,這是因為Kappa系數在本質上是去除了偶然一致性后的“準確度”。以Sub 3和Sub 6為例,雖然Sub 3模型的準確度超過了Sub 6模型,但Sub 3模型的Kappa系數卻小于Sub 6模型。這是由于Sub 3的樣本分布十分不平衡(見圖4),偶然一致性大,Sub 3模型需要達到更高的準確度才能證明其具有和Sub 6模型一樣的預測性能。再以Sub 2為例,雖然準確度超過了0.7,但是Kappa系數還未達到0.6,說明模型預測與實際僅具有“中等的一致性”。

值得注意的是,Sub 3模型的準確度在一開始有先下降后上升的現象。通過分析混淆矩陣,原因如下:以圖7為例來說明,一開始的模型無論真實標簽如何,預測的結果都是“希望環境保持不變”(0),雖然模型的準確度較高,但模型性能很差;隨著不斷學習增量樣本,該模型開始具備預測其他類別的能力,也造成了更多的誤分類,造成準確度下降,但Kappa系數在上升,模型的性能也在上升;繼續學習更多樣本后,誤分類的個數開始減少,準確度和Kappa系數都在上升。綜上所述,相比準確度而言,Kappa系數更適合評價模型的預測性能。

圖7 對部分模型準確度出現先下降后上升的解釋

2.3 3種建模方法的模型性能對比

表7對比了本文提出的增量學習算法(表1的方法A)和以往文獻中出現的2種方法(表1的方法B和方法C)的建模性能,分別對比了3種建模方法在增量學習50組和100組樣本之后的模型Kappa系數??梢钥闯?,方法A和方法B建立模型的Kappa系數幾乎完全相同,表明通過這2種方法建立的模型性能差異極小,這是樸素貝葉斯算法的原理導致的。樸素貝葉斯算法中標簽的先驗概率和特征的條件概率,即1.1節提到的P(Ai)和P(X|Ai),在預測樣本的標簽時起到了決定性作用。方法A是根據式(2)~(6)和新增的樣本來修正標簽的先驗概率和特征的條件概率,而方法B是重新計算新增樣本后標簽的先驗概率和特征的條件概率,2種方法計算得到的結果是幾乎相同的,所以得到的模型性能也是幾乎相同的。但方法C建立的模型性能明顯低于方法A和方法B,這是因為方法C最多只保持20組訓練樣本,提高方法C的訓練樣本數可提高建模性能,但也會提高建模成本。

表7 3種建模算法的Kappa系數對比

2.4 3種建模方法的時間空間成本對比

圖8對比了3種方法對各受試者的所有數據進行完整的增量學習所需要的時間??梢钥闯?,使用方法A所需要的時間明顯少于方法B和方法C,方法B和方法C均需重新訓練模型,因此需要的時間幾乎完全相同。對于本文所使用的數據集,使用方法A建模的平均時間為0.221 s,而使用方法B和方法C建模的平均時間為0.268 s,方法A縮短了17%的建模時間。

圖8 3種建模方法的時間對比

圖9對比了3種方法在建模過程中占用的存儲空間。由于方法A僅存儲模型,所以在增量學習的過程中占用的存儲空間保持不變;方法B既存儲模型又存儲歷史樣本,所以在增量學習的過程中占用的存儲空間隨樣本數的增加而增大;方法C需要存儲預測模型和20組訓練樣本,因此在獲得20組樣本后,占用的存儲空間保持不變。在增量學習100組樣本后,方法A相比方法B和方法C分別節約了98%和92%的空間成本。

圖9 3種建模方法的空間成本對比

需要指出的是,本研究的模型訓練過程均是在個人計算機(PC)上進行的,因此時間成本和空間成本都不算高。但是考慮到用戶熱舒適數據的隱私性和數據傳輸的復雜性,未來個人熱舒適模型的建立與更新都應當在本地的輕量化智能終端(如智能空調)中進行,其數據計算和存儲能力要遠低于日常使用的個人計算機,因此本文提出的模型建立與更新的方式更加適合部署到計算資源和存儲資源較少的輕量化智能終端。

3 討論與展望

以往的研究過多強調如何利用各種機器學習算法提升預測模型的準確性,而很少考慮在面對不斷出現的“流式數據”時如何更新模型。本文提出的基于樸素貝葉斯增量學習算法相比現有的模型更新方法,具有更高的準確度和更低的建模成本,更適合部署到計算和存儲資源較少的輕量化智能終端。同時為了避免偶然的一致性,采用了Kappa系數來科學評價模型的預測性能,扣除了在預測過程中出現的偶然一致性,還原了模型本身具備的預測能力,建議后續研究多采用Kappa系數作為模型評價指標。也有學者認為應當依據模型的應用特點選擇合適的評價指標,如Cosma等人認為:如果希望最大程度地節約能源,則應當選擇一個具有高查全率的模型;如果希望最大程度地保證人員舒適,則應當選擇一個高查準率的模型[21]。

不過,本文仍存在以下不足:第一,本文使用的增量學習算法沒有賦予新樣本更高的權重??紤]到實際中新增樣本對預測人員熱舒適狀態的作用更大,因此后續研究可以考慮提高新增樣本在建模過程中的權重,從而建立性能更高的個體熱舒適預測模型。第二,本文提出的算法僅適用于單人空間的熱舒適預測,在得到用戶冷熱需求的基礎上即可控制室內空調運行,但開發適合共享空間(如多人辦公室)的熱舒適預測與控制算法仍然是一大難題,特別是當共享空間中存在相左的熱期望時如何進行空調控制,以滿足共享空間中所有人的熱舒適需求。第三,本文僅針對樸素貝葉斯算法提出了一種增量學習方法,并沒有考慮其他性能可能更好的分類算法,如支持向量機和人工神經網絡等,如何使用這些算法進行增量式的機器學習,這可能需要更多建筑熱環境領域與人工智能領域的交叉研究。

4 結論

1) 基于實驗室多工況熱舒適實驗數據實現了樸素貝葉斯增量學習算法,通過增量數據在線建立和更新模型,使建模過程更加符合現實的數據產生方式。

2) 實驗數據驗證顯示,該算法在學習所有樣本之后,模型的平均Kappa系數為0.699 4,表明預測結果與真實結果存在高度一致性;并且模型在平均學習26組樣本后,即可達到最終Kappa系數的90%,表明該算法建立的模型可以較好、較快地預測真實環境下個體熱舒適需求。

3) 通過對比已有模型更新方法,本文所提出的增量學習算法節約了17%的時間成本和90%以上的空間成本,為未來在存儲資源有限、計算資源較少的輕量化智能終端中使用提供了一定的參考和支撐。

猜你喜歡
準確度增量受試者
涉及人的生物醫學研究應遵循的倫理原則
涉及人的生物醫學研究應遵循的倫理原則
淺談新型冠狀病毒疫情下藥物Ⅰ期臨床試驗受試者的護理
導彈增量式自適應容錯控制系統設計
影響重力式自動裝料衡器準確度的因素分析
提質和增量之間的“辯證”
全現款操作,年增量1千萬!這家GMP漁藥廠為何這么牛?
疫情下普通患者應如何進行肺功能檢查?
Phosphatidylinositol-3,4,5-trisphosphate dependent Rac exchange factor 1 is a diagnostic and prognostic biomarker for hepatocellular carcinoma
特大城市快遞垃圾增量占垃圾增量93%
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合