黃思源,何欣欣,張明鳳,熊華容,王 丹,石鎂虹
(西南醫科大學護理學院,四川 瀘州 646000)
高尿酸血癥(hyperuricemia,HUA)是一種由于嘌呤代謝障礙或紊亂而導致的血清尿酸水平升高的疾病[1],是指男性患者血清尿酸>420 μmol/L(7 mg/dL)、女性患者血清尿酸>360 μmol/L(6 mg/dL)[2]。我國不同地區高尿酸血癥的發病率為5.46%~19.30%[3],其中男性人群發病率最高可達26.2%。高尿酸血癥不僅是導致痛風的基礎疾病,還會增加患高血壓、心臟疾病、糖尿病和慢性腎衰竭的風險[4]。近年來,隨著社會經濟水平的提高和人們生活方式的改變,高尿酸血癥的患病率逐漸增加。但由于其發病隱匿,不易察覺,一旦發現,會給患者及家庭帶來嚴重負面影響。通過預測患者發生高尿酸血癥風險并給予及時精準的干預措施,不僅能有效貫穿“早發現、早診斷、早治療”的三級預防體系,還能降低不良結局事件的發生。目前,國內外關于高尿酸血癥風險預測模型的研究較多,但公開發表的預測模型性能和臨床適用性仍待進一步驗證。因此,本研究通過系統評價國內外健康篩查發生高尿酸血癥風險預測模型的相關文獻,旨在為高尿酸血癥發生風險預測模型的應用、優化以及針對性預防提供參考依據。
1.1檢索策略 檢索The Cochrane Library、PubMed、Web of Science、維普、萬方和知網數據庫,檢索關于健康篩查發生高尿酸血癥風險預測模型的研究,檢索時限為建庫至2021年12月10日。英文檢索詞包括hyperuricemia、uric acid、gout、prediction model、early-warning、risk prediction、risk assessment、risk stratification、risk score、nomogram、predictor;中文檢索詞包括高尿酸血癥、高尿酸、痛風、預測模型、預測因子、列線圖、風險預測、風險評分、風險評估、早期預警、危險分層。具體檢索策略以PubMed為例。見圖1。
1.2納入和排除標準 納入標準:(1)研究對象:年齡 ≥18歲的健康體檢者;(2)研究內容:高尿酸血癥風險預測模型的開發或驗證研究;(3)研究類型:隊列研究、病例對照研究和橫斷面研究。(4)結局指標:發生高尿酸血癥;(5)文獻語言:中文或英文。排除標準:(1)未建立高尿酸血癥風險預測模型的研究;(2)未描述模型構建過程或方法的研究;(3)無法獲取全文;(4)會議論文等非正式發表的文獻。
1.3數據提取 由2名研究者獨立篩選文獻、數據提取及文獻質量評價。如果存在異議,則由第3位研究人員參與決定。數據提取包括:文獻研究信息,國家,研究設計,結局指標,統計方法,模型名稱,因子個數,預測因子,樣本量,模型性能等。
預測模型的預測性能評估主要是根據區分度和校準度兩個重要的維度[5]。區分度代表預測模型區分最終事件是否會發生的能力,最常用的評估指標是受試者工作特征曲線(receiver operating characteristic curve,ROC)下的面積(area under curve,AUC)的值。如果AUC>0.80,則認為該模型區分度極佳,如果AUC>0.75,則認為該模型非常好,如果AUC>0.70,則認為該模型區分度好[6-7]。校準度(Calibration)也是評價風險預測模型的一個重要指標[8],代表疾病風險模型預測未來某個個體發生結局事件概率準確性的重要指標,即模型預測與實際發生風險一致程度,校準度好,代表預測模型的準確性高,校準度差,則代表模型有可能高估或低估疾病的發生風險[8-9]。
1.4文獻質量評價 文獻質量評價:采用PROBAST工具[10-11],根據研究對象、預測因子、結果和統計分析4個領域中相關20個問題進行文獻偏倚風險的評估,適用性則由研究對象、預測因子和結果3個領域進行判斷。文獻偏倚風險問題的判斷標準為每個問題采用“是/可能是”、“可能不是/不是”或“沒有信息”進行回答;文獻適用性的判斷標準為每個問題采用“低適用性風險”、“高適用性風險”、“不清楚”進行回答。
偏倚風險與適用性整體性評價:只有每個領域被評為“低風險”,則才將整體視為“低風險”;只要某個領域中被評為“高風險”,則將整體視為“高風險”;若某個領域被評為“不清楚”而同時其他領域都為“低風險”,則整體為“不清楚”。
2.1符合標準的研究及特征 通過檢索初步得到1 960篇文獻,去重后獲得1 818篇文獻,其中中文573篇,英文1 245篇。閱讀題目和摘要篩選出210篇文獻,根據納入排除標準最終納入14項研究(圖2)。表1總結納入研究的主要特征。該研究系統評價包括29個預測模型。本系統評價共納入638 539例健康體檢篩查者。7項研究[12-18]是針對2個及以上高尿酸血癥風險預測模型的建立及模型間比較,5項研究[13-15,18-19]對高尿酸血癥風險預測模型特別關注性別。12項研究[12-17,19-24]設計類型為橫斷面研究,僅2項研究[18,25]為隊列研究。
表1 納入文獻基本特征
圖2 文獻篩選流程
符合標準的14項預測模型中,最終納入模型中的預測因子個數為4~24個,預測模型中預測因子主要分為6類,包括人口統計學資料、人體形態特征、生化檢查、治療、現病史和生活習慣方式,共52個預測因子。模型輸入特征中出現頻次最高的前5位分別為身體質量指數(n=16,30.77%)、年齡(n=12,23.08%)、甘油三酯(n=9,17.31%)、性別(n=9,17.31%)、總膽固醇(n=8,15.38%)。
2.2文獻偏倚風險和適用性評價 文獻質量評價采用的工具是PROBAST,其評估的內容主要包括偏倚風險評價和適用性評價。14項研究對象和預測因子的偏倚風險均較低,但7項研究在結果領域偏倚風險較高,納入研究在統計分析領域偏倚風險均較高。其主要內容如下:(1)7項研究[12-13,15,19-20,22,24]將連續型變量轉化為分類變量;(2)4項研究[15,17,22,24]尚未按照PROBAST對缺失值進行處理;(3)4項研究[13-14,20-21]采用單因素分析篩選預測因子;(4)14項研究[12-25]均尚未對數據中出現的復雜性問題進行報道;(5)11項研究[12,14-19,21-24]尚未完整評估模型性能;(6)5項研究[12,15,19,22,24]缺乏模型開發的內部驗證;(7)8項研究[12,14-15,17,19-20,22,24]在模型開發后未報告最終模型計算公式和最終的預測模型。研究進行適用性評價,多數研究的適用性為低偏倚風險。具體評價結果見表2。
表2 PROBAST評價結果示意表
2.3模型的統計方法 本研究14項研究中12項研究[12-14,16-21,23-25]屬于開發模型,3項研究[15,22,24]屬于增量更新模型。模型構建的方法新穎多樣,其中5項研究[13-14,16-17,21]構建高尿酸血癥風險預測模型為非參數模型采用機器學習的算法,其中出現頻次最高的方法為隨機森林,共3項研究[14,16-17]。本研究中模型建立主要方法是Logistic回歸,共12項研究[12-17,19-20,22-25]。4項研究[13-14,20-21]是采用單變量分析方法篩選風險預測模型的預測因子。見表3。
表3 高尿酸血癥風險預測模型樣本量、訓練及模型性能
2.4預測性能 14項研究[12-25]開發模型研究均報道區分度,ROC曲線下面積(AUC)取值范圍在0.512~0.827,經過驗證后模型的AUC有4項[13,18,21,25]研究報告,其取值范圍在0.764~0.814,表明這些模型區分度存在不同程度的差異。4項[13-14,16-17]研究是模型同模型之間的性能比較,但有11項研究[12,14-19,21-24]開發預測模型均未報告預測模型校準度。在模型驗證方面,在14項高尿酸血癥風險預測模型中,進行內部驗證模型有8項[13,14,16-18,20,21,23],其中有2項研究[20,23]采用Bootstrap重抽樣方法,有3項研究[13-14,21]采用隨機拆分法,其比例有8∶2、7∶3或者2∶1,有3項研究[16-18]采用交叉驗證方法,包括簡單、10折和5折。有1項研究[21]采用空間驗證方法進行外部驗證。14項研究最終模型呈現方式也不盡相同,有3項研究[13,20,23]以列線圖方式呈現,有1項研究[25]采用的是風險等級方式呈現,并給出高尿酸血癥發病概率的計算公式。見表3。
高尿酸血癥風險預測模型具有較好的預測性能,但總體偏倚風險較高,本系統評價共納入14項研究,分別報告高尿酸血癥風險預測的參數化模型與非參數化模型之間的比較。10項研究[13-15,19-25]經過驗證模型的報告中AUC均>0.7,這表明模型區分度好,僅1項研究[21]AUC>0.8,這表明模型都具有出色的辨別力。但本研究納入研究偏倚風險均較高,偏倚風險高主要原因在研究對象和分析領域。分析偏倚風險高的原因如下:(1)研究設計局限,缺乏前瞻性隊列研究和隨機對照試驗等高質量研究。12項研究[12-17,19-24]在模型開發研究設計為橫斷面研究。(2)因子篩選方法過于單一。4項研究[13-14,20-21]采用的是單因素分析進行預測因子的篩選,2項研究[17,24]尚未對篩選預測因子的方法進行描述,容易造成模型擬合度不足。(3)數據的復雜性缺乏考慮。14項研究[12-25]尚未對數據的復雜性進行闡述,可能對讀者方面會降低可讀性。(4)模型性能的評價缺乏標準化。11項研究[12,14-19,21-24]未評估預測模型校準度,僅評估模型區分度,這會造成模型準確度降低,模型可能會高估或低估疾病的發生風險。(5)缺乏模型開發的內部驗證。5項研究[12,15,19,22,24]未對風險預測模型進行內部驗證導致模型擬合優度欠考慮。(6)7項研究[12-13,15,19-20,22,24]將連續型變量轉化為分類變量,造成預測模型數據信息的損失,導致預測模型準確性欠佳,導致模型的偏倚增高。因此建議研究人員以后進行高尿酸血癥風險預測模型的開發、驗證或更新研究時,應該參照PROBAST工具對自己研究方案進行設計或進行臨床預測報告時使用TRIPOD聲明[26]書寫報告。
高尿酸血癥風險預測模型預測因子分析,納入模型中的預測因子個數為4~24個,預測模型中最終預測因子可歸納為6個類別,分別為人口統計學資料、人體形態特征、生化檢查、治療、現病史和生活習慣方式。模型中出現最多的5個預測因子分別為:身體質量指數、年齡、甘油三酯、性別、總膽固醇。研究表明,身體質量指數是作為肥胖判斷的“金標準”,而肥胖是發生高尿酸血癥的影響因素[27]。年齡在高尿酸血癥的影響中反而是更小年齡的風險越高[13]。性別作為高尿酸血癥的影響因素之一,有12項高尿酸風險預測模型男性發病率要高于女性,一方面可能是由于女性體內雌激素多,可以幫助腎臟加速尿酸的排泄,從而減少尿酸水平[13];另一方面可能是男性與女性飲食習慣的不同,而男性更偏愛高嘌呤飲食和飲酒等不健康的生活習慣[28]。甘油三酯、總膽固醇是反應血脂水平的重要指標,而血脂指標異常同高尿酸血癥間是正相關關系[29]。利用這些預測因子可以做好健康科普,可以讓民眾認識到做好健康生活方式的重要性。身體質量指數、甘油三酯、總膽固醇3個為可控性預測因子,而臨床預測模型中加入可控性預測因素則會使臨床預測模型的推廣更加具有臨床意義。因此本研究針對高尿酸血癥風險預測模型對普通大眾可以進行切實可行的健康教育,落實“預防先行”。
模型統計方法分析,4項[13-14,16-17]高尿酸血癥風險預測模型比較類研究中可見3項研究[14,16-17]在相同數據源采用2個及以上機器學習算法和傳統Logistic回歸比較,前者預測性能更佳,而有1項[13]研究是分類樹和傳統Logistic回歸之間的比較,后者略優。雖然目前機器學習方法在臨床上得到廣泛推廣,但Logistic回歸作為一種經典的建模方法有其特定優勢,且目前針對預測模型的方法尚無最佳推薦,因此,在進行風險預測模型建模時,應該盡可能多地去嘗試多種建模方法,從而尋找預測性能好且操作性強的最佳預測模型。
高尿酸血癥風險預測模型的外推性探討,近年來,風險預測模型是目前臨床上廣泛關注的焦點。但根據2019年后的12項研究[12-14,16-21,23-25],可見高尿酸血癥風險預測模型尚處于發展階段。雖然10項研究[13-15,19-25]經過驗證模型的報告中AUC均>0.7,表現出良好的預測潛力,但是僅1項研究[25]中報道高尿酸血癥風險預測模型外部驗證。曾有研究[30]表明風險預測模型缺乏嚴格的外部獨立驗證的情況,使模型可能提供具有誤導性的高預期風險預測。隨著近年來臨床預測模型的熱潮,越來越多疾病相關臨床預測模型被建立,而高尿酸血癥風險預測模型也不例外,但是這些模型均未進行外部驗證,導致這些模型在應用價值上存在缺陷,難以將模型推廣到臨床上進行使用。
本系統評價的局限性:(1)本系統評價納入語言為中文或英文,可能存在發表偏倚;(2)本系統評價納入研究的研究設計不足,多為橫斷面研究,缺乏前瞻性隊列研究;(3)本系統評價研究缺乏內部驗證和外部驗證,雖然部分研究有提及驗證隊列,但是并未詳細闡述采用的方法且這些研究均未進行外部驗證,研究的推廣性局限。
這項系統評價共納入14項研究,研究表明目前建立高尿酸血癥風險預測模型正處于蓬勃發展階段,且當前構建的高尿酸風險預測模型具有良好的預測準確性,但是,這些模型的研究尚缺乏校準度和外部驗證,導致目前這些模型存在不同程度的不足,難以在臨床上推廣應用。因此針對未來高尿酸血癥風險預測模型相關研究應仔細考慮當前存在的不足及時進行修正,并且建議研究人員緊跟時代先進的統計技術和嚴格遵守臨床預測模型TRIPOD報告進行設計臨床模型,同時未來期待基于前瞻性隊列研究的高尿酸血癥風險預測的開發和驗證模型,以期為臨床提供質量佳、可推廣的高尿酸血癥風險預測模型。