?

2016—2021年全球結核研究現狀及熱點:基于VOSviewer的可視化分析

2022-04-16 01:57吳利俊王鈺琛張文宏
復旦學報(醫學版) 2022年2期
關鍵詞:結核結核病聚類

李 楊 吳利俊 王鈺琛 應 峻 張文宏

(1國家傳染病醫學中心,復旦大學附屬華山醫院 上海 200040;2上海市傳染病與生物安全應急響應重點實驗室 上海 200040;3復旦大學圖書館 上海 200433;4復旦大學文獻信息中心 上海 200433)

結核病是由結核分枝桿菌感染引起的慢性傳染病。世界上近四分之一的人口、約17億人身上潛伏著結核分枝桿菌感染,一生面臨罹患結核病的風險[1]。2020年全世界估計有990萬例新發結核病患者,因結核病死亡的人數高達150萬[2]。

中國是30個結核病高負擔國家之一,2020年估計有84.2萬例新發結核病患者,占全球總數的8.5%,預計發病率為59/10萬[2]。肺結核作為我國乙類法定報告傳染病,經呼吸道傳播,對公共衛生產生持續威脅。貧困和生活條件惡劣是導致結核病患病的高危因素。而結核病又導致和加劇了不良健康和貧困的循環,給家庭、社區和國家帶來了潛在的災難性社會和經濟后果。

為了應對結核病的嚴峻疫情,聯合國將結核病流行狀況以及如何終止其流行的討論提升至國家元首和政府首腦級別,WHO設定了2030年消除結核病流行的具體目標。目前的結核病發病率離消除流行的目標仍有很大的距離,消除結核病的研究長期進展緩慢。為了推動結核病領域后續研究,本文以結核病高被引論文和熱點論文作為基礎,深入探究國際結核領域科研進展,以可視化形式揭示結核病研究發展趨勢,以期為科研人員、臨床醫師、公眾和政策制定者掌握該病特點和研究現狀提供參考。

為了盡可能納入結核病領域高影響論文和研究,本研究選擇全球最大、覆蓋學科最多的綜合性學術信息資源平臺Web of Science數據庫作為研究工具,該數據庫收錄了自然科學、工程技術、生物醫學等各個研究領域最具影響力的學術期刊,具有較高的代表性和權威性,其用于評價期刊影響力指標的影響因子(impact factor,IF)已成為國際上期刊評價的重要指標。為兼顧文獻計量分析的科學性和數據展示的可視性,本研究選擇了VOSviewer軟件作為文獻數據處理軟件。

資料和方法

數據來源本研究基于Web of Science核心合集數據庫,選擇標題和主題檢索途徑,設置檢索詞為tuberculosis、Koch's Disease和TB,文獻類型為研究論文(article)或綜述(review),文獻索引時間設置為2016年1月1日至2021年11月18日,文獻檢索時間為2021年11月18日。

數據清理將Web of Science核心合集數據庫中的命中文獻以純文本格式導出“全記錄與引用的參考文獻”數據,并導入VOSviewer軟件進行關鍵詞共現的聚類分析,將文獻中的作者關鍵詞提取到Excel表格,針對關鍵詞存在單復數、同義或近義詞、縮寫等情況,通過兩名專業人員分別對關鍵詞進行干預處理,并彼此驗證核實的方式,反復對關鍵詞進行清理,例如將MDR、multi-drug resistance、

multidrug-resistant TB、 multi-drug-resistant tuberculosis、MDR TB、MDR-TB、multidrug resistant tuberculosis等十余個關鍵詞合并為multidrug-resistant tuberculosis,從而保證最終獲得合理、準確的關鍵詞詞頻統計和聚類分析結果。

數據分析InCites數據庫創立于2011年,是基于Web of Science核心合集引文數據所建立的科研評價平臺,涵蓋多個學科,并預設了8個重要文獻計量評價指標,能夠全面深入地分析不同國家/地區、機構、人員和研究領域的科研表現[3]。VOSviewer是一款科學知識圖譜軟件,由荷蘭萊頓大學科技研究中心Van Eck和Waltman研發,能夠在文獻關鍵詞構建共現矩陣的基礎上進行聚類分析,并獲得聚類標簽圖譜,從而以直觀可視的方式展現不同的聚類主題[4]。ESI數據庫高被引論文是領域內高水平論文的代表,被定義為近10年來每個研究領域中被引頻次排名位于前1%的論文。針對高被引論文的具體內容進行挖掘和分析,有助于提煉學科研究的熱點,也能夠指引學科的發展方向[5]。因此,本文以2016—2021年全球結核相關的研究論文和綜述作為樣本數據,基于InCites平臺作為評價工具,并以VOSviewer作為可視化工具,分析本領域的總體發文情況、高被引論文、主要研究國家/地區、重點研究領域,并進行主題聚類分析,再基于主題聚類結果,對領域內高被引論文的內容深入分析,從而凝練出結核領域內近年的研究熱點。

結 果

年度發文情況分析截至檢索時間,共檢索到文獻22 264篇,其中研究論文(article)19 892篇(89.35%),綜述(review)2 372篇(10.65%)。年度發文情況如圖1所示,可以發現2016—2021年期間,全球結核相關研究的發文數量呈相對平穩趨勢,因數據采集時間截至2021年11月18日,故圖中2021年的出版數據比實際數值低。

圖1 2016—2021年結核相關年度發文情況Fig 1 Papers published annually in TB area during 2016-2021

高被引論文分析截至調研時間,獲得本領域ESI高被引論文共77篇,總被引頻次為14 186,篇均被引頻次為184.23,其中作者署名中包含中國機構(包括大陸地區和香港地區)共9篇(11.69%)。全球排名前10位的高被引論文主要信息如表1所示。高被引論文討論內容聚焦在結核病新的治療藥物[6]、結核病及潛伏結核感染疾病負擔[1,7]、深度學習技術在肺結核影像學中的應用[8]、結核感染轉錄組學特征[9]和結核病臨床診治指南。

表1 2016—2021年被引頻次排名前10位的結核相關論文Tab 1 The top 10 most frequently cited papers in TB area during 2016-2021

國家/地區分析由于InCties平臺根據作者所屬機構來標引文獻所屬國家或地區,因此同一篇論文如果存在合作,可能會被標注2個或以上的國家或地區。通過對納入文獻的國家/地區進行統計分析,發現全球共有187個國家/地區有發文貢獻。發文量排名第一的是美國(5 026篇,22.57%),篇均被引頻次12.55,中國大陸地區排名第三(3 116篇,14.00%),但篇均被引頻次僅6.38,相對較低。其他發文量排名靠前的國家/地區見表2。

表2 2016—2021年結核相關發文量排名前20位的國家/地區Tab 2 The top 20 countries/areas in the quantity of publishing TB papers during 2016-2021

重點研究領域分析基于InCites平臺對每篇發文所屬的研究領域進行標記,發現結核相關發文涉及190個領域。發文量排名前10位的研究領域為感染病學,微生物學,免疫學,呼吸病學,公共、環境和職業衛生,藥理學和藥劑學,生物化學和分子生物學,研究與實驗醫學,熱帶醫學,藥物化學(表3)。

基于納入樣本的發文數量、被引頻次和學科規范化的引文影響力分別作為橫坐標、縱坐標以及氣泡大小衡量標準,我們進一步繪制了發文量排名在前20位的研究領域散點圖(圖2),以直觀展示目前具有一定影響力的研究領域??梢姼腥静W、微生物學、免疫學和呼吸病學是目前最有影響力的4個研究領域。中國大陸地區在這4個領域發文量分別為714篇(13.25%)、526篇(13.54%)、441篇(14.78%)和237篇(7.96%),論文的篇均被引頻次分別為6.35、8.25、8.83和7.83。

圖2 2016—2021年發文量排名前20位的研究領域散點圖Fig 2 The scatter diagram of top 20 research areas in the quantity of publishing TB papers during 2016-2021

關鍵詞共現及主題聚類分析用VOSviewer軟件對納入文獻的關鍵詞進行提取和統計,發現共有26 401個關鍵詞。首先篩選出現頻次超過4次以上的關鍵詞,獲得2 872個(10.88%),進一步通過人工干預方式對關鍵詞進行合并等處理,獲得關鍵詞統計頻次結果,排名前20位的主要關鍵詞如表4所示??梢娔投嗨幗Y核病及耐藥結核病頻次排名分列第3和第7,是結核病最受關注的領域。耐多藥結核病不足60%的治療成功率引起全球的持續關注和研究興趣,是目前結核病防控的重點和難點[10]。合并HIV感染、潛伏結核感染在結核病領域亦備受關注。前者是全球極為重要的公共衛生問題,后者是個巨大的結核儲蓄池。據估計,目前全球范圍內有17億結核潛伏感染人群[1]。其他研究熱點包括結核病診斷及治療、兒童結核、以Xpert MTB/RIF為代表[11]的快速分子學診斷、肺外結核等。

表4 2016—2021年間結核相關研究出現頻次排名前20位的關鍵詞Tab 4 The top 20 frequent key words of TB research during 2016-2021

我們進一步選取出現頻次排名靠前的500個關鍵詞進行聚類分析,共獲得10個聚類簇。表5顯示了聚類簇的標簽和總共現頻次(total link strength)。圖3是關鍵詞共現的10個聚類簇的可視化分析結果,在圖中重點標注了其中6個聚類簇,所得不同聚類由不同顏色表示,節點標簽越大表示關鍵詞出現頻次越多,基于聚類結果可以獲得領域內主要研究主題。(1)聚類1#:紅色區域主要圍繞結核病作為一種疾病的相關科學問題,包括診斷、治療、合并癥(如HIV)等,疾病負擔亦是該區域的重要組成部分。準確評估疾病負擔是正確開展消除結核病流行戰略并進行及時調整的先決條件,也是結核病研究的重點方向。因此,該區域突出的關鍵詞還包括中國、南非、印度等結核高負擔國家。(2)聚類2#:綠色區域主要是圍繞結核分枝桿菌的基礎研究,圍繞結核分枝桿菌與巨噬細胞之間相互作用的研究能為有效殺滅結核分枝桿菌和研制新疫苗提供科學依據,亦是重要方向。(3)聚類3#:深藍色區域主要涉及兒童結核和肺外結核病。由于肺外結核臨床診斷十分依賴免疫學技術,因此該聚類中突顯關鍵詞中也包括了評估結核感染免疫狀態的各類技術手段如γ干擾素釋放試驗、結核菌素皮膚試驗等。(4)聚類4#:黃色區域以肺結核為主,關鍵詞包括培養、痰涂片等。(5)聚類5#:紫色區域圍繞耐藥結核病展開,其差強人意的治療成功率不斷刺激新技術和新藥物的發展。因此,突出關鍵詞可看到全基因組測序、貝達喹啉、氟喹諾酮類等。全基因組測序已經從科研領域迅速發展成為臨床實踐中的重要工具,用于指導結核病防控過程中的所有環節:結核病診斷、分子耐藥預測、公共衛生監測等[12]。而貝達喹啉、氟喹諾酮類藥物是近年來耐藥結核病治療的核心藥物[13]。(6)聚類6#:淺藍色區域的聚類標簽為抗結核治療,這部分研究內容一方面與結核病基礎研究(聚類2#)密切相關,同時又服務并指向耐藥結核?。ň垲?#)的研究進展。突出關鍵詞包括分子動力學模擬、分子對接等。

圖3 2016—2021年結核相關研究關鍵詞共現網絡視圖Fig 3 Network view of key words co-occurrence in TB research during 2016-2021

表5 2016—2021年結核相關研究關鍵詞共現聚類簇Tab 5 Co-occurrence analysis of thekey wordsin TB research during 2016-2021

討 論

近年來結核病的防控仍面臨巨大壓力,特別是新冠疫情凸顯了呼吸道傳染病對公共衛生健康的重要性,激發了各國學者新的研究熱情。本文采用文獻計量學的方法對近六年的結核病相關文獻進行分析,總結出該領域近年研究現狀和熱點:

一、從目前結核領域發文特征,可以發現近兩年結核領域研究進度明顯放緩,推測與新冠疫情有關。正如WHO《全球結核報告》所闡述,新冠疫情有可能使結核防控倒退5~10年。事實上,中國在結核病消除上曾經有過驕人成就,在2003年非典型肺炎(SARS)疫情后中國加大了對重大傳染病的防控力度,提前5年超額實現了聯合國千年發展目標(2015年結核病患病率和死亡率在1990年的基礎上下降50%),并從結核病高發病率國家轉變為中發病率國家。而今新冠疫情的流行使得傳染病的控制再次成為重要議題。目前中國的公共衛生安全完全可以與消除結核病工作協同發展,有力實施消除結核病的干預措施,加速實現結核病可持續發展目標。

二、美國、印度、中國大陸地區、英國和南非是全球結核領域發表數量最多的5個國家(地區),其中印度、中國大陸地區和南非是結核病高負擔國家。為加快結核病科學研究進程,需要擴大結核病研究活動范圍并提高其質量,鼓勵不同國家研究人員圍繞需求驅動的研究課題開展協作,并利用高效網絡實現成果和信息共享。

三、結核研究方向包括感染病學、呼吸病學、微生物學、免疫學、公共衛生等多個方向,其中感染病學發文量最多。提示結核病本質仍是結核分枝桿菌感染機體所引起的疾病,且前四個方向在目前仍具有較大影響力,而結核的公共衛生研究未得到足夠關注。呼吁政府相關層面進行結核病防控的資源整合和頂層設計。結核病不僅是臨床疾病,也與多種社會因素高度相關,易引發公共衛生危機,因此迫切需要政府和相關組織在公共衛生領域增加資金投入,創造良好的防治環境。

目前,各類新技術、新工具和新藥物的開發正在蓬勃發展,為補充結核病研發管線作出了巨大努力。然而,要使其服務于公共衛生利益,還需要加大產品后期研究階段的投入,以優化其傳播,轉化為國家政策和現場實踐。因此,我們擬從結核疫苗、潛伏結核管理、診斷、治療四大環節對結核病研究的未來進行展望:

首先,結核疫苗的研發仍需持續推進。推廣COVID-19疫苗接種的初步經驗表明,要快速控制疫情,疫苗與實施策略同等重要。這個經驗同樣適用于防控結核病。針對成人提供有效保護的結核疫苗研發工作已歷盡多年,但大多失敗。目前主要有兩項研究較有前景:一項是針對南非開普敦地區所開展的H4:IC31亞單位疫苗和卡介苗復種的Ⅱb期研究中,對青少年進行卡介苗復種可能保護其免受持續性結核分枝桿菌感染[14];另一項是疫苗M 72/AS01E(葛蘭素史克)的Ⅱ期和Ⅲ期臨床試驗分別證實其良好的免疫原性和安全性,且該疫苗接種后3年內預防從感染到發病的有效率達50%及以上[15-16]。增加主動免疫是減少藥物使用、繼而避免藥物耐藥的重要手段,不能期望依靠一種疫苗解決所有問題。未來不僅需要新的結核疫苗,也需要針對不同年齡、不同疾病背景的接種方案。中國目前結核感染患者以老齡、復發結核為主,因此感染后預防以減少潛伏感染的活動比預防結核感染本身更為重要。另一方面,由于潛伏性結核病感染無法測定感染菌株的藥敏性,使得耐藥性感染的預防性治療變得復雜,而通過疫苗接種或可獲益。

第二,潛伏結核管理仍需加強。目前全球約四分之一人口為潛伏結核患者,對他們的科學管理是全球消除結核病流行的重要組成部分。高風險人群LTBI篩查與預防性治療是2035年消滅結核戰略的重要舉措。WHO推薦在HIV、密切接觸人群等高危人群中進行預防性抗結核治療,但如何平衡預防治療的有效性及藥物相關安全性一直是難題,也是影響患者依從性的重要原因。既往推薦異煙肼單藥治療,但該方案療程較長,藥物性肝損傷等不良反應較多。因此,各大團隊針對如何提出更加有效、安全的結核病預防性治療方案正展開系列研究。相關進展主要為包含利福霉素類藥物的超短程方案出臺。3個月每周一次利福噴丁聯合異煙肼的方案已被廣泛應用[17];4個月利福噴丁的方案被證明療效不劣于6個月異煙肼方案,而安全性更佳[18];短至1個月每日一次利福噴丁聯合異煙肼的方案也正在開展實施,其安全性及有效性都較理想[19]。聯合國制定了2018—2022年5年3 000萬例結核病預防治療目標,相信預防治療方案的不斷改良可以早日實現該目標,大幅度增加全球預防治療的覆蓋率。另一方面,潛伏結核患者的管理需要特別關注重點人群,逐步建立防控合作機制,尤其是加強與艾滋病治療規劃的整合與協作。

第三,如何通過快速分子診斷高效發現結核病例有待優化。結核分枝桿菌分子生物學診斷方法的革新是近十年結核病診斷領域最突出的進展之一。以Xpert MTB/RIF和Xpert MTB/RIF Ultra為代表的快速分子學診斷徹底改變了結核病發現和診斷模式[11]。Xpert MTB/RIF能同時檢測結核分枝桿菌和利福平耐藥(rpoB),不僅結果準確可靠,且 結 果 報 告 時 間 短(通 常<2 h)[20]。Xpert MTB/RIF Ultra是2017年WHO推薦使用的新一代檢測方法,較Xpert MTB/RIF顯著提高痰涂片陰性結核患者和肺外結核的檢出率[21]。數十年以來,結核病確診主要依靠痰涂片和痰培養,前者快速但敏感性不高,后者敏感但耗時太久。而快速分子診斷可以在富有挑戰性的環境中擴大主動發現病例的規模,在與病原體的斗爭中領先一步。這種“早識別、早診斷、早治療”的防控策略與我國新冠疫情防控的成功經驗不謀而合。因此,加快實驗室服務建設,將結核病快速分子檢測整合到疾病控制中將是未來實現終止結核病流行的關鍵環節。

最后,活動性結核病,特別是耐藥結核病的治療困境仍待解決?;顒有越Y核病的治療是結核病防控的核心與基石,也是結核病研究最受關注的領域[6]。目前耐藥結核病治療進展主要體現在兩大趨勢:首先是以縮短療程為導向的治療策略推廣。2010年孟加拉方案出臺,開啟了耐多藥結核病短程治療時代,該方案成功地將療程縮短至9~11個月、治療成功率提高至87.9%[22]。在此基礎上,耐多藥結核病首個短程治療的隨機對照研究——STREAM研究結果于2019年正式出爐,證實9~11個月治療方案在療效和安全性上與20個月長程方案相當[23]。其次,淘汰注射劑的全口服方案成為第二個重要變革。2018年WHO將氟喹諾酮類(fluroquinolones)、利奈唑胺(linezolid)、貝達喹啉(bedaquiline)正式提高到A組核心藥物[24],代表全口服治療時代的到來,長期以來由于備選藥物有限,耐多藥結核病治療離不開漫長的注射劑治療。但隨著貝達喹啉、利奈唑胺、德拉馬尼、PA-824等更多強效殺菌藥物的出現,全口服治療方案得以實現[13]。融合以上兩大趨勢,目前十數個前瞻性臨床研究正在對各種全口服短程方案進行探索,包括Nix-TB 研 究 (NCT 02333799)[25]、 TBPRACTECAL研究(NCT 02589782)、NeXT研究(NCT 02454205)和STREAM研 究(第2階 段)(NCT 02409290)等;在我國,由國家傳染病醫學中心復旦大學附屬華山醫院團隊牽頭的全口服短程方案的隨機對照試驗(TB-TRUST)、首都醫科大學附屬北京胸科醫院主持開展的含貝達喹啉治療耐多藥結核病短程新方案的多中心隨機對照研究等,亦受到國際關注[26]。盡管圍繞耐藥結核病治療的研究較之前有了數量和質量的提升,但高水平臨床研究(隨機對照試驗)仍屈指可數,重要原因之一是研發支出的明顯匱乏。近年來制藥公司在結核病研究和創新方面支出比例逐步下降。因此,有必要將新的資源和供資模式引入結核病研究領域,以建立更廣泛、更多樣化的基礎和平臺;另一方面,應在高負擔國家積極開展實施性研究,以臨床研究形式開展患者管理,并對項目數據進行持續評價,為治療指南的更新提供不斷疊加的證據。

綜上所述,本文針對結核病近六年來的國際研究特征及演化進行了分析,獲得了一定研究成果。本研究局限性在于為了保證數據的規范性,僅檢索了Web of Science數據庫文獻,數據缺乏一定完整性;其次,以英文文獻為數據源,未納入中文文獻等其他非英文文獻,研究成果欠全面。期待未來更多研究整合不同國家英文及非英文文獻結果,總結各國自身結核病研究特點,提出符合各國自身國情的結核病防控策略。

結核病在我國負擔之重、情況之復雜不亞于新冠肺炎。但作為一類呼吸道傳染性疾病,結核病與新冠肺炎一樣,遵循流行病學的基本規律。想要實現2030年前實現全球終止結核病流行的目標,只有大幅擴展工作,并形成可持續發展機制,從多個環節合力推動政策改革和實施。

作者貢獻聲明李楊 數據整理,前沿分析,論文撰寫。吳利俊 文獻查閱,數據分析,論文撰寫。王鈺琛 數據查閱,論文撰寫。應峻 研究設計,數據分析指導,論文修改。張文宏 研究設計和指導,論文修改。

利益沖突聲明所有作者均聲明不存在利益沖突。

猜你喜歡
結核結核病聚類
一種傅里葉域海量數據高速譜聚類方法
艾滋病合并結核病的診斷和治療
生命至上 全力投入 終結結核
貴州省結核病定點醫院名單
基于數據降維與聚類的車聯網數據分析應用
個性化護理對結核患者肺結核知識知曉率的影響
基于模糊聚類和支持向量回歸的成績預測
長得丑?但價值無限!
背上長“包”,小心結核作怪
為什么全球結核病人數增多
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合