?

全球心血管疾病學術影響力評價(CAPE)體系的方法探索

2024-02-02 11:25尹潞張雪燕曹也丁李衛姚焰薄致遠魏良蔡軍楊進剛胡盛壽
中國循環雜志 2024年1期
關鍵詞:影響力醫療機構心血管

尹潞 張雪燕 曹也丁 李衛 姚焰 薄致遠 魏良 蔡軍 楊進剛 胡盛壽

目的:構建全球心血管疾病學術影響力評價(Cardiovascular Academic Performance Evaluation,CAPE)體系,并對全球醫療機構心血管疾病學術影響力進行排名。

結論:CAPE 項目基于2016~2022 年多源數據基礎,首次探索建立了心血管領域機構學術影響力綜合評價指標體系。

近年來,生物醫學研究發表論文數量迅猛增加;1997~2016 年,PubMed 收錄的論文數量已翻倍,雖然有一定數量的針對單病、單藥或單種治療措施開展的文獻計量研究[1-4],但尚缺乏針對學科、亞學科領域的論文計量分析和進一步數據挖掘。目前國際上醫學學科評價大多基于Web of Science(WOS)數據庫及其學科分類體系,存在數據來源單一、學科細分不準確、數據清洗不足(主題、機構、作者的規范性差)等缺陷,且在評價過程中醫學領域專家只進行指標權重制定,在檢索策略、質量控制等方面參與度極低,導致評價結果在具體學科及亞學科中參考價值有限。為進一步提升心血管學科建設水平[5],本研究首次建立心血管學科術語詞表及學術影響力綜合評價指標體系,對同行評議的學術期刊發表研究論文進行量化對比,描述中國在全球心血管疾病領域及其臨床亞學科所處的地位和發展態勢,并結合國家自然科學基金項目、授權發明專利、國家級獲獎成果、科研平臺、注冊試驗等數據,對中國醫療機構心血管疾病科技影響力進行評價,以推動中國心血管疾病研究事業的健康發展。

1 資料與方法

1.1 數據庫選擇和檢索范圍

1.1.1 論文

本研究數據來源于PubMed、WOS 和Scopus 數據庫,檢索完成后對3 個數據庫的心血管論文收錄情況進行比對。檢索范圍為:(1)發表時間2016 年1 月1 日至2022 年12 月31 日;(2)論文撰寫語言為英文;(3)論文類型包括論著、綜述、病例報告、短篇報道等;排除學位論文、大會摘要、專利類論文、書籍、報告、新聞類出版物等。

PubMed、WOS 和Scopus 收錄范圍及功能特點各有不同[6-7]:(1)PubMed 是全球公認的專注醫學生命科學相關領域的論文數據庫,收錄期刊20 000余種,生物醫學論文超過3 400 萬篇,每周更新,使用美國國立醫學圖書館編制的《醫學主題詞表》(MeSH)術語體系,在術語規范、樹狀結構、分類體系等具有優勢,與國際臨床試驗注冊中心(ClinicalTrials.gov)、F1000、指南等數據關聯性更優,論文類型標注也更優;(2)WOS 收錄期刊包括自然科學、工程技術、生物醫學、社會科學、藝術與人文等領域高質量期刊24 000 余種,其中醫學生命科學類約12 000 余種,以提供期刊影響因子、多學科領域期刊引證報告(JCR)分區、被引頻次、基本科學指標數據庫(ESI)高被引論文等相關數據而著稱;(3)Scopus 收錄了超過30 000 余種期刊,醫學與生命科學期刊約12 000 種(占比41%),是目前全球規模最大的摘要和引文數據庫,檢索指標也較多元化,如論文指標、研究者指標、引用分類等,供用戶從研究論文、期刊、研究者等不同角度評估論文與期刊的影響力以及研究的學術產出。

1.1.2 國家自然科學基金項目

考慮近年學科交叉融合的趨勢,本研究采集2016 年1 月至2022 年12 月國家自然科學基金醫學科學部全庫、生命科學部全庫及宏觀管理與政策項目數據,包括重點項目、重大研究計劃、面上項目、聯合項目、專項基金、青年項目等項目類型。

1.1.3 發明專利

本研究采集2016 年1 月至2022 年12 月國家知識產權局中國心血管相關發明專利數據。

1.1.4 獲獎成果

本研究采集2016 年1 月至2022 年12 月心血管相關獎勵成果數據,范圍包括:(1)國家科學技術獎(國家最高科學技術獎、國家自然科學獎、國家技術發明獎、國家科學技術進步獎、中華人民共和國國際科學技術合作獎);(2)中華醫學科技獎;(3)高等學??茖W研究優秀成果獎。

1.1.5 科研平臺

本研究采集2016 年1 月至2022 年12 月國家衛生健康委員會、科技部等機構公布的心血管相關科研平臺數據,范圍包括國家醫學中心、國家臨床醫學研究中心、全國重點實驗室、教育部重點實驗室、國家衛生健康委員會重點實驗室、科技部國際合作基地等。

1.1.6 注冊試驗

本研究采集2016 年1 月至2022 年12 月國家藥品監督管理局藥品審評中心(CDE)心血管相關藥物臨床試驗登記數據。

1.2 檢索策略

1.2.1 心血管學科術語詞表的建立

為了全方位揭示心血管學科的發展趨勢,本研究對論文、專利等數據主題特征進行分析和量化,并建立心血管術語詞表。國際上常用的醫學術語詞表有:(1)應用于臨床、病歷、知識本體的國際疾病分類(ICD)、醫學系統命名法-臨床術語(SNOMED-CT)等;(2)應用于自然語言處理的一體化醫學語言系統UMLS 等;(3)應用于論文檢索的醫學主題詞表,如MeSH、Embase 主題詞表(EMtree)等。MeSH 是醫學領域論文檢索和論文主題特征標引的權威詞表,是以主題概念為基礎建立的關聯組類詞表,分為解剖、組織疾病、化學與藥物、現象與過程等16 個分類,其樹狀結構表在主題概念包含關系區分上具有優勢,但并不能直接應用于學科分類。目前各學科交叉融合趨勢明顯,聯系越來越緊密,學科之間的主題界限已不再涇渭分明。有些論文可能被歸類至其他類別中,如心血管疾病基礎類研究,或與心血管疾病密切相關的交叉領域,如糖尿病、腎臟疾病等。另外,MeSH 由美國編制,由于中美兩國文化及臨床學科設置差異,且存在新研究主題尚未更新加入詞表的情況,因此僅依靠MeSH 已無法滿足臨床亞學科劃分和評價的需求。

本研究借鑒MeSH 的主題詞(規范化的詞或詞組)和入口詞(MeSH 收錄主題詞的同義詞或近義詞)映射模式,由醫學專業人員和圖書情報人員提取MeSH、EMtree、中文醫學主題詞表、ICD-10、ICD-9-CM 中的心血管疾病相關術語,由各臨床亞學科領域專家進行認領,補充對應入口詞(包括MeSH 入口詞、醫生新增的自由詞、醫學縮略語等),經專家組討論通過,最終形成心血管學科的術語詞表(即阜外詞表),并確定亞學科與主題詞/入口詞的映射關系,同時建立國家自然科學基金學科代碼、國際專利分類(IPC)與心血管亞學科對應詞表。共納入主題詞1 010 個、入口詞9 537 個,其中9 個亞學科(缺血性心臟病、高血壓、血管疾病、心律失常、肺血管疾病、心力衰竭、先天性心臟病、心肌病和瓣膜性心臟?。?映射主題詞563 個、入口詞5 501 個,直接映射亞學科的入口詞(前后綴)134 個;無法直接歸類到具體亞學科的心血管相關主題詞447 個。

1.2.2 數據庫建立

論文數據采用主題詞和入口詞檢索,同時匹配題名、學者、學者機構、數據來源、摘要、關鍵詞、主題詞、數字對象唯一標識符(DOI)、全文鏈接等信息,并經過元數據去重融合;專利數據采用入口詞及IPC 分類進行檢索,課題數據、平臺數據、注冊試驗數據采用入口詞檢索。采集相應數據,建立主索引,分別建立心血管??普撐膸?、國家自然科學基金課題庫、心血管專利庫、心血管獎勵成果庫、心血管科研平臺庫、心血管藥物注冊試驗庫等。

1.2.3 學科歸類和亞學科劃分

結合心血管術語詞表,對論文中主題詞、題目、關鍵詞、摘要等4 個位置的內容進行檢索匹配,生成論文“位置-心血管術語詞-頻次”的信息表,計算心血管學科相關度積分及亞學科積分。規則如下:(1)主題詞匹配:主要主題詞標記為10 分,次要主題詞標記為7 分;(2)題目和關鍵詞匹配:題目匹配標記為5 分,關鍵詞匹配標記為4 分;(3)摘要匹配:上述無法匹配的論文采用摘要匹配,每次標記1 分。

心血管“強相關”論文被定義為:心血管學科相關度積分≥4 分或篇名、關鍵詞含有心血管通用詞(如heart、electrocardiogram 等),且不含有腦血管疾病主題詞;否則定義為“弱相關”論文。心血管學科相關度及亞學科分類流程見圖1。

圖1 心血管學科相關度及亞學科分類流程圖

國家自然科學基金課題亞學科分類采用學科代碼+心血管術語詞表匹配(標題、關鍵詞2 個位置);專利亞學科分類采用IPC 分類+心血管術語詞表匹配(標題、關鍵詞、摘要3 個位置);注冊試驗數據亞學科分類采用心血管術語詞表匹配(標題、適應證、關鍵詞3 個位置);生成“位置-心血管術語詞-頻次”的信息表,計算心血管學科相關度積分及亞學科積分。心血管“強相關”數據被定義為:學科積分>0 分或標題等含有心血管通用詞(如heart、electrocardiogram 等),且不含有腦血管疾病主題詞;否則定義為“弱相關”數據??蒲衅脚_及獲獎成果的亞學科分類采用人工完成。

1.2.4 論文國別(地區)和署名機構歸一

目前一些國際期刊對論文的作者和機構書寫規范沒有明確要求,存在大量的同一機構英文表達不同、不同機構英文表達相同、機構合并拆分及歷史名稱變遷、作者所屬機構與上級機構同屬一個機構體系等現象,已成為文獻計量領域的全球性難題。本研究判定論文國別(地區)和歸屬機構時,以第一作者和通信作者(包括共同通信作者)為準;當第一作者的署名機構不止1 個時,也以第一署名機構和國別(地區)為準。以2016~2022 年全球心血管疾病領域論文總數做聚類排序,保留作者署名機構中含Hosp 或Clinic 的醫療機構,將全球前100 家醫療機構和全國前200 家醫療機構進行了機構歸一。首輪數據清洗完畢后,中國醫學科學院阜外醫院組織各學科領域專家針對心血管疾病領域綜合排名和九大亞學科排名展開論證和評估,補充了27 家亞學科具有全球影響力但不足以在心血管疾病全領域排名靠前的醫療機構,共同納入機構歸一,從而為全球百強和全國百強排名提供精準數據支撐。

1.2.5 作者歸一

相對于機構歸一,作者歸一更為復雜,特別是中國作者,同名同姓不同人、同音不同人、同人不同英文表達、同名同姓同院不同人、同人不同院等復雜情況也給作者歸一造成了難度。本研究基于英國人類學家Radcliffe-Brown 提出的社會網絡分析理論[8]進行歸一建模,如一位學者的研究團隊成員及科研合作對象是相對穩定的,其發表的科研成果“論文”的署名作者群體也就相對穩定。也就是說,如果我們能夠確定學者的合作者網絡,就可以精確定位學者本身,而且能夠確定學者的唯一性和學術遷移軌跡?;谠摾碚摎w一算法,將國內學者進行歸一處理,且進一步衍生到國際學者。

1.2.6 其他數據源的機構歸一

為了方便不同數據源的信息整合和機構匹配,按照1.2.4 所述方法建立的機構歸一字典表,進行國家自然科學基金項目(匹配依托單位)、授權發明專利(匹配第一專利權人、第一專利權人地址)、國家級獲獎成果(匹配獲獎單位)、科研平臺(匹配依托單位)、注冊試驗(匹配申辦單位、試驗機構)的機構歸一。由于部分國家自然科學基金項目依托單位只填寫所屬大學,本研究結合作者歸一字典表,將數據精確到其所屬醫院。

1.3 論文數據庫質量評價

本研究論文數據庫質量評價分三步:(1)采用年份分層隨機抽樣的方法,從全庫中共抽取700 篇論文,核對第一作者國別(地區)和機構名稱、通信作者國別(地區)和機構名稱、是否存在漏標等情況,計算錯誤率,并根據錯誤類型調試程序,更新全庫;(2)從被標記心血管“弱相關”論文數據庫編程將論文標題和作者關鍵詞字段打散做聚類分析,進一步挖掘潛在心血管漏標詞匯,并匯總反饋迭代,更新全庫;(3)將各亞學科數據庫發送各學科負責人,組織專業領域團隊核對亞學科歸類的準確性,從而進一步細化和調整各亞學科分類規則。完成上述三步后,經編程迭代優化全庫后,再次重復上述質量評價的三步操作后,評估更新后數據的準確度等指標。最終根據最新庫將全庫劃分為“強相關”論文庫和“弱相關”論文庫,所有統計分析均基于“強相關”論文庫。

1.4 全球醫療機構學術影響力綜合評價體系的建立

在評價全球醫療機構學術影響力時,現有評價體系均只基于學術論文的發表情況,且僅納入發文總量、累積影響因子、累積被引頻次等常見指標,也并未公布內在算法規則[9-11]。很多指標采集困難也給綜合評價體系的構建帶來了挑戰。為了更加全面地對醫療機構的學術影響力進行評價,本研究對同行評議論文、論文的高被引情況、論文被心血管領域的國際指南引用情況以及是否有臨床試驗支撐進行綜合考慮,因此采集了F1000 標引論文、ESI高被引論文、JCR 分區及影響因子、被引頻次、中國科學院分區、美國心臟協會(AHA)/美國心臟病學會(ACC)/歐洲心臟病學會(ESC)指南被引論文、ClinicalTrials.gov 注冊臨床研究等相關數據庫的指標數據。

本研究將英文原創研究論文作為全球醫療機構排名的數據基礎,以第一作者和通信作者署名機構發表的科研成果為統計基礎,若一位作者出現多個署名機構時,以第一個署名機構為準,具體學術影響力指標體系構建步驟如下:(1)利用2020~2022 年心血管領域“強相關”原創研究論文搭建指標體系;(2)當第一作者、共同通信作者出現多家機構時,第一作者機構占二分之一,所有共同通信作者機構平攤另外二分之一;(3)選取15 項可用于評價論文影響力的指標(表1),按歸一后的醫療機構整理不同醫療機構2016~2022 年間各項指標的數據庫;(4)為了消除量綱和數量級影響,將原始數據進行標準化,將其轉化為均值為0、方差為1 的無量綱數據;(5)邀請部分國家心血管病專家委員會委員針對綜合評價指標體系的指標選取和權重投票和打分;(6)根據投票結果,排除了3 項指標,其余12 項指標均納入,但F1000 標引論文和ESI 高被引論文合并,最終共納入11 項單項指標,構建成綜合指標評分(表2),從而建立全球醫療機構心血管疾病學術影響力評價(Cardiovascular Academic Performance Evaluation,CAPE) 體系,用作全球醫療機構排名的數據依據。

表1 可用于評價論文影響力的指標

表2 全球醫療機構心血管疾病學術影響力評價指標體系和權重的設定

1.5 全國醫療機構心血管疾病科技影響力綜合評價體系的建立

在評價中國醫療機構心血管疾病科技影響力時,除原創英文論文外,本研究增加了5 個方面的評價指標,包括國家自然科學基金課題、有效授權專利、國家級成果、國家級平臺、CDE 藥物臨床試驗等。在權重分配方面,論文占0.60,其中論文各單項指標按上述比例等比例縮小,其余0.40 分配給其他科技產出,課題、專利、成果各占0.10,平臺和CDE 藥物臨床試驗各占0.05(表3)。

2 結果

2.1 數據庫收錄心血管數據情況

2.1.1 論文

本研究共檢索到2016~2022 年心血管領域論文1 545 103 篇,其中來自PubMed、WOS、Scopus的論文分別有1 111 666 篇、1 424 267 篇、801 908篇,三者重疊率為43.2%。另外,23.5%的論文同被PubMed 和WOS 收錄,但并未被Scopus 收錄;4.3%的論文同時被WOS 和Scopus 收錄,但并未被PubMed 收錄;0.9%的論文同時被PubMed 和Scopus收錄,但并未被WOS 收錄(圖2)。

圖2 三個數據庫檢索到的心血管領域論文重疊情況

剔除摘要、書籍、傳記、新聞、視頻、音頻、撤稿、更正聲明等文獻后,剩余1 178 019 篇,使用阜外詞表在論文標題、主題詞、關鍵詞、摘要中標引共518 058 篇“強相關”論文,完成全球前100 家醫療機構和全國前200 家醫療機構歸一論文(含原創研究、綜述、病例報告等)共107 110 篇,最終用于全球醫療機構心血管疾病學術影響力排名的原創研究論文共81 274 篇(圖3)。

圖3 2016~2022 年全球心血管領域論文數據庫清理流程圖

2.1.2 國家自然科學基金課題

本研究共采集2016~2022 年國家自然科學基金課題醫學科學部批準課題73 125 項、生命科學部批準課題47 775 項、管理科學部批準課題14 132項,通過標題和關鍵詞檢索標注心血管相關課題共11 143 項,其中4 405 項來自于循環系統,其余6 738 項均來自其他二級分類。在醫學科學部課題分類中,心血管領域的課題比重僅為14.1%。

2.1.3 發明專利

本研究通過IPC 分類、專利標題-關鍵詞-摘要檢索標記2016~2022 年心血管相關專利共169 094項,其中授權發明19 382 項、發明申請84 816 項、實用新型57 514 項、外觀設計7 382 項。排除以公司和個人名義申報的專利后,剩余36 600 項專利,其中授權發明2 730 項、發明申請11 844 項、實用新型21 369 項、外觀設計657 項。

2.1.4 獲獎成果

本研究采集2016~2022 年國家最高科學技術獎10 項,無一項與心血管相關;國家自然科學獎1 283項,僅1 項為心血管相關成果;國家技術發明獎236項,無一項與心血管相關;國家科學技術進步獎668項,其中11 項為心血管相關成果;中華人民共和國國際科學技術合作獎36 項,無一項與醫學相關;中華醫學科技獎628 項,其中69 項為心血管相關成果;高等學??茖W研究優秀成果獎1 254 項,其中22 項為心血管相關成果。

2.1.5 科研平臺

本研究采集國家醫學中心13 個,僅1 個為心血管相關平臺;國家臨床醫學研究中心50 個,其中2 個為心血管相關平臺;全國重點實驗室607 個,其中3 個為心血管相關平臺;教育部重點實驗室450個,其中6 個為心血管相關平臺;國家衛生健康委員會重點實驗室109 個,其中9 個為心血管相關平臺;科技部國際合作基地642 個,其中3 個為心血管相關平臺。

2.1.6 注冊試驗

本研究共采集2016~2022 年CDE 心血管相關藥物臨床試驗登記數據2 084 項,其中I、Ⅱ、Ⅲ、Ⅳ期試驗分別有226 項、85 項、129 項、21 項,1 623 項試驗歸為其他,96.5%為等效性試驗,故心血管試驗藥物多為仿制藥。

2.2 論文質量評估

共隨機抽取700 篇論文。第一作者國別(地區)歸一共700 篇,國別(地區)錯誤31 篇,正確率為95.6%;通信作者國別(地區)歸一共643 篇,錯誤標記52 篇,正確率為91.9%;85 篇論文完成第一作者機構歸一,經人工核對僅3 篇機構歸一錯誤,正確率96.5%;通信作者完成機構歸一72 篇,其中4 篇錯誤,正確率為94.4%。經編程迭代優化后,再次隨機抽取700 篇論文進行質量評估,上述4 種情況的正確率分別提升至96.3%、99.7%、98.7%、和98.3%。

在“弱相關”庫(即相關度積分<4 分)中,在篇名和關鍵詞中檢索心血管通用詞匯,共發現137 個漏標詞匯。經編程迭代優化后,隨機抽取500 篇論文,未再發現漏標心血管詞匯。將用于亞學科排名的論文數據庫發給各亞學科負責人,經各團隊篩選確認后,調整各亞學科標記規則,從而經編程迭代優化數據庫。

2.3 全球排名前十國家的論文發表情況比較

按第一作者國別(地區)進行統計發現,2016~2022 年,中國共發表心血管領域研究論文約7.68 萬篇,僅次于美國(約11.41 萬篇),且7 年間增速明顯高于美國(123.5% vs. 17.9%,P<0.01),其他國家的論文數量增幅不明顯(圖4)。7 年間中國在累積影響因子方面增速達260%,美國則基本平穩,但2022 年有所下滑(圖5)。中國JCR 分區和中國科學院分區論文占比均僅居世界第八位(圖6)。

圖4 2016~2022 年全球排名前十國家心血管論文總數的變化趨勢

圖5 2016~2022 年全球排名前十國家心血管論文累積影響因子的變化趨勢

圖6 2016~2022 年全球排名前十國家的期刊引證報告(JCR) 和中國科學院分區論文占比

2.4 全球醫療機構心血管疾病學術影響力綜合排名

綜合原創研究論文11 項指標,對全球前100家醫療機構進行排名。結果顯示,在2020~2022 年全球醫療機構心血管原創研究論文影響力綜合排名中,前三名均來自美國,分別為美國布萊根婦女醫院、美國梅奧診所、美國麻省總醫院;僅2 家中國醫療機構進入前20 名,為中國醫學科學院阜外醫院和復旦大學附屬中山醫院,分別位居全球第4名和第15 名(表4)。本研究針對9 個心血管亞學科也對全球前30 家醫療機構進行了排名,我國醫療機構在排名上均有所表現(見本刊官方網址www.chinacircnlation.org 電子版附表1~9)。

表4 2022 年度全球醫療機構心血管疾病原創研究論文影響力綜合排名(前100 名)

2.5 中國醫療機構心血管疾病科技影響力綜合評價排名

綜合論文、課題、專利、成果、平臺、CDE 藥物臨床試驗等多項產出,對中國前100 家醫療機構進行排名。

結果顯示,在2020~2022 年中國醫療機構心血管疾病科技影響力綜合排名中,前五名分別為中國醫學科學院阜外醫院、復旦大學附屬中山醫院、四川大學華西醫院、中國人民解放軍總醫院、首都醫科大學附屬北京安貞醫院(表5)。

表5 2022 年度中國醫療機構心血管疾病科技影響力綜合排名(前100 名)

3 討論

本研究首次采集PubMed、WOS 和Scopus 三個國際知名論文數據庫的心血管論文,并增加F1000標引論文、ESI 高被引論文、JCR 分區和影響因子、被引頻次、AHA/ACC/ESC 指南被引論文等指標。為了更全面地評價全球醫療機構的學術影響力,除了考慮論文數量指標,CAPE 項目組經過多次討論并邀請國家心血管病專家委員會專家針對15 項單項指標進行投票和打分,最終選出11 項指標構建綜合評價指標體系且設定了相應的權重,從論文質量、論文數量、學術影響力和學科覆蓋度四個維度,以2020~2022 年原創研究論文為基礎,首次公布全球醫療機構心血管疾病學術影響力百強排名,其中7家中國醫療機構已躋身前30 名。另外針對9 個心血管亞學科也進行了前30 名排名,我國醫療機構在排名上均有所表現。在國內醫療機構心血管疾病科技影響力綜合排名中,除了論文,CAPE 還增加了國家自然科學基金課題、專利、獎勵成果、科研平臺、CDE 藥物臨床試驗等多項科技產出指標。

首先,心血管疾病專業術語庫、字典庫的建立和更新是心血管疾病研究資源平臺的數據質量保障。本研究建立了心血管術語詞表,實現了醫學術語、入口詞、亞學科三者的映射關系,在論文主題特征標引和亞學科分類過程中起到了重要作用。PubMed 利用MeSH 對論文進行主題標引,標引率約為80%,存在標引時間滯后、次要主題標引不全等缺點,不利于交叉學科知識的發現。本研究由國家心血管中心專家完善更新了心血管學科主題詞及入口詞,內容涵蓋心血管疾病、解剖學、檢驗檢查、生理現象、手術、儀器設備等,并以此為基礎按照相應規則進行自動主題標引,有效避免了上述缺點,并實現了符合中國臨床特點的心血管亞學科分類,為學科評價提供了保障。

其次,心血管疾病專業術語庫、字典庫的應用需要規則算法的協同。本研究規范了元數據標準、數據采集標準,創新性地提出了基于心血管術語詞表的論文主題特征標引規則及亞學科分類規則。在論文主題特征標引中,本研究突破既往基于題錄數據中主題詞、關鍵詞的簡單計量分析,而基于主題詞、關鍵詞、題目、摘要不同位置詞頻,并通過人工驗證不斷調整算法,可有效避免漏掉次要概念,更有利于心血管交叉學科知識的揭示。在心血管亞學科分類中,分別由9 個亞學科的醫學專家團隊參與,制定合理的學科規則,包括入選和排除規則以及交叉學科分類規則。例如高血壓亞學科主題詞hypertension,需要排除肺動脈高壓(pulmonary arterial hypertension)、門靜脈高壓(portal hypertension)、腎性高血壓(renal hypertension)、顱內高壓(intracranial hypertension)等。一篇論文同時具有高血壓、心律失常、心力衰竭、心肌病的主題概念,按照相關度算法排序包含80%主題概念的標準,可標記多個亞學科分類。

再次,本研究在數據清洗歸一階段建立了機構字典庫和作者唯一標識符映射表字典庫。國內基于論文計量研究熱點、學科評價體系的研究較多,但由于作者機構名稱及作者姓名的不同表達方式,通過字符串算法無法達到歸一的效果,嚴重影響結果的準確性。本研究以150 萬檢出數據為基礎,采用合作者網絡、模糊匹配等算法,并結合人工驗證,建立機構字典庫和作者唯一標識符映射表字典庫,經質量評價準確率可達95%以上。

最后,機構歸一為全球心血管疾病學術影響力綜合排名提供了重要支持。本研究突破單項指標進行醫療機構排名和同行評議等主觀評價的局限性,綜合多項客觀指標并根據國家心血管病專家委員會投票的方式設置每個單項指標所占權重,為選出全球心血管疾病學術影響力前100 家醫療機構提供了堅實的數據基礎。該綜合指標不僅考慮了論文發表數量、累積影響因子、被引頻次等常見評價指標、還引入ESI 高被引論文、F1000 標引論文、AHA/ACC/ESC 指南被引論文、JCR Q1 分區論文數量,ClinicalTrials.gov 注冊、亞學科覆蓋度等高端指標。

本研究的不足及未來研究方向:(1)機構及個人的學術影響力評價,需要納入更多的數據源,例如課題基金、專利、臨床試驗注冊等,但各國國情不同,尤其是課題基金含金量量化標準等還需要進一步研究。本課題組已開展國家自然科學基金和科技部課題、專利、獎勵、平臺等數據清洗,但僅適用于國內醫療機構綜合評價排名。(2)根據可利用數據資源和專家討論法,考慮納入11 項單項指標構建綜合指標體系,隨著項目的推進和展開,會考慮納入更多高端指標,例如ESI 高被引頻次、累積他引頻次、累積自引頻次、院士引用頻次等。(3)雖然目前指標構建以專家投票為準,但隨著項目的推進、更多領域專家的加入以及人工智能等更為先進的統計和算法技術的發展,該綜合指標體系的構建仍有提升空間。(4)需要不斷更新心血管術語詞表,并根據中國臨床特點完善心血管亞學科設置,并調整相應規則算法,例如增加融合ICD等醫學字典的術語。(5)需要加快資源平臺建設,讓更多的心血管專家學者獲益,在使用中不斷完善相應功能。(6)本研究聚焦心血管疾病的臨床研究和醫療機構排名,并沒有將國內外大學或研究機構納入數據清洗歸一范圍。

隨著信息技術的飛速發展,多源的醫學信息獲取已不存在瓶頸,但各個資源平臺難以實現數據融合,無法進行??祁I域的高效內容特征揭示,急需建立醫學???專病信息資源門戶,以高質量論文為基礎,依靠領域專家輔助建成的心血管疾病術語體系,按??疲ㄅR床亞學科)對論文進行分類分析和挖掘,為??频膶W科熱點、前沿發現、領域科學研究提供支撐。本研究充分利用國家心血管病中心領域專家優勢,通過醫學信息檢索、異構數據整合、數據清洗融合等技術,建立心血管論文數據倉庫,打造全球心血管疾病研究資源平臺,實現基于9 個臨床亞學科的知識發現、學術影響力評價、前沿熱點揭示等功能,進一步推動中國心血管疾病研究事業的健康發展。

利益沖突:所有作者均聲明不存在利益沖突

全球九大心血管亞學科原創研究論文影響力綜合評價排名

依據全球心血管疾病學術影響力評價(Cardiovascular Academic Performance Evaluation,CAPE)體系統計及評選,基于阜外詞表亞學科標引規則,在全球九大心血管亞學科原創研究論文影響力綜合評價排名(前30 名)中,我國醫療機構在數量和名次上均表現不俗,包括缺血性心臟?。ǜ奖?)、高血壓(附表2)、血管疾?。ǜ奖?)、心律失常(附表4)、肺血管疾?。ǜ奖?)、心肌?。ǜ奖?)、心力衰竭(附表7)、先天性心臟?。ǜ奖?)和瓣膜性心臟?。ǜ奖?)。

附表1 2022 年度全球醫療機構缺血性心臟病研究學術影響力綜合排名(前30 名)

附表2 2022 年度全球醫療機構高血壓研究學術影響力綜合排名(前30 名)

附表3 2022 年度全球醫療機構血管疾病研究學術影響力綜合排名(前30 名)

附表4 2022 年度全球醫療機構心律失常研究學術影響力綜合排名(前30 名)

附表5 2022 年度全球醫療機構肺血管疾病研究學術影響力綜合排名(前30 名)

附表6 2022 年度全球醫療機構心肌病研究學術影響力綜合排名(前30 名)

附表7 2022 年度全球醫療機構心力衰竭研究學術影響力綜合排名(前30 名)

附表8 2022 年度全球醫療機構先天性心臟病研究學術影響力綜合排名(前30 名)

附表9 2022 年度全球醫療機構瓣膜性心臟病研究學術影響力綜合排名(前30 名)

猜你喜歡
影響力醫療機構心血管
“心血管權威發布”公眾號簡介
COVID-19心血管并發癥的研究進展
天才影響力
黃艷:最深遠的影響力
醫生集團為什么不是醫療機構?
lncRNA與心血管疾病
胱抑素C與心血管疾病的相關性
3.15消協三十年十大影響力事件
傳媒不可估量的影響力
醫療機構面臨“二孩”生育高峰大考
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合