?

美國食品藥品監管大數據實踐簡介及對我國的啟示

2017-06-02 00:33楊依晗王廣平高惠君
上海醫藥 2017年9期
關鍵詞:信息公開大數據

楊依晗+王廣平+高惠君

摘 要 數據資源將為監管創新、產業創新提供極大的動力,數據開放成為食品藥品安全社會共治的基礎。本文基于美國食品藥品監督管理局(FDA)的大數據信息化基礎、共享平臺——“開放FDA”(openFDA)以及應用實踐的分析,提出我國食藥監管政府大數據應用對策,包括完善數據庫基礎建設、提升信息公開力度、擴大數據開發主體和挖掘企業行業數據等。

關鍵詞 數據開放 信息公開 大數據 食品藥品管理局

中圖分類號:R951 文獻標識碼:C 文章編號:1006-1533(2017)09-0060-06

Brief introduction on big data practice of FDA and its enlightenment to China

YANG Yihan*, WANG Guangping, GAO Huijun

(Shanghai Institute for Food and Drug Safety, Shanghai 200233, China)

ABSTRACT Data resources would provide a great driving force for both regulatory and industrial innovation, and data open to the public will become a basis of social co-governance for food and drug safety. Based on research of the foundation of big data of FDA (Food and Drug Administration), the sharing platform — openFDA and the data application, some strategies for the big data application in food and drug supervision in our country were proposed in this paper, including the infrastructure of database, the improvement of the scale of information disclosure, the expansion of the main body of data development and the data mining in the industry and enterprise and so on.

KEy WORDS data open; information disclosure; big data; Food and Drug Administration

當今世界,新一代信息技術與經濟社會各領域的深度融合,我國政府提出信息化與工業化融合。數據資源以其預測、決策等方面的推動作用,將有效地提高社會的生產力和監管水平,為監管創新、產業創新提供極大的動力,并成為食品藥品安全社會共治的基礎。2009年以來,美國政府開展了“政府大數據計劃”,美國食品藥品監督管理局(Food and Drug Administration, FDA)逐步向社會開放醫療和健康方面的大數據,為數據開放提供各種便利。2014年6月2日,FDA實現其重要的公共數據開放項目“開放的FDA”(openFDA)。本文通過分析FDA食品藥品大數據戰略以及大數據應用實踐,以期為我國食藥監管政府大數據開發、提高監管有效性提供決策參考。

1 美國食品藥品監管大數據信息化基礎

美國的政府信息公開工作具有起步早、數據多、深度開放等特點,在大數據的開發利用方面具有優勢。大數據管理的規范化、標準化是大數據開發利用的前提。明確工作職責,建立標準化數據庫,保證數據的完整性,以確保大數據戰略順利實施。

1.1 數據信息專業團隊的建立

美國FDA的信息管理源于國家對信息資源管理的頂層設計,具有起步較早、高度重視、數據與信息技術工作相分離、充分借助第三方力量的特點。為確保信息技術的獲得和信息資源的有效管理以及推進大數據的使用,1998年FDA設立了首席信息官(Chief Information Officer)[1],2013年任命首位首席健康信息官(Chief Health Informatics Officer)[2],2015年成立健康數據辦公室(Office of Health Informatics)[3]。健康數據辦公室的工作是和常規信息化工作相分離的,FDA原有的信息管理和技術辦公室仍然負責常規信息化系統的運維。

FDA的很多數據項目的啟動和維護都依托于第三方的數據信息服務。如:在openFDA項目前期準備階段,FDA聯合Iodine公司建立openFDA項目上傳數據和應用程序接口。在項目發布以后,FDA繼續與該公司合作,加強數據結構和數據來源,開發數據訪問工具[4]。

1.2 數據信息的基礎建設

符合大數據特征的數據集是大數據的應用前提。在數據集的建立過程中,大量紙質材料的電子化是數據庫建立的一大阻礙。如:FDA不良事件報告系統(the FDA Adverse Event Reporting System,FAERS)中有9萬份手工填寫的紙質文件。FDA利用數據提取技術將其轉為設備可讀的數據集,這樣的轉化成本是使用人力識別的1/8,而準確率高達99%[5]。同時推進行政申請的無紙化過程。2003年起,美國FDA就宣布接受采用國際通用的電子通用技術文檔(electronic common technical document, eCTD)格式的新藥審批、生物制品許可申請以及試驗用新藥申請等申請文件。經過數十年的過渡,2017年FDA的大部分新藥臨床研究和上市申請以及原料藥主控文件等都不再接受紙質申請,必須采用eCTD提交[6]。

因為數據庫平臺和結構不同而產生許多困難,幾乎任意兩個不同軟件之間要實現數據傳遞都會存在數據轉換問題。目前,FDA已成立數據標準管理團隊并建立數據標準體系,由FDA的數據標準委員會(Data Standards Council)協調,進行數據的評價、開發、維護和采用,以確保整個機構使用共同的數據標準[7]。匯總與數據標準有關的已有指南文件[8],并建立了數據標準的目錄。

1.3 數據挖掘技術的開發應用

FDA的數據挖掘方法和工具最先用于對藥品不良事件報告的數據庫分析。常用的方法有:非均衡測量法、變點分析(change-point analysis,CPA)、文本挖掘和可視化工具。數據挖掘已協助進行許多重要的藥品、醫療器械的安全性信號評價,甚至能發現已上市很久的藥品隱藏的毒性信號,如丙基硫氧嘧啶的肝毒性案例;也可以提早發現風險信號,如經回顧性數據挖掘發現,數據挖掘方法可能提早10個月發現植入式心臟除顫器(implantable cardioverter defibrillator, ICD)存在風險信號[9]。

由于數據挖掘方法在不良事件報告分析的成功應用,FDA已開始將此方法應用于其他類型的數據,如在藥物應用的臨床研究數據和呼叫中心接收問題中,已常規使用,而在MEDLINE、醫學文獻、醫療設備文件社會媒體、煙草文件等類型數據的挖掘工具正在開發中。

2 大數據共享策略——openFDA

2.1 項目概況

openFDA項目于2013年3月啟動,2014年6月正式發布。此項目的重要意義在于推動FDA已公開數據的使用,使數據的檢索和使用過程更加便利,促進監管效能提升[10]。截至2015年11月,openFDA注冊用戶超過6 000個,全球21 000個系統與之相連,有超過2 000萬次的數據調用。數據開放促使產生了多種多樣的應用FDA數據的手機軟件。截至2015年7月,已有30個手機軟件在使用FDA的開放數據提供服務。

openFDA項目由開放的數據(原始數據下載)、開放的源代碼(可檢索的、開放的應用程序編程接口)和開放的社區(技術文檔和應用實例的交流平臺)3部分組成,最終的產品是形成第三方開發的手機軟件(圖1)。openFDA項目基于云平臺技術,可自動實時更新數據;數據獲取方式分為網頁和應用程序編程接口2種,以下兩節分別介紹。

2.2 網頁展示和下載

網頁展示和下載數據為非信息技術人員獲取數據提供了極大的方便。目前,openFDA已公開了食品、藥品、醫療器械和化妝品有關不良反應、召回、標識等數據(表1)。網頁展示可按照不同的檢索類別進行查詢,顯示相應的統計數據及其直觀圖表。同時公眾可以下載JSON格式的原始數據壓縮包,進行自行分析。

2.3 應用程序編程接口

openFDA使用基于搜索的編程接口,使得開發者能夠向搜索引擎一樣通過文本字符進行檢索。應用程序編程接口的數據獲取方式,可在代碼檢索框輸入不同的查詢代碼查詢,還可進入相應的編程接口網址,查詢代碼模版結構。合理利用查詢參數構建表達式,可精確獲取數據。openFDA的應用程序編程接口支持4個查詢參數:search、count、limit、skip,實現查詢特定內容、統計指定變量的分類計數、指定返回結果數目的上限、指定需省略的結果數目等功能。在官方網站可免費獲取調用openFDA的編程接口的密鑰,使得獲取、調用數據更自由[11]。

3 美國食品藥品監管大數據應用實踐

在FDA建立數據共享平臺的基礎上,一方面FDA開發手機軟件加強信息交流,進行有效的數據交換并探索公共網絡數據的開發;另一方面,企業與研究機構利用FDA的開放數據,創造性地開發了數據的商業價值和研究價值,以下對各類應用舉例介紹。

3.1 促進雙向信息交流——緊缺藥信息平臺

智能手機的廣泛應用使得手機軟件成為數據采集的重要途徑之一,也是擴大數據應用范圍的重要手段。為避免藥品短缺延誤患者治療,加強FDA和制藥企業的信息溝通,2015年3月4日,FDA創新性地發布其首款手機軟件——FDA藥品短缺(FDA Drug Shortages),提供了更簡單、快捷的方式向FDA報告已發生以及潛在的藥品短缺問題,也使公眾、醫藥專業人士和制藥公司能獲知藥品短缺的實時信息,可通過輸入藥品通用名、適應證或活性成分查找。

3.2 實現部門間數據交換——國家電子病歷整合

同樣的數據,對于不同監管部門有不同的作用。部門間的數據交換可以作為部門已有數據來源的補充,也可以更有效地解決已有問題。2009年美國啟動電子病歷系統的推廣,這其中包括FDA的藥品信息數據庫與國家電子病歷的電子用藥處方對接[12]。數據對接后,患者和醫生可以隨時查看用藥記錄,提高處方的準確性和護理質量;FDA也可以查看用藥情況,將用藥情況與后期診療情況結合,挖掘不良事件信號;對制藥企業,電子病歷意味著更快地識別臨床試驗候選人,并開展上市后藥品的跟蹤研究。

3.3 挖掘不良事件信號——公共網絡數據開發

FDA的不良事件報告系統中有強制性報告,也有自愿性報告,因此漏報情況時有發生。FDA一直在尋找收集不良事件信號的其他途徑,包括社交媒體信息和搜索引擎數據。FDA已與網上患者社群網站(如:PatientsLikeMe)以及大眾社交網站(如:推特)開展合作,挖掘隱藏在社交媒體中的藥品相關使用信息。2013年,谷歌、微軟和斯坦福大學的研究人員等都曾撰文描述通過分析搜索引擎數據發現不良事件的方法[13],證明在信息過濾后,搜索引擎數據可以作為識別不良事件的另一個數據來源。2015年7月,美國FDA已開展與谷歌代表探討使用谷歌的技術和數據識別不良事件[14],以獲得不良事件報告難以發現的長期服藥副作用。

3.4 鼓勵外部創新數據應用——可視化展示和性別差異研究

以下分別挑選了企業和研究機構應用FDA開放數據的2個案例。

健康樹林(Healthgrove)是一個向公眾提供專業健康知識的網站,包含大量綜合性數據的文章、可視化圖表和研究工具。網站通過openFDA的數據接口與FDA藥品不良反應數據庫的數據對接,提供不良反應報告數、使用人群和召回等藥品安全信息,指導科學合理地選擇藥品。以抗癲癇藥加巴噴?。╣abapentin)為例,網站提示:加巴噴丁在2013年有378萬患者使用,2013年以來有5次召回,歷年涉及91 416例不良反應報告,其中67%是嚴重的不良反應,按照不良反應的種類和報告年份提供了圖表展示(圖2、圖3)。

瑞典的卡羅林斯卡學院(Karolinska Institute)性別藥物研究中心(Centre for Gender Medicine)建立性別反應網站(genderedreactions.com)發布藥品對男性和女性不同作用的研究結果,可快速按照男女性別來識別藥品副作用的發生率。就針對布洛芬的79 960例不良反應報告而言,女性的不良反應報告數量占到總量的68%。

4 美國食藥監管大數據實踐對我國的啟示

在醫藥領域,健康和醫療相關的數據大部分掌握在政府行政部門和事業單位中,不對公眾開放,缺乏有效地整理和開發。近年來,在我國雖然在食品監管運行機制上實現了“從農田到餐桌”的全過程統一監管,藥品監管方面也曾依托藥品電子監管碼建立電子監管系統(現調整為藥品追溯體系),不乏有重視數據采集、開發利用的舉措出臺,但對大數據技術的挖掘、利用仍處在探索階段,尤其是數據開放的理念依然沒有獲得廣泛認同,在監管大數據實踐方面還有很大的發展空間。我國食藥監管政府數據開發策略要遵循總體規劃、指標規范、信息共享的方針,實現大數據服務科學監管、服務公眾創新。

4.1 完善數據庫的構建,聯接標準化數據

我國食品藥品監管數據不但面臨“信息孤島”的挑戰,而且已成為高度碎片化的信息孤島。食藥監管系統已有的數據庫往往由部門、行業、產品、環節、地域所分隔,在缺乏頂層設計的情況下,甚至一個省級監管機構內藥品注冊、生產、流通、不良反應監測等不同監管環節也無法實現數據的有效聯通。完善數據庫需首先清理食藥監管機構內的數據,統一數據標準,構建內部數據庫,再逐步實現對接跨部門、跨行業的數據,如:原料價格數據、醫療機構的使用數據、藥店和藥房的零售數據,最終形成真正意義的大數據庫。這是提升公共信息資源的價值,實現數據開放和流動的第一步。值得欣喜的是,2014年,國家總局的出臺了多項關于數據標準的文件,《食品藥品監管信息數據集元數據規范》、《食品藥品監管數據庫設計規范》、《食品藥品監管數據共享與交換接口規范》、《食品藥品監管信息基礎數據元(機構、人員、藥品、醫療器械部分)》等。2016年食品抽檢方面的大數據已開展應用。在我國首個全國性食品安全大數據應用項目——“全國食品抽檢結果查詢系統”中,消費者通過輸入食品名稱、選擇食品分類或者掃描商品條形碼即可查詢到某一食品兩年以來的被抽檢結果,其數據庫覆蓋了全國食品藥品監管部門的食品抽檢結果數據[15]。

4.2 提升信息公開力度,實現數據自主查詢

信息是包含解讀和二次加工的數據,數據是原始、可再利用的信息。政府信息公開是政府數據開放的前提和基礎,而政府數據開放則是政府信息公開的發展和躍進[16]。推動數據的有效使用應成為信息公開的目的之一。在我國,雖然信息公開從2008年開始實施,但是時至今日,即便在起步較早、公開水平較高的上海,《信息公開條例》并未達到促進政府信息再利用的預期效果[17]。逐年急劇增長的依申請公開申請數量,對比相對穩定的主動公開信息數量,說明公眾對信息數據的需求程度與實際公開程度的矛盾愈加激烈。在數據的公開中政府部門有諸多顧慮,如:視數據為政府“私有”資源,不屬于政府信息;數據涉密缺乏標準,公開易產生輿情危機;數據本身有缺陷,公開會暴露工作質量問題。但是,主動公開數據庫且提供有效的數據檢索方式終將成為更加深入和廣泛地推進信息公開工作的主要形式。事實上,國家食藥監總局和地方食藥監管部門在數據主動公開中已建立了一些良好的協作,如:食品抽檢、藥品抽驗、食品生產企業、藥品品種以及研發、生產、經營單位等信息。然而,更豐富有效的檢索方式、更直觀的檢索結果展示形式將會更好的推動數據在風險交流、科普宣傳、投資引導方面發揮作用。

4.3 擴大數據開發的主體,鼓勵公眾參與和創新

監管部門的本職是監管,除了以數據手段提升監管效能外,并沒有使用數據、挖掘數據價值的責任。食藥監局作為一個政府職能部門,縱然掌握了大量數據,也不可能對我國食品藥品行業中發生的林林總總情況都提出解決方案。在這個倡導社會共治的時代,只有政府部門開放數據,讓社會一起來尋求解決方案,才有可能不斷提高飲食用藥的安全水平。從國際上看數據開發和開放的發展,都是這樣的情況。因此,數據的有效使用,在社會而不是監管部門。數據開放的終極目標在于利用,數據開發中更重要的是公眾的參與,以及開放、利用數據之后實際獲得的表達權和監督權。同時,信息和數據的共享為社會組織和公民參與管理提供充分條件[18],信息和數據的公開是社會共治的根基??稍L問的數據是公眾參與數據開發的前提。正如前文介紹的openFDA項目,其啟動和維護都依托于第三方企業,構建目的也是為有效刺激公共及私人部門創新、推進學術研究、民眾教育以及保護公眾健康。開放監管數據能夠刺激社會創新從而轉化為巨大的經濟利益。當監管數據開放后以可忽略不計的成本獲得,創新的數據服務企業賦予數據新價值的先進分析技能、發掘數據的全新使用領域將在市場競爭中占據優勢。當然,需要注意的是,監管數據的免費開放和數據開發后的有償使用是兩個概念,數據的開發使用將創造價值。因為,監管數據對應于《中華人民共和國政府信息公開條例》中的相關規定“行政機關在履行職責過程中制作或者獲取的,以一定形式記錄、保存的信息”,是應該及時準確公開的。監管數據應主動公開或依申請公開,依申請公開僅可以收取檢索、復制、郵寄等成本費用?!靶姓C關不得通過其他組織、個人以有償服務方式提供政府信息?!?

4.4 挖掘企業行業數據,推動政企信息共享

2016年6月30日,國家食品藥品監督管理總局局務會議審議通過《關于修改〈藥品經營質量管理規范〉的決定》,將藥品電子監管系統調整為藥品追溯體系,要求在企業藥品經營質量管理體系中建立相應的管理制度;麻醉藥品、精神藥品等法規規定的品種仍由藥品監管部門建立監控信息網絡。這一修訂調整了在2015年以前實現全品種、全過程、可追溯的藥品電子監管的計劃[19]。隨著更多由企業自行建立藥品追溯體系的出現,藥品的全流程信息將不再掌握在政府的電子監管系統中,需要通過推動政企信息的共享,促成具有完備性、覆蓋率高的藥品信息數據庫,實現企業與政府的共贏?;谇拔拿绹称匪幤繁O管大數據應用實踐,有許多數據應用需要政府和企業的合作實現,從而達到解決藥品短缺等信息對接難題、開展上市后藥品的跟蹤研究、補充藥品不良反應等已有數據庫、推動藥品安全信息普及、促進藥品安全相關科學研究等目的。

參考文獻

[1] FDA. SMG 3240.1. FDA staff manual guids, volume IIIgeneral administration[EB/OL]. (1999-08-01)[2016-07-25]. http://www.fda.gov/downloads/aboutfda/ reportsmanualsforms/staffmanualguides/ucm261638.pdf.

[2] FDA. FDA leadership profiles[EB/OL]. (2016-07-11)[2016-07-25]. http://www.fda.gov/aboutfda/centersoffices/ ucm193757.htm.

[3] FDA. Staff manual guide 1114.10[EB/OL]. (2015-7-22)[2016-7-22]. http://www.fda.gov/downloads/aboutfda/ reportsmanualsforms/staffmanualguides/ucm478778.pdf.

[4] PRNewswire. Iodine Inc. Awarded $1.17 Million Contract from the Food and Drug Administration for openFDA project[EB/OL]. (2015-01-29)[2015-07-30]. http://www. prnewswire.com/news-releases/iodine-inc-awarded-117-million-contract-from-the-food-and-drug-administration-foropenfda-project-300027652.html.

[5] JASON S. FDA shows how to cut costs and reduce paperwork[EB/OL]. (2013-11-15)[2015-8-11]. http://www.govtech.com/ data/FDA-Shows-How-To-Cut-Costs-and-Reduce-PaperWork.html?utm_source=related&utm_medium=direct&utm_ campaign=FDA-Shows-How-To-Cut-Costs-and-ReducePaper-Work.

[6] Alexander Gaffney. FDA to require electronic submission of new drug, biologic files in next two years [EB/OL]. (2015-05-07)[2016-07-22]. http://www.raps.org/RegulatoryFocus/News/2015/05/07/22116/FDA-to-Require-ElectronicSubmission-of-New-Drug-Biologic-Files-in-Next-Two-Years.

[7] FDA. FDA resources for data standards[EB/OL]. (2015-02-13)[2016-07-26]. http://www.fda.gov/forindustry/datastandards/ default.htm.

[8] FDA. Individual case safety reports[EB/OL]. (2015-10-07)[2016-07-26]. http://www.fda.gov/ForIndustry/ DataStandards/IndividualCaseSafetyReports/default.htm.

[9] FDA. Data mining at FDA-White Paper[EB/OL]. (2015-11-20)[2016-08-30]. http://www.fda.gov/scienceresearch/ healthinformatics/ucm446239.htm#safetyassessment.

[10] JASON S. Federal CTO Todd Park announces FDA open data portal[EB/OL]. (2014-06-02)[2016-07-26]. http://www. govtech.com/federal/Federal-CTO-Todd-Park-AnnouncesFDA-Open-Data-Portal.html.

[11] 施雯慧, 陳穎, 姚捷, 等. FDA公共數據開放項目中屈螺酮炔雌醇片的分析研究[J]. 中國藥物警戒, 2015, 12(9): 552-555.

[12] FDA. Science board to the FDA[EB/OL]. (2015-11-18)[2016-07-22]. http://101.96.10.42/www.fda.gov/downloads/ advisorycommittees/committeesmeetingmaterials/ scienceboardtothefoodanddrugadministration/ucm473504. pdf.

[13] Yom-Tov E, Gabrilovich E. Postmarket drug surveillance without trial costs: discovery of adverse drug reactions through large-scale analysis of web search queries[J]. J Med Internet Res, 2013, 15(6): e124.

[14] Michael M. FDA and Google talk ‘adverse event trending[EB/OL]. (2015-07-16)[2015-07-23]. http://www. raps.org/Regulatory-Focus/News/2015/07/16/22888/FDAand-Google-Talk-Adverse-Event-Trending/.

[15] 國家食品藥品監督管理總局. 全國食品安全大數據應用項目落戶海南[EB/OL]. (2016-07-12)[ 2016-07-22]. http:// www.cfda.gov.cn/WS01/CL0005/158742.html.

[16] 張毅菁. 從信息公開到數據開放的全球實踐——兼對上海建設“政府數據服務網”的啟示[J]. 情報雜志, 2014, 33(10): 175-178, 183.

[17] 肖衛兵. 政府數據開放機制的建立和完善:結合《政府信息公開條例》談起[J]. 理論探討, 2015(4): 154-157.

[18] 劉霞, 向良云. 公共危機管理[M]. 上海: 上海交通大學出版社, 2010: 20-21.

[19] 國務院. 國務院關于印發國家藥品安全“十二五”規劃的通知[EB/OL]. (2012-02-13)[2016-07-22]. http://www. gov.cn/zwgk/2012-02/13/content_2065197.htm.

猜你喜歡
信息公開大數據
美國高校學術科研信息公開的原則、標準及路徑
從轉基因食品的安全性論食品信息公開化
基于我國政府信息公開的電子政務研究
中小企業財務管理存在的問題及對策研究
關于加快建立上海市固體廢物全產業鏈信息化監管機制的措施與建議
大數據環境下基于移動客戶端的傳統媒體轉型思路
基于大數據背景下的智慧城市建設研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合