摘 要 / Abstract
隨著醫療健康數據的快速增長,真實世界數據(real world data,RWD)分析為藥物警戒工作帶來了新的機遇,成為傳統藥品不良反應監測模式的有益補充。本文通過介紹幾種主要的RWD類型,包括電子健康檔案數據、醫療保險數據、注冊登記數據、社交媒體數據和多源整合數據的定義和常見數據庫舉例,并對各種類型數據應用于相關藥品安全性監測和評價的案例進行分析,總結了RWD在藥物警戒中的應用范疇、優勢和局限性,以期為我國利用RWD開展藥物警戒活動相關研究的探索和實踐提供參考。
With the rapid digitalization of healthcare data, the analysis of real world data(RWD) analyses has brought new opportunities for pharmacovigilance and serves as a valuable complement to traditional adverse drug reaction surveillance.This article provides an overview of the definition, database examples and case analysis of major types of RWD in pharmacovigilance, including electronic health record data, health insurance data, registry data, social media data, and multisource integrated data. It summarizes the application scope, strengths and limitations of RWD in pharmacovigilance, aiming to provide references for exploring and implementing RWD-based pharmacovigilance research and practices in China.
關 鍵 詞 / Key words
真實世界數據;藥品安全性;藥物警戒;不良事件
real world data; drug safety; pharmacovigilance; adverse events
藥物警戒活動是指對藥品不良反應及其他與用藥有關的有害反應進行監測、識別、評估和控制的活動[1]。真實世界數據(real world data,RWD)是指來源于日常所收集的各種與患者健康狀況和(或)診療及保健相關的數據[2]。相較于傳統的藥物警戒模式,RWD在特殊群體(如兒童、老人、孕產婦等)、罕見事件、遠期毒性等方面的藥品安全性評價中更具優勢,RWD豐富的藥品安全性信息資源是傳統藥品不良反應監測模式的有益補充。本文將對幾種主要的RWD類型在藥品安全性監測和評價中的應用進行介紹。各類型RWD的定義及常見數據庫舉例見表1。
1、電子健康檔案數據
電子健康檔案(electronic health record,EHR)是指醫務工作人員在日常臨床診療工作中所記錄的電子醫療記錄,收集了患者的人口學特征、癥狀和體征、實驗室檢查和影像學檢查、診斷和治療及臨床結局等臨床信息。EHR豐富的臨床信息及其覆蓋的大樣本患者量為藥品安全性評價提供了數據基礎。得益于電子信息技術的發展,越來越多的國家和地區利用大型EHR數據庫開展藥品安全性評價。EHR在藥品安全性主動監測方面有著廣泛應用,如歐洲藥品管理局(EMA)的藥物流行病學和藥物警戒網絡中心(European network of centres for pharmacoepidemiology and pharmacovigilance, ENCe PP)、美國食品藥品監督管理局(FDA)的哨點監測項目和日本藥品醫療器械管理局(PMDA)的醫療信息風險評估行動(medical information for risk assessment initiative, MIHARI),以及我國建立的中國醫院藥物警戒系統(Chinese hospital pharmacovigilance system, CHPS)等均在藥品安全性主動監測項目中持續開發整合利用EHR數據,評價藥品的已知嚴重風險、識別嚴重風險信號以及非預期的嚴重風險[3]。除主動監測外,利用EHR開展藥品上市后安全性再評價研究的方法也被許多國家和地區的監管部門、學術界和制藥企業廣泛接受。EHR的具體應用案例如下。
1.1 對于使用司美格魯肽注射液的2型糖尿病患者的安全性主動監測[4]
研究背景:司美格魯肽注射液(Ozempic)于2017年獲得美國FDA批準上市,用于2型糖尿病患者血糖控制。FDA在2022年開展了Ozempic安全性主動監測研究,以分析識別新的非妊娠非腫瘤類風險信號。RWD數據源和方法:研究數據來源于2018~2022年FDA哨點監測項目中5個監測點的EHR縱向數據庫,從EHR中提取患者年齡、性別、既往病史、糖尿病診斷、Ozempic和西他列?。⊿itagliptin)使用、合并用藥、臨床結局等信息進行回顧性分析,對啟動Ozempic和Sitagliptin治療的糖尿病患者根據傾向性評分進行1∶1配對,利用Tree Scan軟件進行統計分析,比較Ozempic和Sitagliptin兩組間不良臨床結局發生情況的均衡性,識別風險信號。主要發現和建議:相較于Sitagliptin,Ozempic使用者惡心嘔吐及其他代謝癥狀發生風險增高。EHR數據收集的藥物使用和臨床結局等信息可以用于藥品上市后安全性評價。值得注意的是,此類藥品安全性主動監測并沒有事先明確檢驗假設,屬于探索分析,不能只依賴統計結果判斷風險信號。藥品安全性監測和評價需要綜合考慮研究設計、藥物作用機制、治療背景和治療人群等因素進行風險分析。
1.2 維得利珠單抗上市后安全性再評價研究[5]
研究背景:維得利珠單抗(Vedolizumab)于2014年獲得美國FDA批準用于治療炎癥性腸病(inflammatory bowel disease,IBD),但其臨床試驗缺乏老年患者安全性研究數據。該研究的目的是評價Vedolizumab在老年IBD患者中的有效性和安全性。RWD數據源和方法:采用回顧性觀察研究設計,RWD數據來源于2015~2018年英國6家醫院老年IBD患者EHR縱向數據庫,利用標準化問卷從EHR中收集人口學、疾病診斷和分型、既往病史和治療史、Vedolizumab治療、臨床應答、不良事件等信息,描述分析臨床結局事件。主要發現和建議:74名使用Vedolizumab的老年患者中有6名(占比8%)發生不良事件,不良事件發生率與文獻報道的其他年齡組IBD患者相似,因此該研究認為Vedolizumab對老年IBD患者是安全的。同臨床試驗相比,真實世界中接受治療的患者群體更加廣泛,可能涵蓋老年人群、重病人群和妊娠婦女等。該研究利用EHR數據中豐富的臨床信息對臨床試驗中未覆蓋的老年患者人群使用Vedolizumab的安全性進行了分析,有效補充了藥品在特殊人群中安全性評價證據。
隨著醫院信息系統的建設和完善,EHR數據庫所收集的健康和疾病診療相關內容不斷擴充、質量不斷提升,其豐富的臨床信息和多樣化的患者人群數據為開展藥品安全性實時主動監測和藥品上市后安全性評價提供了有力的數據支撐。EHR數據用于藥物警戒工作具有以下優勢:覆蓋患者群體廣泛,除收集一般患者信息外,還包括兒童、老年人、孕產婦、共病患者等特殊群體的信息;覆蓋豐富的醫療保健信息,在日常的臨床診療實踐中收集了詳細的患者疾病特征、治療和檢查等臨床信息;覆蓋長期的隨訪數據,可用于評估遠期臨床結局。但EHR數據也具有局限性:由于是以醫院為基礎的數據,數據源分散、缺乏整合,易發生失訪的情況;各醫療機構間醫療實踐和數據異質性較大;相較于住院病歷,門診病歷多存在診療信息記錄不完整的情況;存在適應癥偏倚和渠道偏倚等。
2、醫療保險數據
醫療保險數據是為了滿足醫療保險支付方對醫療機構的支付和報銷的管理需求所收集的醫療保險記錄,主要涵蓋了患者的疾病診斷和治療、處方藥等編碼和簡單描述及相關醫療費用信息。常見的醫療保險數據庫有美國老年和殘障健康保險(Medicare)和醫療補助(Medicaid)數據庫、日本的全國醫療保險數據庫(National Database of Health Insurance Claims and Specific Health Checkups,NDB),以及我國的城鎮職工基本醫療保險和城鄉居民基本醫療保險數據庫等。醫療保險數據是以人群為基礎收集的參保人員在不同診療機構和不同時間的就診和治療信息,是藥品安全性評價常用數據源之一。
筆者以戈利木單抗上市后安全性監測[6]為例介紹醫療保險數據的具體應用。
研究背景:戈利木單抗是一種單克隆抗體,于2009年獲得美國FDA批準用于治療類風濕性關節炎(rheumatoid arthritis,RA)、銀屑病關節炎和強直性脊柱炎。該研究的目的是比較戈利木單抗和其他非生物系統療法(nonbiologic systemic,NBS)治療風濕病的安全性。RWD數據源和方法:采用觀察性研究設計,RWD數據來源于美國Optum醫療保險數據庫,利用其醫療和藥品保險索賠信息提取患者性別、年齡、既往病史、風濕病診斷、治療、臨床轉歸和不良事件等數據。從Optum數據庫中識別2009~2014年接受戈利木單抗治療的風濕病患者作為研究對象,并根據傾向性評分按照1∶4比例與接受NBS治療的患者進行配對,通過系列治療組間比較、配對組間比較、巢式病例對照分析以及敏感性分析,比較兩組患者抑郁癥及其他不良臨床結局的發病風險。主要發現和建議:研究共納入1337例戈利木單抗治療患者和4227例NBS治療的傾向性評分配對患者,并未發現戈利木單抗治療會增加抑郁癥及其他不良事件的發生風險。該研究屬于藥品上市后針對事先定義的不良臨床結局開展的主動監測,利用醫療保險數據識別大樣本的用藥患者及對照組患者,并通過嚴謹的藥物流行病學研究設計和多種統計分析方法控制混雜和偏倚的影響,從而提高研究結果的可靠性。
醫療保險數據庫收集了以一般人群為基礎的醫療保險索賠相關信息,在藥品上市后安全性評價研究中有著廣泛應用。同其他類型的RWD相比,醫療保險數據庫在藥物警戒工作中具有以下優勢:醫療保險數據覆蓋的人群樣本量通常較大,研究人群的代表性和結果的外推性較好;用藥信息較完整,可以縱向長時間收集用藥、隨訪和結局變量數據,包括開始使用研究藥品的情況、藥品治療中斷的情況、同期其他藥品的使用情況以及其他疾病診斷和不良事件信息等,從而評價藥品的近期和遠期安全性;數據的結構化較好。醫療保險數據也有局限性,如僅收集醫療保險覆蓋人群信息,不能完全代表全人群特征;僅收集有限的診療信息,而未收集患者癥狀、體征以及非保險報銷范圍內的診療操作等信息,不能對疾病嚴重程度進行準確分層;可能存在漏診和錯分病例,難以對診斷信息進行驗證;混雜因素和協變量信息較少,很多重要的混雜因素都未被測量收集等。
3、注冊登記數據
注冊登記是指一個有組織的系統,利用標準的方法收集具有某種特定疾病、狀況或者暴露人群的臨床和其他數據。注冊登記研究是藥品注冊決策中重要的RWD來源,其利用觀察性方法系統收集特定人群患者的個體健康相關信息,大致分為疾病注冊登記、患者(醫療服務)注冊登記以及產品注冊登記三大類。其中,患者注冊登記研究是指納入登記的患者均暴露于某些特定醫療保健服務的一類注冊登記研究,如北美Corrona(已于2021年更名為Cor Evitas)類風濕關節炎患者注冊登記研究和我國的急性心肌梗死注冊研究等。產品注冊登記研究是指納入登記的患者均暴露于某種特定醫療產品(單藥或某一類藥品)的一類注冊登記研究。在藥品安全性監測和評價中,患者注冊登記和產品注冊登記是常用的注冊登記數據來源。
筆者以阿達木單抗安全性評價[7]為例介紹注冊登記數據的具體應用。
研究背景:阿達木單抗于2002年首次獲得美國FDA批準用于治療RA等疾病。該研究的目的是評價阿達木單抗在美國人群中治療RA的長期安全性。RWD數據源和方法:采用觀察性研究設計,RWD數據來源于Corrona的RA患者注冊登記數據庫。Corrona建立于2001年,定期從RA患者和風濕科醫生處收集疾病診療、臨床轉歸、不良事件及患者報告結局等信息和長期隨訪數據。該研究從Corrona數據庫識別2008~2017年使用阿達木單抗的RA患者,收集其人口學、RA診斷和治療、既往病史和治療史以及嚴重感染、腫瘤、心衰等不良事件信息,描述分析阿達木單抗治療的遠期安全性。主要發現和建議:該研究對2798例接受阿達木單抗治療的RA患者進行分析,發現治療后嚴重感染的發病率為1.86/100人年,其中治療后第一年的發病率遠高于一年后的發病率。與之前的研究相比,該研究并未發現新的安全性信號。Corrona患者注冊登記系統覆蓋美國全國范圍的RA患者,利用該數據庫所識別的RA患者代表性較好,其長期隨訪數據可有效用于藥品的遠期安全性評價,并且研究結果具有很好的外推性。
注冊登記研究的開展能夠有組織地、系統地在較大范圍內收集符合條件的患者的疾病診療、隨訪、臨床轉歸信息,甚至包括某些特定疾病和健康量表測量的患者報告結局等內容,信息完整性以及數據結構化和標準化程度均較好,是藥品安全監測和上市后安全性評價的重要數據來源。注冊登記數據在藥物警戒工作中的優勢在于:患者樣本量大且涵蓋患者人群廣泛,包括老人、兒童和孕產婦等特殊人群,具有較好的患者代表性、較大的樣本量和較高的統計檢驗效能。注冊登記研究利用標準化方式收集數據,定期隨訪和評估疾病的進展和嚴重情況,數據質量相對較高,不良事件信息更加詳細、系統和完善。此外,隨著時間的推移,醫療實踐不斷改善,通過注冊登記研究可以觀察患者臨床結局在不同診療時期的變化趨勢。而注冊登記研究也存在局限性,包括僅有針對部分特定疾病的注冊登記數據,建立注冊登記研究成本較高;存在渠道偏倚等選擇偏倚,存在信息偏倚和未測量的混雜因素,不能直接進行因果推斷;隨訪時容易發生失訪和信息缺失的情況,可能會對罕見不良事件的評價產生嚴重不良影響。
4、社交媒體數據
社交媒體是一種在線互動平臺和工具,包括網絡論壇、微信、微博、快手、抖音、Twitter、Facebook等,被人們廣泛使用。據統計,截至2020年,全球活躍的社交媒體用戶數達到39億,約占全球總人口數量的50%以上,其中我國社交媒體用戶數超過10億[8]。人們可以在社交媒體上討論與健康相關的各種問題,分享就醫和診療體驗以及不良事件的發生情況,社交媒體成為藥品安全性信息來源之一。近年來,歐美很多國家和地區正在探索利用社交媒體收集藥品不良反應信息的技術和方法。
筆者以推特(Twitter)藥品不良事件監測[9]為例介紹社交媒體數據的具體應用。
研究背景:隨著社交媒體中藥品相關數據的日益增多,歐盟資助了旨在推進利用社交媒體報告藥品不良反應的相關政策、框架、工具和方法推薦項目。鑒于Twitter推文中含有大量藥品安全性信息,該研究探索了如何利用Twitter中相關信息識別藥品不良事件的方法。RWD數據源和方法:采用回顧性分析方法,RWD數據來源于2012~2015年近6萬條抽樣Twitter英文推文信息,這些推文內容中至少提及了6種藥品(甲磺酸伊馬替尼、左乙拉西坦、哌甲酯、索拉非尼、特比萘芬、唑吡坦)中的一種。通過對Twitter中相關信息進行數據治理,制定算法識別藥品適應癥、不良事件等變量數據并進行描述分析。主要發現和建議:該研究利用Twitter推文識別了6種藥品的1056條不良事件陽性報告信息和56 417條不良事件陰性報告信息,研究表明社交媒體數據可以用于識別藥品不良事件。社交媒體數據主要是非結構化文本數據,且包含大量的方言,數據治理費時費力。該研究通過制定操作指南和進行培訓等方式進行質量控制,為探索社交媒體數據應用于藥品安全性評價提供了參考。
社交媒體中藥品和健康相關數據可應用于藥品安全風險信號監測,但其信息體量大且內容繁雜,也給藥品不良事件相關數據治理工作帶來了挑戰,目前其在藥品安全性監測工作中的應用尚處于探索階段。社交媒體數據應用于藥物警戒具有以下優勢:用戶群體多且地理位置分布廣泛,利用患者交流平臺等媒體平臺會更加容易地收集罕見病群體不良事件相關信息;能夠直接提供患者視角的藥品使用體驗,而不是由接診醫生或者藥劑師“過濾”和“再加工”處理后上報的不良事件信息;屬于即時數據,可以更加快速地監測不良事件的發生及頻率。但社交媒體數據也存在局限性:信息內容冗雜,充滿各種“噪音”;多為文本、圖像和視頻等非結構化數據,數據挖掘和處理存在困難;常缺乏對醫療事件的細節描述,用語不規范,難以與醫學專業術語匹配以及判斷藥品與不良事件之間的關系;不良事件可能會被重復發布或者被其他人轉發導致重復記錄等;存在渠道偏倚和報告偏倚等偏倚和混雜。
5、多源整合數據
多源整合數據是指將EHR、醫療保險、注冊登記等數據甚至不同國家和地區的相關數據進行鏈接和整合生成的多源數據。隨著各種類型健康數據的積累發展,多源整合數據庫對不同來源的數據進行鏈接整合,數據更加全面豐富,為準確監測和評價藥品風險信號提供了有力的數據支撐。例如,英國臨床實踐研究數據庫(clinical practice research datalink, CPRD)除通過常規方式從全科醫生處收集初級衛生保健數據外,還通過患者個人的英國國家醫療服務體系(national health service, NHS)識別號將患者的初級衛生保健數據、上級醫療服務數據、疾病注冊登記數據、死亡登記數據等進行鏈接整合。CPRD在藥物警戒領域有過多項應用[10]。在我國,很多地方探索建立了區域健康信息平臺,如寧波市全民健康信息平臺。這類多源整合數據庫的主要數據來源是當地各級醫院、衛生行政部門、疾病預防控制中心和公共衛生機構以及其他醫療衛生機構在日常醫療服務工作中采集獲得的患者和居民的醫療健康信息。
筆者以利用CPRD開展疫苗安全性監測[11]為例介紹多源整合數據的具體應用。
研究背景:該研究的目的是評價利用英國CPRD開展疫苗上市后安全性實時監測、快速識別安全性信號的可行性。RWD數據源和方法:通過觀察性研究,RWD數據來源于CPRD。提取2013~2015年流感疫苗和麻疹腮腺炎風疹聯合減毒活疫苗(MMR疫苗)接種、人口學、格林-巴利綜合征和熱性驚厥診斷相關數據,以流感疫苗接種/格林-巴利綜合征作為罕見不良結局進行識別測試,并以MMR疫苗接種/熱性驚厥作為陽性對照,比較分析兩對疫苗/不良臨床結局的觀察/預期事件結果。主要發現和建議:該研究發現,CPRD可以用于有效識別流感疫苗接種后發生的中等或顯著增加的格林-巴利綜合征發病風險,以及MMR疫苗接種后輕度增加的熱性驚厥發病風險。CPRD是多源整合數據庫,收集了疫苗接種、初級衛生保健服務、轉診服務、疾病診療等信息,可以用于開展疫苗安全性實時監測,識別疫苗接種后顯著增加的罕見不良事件發病風險信號以及輕度增加的常見不良事件發病風險信號。
多源整合數據庫從不同數據源收集數據并進行整合,收集的信息內容遠多于單一數據源,在藥物警戒工作中兼具其他數據類型的優勢,可用于藥品安全性實時主動監測以及藥品上市后安全性評價,包括罕見、常見不良事件和遠期不良結局風險監測和識別等。多源整合數據通常為大樣本人群數據,人群的代表性較好;從多個維度對研究人群特征、暴露、其他危險因素和協變量、混雜因素、臨床結局等變量特征進行描述,進行變量交叉驗證,深入分析并綜合評價藥品的安全性,有助于回答更多的研究問題。然而,多源整合數據也具有局限性:由于數據來源較多,難以對每個數據源的數據收集和整理過程進行深入了解,不同數據源的異質性給數據鏈接、治理和分析過程帶來挑戰,關鍵變量定義和算法制定常常需要根據可行性進行調整而不夠直觀等,這些問題都需要在研究過程中加以注意。
上述各類型的RWD應用于藥品安全性評價的優勢和局限性匯總分析見表2。
6、機遇與挑戰
RWD種類繁多,其收集的藥品安全性信息可以廣泛用于開展藥物警戒活動。除上述EHR、醫療保險、注冊登記、社交媒體、多源整合等數據外,還包括近年來蓬勃發展的患者報告結局和可穿戴設備等產生的健康數據。各個國家和地區的藥品安全性評價案例也表明,RWD豐富的數據資源可作為傳統藥品不良反應監測方法的有益補充,用于加強對藥品安全風險信號的識別和驗證。
然而同時需要注意的是,RWD用于開展藥物警戒活動也面臨著諸多挑戰。例如,由于RWD是在日常醫療服務中產生的,而不是根據研究需要而收集的,研究者需要評價和判斷哪些數據能回答所要研究的問題,需要理解各類數據的背景、質量和潛在的混雜與偏倚,充分發揮各類數據源的優勢,對研究進行合理設計、數據治理、統計分析和結果解讀,產生可靠的證據,從而回答藥品的安全性問題。同時,RWD面臨數據多源異構問題,不同數據源的數據質量參差不齊,缺乏數據的標準化,為數據的治理和統計分析帶來巨大的挑戰。對此,研究者可通過質量控制,并借助于人工智能和機器學習等信息技術提高數據的利用效率。此外,數據安全、隱私保護和相關倫理問題也是RWD采集、存儲、共享和分析過程中備受關注的問題。研究者應建立隱私保護機制,遵守相關法律法規,通過數據去個人隱私化、加強網絡安全管理、建立倫理委員會審核制度等,有效保護個人隱私和數據安全。
相較于部分發達國家和地區,我國RWD用于藥物警戒的研究起步相對較晚,RWD數據碎片化和信息孤島現象在一定程度上限制了其在藥品安全性評價方面的探索和應用。建議加強我國RWD的數據整合力度,增強其可及性,鼓勵應用RWD開展藥物警戒探索和研究,進一步推進藥品安全性全面監測和評價工作。
引用本文
王薔,吉永卓成,竇麗霞*.真實世界數據在藥物警戒工作中的應用[J].中國食品藥品監管,2023(10):60-67.