摘要
目的:分析藥物臨床試驗現場核查過程中療效指標相關問題的關注點,為藥物臨床試驗現場核查工作提供參考。方法:參考國內外藥物臨床試驗實施和檢查相關指導性文件,對療效指標相關核查要點進行總結;并結合近年來現場核查經典案例,梳理核查過程中不同試驗設計的藥物臨床試驗常用的療效評價指標及對應的常見問題,分析現場核查的關注點。結果:通過案例分析,明確了疾病臨床終點或相關重要臨床事件類療效指標、量表類療效指標、實驗室檢測結果類療效指標、影像學結果類療效指標4類常用療效評價指標的現場核查關注點。結論:不同類型的療效指標具有不同的評估要求、評估標準和評估流程,現場核查過程中應有針對性地考慮適當的關注點,才能使核查工作更加高質高效地開展。關鍵詞:藥物臨床試驗;療效指標;現場核查;療效評估
藥物臨床試驗是確認藥物有效性和安全性的關鍵環節,對探究藥物在體內的生理藥理特性、明確適用人群和評價治療作用具有十分重要的意義。為確保臨床試驗數據的真實、科學和可靠,充分保證上市藥品的安全有效,國家藥品監督管理局食品藥品審核查驗中心于2015年10月啟動現場核查工作,對臨床試驗現場進行實地確證,對臨床試驗原始記錄進行現場核查。在現場核查過程中,療效指標相關問題事關藥物臨床試驗的有效性評價,既是核查的重點,也是核查的難點。本文對藥物臨床試驗療效指標相關核查要點進行總結,梳理常見的療效評價指標,結合典型案例分析現場核查關注點,旨在為同行提供參考,促進我國藥物臨床試驗現場核查工作更加高效有序地開展。
一、物臨床試驗現場核查實施情況
藥物臨床試驗現場核查是藥品注冊研制現場核查的一部分,是對注冊申報資料中的臨床試驗實施情況進行實地檢查、核實。主要依據《藥品注冊管理辦法》《藥物臨床試驗質量管理規范》《藥品注冊核查要點與判定原則(藥物臨床試驗)(試行)》[1](以下簡稱“核查要點”)等法律、法規或規范要求,對臨床試驗的許可條件、倫理審查、實施過程、試驗用藥品管理、生物樣品管理、中心實驗室及獨立評估機構、數據采集記錄等方面進行核查。藥物臨床試驗現場核查工作由國家藥品監督管理局食品藥品審核查驗中心組織全國藥品檢查資源實施。
鑒于有效性評價在臨床試驗實施和核查過程中的重要作用,筆者結合多年工作經驗及現場核查實際,以現行法規文件和核查要點為指導,分析藥物臨床試驗現場核查中療效指標方面的常見問題及關注點。
二、現行《藥品注冊核查要點與判定原則(藥物臨床試驗)(試行)》涉及療效指標的核查要點
我國現行核查要點于2021年12月17日由國家藥品監督管理局食品藥品審核查驗中心發布,自2022年1月1日起施行。核查要點包含八個部分共48條,涉及療效指標的要點在多個部分均有提及。事實上,由于療效指標的評價是藥物臨床試驗實施的關鍵環節,對藥品有效性的確定具有重要作用,其記錄、溯源、評估等要求貫穿于核查要點的各個環節。根據核查要點總結療效指標應在如下幾個方面重點關注。
2.1 療效指標的記錄
數據記錄是療效評估的基礎。研究者應按照臨床試驗方案規定的流程和評估方法實施試驗,采取措施保證關鍵步驟實施的準確性,并保存相關記錄,記錄修改應留痕,不掩蓋初始數據并保存修改軌跡,注明修改理由,由修改者簽名確認并注明日期。
2.2 療效指標的評估
基于核查要點,療效指標的評估可分為以研究者或獨立評估機構的評估結果作為有效性數據、以臨床機構檢驗科或中心實驗室的檢驗結果作為有效性數據和以受試者自評結果作為有效性數據等多種情況。不同適應癥的藥物臨床試驗療效指標的選擇往往差異較大。筆者結合檢查工作經驗并檢索藥物臨床試驗登記與信息公示平臺,發現95%以上的抗腫瘤藥物臨床試驗以研究者或獨立評估機構的評估結果作為主要終點,80%左右的神經精神類藥物、風濕免疫類藥物、皮膚病相關藥物以受試者自評結果作為療效指標之一,而多數代謝疾病相關藥物的療效指標則常以實驗室檢測結果為主。
以研究者的評估結果作為有效性數據的,該研究者應具有相應的教育、培訓和經驗,并得到主要研究者的授權,其評估數據的記錄和修改應符合臨床試驗數據記錄的相關要求。
以獨立評估機構的評估結果作為有效性數據的,其評估人員應具備相應資質,評估流程、數據記錄及修改應按照相關指南和獨立評估機構的章程、標準操作規程執行。
以臨床機構檢驗科的檢驗檢查結果作為有效性數據的,其臨床實驗室應參加經國家衛生健康部門認定的室間質量評價機構組織的臨床檢驗室間質評并取得通過證書,且對臨床檢驗相關檢驗儀器、輔助設備等定期校準。
以中心實驗室的檢驗結果作為有效性數據的,中心實驗室除應通過國家級室間質評并做好儀器設備的使用、維護、校準外,還應建立臨床檢驗報告發放制度(包括危急值報告制度),按照相關要求向研究者報告檢驗結果,保證檢驗報告的準確性、完整性和及時性。
2.3 療效指標的溯源
經研究者或獨立評估人評估得出的有效性數據應溯源至評估人、評估時間、原始評估結果及其修改過程,獨立評估結果還應溯源至每位獨立評估人員獨立出具的評估報告。
以臨床機構檢驗科或中心實驗室的檢驗結果作為有效性數據的,應可在其LIS系統或儀器設備中溯源。
以受試者自評結果作為有效性數據的應溯源至有受試者署名確認的原始評估記錄,包括受試者日記卡、受試者評估報告等。
三、藥物臨床試驗常見療效指標及關注重點
有效性是藥物批準上市的前提和基礎,不同試驗目的、不同適用人群、不同給藥途徑、不同試驗設計的藥物臨床試驗,其選擇的療效評價指標往往不同。
療效指標是反映藥物作用于受試者所表現出的有效性的主要觀測與評價工具,具體應包括療效觀測指標、收集方法和評價標準等。療效觀測指標可以是疾病臨床終點、影響疾病進程的重要臨床事件,也可以是反映患者社會參與能力、生存能力、臨床癥狀和/或體征、心理狀態等內容的相關量表或其他形式的定量、半定量或定性的指標;也可以是通過某些醫療儀器和設備測量手段獲得的數據或檢查結果,主要包括影像學、病理、生化等指標[2]。不同類型的療效指標,有不同的觀測、收集和評價方法,本文僅針對藥物臨床試驗設計和實施過程中常用的療效指標進行討論。
3.1 疾病臨床終點或相關重要臨床事件類療效指標
疾病臨床終點指標一般是指反映患者疾病的最終結局或影響患者生存的嚴重疾病狀態等特征的指標[3],如抗腫瘤藥臨床試驗的總生存期(OS)、某些重要臨床事件如腦卒中、急性心梗、骨折的發生情況等。但由于該類指標作為療效評價時臨床試驗的觀察周期往往較長、所需樣本量大、研究成本較高,目前多采用其他可測量或易于觀測的替代性指標,以增加臨床試驗的可操作性。采用疾病臨床終點或相關重要臨床事件作為療效指標的,應關注其判斷標準是否清晰明確,如住院標準的判斷、死亡原因的判斷等,同時應關注相關記錄是否保存完整、可追溯。對于多中心臨床試驗,盡管方案中規定或者國內外有明確的公認的診斷標準,不同研究者仍可能在判斷上存在不同認識,通常可以設立獨立的終點仲裁委員會,以降低不同研究者評判差異造成的偏倚,增強臨床事件判斷的可靠性。
常見問題舉例:某臨床試驗主要療效指標為OS,現場檢查發現一定比例的受試者未收集死亡證明,僅在門診病歷本的電話隨訪記錄中記錄電話聯系日期、受試者家屬告知的死亡日期等,不能保證有效性數據的可靠性。該項問題的出現可歸因于研究者對OS和源數據的認識有欠缺,隨訪記錄內容過于簡單,可靠性差。OS是國際公認的腫瘤臨床試驗療效評價的金標準,OS的可靠性高度依賴受試者死亡時間的準確性。記錄在門診病歷中的電話隨訪情況過于簡單,缺乏必要的信息要素,不足以作為反映受試者死亡時間的原始文件,不能保證時間的準確可靠。該專業最終因該項問題涉及數據可靠性被國家藥品監督管理局發文整改。針對類似問題,建議研究者正確理解OS作為主要療效指標對數據記錄準確性的要求和源文件、源數據的涵義,盡量收集受試者家屬提供的死亡證明如醫療機構簽發的死亡證明、電子病歷中記錄的死亡時間或公安系統簽發的死亡證明等,如采用隨訪記錄的方式,應盡可能包括隨訪日期、方式、人員、受試者生存狀態、死亡日期、死亡原因、死亡地點等信息要素,保證記錄的標準統一,以提高數據可靠性[4]。
3.2 量表類療效指標
量表是藥物臨床試驗中應用較普遍的評價工具,可適用于入排標準的判斷、不良事件的監測、療效指標的評價等。作為療效指標的量表以評價人員進行劃分可以分為患者報告的結局(PRO)量表和臨床醫生觀測的量表等。
3.2.1PRO量表
以患者自我感受為疾病變化指征的藥物臨床試驗多采用PRO量表,以評價患者自覺性癥狀或功能能力的變化,如疼痛、瘙癢、失眠、疲勞、抑郁、生活質量或對日常生活和心理狀態的影響等[5]。常見如疼痛相關臨床試驗最常使用VAS和數字疼痛評分量表,精神健康類臨床試驗多使用漢密爾頓抑郁量表、匹茲堡睡眠質量指數,神經病學相關試驗側重使用VAS和歐洲生活質量-5維量表等。在使用PRO量表前,應對受試者進行培訓,確保其能夠正確理解并準確填寫量表,且應制定有效措施防止出現補填行為。在隨訪過程中,也應注意對受試者依從性的評估和量表填寫的再培訓,以充分保證評估結果的可靠性。
常見問題舉例:某臨床試驗主要療效指標為評分刻度表,方案規定由受試者根據自身感覺在評分刻度表上劃記號表示,但現場核查中未見原始評分刻度表。該試驗是以PRO量表為主要療效指標的典型案例,受試者依據自身感受轉化形成可量化的數字化指標作為評估標準,其數字化來源的第一手資料至關重要。缺少原始評分刻度表,導致用于評價的數據不能溯源,不能保證數據真實反映受試者自身感受,最終影響療效評價的可靠性。該項問題在現場核查中被建議作為審評重點關注問題。針對類似問題,建議研究者認真培訓受試者按照標準操作流程完成療效相關評價并完整保存原始記錄,確保源文件、總結報告、統計分析報告和數據庫中的療效指標相關數據一致。
3.2.2臨床醫生觀測的量表
臨床醫生觀測的量表是基于有醫療專業背景的醫生對患者的健康狀況觀察后進行的評估報告,包括醫生觀察到的患者的癥狀、體征及其他結果[6]。不同的觀測量表對使用人員有不同的資質要求,有的量表甚至需經過資格認證并取得資格證書后方可使用。臨床醫生觀測的量表常見于皮膚疾病、免疫疾病、神經精神類疾病等相關試驗,由于此類量表評估易受研究者主觀影響,通常試驗設計為雙盲試驗,應關注臨床試驗過程中盲態的保持情況,如試驗藥物和對照藥物因外觀存在差異而必須設置非盲團隊時,應重點關注非盲操作流程設計是否合理,是否存在破盲風險,從而對療效評估結果產生影響。
常見問題舉例:某臨床試驗主要療效指標為皮損部位評分量表,1例受試者未現場訪視,由研究者依據該受試者皮損部位照片進行評分,不能準確反映皮損部位的浸潤、脫屑等表現;某臨床試驗主要療效指標為研究者評估的量表,試驗采用盲法設計,根據試驗方案,配藥環節應為非盲人員,主要研究者未授權非盲配藥人員,配藥人員實際參與注射給藥,存在破盲風險。上述兩項問題均可歸結于臨床試驗過程中產生了偏倚,影響有效性結果的評估。以皮損照片代替現場訪視,不能完整展現皮損全部特征,評估結果準確性大打折扣;破盲風險可能導致主觀選擇偏倚,試驗均衡性出現差異,還會導致研究者對治療的態度及療效評價呈一定傾向性,受試者對治療的配合及心理作用產生干擾,均會影響試驗結果的準確性。因該項目存在破盲風險申辦者經過綜合評估后未使用該中心試驗數據進行注冊申報。針對以研究者或受試者評估結果作為主要療效指標的試驗,建議盡可能采取措施減少或避免來自研究者或受試者的主觀偏倚,使療效評價更加科學、客觀、可靠。
3.3 實驗室檢測結果類療效指標
實驗室檢測結果因其客觀性和準確性經常作為藥物臨床試驗的療效評價指標,一定情況下甚至可作為主要療效指標,在有效性評價中發揮關鍵作用。此類指標常見于心血管疾病、內分泌代謝性疾病相關的藥物臨床試驗,如糖尿病相關臨床試驗的主要療效指標多為糖化血紅蛋白、動脈粥樣硬化相關臨床試驗療效指標多為低密度脂蛋白膽固醇降低值和降低百分率[7]、骨質疏松相關臨床試驗療效指標常見骨轉換指標等。以實驗室檢測結果作為療效評價指標時往往需要與基線檢測結果進行比較,而這些指標往往會受到生活方式、飲食習慣、睡眠狀況、心理因素和其他臨床干預等多種因素的影響。因此,該類藥物臨床試驗在設計上往往會增加導入期或洗脫期,使受試者達到穩定的基礎狀態和用藥劑量水平,以消除其他因素對藥物有效性評價的干擾。
為降低不同實驗室檢測結果的差異和偏倚,以實驗室檢測結果作為療效評價指標時多設置中心實驗室進行統一樣本檢測,此時應關注生物樣本的采集、處理、保存、運輸、檢測等樣本管理的各個環節是否符合試驗方案和實驗室手冊的要求,原始記錄是否完整,樣本數量是否核對一致,檢測結果是否可溯源。對于多中心臨床試驗尤其國際多中心臨床試驗以中心實驗室檢測結果作為療效評價指標的,還應注意檢測結果的計量單位和正常值范圍是否存在較大差異。
常見問題舉例:某臨床試驗療效指標為基于中心實驗室檢測結果的計算值,核查發現其原始數據與數據庫及總結報告數據不一致。統計人員通過對數據庫中數據的統計分析,評價試驗用藥品的有效性,而數據庫中的數據來源于試驗過程中的原始文件,因此,確保原始數據與數據庫、統計報告和總結報告中的數據一致至關重要,既是研究者履行質量管理職責的重要環節,也是現場核查過程中的關注重點,尤其針對以實驗室檢測結果作為主要療效指標的試驗。當然,基于該項問題還應結合不一致數據的占比綜合評估對療效指標的最終影響。針對此類問題,研究者應保證將數據及時、準確、完整地錄入原始病歷和數據庫中,不得隨意更改,確有明確原因需更改的,應按照GCP規定的修改要求,保持初始記錄清晰可辨,保留修改軌跡,必要時注明修改理由,并由修改人簽署姓名和日期。
3.4 影像學結果類療效指標
影像學指標廣泛應用于抗腫瘤藥相關的藥物臨床試驗,如無進展生存期(PFS)、無病生存期(DFS)、客觀緩解率(ORR)、疾病控制率(DCR)等抗腫瘤藥臨床試驗中常見的替代指標的評估均依賴于影像學結果。使用影像學結果作為療效評價指標時,可參考FDA發布的《臨床試驗影像終點過程標準行業指導原則》(Clinical Trial Imaging Endpoint Process Standards Guidance for Industry)的相關要求,國家藥品監督管理局藥品審評中心也發布了《抗腫瘤藥臨床試驗影像學評估程序標準技術指導原則》[8]供行業參考。
以影像學結果進行療效評價的,應在試驗方案中明確具體評價標準,通常應選用國內外行業內公認的評價標準,如目前實體瘤常用的評價標準為RECIST 1.1,淋巴瘤常用的評價標準為lugano等。無論基于何種標準,靶病灶和非靶病灶的選擇尤為重要。應關注選擇的靶病灶是否可測量、大小是否合適、邊界是否清晰、有無與其他組織腺體相融合;非靶病灶選擇是否合理等。為保證前后測量的可比性和準確性,整個試驗過程中應盡可能保證掃描方式一致,如不要由CT變更為MRI等。為保證評估結果的可追溯性,還應盡可能記錄測量靶病灶選擇的圖層、測量方式(是否進行重建)等。
通常情況下,為保證評估的客觀性和獨立性,往往設立獨立影像評估委員會(IRC)并采用其評估的結果作為主要療效指標,輔以研究者評估結果作為次要療效指標。IRC應確保評估人員具有相應的資質、接受過系統的培訓,并采取適當措施保證評估獨立性。當不同評估人員的評估結果出現不一致時,還應設置裁判閱片人進行仲裁。有時因評估標準要求結合臨床數據作為參考,還會設置療效評估人員進行臨床療效評價。以IRC作為療效評估的,應關注評估流程的合理性、影像學圖像是否隱去受試者個人信息以消除評估偏倚,還應關注IRC評估結果與研究者評估結果是否存在明顯差異。早年間因無相應的指導原則,無官方推薦的統一評估標準,部分臨床試驗還存在IRC集體討論做出評估結果的方式,影響評估的獨立性,進而影響有效性數據的可靠性。
常見問題舉例:某臨床試驗使用IRC進行影像學評估,IRC通過圓桌會議方式對每一位受試者的影像學資料共同審核,不能保證評估的獨立性。IRC的獨立性是藥品審評部門關注的重點,多名評估者通過會議方式評價目標病例,將難以避免討論會影響單個評估者的獨立判斷,可能導致主要療效指標結果不可靠。該項問題在現場核查中被建議作為審評重點關注問題。使用IRC進行影像學評估且以其評估結果作為主要療效指標時,要根據目標適應癥特點、試驗設計和實際實施因素考慮評估流程設計,避免因評估流程存在的科學性問題而導致評價結果發生系統性偏倚[8]。
四、討論
藥物臨床試驗現場核查是藥品全鏈條監管的重要手段,既能保證臨床試驗數據的真實可靠,從源頭上保障藥品安全有效,又能保護受試者安全和權益,在過程中控制臨床試驗質量風險[9]。臨床試驗的有效性數據是藥品上市的重要支撐,也是藥品審評審批的關鍵內容。在核查過程中發現療效指標相關問題時,一方面應評估問題出現的具體環節,如評估、記錄、溯源等,核實問題產生的原因,并及時將原始記錄與數據庫進行比對,還原數據產生的過程,判斷數據庫的錄入和上報是否準確無誤,符合要求;當數據出現大量修改時,還應核實修改依據是否充分合理,是否具有一定傾向性,必要時還應剔除具體數據作敏感性分析;核實數據庫的鎖定時間是否符合邏輯,如有開庫痕跡,核實開庫原因,是否有相應的文件記錄等。另一方面,應收集匯總出現相同情況的受試者例數、組別(試驗組或對照組)及所占比例,綜合判斷其對臨床試驗療效評價結果的影響。
綜上,療效指標是藥物臨床試驗設計和實施的重要內容,不同試驗目的、不同試驗類型選擇的療效指標尤其主要療效指標往往存在差異。不同類型的療效指標具有不同的評估要求、評估標準和評估流程,這就要求數據核查過程中應有針對性地考慮適當的關注要點,才能使核查工作更加高質高效開展。
參考文獻
[1] 國家藥品監督管理局食品藥品審核查驗中心. 藥品注冊核查要點與判定原則(藥物臨床試驗)(試行)[S].2021.
[2] 國家食品藥品監督管理局. 中藥新藥臨床研究一般原則[S]. 2015.
[3] 劉炳林. 藥物臨床試驗中療效指標的選擇[J]. 中國新藥雜志,2017,26(18):2113-2120.
[4] Huang H, Tang Y, Yu Y, et al. The Reliability and Integrity of Overall Survival Data Based on Follow-up Records Only and Potential Solutions to the Challenges[J]. The Lancet Regional Health-Western Pacific,2023,31:100624.
[5] 劉炳林,薛斐然. 臨床試驗中療效指標觀察與測量相關問題的考慮[J]. 中國新藥雜志,2019,28(24):2939-2947.
[6] 劉炳林. 藥物臨床試驗中有效性指標的分類[J]. 中國新藥雜志,2016,25(10):1103-1107.
[7] 劉炳林. 藥物臨床試驗中療效評價指標及常見評價方法[J]. 中國新藥雜志,2016,25(18):2074-2077.
[8] 國家藥品監督管理局藥品審評中心. 抗腫瘤藥臨床試驗影像學評估程序標準技術指導原則[S]. 2021.
[9] 張正付,王佳楠. 基于審評需要的藥物臨床試驗數據核查[J]. 中國臨床藥理學雜志,2019,35(23):3162-3164.
