女人被男人强扒内裤内衣,一区中文字幕在线观看,天天干夜夜做,亚洲成人av网址,亚洲性一区,国产精品亚洲综合,亚洲情一区,日韩一区二区在线免费

您當前的位置:檢測資訊 > 法規標準

藥物臨床研究中多個臨床終點的指導原則

嘉峪檢測網        2022-10-26 06:19

1、介紹

 

在人用藥品和生物制品的臨床研究中,可能會采用多終點的方法對研究結果進行分析和解釋。本指導原則為申辦方和審評人員提供了FDA針對多終點相關的問題的觀點,以及如何在臨床研究中處理這些問題。在藥物研發過程中開展的臨床研究,多數的臨床研究都包含了多個終點。這些終點用來評估藥品產生的影響,并記錄藥物對一種或多種疾病特征產生有利影響的能力。但在研究中進行多終點分析的時候,如果沒有對多重性進行適當的調整,得到關于療效的錯誤結論的可能性就會增加。所以,應該采取適當的措施對多重性進行調整。

 

本指導原則的目的描述為分析藥物效果而對終點進行分組和排序的不同的策略,以及一些公認的統計方法來管理研究中的多重性,從而減少研究中得到關于療效的錯誤結論的可能性。如果相關風險沒有得到適當的控制,那么基于這樣的分析得到的結論也會導致對藥品療效的誤判和誤導性陳述。

 

1998年9月頒布的ICH E9《臨床試驗統計原則》(1998年9月)是一個涉及范圍廣泛的指南,包括對多終點問題的討論。本指導原則則為多終點的相關問題提供了更詳細的解釋。本指導原則的頒布履行了FDA在2007年《食品和藥品管理修正案》(FDAAA)中的承諾。

 

一般來說,FDA的指導原則通常不代表有法律效力的規定,而是代表了FDA目前對相關問題的看法和建議。如果有相關的法律法規出臺則另當別論。本原則中提到的“應當”是說FDA建議這樣做,但不等于說是必須這樣做。

 

2、背景和范圍

 

在臨床研究中,藥品療效是通過療效終點來體現的。療效終點包括臨床事件(例如,死亡率、中風、呼吸衰竭、靜脈栓塞)、癥狀(例如:疼痛、呼吸困難、抑郁癥狀)、功能測量(例如:行走和運動能力)或有望預測臨床獲益的替代終點。

 

因為大多數的疾病會導致多種臨床事件、癥狀和/或功能改變,很多臨床研究的設計是針對疾病的多個方面。在某些情況下,僅針對疾病的某個方面進行療效評估是不合適的,需要將疾病的多個方面合并為一個終點或者進行多終點的評估。也存在另外一種情況,那就是對多終點中的任何一個終點進行評估就足以支持該產品的上市批準。

 

在采用多終點的臨床研究中,如果對多重性沒有進行良好的處理,就會增加得出錯誤的療效結論的可能性。監管部門對多重性的關注主要出現在對臨床試驗的評估中,這些試驗旨在證明支持藥物批準和FDA批準的標簽中的聲明的有效性。但是,這個問題在整個的藥品研發過程中都是很重要的。例如,如果通過假設檢驗來評估安全性的結果,就需要考慮本指導原則提到的多重性的問題。安全性分析的多重性問題不屬于正式統計測試中預先指定的假設集的一部分,不是本指導原則中討論的問題。

 

在以下的章節中,對多終點問題和對多終點的處理方法進行了討論。多重性問題和對多終點的處理方法也同樣適用于其他原因產出的多重性,包括估計目標的其他屬性(例如:多劑量、多時間點、研究人群的亞組);但是,這些其他來源的多重性不是本指導原則討論的內容。而且,對于某些特殊情況下的多重性,可能會有與多重性有關的不同的考慮。例如,在主方案中評估不同的產品對同一個疾病的療效,這也不是本指導原則中討論的問題。本指導原則集中于同一臨床研究中對多終點問題進行分析和解釋。

 

體現研究目的:療效

 

如果一項研究提供了客觀的療效證據,呈現出了所期望的藥品療效,這對于新藥的批準是至關重要的(例如,“適當和良好控制的研究...基于平等和負責的結論...藥品具有其所聲稱的效用”)(section 505(d) of the FD&C Act)。

 

FDA的法規進一步規定,藥品的臨床研究必須采取適當的方法,需要進行良好的控制。此外,應該“對對研究結果的分析足以評估藥物的效果”,即“實施藥品臨床研究的目的,是將藥品產生的效應與其他因素區分開,這些因素包括病程變化、安慰劑影響、觀察中的偏倚等”。

 

在單個的臨床研究中,在假設檢驗的結論之外,在評估療效的客觀證據的時候,還有需要考慮一些其他的重要因素(例如:終點和評估效應的臨床相關性,相關的外部信息)。在FDA其他的指導原則中,有關于療效客觀證據的更廣泛的討論,但這不是本指導原則的討論范圍。

 

通常是通過假設檢驗來解決針對所選擇的終點進行的療效評估中產生的不確定性問題。這種方法始于對所選擇的終點進行相關假設。在最簡單的情況下,目的是體現試驗藥與對照藥相比的優效性。在臨床研究開始前,針對終點有兩個互不相容的假設:

 

● 第一個假設是無效假設,聲稱針對所選擇的終點沒有治療效應。

 

● 另一個假設是備擇假設,假定試驗藥物至少有某些治療效應。

 

采用預先確定的統計方法對這對假設進行檢驗,看無效假設是否會被否定,備擇假設是否會被認可,從而用以確定研究結果。需要注意的是,如果無效假設不能被否定,并不意味著無效假設就是成立的。有很多因素可以導致否定無效假設失敗,例如樣本量不夠等。

 

在某些情況下(例如在一些疫苗的臨床研究中),在一些研究中需要有最小的治療效應來體現療效,這對于藥品的批準至關重要。在這種情況下,如果采用正規的統計檢驗來體現療效,應該對無效假設進行適當的修改,將最小的臨床效應包含在無效假設之中。

 

本指導原則的重點在于基于假設檢驗的統計學框架。如果申辦方為了特殊的研發項目,例如兒科項目,需要采用其他的統計學方法(例如貝葉斯法),應當盡早與FDA進行討論。

 

I類錯誤

 

拒絕無效假設,可以支持得出兩組療效有差異的結論,但并不等于說無效假設絕對是錯的。仍然存在錯誤地否定無效假設的可能性,也就是說,事實上無效假設是對的。這種錯誤的結論被稱為是I類錯誤。對于一個終點來說,錯誤地拒絕無效假設以及針對這一終點得出有治療效應(實際上是沒有治療效應的)的結論的幾率,被稱為是針對該終點的I類錯誤發生率或I類錯誤率。顯著性水平,記錄為a,是控制I類錯誤發生率的閾值。做出拒絕無效假設判斷,是基于通過研究結果計算出的無效假設正確的概率(P值)足夠小(通常是小于a)。

 

備擇假設可以是單側的或雙側的,并以此為基礎進行統計分析。對雙側的統計檢驗而言,I類錯誤的概率是指在試驗組和對照組的療效實際上沒有差別的情況下,得出療效有差別結論的可能性。對于單側檢驗而言,I類錯誤的概率是指在實際上試驗組和對照組沒有差別的情況下,得出試驗組優于對照組結論的可能性。通常情況下,對于雙側檢驗而言,該值設定為0.05;對于單側檢驗而言,該值設定為0.025。

 

對于雙側檢驗而言,0.05的意思是:當不存在差異時(在實際上兩組療效相同的情況下),錯誤地得出試驗組與對照組療效不同的結論的可能性不超過5%,也就是20分之1,不管是試驗組優于對照組還是劣于對照組。對于單側檢驗而言,0.025的意思是:在實際上兩組療效相同的情況下,錯誤地得出試驗組療效優于對照組的結論的可能性為2.5%,也就是40分之1。雙側檢驗的0.05涵蓋了對稱的雙側的概率,所以也包括了錯誤地得出優效結論的2.5%的單側檢驗概率(40分之1)。通過恰當的統計檢驗可以得到正確的I類錯誤的概率。如果統計檢驗有問題(例如,基本的假設不成立),那么I類錯誤的概率會更大。

 

FDA要求控制I類錯誤的概率以減少對于主要和次要終點得出錯誤的優效性結論(見第III章),而不管研究的哪個或者多少終點沒有效應。針對多終點研究的I類錯誤率被稱為總的I類錯誤率。控制這個概率的原理在后面的章節描述(第II章C部分)。

 

當有多于一個的主要終點和次要終點的時候,要保證對多重假設的評估不會導致研究總的I類錯誤的膨脹,以至于高于原來計劃的水平,這一點很重要。為了控制I類錯誤的發生率,對于申辦方至關重要的是,要前瞻性的注明以下內容:

 

● 在主要終點和次要終點中所有的終點情況(見第三章,定義)

● 所有針對預先定義的、用于進行假設檢驗的數據分析,不管這些數據是用于主要終點或次要終點。

 

對于多終點的臨床研究而言,統計分析計劃要對相關假設的檢驗程序進行描述,這些假設要對I類錯誤水平有良好的控制。

 

多重性

 

對于單終點的、采用雙側檢驗的(α = 0.05)臨床研究而言,如果試驗組和對照組實際上沒有差別,但得出試驗組優于對照組結論的概率是0.025(2.5%的概率)。這就是說,在針對這個終點實際上沒有療效的情況下,有97.5%的可能性是不優于對照組。 

 

與之比較,如果有兩個獨立的終點,每個終點都是雙側檢驗,a=0.05,而且針對每個終點都得出了藥品有效的結論,那么兩個終點合到一起,不能得出有效結論的概率就是0.975 * 0.975,約為0.95,所以,錯誤地判斷為存在療效優勢的概率(也就是在實際無效卻得出優效結論的概率)上升到了大于0.05. 這樣一來,當兩個終點合并的時候,有利于判定為藥品有效的I類錯誤發生率增加了為近兩倍。

 

在進行多重檢驗的時候,如果未進行調整,這種高于計劃的I類錯誤發生率稱為多重性問題。因此,如果不對多重性進行改正,對于這個研究而言,發生對藥品有利的I類錯誤的概率會增加到5%。所以,這種情況下就沒有對I類錯誤進行良好的控制。在有兩個以上的終點的情況下,這個問題會更嚴重。

 

例如,如果有三個獨立的終點,那么一類錯誤率就是 1 - (0.975 * 0.975 * 0.975),大約為7%。在有十個獨立終點的情況下,I類錯誤率是大約22%。如果這些多個的終點是相關的,那么總體I類錯誤率也會膨脹,但但可能程度較低。

 

即使是在評估單個結局變量的時候,如果需要分析結局的多個方面(例如,多個劑量組、多個時間點、基于人口學或其他特征的多個亞組),而且如果其中的任何一個分析都可以得出藥品有效的結論,分析的多重性也會導致I類錯誤的膨脹。所以,多重性導致I類錯誤率的膨脹,產出了對研究結果解釋的不確定性,導致通過研究得出的療效結論變得不可靠。可以采用不同的方法前瞻性地將總體的I類錯誤發生率控制在2.5%或以下。

 

為了對多重性進行控制,有一個重要的原則是首先前瞻性地對所有計劃的終點、時間點、分析人群、劑量、分析方法進行說明;在對這些因素有了說明以后,可以通過選擇、事先說明和使用,對多終點進行適當的調整和分析。更改分析計劃,進行額外的分析也可以產生多重性的問題,對臨床研究的結果分析產生負面影響,除非這些變化是發生在數據分析之前,并且采取了適當的措施對多重性進行了調整。統計分析計劃在治療組揭盲以及進行統計分析以后,不得進行修改。

 

本指導原則的重點是對預先確定的臨床研究終點(例如主要終點和次要終點)I類錯誤率的控制,保證對臨床研究的主要發現的支持和藥品療效的呈現。

 

對已經證明的、對終點有影響的特征進行解釋,對這些特征:例如發病時間、人群中效應大小的分布、亞組的效應以及對復合終點終某終點的影響,進行描述性的分析,這樣就對終點的特性有了更深入的理解,而不擴展到該終點之外的效應。這些描述性分析可以被考慮包含在FDA批準的標簽中,而不呈現P值。

 

值得注意的是,在與主要發現密切相關的分析和展現其他效應的分析之間,不是總明確的差別。所以,當要得出確切結論的時候,這些分析需要事先確定,并并適當地納入預先指定的多重測試策略中。。如果一個描述性的分析沒有包含在事先確定的多重檢驗策略之中,就不應該呈現到FDA批準的標簽上。這樣會暗示這是一個嚴格的統計方法得出的結論,或者暗示了療效方面的確定性,但實際上在研究中沒有支持這種確定性。描述性分析不是本指導原則要討論的問題,所以就不做詳細的說明了。

 

3、多終點:總則

 

終點族的層級

 

在充分和良好控制的藥物試驗中,通常按等級對終點進行分組,通常根據其臨床重要性,但也考慮到終點事件的預期頻率和預期的藥物效果。。對終點進行分組的關鍵考量是看這些終點是否構成支持藥品審評的療效或其他有意義的效應。那些對療效有關鍵作用的、用于支持藥品審評的終點一般是主要終點。次要終點可以提供有用的說明來支持主要終點和/或體現其他的重要臨床效應。層級中的第三類包括所有其他的終點,被稱為探索性的終點。探索性終點可以包括那些用于研究目的的終點,或用于產生新的假設。終點的每個層級可以包含單個的終點或一系列的終點族。

 

(1)主要終點族

 

主要終點族是指那些構成藥品的療效,并且是得出研究達到研究目的結論的基礎的終點。如果只有一個事先確定的主要終點,就不存在確定研究達到目的的多終點相關的多重性問題。

 

多個主要終點發生在以下三種情況,在第三章的C部分有更詳細的描述。第一種情況是,有多個主要終點,其中的每一個終點都足以證明藥品的療效。這種情況下,多個終點就產生了多個成功機會。在這種情況下,如果不對多重性進行調整會導致I類錯誤的膨脹,不能得出藥品有效的結論。第二種情況是,在有兩個或多個終點的情況下,必須所有的終點都達到才能證明藥品的療效。在這些情況下,這些主要終點就沒有多重性的問題,因為只有一條途徑去獲得研究結果的成功,所以,不會導致I類錯誤的膨脹。第三種情況是,療效的主要方面可以合并為一個主要的復合終點或其他多重復合終點,這也可以避免多終點導致的多重性問題。例如,在很多心血管的研究中,通常將多個終點進行合并(例如:心因性死亡、心梗、中風)成為主要終點,而降死亡作為次要終點(見第III章A2).

 

(2)次要終點族和探索性終點族

 

當主要終點的療效得到顯現以后,次要終點可以進行正式的檢驗。次要終點可以是與主要終點相關的臨床效果,可以用來擴展對該效果的理解(例如:在一個心血管產品的主要評價終點為心衰導致的住院率時,次要終點為生存率)或者提供與主要評價終點要區別的臨床獲益的證據(例如在多發性硬化治療的臨床研究中,主要評價終點為復發率,將殘疾率作為次要終點)。作為一個通用的原則,如果一個次要終點將能夠提供潛在的、關于藥品其他效應的證據,也應該將這個次要終點納入I類錯誤控制計劃。

 

通常情況下,會盡量減少次要終點的數量,因為如果采用多重性調整策略,隨著次要終點數量的增加,證明對其中任何一個次要終點確證臨床效應的可能性就越小。或者如果s使用層級機構,在底層的重要假設可能永遠得不到檢驗。

 

探索性終點不需要進行多重性的調整,因為這些終點通常不用于支持藥品的批準決定。

 

(3)對主要終點族和次要終點族的選擇和解釋

 

次要終點的陽性結果可以是可以解釋的,如果事先在主要終點族證明了治療效應(O’Neill 1997)。總體I類錯誤率的控制可以將主要終點族和次要終點族一起考慮。

 

有時候,有一些研究的臨床重要終點(例如死亡和不可逆的疾病狀態)發生率很低,不能為研究提供足夠的把握度,同時一個不同的臨床重要終點發生率較高或者在病程的早期出現,可以增加把握度。

 

在這種情況下,通常把握度不高的終點被劃分為次要終點,而把握度較高的終點被期望劃分為主要終點。

 

例如,一些腫瘤的研究中,選擇PFS為主要終點,而OS選擇為次要終點,因為對疾病進展的治療效應具有臨床重要性,更容易得到驗證,可以更早的探測到,而且可以更大,應該觀察到的OS可能會被疾病進展后的后續的治療所影響。

 

II類錯誤和樣本量

 

FDA也關注II類錯誤導致的風險。II類錯誤是指實際存在效果的情況下未能顯示藥物的效果。研究的把握度是在明確了治療效應的大小的情況下,研究成功的概率。期望的把握度是確定樣本量的一個重要因素,特別是對于主要終點而言。

 

在已經知道了主要終點的效應大小的情況下,通常通過對研究的樣本量的選擇,來獲得一個合理的高把握度,來證明治療效應。樣本量的計算可能需要考慮統計學上的調整,來控制由多重性產出的I類錯誤率。例如,如果針對一個研究終點采用了較低的率,那么樣本量需要進行調整,以為此終點提供足夠的統計把握度。

 

使用兩個或兩個以上的終點,每個終點都證明治療效應,以支持藥品審批(又稱為聯合主要終點,見第III章的C1節),這種方式會增加II類錯誤的發生率,降低研究的把握度。

 

例如,假設兩個終點有同樣的效應幅度,而且研究的樣本量可以提供80%的把握度來給每個終點表示成功。如果兩個終點是彼此獨立的,那么兩個終點成功的概率是64%(0.8 x 0.8);在這些情況下,當存在有利的藥物效應時,研究不能成功支持得出藥品有效結論的可能性為36%。為了維持期望的把握度,就需要增加樣本量,而且每個終點的把握度要達到大約90%來保證成功的概率至少為80%。如果終點有很強的相關性或者不同終點的把握度不同,會有不同的計算方法。

 

多終點的種類

 

如果需要證明藥品效應體現在疾病或臨床結局的多個方面,這對確定藥品產生的臨床獲益非常重要,那么久需要采用多終點的方法。多終點也可以用于以下的情況:(1)一個疾病有多個重要的方面或有不同的方法去評估一個重要方面,(2)無法事先知道那個終點最能體現藥品的效應,和(3)任何一個終點的效應都可以足夠支持藥品的審批。在很多情況下,疾病的多個方面可以適當地合并為一個終點,但之后的分析,針對疾病的每個方面或終點的每個部分進行檢查,就變得很重要,這樣才能獲得對藥品效應的正確理解。這種情況下下文中會進行詳細的討論。

 

(1)當兩個或兩個以上獨立的終點(聯合主要終點)來證明治療效應的時候

 

對于某些疾病,有兩個或多個特征對于所研究的疾病來講非常重要,如果藥品不能對所有的疾病特征有效的話,就不能認為這個藥品有效。本指導原則用來描述這種多個主要終點的情況所采用的術語是聯合主要終點。在各個終點都體現出療效才能說明藥品有效的時候,多個主要終點就變為聯合主要終點。

 

對急性偏頭痛的治療可以描述這種情況。雖然疼痛是最重要的特點,偏頭痛還有畏光、恐音和/或惡心,所有這些癥狀都有臨床上的重要性。在這三個癥狀中,那個是最重要的,因人而異。

 

在對急性偏頭痛進行治療臨床研究中,只有在部分受試者服藥后2小時沒有頭疼,同時部分受試者服藥后2小時沒有最難受的癥狀,在兩者都得到改善的情況下,才會要考慮藥品對偏頭痛的療效。

 

另外一個方法是用反應終點來評估藥品效應。反應終點是疼痛和根據個人情況來確定的同一受試者的第二癥狀的消除。這種方法會用到包含多個成分的單終點,而非聯合主要終點。

 

組合疫苗的臨床研究也是需要采用聯合主要終點的情況。這些疫苗的研究采用經典的設計,采用有足夠的把握度以獲得成功的結果,每個療效終點是針對每種病原體,評估疫苗所提供的保護情況。

 

正如在第III章B節中所討論的,當研究旨在證明對所有獨立終點的有效性時,不存在多重性問題。然而,聯合主要終點的檢驗增加了第二類錯誤率。一般來說,除非臨床非常重要,否則在使用兩個以上的聯合主要終點應仔細考慮,因為這樣會減少把握度。

 

有人建議,當目標a為0.05時,可以增加每個聯合主要終點的統計檢驗標準(例如,在a為0.06或0.07時進行檢驗),以適應因需要顯示對兩個終點的影響而導致的統計效能的損失。增加每個聯合主要終點的a是不可接受的,因為這樣做可能會破壞對疾病不同方面的治療效果的解釋能力,這些治療效果被認為是證明藥物有效、支持批準的關鍵。

 

(2)如果在多個終點中,有至少一個終點反映了治療效應就足夠的情況

 

許多疾病有多重后遺癥。針對任何一種后遺癥有效,都可以支持有效性的結論。如果事先不知道疾病的哪些方面會對藥物有反應,或者不知道是否有更好的檢驗治療效果的方法(在研究設計時),選擇單一的主要終點可能是困難的。在這種情況下,研究可以設計為在幾個終點中的任何一個成功都可以支持有效性的結論。這就建立了一個主終點族。例如,對于一種用于治療燒傷的藥物,目前尚不清楚該藥物是否會增加傷口愈合率或減少疤痕,但只要能證明其中一種效果就被認為是有臨床重要性的。在這種情況下,研究可能將傷口愈合率和疤痕測量作為單獨的主要終點。

 

(3)復合終點

 

在某些疾病的臨床試驗中,有一個以上的臨床結果是重要的,所有的臨床結果都將受到治療的影響。與其將每個臨床結果作為單獨的主要終點(產生多重性),或只選擇其中一個作為主要終點,指定其他的終點為次要終點,不如將這些臨床結果合并為一個單一變量。這通常被稱為復合終點,可以將某特定事件的發生或完成作為復合終點。舉一個典型的例子:在心血管研究中將主要不良臨床結局事件作為復合終點(例如,將心肌梗死、中風或死亡作為復合終點)。當終點的不同成分對應不同的事件時,通常是在任何一個終點成分第一次出現時進行終點評估。如果針對復合終點進行單個統計檢驗,則該終點不會出現多重性問題。

 

使用復合終點的一個可能的原因是,每個事件的發生率可能太低,導致研究在合理的樣本量下不能有足夠的把握度; 采用復合終點可以獲得足夠高的總事件發生率,在樣本量和研究持續時間合理的情況下,研究也具有足夠的把握度。復合終點也通常使用于治療的目標是預防或延遲某臨床重要并相關的事件的發生(例如,在冠心病患者中使用抗血小板藥物來預防心肌梗死、中風或死亡)時,可能并不知道哪些事件可能受到影響。

 

應謹慎選擇復合終點的組成成分。當單個事件的臨床重要性都很相似時,可以認為對復合事件率的治療效應可代表整體的臨床效果。然而,如果不同成分的臨床重要性有很大差異,且治療效應主要是體現在最不重要的事件上,那么對復合終點的影響就不能代表對所有成分的影響標,也就不能準確描述藥物的療效。

 

此外,即使一個或多個不那么重要的事件類型受到了有利的影響,也有可能一個更重要的成分會在接受治療后產生的不利影響,因此,盡管總體的統計結果是有利的,但這種治療的臨床價值是可疑的。在這種情況下,盡管總體統計分析表明治療是有益的,但通過對數據的仔細檢查,可能會對這一結論提出質疑。因此,為了更深入地了解治療的效應,對復合終點的組成部分的分析很重要(見第三章D節),并可能對整個研究結果的解釋產生影響。

 

對各成分的檢查總是必要的,但是否要對多重性進行調整,這取決于研究目的。如果研究的目的是為了更好地理解對復合終點效應,則不建議進行多重性調整。在這種情況下,需要通過臨床判斷來確定獲益是否具有臨床意義,而且獲益多于風險,以及如何在FDA批準的標簽中進行描述。如果目的是建立藥物的其他效應,那么應該進行多重性調整。

 

(4)多成分的終點

 

多成分終點是兩個或多個成分的個體內組合。針對這一終點,對個體的評價依賴于對該個體中所有指定成分的觀察。然后根據指定的規則確定對個體的整體評級或確定個體的整體狀態。

 

單個個體的總體評分可以由單個域得分的某種平均值(加權或不加權)組成。多成分終點的一個例子是精神分裂癥研究中的陽性和陰性綜合征量表(PANSS)。多成分終點也可以是二分變量(響應),對應于每個個體針對多成分中的每個成分是否能達到指定的標準。例如,在異體胰島細胞治療1型糖尿病的臨床研究中,主要終點可以是反應率,但只有受試者同時滿足兩個二分反應標準: HbA1c正常范圍和低血糖消除,才被認為是有反應。

 

還有更復雜的終點公式,其中一種疾病的幾種(但不是全部)不同特征必須受到積極影響,才能被視為受益。例如,在美國風濕病學會(ACR)的類風濕關節炎評分系統中,對單個受試者的有效的反應可能被定義為對一種疾病的兩個特定方面有一定程度的改善,以及至少五個附加疾病特征中的三個得到改善。

 

如果對不同成分的治療效應在一個受試者內總體上呈相同的趨勢,那么使用受試者內多成分終點可能是高效率的。

 

然而,如果終點之間的一致性有限,對研究的把握度可能會產生不利影響。

 

雖然與聯合終點相比,多組份終點可以提供更高的效率,但研究對象內特定多組份終點是否是適當的,這通常是由臨床而不是統計來決定的。

 

類似于第III章C3節中對復合終點的各個終點成分的評估,在美國,對多成分終點的某成分的評估可能也是重要的,但如果研究目的是為了支持治療如何影響某特定成分的結論,則應事先說明并進行多重性調整(見第III章D節)。

 

(5)關鍵臨床終點過于罕見,不能用作主要終點

 

對于許多嚴重的疾病,有的終點是有重要臨床意義的。不對這樣的終點數據進行收集和分析是不合理的;常見的例子是死亡或主要發病事件(如中風、骨折、肺功能衰竭)。如果藥物對復合主要終點的影響已被證實,即使在研究中這些事件的發生相對較少,也可以將這些事件包含在復合終點中(見第III章C3節),并做為次要終點,可能可以支持對該終點產生效應的結論。

 

復合終點和多成分終點的單個成分

 

(1)對復合終點的結果的評估和報告

 

對于其成分與事件對應的復合終點,事件通常定義為任何指定成分事件的第一次出現。這樣的復合終點可以在研究結束時通過比較研究組之間的比例或使用時間-事件分析進行分析。

 

當在研究的觀察時間范圍內,無事件的持續時間具有臨床意義時,時間-事件分析方法是更常見的方法。盡管人們可能期望藥物對復合終點的所有成分都有良好的效果,但這并不一定。

 

因此,每個成分事件的結果應單獨審查,并應包括在研究報告中。這些分析不會改變關于復合主要終點的統計學顯著性的結論。然而,對復合終點結果的解釋可能是不確定的(見第III章C3節)。如果有興趣將復合終點的一個或多個成分作為不同的假設來分析,以證明藥物的效果,這些假設應該是預先指定的統計分析計劃的一部分,該計劃應考慮到,如上所述的死亡率的分析,將產生的多重性。但是,對單個終點成分的檢驗可能沒有足夠的檢驗效能,因為樣本量或事件總數通常是根據對復合終點的檢驗來計算的。

 

通常對首個復合事件進行分解,以描述各事件組成部分在復合事件中所占的比例。例如,在RENAAL研究中(Brenner et al. 2001),主要療效終點是首次出現兩倍血清肌酐水平、終末期腎病或死亡的復合終點。基于這種分解,52%的首發復合事件是血清肌酐水平加倍,19%是終末期腎臟疾病事件,29%是死亡。然而,受試者可能經歷不止一種事件類型。對于這些受試者,在第一次復合事件之后發生的事件(例如,終末期腎臟疾病或血清肌酐翻倍后發生的死亡)不會進行分解統計。因此,在對包含相關事件類型的所有事件(甚至是發生在其他類型事件之后的事件)的分析中,對單個事件類型的評估也很重要。這樣的分析可以證明藥物可能的額外效果,如果它們是預先指定的、充分考慮了多重性、并且結果是可解釋的。

 

(2)評估和報告其他多成分終點的結果

 

與復合終點一樣,了解受試者內多成分終點的哪些成分對總體統計顯著性貢獻最大,這對于正確理解藥物的臨床效果可能很重要。因此,對單個成分的研究結果的分析通常是重要的,但如前所述,如果進行了這樣的分析,不應在FDA批準的標簽中暗示這是統計學上嚴謹的結論或傳達以確定性的方式總結該研究不支持的效應。對于許多這些多成分終點,綜合評分被認為是全面的,而且是臨床上可解釋的。然而,單個成分量表可能或不能是獨自具有臨床上的解釋。將臨床結果評估的某個特定組成部分或子域作為主要或次要終點家族中的明確終點進行分析是合理的,前提是該終點在臨床上是可解釋的。如果為了表明除總體多成分終點外,藥物對一個或多個這些終點的作用,建議對這些特定的終點成分或子域進行多重性的控制。

 

4、方法學的考慮

 

在第II章和第III章討論了產生多重性的各種情況。

 

當存在一系列終點時(在第III章A節中討論),無論其他終點是否存在治療效果,在至少一個終點中錯誤地發現統計上顯著的治療效果的概率為總體I類錯誤概率。這個錯誤率通常保持在0.05(或單側檢驗的0.025)。將錯誤率控制在所需水平的統計方法可以在單個終點上得出有效的結論。

 

有許多常用的統計方法來解決多終點相關的多重性問題(Hochberg和Tamhane 1987)。

 

附錄給出了一些常用的統計學方法。例如Bonferroni, Holm (Holm 1979)和Hochberg (Hochberg 1988)程序,這些方法在無效假設上不假定任何層次(例如,終點族中的任何單個無效假設都可以被拒絕,而不管其他假設是否被拒絕)。其他可行的方法結合了部分alpha分配和分層,如附錄中的圖形方法(Bretz et al. 2009)。如果在任何一個被考察的終點中發現統計學上有顯著性意義的治療效應被認為是成功的,那么就應該采用適當的方法,對終點族的多重性進行調整。

 

然而,如果基于臨床上的重要性,終點是有序的,或在邏輯上是相關的,那么可以推薦不同的方法(例如,Pocock等人,2012)。例如,對于一個簡單的情況,只有一個主要終點和一個次要終點,可以使用分層檢驗方法。已經開發了一些方法來解釋終點之間更復雜的邏輯/層次關系,如圖形法(例如,Bretz等,2009)和mixture gatekeeping程序(Dmitrienko等,2008)。

 

圖形法具有順序檢驗算法,并且可以通過圖形可視化測試過程。

 

在某些情況下,一個主要終點要先進行非劣效檢驗(固定界值),然后進行優效性檢驗。如果這個終點是進行統計檢驗的唯一終點,那么非劣性和優效性檢驗可以不需要對多重性進行調整,因為非劣性和優效性檢驗的無效假設是自然有序的,并且兩個檢驗都是在該終點的同一層級。但是,如果統計檢驗包含了至少有一個終點,那么就會出現多重性的問題,應該對多重性進行調整,以控制總體的I類錯誤的概率。

 

例如,統計檢驗可以通過排序,在一個層級中開展,其中附加終點在主終點的優效假設之后進行檢驗。或者,另外一個方法是,可以在對主要終點進行優效性假設檢驗的同時,對附加終點進行假設檢驗,并在多個假設之間進行alpha分配。為了了解為什么這樣的alpha分配是適用的,假設藥物就主要終點而言不劣于陽性對照,但對于藥物既不在主要終點優于陽性對照,也不在次要終點上非劣于的陽性對照。在這種情況下,I類錯誤可能發生在這些假設檢驗中的任何一個。如果這兩項都以0.05的顯著性水平進行檢驗,那么其中至少一項導致錯誤結論的概率將大于0.05。

 

因此,應該以某種方式進行適當的控制(例如,只有在主終點的優效性顯示出來后才測試次要終點,或者在兩個測試之間進行alpha分割)。關于這一特殊情況和其他方法上的考慮的進一步討論載于附錄中。

 

— 總結 —

 

對療效做出錯誤的有效的結論(即,錯誤地認為一種藥物具有積極的治療效果,但實際上是無效的)是一個主要的問題。一種常見的方法是:對于存在治療差異的錯誤結論,將I類錯誤率控制在5%(1 / 20的幾率)以下,對于有效性的假陽性結論,控制在2.5%(1 / 40的幾率)以下。隨著終點數量或分析數量的增加,由于多重性的影響,I類錯誤率可能會遠遠超過2.5%。

 

如本指導原則所述,在采用多終點評估藥物療效時,多重性調整為對I類錯誤率的控制提供了方法。如本指導原則所述,可酌情使用許多策略和方法。這些方法各有優缺點,選擇合適的策略和方法是研究計劃階段必須迎接的挑戰。應利用統計專業知識來幫助選擇最適當的方法。如果不能適當地對I類錯誤率進行控制,就會增加假陽性結論的風險;本指導原則旨在闡明何時以及如何管理由多個終點引起的多重性,以避免得出錯誤的結論。

 

分享到:

來源:同寫意

主站蜘蛛池模板: 国产精品久久久久久久新郎| 国产偷国产偷亚洲清高| 99国产午夜精品一区二区天美| 国产一区二区三区伦理| 欧美日韩高清一区二区| 久久99精品久久久野外直播内容| 91一区在线观看| 视频一区二区三区中文字幕| 精品91av| 国产69精品久久久久777糖心| 亚洲精品日本久久一区二区三区| 一区二区三区四区视频在线| 久久久国产精品一区| 日本精品一区二区三区视频| 国产精品二区一区| 好吊妞国产欧美日韩免费观看网站| 男女午夜爽爽| 国产欧美一区二区在线观看| 午夜电影三级| 国产精欧美一区二区三区久久久| 99精品久久99久久久久| 欧美日韩一级二级三级| 狠狠色丁香久久综合频道 | 国产精品久久国产精品99| 亚洲欧美日韩综合在线| 日韩电影在线一区二区三区| 26uuu亚洲国产精品| 91麻豆精品国产91久久久资源速度| 国产精品日韩三级| 国产剧情在线观看一区二区| 久久精品com| 精品国产乱码久久久久久图片| 日韩av一区二区在线播放| 亚洲乱视频| 国产一区二区在| 亚洲视频h| 美国三级日本三级久久99| 一区二区三区在线观看国产| 四虎国产永久在线精品| 国产精品视频一区二区二| 日韩精品一区二区不卡| 欧美日韩国产影院| 97精品国产aⅴ7777| 欧美性猛交xxxxxⅹxx88| 欧美精品xxxxx| 视频一区二区国产| 国产日产精品一区二区三区| 狠狠色噜噜狠狠狠狠色综合久老司机| 午夜电影三级| 国产乱码一区二区三区| 国偷自产中文字幕亚洲手机在线 | 国产精品久久久视频| 丰满岳乱妇bd在线观看k8 | 国产69精品久久久久777糖心| 国产午夜三级一二三区| 欧美在线视频二区| 亚洲精品丝袜| 久久精品一二三四| 亚洲四区在线| 欧美黑人巨大久久久精品一区| 69久久夜色精品国产7777| 99久久国产综合精品色伊 | 色偷偷一区二区三区| 99er热精品视频国产| 国产99视频精品免视看芒果| 欧美亚洲视频二区| 激情欧美一区二区三区| 国产精品99一区二区三区| 91精品国产高清一二三四区 | 欧美日韩久久一区| 久久精品com| 一区二区三区日韩精品| 四虎国产永久在线精品| 99国精视频一区一区一三| 色乱码一区二区三区网站| 国产精品一区二区免费视频| 日韩欧美中文字幕精品| 国产精品理人伦一区二区三区| 国产三级在线视频一区二区三区| 精品国产乱码久久久久久久久| 国产日韩欧美91| 亚洲欧洲日韩av|