2025年7月,邁瑞的AI乳腺超聲輔助評估軟件(Smart Breast)進入創新醫療器械特別審查通道,乳腺超聲輔助診斷AI軟件再次成為醫療器械行業的焦點。
乳腺超聲輔助診斷AI軟件是基于深度學習算法,通過對大規模乳腺超聲圖像訓練,用于自動病灶檢測與分割、病灶測量與參數計算、智能生成報告及自動提供輔助診斷建議,為乳腺癌預防提供了技術保障。
本文基于瑞旭CRO在乳腺超聲輔助診斷AI軟件臨床試驗經驗及相關指導原則,從臨床試驗設計類型、金標準及閱片方式、評價指標等關鍵要素進行了分析和設計經驗分享,為乳腺超聲輔助診斷AI軟件的臨床試驗設計提供參考。
乳腺超聲輔助診斷AI軟件臨床試驗設計類型
乳腺超聲輔助診斷AI軟件的臨床意義在于提升臨床醫生對于病變檢測的準確度以及工作效率,因此需開展對照試驗,可設置試驗組為AI輔助臨床醫生閱片,對照組為臨床醫生獨立閱片??紤]乳腺超聲輔助診斷AI軟件為基于非實時影像的輔助檢測產品,因此可優先考慮選擇MRMC(Multi-Reader Multi-Case 多閱片者多病例)設計。MRMC有多種設計方式,可采用其中常見的配對閱片者配對病例設計,即全部閱片者對每一種閱片方式下所有患者的影像數據給出閱片結果。該設計為全交叉設計,醫生需要采用不同的閱片方式閱片,后一種閱片方式下醫生的判讀可能會受到記憶中前一閱片方式下的信息干預而影響結果,因此在兩種閱片方式之間可設置適當的洗脫期。建議設置至少4周的洗脫期,因為洗脫期間隔時間越長,閱片過程中記憶偏倚相對越小。具體新閱片流程如下圖:
備注:影像數據分為4組,A代表該組影像數據的閱片方式為AI輔助臨床醫生閱片,B代表該組影像數據的閱片方式為臨床醫生獨立閱片。
乳腺超聲輔助診斷AI軟件臨床試驗金標準和閱片者
(1)金標準
可采用3位高年資(具有高級職稱,10年以上工作經驗)臨床影像科專家獨立閱片建立金標準。三位專家獨立閱片并給出診斷結果,最終以一致率≥2結果作為一致的診斷結果,即該例患者影像的最終結果。
(2)閱片者要求
考慮到乳腺超聲輔助診斷AI軟件的預期使用情況,并且為充分反映該軟件對不同年資醫生診斷能力的提高,試驗中可同時納入低、中、高不同年資的醫生。此外還應注意,參與金標準建立的專家不再作為閱片者參與閱片。
乳腺超聲輔助診斷AI軟件臨床評價標準
乳腺超聲輔助診斷AI軟件臨床試驗優先考慮ROC曲線下面積(Area Under Curve,AUC)、靈敏度、特異度等診斷準確性指標為主要評價指標。同時,臨床試驗設計時應考慮整體的優效設計。當主要評價指標設置為基于病例水平BI-RADS評級的AUC(基于陽性、陰性兩分法,以BI-RADS評級≥4為陽性)時,最終的臨床試驗結果應為AI輔助閱片的AUC優于醫生獨立閱片的AUC,此時可認為臨床試驗成功。
乳腺超聲輔助診斷AI軟件臨床試驗次要評價指標
(1)基于病例水平的靈敏度、特異度(基于陽性、陰性兩分法,以BI-RADS評級≥4為陽性);
(2)AI輔助閱片和醫生獨立閱片所用時間平均值;
(3)不同工作經驗(低年資、中高年資)的醫生由AI軟件輔助閱片和醫生獨立閱片時的AUC;
(4)在病例水平的特異度下,不同病灶大?。ㄖ睆綄⑵浞譃?le;10 mm組、>10 mm且<20 mm組及≥20 mm組)時,AI輔助閱片和醫生獨立閱片的靈敏度。
此外還應收集試驗過程中發生的不良事件和器械缺陷等,作為安全性評價指標對該AI軟件的安全性進行評價。
結束語:
當AI 遇見乳腺超聲,技術終點不是“算法多準”,而是“醫生更好用、患者更早獲益”。愿更多乳腺超聲輔助診斷AI產品能早日通過臨床試驗驗證并獲得注冊批準,兌現乳腺癌“早篩早治”的承諾。