雖然目前有十幾個獲批用于乳腺癌篩查的人工智能系統(tǒng),但很難客觀地評估它們的臨床表現(xiàn)。然而,現(xiàn)在有一個瑞典驗證平臺可以比較人工智能系統(tǒng)檢測乳腺癌跡象的能力——它的開發(fā)是由卡羅林斯卡學院的研究人員領(lǐng)導的。
該試點項目于 2021 年啟動,該平臺已于去年準備好進行試用。到目前為止,它已被用于根據(jù)來自瑞典三個地區(qū)的約 40,000 張乳房 X 線照片開始評估三個不同公司的算法。
“評估可能在臨床上使用的 AI 算法的診斷準確性非常重要,”項目負責人、卡羅林斯卡學院腫瘤病理學系研究員、卡羅林斯卡大學醫(yī)院放射科醫(yī)生 Fredrik Strand 說。“即使它們符合監(jiān)管要求,也不意味著它們在所有情況下都有效。”
在發(fā)表在《醫(yī)學影像學雜志》上的一篇論文中,研究人員描述了他們是如何設(shè)計該平臺的,希望更多的團隊能夠開發(fā)出類似的平臺。
實現(xiàn)人工智能系統(tǒng)的客觀評估
Fredrik Strand說:“通過讓我們的代碼可以免費訪問,我們希望它能用于實施類似的平臺,用于對除乳腺癌以外的其他類型的癌癥進行算法評估,”他補充說,人們熱切期待這種客觀評估。該國的幾個地區(qū)已經(jīng)在考慮開始使用 AI 進行乳房 X 光檢查。
“迫切需要一個可以在當?shù)叵嚓P(guān)條件下評估算法的系統(tǒng),”他說。“重要的是,每家醫(yī)院都選擇適合其要求和特定情況的正確系統(tǒng),以避免遺漏乳腺癌或召回過多的健康女性。”
目前還沒有針對指定數(shù)據(jù)集的既定評估程序來評估 AI 算法在醫(yī)學診斷中的準確性。人工智能系統(tǒng)的制造商已經(jīng)在不同的數(shù)據(jù)集上訓練和測試了他們的算法,這些結(jié)果用于監(jiān)管批準。在該平臺中,所有算法都處理相同的圖像,并將結(jié)果與??從國家乳腺癌質(zhì)量登記冊 (NKBC) 中提取的實際癌癥診斷數(shù)據(jù)進行比較,揭示算法之間的差異。由于今天的 AI 算法已經(jīng)針對開發(fā)人員可以訪問的特定人群進行了訓練,因此它們可能包含應(yīng)該識別的偏差。
標簽:
免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!