以下文章來源于:藥明康德
人工智能(AI)在醫(yī)學(xué)領(lǐng)域中的應(yīng)用一直備受關(guān)注。尤其是在分析醫(yī)學(xué)影像圖片方面,AI很早就被開發(fā)用于該領(lǐng)域。在今年的歐洲心臟病學(xué)會年會(ESC 2022)上,來自西達賽奈(Cedars-Sinai)醫(yī)學(xué)中心Smidt心臟研究所的心臟病學(xué)家David Ouyang教授分享了一項前瞻性雙盲試驗,該研究在真實的臨床環(huán)境中將AI模型與超聲醫(yī)師對經(jīng)胸超聲心動圖評估的結(jié)果進行了比較,結(jié)果顯示,就連經(jīng)驗豐富的心臟病學(xué)家都無法區(qū)分哪些結(jié)果是經(jīng)“AI之手”得出的,哪些結(jié)果是來自于人類臨床醫(yī)生的判斷。此外,相比于人類臨床醫(yī)生的初始評估結(jié)果,AI生成的結(jié)果需要專家校正的比例更少。該研究中使用到的AI模型EchoNet-Dynamic是一種利用多個心臟周期的超聲心動圖視頻進行訓(xùn)練的深度學(xué)習(xí)算法。在此前的研究中,該模型在分割左心室、估計射血分?jǐn)?shù)和評估心肌病等關(guān)鍵項目中的表現(xiàn)超過了人類專家,在左室射血分?jǐn)?shù)(LVEF)的評估方面,平均絕對誤差僅為4.1-6.0%。
在此次進行報告的EchoNet-RCT試驗中,研究人員將3495例經(jīng)胸超聲心動圖按1:1的比例隨機分配給AI模型或平均擁有14年以上經(jīng)驗的超聲醫(yī)師進行初步評估,記錄的報告內(nèi)容包括LVEF的第一次讀數(shù)或是將血液泵出到身體其余部分的心肌強度數(shù)據(jù)。隨后,研究人員把AI模型和超聲醫(yī)師的報告混合后提交給資深心臟病學(xué)家進行最終的審評。研究發(fā)現(xiàn),與人類臨床醫(yī)生相比,心臟病專家對AI模型生成的報告進行的校正較少——AI組僅有16.8%的報告與心臟病專家評估的LVEF相比具有實質(zhì)性的變化(數(shù)據(jù)差異>5%),而超聲醫(yī)師組的這一數(shù)據(jù)為27.2%。此外,即使是需要進行校正的數(shù)據(jù),AI模型做出的即時讀數(shù)相比于人類醫(yī)生也更接近標(biāo)準(zhǔn)值。AI模型校正射血分?jǐn)?shù)讀數(shù)大部分在2.8個百分點以內(nèi),而人類醫(yī)生的校正射血分?jǐn)?shù)讀數(shù)平均在3.8個百分點。最重要的是,AI模型平均在2分鐘內(nèi)就能完成對一名患者的讀數(shù),在效率方面也十分出色。有趣的是,研究人員還要求參與的心臟病學(xué)家猜一猜手上的這份報告究竟是出自人類還是AI之手。從結(jié)果上來說,AI做出的報告足以“以假亂真“。心臟病學(xué)家只猜對了其中三分之一的報告,而剩下的報告要么無法分辨,要么直接猜錯。
對于這項研究,Ouyang教授表示:“盲法試驗可以防止人們對人工智能的偏見。這項研究的成功也說明了這類研究在正確的環(huán)境中的可行性很高。此外,研究結(jié)果也證明了如果以正確的方式開發(fā)和集成,AI算法可以簡化原本繁瑣但重要的任務(wù)、提高超聲波讀數(shù)的質(zhì)量和效率,從而節(jié)省超聲醫(yī)師和心臟病專家的時間和精力?!?/span>來自西北大學(xué)的心臟病學(xué)教授James Thomas在會上發(fā)表了點評:“如何在日常臨床實踐中證明AI模型的價值?或許盲法臨床試驗是一個不錯的主意。這項研究表明與超聲醫(yī)師費力追蹤超聲掃描中的讀數(shù)相比,AI模型似乎能夠顯著改善這項流程。如果這項研究能使超聲醫(yī)師不再需要花時間在這上面,他們得給研究人員頒發(fā)一塊金牌!”盡管這項研究的結(jié)果很突出,但大規(guī)模地將這個“計算機幫手”整合到現(xiàn)有的超聲心動圖系統(tǒng)之前還有待進一步的性能驗證,以評估這款A(yù)I模型在不同健康中心的不同硬件設(shè)施上是否也有同樣出色的表現(xiàn)。此外,獲得監(jiān)管機構(gòu)的許可也是必要的條件。“我們是不是可以期待未來有一天,會專門開設(shè)將獲得FDA批準(zhǔn)的AI算法納入其中的應(yīng)用商店呢?” Thomas教授如是說。
[1] ESC 2022: Ultrasound AI outperforms human clinicians in randomized, blinded study. Retrieved August 27, 2022, from https://www.fiercebiotech.com/medtech/esc-2022-ultrasound-ai-outperforms-human-clinicians-randomized-blinded-real-world-study[2] Hot Line - AI assessment of LVEF is superior to sonographer assessment: Results from the EchoNet-RCT trial. Retrieved August 28, 2022, from https://www.escardio.org/Congresses-&-Events/ESC-Congress/Congress-news/hot-line-ai-assessment-of-lvef-is-superior-to-sonographer-assessment-results[3] Ouyang, D., He, B., Ghorbani, A. et al. Video-based AI for beat-to-beat assessment of cardiac function. Nature 580, 252–256 (2020). https://doi.org/10.1038/s41586-020-2145-8