近日,《Nature Medicine》上發(fā)表了一項(xiàng)重磅研究:來自紐約大學(xué)醫(yī)學(xué)院的研究人員開發(fā)了一個(gè)新的機(jī)器學(xué)習(xí)程序,不僅能夠以97%的準(zhǔn)確率確定患者的肺癌類型,甚至還可以識別導(dǎo)致異常細(xì)胞生長的變異基因!
本文來源:藥明康德AI
肺癌是生存率最低的癌癥之一,據(jù)統(tǒng)計(jì),在美國每年有超過15萬人死于與疾病相關(guān)的并發(fā)癥。更讓人沮喪的是,在過去四十年中,盡管癌癥患者的總生存率提高了2倍多,但肺癌患者的生存率幾乎沒有提高。目前僅有5%的肺癌患者生存期超過10年。在肺癌的診斷和治療方面,人們還有很長的路要走。
研究人員團(tuán)隊(duì)使用了來自Google的深度卷積神經(jīng)網(wǎng)絡(luò)Inception v3,并使用來自The Cancer Genome Atlas(TCGA)數(shù)據(jù)集的1634張圖像對其進(jìn)行了重新訓(xùn)練。TCGA是一個(gè)由美國國家癌癥研究所(NCI)和美國國家人類基因組研究所(National Human Genome Research Institute,NHGRI)維護(hù)的公共數(shù)據(jù)集,包含了33種不同類型的癌癥,以及每種癌癥中存在的基因組變化數(shù)據(jù)。
▲上圖為AI模型從癌變組織圖像中識別兩種肺癌類型的示意圖。其中左圖為原始圖像,右圖為AI輸出的肺癌類型圖譜。右圖中的紅色部分為鱗狀細(xì)胞癌,藍(lán)色部分為肺鱗狀細(xì)胞癌,灰色部分為正常肺部組織(圖片來源:NYU School of Medicine)
在完成了對Inception v3的訓(xùn)練之后,研究人員開始使用該神經(jīng)網(wǎng)絡(luò),來區(qū)分腺癌(LUAD)和鱗狀細(xì)胞癌(LUSC),這兩種癌癥都是肺癌最常見的形式。結(jié)果顯示,盡管樣本中出現(xiàn)了在之前訓(xùn)練中從未出現(xiàn)的特征,比如血塊、炎癥、壞死區(qū)域和肺萎縮等等,Inception v3仍然可以正確識別絕大部分樣本中的肺癌類型,正確率最高可到達(dá)97%。更加令人印象深刻的是,該模型在一臺擁有單一圖形處理器的電腦上運(yùn)行時(shí),平均計(jì)算時(shí)間只需短短20秒。
有趣的是,研究人員發(fā)現(xiàn),在被AI程序錯(cuò)誤分類的那一小部分腫瘤圖像中,約有一半也被病理學(xué)家錯(cuò)誤地進(jìn)行了分類,這一點(diǎn)表明了區(qū)分兩種肺癌類型的難度。另一方面,在54幅被至少一位病理學(xué)家分類錯(cuò)誤的圖像中,機(jī)器學(xué)習(xí)正確識別出了其中45幅的癌癥類型,這一點(diǎn)說明人工智能可以為醫(yī)生提供有用的補(bǔ)充信息。
除了對疾病類型的識別外,研究人員還訓(xùn)練Inception v3識別癌變組織內(nèi)的突變基因。利用腫瘤外觀的細(xì)微差異,AI模型可以預(yù)測在細(xì)胞中是否存在與肺癌相關(guān)的6個(gè)突變基因,這6個(gè)基因分別為STK11、EGFR、FAT1、SETBP1、KRAS和TP53。針對不同的突變基因,Inception v3的預(yù)測準(zhǔn)確率也不同,總體介于73%到86%之間。
“總的來說,這項(xiàng)研究表明深度卷積神經(jīng)網(wǎng)絡(luò)可能會成為一個(gè)非常有用的工具,幫助病理學(xué)家對肺部組織圖像進(jìn)行分類,”研究人員在論文中寫道:“有了這些至關(guān)重要的信息,就可以為肺癌患者量身定制適合他們的靶向療法,從而增加精準(zhǔn)治療的范圍和效果。”
▲該研究的通訊作者之一、紐約大學(xué)Langone’s Perlmutter Cancer Center病理系副教授Aristotelis Tsirigos博士(圖片來源:紐約大學(xué)官網(wǎng))
“推遲癌癥治療永遠(yuǎn)不會對患者有益,”該研究的通訊作者之一、紐約大學(xué)Langone’s Perlmutter Cancer Center病理系副教授Aristotelis Tsirigos博士表示:“我們的研究提供了強(qiáng)有力的證據(jù),表明機(jī)器學(xué)習(xí)能夠即時(shí)確定癌癥亞型和基因突變特征,有助于讓患者更早開始接受靶向治療?!?nbsp;
未來,研究團(tuán)隊(duì)計(jì)劃繼續(xù)對該AI程序進(jìn)行進(jìn)一步的數(shù)據(jù)培訓(xùn),使其能夠以超過90%的準(zhǔn)確率確定哪些基因在特定癌癥中發(fā)生突變。屆時(shí)他們將會申請將該技術(shù)用于臨床,來輔助進(jìn)行不同癌癥類型的診斷工作。
參考資料:
[1] Artificial intelligence can determine lung cancer type. Retrieved September 19, 2018, from https://www.eurekalert.org/pub_releases/2018-09/nlh-aic091718.php
[2] Coudray, et al., (2018). Classification and mutation prediction from non–small cell lung cancer histopathology images using deep learning. Nature Medicine, doi: http://dx.doi.org/10.1038/s41591-018-0177-5
[3] NYU applies open source Google AI to diagnose lung cancer. Retrieved September 19, 2018, from https://venturebeat.com/2018/09/17/nyu-trains-open-source-google-ai-system-to-diagnose-lung-cancer/