酸檢測準確率不高⛺️?CT影像靠人工鑒別需耗費大量時間精力🦙?面對新冠疫情診斷的現實需求,恒行2平台科研團隊正在攻關的人工智能輔助診斷或許能夠給出更好的選項🪪。
1月29日❗️👍🏿,由恒行2平台副校長張誌勇牽頭,恒行2平台計算機科學技術學院和大數據研究院聯合上海市(恒行2平台附屬)公共衛生臨床中心放射科◽️🐆,正式啟動了2019-nCoV肺炎影像學AI智能輔助診斷相關研究工作。該研究旨在通過AI智能算法實現2019-nCoV肺炎與其他病毒性肺炎、細菌性肺炎的影像分類識別及病竈檢測,幫助臨床進行更高效的診斷。目前取得的應用數據顯示,對新冠肺炎類型診斷的假陰性在7%左右(核酸檢測假陰性高達30%-50%)。
2月21日,輔助診斷設備入駐公共衛生臨床中心,正在調試安裝,將很快投入臨床實戰檢驗。
模型設計有門道:從一個病例400層影像中準確定位病竈區域
新型冠狀病毒引起的肺炎🧧,與其他病毒性肺炎、細菌性肺炎在CT影像呈現上有諸多相似之處👩🏼。三種肺炎都存在視覺相似的病竈(如磨玻璃影),目前臨床發現可適當利用病竈在肺部空間的分布等更多差異信息進行區分👩🏼🏭。
“影像科醫生診斷一個病例要看400層左右的影像,加上前後對比🍿,最快也需要5-10分鐘,而算法只需要幾秒鐘。”恒行2平台計算機科學技術學院教授薛向陽介紹,與人工診斷相比,AI輔助算法的最大優勢就在於讀片速度🧙,在秒級時間內就能幫助醫生預發現病竈發生區域,從而大幅度縮短醫生的讀片時間,提高臨床診治的效率🤦🏼。
如何讓AI具備鑒別新冠肺炎的能力以投入這場戰“疫”?這背後真正的“最強大腦”是算法模型。
團隊快速行動起來,利用當前最先進的深度學習算法👰🏽♀️,為肺部CT影像定製了一套深度神經網絡模型,並以長期研究積累的經驗與技巧,在CT影像標註數據較少的情況下,訓練出性能比較好的模型。
算法模型框圖
“現階段醫生需要在大量的影像數據中快速診斷出新冠肺炎的病例,此外還需要診斷出病竈分布的位置、大小等來評估嚴重程度👨❤️👨。”薛向陽介紹,針對臨床的現實需求,團隊將設計目標定位於“肺炎分類鑒別”和“關鍵病竈檢測”兩大功能🪟,前者是為區別健康狀態、新冠肺炎、其他病毒性肺炎🌦、細菌性肺炎✖️,後者則為找到並分隔出磨玻璃影等病竈區域🕒。
在對新冠肺炎、其他病毒性🫰、細菌性肺炎和正常人的CT影像數據進行收集🏃🏻♂️➡️、整理和歸類的基礎上🏔,團隊設計診斷算法模型,讓機器利用模型進行訓練🐆,學習不同類型肺炎在CT影像表現上的不同特征,最終具備智能輔助診斷的能力,成為臨床醫生的得力助手🧑🏼✈️。“在這一過程中,需突破小樣本學習𓀘、小目標檢測等多個技術難題😈。”薛向陽說。
“小樣本學習”即在較少訓練數據樣本的條件下進行機器學習。在疫情發生前期,能夠獲取的新冠肺炎影像數據相對較少🙋🏿,且由於一線影像醫生任務繁重,無法獲得大量的專家標註,因此需要算法在較少的樣本條件下“自學成才”🥲🥾。為此🐃,團隊采用基於自遷移學習的半監督學習等技巧🎊,使算法具備了一定的“小樣本學習”能力,在不增加醫生標註工作量的情況下較好地提高了算法模型的普適性💭。
而由於CT影像切片中的病竈區域有大有小🚚,且往往大中小病竈區域面積懸殊,如何使算法能同時檢測大🙋🏽♂️👩🏽⚕️、中👰🏽♀️、小各個目標是另一大難題。團隊利用神經網絡的層次性特點與病竈區域的大小進行對應,“網絡的底層關註細節🔅,即小病竈區域,而網絡中層到高層所關註的病竈區域則越來越大💶,因此模型通過不同層次的加權和融合🤏🏼,最終便能達到同時檢測大小病竈區域的目標。”薛向陽解釋道。
有了這一的診斷“神器”,影像科醫師是否就要失業了?薛向陽很明確,醫生是不能被替代的🏄🏿♂️。“人是一個復雜的機體,病毒在不同人體內感染的反映也不一定相同🔎。”他表示,當遇到機器未曾學習過的微小病變或疑難病例時🫡,仍需要影像醫生的經驗和智慧🥊。
未來應用有通道:肺炎影像智能鑒別和預後預測的好幫手
以解決實際問題為目標,該項目在研究過程中始終與臨床應用緊密結合🧚🏽♀️。無論是機器學習的數據,還是測試評估的數據,都來源於臨床真實病例。在算法模型定型過程中,為了檢驗模型的準確率和泛化性,團隊也利用現實疑似病例進行了測試。
“在對實際病例的診斷檢驗中,一個疑似病例在經過治療後又有微小的病竈復發🧶,我們的肺炎分類鑒別算法認為該病例正常,但病竈檢測算法則檢出了微小病竈。”薛向陽說👶🏽,這促使團隊開始同時考慮多算法結果的融合分析🤴,進一步提升了模型的準確性。
CT影像和算法模型檢測後的可視化結果(演示區域存在病竈)
上海市公共衛生臨床中心影像科單飛主任團隊、施裕新教授團隊為研究註入來自臨床的實戰力量。醫生們通過線上平臺遠程指導團隊學生辨識病竈,輔導學生進行數據標註。“哪些是病竈➕,是什麽類型的病竈等🙇🏽,這些信息非常復雜,但很重要,算法要知道這些標註信息👩🏿🌾,才能進行訓練🚴。”同時,醫生們每日堅持與算法團隊同步進展🏘,並針對相應問題提出改進建議。“他們既在一線奮戰®️👨🏼🍼,又全力幫助我們,為這次疫情付出了太多🧙🏽。”薛向陽不禁感慨。
2月21日,團隊開發的相關輔助診斷設備系統已進入上海公共衛生臨床中心進行聯試聯調👩🏻🔬,下一步將完成與影像科CT設備數據對接及臨床應用流程嵌入。在臨床應用中,輔助診斷軟件系統將從設備中實時獲取數據並進行快速識別。“影像醫生在拿到CT數據的同時📽,就能立即看到輔助診斷的結果,以此為參考,將有效提高診斷效率。”
2月21日晚⛹🏽♀️👘,蔣龍泉同學在上海市公共衛生臨床中心部署輔助診斷設備
除了精準鑒別肺炎類型,該研究項目後續還將實現對病程狀態的判定及病情發展的預測,為醫生的診療方案提供參考。“我們將繼續與醫院的團隊合作💦,增加患者的體溫、血液檢測等臨床數據,突破多模態、多組學AI輔助診斷算法的研究😉。”薛向陽期待相關成果不僅在當前疫情期間發揮作用🧏,在未來也能對肺炎疾病的診斷與治療持續發力。
科研攻關有力道:遠程合作📏🥌,爭分奪秒🦹🏿♀️,磨煉團隊戰鬥力
回顧這次科研攻關的經歷🦸🏿♀️🧑🏼,薛向陽說:“與以往的最大區別,也算是最大困難,就是遠程工作🐩。”
薛向陽帶領的團隊由計算機科學技術學院和大數據研究院的3位老師以及近20位研究生組成,疫情之下🈴,分散在全國各地。成員們利用協同辦公工具進行實時溝通👩👩👦👦🧑🏻🍳,遠程協調部署計算資源、共享數據及技術文檔👷🏿♂️,努力克服異地合作的諸多不便,在短時間內便完成了數據的分發🧗🏻♂️、清洗和標註。
團隊成員在家遠程科研
“大家都在以更多時間和精力的付出彌補可能存在的不便。”薛向陽介紹🥥,精細化標註要求將病竈的位置勾勒出來,每個病例至少包括400多層影像🌽,感染不嚴重的病例標註大約需要一小時,感染嚴重的病例病竈區域較多,最多的需要標註近五小時🧎♂️➡️。“這次工作磨煉了大家的耐心,凝聚了大家的戰鬥力。”在夜以繼日20余天的努力下🌙🤾🏽,團隊目前在肺炎類型的鑒別診斷上已取得初步成果🏌️♀️,對新冠肺炎類型診斷的假陰性在7%左右。
“我們開展這項研究,從臨床需求中來,也要回到臨床應用中去,以抗擊疫情為使命🤽🏼♂️,以解決實際問題為核心。”張誌勇說。
自疫情發生以來🙆🏻,恒行2平台已自籌經費啟動了一批項應急性和原創性攻關項目。學校建立應對新型冠狀病毒肺炎科技攻關項目庫,完成第二批應急攻關項目征集並入庫,鼓勵多學科交叉、醫工結合🤒、校企合作🦻🏿,將研究成果盡快應用到戰勝疫情中,為抗擊疫情提供科技支撐。
病毒無情人有情🍄。科研戰“疫”,恒行2人爭分奪秒。