理大研發 | 精準心血管診斷影像,時間感知及抗雜訊革新技術
  • 2025-06-25 14:50

香港理工大學團隊開發了一項名為「MemSAM」的人工智能模型,該模型採用了革新性的超聲波心動圖影片分割技術,有望大幅降低成本及解讀影像所需的專業知識門檻,從而提高疾病的早期發現率。成果已於去年發表於 IEEE,題為 MemSAM: Taming Segment Anything Model for Echocardiography Video Segmentation。

論文:

 

研究背景

超聲波心動圖,在評估心臟功能方面非常重要,但影像常出現斑點雜訊與模糊邊界等問題,尤其因為心臟運動的動態特性,在不同畫面之間會出現顯著差異。這時需要大量的專業知識和時間來解讀,進而影響了常規體檢計劃中對心臟相關檢查的涵蓋率。由 Meta AI 推出的 Segment Anything Model(SAM)是專門用於影像分割的先進 AI 模型,但時間一致性的缺乏,以及顯著的雜訊,限制了其在醫學影像中的直接應用。

研究成果

香港理工大學護理學院秦璟教授及團隊與深圳大學學者合作,改良 SAM 而創造出名為「MemSAM」的新模型,以配合醫學影像的特定需求。其中的關鍵技術是時間感知提示以及記憶強化。

時間感知提示,是透過時空記憶引導分割的過程。該記憶機制包含了空間及時間線索,使模型能夠在不同畫面之間維持一致,避免由遮罩傳播而導致的錯誤識別問題。

記憶強化機制則是利用預測遮罩,突顯前景特徵,並降低背景雜訊的影響,同時防止錯誤資訊在記憶中累積。

這一技術還使得 MemSAM 能夠在標註資料有限的情況下保持表現。在臨床實務中,超聲波心動圖的標註工作需要大量人力,通常會導致標註稀疏,一般僅限於收縮末期和舒張末期等關鍵畫面。而此新技術處理影片序列的後續影片時,不用依靠外部提示,而是靠記憶提示,大幅降低對密集標註及外部提示的需要。MemSAM 在半監督設定下表現出色,媲美完全監督模型,同時所需的標註及提示遠少於後者。其在 CAMUS 及 EchoNet-Dynamic 兩個公共資料集上進行了嚴格測試,表現比現有模型更為優勝。

研究團隊表示,MemSAM 可視為超聲波心動圖影片分割領域的一大突破。未來的研究目標是提升模型的效率和穩健性,探索在其他醫學影像領域的應用。

 

來源:香港理工大學,IEEE

 


 

如欲知道更多教科相關消息,請留意京港 Facebook 專頁:https://www.facebook.com/BHKAEC

返回頂部