楊光
近日,百度研究院發(fā)表論文提出一種名為“神經(jīng)條件隨機場”的全新病理切片分析算法,將腫瘤識別定位準確率大幅提高。在公開數(shù)據(jù)集 Camelyon 16大賽測試集上,該算法的腫瘤定位 FROC 分數(shù)達到0.8096,超過專業(yè)病理醫(yī)生水平及由哈佛和麻省理工學院聯(lián)合團隊保持的最好成績。
病理切片分析是癌癥診斷中的黃金標準,但病理切片的閱片流程十分困難復(fù)雜。一張被放大40倍的電子化病理切片通常由超過十億個像素點組成,磁盤空間大小超過1GB。然而淋巴結(jié)附近微轉(zhuǎn)移腫瘤細胞群可能最小只有不到1000像素的直徑。而一旦發(fā)現(xiàn)微轉(zhuǎn)移腫瘤細胞群,病人的治療方案和預(yù)后可能就會有極大差別。因此,詳盡的閱讀病理切片,且不漏掉任何一處具有臨床價值的病灶,如同大海撈針,是一項十分復(fù)雜和耗時的任務(wù)。
百度研究院提出一種全新的深度學習算法,一次性輸入一組3x3的圖塊,并聯(lián)合預(yù)測每張圖塊是否有腫瘤區(qū)域。圖塊間的空間關(guān)系可通過一種名為“條件隨機場”的概率圖模型來模擬。整套算法框架可在 GPU 上進行端到端的訓(xùn)練,而不需任何后處理的步驟。由于考慮到了相鄰圖塊之間的空間關(guān)系,該算法讓假陽性得以大大降低,算法預(yù)測的腫瘤區(qū)域也更加平滑。對比之前的算法,該算法除了真實腫瘤區(qū)域外,幾乎沒有引入任何其他假陽性區(qū)域。
同時,百度研究院也在 Github 上開源了整套算法代碼,以便其他研究人員在此基礎(chǔ)上進行更深入的研究,促進人工智能在醫(yī)學圖像分析領(lǐng)域取得更加長足的發(fā)展。