孫浩
AI技術(shù)即人工智能,近幾年在各個行業(yè)得到了廣泛的應(yīng)用,如自動應(yīng)答系統(tǒng),圖文識別系統(tǒng)等。它通常有兩種實現(xiàn)方法:一種是工程學(xué)方法,采用傳統(tǒng)的編程技術(shù),使系統(tǒng)呈現(xiàn)智能效果;另一種是模擬方法,應(yīng)用到遺傳算法或人工神經(jīng)網(wǎng)絡(luò)。醫(yī)院智能審核平臺使用第一種的工程學(xué)方法,通過編程技術(shù)實現(xiàn)醫(yī)院的消息異步處理、大數(shù)據(jù)訓(xùn)練模型、醫(yī)生標(biāo)注三部分功能。該系統(tǒng)通過讀取醫(yī)院各個檢測設(shè)備的數(shù)據(jù),實現(xiàn)模擬醫(yī)生給出病人最終的健康情況診斷。醫(yī)生診斷是人為因素很大的行業(yè),不同的知識儲備和行業(yè)經(jīng)驗會得到不同的診斷結(jié)果,AI技術(shù)通過大數(shù)據(jù)分析實現(xiàn)了專家級的診斷結(jié)果,成為行業(yè)的指導(dǎo)規(guī)范,為醫(yī)生診斷提供很大的幫助作用。
消息異步處理的邏輯架構(gòu)包括讀取儀器設(shè)備信息并推送到消息隊列的程序、監(jiān)控消息隊列并處理收到的消息的程序、提供給醫(yī)生操作的智能審核平臺程序。傳輸數(shù)據(jù)采用Json格式,圖片采用二進制流傳輸,審核平臺采用微服務(wù)架構(gòu),為了保障每個API提供的服務(wù)能夠最大化的得到各個科室的共享,我們盡可能的做業(yè)務(wù)層的拆分,從自動化測試到自動化部署,為平臺的敏捷化管理提供了保障。
醫(yī)院就診病人的信息來源有兩大類設(shè)備,一種是病人掛號時的登記信息,被稱為Lis下單設(shè)備,包括病人ID、年齡、性別、需要做的檢查項目等信息;另一種是醫(yī)院各個檢測儀器返回的信息,被稱為中間件信息,包括血清檢測、尿液檢測等信息。系統(tǒng)首先通過監(jiān)測程序?qū)崟r監(jiān)測Lis下單信息,將病人基本信息及所做檢測項讀取到消息隊列中。再通過監(jiān)測中間件的程序,實時的將各個檢測項值讀取到消息隊列,當(dāng)監(jiān)測到某一病人的所有檢測項都有返回結(jié)果值了,系統(tǒng)就將這個病人數(shù)據(jù)傳入事先訓(xùn)練好的AI模型中,模型根據(jù)病人的年齡、性別、檢測項值給出一個最終診斷結(jié)果,系統(tǒng)將這個結(jié)果通過消息隊列傳輸給Lis中。醫(yī)生在自己的系統(tǒng)操作頁面可以查看到病人的整個檢測情況和系統(tǒng)給出的診斷結(jié)果,參照該結(jié)果醫(yī)生給出病人的診斷結(jié)論。
Lis下單的消息處理,分為新增檢測項、取消檢測項、重做檢測項和重做檢驗單的不同處理流程,病人的每次檢測的檢測項值都會通過歷史值查看中找到,保證每個就診病人都在大數(shù)據(jù)庫中科查詢,可追蹤。配置檢測項的范圍值,顯示順序,顯示名稱,在醫(yī)生的操作頁面就可以按配置顯示檢測項信息,低于范圍值的檢測項會有向下的箭頭標(biāo)識,超過范圍值的檢測項會有向上的箭頭標(biāo)識。
中間件的消息處理,各個設(shè)備的檢測項結(jié)果值傳輸?shù)较㈥犃兄校O(jiān)測程序?qū)⒔Y(jié)果值更新到Lis中,同時要檢測這些檢測項是否有滿足的計算項,當(dāng)計算項中包含的所有檢測項都在同一個檢驗單中,則將該計算項添加到檢驗單中,并調(diào)用公式引擎得到計算項的結(jié)果值。所有檢測項和計算項的結(jié)果值傳入規(guī)則引擎,將不通過的規(guī)則一一列出,醫(yī)生可以查看到該檢驗單的所有規(guī)則描述,同時系統(tǒng)會對不通過的檢驗單給出診斷結(jié)果,不再調(diào)用AI模型。當(dāng)所有規(guī)則都通過的檢驗單,才調(diào)用AI模型,由AI模型返回診斷結(jié)果,系統(tǒng)維護診斷值范圍,超過范圍值會以紅色標(biāo)記高風(fēng)險字樣。圖片采用二進制流傳輸,接收程序?qū)D片存儲到服務(wù)器磁盤,并調(diào)用圖片識別API,自動識別圖片中的信息保存到數(shù)據(jù)庫中,醫(yī)生在系統(tǒng)操作頁面即可預(yù)覽圖片,也可圖文信息做匯總統(tǒng)計分析。
AI模型的核心時算法,訓(xùn)練模型是為了達到高識別率的目標(biāo),通過大數(shù)據(jù)不斷的迭代測試,直到找到最優(yōu)配置。AI模型的邏輯架構(gòu)包括模型訓(xùn)練和驗證、模型管理、模型部署。其中涉及能力有模型訓(xùn)練、參數(shù)配置、訓(xùn)練任務(wù)管理、訓(xùn)練狀態(tài)可視化及管理、模型版本管理、模型文件管理、模型操作和處理、模型策略管理、模型部署及業(yè)務(wù)管理等。
通過采集儀器設(shè)備信息,醫(yī)生對采集數(shù)據(jù)做完標(biāo)注處理后,數(shù)據(jù)已經(jīng)都存儲到了AI模型庫,之后即可調(diào)用AI算法開始增量或全量的模型訓(xùn)練。在訓(xùn)練過程中訓(xùn)練狀態(tài)是可視化的,幫助業(yè)務(wù)人員對當(dāng)前訓(xùn)練任務(wù)的進度有所了解,可以對任務(wù)進行暫停、取消等操作。依據(jù)大數(shù)據(jù)可以對不同數(shù)據(jù)集同時進行多個模型訓(xùn)練,最后匯總模型準(zhǔn)確率來對模型的質(zhì)量進行驗證。
模型管理主要進行模型版本控制,是對模型有優(yōu)化更新、替代、異常等情況的管理。做到完善的日志記錄,可查詢及追溯。算法工程師會不斷的有算法更新,大數(shù)據(jù)量處理也需要有不斷優(yōu)化過程,這樣會導(dǎo)致模型有不同版本的升級,要求要有嚴(yán)格的部署流程。
模型部署主要會出現(xiàn)部署環(huán)境問題,容器化應(yīng)用程序是近年來應(yīng)用最多的技術(shù),采用Docker容器化部署,通過生成鏡像文件,只要幾行腳本命令就可以使部署文件能在不同操作系統(tǒng)下正常運行。
醫(yī)生標(biāo)注是該平臺的核心功能模塊,整體架構(gòu)包括前端采用Vue框架,后端調(diào)用API的微服務(wù)架構(gòu),服務(wù)之間通過輕量的通訊機制進行交互,系統(tǒng)在服務(wù)解耦方面上花了更多的時間,使得每個服務(wù)更專注于自己的業(yè)務(wù),滿足高內(nèi)聚低耦合的設(shè)計原則。由于一個科室平均每天會接待3000名病人,每個病人的檢測項目平均在50項左右,這樣一年的檢測項數(shù)據(jù)就會達到千萬級數(shù)據(jù)量,為了解決海量數(shù)據(jù)的快速存儲和讀取問題,平臺采用分布式負載均衡,數(shù)據(jù)庫采用主從讀寫分離設(shè)計,并充分利用緩存技術(shù)減少傳輸數(shù)據(jù)量。
系統(tǒng)角色分成平臺管理員、醫(yī)院管理員、醫(yī)生三類。系統(tǒng)功能權(quán)限分為系統(tǒng)配置、數(shù)據(jù)標(biāo)注、報表制作及查看,功能級、按鈕級和數(shù)據(jù)級權(quán)限由平臺管理員進行配置。醫(yī)生操作的數(shù)據(jù)有兩部分組成,一部分是為訓(xùn)練AI模型的數(shù)據(jù),可以用于培訓(xùn)醫(yī)生的業(yè)務(wù)操作能力,醫(yī)院管理員選定一批數(shù)據(jù),以CSV格式導(dǎo)入數(shù)據(jù)庫,并將這些數(shù)據(jù)分派給醫(yī)生,醫(yī)生登錄自己的賬號對這些數(shù)據(jù)進行標(biāo)注。系統(tǒng)進行自動過濾,所有醫(yī)生都一致認為是通過的數(shù)據(jù)直接傳給AI模型庫,只要有一個不同意見,則由專家在進行一次批注,直到所有數(shù)據(jù)都達成一致意見,再將這些數(shù)據(jù)也傳給AI模型庫。通過以上反復(fù)操作,既提高了醫(yī)生的業(yè)務(wù)操作能力,也增加了AI模型庫的知識儲備。醫(yī)生操作的另外一部分數(shù)據(jù)是病人的實際診斷數(shù)據(jù),病人的檢測數(shù)據(jù)經(jīng)過系統(tǒng)各級處理,并由AI模型給出了參考診斷結(jié)果,醫(yī)生參考這些數(shù)據(jù),再根據(jù)自己的經(jīng)驗?zāi)芰ψ龀鲎詈蟮脑\斷結(jié)果,其診斷結(jié)果同時傳入AI模型庫。
系統(tǒng)的報表采用BI工具做到了自定義方式,用戶通過鼠標(biāo)簡單地拖拽想要的字段就可以得到想要的報表,還可以將生成的圖表預(yù)制發(fā)送到指定的郵箱。常規(guī)編程方式實現(xiàn)的報表開發(fā)周期長成本高,而采用BI工具后,不懂技術(shù)的業(yè)務(wù)人員也可以通過菜單頁面實現(xiàn)構(gòu)建報表,避免以后的業(yè)務(wù)變更時新報表的二次開發(fā)。
總之,通過AI技術(shù)實現(xiàn)了現(xiàn)有病例的醫(yī)生模擬診斷,在一定程度上消除了醫(yī)生的誤診,提高了醫(yī)院的診斷效率,未來該系統(tǒng)會向新型的病例診斷做進一步的探索研究。
作者單位:中國電子-文思海輝智科科技有限公司大連分公司