魯曉 張勇 李昕
摘要:目的:在超聲審核工作站應(yīng)用智能語音識別技術(shù),提升超聲報(bào)告審核效率。方法:通過市場調(diào)研,選用科大迅飛陣列臺式麥克風(fēng),安裝在集中閱片室用于報(bào)告駁回意見的智能語音錄入,在保證軟硬件的基礎(chǔ)上建立專家數(shù)據(jù)庫,對語句進(jìn)行修改完善,最后完成意見填寫。結(jié)果:智能語音識別技術(shù)在超聲審核工作站應(yīng)用1年來,1份超聲報(bào)告的駁回意見填寫時(shí)間從原來的1min縮短至20s,效率提升3倍。結(jié)論:在超聲審核工作站中應(yīng)用智能語音識別技術(shù),可以節(jié)省醫(yī)師審核時(shí)間,提升超聲報(bào)告審核效率。
關(guān)鍵詞:超聲;麥克風(fēng);智能語音;審核
中圖分類號:R197.3;TN912.34 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2020)09-0056-03
0 引言
隨著超聲檢查普及程度的提高,超聲醫(yī)學(xué)科每天的病人就診數(shù)量不斷上升,在保證超聲檢查質(zhì)量的同時(shí)需要加快檢查速度,隨之集中閱片室醫(yī)師的工作量也相應(yīng)加重。近年來智能語音逐漸走進(jìn)人們的生活,手機(jī)、家電、家具、機(jī)器人、自動駕駛汽車無處不改變著人們的生活方式[1]。國家高度重視智能語音的相關(guān)研究,投入大量人力物力助力智能語音研究。智能語音在改變我們生活的同時(shí),在生物醫(yī)療領(lǐng)域也得到不斷發(fā)展[2-3]。國內(nèi)許多機(jī)構(gòu)對智能語音在醫(yī)療方面做了相關(guān)研究分析,為智能語音在醫(yī)療機(jī)構(gòu)的應(yīng)用指明了方向[4-5]。經(jīng)過階段性臨床實(shí)踐應(yīng)用,智能語音識別技術(shù)在病歷錄入、智能問診信息采集等方面的優(yōu)勢使其在門診、急診、病理科、放射科等科室得以一定程度應(yīng)用,受益頗豐[6-7]。超聲醫(yī)學(xué)科為了適應(yīng)超聲檢查不斷產(chǎn)生的新需求,超聲醫(yī)學(xué)科積極優(yōu)化超聲檢查流程,提升超聲檢查效率。智能語音識別在超聲工作站的應(yīng)用相對緩慢,原因是超聲檢查的特征決定的,超聲檢查在檢查部位、檢查報(bào)告、檢查類型的多樣性使得其專業(yè)術(shù)語和習(xí)慣用語多樣,超聲檢查人員眾多、環(huán)境嘈雜,對于語音錄入有著更高的要求[8-9]。為了適應(yīng)超聲檢查的新需求,超聲醫(yī)學(xué)科與科大訊飛合作探索智能語音識別技術(shù)在超聲檢查過程中的應(yīng)用可能,初步在超聲審核工作站得以應(yīng)用實(shí)踐。
1 超聲工作站面臨的問題
四川大學(xué)華西醫(yī)院超聲醫(yī)學(xué)科的醫(yī)療工作實(shí)行超聲醫(yī)技協(xié)同、分級診療的新模式,在這種模式中,超聲技師和學(xué)員級醫(yī)師承擔(dān)大多數(shù)普通超聲的篩查和檢查工作,高年資超聲醫(yī)師則承擔(dān)超聲會診工作及更多的??瞥?、介入超聲工作。超聲醫(yī)學(xué)科于2019年5月開始在原有的超聲檢查工作站中新構(gòu)建超聲審核工作站,審核工作站建立后,超聲技師和學(xué)員級醫(yī)師在檢查室坐診,完成病人的圖像采集和描述,醫(yī)輔人員完成圖文報(bào)告編輯并上傳到醫(yī)師審核工作站,審核醫(yī)師在集中閱片室同時(shí)進(jìn)行多個(gè)檢查室報(bào)告的審核。如果審核通過則病人可在自助打印機(jī)進(jìn)行報(bào)告打印,如果審核不通過,則需要進(jìn)行報(bào)告駁回,并填寫駁回意見。審核系統(tǒng)建立之初,采用鍵盤輸入的方式進(jìn)行駁回意見填寫,然而通常一份報(bào)告的駁回意見需要書寫多行文字,耗時(shí)費(fèi)力,所以超聲醫(yī)學(xué)科引用科大訊飛的臺式麥克風(fēng)搭配訊飛輸入法實(shí)現(xiàn)智能語音錄入,旨在提升醫(yī)師駁回意見填寫速度,從而審核醫(yī)師有更多的時(shí)間進(jìn)行報(bào)告審核,進(jìn)而提升審核效率。也為后續(xù)的超聲檢查報(bào)告的語音錄入建立一定的基礎(chǔ)。
2 智能語音識別的原理
智能語音識別是語音信號處理的一個(gè)分支,涉及信號處理、聲學(xué)、模式匹配、語言語音學(xué)、計(jì)算機(jī)科學(xué)、心理學(xué)等理論的交叉學(xué)科。智能語音識別技術(shù)是接收輸入的語音信號,對輸入語音信號進(jìn)行預(yù)處理、特征提取、模型匹配,最后輸出語音識別結(jié)果。智能語言識別的原理框架如圖1所示。
語音預(yù)處理中噪聲濾波消除、端點(diǎn)檢測最為重要。噪聲分為隨機(jī)環(huán)境噪聲和固有電源工頻干擾噪聲,一般為50Hz。端點(diǎn)檢測的目的是把有用的信號從語音輸入信號中提取出來,即確定有用信號的起始點(diǎn)和終止點(diǎn),識別語音信號和非語音信號這樣既能縮短后端語音信號處理的時(shí)間也能排除無用信號的干擾,從而提升語音識別的有效性。
語音特征提取包括時(shí)域特征和頻域特征。時(shí)域特征包括短時(shí)平均幅值、短時(shí)過零率、過均值率、短時(shí)能量等。頻域特征包括線性預(yù)測分析、感知性預(yù)測系數(shù)、線性預(yù)測倒譜系數(shù)、梅爾頻率倒譜系數(shù)等。
聲學(xué)數(shù)據(jù)庫和語言數(shù)據(jù)庫是針對智能語音識別的應(yīng)用場景構(gòu)建的具有針對性的數(shù)據(jù)庫。這兩個(gè)數(shù)據(jù)庫需要提前對大量數(shù)據(jù)進(jìn)行訓(xùn)練分析,也就是所說的自學(xué)習(xí)系統(tǒng),從而提取出有用的數(shù)據(jù)模型構(gòu)成數(shù)據(jù)庫;另外,在識別過程中,自學(xué)習(xí)系統(tǒng)會歸納用戶的使用習(xí)慣和識別方式,然后將數(shù)據(jù)歸納到數(shù)據(jù)庫,從而讓語音識別系統(tǒng)對該用戶來說更智能。
專家知識庫用于存放于應(yīng)用場景對應(yīng)的背景知識、常用詞句等,對句子進(jìn)行智能語義組合,仔細(xì)分析上下文的相互聯(lián)系,對當(dāng)前正在處理的語句進(jìn)行適當(dāng)修正,最后進(jìn)行結(jié)果輸出。
3 智能語音識別設(shè)備選用及在超聲工作站的初步實(shí)踐
3.1 智能語音識別設(shè)備選用
超聲醫(yī)學(xué)科選用科大訊飛臺式麥克風(fēng)IMI-G100,科大訊飛是亞太地區(qū)在智能語音錄入的標(biāo)桿,近年來在醫(yī)療領(lǐng)域也得到長足進(jìn)步??拼笥嶏w臺式麥克風(fēng)有著多種特性,適用于超聲醫(yī)學(xué)科的工作環(huán)境。
3.2 語音喚醒
通過設(shè)定喚醒詞,麥克風(fēng)在休眠狀態(tài)下也能檢測到醫(yī)師的聲音,讓處于休眠狀態(tài)下的麥克風(fēng)直接進(jìn)入到等待指令狀態(tài),快速開啟語音錄入。這樣能使超聲醫(yī)師可以通過喚醒詞,快速實(shí)現(xiàn)語音錄入,節(jié)約時(shí)間。
3.2.1 聲源定位
傳統(tǒng)的單個(gè)麥克風(fēng)的聲音聽取質(zhì)量與聲源距麥克風(fēng)的距離息息相關(guān),距離越近失真越小。如果想要獲得理想的聲音質(zhì)量時(shí),麥克風(fēng)的位置需要隨著聲源位置的變化進(jìn)行改變[10-11]。同時(shí)集中閱片室會有多位會診醫(yī)師同時(shí)會診的情況,會診醫(yī)師的聲音會受著其他各類噪聲的干擾,包括室內(nèi)聲音的反射和混響,都會大大降低聲音質(zhì)量,從而影響后續(xù)的語音處理。IMI-G100采用四麥陣列,可實(shí)現(xiàn)360度定位,陣列麥克風(fēng)具有較強(qiáng)的空間選擇性,能很好地實(shí)現(xiàn)聲源定位及跟蹤,從而可實(shí)現(xiàn)語音增強(qiáng)、回聲消除等。
3.2.2 遠(yuǎn)場拾音
訊飛麥克風(fēng)可實(shí)現(xiàn)最遠(yuǎn)5米距離的拾音,能保證會診醫(yī)師在較遠(yuǎn)的距離也能實(shí)現(xiàn)語音錄入。
3.3 專家數(shù)據(jù)庫建立
專家數(shù)據(jù)庫可以用于存放醫(yī)師在審核工作中的常用詞句或者模板進(jìn)行有效管理,審核醫(yī)師可以根據(jù)對專家數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行增加、刪除或修改。專家數(shù)據(jù)庫用于在語音形成句子后,在輸出前的最后修正,智能語音識別系統(tǒng)是否足夠智能,與專家數(shù)據(jù)庫數(shù)據(jù)的準(zhǔn)確性和豐富性息息相關(guān)。審核醫(yī)師把常用的短語、專用詞匯、簡短語句錄入數(shù)據(jù)庫中后,系統(tǒng)對最后的語句進(jìn)行詞句匹配,這樣讓語音識別系統(tǒng)更能聽懂審核醫(yī)師的審核意見,并進(jìn)行同音字判斷,最大限度減少錯(cuò)別字。
3.4 智能語音識別設(shè)備在超聲工作站的初步實(shí)踐結(jié)果
超聲醫(yī)學(xué)科于2019年5月開始在超聲工作站中啟用智能語音錄入的方式實(shí)現(xiàn)對駁回意見的快速錄入,原來一份報(bào)告的駁回意見填寫平均需要1min左右,智能語音錄入系統(tǒng)上線后,一份報(bào)告的駁回意見時(shí)間基本在20s以內(nèi),效率提升三倍。這樣會診老師將有更多的時(shí)間用于報(bào)告的審核,進(jìn)而也提升了報(bào)告審核的質(zhì)量。
4 結(jié)論與展望
智能語音識別技術(shù)經(jīng)過數(shù)據(jù)庫模型的建立,可很好地應(yīng)用于超聲審核工作站,目前能提升會診醫(yī)師的報(bào)告審核效率,降低工作強(qiáng)度。這為超聲報(bào)告錄入系統(tǒng)的智能語音錄入建立一定基礎(chǔ)。超聲醫(yī)學(xué)科將繼續(xù)構(gòu)建用于超聲報(bào)告錄入的智能語音系統(tǒng)。進(jìn)一步優(yōu)化超聲檢查流程、節(jié)約人力資源、提升超聲檢查效率。
參考文獻(xiàn)
[1] 李剛.智能語音識別技術(shù)的架構(gòu)與設(shè)計(jì)[J].電腦知識與技術(shù),2018,14(18):175-177.
[2] 王飛,胡川,羅浩,等.醫(yī)療場景智能語音識別技術(shù)的應(yīng)用研究[J].中國數(shù)字醫(yī)學(xué),2019,14(12):19-21.
[3] 孫國強(qiáng),趙從樸,朱雯,等.智能語音識別技術(shù)在醫(yī)院應(yīng)用中的探索與實(shí)踐[J].中國數(shù)字醫(yī)學(xué),2016,11(9):35-37.
[4] 賈孟成.語音識別技術(shù)在醫(yī)療領(lǐng)域中的應(yīng)用與思考[J].中國新通信,2019(3):69-70.
[5] 劉晶,羅進(jìn)城,左秀然.基于語音識別的移動電子病歷應(yīng)用探索[J].中國數(shù)字醫(yī)學(xué),2018,13(4):23-25.
[6] 李金苗,李鵬,劉慶金,等.智能語音識別技術(shù)在臨床醫(yī)療的應(yīng)用研究與實(shí)踐[J].中國衛(wèi)生信息管理雜志,2019,16(2):218-221.
[7] 張海波,周民偉,劉曉輝,等.智能語音識別技術(shù)在醫(yī)院臨床的探索與應(yīng)用[J].中國衛(wèi)生信息管理,2017,14(5):660-663.
[8] 栗小艷.超聲檢查報(bào)告語音識別與錄入系統(tǒng)臨床應(yīng)用研究[D].北京:解放軍總醫(yī)院,2015.
[9] 馬多佳,劉孟美,王旸,等.超聲檢查報(bào)告語音錄入系統(tǒng)[J].電子世界,2014(9):36-37.
[10] 張鐵成.基于麥克風(fēng)陣列的聲音識別與定位算法研究[D].南京:南京師范大學(xué),2016.
[11] 彭奎.一種基于麥克風(fēng)陣列的聲源定位系統(tǒng)及其應(yīng)用研究[D].合肥:安徽大學(xué),2014.