智能語音識別技術(shù)在超聲審核工作站的研究與實(shí)踐

2020-11-16 06:56魯曉張勇李昕

數(shù)字技術(shù)與應(yīng)用 2020年9期

魯曉張勇李昕

摘要：目的：在超聲審核工作站應(yīng)用智能語音識別技術(shù)，提升超聲報(bào)告審核效率。方法：通過市場調(diào)研，選用科大迅飛陣列臺式麥克風(fēng)，安裝在集中閱片室用于報(bào)告駁回意見的智能語音錄入，在保證軟硬件的基礎(chǔ)上建立專家數(shù)據(jù)庫，對語句進(jìn)行修改完善，最后完成意見填寫。結(jié)果：智能語音識別技術(shù)在超聲審核工作站應(yīng)用1年來，1份超聲報(bào)告的駁回意見填寫時(shí)間從原來的1min縮短至20s，效率提升3倍。結(jié)論：在超聲審核工作站中應(yīng)用智能語音識別技術(shù)，可以節(jié)省醫(yī)師審核時(shí)間，提升超聲報(bào)告審核效率。

關(guān)鍵詞：超聲;麥克風(fēng);智能語音;審核

中圖分類號：R197.3;TN912.34 文獻(xiàn)標(biāo)識碼：A 文章編號：1007-9416（2020）09-0056-03

0 引言

隨著超聲檢查普及程度的提高，超聲醫(yī)學(xué)科每天的病人就診數(shù)量不斷上升，在保證超聲檢查質(zhì)量的同時(shí)需要加快檢查速度，隨之集中閱片室醫(yī)師的工作量也相應(yīng)加重。近年來智能語音逐漸走進(jìn)人們的生活，手機(jī)、家電、家具、機(jī)器人、自動駕駛汽車無處不改變著人們的生活方式[1]。國家高度重視智能語音的相關(guān)研究，投入大量人力物力助力智能語音研究。智能語音在改變我們生活的同時(shí)，在生物醫(yī)療領(lǐng)域也得到不斷發(fā)展[2-3]。國內(nèi)許多機(jī)構(gòu)對智能語音在醫(yī)療方面做了相關(guān)研究分析，為智能語音在醫(yī)療機(jī)構(gòu)的應(yīng)用指明了方向[4-5]。經(jīng)過階段性臨床實(shí)踐應(yīng)用，智能語音識別技術(shù)在病歷錄入、智能問診信息采集等方面的優(yōu)勢使其在門診、急診、病理科、放射科等科室得以一定程度應(yīng)用，受益頗豐[6-7]。超聲醫(yī)學(xué)科為了適應(yīng)超聲檢查不斷產(chǎn)生的新需求，超聲醫(yī)學(xué)科積極優(yōu)化超聲檢查流程，提升超聲檢查效率。智能語音識別在超聲工作站的應(yīng)用相對緩慢，原因是超聲檢查的特征決定的，超聲檢查在檢查部位、檢查報(bào)告、檢查類型的多樣性使得其專業(yè)術(shù)語和習(xí)慣用語多樣，超聲檢查人員眾多、環(huán)境嘈雜，對于語音錄入有著更高的要求[8-9]。為了適應(yīng)超聲檢查的新需求，超聲醫(yī)學(xué)科與科大訊飛合作探索智能語音識別技術(shù)在超聲檢查過程中的應(yīng)用可能，初步在超聲審核工作站得以應(yīng)用實(shí)踐。

1 超聲工作站面臨的問題

四川大學(xué)華西醫(yī)院超聲醫(yī)學(xué)科的醫(yī)療工作實(shí)行超聲醫(yī)技協(xié)同、分級診療的新模式，在這種模式中，超聲技師和學(xué)員級醫(yī)師承擔(dān)大多數(shù)普通超聲的篩查和檢查工作，高年資超聲醫(yī)師則承擔(dān)超聲會診工作及更多的?？瞥?、介入超聲工作。超聲醫(yī)學(xué)科于2019年5月開始在原有的超聲檢查工作站中新構(gòu)建超聲審核工作站，審核工作站建立后，超聲技師和學(xué)員級醫(yī)師在檢查室坐診，完成病人的圖像采集和描述，醫(yī)輔人員完成圖文報(bào)告編輯并上傳到醫(yī)師審核工作站，審核醫(yī)師在集中閱片室同時(shí)進(jìn)行多個(gè)檢查室報(bào)告的審核。如果審核通過則病人可在自助打印機(jī)進(jìn)行報(bào)告打印，如果審核不通過，則需要進(jìn)行報(bào)告駁回，并填寫駁回意見。審核系統(tǒng)建立之初，采用鍵盤輸入的方式進(jìn)行駁回意見填寫，然而通常一份報(bào)告的駁回意見需要書寫多行文字，耗時(shí)費(fèi)力，所以超聲醫(yī)學(xué)科引用科大訊飛的臺式麥克風(fēng)搭配訊飛輸入法實(shí)現(xiàn)智能語音錄入，旨在提升醫(yī)師駁回意見填寫速度，從而審核醫(yī)師有更多的時(shí)間進(jìn)行報(bào)告審核，進(jìn)而提升審核效率。也為后續(xù)的超聲檢查報(bào)告的語音錄入建立一定的基礎(chǔ)。

2 智能語音識別的原理

智能語音識別是語音信號處理的一個(gè)分支，涉及信號處理、聲學(xué)、模式匹配、語言語音學(xué)、計(jì)算機(jī)科學(xué)、心理學(xué)等理論的交叉學(xué)科。智能語音識別技術(shù)是接收輸入的語音信號，對輸入語音信號進(jìn)行預(yù)處理、特征提取、模型匹配，最后輸出語音識別結(jié)果。智能語言識別的原理框架如圖1所示。

語音預(yù)處理中噪聲濾波消除、端點(diǎn)檢測最為重要。噪聲分為隨機(jī)環(huán)境噪聲和固有電源工頻干擾噪聲，一般為50Hz。端點(diǎn)檢測的目的是把有用的信號從語音輸入信號中提取出來，即確定有用信號的起始點(diǎn)和終止點(diǎn)，識別語音信號和非語音信號這樣既能縮短后端語音信號處理的時(shí)間也能排除無用信號的干擾，從而提升語音識別的有效性。

語音特征提取包括時(shí)域特征和頻域特征。時(shí)域特征包括短時(shí)平均幅值、短時(shí)過零率、過均值率、短時(shí)能量等。頻域特征包括線性預(yù)測分析、感知性預(yù)測系數(shù)、線性預(yù)測倒譜系數(shù)、梅爾頻率倒譜系數(shù)等。

聲學(xué)數(shù)據(jù)庫和語言數(shù)據(jù)庫是針對智能語音識別的應(yīng)用場景構(gòu)建的具有針對性的數(shù)據(jù)庫。這兩個(gè)數(shù)據(jù)庫需要提前對大量數(shù)據(jù)進(jìn)行訓(xùn)練分析，也就是所說的自學(xué)習(xí)系統(tǒng)，從而提取出有用的數(shù)據(jù)模型構(gòu)成數(shù)據(jù)庫;另外，在識別過程中，自學(xué)習(xí)系統(tǒng)會歸納用戶的使用習(xí)慣和識別方式，然后將數(shù)據(jù)歸納到數(shù)據(jù)庫，從而讓語音識別系統(tǒng)對該用戶來說更智能。

專家知識庫用于存放于應(yīng)用場景對應(yīng)的背景知識、常用詞句等，對句子進(jìn)行智能語義組合，仔細(xì)分析上下文的相互聯(lián)系，對當(dāng)前正在處理的語句進(jìn)行適當(dāng)修正，最后進(jìn)行結(jié)果輸出。

3 智能語音識別設(shè)備選用及在超聲工作站的初步實(shí)踐

3.1 智能語音識別設(shè)備選用

超聲醫(yī)學(xué)科選用科大訊飛臺式麥克風(fēng)IMI-G100，科大訊飛是亞太地區(qū)在智能語音錄入的標(biāo)桿，近年來在醫(yī)療領(lǐng)域也得到長足進(jìn)步?？拼笥嶏w臺式麥克風(fēng)有著多種特性，適用于超聲醫(yī)學(xué)科的工作環(huán)境。

3.2 語音喚醒

通過設(shè)定喚醒詞，麥克風(fēng)在休眠狀態(tài)下也能檢測到醫(yī)師的聲音，讓處于休眠狀態(tài)下的麥克風(fēng)直接進(jìn)入到等待指令狀態(tài)，快速開啟語音錄入。這樣能使超聲醫(yī)師可以通過喚醒詞，快速實(shí)現(xiàn)語音錄入，節(jié)約時(shí)間。

3.2.1 聲源定位

傳統(tǒng)的單個(gè)麥克風(fēng)的聲音聽取質(zhì)量與聲源距麥克風(fēng)的距離息息相關(guān)，距離越近失真越小。如果想要獲得理想的聲音質(zhì)量時(shí)，麥克風(fēng)的位置需要隨著聲源位置的變化進(jìn)行改變[10-11]。同時(shí)集中閱片室會有多位會診醫(yī)師同時(shí)會診的情況，會診醫(yī)師的聲音會受著其他各類噪聲的干擾，包括室內(nèi)聲音的反射和混響，都會大大降低聲音質(zhì)量，從而影響后續(xù)的語音處理。IMI-G100采用四麥陣列，可實(shí)現(xiàn)360度定位，陣列麥克風(fēng)具有較強(qiáng)的空間選擇性，能很好地實(shí)現(xiàn)聲源定位及跟蹤，從而可實(shí)現(xiàn)語音增強(qiáng)、回聲消除等。

3.2.2 遠(yuǎn)場拾音

訊飛麥克風(fēng)可實(shí)現(xiàn)最遠(yuǎn)5米距離的拾音，能保證會診醫(yī)師在較遠(yuǎn)的距離也能實(shí)現(xiàn)語音錄入。

3.3 專家數(shù)據(jù)庫建立

專家數(shù)據(jù)庫可以用于存放醫(yī)師在審核工作中的常用詞句或者模板進(jìn)行有效管理，審核醫(yī)師可以根據(jù)對專家數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行增加、刪除或修改。專家數(shù)據(jù)庫用于在語音形成句子后，在輸出前的最后修正，智能語音識別系統(tǒng)是否足夠智能，與專家數(shù)據(jù)庫數(shù)據(jù)的準(zhǔn)確性和豐富性息息相關(guān)。審核醫(yī)師把常用的短語、專用詞匯、簡短語句錄入數(shù)據(jù)庫中后，系統(tǒng)對最后的語句進(jìn)行詞句匹配，這樣讓語音識別系統(tǒng)更能聽懂審核醫(yī)師的審核意見，并進(jìn)行同音字判斷，最大限度減少錯(cuò)別字。

3.4 智能語音識別設(shè)備在超聲工作站的初步實(shí)踐結(jié)果

超聲醫(yī)學(xué)科于2019年5月開始在超聲工作站中啟用智能語音錄入的方式實(shí)現(xiàn)對駁回意見的快速錄入，原來一份報(bào)告的駁回意見填寫平均需要1min左右，智能語音錄入系統(tǒng)上線后，一份報(bào)告的駁回意見時(shí)間基本在20s以內(nèi)，效率提升三倍。這樣會診老師將有更多的時(shí)間用于報(bào)告的審核，進(jìn)而也提升了報(bào)告審核的質(zhì)量。

4 結(jié)論與展望

智能語音識別技術(shù)經(jīng)過數(shù)據(jù)庫模型的建立，可很好地應(yīng)用于超聲審核工作站，目前能提升會診醫(yī)師的報(bào)告審核效率，降低工作強(qiáng)度。這為超聲報(bào)告錄入系統(tǒng)的智能語音錄入建立一定基礎(chǔ)。超聲醫(yī)學(xué)科將繼續(xù)構(gòu)建用于超聲報(bào)告錄入的智能語音系統(tǒng)。進(jìn)一步優(yōu)化超聲檢查流程、節(jié)約人力資源、提升超聲檢查效率。

參考文獻(xiàn)

[1] 李剛.智能語音識別技術(shù)的架構(gòu)與設(shè)計(jì)[J].電腦知識與技術(shù)，2018，14（18）：175-177.

[2] 王飛，胡川，羅浩，等.醫(yī)療場景智能語音識別技術(shù)的應(yīng)用研究[J].中國數(shù)字醫(yī)學(xué)，2019，14（12）：19-21.

[3] 孫國強(qiáng)，趙從樸，朱雯，等.智能語音識別技術(shù)在醫(yī)院應(yīng)用中的探索與實(shí)踐[J].中國數(shù)字醫(yī)學(xué)，2016，11（9）：35-37.

[4] 賈孟成.語音識別技術(shù)在醫(yī)療領(lǐng)域中的應(yīng)用與思考[J].中國新通信，2019（3）：69-70.

[5] 劉晶，羅進(jìn)城，左秀然.基于語音識別的移動電子病歷應(yīng)用探索[J].中國數(shù)字醫(yī)學(xué)，2018，13（4）：23-25.

[6] 李金苗，李鵬，劉慶金，等.智能語音識別技術(shù)在臨床醫(yī)療的應(yīng)用研究與實(shí)踐[J].中國衛(wèi)生信息管理雜志，2019，16（2）：218-221.

[7] 張海波，周民偉，劉曉輝，等.智能語音識別技術(shù)在醫(yī)院臨床的探索與應(yīng)用[J].中國衛(wèi)生信息管理，2017，14（5）：660-663.

[8] 栗小艷.超聲檢查報(bào)告語音識別與錄入系統(tǒng)臨床應(yīng)用研究[D].北京：解放軍總醫(yī)院，2015.

[9] 馬多佳，劉孟美，王旸，等.超聲檢查報(bào)告語音錄入系統(tǒng)[J].電子世界，2014（9）：36-37.

[10] 張鐵成.基于麥克風(fēng)陣列的聲音識別與定位算法研究[D].南京：南京師范大學(xué)，2016.

[11] 彭奎.一種基于麥克風(fēng)陣列的聲源定位系統(tǒng)及其應(yīng)用研究[D].合肥：安徽大學(xué)，2014.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

智能語音識別技術(shù)在超聲審核工作站的研究與實(shí)踐