国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

智能問答系統(tǒng)在醫(yī)學(xué)領(lǐng)域的應(yīng)用研究

2018-10-30 10:17賀佳杜建強(qiáng)聶斌熊旺平羅計根
醫(yī)學(xué)信息 2018年14期
關(guān)鍵詞:中醫(yī)藥

賀佳 杜建強(qiáng) 聶斌 熊旺平 羅計根

摘 要:智能問答系統(tǒng)可以快速、準(zhǔn)確地為用戶提供信息服務(wù),是自然語言處理領(lǐng)域的備受關(guān)注的研究方向。在醫(yī)學(xué)知識服務(wù)領(lǐng)域,也具有很好的應(yīng)用前景和發(fā)展空間。論文首先簡述了醫(yī)學(xué)領(lǐng)域智能問答系統(tǒng)的研究情況,其次就醫(yī)學(xué)智能問答系統(tǒng)中的問題分析、信息檢索、答案抽取三個組成部分及其關(guān)鍵技術(shù)進(jìn)行了分別闡述;最后對其在中醫(yī)方面的應(yīng)用進(jìn)行了闡述,并對醫(yī)學(xué)智能問答系統(tǒng)的進(jìn)一步發(fā)展提出了展望。

關(guān)鍵詞:醫(yī)學(xué)領(lǐng)域;智能問答系統(tǒng);中醫(yī)藥

中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A DOI:10.3969/j.issn.1006-1959.2018.14.007

文章編號:1006-1959(2018)14-0016-04

Abstract:Intelligent question-answering system can provide information service to users quickly and accurately,which is the research direction of natural language processing.In the field of medical knowledge service,it also has a good application prospect and development space.Firstly,this paper briefly introduces the research situation of intelligent question-answering system in medical field, and then expounds the three components and key technologies of question analysis,information retrieval and answer extraction in medical intelligent question answering system.Finally,its application in traditional Chinese medicine is expounded,and the further development of medical intelligent question-answering system is prospected.

Key words:Medical field;Intelligent question-answering system;Traditional Chinese medicine

隨著科學(xué)技術(shù)的發(fā)展,互聯(lián)網(wǎng)應(yīng)用開始普及于人類生活的方方面面,健康醫(yī)療與互聯(lián)網(wǎng)相結(jié)合是醫(yī)學(xué)信息化發(fā)展的必然趨勢。醫(yī)學(xué)信息化的發(fā)展影響著人們對健康知識的獲取方式。目前,對醫(yī)學(xué)相關(guān)知識的搜索主要通過傳統(tǒng)搜索引擎,例如百度百科、360搜索等,這種搜索方式一般只需用戶輸入關(guān)鍵字,便會返回大量的網(wǎng)頁。然而這些方式難以滿足用戶的需求:一方面系統(tǒng)不能返回給用戶最直接的答案,而是一些與問題相關(guān)的網(wǎng)頁或者文檔,用戶需要再次從這些網(wǎng)頁或者文檔中尋找最終想要的答案。尤其對于非醫(yī)學(xué)專業(yè)人員,他們對醫(yī)學(xué)知識了解不深,尋找答案會更加困難。另一方面答案質(zhì)量參差不齊,用戶在查找、獲取、理解方面會存在許多困難。智能問答系統(tǒng)不僅可以允許用戶以自然語言方式提問,還能返回給用戶準(zhǔn)確、簡潔的答案,不需要用戶再次篩選合適的答案。將智能問答系統(tǒng)應(yīng)用于醫(yī)學(xué)領(lǐng)域,能夠進(jìn)一步提高人們獲取健康知識的便捷性、準(zhǔn)確性。

1智能問答系統(tǒng)在醫(yī)學(xué)領(lǐng)域研究概況

1.1發(fā)展歷程 智能問答系統(tǒng)的發(fā)展可追溯到圖靈測試時期,其主要測試機(jī)器是否具備人類智能。20世紀(jì)60年代,由于計算、數(shù)據(jù)資源有限,主要是限定領(lǐng)域智能問答系統(tǒng)發(fā)展,比如專家系統(tǒng)。這些系統(tǒng)中搜索答案的數(shù)據(jù)集來自于專家手工編寫。90年代以來,自然語言處理技術(shù)的興起和語義信息的應(yīng)用,以及隨著網(wǎng)上的資源越來越豐富,智能問答系統(tǒng)得到了快速發(fā)展[1]。尤其在1999年國際文本檢索會議(簡稱TREC)引入了問答系統(tǒng)評測專項(簡稱QA Track)后,QA Track成為了最受歡迎的TREC評測項目之一,智能問答系統(tǒng)的發(fā)展速度越來越快。相比之下,醫(yī)學(xué)領(lǐng)域智能問答系統(tǒng)研究起步較晚,當(dāng)前尚處于初步發(fā)展階段[2]。

1.2研究現(xiàn)狀

1.2.1國外研究情況說明 國外在醫(yī)學(xué)領(lǐng)域智能問答系統(tǒng)研究中已有了初步發(fā)展,國外的醫(yī)學(xué)智能問答系統(tǒng),見表1。從面向的對象來看,MedQA、AskHERMES、MEANS、AskCuebee主要針對醫(yī)學(xué)專業(yè)人員,如AskCuebee是一款用于寄生蟲學(xué)家獲取與寄生蟲有關(guān)知識的系統(tǒng)。mnquireMe則是針對大眾群體,通過問題-答案對返回給用戶想要的信息。從使用技術(shù)的不同來看,可以分為基于傳統(tǒng)檢索技術(shù)的問答系統(tǒng)和基于語義技術(shù)的問答系統(tǒng)?;趥鹘y(tǒng)檢索技術(shù)的問答系統(tǒng)有MedQA、AskHERMES、mnquireMe,基于語義技術(shù)的問答系統(tǒng)有MEANS、AskCuebee?;趥鹘y(tǒng)檢索技術(shù)的問答系統(tǒng)主要采用關(guān)鍵詞匹配技術(shù),這種方法的問答系統(tǒng)對于抽取的答案質(zhì)量有一定局限性?;谡Z義技術(shù)的問答系統(tǒng)主要采用語義分析法對問題和抽取的答案進(jìn)行分析,不再只是單純的關(guān)鍵詞匹配,而是從語義層面上對問題和答案進(jìn)行了分析思考,答案質(zhì)量有所提高。

1.2.2國內(nèi)研究情況說明 國內(nèi)智能問答系統(tǒng)起步相對較晚。HestiaQA是由Zhang等人[8]針對疾病咨詢所做的中文問答系統(tǒng)。中科院計算研究所研究過一款醫(yī)學(xué)檢索系統(tǒng)[9],這個系統(tǒng)采用深度問答方法對問題進(jìn)行分析以及答案的抽取。由趙欣[10]發(fā)明的基于疾病圈的疾病自診知識問答系統(tǒng)主要為了大眾提供疾病知識的科學(xué)依據(jù)。其主要研究步驟是:建立疾病圈,根據(jù)疾病的不同建立不同的疾病子圈,系統(tǒng)從疾病圈抽取出一些問題用于該圈子的會員回答,另一方面,會員可以向題庫中添加問題,由專家審核確認(rèn)。運(yùn)用此方法,疾病圈即知識庫會越來越大。在社區(qū)類問答系統(tǒng)方面,國內(nèi)出現(xiàn)了一些比較有名的醫(yī)學(xué)信息服務(wù)類網(wǎng)站,如尋醫(yī)問藥網(wǎng),快速問醫(yī)生等[11,12]。這類網(wǎng)站雖然允許用戶通過各種形式提問問題,但是返回給用戶的答案較多,對于非專業(yè)人員,其獲取準(zhǔn)確答案較為困難。

2醫(yī)學(xué)智能問答系統(tǒng)組成

一般來說,智能問答系統(tǒng)主要由三部分組成,分別是:問句分析、信息檢索、答案抽取[13]。系統(tǒng)對用戶提出的問題進(jìn)行分析,將問題分析后所得的信息給信息檢索環(huán)節(jié),檢索出相關(guān)文檔或段落,利用答案抽取技術(shù)將最終答案返回給用戶,見圖1。

2.1問題分析 問題分析指將用戶語言轉(zhuǎn)化為計算機(jī)能夠識別的語言。問題分析是智能問答系統(tǒng)首要環(huán)節(jié),這一部分所用技術(shù)的成熟度影響著候選答案的精度。問題分析部分主要包括對問句進(jìn)行中文分詞、詞性標(biāo)注、句法分析,為了能夠快速準(zhǔn)確找到答案,還要對問句進(jìn)行分類,最后進(jìn)行關(guān)鍵詞提取和拓展。其中,對于分詞、詞性標(biāo)注等,可以采用哈工大社會計算與信息檢索研究中心開發(fā)的語言技術(shù)平臺。對于問句分類,常采用支持向量機(jī)。關(guān)鍵詞提取和拓展,一般用統(tǒng)計方法,其中含詞頻、共現(xiàn)頻率等統(tǒng)計信息[14]。

李冬梅等[15]采用淺層句法分析和最大熵模型的語義分析算法對問題進(jìn)行分析,利用構(gòu)建的生物醫(yī)學(xué)領(lǐng)域本體知識庫進(jìn)行SPARQL查詢,進(jìn)而實現(xiàn)結(jié)果的輸出。劉凱等人[16]通過將條件隨機(jī)場、隱馬爾可夫模型、最大熵馬爾可夫模型用于中醫(yī)病歷命名實體抽取實驗,結(jié)果證實了條件隨機(jī)場相比于其它兩種方法具有較高的準(zhǔn)確率和召回率。張芳芳等人[17]以糖尿病患者的飲食問題為例,采用支持向量機(jī)模型對問題進(jìn)行分類,為深度自動問答系統(tǒng)提供了重要支撐。孟洪宇等[18]采用基于條件隨機(jī)場方法,通過字本身、詞性、詞邊界、術(shù)語類別標(biāo)注的多特征融合模型對《傷寒論》中的術(shù)語進(jìn)行了識別。

2.2信息檢索 信息檢索旨在縮小答案存在的范圍。該部分根據(jù)用戶的問題從文檔、網(wǎng)頁或者知識庫中提取可能相關(guān)的候選答案,候選答案可以是文檔,也可以是段落,基于知識圖譜的知識庫最終得到的是擁有實體和實體關(guān)系鏈接的一個知識庫子圖。

在基于傳統(tǒng)檢索技術(shù)的醫(yī)學(xué)問答系統(tǒng)中主要采用關(guān)鍵詞匹配技術(shù),。一般對于文檔,可以使用檢索模型如布爾模型、向量空間模型、語言模型等[19]檢索候選答案。基于語義分析技術(shù)的醫(yī)學(xué)問答系統(tǒng)中主要將問題的分析結(jié)果轉(zhuǎn)化為SPARQL等查詢語句,然后與本體知識庫匹配。

Asiaee等人[7]建立的知識庫以RDF三元組作為存儲形式,通過SPARQL語句進(jìn)行信息檢索。Wong等人[5]利用關(guān)鍵詞匹配技術(shù)從雅虎問答對中選取最貼近的問答對作為候選答案。

2.3答案抽取 答案抽取即從候選答案中抽出最佳答案返回給用戶。一般的答案抽取流程是:對候選文檔或段落進(jìn)行切分并形成候選答案集,根據(jù)問題類型對候選答案集進(jìn)一步處理,排除冗余的句子,通過相似度計算對候選句子進(jìn)行排序,對相似度高的句子再進(jìn)行重新分析,選取出最佳答案。答案抽取的效果會直接影響返回給用戶答案的好壞。

答案抽取環(huán)節(jié),可以通過基于表層特征的答案提取方法、關(guān)系抽取答案的方法、模式匹配抽取、統(tǒng)計模型抽取答案方法[19]等完成。其中關(guān)系抽取答案的方法,可以改進(jìn)表層特征的答案抽取。模式匹配抽取中通過機(jī)器學(xué)習(xí)方法得到的模式比手工模式要好很多。

潘昊杰等[20]列出與提取的生物醫(yī)學(xué)相關(guān)概念所屬的五個數(shù)據(jù)庫鏈接,通過得分排名得出最終答案。劉寶艷[21]先通過語義相關(guān)性計算等方法找到候選答案的中心詞,再利用相似度計算去掉重復(fù)段落,最后結(jié)合命名實體標(biāo)注結(jié)果提取出最終答案。溫思琦[22]通過構(gòu)建中醫(yī)冠心病本體來增強(qiáng)自然語言處理技術(shù)對中醫(yī)術(shù)語的處理能力,同時采用關(guān)鍵詞模糊匹配算法和神經(jīng)網(wǎng)絡(luò)詞向量的相似度算法以提升問答系統(tǒng)的靈活性。

3智能問答系統(tǒng)在中醫(yī)方面的應(yīng)用

中醫(yī)學(xué)是中國傳統(tǒng)文化中最寶貴財富之一,其中蘊(yùn)含了豐富的醫(yī)學(xué)哲理。面對飛速發(fā)展的科學(xué)技術(shù),中醫(yī)需要走出國門、接受全球的認(rèn)可,中醫(yī)現(xiàn)代化必不可少。自1958年至今,中醫(yī)現(xiàn)代化研究已開展了50多年[23]。將智能問答系統(tǒng)運(yùn)用于中醫(yī)領(lǐng)域,推動了“互聯(lián)網(wǎng)+中醫(yī)藥”的產(chǎn)業(yè)鏈發(fā)展模式[24],促進(jìn)了中醫(yī)現(xiàn)代化的發(fā)展。中醫(yī)智能問答系統(tǒng)的發(fā)展為中醫(yī)行業(yè)的創(chuàng)新和發(fā)展提供了技術(shù)支撐,以人為中心的健康管理模式越來越貼近現(xiàn)實。

實現(xiàn)中醫(yī)智能問答系統(tǒng),關(guān)鍵是對于中醫(yī)知識的解析,即系統(tǒng)對用戶問題和中醫(yī)文本能夠正確理解和分析。然而中醫(yī)知識與中文詞語有一定區(qū)別,主要包括:①中醫(yī)文本多由古漢語表示,而古代漢語常常具有通假字現(xiàn)象且古文之間關(guān)系復(fù)雜。②中醫(yī)古文中也可能含有醫(yī)家寫錯的文字。③中醫(yī)知識也具有中文詞語特有的一詞多義、同義詞、歧義詞等比較棘手的文法現(xiàn)象。這些都對中醫(yī)問答系統(tǒng)造成了特別大的困擾。研究者們更多研究的是中醫(yī)的實體識別,這也是實現(xiàn)中醫(yī)智能問答系統(tǒng)最基本的環(huán)節(jié)。

中醫(yī)智能問答系統(tǒng)已經(jīng)有了一些發(fā)展。中國工程科技知識中心[25]在2012年啟動了中草藥專業(yè)知識服務(wù)系統(tǒng)子課題[26]的建設(shè),其主要組成部分包含了對智能問答系統(tǒng)的建設(shè)。丁宏娟等[27]介紹的計算機(jī)中醫(yī)問診系統(tǒng)主要針對臨床決策,根據(jù)該系統(tǒng)給出的問診初步判斷,臨床醫(yī)生可以有計劃有目的的采集信息。計算機(jī)中醫(yī)問診系統(tǒng)的使用可以節(jié)省醫(yī)生決策時間并提高辨證的準(zhǔn)確率。陳程等[28]將中醫(yī)藥知識與知識圖譜以及智能問答系統(tǒng)相結(jié)合,系統(tǒng)對用戶的問題采用自然語言處理技術(shù)進(jìn)行分析,在交互界面中借用知識圖譜展示中醫(yī)藥知識。

4總結(jié)

智能問答系統(tǒng)應(yīng)用于醫(yī)學(xué)領(lǐng)域,使得醫(yī)學(xué)信息資源的利用率有所提高,同時也為醫(yī)學(xué)工作者提供了巨大的空間和選擇余地[28]。另外,醫(yī)學(xué)智能問答系統(tǒng)的發(fā)展也使得傳統(tǒng)醫(yī)學(xué)信息搜索中以疾病為中心的服務(wù)理念有所變化:以人為本的服務(wù)理念越來越實際。

醫(yī)學(xué)智能問答系統(tǒng)的發(fā)展,可以從以下三個方面加以完善:①醫(yī)學(xué)智能問答系統(tǒng)需要面向普通老百姓,而不單單只是專業(yè)醫(yī)術(shù)工作者,這在一定程度上會為“就醫(yī)難、看病難”貢獻(xiàn)一份力量。②國內(nèi)醫(yī)學(xué)名詞術(shù)語標(biāo)準(zhǔn)化還存有缺乏整體規(guī)劃、權(quán)威術(shù)語標(biāo)準(zhǔn)數(shù)量不足、以及更新不及時等問題。盡力使醫(yī)學(xué)專業(yè)詞匯統(tǒng)一標(biāo)準(zhǔn)化,這不僅會降低智能問答系統(tǒng)中本體構(gòu)建的難度,也會增強(qiáng)答案的準(zhǔn)確性。③借助快速發(fā)展的自然語言處理技術(shù)和深度學(xué)習(xí)技術(shù),尋找到適合解決醫(yī)學(xué)領(lǐng)域智能問答系統(tǒng)的工具和方法,使醫(yī)學(xué)智能問答系統(tǒng)更加趨向于從語義層面深度挖掘理解用戶的問題。

參考文獻(xiàn):

[1]康海燕,李飛娟,蘇文杰.基于問句表征的web智能問答系統(tǒng)[J].北京信息科技大學(xué)學(xué)報(自然科學(xué)版),2011,26(1):36-41.

[2]張芳芳,馬敬東,王小賢,等.國外醫(yī)學(xué)領(lǐng)域自動問答系統(tǒng)研究現(xiàn)狀及啟示[J].醫(yī)學(xué)信息學(xué)雜志,2017,38(3):2-6.

[3]Lee M,Cimino J,Zhu HR,et al.Beyond information retrieval medical question answering[J].Amia Annu Symp Proc,2006:469-473.

[4]Cao Y,Liu F,Simpson P,et al.AskHERMES: An online question answering system for complex clinical questions[J].Journal of Biomedical Informatics,2011,44(2):277-288.

[5]Wong W,Thangarajah J,Lin P.Contextual question answering for the health domain[M].John Wiley&Sons;,Inc.2012.

[6]Abacha AB,Zweigenbaum P.MEANS:A medical question-answering system combining NLP techniques and semantic Web technologies[J].Information Processing&Management;,2015,51(5):570-594.

[7]Asiaee A H,Minning T,Doshi P,et al.A framework for ontology-based question answering with application to parasite immunology[J].Journal of Biomedical Semantics,6,1(2015-07-17), 2015,6(1):31.

[8]Zhang H,Zhu L,Xu S,et al.XML-Based Document Retrieval in Chinese Diseases Question Answering System[M]. Mobile,Ubiquitous,and Intelligent Computing.Springer Berlin Heidelberg,2014:211-217.

[9]吉宗誠,徐安瑩,徐飛,等.醫(yī)療領(lǐng)域深度問答方法及醫(yī)學(xué)檢索系統(tǒng),CN102663129A[P].2012.

[10]趙欣.基于疾病圈的疾病自診知識問答方法及系統(tǒng):, CN105678065A[P].2016.

[11]Ravichandran D,Hovy E.Lerning surface text patterns for a question answering system[C]//Meeting of the Association for Computational Linguistics,Proceedings of the Conference.2002:41-47.

[12]Echihabi A,Marcu D.A noisy-channel approach to question answering[C]//Meeting on Association for Computational Linguistics.Association for Computational Linguistics.2003:16-23.

[13]張寧,朱禮軍.中文問答系統(tǒng)問句分析研究綜述[J].情報工程,2016,2(1):32-42.

[14]王煦祥.面向問答的問句關(guān)鍵詞提取技術(shù)研究[D].哈爾濱工業(yè)大學(xué),2016.

[15]李冬梅,張琪,王璇,等.基于淺層句法分析和最大熵的問句語義分析[J].計算機(jī)科學(xué)與探索,2017,11(8):1288-1295.

[16]劉凱,周雪忠,于劍,等.基于條件隨機(jī)場的中醫(yī)臨床病歷命名實體抽取[J].計算機(jī)工程,2014(9):312-316.

[17]張芳芳,馬敬東,王小賢,等.面向深度自動問答的糖尿病飲食問題分類[J].醫(yī)學(xué)信息學(xué)雜志,2017,38(3):12-16.

[18]孟洪宇,謝晴宇,常虹,等.基于條件隨機(jī)場的《傷寒論》中醫(yī)術(shù)語自動識別[J].北京中醫(yī)藥大學(xué)學(xué)報,2015,38(9):587-590.

[19]毛先領(lǐng),李曉明.問答系統(tǒng)研究綜述[J].計算機(jī)科學(xué)與探索, 2012,6(3):193-207.

[20]潘昊杰,周芳,張博文,等.生物醫(yī)學(xué)文獻(xiàn)檢索方法與問答系統(tǒng)[J].情報工程,2016,2(5):50-57.

[21]劉寶艷.面向生物醫(yī)學(xué)領(lǐng)域的問答系統(tǒng)的研究與實現(xiàn)[D]. 大連理工大學(xué),2007.

[22]溫思琦.基于本體的中醫(yī)冠心病自動問答系統(tǒng)的設(shè)計與實現(xiàn)[D].沈陽工業(yè)大學(xué),2017.

[23]楊云松.關(guān)于中醫(yī)現(xiàn)代化及傳統(tǒng)中醫(yī)未來發(fā)展的思考[J]. 中華中醫(yī)藥雜志,2017(3):920-922.

[24]陳靜鋒,郭崇慧,魏偉.“互聯(lián)網(wǎng)+中醫(yī)藥”:重構(gòu)中醫(yī)藥全產(chǎn)業(yè)鏈發(fā)展模式[J].中國軟科學(xué),2016(6):26-38.

[25]謝友柏.基于互聯(lián)網(wǎng)的設(shè)計知識服務(wù)研究——分析中國工程科技知識中心(CKCEST)的功能[J].中國機(jī)械工程,2017,28(6):631-641.

[26]中國工程科技知識中心中草藥專業(yè)知識服務(wù)系統(tǒng)建設(shè)專家咨詢會在浙江中醫(yī)藥大學(xué)召開[J].浙江中醫(yī)藥大學(xué)學(xué)報,2014,38(06):832.

[27]丁宏娟,何建成.計算機(jī)中醫(yī)問診系統(tǒng)的臨床驗證研究[J]. 遼寧中醫(yī)雜志,2010(11):2138-2139.

[28]陳程,翟潔,秦錦玉,等.基于中醫(yī)藥知識圖譜的智能問答技術(shù)研究[J].中國新通信,2018,20(02):204-207.

收稿日期:2018-4-11;修回日期:2018-4-25

編輯/成森

猜你喜歡
中醫(yī)藥
中醫(yī)藥非凡十年
——中醫(yī)藥科研創(chuàng)新成果豐碩(一)
《中華人民共和國中醫(yī)藥法》實施四周年
中醫(yī)藥在惡性腫瘤防治中的應(yīng)用
中醫(yī)藥在治療惡性腫瘤骨轉(zhuǎn)移中的應(yīng)用
獻(xiàn)身中醫(yī)藥事業(yè)的巴渝中醫(yī)人
重視中醫(yī)藥發(fā)展,發(fā)揮中醫(yī)藥作用
兩會聚焦:中醫(yī)藥戰(zhàn)“疫”收獲何種啟示
貫徹實施《中華人民共和國中醫(yī)藥法》促進(jìn)中醫(yī)藥振興發(fā)展
從《中醫(yī)藥法》看直銷
中醫(yī)藥立法:不是“管”而是“促”
婺源县| 甘肃省| 长子县| 蛟河市| 顺平县| 汉沽区| 文登市| 庄河市| 曲靖市| 安泽县| 漳浦县| 江永县| 宣汉县| 安达市| 修水县| 沂南县| 郧西县| 潼南县| 宁陕县| 泸水县| 崇州市| 东兰县| 青阳县| 策勒县| 灵台县| 革吉县| 庆云县| 阜康市| 枣庄市| 洪洞县| 武定县| 太湖县| 会东县| 喀喇| 政和县| 仲巴县| 曲沃县| 即墨市| 丹江口市| 防城港市| 怀集县|