国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中醫(yī)病歷術(shù)語識別方法探討

2020-04-23 09:34孫超謝晴宇
中國中醫(yī)藥圖書情報 2020年2期

孫超 謝晴宇

摘要:目的 探索中醫(yī)領(lǐng)域利用少量標注語料進行電子病歷中醫(yī)學實體信息的命名實體識別(NER)研究工作,為更復雜的中醫(yī)電子病歷信息處理及深度學習方法在中醫(yī)領(lǐng)域內(nèi)的運用提供參考。 方法 分析中醫(yī)電子病歷詞匯術(shù)語與一般的NER任務(wù)相比較的特殊性,對比了目前3種NER技術(shù)的優(yōu)缺點,找尋適合中醫(yī)電子病歷醫(yī)學術(shù)語的NER技術(shù)。結(jié)果 長短時記憶神經(jīng)網(wǎng)絡(luò)(LSTM)是一種無監(jiān)督學習模型,能有效利用序列數(shù)據(jù)中長距離依賴信息,特別適合處理文本序列數(shù)據(jù);還可以和條件隨機場(CRF)模型相結(jié)合,解決中醫(yī)NER的難點。長短時記憶神經(jīng)網(wǎng)絡(luò)聯(lián)合條件隨機場模型(LSTM-CRF)可以在未標記的病歷文本語料上無監(jiān)督學習詞語特征,不依賴于人工設(shè)計特征模板而達到自動提取患者癥狀、疾病、誘因等命名實體的目的。結(jié)論 中醫(yī)電子病歷術(shù)語識別應(yīng)利用多種命名實體識別技術(shù),充分發(fā)揮這些技術(shù)的優(yōu)勢,提高模型識別準確性。

關(guān)鍵詞:命名實體識別;長短時記憶神經(jīng)網(wǎng)絡(luò);條件隨機場;中醫(yī)電子病歷

中圖分類號:R241;TP391.1 文獻標識碼:A 文章編號:2095-5707(2020)02-0001-05

DOI: 10.3969/j.issn.2095-5707.2020.02.001

Abstract: Objective To explore how to use the small amount of labeled corpora in the field of TCM to conduct research on named entity recognition (NER) of medical entity information in electronic medical records (EMR); To provide references for the application of more complex information processing of TCM EMR and in-depth learning methods in the field of TCM. Methods Specificity of vocabulary and terminology of TCM EMR compared to general NER tasks was analyzed, and the advantages and disadvantages of the current three NER technologies were compared, so as to find the named entity recognition technologies suitable for medical terminology of TCM EMR. Results As an unsupervised learning model, long and short-term memory (LSTM) neural network could effectively utilize long-distance dependent information in sequential data, especially suitable for processing text sequence data. It could also be combined with conditional random field model (CRF) to solve the difficulty of NER in TCM. LSTM-CRF model could learn word features in unsupervised condition in unmarked medical record text corpus, and could automatically extract named entities such as symptoms, diseases and causes of patients without relying on the artificial design of feature templates. Conclusion TCM EMR should be applied to multiple NER technologies, making full use of the advantages of these technologies

隨著醫(yī)院信息化建設(shè)的發(fā)展,針對電子病歷信息開展的后結(jié)構(gòu)化研究已成為主流趨勢。通過集成平臺的后結(jié)構(gòu)化策略,有效推動生產(chǎn)系統(tǒng)業(yè)務(wù)邏輯的改進,是真實世界平臺建設(shè)領(lǐng)域的核心議題。目前,中醫(yī)電子病歷領(lǐng)域研究關(guān)鍵詞有“數(shù)據(jù)挖掘”“遠程醫(yī)療”“人工智能”等[1],這些粗顆粒度的關(guān)鍵詞顯然沒有將研究熱點聚焦在更深入的解決方案上。電子病歷中記載著患者的癥狀、體征、辨證和用藥治療的全部過程,利用這些記錄,我們可以對醫(yī)生的診療經(jīng)驗進行總結(jié),為后人學習參考使用;同樣,若將這些記錄信息提供給計算機作為“學習”的文本素材,在充分“學習”大量事實性的數(shù)據(jù)之后,利用人工智能技術(shù),理論上計算機就可以模擬人的思維進行診斷和治療。計算機輔助診療能夠幫助臨床醫(yī)生進行診斷,選擇合適的治療方式,進行風險預測,減少醫(yī)療錯誤的發(fā)生,最終達到協(xié)助臨床決策的目的[2]。目前,已有多篇人工智能模擬醫(yī)生進行診斷的研究報道[3-6]。實現(xiàn)計算機輔助診療的思路為:首先識別提取出病歷中的癥狀、疾病、病機、誘因等具有特定含義的醫(yī)學實體信息,再利用數(shù)據(jù)挖掘相關(guān)技術(shù),發(fā)掘這些術(shù)語信息之間的聯(lián)系。可見,醫(yī)學實體信息的識別提取是實現(xiàn)計算機輔助診療的首要環(huán)節(jié)。

將電子病歷信息作為文本語料,利用自然語言處理相關(guān)技術(shù),從電子病歷中進行醫(yī)學實體信息的提取成為目前醫(yī)學領(lǐng)域的重要任務(wù)之一[7]。術(shù)語識別工作是一項重要而關(guān)鍵的基礎(chǔ)性步驟,它可以為中醫(yī)藥人工智能輔助臨床決策服務(wù),有很大的理論研究價值和應(yīng)用研究價值。

1 中醫(yī)病歷命名實體識別研究的特殊性

利用計算機自動提取病歷中的實體信息的難點在于:雖然醫(yī)學術(shù)語的表述方式有一定的規(guī)范,但它還是一種自由化的文本表述,不同的醫(yī)生在表達同一種意思時使用的中醫(yī)術(shù)語往往會有不同的表達方式,對于這種情況,醫(yī)生可以很容易判斷出它們是否表達了同一意義,例如,醫(yī)生可以很迅速地反應(yīng)出納差、不能食、食少、不知饑餓、饑不欲食、不思飲食、食欲不振等均表達“納呆”之意,而計算機想判斷出這一點卻并不容易。在實現(xiàn)讓計算機理解的過程中,我們顯然無法找到一本包含各種表述的詞典,采用“字-字”匹配的模式來讓計算機進行理解。此外,我們還希望計算機能夠?qū)ψR別出的中醫(yī)術(shù)語進行分類,把屬于癥狀的歸屬到癥狀術(shù)語里,屬于病因的歸屬到病因術(shù)語里,屬于方藥的歸屬到方藥術(shù)語里,以便進一步的挖掘分析。

實現(xiàn)病歷文本語料術(shù)語識別的自然語言處理技術(shù)為命名實體識別(Named Entity Recognition, NER)技術(shù),它最早由美國紐約大學學者R Grishman和B Sundheim于1996年在MUC-6(Message Understanding Conference 6)會議上提出,目的是從自然語言文本中識別出實體指稱及其類別[8]。傳統(tǒng)的NER任務(wù)包括識別人名、地名、組織機構(gòu)名稱等實體指稱。盡管目前也有許多從文本中提取實體術(shù)語的模型,但是將這些模型應(yīng)用于醫(yī)學實體識別還是具有挑戰(zhàn)性的,因為標準的自然語言處理工具不是為醫(yī)學領(lǐng)域?qū)iT設(shè)計的,因此需要研究特定針對中醫(yī)電子病歷的NER辦法[9]。

中醫(yī)學領(lǐng)域與傳統(tǒng)自然語言領(lǐng)域中識別人名、地名、組織機構(gòu)名稱等實體指稱的不同點有3條。首先,傳統(tǒng)的識別任務(wù)中,人名具有較固定的姓氏,地名、組織機構(gòu)名稱之后有固定的后綴用詞;而中醫(yī)命名實體往往沒有一套嚴格的命名系統(tǒng),有時表述還會帶有古漢語的特點,如“納可,寐佳”,命名實體特征性復雜,難以總結(jié)其中的規(guī)律性。其次,中醫(yī)領(lǐng)域缺乏大規(guī)模、統(tǒng)一的標注語料集,這使得從大量標注好的語料中學習識別實體特征的監(jiān)督學習算法實行起來人力時間成本較大,我們最好能尋求到半監(jiān)督或無監(jiān)督的學習算法。第三,中醫(yī)命名實體長度不確定,實體內(nèi)還會出現(xiàn)子實體或2個并列實體同時出現(xiàn)的嵌套情況,如“外感風寒”為四字術(shù)語,而“下元不足,元氣升騰于上”則較長。實體名稱越長,需要識別上下文信息范圍就越廣,識別難度越大。嵌套現(xiàn)象如“風熱郁于膽絡(luò),兼脾有濕痰壅熱”這里“風熱”“膽絡(luò)”“濕痰壅熱”都是命名實體,而它們又共同組成了“風熱郁于膽絡(luò),兼脾有濕痰壅熱”這樣的病機表述,嵌套現(xiàn)象的存在使得各類中醫(yī)術(shù)語的識別工作是相互交織而非孤立的。這些特殊性決定了中醫(yī)病歷NER工作要比一般領(lǐng)域的更加復雜多變,技術(shù)難度更大。

2 3種命名實體識別技術(shù)分析

NER技術(shù)大體可以歸納為:基于規(guī)則的方法(Rule-Based Model),基于統(tǒng)計模型的方法(Statistic-Based Model)和基于深度學習的方法(Deep Learning Method)。

2.1 基于規(guī)則的方法

基于規(guī)則的方法是在已有符號處理系統(tǒng)和規(guī)則下,由專家知識構(gòu)造大量規(guī)則集,形成有限狀態(tài)機,推理出可能的命名實體詞組。規(guī)則表達易于理解,推理過程直觀明了。但是,中醫(yī)病歷的語言缺乏一套嚴格的命名系統(tǒng),有時候還會帶有文言文的色彩,難以總結(jié)其中的規(guī)律性,單純使用基于規(guī)則的方法難度較大,一般都將它與基于統(tǒng)計模型的方法聯(lián)合使用。

2.2 基于統(tǒng)計模型的方法

基于統(tǒng)計模型的方法有隱馬爾可夫模型(Hidden Markov Model, HMM)、條件隨機場(Conditional Random Fields, CRF)模型、最大熵馬爾可夫模型(Maximum Entropy Markov Model, MEMM)等。目前應(yīng)用于中醫(yī)病歷術(shù)語識別工作最多的就是基于統(tǒng)計模型方法中的CRF模型。CRF能夠在給定需要標注的觀察序列條件下,計算整個標注序列的聯(lián)合概率分布,并在整個觀察值序列上求解一個最優(yōu)的標注序列,具有很強的推理能力,能夠使用復雜的、有重疊性的、非獨立的特征進行訓練,充分利用上下文信息,有效避免了HMM模型條件獨立假設(shè)、MEMM模型標注偏置等諸多問題,識別效率也通常優(yōu)于其他統(tǒng)計模型。

Wang Y Q等[10]對比分析了HMM、MEMM、CRF模型在中醫(yī)臨床記錄中對癥狀實體的識別,結(jié)果發(fā)現(xiàn)CRF模型更適合中醫(yī)臨床病歷的命名實體抽取。劉凱等[11]建立以詞位、狀態(tài)轉(zhuǎn)移、上下文窗口、指示詞、詞典、構(gòu)詞模式為特征的CRF模型,對中醫(yī)臨床病歷進行命名實體抽取。葉輝等[12]使用多特征CRF對《金匱要略》的癥狀、藥物進行信息抽取研究,準確率達到84.5%,召回率70.9%,F(xiàn)值77.1%,有效抽取了中醫(yī)古籍中所含的癥狀、藥物文本實體信息。孟洪宇等[13]對《傷寒論》文本中的癥狀、病名、脈象、方劑等中醫(yī)術(shù)語進行自動識別,采用CRF建立以字本身、詞邊界、詞性、類別標簽為特征組合的中醫(yī)術(shù)語識別模型,模型準確率85.00%,召回率68.00%,F(xiàn)值75.56%。

但是,CRF模型非常依賴于特征工程,特征質(zhì)量的好壞直接影響到識別的準確率。特征選取需要基于大量的語言學知識、領(lǐng)域知識和專家經(jīng)驗,反復試驗篩選調(diào)整。而中醫(yī)語言表述抽象,加之缺乏統(tǒng)一標注的大規(guī)模標注語料集可供訓練,使用CRF模型等監(jiān)督學習模型人力時間成本投入較大。如何在少量人工干預前提下有效利用無標注語料,實現(xiàn)特征自動提取是我們應(yīng)當關(guān)注的問題。

2.3 基于深度學習的方法

基于深度學習的方法是近年來逐漸占主流地位的方法,它通過多個神經(jīng)元組成神經(jīng)層,再由神經(jīng)層逐層連接形成多層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[14],模擬人的大腦思維過程進行分析學習。多隱層的結(jié)構(gòu)使得每一層都能將原始輸入進行線性或非線性的轉(zhuǎn)換,從而放大其中與學習目標相關(guān)的部分,減小不相關(guān)的部分,數(shù)據(jù)規(guī)模更大,模型更復雜,刻畫能力更強,識別效率更高。更值得注意的是,深度學習是一種無監(jiān)督的學習,通過構(gòu)建多隱層模型,自主抽取樣本的特征,具有自動學習特征的能力,在一定程度上很好地替代一般的特征提取方法,減少了人工制定特征的工作量。自加拿大蒙特利爾大學學者Bengio Y將深度學習方法用于自然語言處理后[15],越來越多的自然語言處理領(lǐng)域開始使用深度學習方法?!吧疃葘W習將會在自然語言理解領(lǐng)域產(chǎn)生巨大影響”[14],可以預見,深度學習的下一個主戰(zhàn)場就是自然語言處理領(lǐng)域。

深度學習模型的自主學習能力恰好可以解決CRF模型需要大量依賴人工制定特征工程的弊端,使得今后在抽取中醫(yī)術(shù)語時,即使沒有語言學專家的加入,也可以完成術(shù)語抽取工作。因此,應(yīng)當對深度學習方法進行專門研究,以找尋適用于中醫(yī)病歷術(shù)語識別工作的深度學習模型。

3 深度學習模型在中醫(yī)病歷術(shù)語識別中的應(yīng)用

3.1 中醫(yī)病歷術(shù)語識別屬于NER序列標注問題

中醫(yī)病歷術(shù)語識別屬于NER序列標注問題[16]。所謂序列標注,是指把輸入句子文本看作由詞語組成的序列X=(x1,x2,……xi……xn),如X為現(xiàn)病史文本中“發(fā)作時伴有反酸,噯氣,無嘔吐”這一句話,xi表示經(jīng)過分詞處理后的文本詞語,即“發(fā)作/時/伴有/反酸/噯氣/無嘔吐/”,序列標注就是給句子中每個詞語打上標簽集合中的某個標簽Y=(y1,y2,……yi……yn)。使用BIEOS標記方法[17],其中B為實體標記的開始,I為實體標記的其他部分,E為實體標記的結(jié)尾,O為不屬于命名實體, S為單字即構(gòu)成癥狀術(shù)語。例如,“發(fā)作時伴有反酸,噯氣,無嘔吐”可被標識為“發(fā)/O 作/O 時/O 伴/O 有/O 反/B酸/E,/O 噯/B氣/E,/O 無/B嘔/I吐/E。/O”。適用于序列標注問題的深度學習模型是遞歸神經(jīng)網(wǎng)絡(luò)(Recursive Neural Network, RNN),所謂“遞歸”是指它們的反饋回路結(jié)構(gòu),即在模型的隱層中加入了自連接和互連接,通過重現(xiàn)矩陣傳播延遲信號,這樣反饋回路就能把上一個時間標注的輸出信息作為下一個時間的輸入信息來處理,對前面的信息進行記憶并應(yīng)用于當前的輸出計算中,從而實現(xiàn)對上下文信息的記錄保存和利用。正因為RNN具有這樣的特點和優(yōu)勢,使它特別適用于語音識別、機器翻譯等需要根據(jù)上下文預測下一個單詞、下一個語音的序列標注問題。

3.2 中醫(yī)病歷術(shù)語識別適用的深度學習模型為長短時記憶神經(jīng)網(wǎng)絡(luò)模型

RNN在學習訓練過程中需要將遞歸項反繞解開,它最大的弱點是需克服神經(jīng)網(wǎng)絡(luò)層數(shù)過多帶來的參數(shù)訓練時學習梯度消失的問題,RNN在理論上雖然可以對任何長度的序列數(shù)據(jù)進行處理,但在實際應(yīng)用中,特別是進行長程依賴的學習時,若某一項會受到很遠處的標記影響,普通RNN表現(xiàn)往往不佳[18]。而中醫(yī)病歷中命名實體往往較長,需要識別上下文信息范圍廣,普通的RNN模型識別不佳。

為有效克服普通RNN梯度消失的問題,由德國慕尼黑大學學者Hochreiter S和Schmidhuber J提 出[19]、后經(jīng)改進的長短時記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)結(jié)構(gòu)[20-21],可以看成是對RNN模型的改進。LSTM包括1個用于保存信息的記憶單元(memory cell),3組自適應(yīng)的元素門進行控制更新,即控制網(wǎng)絡(luò)輸入的輸入門(input gate),控制網(wǎng)絡(luò)輸出的輸出門(output gate),控制記憶單元的忘記門(forget gate),共同組成記憶存儲塊(block)的結(jié)構(gòu),從而解決RNN梯度消失的問題。LSTM既可以保存很久之前的信息,達到利用較遠處的上下文信息的效果,有效克服梯度消失的問題;又可以避免無關(guān)緊要的內(nèi)容進入記憶,通過訓練學習達到對信息自動篩選的目的。且LSTM模型是一種數(shù)據(jù)驅(qū)動的方法,它不依賴特征工程,是一種端到端的訓練過程,可以減少傳統(tǒng)統(tǒng)計方法CRF模型需要大量制定特征模板的人工干預過程。近年來,LSTM在自然語言處理領(lǐng)域發(fā)揮了重大作用。Lample G等[22]將LSTM與CRF模型結(jié)合,以詞和字符為特征,加入dropout策略,進行NER標注。Ma X Z等[23]利用雙向LSTM合并卷積神經(jīng)網(wǎng)絡(luò)和CRF模型,得到97.55%的詞性標注準確率和91.21%的NER準確率。

由于文本句子中詞語和詞語之間不是獨立的,是有語義關(guān)系的,因此詞語歸屬的標簽也不是獨立的,打標簽時需要利用前面或后面的信息。當前的預測標簽不僅與當前的輸入詞語有關(guān),還與之前的預測標簽相關(guān),即預測標簽序列之間是有強相互依賴關(guān)系的,有的命名實體標記之間互相是不能搭配的。若僅依靠LSTM得到某詞屬于某命名實體標記的概率,則可能預測出非法的標簽序列。例如,使用BIEOS進行命名實體標注時,正確的標簽序列中標簽O后面是不會接標簽I的。而此問題通過CRF模型可以得到解決,因為CRF模型的目標函數(shù)不僅考慮輸入的狀態(tài)特征函數(shù),而且還包含了標簽轉(zhuǎn)移特征函數(shù),可以在LSTM輸出端將softmax函數(shù)分類器與CRF結(jié)合起來進行NER的標注[22,24],使用LSTM解決提取序列特征的問題,使用CRF有效利用句子級別的標記信息,更好地進行NER工作。

張藝品等[25]以《備急千金要方》《千金翼方》《神農(nóng)本草經(jīng)》作為語料,應(yīng)用LSTM-CRF模型,識別其中的病癥、方劑、中草藥等實體,準確率95.47%,召回率95.21%,F(xiàn)值95.34%,高于HMM、CRF模型。高甦等[26]采用基于雙向長短時記憶神經(jīng)網(wǎng)絡(luò)和條件隨機場(BiLSTM-CRF)的實體識別模型,對《黃帝內(nèi)經(jīng)》中的中醫(yī)認識方法、中醫(yī)生理、中醫(yī)病理、中醫(yī)自然、治則治法等5種實體進行識別,準確率為85.44%,召回率為85.19%,F(xiàn)值85.32%。這些研究均證實了LSTM結(jié)合CRF技術(shù)適用中醫(yī)文本的特點,模型泛化能力和魯棒性更強。

4 小結(jié)

針對中醫(yī)病歷命名實體識別研究的特殊性,我們認為中醫(yī)病歷NER工作的解決流程為:首先,借助中醫(yī)詞典等規(guī)則知識對病歷文本進行過濾;其次,對于中醫(yī)詞典無法識別的中醫(yī)術(shù)語,使用LSTM,利用其記憶存儲塊的結(jié)構(gòu),控制信息的存儲和遺忘,從而實現(xiàn)對梯度信息選擇性地讀取和覆蓋。LSTM模型善于處理長范圍的上下文信息問題,有效解決中醫(yī)領(lǐng)域命名實體過長的難題;LSTM模型作為深層非線性網(wǎng)絡(luò)是一種無監(jiān)督的學習過程,可以在原始字符集上提取特征,減少人工特征制定的工作量,解決標注語料集匱乏的問題。此外,LSTM模型還可與CRF模型等線性方法相結(jié)合,解決中醫(yī)病歷文本數(shù)據(jù)量可能過小的問題,更好地利用NER標記上下文信息。LSTM-CRF可以在未標記的病歷文本語料上無監(jiān)督地學習詞語特征,不依賴于人工設(shè)計特征模板,達到中醫(yī)病歷NER的目的。

參考文獻

[1] 榮光,謝晴宇,孟慶剛.中醫(yī)電子病歷研究領(lǐng)域科學知識圖譜分析[J].中國中醫(yī)藥信息雜志,2017,24(1):99-104.

[2] HE J, BAXTER S L, XU J, et al. The practical implementation of artificial intelligence technologies in medicine[J]. Nat Med, 2019,25(1):30-36.

[3] GULSHAN V, PENG L, CORAM M, et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus Photographs[J]. JAMA, 2016,316(22):2402-2410.

[4] KERMANY D S, GOLDBAUM M, CAI W, et al. Identifying medical diagnoses and treatable diseases by image-based deep learning[J]. Cell, 2018,172:1122-1131.

[5] ESTEVA A, KUPREL B, NOVOA R A, et al. Dermatologist-level classification of skin cancer with deep neural networks[J]. Nature, 2017,542(7639):115-118.

[6] CHENG J Z, NI D, CHOU Y H, et al. Computer-aided diagnosis with deep learning architecture: applications to breast lesions in US images and pulmonary nodules in CT scans[J]. Sci Rep, 2016(6):24454.

[7] FORD E, CARROLL J A, SMITH H E, et al. Extracting information from the text of electronic medical records to improve case detection: a systematic review[J]. Journal of the American Medical Informatics Association, 2016,23(5): 1007-1015.

[8] GRISHMAN R, SUNDHEIM B. Message Understanding Conference 6: A Brief History[C]// Proceedings of the 16th conference on Computational linguistics - Volume 1. Association for Computational Linguistics, 1996:466-471.

[9] CHOWDHURY S, DONG X, QIAN L, et al. A multitask bi-directional RNN model for named entity recognition on Chinese electronic medical records[J]. BMC Bioinformatics, 2018,19(17):499.

[10] WANG Y Q, YU Z H, CHEN L, et al. Supervised methods for symptom name recognition in free-text clinical records of traditional Chinese medicine: An empirical study[J]. Journal of Biomedical Informatics, 2014,47:91-104.

[11] 劉凱,周雪忠,于劍,等.基于條件隨機場的中醫(yī)臨床病歷命名實體抽取[J].計算機工程,2014,40(9):312-316.

[12] 葉輝,姬東鴻.基于多特征條件隨機場的《金匱要略》癥狀藥物信息抽取研究[J].中國中醫(yī)藥圖書情報雜志,2016,40(5):14-17.

[13] 孟洪宇,謝晴宇,常虹,等.基于條件隨機場的《傷寒論》中醫(yī)術(shù)語自動識別[J].北京中醫(yī)藥大學學報,2015,38(9):587-590.

[14] LECUN Y, BENGIO Y, HINTON G. Deep Learning[J].Nature, 2015,521(7553):436-444.

[15] BENGIO Y, SCHWENK H, SENECAL J S, et al. Neural probabilistic language models[M]. Innovations in Machine Learning. Springer, 2006:137-186.

[16] FINKEL J R, GRENAGER T, MANNING C. Incorporating non-local information into information extraction systems by gibbs sampling[C]// Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics. Association for Computational Linguistics, 2005:363-370.

清新县| 肇东市| 咸丰县| 普定县| 来凤县| 上犹县| 清水县| 上栗县| 日喀则市| 岱山县| 班玛县| 盖州市| 安阳市| 贵定县| 青海省| 通河县| 江都市| 鸡西市| 右玉县| 康马县| 化州市| 沙洋县| 横峰县| 常山县| 石柱| 电白县| 肇源县| 青神县| 霍山县| 海淀区| 德州市| 贵阳市| 桦川县| 万盛区| 正镶白旗| 桑植县| 桃园市| 皮山县| 老河口市| 宜宾县| 红安县|