劉麗紅 賈李蓉 朱彥 劉靜 高博
摘要:目的 針對(duì)中醫(yī)藥信息交叉領(lǐng)域概念交叉和術(shù)語歧義造成的領(lǐng)域知識(shí)表達(dá)混亂現(xiàn)狀,以中藥子領(lǐng)域?yàn)闃颖?,初步?shí)現(xiàn)其核心概念的知識(shí)表達(dá)和本體建模。方法 通過收集和梳理包括2015年版《中華人民共和國藥典》(一部)、《中藥編碼規(guī)則及編碼》、《中華本草》、《中藥大辭典》、《中藥學(xué)》、《臨床中藥學(xué)》的中藥知識(shí)權(quán)威來源數(shù)據(jù),基于本體論的概念建模方法,明確中藥概念內(nèi)涵,確定概念屬性,厘清概念間的關(guān)系,初步完成中藥子領(lǐng)域核心概念的本體建模。結(jié)果 完成包括“中藥”“中藥材”“中藥飲片”“中成藥”等核心概念的本體建模。結(jié)論 初步實(shí)現(xiàn)中藥相關(guān)核心概念模型的構(gòu)建,可為其他子領(lǐng)域的中醫(yī)藥知識(shí)表達(dá)和共享提供參考。
關(guān)鍵詞:中藥子領(lǐng)域;本體;概念模型
DOI:10.3969/j.issn.1005-5304.2018.11.021
中圖分類號(hào):R2-03 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1005-5304(2018)11-0095-04
Abstract: Objective In view of the inconsistency between the concepts of TCM in the field of TCM information intersection, the confusion of domain knowledge expression caused by conceptual cross and term ambiguity, and taking TCM sub-domain as a sample, knowledge representation and ontological modeling of core concepts are realized. Methods Through collecting and combing 2015 version of Pharmacopoeia of People's Republic of China (the first volume), Coding Rules for Chinese Medicines and Their Codes, Chinese Materia Medica, TCM Dictionary, Science of Chinese Materia Medica, Clinical Science of Chinese Materia Medica and other TCM knowledge authority source data, based on ontological conceptual modeling method, this article confirmed the definition and connotation of Chinese materia medica, determined the concept properties, clarified the relationship between concepts, and initially completed the ontological modeling for core concepts of TCM sub-domain. Results The ontological modeling of key concepts such as “TCM”, “Chinese materia medica”, “TCM decoction pieces” and “TCM patent medicines” was completed. Conclusion The preliminary construction of TCM related core conceptual model is realized, which can provide reference for expressions and sharing of TCM knowledge in other sub-domains.
Keywords: TCM sub-domain; ontology; conceptual model
中醫(yī)藥領(lǐng)域信息知識(shí)表達(dá)、數(shù)據(jù)處理時(shí),相關(guān)概念理解不一致,存在概念交叉、術(shù)語歧義、領(lǐng)域知識(shí)表達(dá)混亂情況。中醫(yī)藥同專業(yè)或跨專業(yè)交流時(shí),因習(xí)慣用語不同,常出現(xiàn)理解偏差。如臨床上脾胃科將“甘草”默認(rèn)為“炙甘草”,而其他科室可能理解為“生甘草”;中醫(yī)臨床領(lǐng)域一般提及的中藥名稱為中藥飲片,而其他領(lǐng)域可能理解為中藥材或基源植物。
知識(shí)表達(dá)、概念建模是計(jì)算機(jī)信息抽取、數(shù)據(jù)庫設(shè)計(jì)的基礎(chǔ),數(shù)據(jù)處理與利用時(shí),計(jì)算機(jī)無法識(shí)別概念名稱相同但表達(dá)內(nèi)涵不同的情況,中藥名稱概念內(nèi)涵有中藥材和中藥飲片,而其內(nèi)涵屬性不同。因此,應(yīng)明確每個(gè)概念的內(nèi)涵,確保其表達(dá)的準(zhǔn)確性,避免概念交叉。在對(duì)中醫(yī)藥知識(shí)進(jìn)行計(jì)算機(jī)處理時(shí),必須解決概念和術(shù)語歧義問題;同時(shí),數(shù)據(jù)庫建模須基于統(tǒng)一明確的概念模型。這可為該領(lǐng)域本體構(gòu)建提供基礎(chǔ),并指導(dǎo)規(guī)范數(shù)據(jù)庫建模、術(shù)語消歧。
本體是哲學(xué)、計(jì)算機(jī)科學(xué)和信息科學(xué)之間的交叉學(xué)科。在哲學(xué)領(lǐng)域,本體是一門關(guān)于世界本原的學(xué)問,它試圖羅列世間萬物,并對(duì)它們進(jìn)行準(zhǔn)確的定義和完善的分類。在計(jì)算機(jī)科學(xué)領(lǐng)域,本體則是一種用于表示領(lǐng)域知識(shí)的計(jì)算機(jī)模型,它定義了一組表示知識(shí)的“原語”,如類、屬性和關(guān)系等[1]。信息科學(xué)中本體論的目標(biāo)是確定領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模型上給出這些詞匯和詞匯間相互關(guān)系的明確定義,從而獲取相關(guān)領(lǐng)域的知識(shí),提供對(duì)該領(lǐng)域知識(shí)的共同理解[2]。本體的引入可為中藥相關(guān)概念辨析與知識(shí)表達(dá)提供有效途徑。
1 中藥知識(shí)解析
1.1 相關(guān)概念的知識(shí)表達(dá)
采用本體方法進(jìn)行中藥相關(guān)知識(shí)提取,可明確該領(lǐng)域知識(shí)的概念內(nèi)涵,且提供共同認(rèn)知。即將中藥知識(shí)領(lǐng)域抽象成一個(gè)概念體系,在此體系中,明確描述概念內(nèi)涵,確定概念屬性,厘清概念與概念間的關(guān)系,并在中藥領(lǐng)域取得共識(shí)。這個(gè)抽象的概念體系實(shí)際是建立在數(shù)據(jù)實(shí)例基礎(chǔ)上的知識(shí)本體。其主要作用為豐富擴(kuò)展現(xiàn)有中醫(yī)藥領(lǐng)域本體,促進(jìn)中醫(yī)藥領(lǐng)域信息關(guān)聯(lián)與融合,增強(qiáng)中醫(yī)藥領(lǐng)域知識(shí)的顯性表達(dá);對(duì)于數(shù)據(jù)庫建模亦可提供規(guī)范術(shù)語及關(guān)系,指導(dǎo)規(guī)范建庫。
1.2 知識(shí)來源特點(diǎn)分析
本研究以藥典、國家標(biāo)準(zhǔn)、辭典、教材等為中藥知識(shí)權(quán)威來源。課題組前期對(duì)中藥核心概念描述進(jìn)行總結(jié)梳理,體系基于本體思路進(jìn)行解析[3]。
2015年版《中華人民共和國藥典》(一部)[4]中藥部分主要描述中藥材和飲片相關(guān)信息,如中藥材的來源、性狀、鑒別、檢查、浸出物,飲片的炮制、性狀、鑒別、檢查、性味與歸經(jīng)、功能與主治、用法與用量、貯藏等。特點(diǎn):將中藥材與中藥飲片進(jìn)行了初步的區(qū)分,還需對(duì)其內(nèi)涵以及二者關(guān)系進(jìn)行明確和細(xì)化。
《中藥編碼規(guī)則及編碼》[5]為中藥編碼國家標(biāo)準(zhǔn),對(duì)中藥材、中藥飲片、中藥配方顆粒、中藥超微飲片、中藥超微配方顆粒等進(jìn)行分類與編碼,通過編碼明確不同形態(tài)中藥。特點(diǎn):對(duì)中藥、中藥材、中藥飲片、中藥配方顆粒、中藥超微飲片、中藥超微配方顆粒、藥用植物、草藥術(shù)語進(jìn)行定義,并制定編碼規(guī)則。
《中華本草》[6]、《中藥大辭典》[7]為中藥相關(guān)信息的匯總辭典,提供正名、異名、基原、原植(動(dòng)、礦)物、栽培(飼養(yǎng))、采收加工、藥材、成分、藥理、炮制、藥性、功用主治、用法用量、宜忌、選方、臨床報(bào)道、各家論述等描述信息。特點(diǎn):描述內(nèi)容詳盡,可提供信息補(bǔ)充查詢;但缺乏概念層次,無法對(duì)中藥概念內(nèi)涵進(jìn)行區(qū)分判定。
《中藥學(xué)》[8]、《臨床中藥學(xué)》[9]偏重臨床中藥學(xué),側(cè)重描述中藥基本理論及常用中藥來源、產(chǎn)地、采集、炮制、藥性、功效、應(yīng)用、用法用量、使用注意、化學(xué)成分、藥理作用、鑒別用藥、不良反應(yīng)等。特點(diǎn):偏重于中藥基本理論和常用中藥的臨床應(yīng)用,但未對(duì)中藥相關(guān)概念進(jìn)行明確區(qū)分。
上述中藥權(quán)威知識(shí)來源各具特點(diǎn),通過對(duì)其核心概念體系分析,可為中藥本體構(gòu)建中核心概念、概念內(nèi)涵、概念間關(guān)系確定提供支持。中藥本體構(gòu)建所涉及的中藥理論體系需進(jìn)行總結(jié)和概念化描述。
2 中藥本體構(gòu)建的原則和方法
針對(duì)復(fù)雜的中醫(yī)藥知識(shí)體系,構(gòu)建本體需明確分析核心概念體系、確定構(gòu)建基本原則、明確概念內(nèi)涵,按照系統(tǒng)規(guī)范的流程進(jìn)行。
構(gòu)建原則包括:①清晰性。術(shù)語定義盡可能采用形式化公理描述,避免含糊不清。中藥本體構(gòu)建中的概念出自權(quán)威辭典和書籍,需在中醫(yī)藥領(lǐng)域被廣泛認(rèn)可,明確沒有歧義的概念集合。②一致性。本體定義支持推理的一致性。中藥本體在描述上必須是一致的,且可支持與其定義和公理相一致的有意義的推理。③可擴(kuò)展性。概念表達(dá)仔細(xì)設(shè)計(jì),考慮將來可能使用,本體可被線性擴(kuò)展。中藥本體在設(shè)計(jì)構(gòu)建過程中,要充分考慮可能的擴(kuò)展。
構(gòu)建方法遵循“七步法”:①確定專業(yè)領(lǐng)域與范疇;②考察復(fù)用現(xiàn)有本體的可能性;③列出重要術(shù)語;④定義類和類的等級(jí)關(guān)系;⑤定義類的屬性;⑥定義屬性的分面;⑦創(chuàng)建實(shí)例。
3 中藥本體構(gòu)建步驟
中藥本體構(gòu)建基本思路:按照“七步法”流程,明確中藥專業(yè)領(lǐng)域包含的范圍和基本核心框架涉及的范疇;充分調(diào)研和考察現(xiàn)有中藥本體,考慮復(fù)用的可能性;列出中藥領(lǐng)域核心術(shù)語,明確概念內(nèi)涵;明確中藥領(lǐng)域核心類的框架及關(guān)系;參照中藥理論體系,結(jié)合專家咨詢指導(dǎo),建立各類屬性及關(guān)系,創(chuàng)建實(shí)例,加工入系統(tǒng)。
3.1 領(lǐng)域與范疇
科技部“973”項(xiàng)目子課題中藥理論框架構(gòu)建(2013CB532005)[10]提出中藥學(xué)概念體系雛形。其明確了中藥核心概念的層級(jí)關(guān)系,分為一級(jí)概念、二級(jí)概念和三級(jí)概念等,一級(jí)概念為大類“中藥學(xué)”與“中藥”,中藥下含中藥材、飲片和中成藥;二級(jí)概念反映學(xué)科基本理論,如“道地藥材”“功效”“性能”“七情”“炮制”等;其他則為基本概念。在該核心概念框架體系中,可明確中藥材、飲片、中成藥是中藥概念體系的核心概念,與之相關(guān)的二級(jí)概念則可在分析核心概念屬性及相關(guān)類的設(shè)置方面提供參考。
3.2 考察復(fù)用現(xiàn)有本體
中醫(yī)藥學(xué)語言系統(tǒng)(TCMLS)是一個(gè)基于本體技術(shù)構(gòu)建的大型計(jì)算機(jī)語言系統(tǒng),共收錄12萬個(gè)中醫(yī)藥學(xué)概念及概念間的127萬條語義關(guān)系[11]。中藥本體的構(gòu)建可考慮重用TCMLS中的概念與關(guān)系,從而豐富本研究概念關(guān)系。
3.3 本體核心概念框架體系構(gòu)建
基于本體思路,明確中藥核心概念,確定結(jié)構(gòu)體系與內(nèi)涵屬性,確定框架系統(tǒng)。依托“1.2”項(xiàng)中藥領(lǐng)域權(quán)威資源,進(jìn)行中藥概念內(nèi)涵辨析,構(gòu)建本體概念模型。通過對(duì)中藥概念體系調(diào)研與分析,得到中藥領(lǐng)域的核心概念類,包括“中藥”“中藥材”“中藥飲片”“中成藥”等,核心框架見圖1。
3.4 定義中藥本體核心類及屬性
在中藥本體核心概念內(nèi)涵確立的基礎(chǔ)上,進(jìn)一步確定類的屬性。對(duì)于具體中藥核心概念,要分析確立其自身屬性,并定義相關(guān)類的關(guān)系屬性,關(guān)系屬性代表了在領(lǐng)域中概念間的交互作用。
中藥本體建模時(shí),概念本身的屬性需根據(jù)其內(nèi)涵進(jìn)行定義。①中藥:抽象概念,核心在于中醫(yī)藥理論指導(dǎo)下使用的藥物,包括各種形態(tài)的中藥。②中藥材:原料藥材,來源于藥用動(dòng)、植、礦物,有藥用部位,經(jīng)初加工。③中藥飲片:以中藥材為原料藥,加工炮制,用于臨床和制劑生產(chǎn),具有自己的規(guī)格、臨床特性,現(xiàn)代技術(shù)影響下,飲片規(guī)格多樣,具有多種形態(tài)。④中成藥:復(fù)方或單方使用的成品藥劑,飲片是它的原料藥。根據(jù)對(duì)核心概念內(nèi)涵分析,基本確立了“中藥材”“中藥飲片”“中成藥”的自身屬性,納入具體實(shí)例信息,調(diào)整修改其屬性內(nèi)容,見圖2~圖4。
確定中藥本體核心概念類后,對(duì)核心概念類進(jìn)行擴(kuò)展,建立概念的分層結(jié)構(gòu),即中藥本體的概念整體框架模型。
3.5 實(shí)例納入
中藥本體概念體系的建立,使中藥本體的框架架構(gòu)基本顯現(xiàn)。對(duì)具體的中藥實(shí)例,根據(jù)各核心概念屬性進(jìn)行信息納入,并遵循各類之間的關(guān)系。中藥本體構(gòu)建要具有實(shí)用性,實(shí)例的描述具有重要意義,手工輸入添加實(shí)例,完善整個(gè)中藥本體。本研究以中藥麻黃為例,其藥材、飲片及組成的中成藥信息見圖5~圖7。
麻黃藥材有3種來源:草麻黃、中麻黃和木賊麻黃,對(duì)于具體的中藥材可分為3個(gè),但中藥材作為麻黃飲片的來源,需要抽提一個(gè)抽象概念來予以概括,即“麻黃”。而抽象概念“麻黃”作為麻黃中藥材可與麻黃飲片關(guān)聯(lián)。
麻黃飲片具有飲片的共同屬性,如規(guī)格、藥性、藥味、歸經(jīng)、功能、主治等。而在臨床中麻黃飲片有多種形態(tài),如麻黃超微飲片、麻黃配方顆粒、麻黃超微配方顆粒等,這些具體的飲片形態(tài)可抽提出一個(gè)抽象概念來表示,即“麻黃飲片”。
麻黃可作為飲片組成多種中成藥,如與細(xì)辛、桂枝、炙甘草等組成小青龍合劑。而小青龍合劑作為一種中成藥,也具備中成藥的共同屬性,有其性狀、功能、主治等。
4 結(jié)論
中醫(yī)藥學(xué)是一個(gè)復(fù)雜且龐大的理論體系,中藥學(xué)作為其中一個(gè)子領(lǐng)域,具有理論體系相對(duì)獨(dú)立的特點(diǎn)。本研究選取中藥學(xué)子領(lǐng)域作為研究對(duì)象,通過收集和梳理中藥領(lǐng)域各種來源的數(shù)據(jù),基于本體論的概念建模方法,明確中藥概念內(nèi)涵,確定概念屬性,厘清概念間的關(guān)系,初步完成了包括“中藥”“中藥材”“中藥飲片”“中成藥”等核心概念的本體建模。通過對(duì)中藥概念模型的構(gòu)建,明確了中藥概念內(nèi)涵及其關(guān)系,可為中藥知識(shí)資源的知識(shí)構(gòu)建和推理,以及中醫(yī)藥學(xué)其他子領(lǐng)域的知識(shí)表達(dá)和共享提供參考。
參考文獻(xiàn):
[1] LIU L, TAMER?ZSU M. Entry in the Encyclopedia of Database Systems[M]. New York:Springer US,2009:1784.
[2] 蘇里,朱慶偉,陳宜金,等.基于地理本體的空間數(shù)據(jù)庫概念建模[J].計(jì)算機(jī)工程,2007,33(12):87-89.
[3] 劉麗紅,賈李蓉,劉靜,等.中藥本體相關(guān)概念描述探討[J].中國數(shù)字醫(yī)學(xué),2016,11(2):90-92.
[4] 國家藥典委員會(huì).中華人民共和國藥典:一部[M].北京:中國醫(yī)藥科技出版社,2015.
[5] 中華人民共和國國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局,中國國家標(biāo)準(zhǔn)化管理委員會(huì).中藥編碼規(guī)則及編碼:GB/T 31774-2015[S].北京:中國標(biāo)準(zhǔn)出版社,2015.
[6] 南京中醫(yī)藥大學(xué).中藥大辭典[M].上海:上海科學(xué)技術(shù)出版社,2006.
[7] 國家中醫(yī)藥管理局《中華本草》編委會(huì).中華本草精選本[M].上海:上海科學(xué)技術(shù)出版社,1998.
[8] 鐘贛生.中藥學(xué)[M].北京:中國中醫(yī)藥出版社,2012.
[9] 張延模.臨床中藥學(xué)[M].北京:中國中醫(yī)藥出版社,2012.
[10] 楊敏,陳勇,張廷模,等.對(duì)中藥學(xué)概念體系雛形構(gòu)建的研究[J].中藥藥理與臨床,2015,31(6):215-217.
[11] 賈李蓉,朱玲,董燕,等.中醫(yī)藥學(xué)語言系統(tǒng)評(píng)價(jià)體系的研究與建立[J].中國數(shù)字醫(yī)學(xué),2012,7(10):13-16.