漆勝蘭
摘要:中醫(yī)古籍是中華民族幾千年防病治病的智慧結(jié)晶,是我國(guó)傳統(tǒng)文化的寶貴財(cái)富。本文綜合了2004-2014年中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)的發(fā)展?fàn)顩r,提出存在的問(wèn)題,并對(duì)未來(lái)研究思路進(jìn)行了闡述。
關(guān)鍵詞:中醫(yī)古籍:數(shù)據(jù)庫(kù):建設(shè):綜述
中醫(yī)古籍是中華民族幾千年防病治病的智慧結(jié)晶,是我國(guó)傳統(tǒng)文化的寶貴財(cái)富。古籍?dāng)?shù)字化是指利用現(xiàn)代技術(shù)將古籍中的文字或圖像信息轉(zhuǎn)化為能被計(jì)算機(jī)識(shí)別的數(shù)字符號(hào),形成書目數(shù)據(jù)庫(kù)、全文數(shù)據(jù)庫(kù)和知識(shí)庫(kù),從而實(shí)現(xiàn)古籍整理、存儲(chǔ)、檢索、閱讀、傳輸?shù)饶康模_(dá)到保護(hù)、利用和挖掘古籍知識(shí)的功效。通過(guò)數(shù)字化處理,既可以實(shí)現(xiàn)對(duì)珍貴古籍的保存,又可實(shí)現(xiàn)資源共享,傳承中華文明。古籍?dāng)?shù)據(jù)庫(kù)建設(shè)是古籍?dāng)?shù)字化的一種方式,本文對(duì)2004-2014年間國(guó)內(nèi)外中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)的建設(shè)進(jìn)行綜述。
1 中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)現(xiàn)狀
1.1 中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)的建設(shè)形式及現(xiàn)狀
陳力認(rèn)為中國(guó)大陸古籍成規(guī)模的數(shù)字化工作基本上是由教學(xué)和研究機(jī)構(gòu)、圖書館、商業(yè)機(jī)構(gòu)這3個(gè)類型的部門完成。從目前的數(shù)字化成果來(lái)看,中醫(yī)古籍?dāng)?shù)字化建設(shè)形式主要有書目型數(shù)據(jù)庫(kù)、全文型數(shù)據(jù)庫(kù)、全圖像型數(shù)據(jù)庫(kù)、圖文型數(shù)據(jù)庫(kù)、古籍知識(shí)庫(kù)。
1.1.1 中醫(yī)古籍書目型數(shù)據(jù)庫(kù)書目型數(shù)據(jù)庫(kù)是將古籍書名、著者、版本、卷次、摘要、出版年等信息輸入計(jì)算機(jī)而形成的數(shù)據(jù)庫(kù),讀者可以通過(guò)書名、著者等檢索到某古籍的相關(guān)信息。該類型的代表是中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所的“全國(guó)中醫(yī)藥珍善本古籍檔案管理系統(tǒng)”、“海外古籍書目數(shù)據(jù)庫(kù)”,及中國(guó)中醫(yī)科學(xué)院圖書館的“館藏中醫(yī)古籍目錄數(shù)據(jù)庫(kù)”。
目前國(guó)內(nèi)有一定中醫(yī)藥古籍藏書規(guī)模的醫(yī)學(xué)院校、科研機(jī)構(gòu)、圖書館也都相繼進(jìn)行了書目數(shù)據(jù)庫(kù)的建設(shè),如北京中醫(yī)藥大學(xué)圖書館的“中醫(yī)藥古籍書目數(shù)據(jù)庫(kù)”、上海圖書館的“古籍書目數(shù)據(jù)庫(kù)”和“中醫(yī)古籍善本書目提要”、大連圖書館的“特色館藏古籍線裝書目庫(kù)”、北京大學(xué)及多家圖書館的“CALIS(中國(guó)高等教育文獻(xiàn)保障系統(tǒng))古籍聯(lián)合目錄”、上海中醫(yī)藥大學(xué)圖書館的“善本書目提要數(shù)據(jù)庫(kù)”、浙江中醫(yī)藥大學(xué)圖書館的“館藏古籍目錄數(shù)據(jù)庫(kù)”、山西中醫(yī)藥大學(xué)圖書館的“古籍書目數(shù)據(jù)庫(kù)”、山東中醫(yī)藥大學(xué)圖書館的“占籍書目數(shù)據(jù)庫(kù)”等等。但因國(guó)內(nèi)沒(méi)有統(tǒng)一的建庫(kù)標(biāo)準(zhǔn),各種書目數(shù)據(jù)庫(kù)揭示的深度不一樣。
1.1.2 中醫(yī)古籍全文型數(shù)據(jù)庫(kù)全文型數(shù)據(jù)庫(kù)是將古籍全文手工錄入,形成電子文本,供用戶查詢。這種數(shù)據(jù)庫(kù)存儲(chǔ)空間小,便于檢索和閱讀,但是沒(méi)有保持古籍原貌,且文字錄入有難度,容易出錯(cuò)。中醫(yī)藥古籍含有穴位、圖譜等信息,數(shù)字化的困難更大。臺(tái)灣高雄市立中醫(yī)院的“中醫(yī)古籍文獻(xiàn)全文檢索系統(tǒng)”和由湖南電子音像出版社出版的光盤版《中華醫(yī)典》就是典型的全文型數(shù)據(jù)庫(kù)。
1.1.3 中醫(yī)古籍全圖像型數(shù)據(jù)庫(kù) 全圖像型數(shù)據(jù)庫(kù)是將古籍直接以圖像格式掃描存儲(chǔ),加入簡(jiǎn)單標(biāo)題和分類,能保存古籍原貌,有助于專業(yè)研究,但是這種數(shù)據(jù)庫(kù)存儲(chǔ)空間大且不方便檢索。如武漢大學(xué)出版社開(kāi)發(fā)出的《四庫(kù)全書》光盤版就是以文淵閣本《四庫(kù)全書》為底本,掃描全書,手工錄入總目。
1.1.4 中醫(yī)古籍圖文型數(shù)據(jù)庫(kù) 圖文型數(shù)據(jù)庫(kù)是利用圖像處理技術(shù)與超鏈接技術(shù)結(jié)合形成的數(shù)據(jù)庫(kù),即在古籍書頁(yè)圖像化的基礎(chǔ)上,將書中具有檢索意義的信息轉(zhuǎn)化為電腦可識(shí)別的文字,并加以合適的軟件工具,為用戶提供快捷有效的檢索、統(tǒng)計(jì)、整理和編輯功能。這種數(shù)據(jù)庫(kù)能再現(xiàn)古籍原貌、方便檢索,是目前古籍?dāng)?shù)字化的最佳方式。中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所的“中醫(yī)藥珍善本占籍多媒體數(shù)據(jù)庫(kù)”和由北京大學(xué)劉俊文教授總策劃、總編纂的《中國(guó)基本古籍庫(kù)》(醫(yī)書集成)可為此類代表。
1.1.5 古籍知識(shí)庫(kù) 古籍知識(shí)庫(kù)是人工智能和數(shù)據(jù)庫(kù)結(jié)合的產(chǎn)物,它以統(tǒng)一的形式存儲(chǔ)知識(shí)。知識(shí)庫(kù)的知識(shí)是高度結(jié)構(gòu)化的符號(hào)數(shù)據(jù),用戶可以進(jìn)行深層次的知識(shí)挖掘,實(shí)現(xiàn)由書目到全文等多個(gè)知識(shí)點(diǎn)的關(guān)聯(lián)檢索,也可以由一個(gè)作者檢索到其他相關(guān)作者等。中國(guó)中醫(yī)科學(xué)院中國(guó)醫(yī)史文獻(xiàn)研究所中醫(yī)古籍?dāng)?shù)字化研究室的“中醫(yī)藥古文獻(xiàn)知識(shí)庫(kù)”是其代表。該知識(shí)庫(kù)構(gòu)建了我國(guó)第一個(gè)中醫(yī)古籍知識(shí)庫(kù)系統(tǒng),目前已經(jīng)建成中醫(yī)古籍本草知識(shí)庫(kù)、中醫(yī)古籍方劑知識(shí)庫(kù),以及張仲景、陳士鐸、新安醫(yī)學(xué)、婦科、醫(yī)案、蒙醫(yī)藥等6個(gè)中醫(yī)古籍專題知識(shí)庫(kù)。
1.1.6 國(guó)外中醫(yī)古籍?dāng)?shù)據(jù)庫(kù) 國(guó)內(nèi)的中醫(yī)古籍?dāng)?shù)字化取得了一些成就,國(guó)外中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)也在建設(shè)中。雖然在建設(shè)規(guī)模和涵蓋資源上與國(guó)內(nèi)有些差距,但是也具有非凡的意義和價(jià)值。例如日本的全文數(shù)據(jù)庫(kù)“全國(guó)漢籍?dāng)?shù)據(jù)庫(kù)一一子部醫(yī)家類”“數(shù)字化善本書——醫(yī)學(xué)”“民族藥物資料館——證類本草”,加拿大的“中醫(yī)在線圖書館”以及美國(guó)的全影像數(shù)據(jù)庫(kù)“YiJing: The mlrror of medicine”等等。
1.2 中醫(yī)古籍養(yǎng)生數(shù)據(jù)庫(kù)的現(xiàn)狀
古今往來(lái),健康長(zhǎng)壽是人類的美好愿望,養(yǎng)生保健是人們永恒的話題和社會(huì)關(guān)注的熱點(diǎn)。特別是近年來(lái),隨著科學(xué)的發(fā)展和生活水平的提高,人們自我保健意識(shí)和養(yǎng)生要求逐漸提高,中醫(yī)養(yǎng)生學(xué)顯示出強(qiáng)大的生命力,中國(guó)數(shù)千年積累的養(yǎng)生法備受世界青睞。我國(guó)養(yǎng)生學(xué)內(nèi)容廣泛,方法眾多,養(yǎng)生論著卷帙浩繁,有的是養(yǎng)生專著,有的則是部分章節(jié)論述養(yǎng)生,更多的是散見(jiàn)于各類著作中,如道教、佛教、史學(xué)典籍等,未形成一個(gè)全面、系統(tǒng)的學(xué)科。中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)的建設(shè)方興未艾,取得了一定成果,如《中華醫(yī)典》以及“中國(guó)中醫(yī)藥數(shù)據(jù)庫(kù)”“中國(guó)古籍資源數(shù)據(jù)庫(kù)”“龍語(yǔ)瀚堂典籍?dāng)?shù)據(jù)庫(kù)”都收錄了大量中醫(yī)古籍,但是關(guān)于養(yǎng)生類的專題數(shù)據(jù)庫(kù)發(fā)展還比較緩慢。如目前中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)當(dāng)中收錄最全、范圍最廣的電子資源文獻(xiàn)庫(kù)“龍語(yǔ)瀚堂典籍?dāng)?shù)據(jù)庫(kù)”所收錄的中醫(yī)藥文獻(xiàn)達(dá)700多部近10000冊(cè),只在中醫(yī)藥類收錄養(yǎng)生類古籍35種。巨型數(shù)字古籍叢書《中國(guó)基本古籍庫(kù)》收錄了上自先秦、下至民國(guó)的歷代典籍10000余種,其中休閑養(yǎng)生目收錄28部,武術(shù)技擊目收錄14部,氣功健身目收錄11部。目前,南京中醫(yī)藥大學(xué)的“氣功基本古籍提要庫(kù)”是以專門的氣功、導(dǎo)引、養(yǎng)生著作為主要內(nèi)容的數(shù)據(jù)庫(kù),屬于氣功養(yǎng)生的專題庫(kù)。中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所建設(shè)開(kāi)發(fā)的“中醫(yī)古籍養(yǎng)生數(shù)據(jù)庫(kù)”收錄養(yǎng)生古籍110種,并可瀏覽全文圖片。
2 中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)建設(shè)存在的問(wèn)題
2.1 中醫(yī)古籍書目收集及錄入
中醫(yī)古籍?dāng)?shù)量大,版本多,全面收集版本優(yōu)良的古籍是古籍?dāng)?shù)字化中的一大課題。古籍圖書印刷格式多樣,出版方式隨意,多處標(biāo)有正題名且各處書名不盡相同,編目人員需要對(duì)各種書名信息進(jìn)行分析、思考,方能準(zhǔn)確而規(guī)范地著錄正題名。另外,摘要由編目人員編寫,編目人員的責(zé)任心和相關(guān)專業(yè)知識(shí),如對(duì)古籍中同藥異名、異藥同名,古籍中的病證和現(xiàn)代病名等知識(shí)的掌握,也直接影響書目數(shù)據(jù)的質(zhì)量。
2.2 中醫(yī)古籍用字
古籍?dāng)?shù)字化建設(shè)難度大,其中面臨最多的問(wèn)題是有關(guān)用字的問(wèn)題。據(jù)查,《康熙字典》收字就達(dá)49 030個(gè)。漢字在漫長(zhǎng)的演變過(guò)程中產(chǎn)生的繁簡(jiǎn)字、異體字、古今字、通假字就更數(shù)不勝數(shù)了。中醫(yī)古籍?dāng)?shù)字化目前面臨著無(wú)古籍大字庫(kù)、古籍生僻字錄入、古籍光學(xué)字符識(shí)別系統(tǒng)(Optical Character Recognition,OCR)識(shí)別、古籍排版等幾個(gè)難題。陳進(jìn)等認(rèn)為產(chǎn)生這些現(xiàn)象的原因主要是對(duì)字體的認(rèn)知障礙和技術(shù)障礙。高晶晶認(rèn)為可以通過(guò)私用區(qū)造字法、圖片代替法、自然語(yǔ)言描述法、動(dòng)態(tài)組字法等方法在一定范圍內(nèi)解決古籍閱讀和檢索用字的問(wèn)題。
2.3 中醫(yī)古籍?dāng)?shù)字化標(biāo)準(zhǔn)尚未建立
合作與共享是中醫(yī)古籍?dāng)?shù)字化發(fā)展的趨勢(shì),文獻(xiàn)標(biāo)準(zhǔn)化是文獻(xiàn)資源共享的前提和基礎(chǔ)。古籍?dāng)?shù)字化,需要規(guī)范的著錄條例、數(shù)據(jù)庫(kù)格式、編目軟件使用字庫(kù),還要統(tǒng)一的古籍分類法。但是中醫(yī)古籍?dāng)?shù)字化標(biāo)準(zhǔn)尚未建立,國(guó)內(nèi)至今未形成統(tǒng)一的古籍分類法。曾燕認(rèn)為應(yīng)以《四庫(kù)法》(即按經(jīng)、史、子、集分類)為基礎(chǔ),制定完善的古籍分類法。劉文波等認(rèn)為《全國(guó)中醫(yī)圖書聯(lián)合目錄》的分類體系,基本上包括了現(xiàn)存中醫(yī)古籍的主要種類,比較符合讀者“以類求書”的使用習(xí)慣。李兵認(rèn)為中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)內(nèi)容、檢索功能、輔助功能和服務(wù)功能這4個(gè)要素可以作為中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)的評(píng)價(jià)要素和一級(jí)指標(biāo)。
2.4 中醫(yī)古籍?dāng)?shù)字化的開(kāi)發(fā)深度
符永馳等認(rèn)為中醫(yī)古籍?dāng)?shù)字化不應(yīng)僅僅滿足于對(duì)古籍的閱覽和查詢。劉毅認(rèn)為在數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)普及的時(shí)代,利用現(xiàn)代技術(shù)手段,挖掘中醫(yī)古籍的內(nèi)涵知識(shí)很重要,但是目前由于各種因素的影響,數(shù)據(jù)庫(kù)不具備古籍知識(shí)深度挖掘的功能,從這方面來(lái)說(shuō),專業(yè)的中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)尚處于初級(jí)階段。古代中醫(yī)藥文獻(xiàn)是一個(gè)知識(shí)寶庫(kù),在數(shù)字化的基礎(chǔ)上挖掘古籍中的寶貴知識(shí)財(cái)富,實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)和知識(shí)拓展,更好地為中醫(yī)藥事業(yè)的發(fā)展和人類健康服務(wù)是中醫(yī)古籍?dāng)?shù)字化的最高目標(biāo)。
除上述內(nèi)容以外,技術(shù)手段落后、經(jīng)費(fèi)制約等等也是中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)建設(shè)中存在的問(wèn)題。
3 總結(jié)與展望
中醫(yī)古籍?dāng)?shù)字化已經(jīng)取得了一定成就,建立了不同類型的數(shù)據(jù)庫(kù),在很大程度上實(shí)現(xiàn)了保護(hù)和利用中醫(yī)古籍的目的。但是數(shù)據(jù)庫(kù)建設(shè)中的用字問(wèn)題、數(shù)據(jù)庫(kù)建設(shè)標(biāo)準(zhǔn)及數(shù)據(jù)庫(kù)知識(shí)的深度挖掘問(wèn)題仍然有待研究。同時(shí),養(yǎng)生學(xué)作為中醫(yī)的一個(gè)重要學(xué)科,其數(shù)據(jù)庫(kù)建設(shè)仍有待加強(qiáng),構(gòu)建數(shù)量多、版本齊全、信息涵蓋量大的古籍養(yǎng)生數(shù)據(jù)庫(kù)有著重要的現(xiàn)實(shí)意義和學(xué)術(shù)研究意義,對(duì)中醫(yī)養(yǎng)生學(xué)科的內(nèi)涵外延的界定具有促進(jìn)作用。在建立信息涵蓋量大的古籍養(yǎng)生數(shù)據(jù)庫(kù)的基礎(chǔ)上,從小處著眼,著重研究新安醫(yī)籍中的養(yǎng)生古籍,建立數(shù)據(jù)庫(kù),研究其與前人、同時(shí)代及后世之間的學(xué)術(shù)繼承、借鑒和影響,可操作性強(qiáng)。作為中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)建設(shè)的一部分,養(yǎng)生類古籍文獻(xiàn)的整理與數(shù)據(jù)庫(kù)開(kāi)發(fā)有待進(jìn)一步拓展與深化??傊?,在計(jì)算機(jī)及網(wǎng)絡(luò)技術(shù)不斷發(fā)達(dá)的今天,中醫(yī)古籍?dāng)?shù)據(jù)庫(kù)的建設(shè)會(huì)有更大的發(fā)展前景,會(huì)為中醫(yī)傳承做出更大的貢獻(xiàn)。