浙江中醫(yī)藥大學(杭州,310053) 焦 陽 凌 天 狄碧云
近代中國,社會動蕩,但總體來看,出版業(yè)仍相對繁榮,有大量的中醫(yī)書籍出版發(fā)行。近代中醫(yī)文獻包括清末古籍、民國圖書及期刊等文獻,是傳統(tǒng)醫(yī)藥文化遺產(chǎn)的重要組成部分。本文通過梳理中醫(yī)文獻著作并利用知識挖掘技術(shù),構(gòu)建中醫(yī)文獻特色數(shù)據(jù)庫,分析某一特定時期特定區(qū)域醫(yī)家醫(yī)籍文獻的分類、分布情況,以期讓讀者更好地利用中醫(yī)文獻資源,使其展現(xiàn)經(jīng)典價值,并為中醫(yī)文獻數(shù)字化建庫模式提供一種全新的研究方法和思路。
浙派中醫(yī)源遠流長,歷代名醫(yī)輩出,醫(yī)籍汗牛充棟。歷史上先后產(chǎn)生眾多中醫(yī)學術(shù)派別,諸如永嘉醫(yī)派、丹溪學派、錢塘醫(yī)派、紹派傷寒、溫病學派等,具有深遠影響。近代以來,中醫(yī)受到了西學東漸、“中醫(yī)存廢”政策的沖擊,浙派醫(yī)家們積極探索中醫(yī)學發(fā)展新模式。許多中醫(yī)名家如國醫(yī)革新導(dǎo)師章炳麟、錢塘醫(yī)派仲學輅、永嘉徐定超、紹興裘吉生等,共同推動了地方中醫(yī)藥事業(yè)的發(fā)展。著作方面,近代浙江重要醫(yī)籍雖不及以前,但也數(shù)量眾多,精品迭出。因此整理研究近代浙派中醫(yī)文獻并建設(shè)中醫(yī)文獻特色數(shù)據(jù)庫,對彰顯和保護傳統(tǒng)醫(yī)學、挖掘浙江醫(yī)學流派及賢哲經(jīng)驗智慧具有重要參考價值,值得全面整理、繼承,精心研究。
1.近代中醫(yī)文獻具有很高的學術(shù)價值
近代中醫(yī)學術(shù)上秉承“中學為體,西學為用”,其對當代浙江中醫(yī)藥事業(yè)的發(fā)展具有重要價值,體現(xiàn)在:(1)中西醫(yī)論爭與匯通類著作涌現(xiàn)。中西醫(yī)匯通思想深刻影響了中醫(yī)學的發(fā)展,也是近代醫(yī)學發(fā)展的重要特征。浙江地區(qū)中西醫(yī)匯通之作集中于民國時期,隨著中西醫(yī)對比研究更加深入,浙派醫(yī)家嘗試用西醫(yī)知識來解釋中醫(yī)理論,力圖實現(xiàn)中西醫(yī)匯通。比較有影響的是楊則民,其《內(nèi)經(jīng)的哲學檢討》一文,駁斥了廢止中醫(yī)派的各種錯誤觀點[1]。當時中西醫(yī)匯通的思想雖有很多局限,但也有很多值得肯定之處。(2)中醫(yī)教材著作推動近代中醫(yī)學校教育。清末廢除科舉,設(shè)立新式學堂,改良了傳統(tǒng)醫(yī)學教育模式,開啟了近代中醫(yī)教育的序幕。浙江作為近代民辦中醫(yī)教育的主要發(fā)源地之一,創(chuàng)辦了許多新式中醫(yī)學校,編寫了大量教材著作,如“浙江中醫(yī)專門學?!毙iL傅崇黻所編教材《外科要旨講義》(1938年)等。這些中醫(yī)教材凝聚了浙江中醫(yī)教育界人士的拳拳之心,培養(yǎng)了大批中醫(yī)人才,為中醫(yī)學術(shù)傳承做出了巨大貢獻[2]。(3)臨床醫(yī)學著作占據(jù)主導(dǎo)地位。近代西方醫(yī)學的傳入推動了中醫(yī)學尤其是中醫(yī)臨床的發(fā)展,使其成為近代中醫(yī)學發(fā)展的核心,浙江地區(qū)也大致如此。中醫(yī)臨床各科著作以溫病、內(nèi)科、兒科為主,出現(xiàn)了《溫熱經(jīng)緯》(1852年)等經(jīng)典醫(yī)學巨著。民國時期的浙派醫(yī)家如曹炳章、何廉臣等注重中醫(yī)臨床治療效果的總結(jié),以證明中醫(yī)科學有效。(4)大型醫(yī)學叢書匯編類著作發(fā)展。沿襲前代傳統(tǒng),醫(yī)學叢書的匯編匯刻是近代中醫(yī)書籍發(fā)展的主流。浙派醫(yī)家所編叢書匯編類著作主要是一些大部頭的醫(yī)學工具書。比較著名的是祝韻梅《壽世匯編》(1867年),重印多次,版本眾多。貢獻最大者當屬裘吉生、曹炳章二人。裘吉生的《三三醫(yī)書》(1924年),保存大量江浙一帶的名醫(yī)方論,內(nèi)容齊全,兼顧各科,其中有些書已是孤版,價值很高[3]。曹炳章的《中國醫(yī)學大成》(1936年),匯集漢唐至明清一百余醫(yī)家及日本漢醫(yī)家著述,也很有代表性。叢書匯編類著作為研究近代醫(yī)學發(fā)展提供了珍貴史料和寶貴經(jīng)驗。
2.文獻數(shù)字化有利于近代中醫(yī)文獻保護和利用
清末民國時期的中國,發(fā)生過很多極具影響的社會事件,近代文獻在這場社會變革浪潮中具有較高的史料價值和利用價值。這一時期的中醫(yī)文獻既有古籍的特性,又有現(xiàn)代文獻的特性,體現(xiàn)中醫(yī)由古代向現(xiàn)代邁進過程中的諸多時代特征。當前許多收藏機構(gòu),如國家圖書館已經(jīng)把清末民國時期文獻列入館藏珍品的范圍,并開展數(shù)字化研究[4]。但是從一些調(diào)查數(shù)據(jù)來看,當前近代文獻普遍存在不同程度的損毀,文獻保護工作尚需加強[5]。究其原因,首先是自然原因?qū)е碌奈墨I本身的酸化和老化。近代出版的中醫(yī)文獻多是采用機制含酸紙張印制而成,紙張質(zhì)量較差,易于老化, 以其為載體的文獻, 據(jù)說只能保存百年左右。其次是人為因素,即早期研究和管理人員認識觀念的偏差,較之那些備受推崇的年代久遠的古籍善本,近代文獻備受冷落,保存隨意,過度翻閱,導(dǎo)致很多的近代文獻損毀嚴重,修復(fù)困難。再者,許多近代中醫(yī)文獻沒有重新整理再版,僅存唯一抄本,且利用率遠高于傳統(tǒng)古籍,面臨失傳的風險。最后,近代文獻采用雙面印刷形式,傳統(tǒng)的古籍裱托修復(fù)方法并不適合近代文獻[6],需要用西方的文獻修復(fù)技術(shù),成本很高。因此,文獻數(shù)字化,建立特色數(shù)據(jù)庫是最好的文獻保護方法。首先,建立特色數(shù)據(jù)庫實現(xiàn)了對文獻數(shù)字化還原,原貌再現(xiàn);其次,根據(jù)著作權(quán)法的相關(guān)規(guī)定,大部分近代文獻已過知識產(chǎn)權(quán)保護期,為數(shù)字化資源共享帶來便利;最后,資源平臺可以豐富用戶體驗效果,實現(xiàn)模擬文獻翻頁、縮放等全新體驗[7]。
1.研究資料及方法
本文以《中國中醫(yī)古籍總目》(2007年)(以下簡稱《古籍總目》)中記載的中醫(yī)書目為主要數(shù)據(jù)來源,以近代時期(1840—1949年)浙派醫(yī)家醫(yī)著文獻為研究對象。《古籍總目》收錄了全國150家圖書館館藏1949年以前出版的存世中醫(yī)古籍書目13455部,是迄今為止覆蓋面最廣的反映中醫(yī)文獻現(xiàn)狀的大型聯(lián)合目錄[2]。
圈定研究范圍后,本研究主要以文獻調(diào)查法與網(wǎng)絡(luò)調(diào)查法搜集、查證相關(guān)文獻。參考了《中醫(yī)人名辭典》、《浙江醫(yī)籍考》及浙江地方志等眾多文獻,對《古籍總目》中醫(yī)著作進行標注,做到書名、著者、名號、出版年代一致,剔除了原著補正、校注等非原著者、審定者、無法考證者、著者佚名者醫(yī)籍書目,同時還注重《古籍目錄》未收錄的現(xiàn)存文獻的整理和收錄。在整理文獻中,關(guān)于收錄的著者遵循以下原則:(1)原籍是浙江、后遷居外地的浙派醫(yī)家的醫(yī)著以及本土資料記載的醫(yī)著,予以收錄;(2)原籍外地,但長期在浙江居住、工作,并對浙派中醫(yī)有研究者,醫(yī)著可納入;(3)浙派中醫(yī)的專論著作予以收錄。
2.館藏分布
調(diào)查統(tǒng)計結(jié)果顯示,《古籍總目》中共整理出近代浙派中醫(yī)醫(yī)著475部,各種版本的醫(yī)籍數(shù)據(jù)3944條,涉及醫(yī)家近100位。我們從館藏角度將3944條醫(yī)籍數(shù)據(jù)錄入計算機系統(tǒng)進行統(tǒng)計分析,得出版本數(shù)879種,藏于139個圖書館中,主要在上海中醫(yī)藥大學圖書館(226種)、中國中醫(yī)科學院圖書館(212種)、上海圖書館(149種)和浙江省中醫(yī)藥研究院(105種)。這些單位收藏量都在百種以上,其中上海中醫(yī)藥大學收藏最多。收藏量分列其后的是國家圖書館(89種)、南京圖書館(88種)、南京中醫(yī)藥大學圖書館(81種)、安徽中醫(yī)藥大學圖書館(81種)、成都中醫(yī)藥大學圖書館(76種)、浙江中醫(yī)藥大學圖書館(74種),另外,蘇州市中醫(yī)醫(yī)院圖書館、北京中醫(yī)藥大學圖書館也收藏了70種以上的醫(yī)籍。由于版本的原因,這些醫(yī)籍種類是存在重復(fù)的。
3.版本特點
從版本類型來看,879種版本的中醫(yī)典籍主要有鉛印本、刻本、石印本、抄本、稿本、影印本等,載體豐富,形式多樣。其中刻本數(shù)最多(309種);其次是鉛印本(250種)、抄本(153種)和石印本(112種),稿本(42種)和影印本(8種)較少??梢钥闯觯迥┟駠鴷r期,現(xiàn)代機械印刷工藝尚未完全取代傳統(tǒng)的雕版印刷,抄本和刻本仍然是主流的書籍出版手段。鑒于鉛印和石印工藝物美價廉、印制方便,可以快速有效地增加館藏數(shù)量,方便了書籍的保存和流通,所以從民國開始,以鉛印與石印為代表的機械印刷工藝后來居上,逐漸取代雕版,成為主流的印刷手段,直到今天,也充分說明了近代充滿變革的時代屬性。
4.分類概況
從分類概況來看,475部浙派中醫(yī)醫(yī)著研究內(nèi)容廣泛,幾乎涵蓋了中醫(yī)藥的所有門類。其中,有關(guān)醫(yī)案醫(yī)話醫(yī)論的著作最多(81部),其次是方書(42部)、溫病(41部)、本草(37部)、綜合(35部)、內(nèi)科(33部)、傷寒金匱(24部)。這幾個門類也是近代醫(yī)家普遍關(guān)注的門類,故著述相對集中。另外,臨證類各科(臨證綜合、溫病、內(nèi)科、女科、兒科、外科、五官科、傷科)著作共有178部,中醫(yī)基礎(chǔ)理論類(基礎(chǔ)理論、醫(yī)經(jīng)、傷寒金匱)著作共有56部??梢钥闯?,臨證醫(yī)學各科研究成果豐碩,已成為近代中醫(yī)藥學發(fā)展的重要特征[3]。
1.中醫(yī)文獻數(shù)字化現(xiàn)狀
國內(nèi)中醫(yī)文獻數(shù)字化的研究可以追溯到20世紀80年代的古籍數(shù)字化,歷經(jīng)幾十年的發(fā)展,在基礎(chǔ)理論和標準化技術(shù)方面的研究和應(yīng)用已經(jīng)比較成熟[8]。近年來,中醫(yī)文獻數(shù)字化逐漸受到國家和中醫(yī)藥類高校、公共圖書館、中醫(yī)科研機構(gòu)、商業(yè)公司等重視,陸續(xù)建成一批書目數(shù)據(jù)庫和全文資源庫,反映了收藏單位的古籍收藏情況。部分數(shù)據(jù)庫還實現(xiàn)了數(shù)據(jù)挖掘功能,但是在近代中醫(yī)文獻數(shù)字化研究方面稍顯不足。在取得成果的同時,我們也應(yīng)該看到在中醫(yī)古籍文獻數(shù)據(jù)庫的規(guī)劃、建設(shè)、共享、利用等過程中存在的一些問題:(1)缺乏整體規(guī)劃。在中醫(yī)古籍數(shù)字化規(guī)劃中,各個機構(gòu)和商業(yè)公司往往獨立開發(fā),建成的資源庫涵蓋數(shù)據(jù)量有限,缺乏整體規(guī)劃。一些公共圖書館、博物館等非醫(yī)學專業(yè)收藏機構(gòu),沒有做到對館藏資源的分門別類,醫(yī)著數(shù)字化散見于各個古籍數(shù)據(jù)庫中,不利于文獻利用[9]。(2)建設(shè)滯后。中醫(yī)古籍數(shù)字化具有很強的專業(yè)性,除了一些商業(yè)公司和少數(shù)單位外,多數(shù)單位都存在技術(shù)人員與設(shè)備不足的問題,缺乏深層次開發(fā)。收藏機構(gòu)數(shù)據(jù)庫建設(shè)質(zhì)量參差不齊,古籍目錄類數(shù)據(jù)庫居多,許多數(shù)據(jù)庫建成很早,缺乏必要的升級維護,已經(jīng)無法訪問。(3)資源共享不足。資源共享是提升古籍資源利用價值的重要手段,調(diào)查發(fā)現(xiàn),除了少數(shù)數(shù)據(jù)庫外,許多庫在互聯(lián)網(wǎng)上無法訪問,了解不到該收藏單位的古籍資源情況。
2.文獻全文數(shù)字化采集策略
為了避免重復(fù)建設(shè),我們在文獻掃描前對文獻數(shù)字化情況進行了查重調(diào)查。調(diào)查發(fā)現(xiàn),當前有關(guān)近代浙派醫(yī)家醫(yī)著主要散見于各個古籍數(shù)據(jù)庫中或是收錄在民國圖書數(shù)據(jù)庫中。進行近代中醫(yī)文獻全文數(shù)字化保存的單位有國家圖書館、北京大學圖書館、上海圖書館等。通過檢索本單位已購買或公開可共享的大型古籍全文數(shù)據(jù)庫后發(fā)現(xiàn),前期整理475部浙派中醫(yī)醫(yī)著目錄中有139部醫(yī)籍已經(jīng)完成數(shù)字化,占29.3%。其中超星讀秀數(shù)據(jù)庫全文數(shù)字化數(shù)量最多,達到101部,之后依次是中國國家數(shù)字圖書館(76部)、大學數(shù)字圖書館國際合作計劃(以下簡稱CADAL,26部)和瀚堂數(shù)據(jù)庫(3部)。各個數(shù)據(jù)庫之間數(shù)字化醫(yī)籍互有重復(fù),相互補充,采用版本也不同。其中超星讀秀數(shù)據(jù)庫可以提供全文檢索,使用方便,而CADAL掃描的醫(yī)籍質(zhì)量較高,內(nèi)容清晰??梢钥闯?,目前浙派醫(yī)家醫(yī)著數(shù)字化程度很低。對于已經(jīng)數(shù)字化的文獻,我們購買數(shù)字化全文,下載已購數(shù)字資源或遠程調(diào)用全文鏈接。除此之外,針對本單位收藏的70余種浙派中醫(yī)文獻,我們進行CCD掃描數(shù)字化處理,通過糾偏、裁剪、加水印、文件命名等技術(shù)化操作,完成數(shù)字化加工。對于其中屬于古籍的,數(shù)據(jù)采集過程嚴格按照國家古籍保護中心的《古籍數(shù)字化工作手冊》(2014年)來執(zhí)行。對于非本單位收藏的文獻,我們以單位的名義與該文獻的收藏單位協(xié)商解決數(shù)字化問題。在數(shù)字化過程中保證文獻資源全貌,符合讀者閱讀習慣。
1.平臺架構(gòu)
根據(jù)前期的文獻梳理情況,本文以“近代浙派中醫(yī)文獻數(shù)據(jù)庫平臺”(以下簡稱“數(shù)據(jù)庫平臺”)為例,介紹中醫(yī)文獻古籍數(shù)字化建設(shè)。當前各類中醫(yī)古籍數(shù)據(jù)庫琳瑯滿目、各具特色,在古籍數(shù)字化平臺建設(shè)中應(yīng)當充分吸收各個數(shù)據(jù)庫的成功經(jīng)驗,立足收藏單位的實際需求,自建或采購商業(yè)平臺。為了更好地研究浙派中醫(yī)發(fā)展情況,我們經(jīng)過對各個商用數(shù)據(jù)庫平臺的綜合調(diào)研,最終決定依托圖書館的文獻信息資源優(yōu)勢,組織相關(guān)專業(yè)和技術(shù)人員自建該平臺。網(wǎng)站平臺采用B/S架構(gòu),HTML5頁面,利用主流的Java+MVC框架技術(shù),構(gòu)建基于mySQL的醫(yī)家子庫、醫(yī)著子庫和流派子庫的數(shù)據(jù)庫,在兼顧實用性的基礎(chǔ)上,頁面具有良好的自適應(yīng)性,適合各種瀏覽器、中醫(yī)文化墻等大屏幕展示,起到了很好的宣傳推廣中醫(yī)藥文化的作用?!皵?shù)據(jù)庫平臺”構(gòu)建主要分全文數(shù)字化和數(shù)據(jù)庫管理平臺搭建兩個部分。
2.元數(shù)據(jù)著錄
元數(shù)據(jù)的著錄是數(shù)據(jù)庫建設(shè)的基礎(chǔ), 統(tǒng)一結(jié)構(gòu)的元數(shù)據(jù),有利于古籍數(shù)字化成果的共建共享。由于本數(shù)據(jù)庫文獻類型既有清末古籍也有民國出版圖書,為了方便建庫,統(tǒng)一按照古籍數(shù)字化元數(shù)據(jù)處理。首先要制定好描述策略,確定描述單元和描述深度。本“數(shù)據(jù)庫平臺”根據(jù)《古籍數(shù)字化工作手冊》和《古籍描述元數(shù)據(jù)著錄規(guī)則》要求描述和管理元數(shù)據(jù), 著錄字段包括加工記錄標識號、名錄號、索書號、分類、題名、卷次、責任者、版本、冊數(shù)、版式、裝幀形式、館藏單位、制作單位,同時根據(jù)需要增加了內(nèi)容提要、全文地址等字段。另外針對醫(yī)家的著錄字段包括姓名、字號、生卒、出生地、現(xiàn)地名、所屬流派、省份、介紹等。統(tǒng)一標準的著錄方式是下一步數(shù)據(jù)庫平臺數(shù)據(jù)挖掘和可視化研究實踐的基礎(chǔ)[10]。
3.功能模塊設(shè)計
醫(yī)籍文獻數(shù)字化后需要發(fā)布到特定的數(shù)據(jù)庫服務(wù)平臺上,為網(wǎng)絡(luò)用戶提供類型多樣的文獻資源,實現(xiàn)對文獻的瀏覽、檢索和文獻發(fā)布。根據(jù)前期需求整理,該“數(shù)據(jù)庫平臺”可劃分為前臺展示頁面和資源管理后臺。數(shù)據(jù)庫平臺前臺展示頁面分為首頁主頁面、統(tǒng)一檢索頁面、醫(yī)家模塊、醫(yī)著模塊、醫(yī)派模塊、中醫(yī)文化模塊等內(nèi)容模塊。其中主頁面實現(xiàn)了對醫(yī)籍的分類展示和醫(yī)家的地域分布可視化時間軸展示,實現(xiàn)了文獻信息的主流社交媒體如豆瓣、微信的分享,實現(xiàn)了多條件統(tǒng)計在線可視化展示等特色功能。醫(yī)家、醫(yī)著模塊為核心服務(wù)模塊,分別實現(xiàn)了對收錄醫(yī)家、醫(yī)著的詳細展示。后臺管理頁面實現(xiàn)了在線的醫(yī)著采集加工、全文鏈接、發(fā)布等操作,界面友好。在安全管理方面,該后臺模塊需要賬戶密碼登錄,對后臺用戶的訪問權(quán)限進行控制,IP登錄審計管理與限制使用。該數(shù)據(jù)庫發(fā)布到互聯(lián)網(wǎng)上,實現(xiàn)了數(shù)字資源的共享。
近代中醫(yī)文獻的整理和數(shù)字化,反映了近代浙派醫(yī)家醫(yī)著的基本概況,在揭示層次和角度方面作了一些先進性的探索,方便了文獻查找,更好地為中醫(yī)文獻資源的數(shù)據(jù)挖掘提供了決策支持。該數(shù)據(jù)資源庫已經(jīng)初步建成,各項功能和數(shù)據(jù)已基本完善,平臺發(fā)布在圖書館中醫(yī)文化墻上,也可基于互聯(lián)網(wǎng)共建共享。近代中醫(yī)文獻整理和數(shù)字化是一項長期的工作,需要各個部門和專業(yè)技術(shù)人員積極參與及持續(xù)的經(jīng)費投入[11]。目前,在文獻數(shù)據(jù)庫建設(shè)中也存在一些不足:(1)由于時間和經(jīng)費問題導(dǎo)致一些前期規(guī)劃的建設(shè)內(nèi)容來不及實施;(2)在對近代文獻數(shù)字化掃描過程中,掃描設(shè)備可能會對文獻造成未知損毀;(3)許多浙派醫(yī)家醫(yī)籍文獻收藏于其他地區(qū)圖書館,紙本文獻獲取渠道需要有關(guān)部門一起協(xié)商打通;(4)當前數(shù)據(jù)庫中收錄的浙派醫(yī)家和醫(yī)籍數(shù)量可能有遺漏,需要進一步搜集補充。下一步,該資源庫將會通過門戶網(wǎng)站、微信公眾號等渠道進行宣傳推廣,并考慮繼續(xù)擴充數(shù)據(jù)平臺的內(nèi)容,補充遺漏的近代浙派中醫(yī)文獻,繼續(xù)加強對非館藏的中醫(yī)文獻數(shù)字化全文的收集,建立館藏古籍模塊,展示本館收藏古籍的數(shù)字化成果,運用數(shù)字人文相關(guān)技術(shù)揭示醫(yī)籍、醫(yī)家、醫(yī)派間的關(guān)聯(lián)性等內(nèi)容[12]。