魏郭輝
(貴州師范學院 歷史與社會學院,貴州 貴陽 550018)
伴隨電子信息時代的來臨,網(wǎng)絡工具日益成為學術研究的利器,它把人們從以往皓首窮經(jīng)、紛繁復雜的閱讀工作中逐步解放出來,使研究者將更多的精力用在數(shù)據(jù)的整理和分析上。近代以來,隨著敦煌吐魯番文書、徽州文書、清水江文書、古方志譜牒、明清檔案、域外古漢文文獻等古文書的發(fā)現(xiàn)[1],推進了對中國古文明史的研究。研究中國古代歷史、語言及文化,必須重視古文書,這已是學界不爭的事實。由于古文書距離今人的時代已非常遙遠,因此今人對這些文獻在文義的理解上也會存在不小差異,準確理解古文書的語言文字,就成為當下古文獻研究的關鍵所在。清代考據(jù)大家戴震曾就語言文字的重要性總結到,“經(jīng)之至者,道也;所以明道者,其詞也;所以成詞者,未有能外小學文字者也。由文字以通乎語言,由語言以通乎古圣賢之心志,譬之適堂壇之必循其階,而不可以竄等”[2]。有鑒于此,文章介紹有關古文書語言文字方面的相關網(wǎng)絡工具及數(shù)據(jù)庫,以期推動學界進一步研究。
我們在研究古文書語言文字時需通過翻檢字典、詞典(辭典)及相關工具書以便準確理解文獻的字詞含義,更好地把握文獻內(nèi)涵。
《說文解字》是東漢經(jīng)學家、文字學家許慎所編纂,該書保存了漢字的形、音、義,其中對字義的解釋保存了最古的含義,對理解古書上的詞義甚有幫助。其在線網(wǎng)絡查詢有:(1)http://www.chinese99.com/xiaozhuan/shuowen/;(2)http://www.shuowen.org/.
《康熙字典》是查詢古漢語語言文字詞義的重要工具書。目前在線網(wǎng)絡《康熙字典》比較實用的有:(1)文泉驛康熙字典查詢服務(http://wenq.org/index.cgi?KangXi);(2)康熙字典全文檢索網(wǎng)上版(http://www.kangxizidian.com/search/index.php)。
除《說文解字》、《康熙字典》等重要工具書外[注]其他如《辭源》、《辭?!芬嗍茄芯抗糯鷿h語語言文字的重要工具書。,《漢語大字典》亦是研究古今漢字極為不錯的工具,目前《漢語大字典DVD光盤版》可在verycd電驢大全(http://www.verycd.com/)上搜索下載。
在線漢語字典當首推漢典(http://www.zdic.net/),其可在線查詢古籍生僻字、詞語的解釋。另外,字典網(wǎng)(http://zhongwen.com/zi.htm),字海(葉典)(http://zisea.com/)等亦是不錯的在線漢語字典。
除上述談到的在線漢語字典外,我們在研究漢字的古今變化中還需用到一些有關漢字字形的專業(yè)字典,一些在線漢字字形的字典有:(1)異體字字典(http://140.111.1.40/main.htm)此字典為總整漢字字形的大型數(shù)據(jù)庫,收字10萬個以上,內(nèi)容含正字與異體字;(2)象形字典(http://vividict.com/Default.aspx),其對于研究象形漢字極為有用。其他如書法字典(http://www.shufazidian.com/)等[注]書法在線字典(http://sf.kdd.cc/),書法字典在線查詢系統(tǒng)——書法字體(http://www.9610.com/zidian/)對研究字形訛變亦有一定幫助。另外,篆字寫法在線速查(http://www.shufa.org/aboutsf/chazhuanzi.asp)可查漢字篆體。
研究古文書中的詞匯,需要有關詞匯解釋方面的工具書。《漢語大詞典》,集古今漢語詞匯之大成,對研究古今漢語詞匯演變彌足珍貴。目前漢語大詞典網(wǎng)絡版(http://218.78.212.175/hd/)可進行在線檢索,相關檢索辦法可瀏覽寧波大學園區(qū)圖書館網(wǎng)址。
查考古漢語詞匯還可使用臺灣編纂的《中文大辭典》(http://ap6.pccu.edu.tw/Dictionary/intro_5.asp),該數(shù)字版《中文大辭典》兼辭典和字典的功能。此外,臺灣《重編國語辭典修訂本》(http://dict.revised.moe.edu.tw/)收錄16萬7千余字詞,也可作為查考詞匯義項的工具之一。
在研究古文書的過程中,要準確弄清文獻字詞內(nèi)涵,還需查考有關古籍文獻訓詁(注釋)方面的工具書,這方面可參看宗福邦等主編的《故訓匯纂》,該書匯輯了從先秦至晚清古籍文獻中的訓詁(注釋)材料。全書共收字頭近2萬個,引據(jù)的訓詁資料50萬條,篇幅達1300萬字。其《電子檢索版djvu版》CD光盤版可在verycd電驢大全搜索下載[3]。
臺灣學者開發(fā)的Accelon3開放古籍平臺也可使用查詢,該平臺(內(nèi)含說文解字、漢語大詞典、二十六史、康熙字典、大藏經(jīng)、古今圖書集成)等19部全文檢索數(shù)據(jù)庫可在以下網(wǎng)址下載(http://www.neixue.org/download/佛學工具/開放古籍平臺.rar),該數(shù)據(jù)庫可以檢索相關字、詞,極為方便實用。
研究古文書,需要將其和傳世文獻相關內(nèi)容進行比較核對、考證甄別以利學術研究之用。因此需要用到一些大型在線工具書,如四庫全書、百科全書、古今圖書集成等。
目前文淵閣四庫全書可進行在線查詢的有寧波大學園區(qū)圖書館所收四庫全書(http://skqs.nlic.net.cn:8000/scripts/skinet.dll?OnLoginPage),該網(wǎng)絡版可節(jié)省搜尋及整理資料的精力和時間,為學術研究帶來極大的方便。南開大學開發(fā)的二十五史全文檢索系統(tǒng)(http://202.114.65.57/net25/)可進行在線網(wǎng)絡字詞語的檢索及閱讀。臺灣中央研究院漢籍電子文獻資料庫(http://hanji.sinica.edu.tw/)包含漢籍全文數(shù)據(jù)庫、古漢語語料庫、正統(tǒng)道藏、詞話集成、新清史-本紀、樂府詩集、閩南語俗曲唱本《歌仔冊》及政書、類書與史料匯編等,可資研究。此外,臺灣故宮東吳數(shù)位古今圖書集成(http://192.83.187.228/gjtsnet/index.htm)、古今圖書集成索引&全書圖像(http://gjtsjc.gxu.edu.cn/)也可使用檢索。
研究古文書中的語言文字,要對古文字字形及演變有比較清楚的認識和了解,方可深入解讀文獻內(nèi)涵。在這方面,耶魯大學Richard Sears制作的漢字字形在線詞典Chinese Etymology(http://www.chineseetymology.org/或http://www.internationalscientific.org/)可對甲骨文、金文、篆體字等古文字字形及演變在網(wǎng)上查詢檢索。與此同時香港大學研發(fā)的漢字古文字字體演變數(shù)據(jù)庫(http://web.hku.hk/~jwilam/chinese/change.htm)亦對漢字字源、字形演變研究有所幫助。臺灣中央研究院漢字部件檢字系統(tǒng)(http://cdp.sinica.edu.tw/cdphanzi/)收錄了大量古文字如甲骨文、簡帛文字等,對文獻疑難文字的輸入有極大幫助。此外,華東師范大學中國文字研究與應用中心(http://www.wenzi.cn/)還開發(fā)研制了常用古文字字形檢索等數(shù)據(jù)庫可進行在線檢索。
研究古文書,還需要對文字的讀音(音韻)有所了解。比較重要的音韻數(shù)據(jù)庫有東方語言學網(wǎng)(http://www.eastling.org/)的上古音查詢、中古音查詢;華東師范大學中國文字與應用中心常用漢字古音網(wǎng)上檢索(http://www.wenzi.cn/guyin/guyin.HTM);廣韻查詢系統(tǒng)(http://kyonh.com)。此外,臺灣開發(fā)的古今音韻檢索系統(tǒng)(http://w3.cyu.edu.tw/luo4/Query.aspx/),臺灣大學中國文學系、中央研究院信息科學研究所漢字古今音數(shù)據(jù)庫[注]該數(shù)據(jù)庫是一個為方便檢索漢字古今音而設計的在線聲韻數(shù)據(jù)庫,為使用者提供根據(jù)字頭查詢古今字音,或依需要設計各種檢索條件做數(shù)據(jù)的閱讀和分析。(http://xiaoxue.iis.sinica.edu.tw/ccr/)等均是查詢古音韻的不錯工具。
除以上介紹的一些在線工具書外,也可查詢龍語瀚堂典籍庫、中國基本古籍庫、國學寶典、中國歷代石刻史料匯編(網(wǎng)絡版、單機版)、漢達文庫、愛如生數(shù)據(jù)庫、書同文數(shù)據(jù)庫、雕龍—中國日本古籍全文數(shù)據(jù)庫網(wǎng)絡版等。
近年來,古文書的研究日益成為學界熱點,從敦煌吐魯番文書、徽州文書、清水江文書、臺灣地區(qū)原住民契約文書到域外古漢文文獻均有不少學者涉獵。由于古文書的解讀涉及古代俗字、俚語及相關語境文化,因而對其中語言文字的研究就顯得格外重要。
20世紀初,伴隨敦煌吐魯番文書的發(fā)現(xiàn),敦煌吐魯番學日益成為國際顯學,關于敦煌吐魯番文書有關數(shù)據(jù)庫,陳爽先生對此亦有相關介紹[4],筆者在此基礎上著重介紹一些對于研究敦煌吐魯番文書語言文字有所幫助的在線數(shù)據(jù)庫。
國際敦煌工程項目(TheInternational Dunhuang Project)(http://idp.bl.uk/ ) 把館藏于世界各地的敦煌遺書,分類整理制作成交互式web數(shù)據(jù)庫,通過多種檢索途徑可以看到有關遺書風貌的客觀描述,目前部分檢索結果可以看到遺書的圖像。龍谷大學文書:全畫像·書志將大谷文書圖像(http://www433.elec.ryukoku.ac.jp/Komon/caption.html)原版掃描以供學界之用。龍谷大學古典籍デジタルアーカイブ研究センター(http://www.afc.ryukoku.ac.jp/RDAC/)龍谷大學制作,該數(shù)據(jù)庫呈現(xiàn)日本大谷探險隊的成果。京都大學人文科學研究所西域行記數(shù)據(jù)庫(http://www.kanji.zinbun.kyoto-u.ac.jp/~saiiki/)收錄了《大唐西域記》、《三藏法師傳》和《法顯傳》等10種關于西域的著作,并提供全文檢索的功能,可供使用者集中范圍搜尋相關數(shù)據(jù)。臺灣傅斯年圖書館敦煌文獻網(wǎng)站共藏敦煌卷子四十九卷,提供卷子的相關信息及全文影像(http://lib.ihp.sinica.edu.tw/c/rare/dunhuang/index.htm)。Digitales Turfan Archiv(德國)對柏林科學院所藏吐魯番文書進行數(shù)字化,內(nèi)有所藏吐魯番文書圖像(http://www.bbaw.de/forschung/turfanforschung/dta/ch_u/dta_chu_index.html)。此外日本國立情報學研究所- ディジタル?シルクロード?プロジェクト(數(shù)字絲綢之路)(http://dsr.nii.ac.jp)也可參考。
除前述敦煌吐魯番文書有關網(wǎng)絡數(shù)據(jù)庫外,茲介紹其他古契約文書、古方志譜牒、明清檔案及域外古漢文文獻方面的數(shù)據(jù)庫。
古民間文書方面,臺灣不少圖書館收藏有古契約文書,如臺灣傅斯年圖書館藏古文書復印件影像數(shù)據(jù)庫(需提供賬號進入)(http://www.ihp.sinica.edu.tw/ttscgi/fsn/ttswebnew?@0:0:1:fsnsnc::/ttsweb/fsn/anadb.htm@@0.8763342339737696)。國立臺灣大學圖書館古契書計劃(http://ci6.lib.ntu.edu.tw:8080/gucci/),在該網(wǎng)站中古契書包括:鄭華生先生收藏“竹塹北門鄭利源號古契書”、臺北市文獻委員會典藏“臺灣北部相關的古契書”、國立臺灣大學圖書館藏“臺灣南部古契書”。臺灣歷史數(shù)位圖書館(http://thdl.ntu.edu.tw/)為集合臺灣史的一手史料之數(shù)據(jù)庫,其對臺灣總督府檔案抄錄契約文書、岸里大社文書等內(nèi)容加以數(shù)字化。
此外,徽州文書中的俗字俗語及方言可參考明清至民國時期徽州相關方志所載內(nèi)容。清水江文書作為苗族侗族人民民間生活寫照的真實記錄,其文書涉及大量俗字、俚語、苗侗語言、方言,給文書的釋讀帶來了不小的困難,因此有必要參考明清至新中國成立后貴州清水江流域各縣方志所載相關內(nèi)容,具體可見貴州地方志全文數(shù)據(jù)庫(http://dfz.gznu.cn/tpi/sysasp/include/index.asp);同時也可瀏覽臺灣中央研究院史語所“村寨網(wǎng)-中國西南少數(shù)民族”網(wǎng)站(http://ethno.ihp.sinica.edu.tw/index.htm)的相關內(nèi)容進行研究。
明清檔案方面,臺灣中央研究院歷史語言研究所明清檔案工作室(http://archive.ihp.sinica.edu.tw/mct/)所藏內(nèi)閣大庫檔案原件時間遠溯至明代,下抵清末,內(nèi)容多樣而豐富,是研究明清歷史、語言等不可忽視之重要典藏。古方志譜牒尤其是清代(含清代)以前的方志可參看中國國家圖書館歷代地方志全文影像(數(shù)字方志)瀏覽檢索(http://res4.nlc.gov.cn/home/index.trs?channelid=8),該數(shù)據(jù)庫具有全文影像瀏覽功能。家譜方面可瀏覽中華尋根網(wǎng)(http://ouroots.nlc.gov.cn/),該網(wǎng)站已擁有姓氏數(shù)據(jù)500條、家譜書目數(shù)據(jù)3萬條、家譜全文影像500余種約50萬頁,具有家譜在線查閱、家譜目錄和全文檢索等功能。
域外漢文古文獻近年來亦是語言文字的研究熱點。以下限于篇幅重點介紹部分日、韓等國所藏古漢文文獻網(wǎng)站及數(shù)據(jù)庫。
日本東京大學東洋文化研究所所藏漢籍善本全文影像數(shù)據(jù)庫 (http://shanben.ioc.u-tokyo.ac.jp/),即將該所藏孤本、善本掃描原書后放置于該網(wǎng)站上,供各界使用。日本所藏中文古籍數(shù)據(jù)庫(http://www.kanji.zinbun.kyoto-u.ac.jp/kanseki/),系日本京都大學人文科學研究所附屬漢字情報研究センター建置,收錄日本35個圖書館藏中文古籍目錄,約62萬筆數(shù)據(jù),古籍叢書部分建置有子目,可用中文檢索。此外,還有日本全國漢籍データベース參加機關一覧(http://kanji.zinbun.kyoto-u.ac.jp/kansekikyogikai/ichiran.htm)。東方學デジタル圖書館(http://kanji.zinbun.kyoto-u.ac.jp/db-machine/toho/html/top.html ),由京都大學人文科學研究所制作,該所為亞洲研究的重鎮(zhèn),收藏中國圖籍約30萬冊。以上均可對日藏漢籍進行檢索查詢,頗利研究。
韓國所藏古漢文文獻網(wǎng)站主要有奎章閣The Kyujanggak Archives(http://kyujanggak.snu.ac.kr/),該網(wǎng)站系首爾大學奎章閣檔案館制作。在該館收藏豐富的漢文典籍中,不時可發(fā)現(xiàn)中國失傳的版本。韓國史在線(http://www.koreanhistory.or.kr/eng/index.jsp),亦收錄不少韓漢籍。其他如法國國家圖書館(http://gallica.bnf.fr/?lang=FR)及亞洲、歐美澳等國的國家圖書館亦可瀏覽查詢。
以上介紹了有關古文書語言文字方面的網(wǎng)絡工具及相關數(shù)據(jù)庫可極大地便利學者學習研究。除此之外,像verycd電驢大全、新浪愛問、讀秀、國學數(shù)典等亦能方便學術研究之用。同時,在研究中遇到的一些疑難字、生僻字,也可下載超大字符集找字工具(http://xiangyata.net/data/articles/f03/615.html)或者瀏覽疑難漢字檢索網(wǎng)站(www.haosystem.com)、日本今昔文字鏡(http://www.mojikyo.org/)[5]進行相關查詢。值得注意的是,對古文書語言文字的研究還應關注最新學術動態(tài),這方面可瀏覽復旦大學出土文獻與古文字研究中心(http://www.gwz.fudan.edu.cn/)、浙江大學漢語史研究中心(http://www.hanyushi.zju.edu.cn/)、華東師范大學中國文字研究與應用中心(http://www.wenzi.cn/)、西南大學漢語言文獻研究所(http://wxs.swu.edu.cn/de/)等網(wǎng)站的相關內(nèi)容。
參考文獻:
[1] 黃正建.“中國古文書學”:超越斷代文書研究[N].中國社會科學報,2012-07-25(A05).
[2] (清)戴 震.東原文集增編 [M],合肥:黃山書社,2008:250.
[3] 宗福邦,陳世鐃,蕭海波.故訓匯纂[M].北京:商務印書館,2003.
[4] 陳 爽.海內(nèi)外敦煌學研究網(wǎng)絡資源簡介[G]//敦煌學知識庫國際學術研討會論文集.上海:上海古籍出版社,2006:177-189.
[5] 周長山.日本應用計算機和國際互聯(lián)網(wǎng)絡研究中國史現(xiàn)狀[J].中國史研究動態(tài),2002(2):26-29.