趙元元
唐代墓志(又有墓碣、墓版、墓表、墓記、埋銘、玄堂志等名稱)是以獨特方式記述唐代人物的文字材料,具有較強的概括性和原創(chuàng)性,是唐史研究不可或缺的原始史料。然而長期以來,學界對墓志的研究利用多限于內(nèi)容考釋及個別專題研究層面,整體全面研究較少涉及。究其原因,豐富的墓志信息處于分散狀態(tài),不易在長時段、大范圍選題中加以利用。隨著新出土墓志不斷增加,這一問題愈加突出。在數(shù)字人文環(huán)境下,如何充分挖掘墓志中的信息成為亟需解決的問題?;诖耍疚木吞拼怪镜膬r值及開發(fā)整理現(xiàn)狀、墓志數(shù)據(jù)化的原則、意義、可行性以及面臨的問題進行討論。
墓志在西漢時期尚不多見,直到東漢末年“蔡邕、崔瑗之徒,多為人立碑;魏晉之后,其流浸盛”[1]卷八。隋唐時期,墓志書寫蔚為大觀,多數(shù)官宦或富庶家庭請人(一般為親朋故舊)依據(jù)亡者的行狀撰寫墓志,內(nèi)容涵蓋世系、歲月、名字、爵里、婚宦、喪葬等多個方面[2]53。墓志對死者生平均有真切記載,具備較高的史料價值。
《舊唐書》《新唐書》分別成書于五代和北宋,受修撰者價值取向及史料散佚等影響,許多唐代人物為正史漏載,即使貴為開國功臣也在所難免,鎮(zhèn)軍大將軍嘉州郡公周護、右威衛(wèi)大將軍李孟常、禮部尚書張允、濮陽郡開國公洪州都督吳黑闥等均屬此例。與男性人物記載相比,正史對女性人物的記述簡略單一,記載對象集中在后妃、公主、列女等專傳中,彭國太妃王氏、永泰公主、文安公主等皇室成員未被正史收錄。與正史不同,墓志在人物記載上約束少,家庭多數(shù)成員都有相關描述,即使是在室女、夭亡者等也有被述及的可能。可見墓志可以補正正史人物記載之不足。
墓志重視對父系先祖的追述,對以志主為中心的幾代男性成員記載更為確切,以此可以勘正正史人物世系之誤?!缎绿茣份d北海太守李邕曾孫名為李翹,李邕之孫名正叔、正卿[3]卷七十二。但是,出土的《李翹墓志》則稱“祖善,皇秘書郎,崇賢、弘文館學士;父邕,皇北海太守、贈秘書監(jiān)。公即北海第三子”[4]1998。該墓志為李翹之子李正卿所做,對父祖的信息敘述當不會有錯,正史將李正卿記作李翹父輩,記錄有誤。墓志對傳世文獻關于人物姓名的偽誤同樣有勘正作用?!缎绿茣份d唐將尉遲敬德名“恭”,但《大唐故開府儀同三司鄂國公尉遲君墓志銘并序》卻稱“君諱融,字敬德”[4]291。墓志為當時人記當時事,尉遲敬德為高級官員,其墓志所記名諱錯誤的可能性小,正史所載可能有誤??傊瑹o論是記錄范圍還是內(nèi)容,墓志都可以補充傳世文獻對人物記載之不足。
個人生平事跡是墓志記述的中心,由于每個人經(jīng)歷不同,一些被正史漏記、簡記的信息會出現(xiàn)在墓志中,可以為相關史實研究提供材料依據(jù)。制舉考試中的清白科和醫(yī)舉科由于正史缺乏記載,相關研究薄弱,束良、吳本立等墓志的出現(xiàn)為該方面的研究提供了相關史料?!妒寄怪尽份d:“應清白著稱舉,敕授代州五臺縣;又應清白著稱舉,又授恒州稾城縣令?!盵4]1088《吳本立墓志》言及其父于“永徽元年,醫(yī)舉及第,尋授太醫(yī)監(jiān)”[5]288。郭思訓、王震、李思本、李愻等墓志中也有舉清白科及第記錄。盡管這些墓志材料分散,但對考究唐代制舉問題仍有幫助。
由于志主在某一事件中地位不同,其墓志信息所體現(xiàn)的意義也不同。在大唐征伐高麗事件中,泉氏家族處于事件的核心地位,泉男生、泉獻誠、泉毖三人墓志顯現(xiàn)了泉氏家族歸順大唐的過程,以及歸順后的生活狀況和精神狀態(tài)。以《任素墓志》為代表的邊緣人物墓志,則描繪基層士兵在高麗之戰(zhàn)結(jié)束后任職基層或者隱逸鄉(xiāng)里的生活境況。雖然上述兩類墓志書寫的側(cè)重點不同,但在各自角度和層面上彌補了史載之闕。
出于對“海桑變改,陵谷貿(mào)遷”[4]544的考慮以及撰述程式的需要,墓志書寫者會在墓志中對亡者的喪葬地點做出詳細記載,多數(shù)墓志還因之羅列出鄉(xiāng)、里、坊、街的名稱及其隸屬關系。若志主為官員,墓志中還常常出現(xiàn)任職地、遷轉(zhuǎn)地以及治下的風土人情和山川形勝。如果官員是外任亡故,墓志往往會提及家人扶柩歸葬所途經(jīng)的官道、運河、驛站、城鎮(zhèn)、碼頭的名稱及距離等內(nèi)容。墓志中記錄的街坊、政區(qū)、山水等名稱和人情風俗為唐代史地研究提供了重要信息,可補《元和郡縣志》《括地志》《太平寰宇記》,以及唐書地理志等傳世文獻記載之缺,對研究唐代地名、交通、鄉(xiāng)村基層組織及其運作機制也有重要意義。從出土地域來看,1994年以來,墓志出土較多的省份為河南和陜西,山西、河北、北京、天津、江蘇、山東、浙江、新疆、湖北、安徽、湖南、黑龍江、云南、西藏、福建、廣東也有一些。唐代墓志的出土地域分布形態(tài)不僅為唐代史地研究提供了一手資料,也為唐代史地研究提供了新的思路。
從內(nèi)容來說,唐代墓志記錄的志主生平事跡一般涉及世系、年齡、家庭成員、婚姻、職官、喪葬、宗教信仰、風俗、家庭經(jīng)濟狀況等內(nèi)容,為唐代人口史、政治史、民俗史、經(jīng)濟史、制度史等專史研究提供了史料佐證。就墓志本身而言,墓志書寫作為一項技藝,兼具美學和文學價值,特別是書法或文學大家所做的墓志更為時人青睞。柳公權書法結(jié)體勁媚,能作真、行、草三體,“當時大臣家碑志,非其筆,人以子孫為不孝。外夷入貢者,皆別署貨貝曰:‘此購柳書’”[3]卷一六三。張說博學多才,“為文屬思精壯,長于碑志,世所不逮”[3]卷一二五。韓愈、柳宗元、元稹、權德輿等文人撰寫了大量墓志,《全唐文》《全唐文補遺》《全唐文新編》多有收錄,豐富了古代文學寶庫。
1950年代以來,學者對出土的唐代墓志進行了初步整理和研究,成果集中體現(xiàn)在兩方面:一是對墓志本身的研究,包括墓志的統(tǒng)計著錄、抄錄整理、集結(jié)出版以及書法紋案研究等;二是墓志內(nèi)容的研究,包括內(nèi)容考釋以及婚姻、喪葬、人口、宗教信仰、地理風俗、職官、經(jīng)濟等方面的專題研究。為滿足查閱及研究需要,學者對墓志進行了持續(xù)性整理和考釋,主要成果有:毛漢光主編《唐代墓志銘匯編附考》,吳鋼等主編《全唐文補遺》《隋唐五代墓志匯編》《新中國出土墓志》,許寶馴編《隋唐墓志百種》,袁道俊編《唐代墓志》《隋唐墓志精粹》,趙文成、趙君平選編《新出唐墓志百種》《河洛墓刻拾零》《秦晉豫新出墓志搜佚》《秦晉豫新出墓志搜佚續(xù)編》,周紹良、趙超編《唐代墓志匯編》《唐代墓志匯編續(xù)集》《全唐文新編》,趙平主編《中國西北地區(qū)歷代石刻匯編》,高峽主編《西安碑林全集》,李獻奇等編《洛陽新獲墓志》,重慶市博物館主編《中國西南地區(qū)歷代石刻匯編》,趙君平編《邙洛碑志三百種》,楊作龍等編《洛陽新出土墓志釋錄》,喬棟等編《洛陽新獲墓志續(xù)編》,齊淵編《洛陽新見墓志》,齊運通主編《洛陽新獲七朝墓志》《洛陽新獲墓志二〇一五》,郭茂育、趙水森編《洛陽出土鴛鴦志輯錄》,王鑫、程利主編《北京市文物研究所藏墓志拓片》,毛陽光、余扶危主編《洛陽流散唐代墓志匯編》,李百勤著《河東出土墓志錄》,陳柏泉編《江西出土墓志選編》,黃文弼整理《高昌磚集》,侯燦、吳美琳編《吐魯番出土磚志集注》,韓明祥編《濟南歷代墓志銘》,章國慶編《寧波歷代碑碣墓志匯編》,鄭炳林編《敦煌碑銘贊輯釋》,李希泌編《曲石精廬藏唐墓志》,胡戟、榮新江主編《大唐西市博物館藏墓志》,趙力光編《鴛鴦七志齋藏石》,河南省文物研究所、河南省洛陽地區(qū)文管處編《千唐志齋藏志》,貴州省博物館編《貴州省墓志選集》,洛陽市文物工作隊編《洛陽出土歷代墓志輯繩》,安陽市文物考古研究所、安陽博物館編《安陽墓志選編》,趙力光主編《西安碑林博物館新藏墓志匯編》《西安碑林博物館新藏墓志續(xù)集》,故宮博物院編《故宮博物院藏歷代墓志匯編》,俞苗榮、龔天力主編《紹興圖書館館藏地方碑拓選》,北京圖書館金石組編《北京圖書館藏中國歷代石刻拓本匯編》,陜西省考古研究院編著《長安高陽原新出土隋唐墓志》,中國國家博物館編《中國國家博物館館藏文物研究叢書·墓志卷》,張鴻杰主編“陜西金石文獻匯集”叢書。
為滿足檢索需要,有關墓志題跋索引的著作相繼問世,主要成果有:吳鋼主編《全唐文補遺總目索引》,李慧主編《陜西石刻文獻目錄集存》,張鈁編《千石齋藏志目錄》,北京圖書館金石組編《北京圖書館藏墓志拓片目錄》,徐自強主編《北京圖書館藏北京石刻拓片目錄》,王敏輯注《北京圖書館藏善拓題跋輯錄》,胡海帆等編《北京大學圖書館藏歷代墓志拓片目錄》,浙江圖書館古籍部編《浙江圖書館藏浙江金石拓片目錄》等。日本學者氣賀澤保規(guī)編《新版唐代墓志所在綜合目錄》、美國學者譚凱(Nico las Tackett)編《唐末至宋初墓志目錄》也是檢索唐代墓志不可或缺的書目。
從整體看,學界對墓志的整理研究取得了一定成就,但在開發(fā)利用的廣度和深度上有待提高。筆者在搜索整理墓志的過程中發(fā)現(xiàn),唐代墓志的數(shù)字化和數(shù)據(jù)化薄弱,只有少部分電子版墓志材料可于互聯(lián)網(wǎng)查閱。有關墓志的數(shù)據(jù)庫建設處于起步階段,僅有少部分人物墓志為CBCD(中國歷代傳記人物數(shù)據(jù)庫)收錄,且對墓志信息的挖掘不夠充分。因此,對墓志進行數(shù)據(jù)化處理已成為充分挖掘墓志價值亟需解決的問題。
史料的發(fā)現(xiàn)足以促成史學之進步,而史學之進步,最賴史料之增加。不斷發(fā)掘并整理唐代墓志為唐史研究提供了寶貴的史料,必然會推動唐史研究。但是,面對不斷增多的墓志材料,研究者如何在短時間內(nèi)獲取所需信息成為必須解決的問題。雖然學界已編纂有多種索引、目錄、通檢等工具書,能給研究者提供所需墓志的位置信息,但信息提取仍然不便。近年利用計算機技術進行的文獻數(shù)字化能夠?qū)崿F(xiàn)對墓志有效信息的檢索復制,但在數(shù)據(jù)有效分析、再生和知識發(fā)現(xiàn)層面上遠不能滿足研究需要。因此,在數(shù)字人文趨勢下,對唐代墓志進行充分的數(shù)據(jù)化分析和處理,生成結(jié)構性數(shù)據(jù)庫是墓志研究和史學研究的理想選擇。
元數(shù)據(jù)(m etadata)是將文獻實體進行計算機識別的編碼體系,元數(shù)據(jù)制作就是將文獻資料變成可以檢索的分析型數(shù)據(jù)的過程,也是史料數(shù)據(jù)化的關鍵。在墓志數(shù)據(jù)化的過程中要注意:
(1)盡量保證元數(shù)據(jù)項目的準確性。關于數(shù)據(jù)庫元數(shù)據(jù)項目的設置,《國家圖書館拓片元數(shù)據(jù)規(guī)范與著錄規(guī)則》一書已至為詳備,茲不贅述。不過,墓志數(shù)據(jù)錄入項目的詳備仍不能避免墓志信息錄入的遺漏,從而影響數(shù)據(jù)信息的準確性。例如,在對志主世系追述中,撰述者的表達方式主要有:“曾祖某,祖某,父某”;“高王父某,曾王父某,王父某,烈考某”;曾府君+官職,祖府君+官職,考府君+官職;官職+祖名諱,官職+父名諱。多種稱呼形式在墓志中的出現(xiàn)要求在世系信息采集過程中須仔細分析與核對,以免出現(xiàn)紕漏。社會觀念對身份信息的影響也應予以足夠的重視,在采集墓主身份信息時要仔細斟酌。例如,出生貧寒的官員會在墓志中將父祖描述為高尚隱逸之士;出身低賤的女妓或仆婢被官員納為妾后,墓志也會被書寫成高門閨秀。這些都是掩蓋出身低微事實的故意行為,在信息提取時要收錄其本質(zhì)信息,不能為表面文字所誤。
(2)保留元數(shù)據(jù)的彈性設置。元數(shù)據(jù)標準化、墓志內(nèi)容的多樣化和研究者對信息需求的特殊化都要求元數(shù)據(jù)的設置必須具有高度的彈性空間,以便容納更多的墓志文獻及其它資料。比如,一些重要歷史人物的墓志往往會著重介紹仕宦履歷而忽略個人及其家庭細節(jié)描寫。此時家庭其他成員墓志中的細節(jié)描寫或許可以勾勒出與之相關的有效信息。正史傳記、神道碑銘、摩崖石刻、譜牒行狀以及小說筆記也有補充和核對人物信息的可能性,這些都要求元數(shù)據(jù)設置留有足夠的空間,以便對信息予以補充。
(3)保證數(shù)據(jù)文本的完整性與客觀性。課題數(shù)據(jù)文本的客觀和完整是研究結(jié)論可信的前提條件。在墓志信息的錄入過程中,即便是殘存墓志也不能遺漏,以確保研究對象各要素關系的變化不受墓志文本的影響。與此同時,避免數(shù)據(jù)庫設計者及墓志信息錄入者自身經(jīng)驗所形成的預設影響,以保證數(shù)據(jù)分析結(jié)果的客觀有效。為減少信息處理中的誤差,在數(shù)據(jù)化過程中可以考慮提供相應的墓志文本影像,以便于數(shù)據(jù)庫信息的核對和修正。這既能實現(xiàn)文本的直觀呈現(xiàn),也能很好地完成文物保護工作。
復原歷史真相的前提是有足夠多的信息依據(jù),但是海量數(shù)據(jù)得不到合理整合,其價值就得不到有效發(fā)揮。文獻資料的數(shù)據(jù)化建設能為研究者提供互補互證性資料,實現(xiàn)原有數(shù)據(jù)的價值增益[6]。唐代墓志相對完整地記述了人物經(jīng)歷和核心社會關系,涉及職官、世系、年齡、婚姻等內(nèi)容,是唐史研究不可或缺的一手資料。然而,在見世的墓志材料中,以中下層人物的墓志居多,上層核心人物的墓志數(shù)量較少。與正史相比,墓志文獻的記載不如正史紀傳中人物介紹集中,分布相對均勻。因此,在墓志數(shù)據(jù)化過程中可以參考正史人物傳記資料,既可改善人物階層分布不均狀況,又有利于對人物信息的整合和分析。唐代的神道碑銘和行狀同樣記錄了人物的生平事跡,雖然數(shù)量少且集中于上層人物,但在人物信息補充和校正上有一定意義?!短綇V記》《唐五代筆記小說大觀》等收錄有唐人零星史事,對其做集中整理也會有益于墓志信息的采集與分析。這些傳世文獻資料在古籍數(shù)字化浪潮推動下已大部分實現(xiàn)全文檢索,為數(shù)據(jù)采集帶來諸多方便。所以,按照唐代墓志的時間編排,以正史列傳、行狀、神道碑銘等資料為補充,有效地實現(xiàn)大規(guī)模、連續(xù)性的史料分析,促進多種史料或史料庫的相互鏈接,可了解人物的生平事跡及其隨時空變化所產(chǎn)生的各類關系和影響,能夠幫助史學研究者探知更多的新史實[7]。
墓志文獻中存在著大量的特殊性字詞,往往是讀取墓志信息的關鍵。例如,墓志中常見的“附”字,一般是對墓主合葬的描述。部分墓志中會書為“祔”,據(jù)《說文》示部解釋,“祔”從礻聲付,泛指合葬。所以,“附”與“祔”通用,均指志主死亡后為合葬或者祔葬,“附”與“祔”無疑成為解讀唐代喪葬問題的一個關鍵。部分墓志出于避諱,對尊者的名字采取空字、減筆、形似等書寫方式,這些避諱字自然也會影響對人物信息的識別。墓志中的異體字、磨泐字、俗體字等特殊字,對墓志解讀及數(shù)據(jù)化工作也有影響。
墓志中存在大量特殊詞匯,對墓志信息解讀起著重要作用。比如,“半子”“喧秾”“縣人”“先時”等口語詞匯,在實際意義上分別表“女婿”“熱鬧”“同縣的人”“先前”之意?!坝捎嗳肭亍钡鹊涔试~語在墓志中代指少數(shù)民族成員或別國人才在唐廷為官?!暗琅D”“法夏”“僧臘”“僧夏”等特指性詞匯專指僧人的年壽?!氨馈薄稗啊薄熬桊^”“卒”“不祿”“死”等詞都表“死亡”之意,但標識著不同人物的社會身份及地位等級。
墓志中廣泛存在的通假字、空缺字、口語詞、名典詞等特殊性字詞具有特定的意義和使用情景,對墓志文本的解讀有重要作用。所以,在墓志數(shù)據(jù)化建設中,對數(shù)量眾多的特殊詞匯建立專業(yè)詞匯庫是有必要的。學界已有諸多論文及專著對墓志中的特殊詞匯進行研究和整理,并可對照現(xiàn)有的字典、辭書進行校對和補充。因此,以現(xiàn)有學術成果為依托,建立專業(yè)詞匯庫在理論上是可行的。
唐代墓志是唐史研究的重要史料,在史事研究中應注重對墓志的宏觀解讀。如果僅對墓志進行就事論事的單篇考釋很可能會影響研究視野的進一步擴展,甚至忽略歷史發(fā)展的主要脈絡。在單篇墓志閱讀中,志主的某一經(jīng)歷或許并不能引起讀者的注意,但如果將同類墓志集中起來解讀就可能使一個重要歷史事件呈現(xiàn)出來。比如,前文所述墓志中經(jīng)常出現(xiàn)的“致仕隱逸”現(xiàn)象,對單個墓志來說只是對志主高雅情懷的表達。然而,大量同類墓志信息的出現(xiàn)則表明,這是戰(zhàn)爭結(jié)束后大量士兵解甲歸農(nóng)的結(jié)果,特別是唐太宗征伐高麗后大量士兵復員是此類墓志集中出現(xiàn)的主要原因。所以,對墓志的解讀不僅要注意個體描述,也要關注墓志書寫的主要集中點,將其與傳世文獻作對比分析,在更加宏觀的視野下還原歷史真相。
墓志文獻是對個人一生的記述,涉及事件、地點、人物、時間等多個信息點。在墓志之間或者墓志與其它文獻之間,常常以時間作為歷史事件編排的鏈接點。所以,對墓志進行時間性排列可以更加清晰地把握歷史敘述的脈絡。在墓志數(shù)據(jù)化過程中,要注意時間接點(一般指埋葬時間,有祔葬和改葬情況的,要以最后葬事時間為限)的把握。通過時間鏈接把墓志與其它文獻對相同歷史事件的記載置于同一時空之下,以更好地分析和復原史實。人物作為事件的執(zhí)行者,是事件研究不可忽略的對象,對人物的準確定位成為捋清事件的關鍵所在。在墓志中,志主的個人代號就有名、字、號、乳名、官職名等多種稱呼,志主在家庭和社會中又有不同的角色,這些代號信息都是人物檢索定位的關鍵詞。所以,研究人物交際網(wǎng)絡,實施關鍵詞擴展,以便對人物信息進行準確定位勢在必行。只有這樣才能最大限度地避免信息遺漏,保證信息的完整,使文獻價值得到充分挖掘。
適合構建成數(shù)據(jù)庫的材料至少應該具備三個特點:第一,材料數(shù)量具備一定規(guī)模,覆蓋面廣且有時間上的延續(xù)性;第二,材料的信息形式或內(nèi)容相對統(tǒng)一;第三,材料蘊含的信息內(nèi)容要相對多樣且重要[8]。唐代墓志材料的特性基本符合以上要求:第一,已經(jīng)結(jié)集出版的唐代墓志基本貫穿整個唐朝,部分還涉及隋和五代,具有較強的連續(xù)性。許多墓主是同一家族,通過對他們墓志的解讀,有利于構建家族生長史,對唐代基本史實的復原也有幫助。第二,唐代墓志所記,既有個人生平也有時代大事,內(nèi)容寬泛。然而記述范圍卻一直穩(wěn)定在姓名、世系、婚姻、喪葬等方面。雖然唐代中后期的古文運動使墓志撰述風格有所調(diào)整,但記述的類目大致不變。第三,墓志記述涉及人口、移民、職官、婚姻、喪葬、宗教信仰、疾病醫(yī)療等多個方面,而且志主身份的不同意味著政治、經(jīng)濟、文化、自然地理等不同信息在墓志中的出現(xiàn)。唐代墓志的這些特點基本符合數(shù)據(jù)庫材料的數(shù)據(jù)特征,為墓志數(shù)據(jù)化工作奠定前提條件。
在正史記載中,同一人物或同一事件常常出現(xiàn)在不同篇章中,即便是小說筆記資料也會出現(xiàn)類似的現(xiàn)象。這種材料分散、瑣碎的狀況不利于數(shù)據(jù)的提取和分析,處理好這一問題對信息整合、墓志解讀及史學研究都有現(xiàn)實意義。正史對人物、事件的記載基本上遵循以時間為經(jīng),可以以此入手,把年代作為最小的單位來梳理歷史事件或史實構成。依照歷史年代的語義聯(lián)系來聚集同一或相關史實,展示事件的全貌,建立年號紀年之間的橫向或縱向聯(lián)系,建立歷史年代本體,然后通過本體的語義關聯(lián),聚集相關歷史年代知識元,從而打破紀傳體因人紀事造成的同一史實或相關史實散見于各卷的弊端。將正史記載與相應人物的墓志內(nèi)容相連接,既解決資料零碎散見的問題,也有利于史事考證工作的開展,為墓志數(shù)據(jù)庫的建立提供技術條件。同時,知識圖譜和數(shù)據(jù)的可視化技術在大數(shù)據(jù)環(huán)境下已趨于成熟,可以在D3.js技術平臺上實現(xiàn)歷史人物實體關系的可視化。這樣可以將繁雜的墓志數(shù)據(jù)進行人物和事件分類,以直觀的形式將歷史人物和事件的信息可視化,幫助研究者更好地處理和挖掘歷史人物之間及其與相關事件之間的關系[9]。
任何事件都有時間和空間雙重屬性,墓志的埋藏及出土地點和時間也應當成為墓志研究的重要方面。隨著考古發(fā)掘工作的不斷深入,墓志研究更是一個持續(xù)生長的過程。借助GIS技術,抓住墓志分布的時空要素,探討其地域分布規(guī)律及其差異,主動尋求墓志的集中分布區(qū)域,進而對墓志進行內(nèi)容分析。這不僅僅是對墓志時空分布的直觀呈現(xiàn),也將會為歷史地理學、區(qū)域史等史學研究的思路構建提供助益。
唐人墓志中的資料信息龐雜零碎,涉及大量唐代政區(qū)、地名等人文材料,有助于唐史研究的深入。如果把唐代墓志涉及的道、府、州、縣等地名匯總,就是一個相對完整的唐代政區(qū)地名系統(tǒng)數(shù)據(jù)庫[10]。不僅如此,墓志中所呈現(xiàn)的籍貫、郡望、任職地點、地理風俗、家庭人口等各方面的信息都可于時空坐標之下進行系統(tǒng)呈現(xiàn)和分析,進而探究這些要素的分布現(xiàn)象及規(guī)律,挖掘其真正成因,對政治史、社會史、歷史地理學等方面的研究都大有裨益。
墓志文獻的內(nèi)容與神道碑、摩崖石刻、筆記、譜牒等的記載有許多相關的部分,這些重合區(qū)域可以佐證墓志之偽訛,墓志的部分信息也可以補正其它文獻之不足。然而,各類文獻自身的特點不同,對歷史現(xiàn)象記載的側(cè)重點和真實度也不同,只有通過對比才能發(fā)現(xiàn)每種文獻的優(yōu)點所在。比如,正史及筆記小說對人物及世系的記載可能是基于傳說,或者在傳世過程中遭到篡改,以致記載出現(xiàn)訛誤。摩崖、石刻、神道碑銘對人物及事件的記載或較真實,然風雨侵蝕磨泐以及人為破壞會使其記載殘缺不全。墓志在這些方面卻有其特殊優(yōu)勢,墓志掩埋在地下不易破壞,被篡改的可能性相對較小,對個人信息的記載也相對可靠。在各類文獻的對比分析中,墓志文獻可將其獨有的優(yōu)勢表現(xiàn)出來,這在史料價值、信息獲取及研究成果的可信度評比中又甚為關鍵。
近30年來,不斷有關于唐代墓志的資料匯編或者拓片結(jié)集問世。雖然匯編資料的部頭較大,但墓志材料的重復部分較多。截至2004年,墓志數(shù)量6828方,很難說這是當時墓志數(shù)量的全部[11]。隨著近十年不斷發(fā)掘,新的墓志材料不斷結(jié)集出版。然而,墓志材料被分散保存在不同的圖書館、博物館及個人收藏者手中,無法進行有效統(tǒng)計和利用,對墓志材料作終極性挖掘也不現(xiàn)實。此外,已出版的墓志多以原石拓片的形式呈現(xiàn),在信息采集之前要先對墓志拓片做謄錄點校工作,需要投入大量的人力、物力及時間。總之,墓志材料的分散和點校謄錄工作的繁重是墓志數(shù)據(jù)化所面臨的首要問題。只有解決集中搜集整理這一問題,才有可能對墓志信息進行深層次的開發(fā)利用。
在墓志文獻中,口語、俗語、典故以及異體字、通假字和不規(guī)范字的使用常見,墓志中磨泐字的考釋及尾部的銘文解讀都對信息采集者提出較高的要求。雖然部分問題已有論文和專著進行探討并得以解決,但遠遠不夠。志文中大量的地名和典故仍需要花更多的精力去解讀和考釋,大部分地理信息也無法用今天的地理坐標定位,這些工作需要歷史學者、金石學者、文字學者、考古學者、數(shù)據(jù)科學家的共同參與。這是一個長期艱苦的過程,為確保墓志信息的準確識別讀取,需要多個學科的工作者進行長期合作。
墓志數(shù)據(jù)化處理既要關注技術問題也要關注學術研究和現(xiàn)實社會的需要,要有一定的問題導向意識。明確墓志材料在整個唐史研究資料中的地位以及墓志對學術問題的適應層面,是墓志數(shù)據(jù)化的核心問題,要求開發(fā)者在技術和學術層面上為墓志數(shù)據(jù)化做好方向性規(guī)劃設計。同時,墓志數(shù)據(jù)化也要考慮現(xiàn)實社會的需求,可借鑒斯坦福大學中國墳墓計劃的典型案例,關注社會需求導向,在傳統(tǒng)文化傳承和文物保護熱潮之下滿足社會對墓志寫作風格、書法藝術、銘文研究等多方面的需求。
在傳統(tǒng)史學領域中,墓志研究集中在單篇墓志的考釋,或者對某一方面的問題做部分時段的局部研究,對大型長時段問題涉及較少。究其原因,墓志數(shù)據(jù)化滯后是一個重要因素。在數(shù)字人文趨勢下,通過數(shù)據(jù)化工作可以對墓志進行文本挖掘,利用計算機、互聯(lián)網(wǎng)以及大型數(shù)據(jù)庫來獲取、分析墓志史料信息,借助網(wǎng)絡對信息數(shù)據(jù)進行保存與傳播。提供墓志主人及其家庭的主要數(shù)據(jù),有利于研究者梳理主要人物關系、揭示社會人物之間的關聯(lián),從而清晰直觀地展現(xiàn)相關的知識體系。以往很難量化的問題,諸如家庭情感、經(jīng)驗、人生體驗、宗教信仰、價值評價、學術思想,在大數(shù)據(jù)背景下,都可以進行有效表達及數(shù)理分析。墓志數(shù)據(jù)化不僅僅推動著墓志研究方法、史料形態(tài)、研究環(huán)境和思維的變革,在相關單位的協(xié)調(diào)合作和與CBDB及CHGIS(中國歷史地理信息系統(tǒng))數(shù)據(jù)連接的情況下,長時段大型數(shù)據(jù)庫的建設可為國內(nèi)外學界提供公共信息平臺,實現(xiàn)真正的資源共享,也能為史學專項數(shù)據(jù)庫創(chuàng)建提供范例。
[1]王讜.唐語林校證:[M].周勛初,點校.北京:中華書局,1987.
[2]吳納.文章辨體序說[M].于北山,點校.北京:人民文學出版社,1998.
[3]歐陽修,宋祁.新唐書[M].北京:中華書局,1975.
[4]唐代墓志匯編[M].周紹良,趙超,編.上海:上海古籍出版社,1992.
[5]吳鋼.全唐文補遺:第五輯[M].西安:三秦出版社,1998.
[6]金觀濤,劉青峰.歷史的真實性:試論數(shù)據(jù)庫新方法在歷史研究的應用[J].清史研究,2008(1):90-108.
[7]梁晨.量化數(shù)據(jù)庫:“數(shù)字人文”推動歷史研究之關鍵[J].江海學刊,2017(2):162-165.
[8]肖懷志,李明杰.基于本體的歷史年代知識元在古籍數(shù)字化中的應用——以《三國志》歷史年代知識元的抽取、存儲和表示為例[J].圖書情報知識,2005(3):28-33.
[9]周亦,周明全,王學松,等.大數(shù)據(jù)環(huán)境下歷史人物知識圖譜構建與實現(xiàn)[J].系統(tǒng)仿真學報,2016(10):2560-2566.
[10]馬強.新出土唐人墓志與唐代歷史地理研究的新拓展[J].中國歷史地理論叢,2013(4):84-93.
[11]氣賀澤保規(guī).新版唐代墓志所在綜合目錄[M].東京:汲古書院,2009.