汪 超
內(nèi)容提要:處在數(shù)字時(shí)代,在傳統(tǒng)閱讀的基礎(chǔ)上,應(yīng)用數(shù)字化技術(shù)輔助閱讀、研究唐宋詞,或可從四個(gè)方面著力。首先,檢索、統(tǒng)計(jì)。在“全讀”文本中發(fā)現(xiàn)問(wèn)題之后再運(yùn)用工具輔助檢索。可嘗試建設(shè)開(kāi)放的、學(xué)者個(gè)性化的檢索系統(tǒng)。其次,文本分析。借助計(jì)算機(jī)分析文本異同,實(shí)現(xiàn)異文的搜索、轉(zhuǎn)換、排列,并與其他數(shù)據(jù)庫(kù)關(guān)聯(lián)。第三,文本標(biāo)注。依托各種數(shù)據(jù)平臺(tái)提高挖掘語(yǔ)意、標(biāo)注文本的正確率。最后,知識(shí)圖譜。知識(shí)圖譜是一種知識(shí)表示和管理的方式,唐宋詞相關(guān)的知識(shí)數(shù)據(jù)化后,也可以加入其中。我們面臨的是一個(gè)知識(shí)呈現(xiàn)變革的時(shí)代。知識(shí)的存儲(chǔ)、組織方式變化,并不改變知識(shí)本身,人機(jī)共讀的時(shí)代正在向我們走來(lái)。
唐宋詞研究是詞學(xué)研究領(lǐng)域的“熟土”,故而近年賢人智者紛紛轉(zhuǎn)出三唐兩宋,前往其他斷代拓荒。所謂“熟土”,一則經(jīng)過(guò)前人深耕,難以出新;二則歷代選本、舊注、舊評(píng)、年譜、考證等前人遺產(chǎn)堆積厚重,異說(shuō)紛紛,頭緒蕪雜,難以厘清。但唐宋詞畢竟是詞體巔峰之作,又是詞學(xué)研究之“原鄉(xiāng)”。一般說(shuō)來(lái),詞學(xué)研究繞不過(guò)唐宋詞文本的閱讀,即便研治宋代以后之詞與詞學(xué),沒(méi)有唐宋詞文本打底,恐怕也是難以想象的?!盎貧w文本”并非新鮮的話題,如何走回文本卻人言言殊。傳統(tǒng)治學(xué)中的閱讀文本之法,是大家都較為熟悉的;而處在數(shù)字時(shí)代的我們?nèi)绾谓Y(jié)合傳統(tǒng)讀法走回唐宋詞文本,是本文想討論的問(wèn)題。
毋庸諱言,唐宋詞經(jīng)過(guò)前代學(xué)者的披沙揀金,經(jīng)典化已經(jīng)完成,形成了閱讀慣習(xí),經(jīng)典作家、經(jīng)典詞作的文本較為封閉而有限。再加上權(quán)威判斷的效應(yīng),我們?yōu)樘扑卧~、唐宋詞家貼上了形形色色的標(biāo)簽?!痘ㄩg集》“雕紅鏤翠”,柳永詞“通俗、創(chuàng)調(diào)”,蘇辛詞“豪放、愛(ài)國(guó)”,諸如此類,唐宋詞豐富的面貌被簡(jiǎn)單化了。前人關(guān)于唐宋詞的成說(shuō)、研究實(shí)績(jī)甚多,對(duì)于我們來(lái)說(shuō),既是需要翻越的山峰,又是可以繼承的財(cái)產(chǎn)。所以,重讀文本就要避免“各照隅隙,鮮觀衢路”。其實(shí)唐宋詞經(jīng)歷過(guò)幾次載體轉(zhuǎn)換,發(fā)生過(guò)文本來(lái)源、傳播方式的變化,例如宋元之際詞樂(lè)漸失,人們從聽(tīng)、唱詞改為看、讀詞;明清以來(lái)唐宋詞經(jīng)典化完成,人們以選本、別集、叢刊看詞;現(xiàn)代詞學(xué)興起,林大椿《唐五代詞》、唐圭璋《全宋詞》出版,人們有了全集型斷代詞總集作為閱讀選擇。閱讀《全宋詞》的模式持續(xù)到20 世紀(jì)90年代,《全宋詞》光盤化、數(shù)字化。二十年過(guò)去了,數(shù)字化工具所能實(shí)現(xiàn)的功能已經(jīng)遠(yuǎn)超王兆鵬師當(dāng)年提到的“《全唐五代詞》、《全宋詞》、《全金元詞》和《詞話叢編》等內(nèi)容,具有查詢、索引、統(tǒng)計(jì)和輔助等四大功能”①嚴(yán)迪昌、劉揚(yáng)忠、鐘振振、王兆鵬:《傳承、建構(gòu)、展望——關(guān)于二十世紀(jì)詞學(xué)研究的對(duì)話》,《文學(xué)遺產(chǎn)》1999 年第3 期。,但我們的閱讀方式并未發(fā)生根本的改變。數(shù)字化的《全宋詞》檢索系統(tǒng)反而造成初學(xué)者以檢索代替閱讀,“文本閱讀”動(dòng)力不足的窘境?,F(xiàn)在,數(shù)字人文在不少領(lǐng)域有明顯貢獻(xiàn),但有些項(xiàng)目設(shè)計(jì)的應(yīng)用內(nèi)容是古代文學(xué)專業(yè)學(xué)者并不需要,甚至應(yīng)當(dāng)“警惕”的。筆者非數(shù)字人文專家,撰此文的目的主要有兩層:一是喚起詞學(xué)、古代文學(xué)研究的同仁注意數(shù)字人文的應(yīng)用,參與數(shù)字人文應(yīng)用于涉古研究之方法討論;一是為數(shù)字技術(shù)研發(fā)人員提供使用體驗(yàn),供其開(kāi)發(fā)新產(chǎn)品時(shí)參考。
那么,我們?nèi)绾卧趥鹘y(tǒng)閱讀的基礎(chǔ)上,應(yīng)用數(shù)字化技術(shù)輔助閱讀唐宋詞呢?
首先,檢索、統(tǒng)計(jì)。檢索既是各類數(shù)據(jù)庫(kù)的基本功能,也是研究者須臾不能忘懷的資料探訪途徑,不少專家對(duì)此憂心忡忡。筆者以為,檢索應(yīng)該建立在“全讀”的基礎(chǔ)上,在“全讀”文本中發(fā)現(xiàn)問(wèn)題之后再運(yùn)用檢索工具加以輔助,那么其結(jié)果與“檢索體”論文絕非一回事。
“全讀”文本為什么重要?“全讀”《全唐五代詞》《全宋詞》《全金元詞》便于了解一代之詞①把《全金元詞》放進(jìn)來(lái)一起討論,是因?yàn)榻鸫c南宋幾乎并存,僅考察南宋詞而棄金詞于不顧,不能反映一個(gè)時(shí)代的全貌。因此,本文所論唐宋詞,皆自動(dòng)包含“金詞”。,可以把握詞的歷時(shí)發(fā)展,據(jù)說(shuō)前代學(xué)者如吳熊和先生就每年翻閱《全宋詞》一過(guò)。這種不斷的重復(fù),看似笨功夫,實(shí)際上最易發(fā)現(xiàn)文本間的相互聯(lián)系、特殊問(wèn)題。例如特殊詞體的出現(xiàn),黃庭堅(jiān)《阮郎歸·效福唐獨(dú)木橋體作茶詞》在全讀的過(guò)程中就不容易忽略。一些特殊的文本關(guān)聯(lián)容易浮現(xiàn),比如詞人以“雨”與“淚”的意象合作,呈現(xiàn)出相思的內(nèi)心世界的慣技;比如詞人“眉間”“心上”相聯(lián)接的互文脈絡(luò)等?!叭x”的過(guò)程自然也會(huì)發(fā)現(xiàn)不少難以卒讀的詞,禪修丹道諸作大體如是。《全金元詞》所收金詞有大量全真高道之作,《全宋詞》中釋、道作品的比例本不如金元時(shí)期大,但也有屬于此類者。唐圭璋先生在《全金元詞》序言中提到這些作品,曾說(shuō)是為存詞律的目的而保留。可是,若從宗教文學(xué)的角度看,這些作品未必全無(wú)價(jià)值。哪怕從詞史本身看,這些作品的出現(xiàn)時(shí)間、文本形態(tài)、文本風(fēng)格等都值得再探索?!叭x”的過(guò)程或許是印象式的,正可以借助數(shù)字化手段將此印象確定化。當(dāng)發(fā)現(xiàn)特殊文本現(xiàn)象時(shí),檢索全文顯然會(huì)為我們帶來(lái)更多相似的文本。事實(shí)上,舉凡詞之體式、句式、用字、用韻等等,多可借助計(jì)算機(jī)處理,形成結(jié)果。這些均是人所周知的,不贅言。
目前的檢索系統(tǒng)往往是封閉的,使用者不能自行修正、上傳、保存?zhèn)€性化的資料。筆者希望有一個(gè)用戶友好型的詞學(xué)檢索系統(tǒng),能彌補(bǔ)不足。比如全集型總集雖然追求“全”,但限于編纂實(shí)際,其結(jié)果往往只是理論上“全”。單個(gè)作家的作品全集,也是如此。所以,我們所說(shuō)的“全讀”,自然也是相對(duì)之“全”?!度莆宕~》晚出,且近年又出新版,學(xué)界有關(guān)唐五代詞的文獻(xiàn)發(fā)現(xiàn)無(wú)多,若無(wú)重要考古發(fā)現(xiàn),唐詞佚作想來(lái)不易再現(xiàn)。《全宋詞》近年來(lái)有兩宗大收獲,一是佘筠珺《靜嘉堂文庫(kù)本『新編通用啟劄截江網(wǎng)』に見(jiàn)える宋詞—『全宋詞』輯補(bǔ)一百四十首》(《風(fēng)絮》第14 號(hào),2017 年12 月),所輯140首名姓不彰者之作;一是湯華泉《〈全宋詞〉拾補(bǔ)九十二首》(《詞學(xué)》第40 輯,華東師范大學(xué)出版社,2018 年),其中有黃庭堅(jiān)、葛長(zhǎng)庚、姚勉、王之道等人詞作,并有散闋。此前,彭志《〈全宋詞〉〈全金元詞〉輯補(bǔ)二十家三十七首》(《社會(huì)科學(xué)論壇》2016 年第7 期),還輯有汪藻、余玠、徐安國(guó)等人詞作20闋,金人詞作17 闋。三年間,270 余闋宋人遺篇重見(jiàn)天日,難免讓我們對(duì)域外漢籍和釋、道、方志諸書(shū)有所期待。事實(shí)上,《全宋詞》一直都在被補(bǔ)苴,小到句讀,大到輯佚、辨?zhèn)?,中間則如其他一些細(xì)節(jié)修訂,如鐘振振教授的《全宋詞》詞人小傳修訂工作已有一系列成果,并主持有國(guó)家社科基金重大項(xiàng)目《全宋詞人年譜、行實(shí)考》。因此有學(xué)者呼吁重編《全宋詞》,并為之做出基礎(chǔ)工作。②劉榮平:《論〈全宋詞〉的缺失局限與重編的可行性》,《廈門大學(xué)學(xué)報(bào)》,2019 年第5 期;劉榮平、曹鈴玉:《〈全宋詞〉訂補(bǔ)論文論著索引(新編)》,《廈大中文學(xué)報(bào)》,2018 年。所以,當(dāng)我們重讀唐宋詞時(shí),一方面不妨取訂補(bǔ)諸作參看;另一方面,若能將這些資料上傳到可以修訂保存的學(xué)者個(gè)性化檢索系統(tǒng),就可以及時(shí)更新《全宋詞》數(shù)據(jù)。
除去更新《全宋詞》數(shù)據(jù),若有系統(tǒng)可存儲(chǔ)、調(diào)用其他文體作品、研究資料,研究者的實(shí)際需要或能得到更大的滿足。如果這個(gè)系統(tǒng)的數(shù)據(jù)是智能化的,可以實(shí)現(xiàn)人機(jī)對(duì)話,并且與其他數(shù)據(jù)庫(kù)發(fā)生關(guān)聯(lián),其功能勢(shì)必更加強(qiáng)大,對(duì)唐宋詞研究的作用也可想而知。
其次,文本分析。文本分析的工具與平臺(tái),目前較常見(jiàn)的有萊頓大學(xué)宋史學(xué)者魏希德教授開(kāi)發(fā)的碼庫(kù)思(Markus),這是與哈佛大學(xué)的CBDB、復(fù)旦大學(xué)的CHGIS 關(guān)聯(lián)的,一般介紹總要提到它的半自動(dòng)標(biāo)注功能。還有一個(gè)中文文本平臺(tái)是ctext.org,它提供研究者可以比對(duì)的文本。這些比對(duì)的內(nèi)容可能是它自身搜羅的,也可以鏈接到其他圖書(shū)資料系統(tǒng)。但是,ctext 平臺(tái)上面有先秦到民國(guó)時(shí)期的諸多文本,卻幾乎沒(méi)有詞文本。所以從某種意義上說(shuō),并不是數(shù)字人文需要詞學(xué)研究,而是詞學(xué)研究需要數(shù)字人文。我們可以在詞籍?dāng)?shù)據(jù)化之后使用這些工具、平臺(tái)。當(dāng)然也希望技術(shù)界能開(kāi)發(fā)新的、功能更強(qiáng)大的文本分析平臺(tái)。
人文學(xué)者進(jìn)行文本分析,是學(xué)術(shù)生產(chǎn)的重要步驟之一。計(jì)算機(jī)是否可以輔助這一步驟呢?舉個(gè)例子,詞學(xué)研究目前的幾種“全集型”斷代詞總集多沿《全宋詞》之體例,是白文本,有時(shí)并不便于理解。因此,別集箋校整理本也成為研究者的重要參考。歷年來(lái),重要詞籍多有數(shù)個(gè)整理本,而詞籍新的整理本仍然層出不窮。辛棄疾詞在已有鄧廣銘《稼軒詞編年箋注》這一經(jīng)典注本的情況下,近年來(lái)仍然有鄭騫《稼軒詞校注》、朱德才與薛祥生《辛棄疾詞新釋集評(píng)》、謝永芳《辛棄疾詩(shī)詞全集》、謝俊華《辛棄疾全詞詳注》、吳企明《辛棄疾詞校箋》、辛更儒《辛棄疾詞編年箋注》等眾多全注本。后兩種分別由上海古籍出版社、中華書(shū)局兩家業(yè)界頂級(jí)出版社先后在三個(gè)月內(nèi)出版。再加上徐漢明《辛棄疾全集校注》、辛更儒《辛棄疾集編年箋注》,稼軒詞的整理本更是為數(shù)眾多。這還不算為數(shù)更眾的辛棄疾詞選本。其他唐宋名家詞籍或許不如稼軒詞整理本突出,但經(jīng)典詞家的箋校本數(shù)量都不少。不過(guò),對(duì)于讀者而言,如此眾多的整理本難免令人心生畏懼、望洋興嘆。它們既是知識(shí)遺產(chǎn),也是學(xué)習(xí)負(fù)擔(dān)。同一部詞籍,即便有異文,其大部分內(nèi)容應(yīng)該是接近,甚至相同的。傳統(tǒng)的??狈ㄍㄟ^(guò)逐字逐句的閱讀來(lái)發(fā)現(xiàn)異文,??币徊吭~籍往往耗數(shù)月之功,《吳梅日記》中記載其校讀白石詞,就是如此。而當(dāng)我們坐擁為數(shù)眾多的整理本時(shí),異文的問(wèn)題就更加復(fù)雜?!罢怼本鸵馕吨潘?,例如??鲍@得異文之后,必然要有所選擇,“選擇”就意味著“放棄”。版本越多,意味著異文出現(xiàn)的可能性越大,整理者修改、擦除異文的可能也就越大。這種擦除,造成誤刪的幾率也不低。夏志穎認(rèn)為姜夔《暗香》的“不管清寒與攀摘”之“摘”若作“折”字,“從版本、字義、詞意三方面”均存在“可能性及優(yōu)勝之處”,但“折”字在今日的著述中還是被淘汰了。①夏志穎:《姜夔〈暗香〉、〈疏影〉三議》,陳水云主編《詞學(xué)國(guó)際學(xué)術(shù)研討會(huì)論文集》,馬來(lái)亞大學(xué)華人研究中心,2012年,第589 頁(yè)。選此棄彼難免誤傷無(wú)辜,也就形成了更多的“異本”,若要全部比勘一遍,不但平白浪費(fèi)光陰,校書(shū)如掃塵,而且仍然可能出現(xiàn)“摘”字勝出的現(xiàn)象。若尋求數(shù)字技術(shù)的幫助,讓計(jì)算機(jī)幫我們判讀異文,當(dāng)唐宋詞文本數(shù)據(jù)化之后,判讀異文就可借助技術(shù)手段實(shí)現(xiàn),相同的部分就不必重復(fù)閱讀,異文所在可以輕松搜索、轉(zhuǎn)換、排列。如果再與其他數(shù)據(jù)庫(kù)關(guān)聯(lián),相關(guān)的學(xué)術(shù)文章中涉及異文判斷的,均有可能在未來(lái)開(kāi)發(fā)的文本系統(tǒng)、平臺(tái)中得到反映。
不過(guò),從目前的情況看,撇開(kāi)版權(quán)問(wèn)題,僅就技術(shù)條件而言,對(duì)整理本的數(shù)字化還是有障礙的。OCR 軟件辨識(shí)繁體字本身就存在問(wèn)題,再由于異體字、手寫體等文字形態(tài)的存在,有時(shí)校核OCR軟件的識(shí)別結(jié)果,耗時(shí)比人工輸入文本還要長(zhǎng)。從單個(gè)研究者來(lái)看,時(shí)間成本過(guò)高,似乎并不合算,但這些數(shù)據(jù)是可以反復(fù)、多角度使用的,因此必然攤薄成本。若出版社也能參與其事,提供與印刷本相同的電子本,這一問(wèn)題也就不成其為問(wèn)題了。
另外,劉石、孫茂松教授曾提到20 世紀(jì)80 年代以來(lái),“廈門大學(xué)周昌樂(lè)教授課題組針對(duì)宋詞風(fēng)格‘豪放與婉約’的分類問(wèn)題,研創(chuàng)了基于字和詞為特征的風(fēng)格分類模型、基于頻繁關(guān)鍵字共現(xiàn)的詩(shī)歌風(fēng)格判定方法以及基于詞和語(yǔ)義為特征的風(fēng)格分類模型”,“北京大學(xué)杜曉勤教授研發(fā)的‘中國(guó)古典詩(shī)文聲律分析系統(tǒng)’”等相關(guān)先行成果,其實(shí)現(xiàn)的方式也是基于標(biāo)注來(lái)進(jìn)行文本分析的。①劉石、孫茂松:《大數(shù)據(jù)時(shí)代的古典文學(xué)研究》,《光明日?qǐng)?bào)》2018 年10 月15 日,第13 版。
蘇軾生活在抄本向雕版轉(zhuǎn)換的時(shí)代,雖然較前人更易獲得雕版印刷的文本,他仍然手抄《漢書(shū)》,以學(xué)習(xí)提高。我們借助文本分析來(lái)判斷異文,目的在減輕人力,但選擇異文的工作仍然是機(jī)器無(wú)法取代的,也是數(shù)字人文研究結(jié)果呈現(xiàn)后,人的智慧發(fā)揮作用之時(shí)。
第三,文本標(biāo)注。王兆鵬師曾設(shè)想“把固態(tài)文獻(xiàn)變成活態(tài)文獻(xiàn),讓舊文獻(xiàn)生成新知識(shí),讓海量文獻(xiàn)生成大數(shù)據(jù),從大數(shù)據(jù)中發(fā)現(xiàn)新問(wèn)題”。②王兆鵬:《新世紀(jì)以來(lái)詞學(xué)研究的進(jìn)展與瞻望》,《學(xué)術(shù)研究》2015 年第6 期。他舉《全宋詞》為例,認(rèn)為未來(lái)數(shù)字化之后,可以根據(jù)讀者意圖排列組合,“可以按題材來(lái)排列,以考察同一題材的不同表現(xiàn)方式及其演進(jìn);可以自定義按詞中的物象來(lái)排列,如分天文、地理、動(dòng)物、植物、人物、器物等,以分類考察詞作中的自然世界、人文世界和情感世界”,期許詞學(xué)研究的新空間、新格局。③王兆鵬:《新世紀(jì)以來(lái)詞學(xué)研究的進(jìn)展與瞻望》,《學(xué)術(shù)研究》2015 年第6 期。其實(shí)文本的排列組合要依靠文本標(biāo)注實(shí)現(xiàn)。前文提到過(guò)碼庫(kù)思的文本自動(dòng)標(biāo)注功能,它依托其他數(shù)據(jù)平臺(tái)提供的地名、人名系統(tǒng),可以為古籍文本初步句讀。碼庫(kù)思之所以能實(shí)現(xiàn)該功能,也是因?yàn)槲谋緲?biāo)注的技術(shù)。數(shù)字技術(shù)研究者建構(gòu)“依存句法樹(shù)庫(kù)”,依據(jù)漢語(yǔ)語(yǔ)法,挖掘語(yǔ)意,點(diǎn)斷句子。但古文文本經(jīng)常由于地名、人名的差異被點(diǎn)破,所以依托有近50萬(wàn)條人物關(guān)系數(shù)據(jù)的CBDB 和有較為詳細(xì)的古代地名的CHGIS,可在很大程度上避免此類問(wèn)題。
筆者感興趣的是詞作中的地名文本與作者行跡圖對(duì)應(yīng)時(shí),創(chuàng)作地、詞作地名不相符時(shí)的文本。如果要人工尋找,恐怕也是個(gè)不小的時(shí)間消耗,但交給計(jì)算機(jī)處理,這樣的文本應(yīng)該很快就可以找出來(lái)。其后,研究者再進(jìn)行人工分析,看這些差異究竟是如何產(chǎn)生的。到底是用典、用事,還是作者在異地懷念曾經(jīng)的居停之所?又或者是別的情況。此類的話題是建立在研究者有相關(guān)知識(shí)儲(chǔ)備的基礎(chǔ)上的,機(jī)器承擔(dān)了文本搜尋的工作,但又較原始、簡(jiǎn)單的檢索功能更進(jìn)一步。
當(dāng)然,數(shù)字化并不是萬(wàn)能的,它的功能都是建立在人類提供數(shù)據(jù)的基礎(chǔ)上的。所以,數(shù)據(jù)若不完整,也肯定會(huì)出現(xiàn)文本分析錯(cuò)誤。如“依存句法樹(shù)庫(kù)”根據(jù)現(xiàn)代漢語(yǔ)語(yǔ)法拆分語(yǔ)詞,文言文斷句有誤差是很正常的。唐宋詞有別于日常生活表達(dá)的句法又哪里會(huì)少?“錦浦,春女,繡衣金縷”(韋莊《河傳》),如果沒(méi)有標(biāo)點(diǎn),這種純名詞組合的句子,哪個(gè)是主語(yǔ)?哪個(gè)是謂語(yǔ)?恐怕有些連專業(yè)基礎(chǔ)略差的研究者也未必搞得清楚,自然要經(jīng)過(guò)特殊處理。更何況我們還有眾多生僻的詞調(diào)在等著開(kāi)發(fā)數(shù)字技術(shù)的程序員們!明明都叫《訴衷情》,為什么文本有的只有一段,有的又分兩段?不同的作者寫的《采桑子》為什么字?jǐn)?shù)不相同,有的平仄位置不一樣?為什么有些《浣溪沙》和《攤破浣溪沙》文本又十分相像?為什么《念奴嬌》《百字令》《酹江月》《大江東去》《壺中天》《湘月》看上去像是“六胞胎”?《詞譜》自然是可以依據(jù)的,哪怕《催徽頭子》《玉團(tuán)兒》《落梅風(fēng)》《早梅芳》這種只有個(gè)位數(shù)作品的詞調(diào)也可以總結(jié)規(guī)律,提供給“依存句法樹(shù)庫(kù)”??墒且馔馊匀皇遣豢杀苊獾模荒芤揽坎粩喾e累,不斷擴(kuò)充,讓計(jì)算機(jī)自動(dòng)學(xué)習(xí)詞學(xué)的內(nèi)容之后,情況才會(huì)略好。如果專業(yè)學(xué)者都不參與,孤立于數(shù)字浪潮之外,那么終將被數(shù)字革命所拋棄。
最后,知識(shí)圖譜。知識(shí)圖譜是知識(shí)服務(wù)的新熱點(diǎn),它是一種知識(shí)表示和管理的方式,主要是各種實(shí)體及其關(guān)系網(wǎng)絡(luò)的呈現(xiàn)。它的數(shù)據(jù)主要是散落在網(wǎng)絡(luò)上的元數(shù)據(jù)。我的理解是,把唐宋詞相關(guān)的知識(shí)數(shù)據(jù)化,也可以加入其中,從而為我們獲取、整理前人遺產(chǎn)服務(wù)。這里說(shuō)的前人遺產(chǎn)包括整理本中的箋注、集評(píng),各類唐宋詞鑒賞,詞話、詞學(xué)論文和論著等。
我們閱讀唐宋詞文本以讀詞籍整理本為主,常見(jiàn)的詞籍整理本箋注模式是現(xiàn)代詞學(xué)興起后,在繼承清人??敝畬W(xué)的基礎(chǔ)上形成基本規(guī)范的。如李冰若的《花間集評(píng)注》(1935)評(píng)、注結(jié)合,著意集評(píng);華蓮圃(華鐘彥)的《花間集注》(1935)傾力于注。稍后唐圭璋先生《南唐二主詞匯箋》(1936)則于箋注之外,融合編年。于是,后來(lái)諸唐宋詞名家詞籍整理本多是???、箋注、集評(píng)、編年等形式的組合。唐宋名家詞的整理本,從某種程度上說(shuō),是整理者“文本細(xì)讀”的結(jié)果。這一結(jié)果包含前人的閱讀經(jīng)驗(yàn)和文化遺產(chǎn)。
唐宋詞的鑒賞、論文、論著和詞話就更是建立在前人閱讀經(jīng)驗(yàn)的基礎(chǔ)上。其中出現(xiàn)的評(píng)論、話題、概念進(jìn)入知識(shí)圖譜的架構(gòu)后均可以自動(dòng)組合。計(jì)算機(jī)與人之間可以實(shí)現(xiàn)對(duì)話,是一種智能型的知識(shí)組織方式。計(jì)算機(jī)通過(guò)學(xué)習(xí),還可以主動(dòng)提供一些相關(guān)的資源。
打個(gè)比方,張以仁寫《溫飛卿詞舊說(shuō)商榷》自然是極有功力的。①?gòu)堃匀剩骸稖仫w卿詞舊說(shuō)商榷》,《花間詞論集》,“中研院”中國(guó)文哲研究所,2004 年。他需要清理、羅列前人時(shí)賢對(duì)同一首作品的若干意見(jiàn),然后分析,一一辨誤。如果未來(lái)放在知識(shí)圖譜中,這些資料會(huì)由計(jì)算機(jī)分類、呈現(xiàn),人需要做的只是分析和辨誤。
現(xiàn)在相關(guān)工作很多是由信息管理、圖書(shū)情報(bào)專業(yè)的學(xué)者完成。他們的目的在提供方法,關(guān)注焦點(diǎn)并不在內(nèi)容本身,所以引以為依據(jù)的知識(shí)來(lái)源是網(wǎng)絡(luò)各種數(shù)據(jù)庫(kù)、百度百科、維基百科等。而這些數(shù)據(jù)源頭不清,相信古代文學(xué)學(xué)者較難信服。但是,如果專業(yè)學(xué)者參與,將詞籍?dāng)?shù)據(jù)化,對(duì)文本妥善標(biāo)注,自建數(shù)據(jù)庫(kù),再與網(wǎng)絡(luò)資源關(guān)聯(lián),關(guān)聯(lián)后進(jìn)行數(shù)據(jù)清洗,確定其可靠性,這樣一來(lái),就可以有效解決文獻(xiàn)可信度的問(wèn)題。
其實(shí)以上各種方法,只是數(shù)字技術(shù)很小的一部分,我們面臨的是一個(gè)知識(shí)呈現(xiàn)變革的時(shí)代。知識(shí)的存儲(chǔ)、組織方式變化,并不改變知識(shí)本身。就像唐五代的前輩手抄詞籍,宋金的前輩將手抄本、稿本變成雕版板片,明清的前輩把詞別集匯成叢刊、叢編,現(xiàn)當(dāng)代的詞學(xué)學(xué)者將這些內(nèi)容又歸攏成各種整理本,這種變化應(yīng)該是類似的。不管我們?cè)覆辉敢?,人機(jī)共讀的時(shí)代正在向我們走來(lái)。