鄧心強(qiáng)
(中國礦業(yè)大學(xué) 人文學(xué)院,江蘇 徐州 221116)
大數(shù)據(jù)時代利用互聯(lián)網(wǎng)、信息技術(shù)、數(shù)據(jù)庫獲取信息、挖掘分析信息這一套思維和方法將成為人文學(xué)科研究的一種新范式。國內(nèi)已經(jīng)出現(xiàn)了一些數(shù)字人文教學(xué)的早期嘗試,如汕頭大學(xué)文學(xué)院開設(shè)了“數(shù)字人文”方向,武漢大學(xué)王濤教授開設(shè)了“數(shù)字工具與世界史研究”課程,臺灣清華大學(xué)中國文學(xué)系祝平次開展了“數(shù)字工具與文史研究”“本體結(jié)構(gòu)與文史研究”課程及35場工作坊[1]。這些都走在國內(nèi)前沿,極大地帶動了數(shù)字人文的人才培養(yǎng)和學(xué)術(shù)研究。
何謂“數(shù)字”?它“從工具層面講是軟件和算法、技術(shù)和工具,從數(shù)字層面講是基礎(chǔ)設(shè)施和研究范式”[2]1-2。數(shù)字已無孔不入地進(jìn)入到當(dāng)代社會生活中。數(shù)字人文主要依賴數(shù)據(jù)庫、圖像識別、數(shù)據(jù)挖掘、神經(jīng)網(wǎng)絡(luò)與機(jī)器學(xué)習(xí)等技術(shù)手段。這些手段與傳統(tǒng)文學(xué)研究相結(jié)合,呈現(xiàn)出文獻(xiàn)數(shù)據(jù)(語料)庫、版本??迸c文字識別、計算語言(風(fēng)格)學(xué)、敘事程式分析、社會關(guān)系網(wǎng)絡(luò)、地理信息系統(tǒng)以及人工智能創(chuàng)作、分析系統(tǒng)等不同形態(tài)的輔助手段或研究成果[3]75。當(dāng)前,數(shù)字人文的引入“可將文學(xué)研究納人一個更宏觀的視野,提高研究結(jié)論的精準(zhǔn)性、穩(wěn)定性及可驗證性,促生新的研究理念、方法與范式”[4]26。和傳統(tǒng)研究相比,數(shù)字人文的優(yōu)勢很明顯,它“超越檢索利用大數(shù)據(jù)和專門的技術(shù)、工具,無論是文本編碼、語義分析、空間分析、地圖制作,還是時間表、網(wǎng)絡(luò)分析、可視化,皆有相應(yīng)的軟件、工具、平臺,展開專門的量化研究”[5]35。對于持續(xù)了數(shù)十年的文論范疇研究而言,數(shù)字人文無異于是一劑新的催生劑。
人文計算在國外發(fā)展有數(shù)十年的歷史。隨著互聯(lián)網(wǎng)的崛起和新興技術(shù)的更新?lián)Q代,基于人文計算而形成的數(shù)字人文研究,近五年來在國內(nèi)迅速興起,并波及到圖書情報、文史哲、藝術(shù)學(xué)等諸多領(lǐng)域,儼然成為當(dāng)前一大學(xué)術(shù)熱點。多名學(xué)者對其發(fā)展史、階段特征、教育現(xiàn)狀等有深入的總結(jié)[6][7]托馬斯·庫恩認(rèn)為,新的范式會帶來革命性影響,極大地推動科技和學(xué)術(shù)創(chuàng)新。數(shù)字人文便是當(dāng)前廣泛應(yīng)用于人文科學(xué)的一種全新研究范式,從解決學(xué)術(shù)問題看,又是一種新的研究方法。當(dāng)前眾多學(xué)人將其引入到古典文學(xué)、現(xiàn)當(dāng)代文學(xué)乃至文學(xué)評論中來,取得了顯赫的成就,帶給我們很多新的思路和啟迪。
國內(nèi)此前已有多位學(xué)者引入數(shù)字人文從事文學(xué)研究,別開生面。北京大學(xué)李鐸教授完成了《全唐詩分析系統(tǒng)》和《全宋詩分析系統(tǒng)》,為約31萬首唐宋詩歌創(chuàng)立數(shù)據(jù)模型,對詩歌的平仄、用韻自動標(biāo)注,再對文本展開分析。杜曉勤教授研發(fā)了《中國古典詩文聲律分析系統(tǒng)》,通過系統(tǒng)自動標(biāo)注古典詩歌及其韻文。王麗麗就數(shù)字人文方法研究的挑戰(zhàn)與機(jī)遇對堪薩斯大學(xué)格雷厄姆教授展開訪談,介紹了美國數(shù)字人文切入文學(xué)研究的路徑與成就,指出數(shù)字人文開辟了研讀經(jīng)典作品的嶄新方法[8]。董洪川深入探討了數(shù)字人文視域下外國文學(xué)研究范式的巨大轉(zhuǎn)換及給該學(xué)科帶來了三大啟迪,并系統(tǒng)分析了超文本遠(yuǎn)讀、定量輔助定性研究等新的研究方法[9]。王兆鵬與鄭永曉等學(xué)者在《借器之勢,出道之新》一文中,重點就古典文學(xué)應(yīng)用于數(shù)字人文的前景進(jìn)行了深入討論,尤其結(jié)合安史之亂分析了系列數(shù)據(jù)庫、平臺建設(shè)及其功能,以及如何運用數(shù)據(jù)挖掘技術(shù)分析和闡釋古代文學(xué)[10],均給人耳目一新之感。邱偉云借助數(shù)字人文技術(shù)分析了131位中唐詩人共一萬四千多份唐詩中的空間方位詞[11]。這是數(shù)字人文研究唐詩的典范,帶來迥異的思路和結(jié)論。劉京臣發(fā)表《大數(shù)據(jù)時代的古典文學(xué)研究》[12]認(rèn)為古典文學(xué)信息化的重點應(yīng)當(dāng)由數(shù)據(jù)檢索向數(shù)據(jù)分析、數(shù)據(jù)挖掘轉(zhuǎn)型,指出針對疑難文字的OCR技術(shù)、利于版本校勘的圖像檢索,將是今后數(shù)字人文研究文學(xué)值得期待的方向。劉石全面分析了數(shù)字人文視野下古代文學(xué)文本分析的六大主要問題[4]26,充分展現(xiàn)了數(shù)據(jù)平臺、技術(shù)平臺、研究平臺“三位一體”模式之優(yōu)長。
《現(xiàn)代中文學(xué)刊》2019年推出《“數(shù)字人文”與中國現(xiàn)代文學(xué)研究三人談》,深入探討了以數(shù)字人文方法介入現(xiàn)代文學(xué)研究的種種思路與方法。趙薇談到了數(shù)字人文在現(xiàn)代文學(xué)研究中的計量方法[3]。嚴(yán)程分析了大數(shù)據(jù)在當(dāng)前人文學(xué)科研究的多種路徑,高度肯定了數(shù)字技術(shù)手段對信息處理的成效,指出文學(xué)研究也能為新技術(shù)的應(yīng)用拓展新的空間[13]。王賀提出了“超越檢索”而以多元的數(shù)字方法切入現(xiàn)代文學(xué)研究的七個方面,皆詳細(xì)而有啟發(fā)性。此外,王賀還就數(shù)字人文切入現(xiàn)代文學(xué)研究如何實際操作,結(jié)合眾多案例分析了“可視化”研究,探索視覺形式作為知識生產(chǎn)和建構(gòu)的可能性[5]36。
此外,但漢松指出“讓機(jī)器閱讀成為對傳統(tǒng)閱讀的一種激發(fā)和挑戰(zhàn),以建構(gòu)具有獨特的數(shù)字化思維但又植根于傳統(tǒng)文學(xué)批評觀念和認(rèn)知模式的新型文學(xué)批評”[14]。郭金龍就數(shù)字人文研究中文本挖掘技術(shù)的運用,如何用來研究文學(xué)分析作者的歸屬、作品的人物關(guān)系、情感以及風(fēng)格等[15]。鄭永曉使用GIS(地理信息系統(tǒng))同時對文學(xué)史上朝代或流派之個案進(jìn)行精確、縝密的分析,定制時空資料后生成分析結(jié)果,推動了古典文學(xué)研究的跨越式發(fā)展[16]。李泉剖析數(shù)字人文與比較文學(xué)在學(xué)科生成、學(xué)科構(gòu)架、學(xué)科理念和學(xué)科前景四個方面的相似性,結(jié)合比較文學(xué)學(xué)科發(fā)展問題比照、反思數(shù)字人文學(xué)科理論建構(gòu)中存在的問題及解決對策[17]。李泉還對“數(shù)字文學(xué)”的理論框架進(jìn)展了整體構(gòu)想,從創(chuàng)作、傳播、教授和總體研究四個維度論及“數(shù)字”與“文學(xué)”的聯(lián)姻與結(jié)合[18]。2021年以來,關(guān)于數(shù)字人文切入文學(xué)各方向的研究成果還在不斷涌現(xiàn),具有很強(qiáng)的新穎度和原創(chuàng)性,為學(xué)者打開了嶄新的窗戶,開啟了很多思路。
學(xué)界引入數(shù)字人文從事“文學(xué)”研究已非個別案例,在文學(xué)多個分支展開,并取得了一定學(xué)術(shù)成就,積累了不少寶貴的經(jīng)驗。筆者長期從事古代文論核心元范疇研究[19],一直在思考如何引入數(shù)字人文到文論范疇研究中,從而突破現(xiàn)有的研究格局,以促進(jìn)學(xué)術(shù)創(chuàng)新。范疇研究歸屬于古代文學(xué)理論與批評,是文學(xué)的重要分支,引入數(shù)字人文對它展開研究,學(xué)理上是可行的。研究領(lǐng)域的不同,所采用的方法會有所不同。據(jù)當(dāng)前科技發(fā)展趨勢來看,今后更多的學(xué)科、領(lǐng)域均離不開數(shù)字化、數(shù)據(jù)庫,不同程度地借助于數(shù)字相關(guān)的軟件或工具,否則研究出新實屬不易。這體現(xiàn)了人工智能時代各學(xué)科與新興技術(shù)的血緣關(guān)聯(lián)。
自20世紀(jì)90年代開始,核心范疇研究長期受到學(xué)界的關(guān)注和青睞。學(xué)者們多角度多側(cè)面地展開研究,取得了一定的學(xué)術(shù)成就。先是蔡忠翔、鄧光東等前輩聯(lián)合眾多學(xué)者在百花洲文藝出版社出版了興、和、情、志、理、意境、雄渾等系列范疇,一個范疇一本專著,已陸續(xù)推出數(shù)十輯,在國內(nèi)產(chǎn)生了較大反響,其中意境、和等多種專著日后再版。其后,成復(fù)旺主編了《中國美學(xué)范疇辭典》(1995)、王振復(fù)主編了《中國美學(xué)范疇史》(2006)、楊星映等著《中國古代文論元范疇論析》(2015)、汪涌豪著《中國文學(xué)批評范疇十五講》(2010),從理論高度上剖析范疇的流變與交織,研究文論體系的建構(gòu)與特征,得到學(xué)界的好評[20]。進(jìn)入21世紀(jì),陳玉強(qiáng)、郭守運、程晶晶、鄧心強(qiáng)等大批中青年學(xué)者在范疇領(lǐng)地上繼續(xù)耕耘,先后有《中國審美心境范疇論》《中國美學(xué)“狂怪”范疇研究》《“遠(yuǎn)”范疇的審美空間》等范疇研究新成果問世。21世紀(jì)以來,系列成果或聚焦階段或從美學(xué)角度切入,學(xué)術(shù)局面被打開,極大地推進(jìn)了范疇研究的進(jìn)程。但范疇研究一直在傳統(tǒng)范式內(nèi)進(jìn)行,主要運用史料就范疇單詞釋義,從哲學(xué)淵源、文論轉(zhuǎn)化、內(nèi)涵演變、外延拓展、彌漫交織、創(chuàng)作關(guān)聯(lián)、審美蘊含等維度展開,形成了其相對固化的研究模式,至今未見有新的學(xué)術(shù)突破。
而數(shù)字人文作為一種新型研究范式,將為當(dāng)前文論范疇研究帶來新的生機(jī)?!皵?shù)字人文會給人文學(xué)科研究帶來新的學(xué)術(shù)思維、學(xué)術(shù)理念、學(xué)術(shù)方法、學(xué)術(shù)視野及學(xué)術(shù)形態(tài)。數(shù)據(jù)的海量聚合影響了人文學(xué)者觀察、思考問題的思路,催生了人文學(xué)科研究的新方法,更新了人文學(xué)科研究的研究范式。”[21]而這是傳統(tǒng)依靠史料、學(xué)者靠研讀文論來研究范疇所無法達(dá)到的。五十多年前,德國理論家韓秉珠(Byung-Chul Han)在新著《在蜂群中:數(shù)字前景》(2017)首頁中寫道:“這個新的媒體正在重新編程(re-programming)我們,而我們卻不能理解正在發(fā)生的范式大轉(zhuǎn)變。正是這個媒體在我們意識還朦朧的時候,改變我們的行為、感知、感覺、思考以及群體生活的方式?!盵22]足見數(shù)字媒體及相關(guān)技術(shù)的威力與魅力。數(shù)字人文以新的技術(shù)帶來研究路徑與手段的變革,在人文學(xué)科研究中具有廣闊的發(fā)展前景,就文論核心范疇研究而言,它促使國內(nèi)學(xué)者轉(zhuǎn)換思路,擁抱技術(shù),通過數(shù)字與平臺將使核心范疇研究獲得新的突破。
數(shù)字人文是以計算機(jī)運算所提供的工具如超文本、超媒體、圖像、文獻(xiàn)檢索、數(shù)據(jù)挖掘、統(tǒng)計等,使用數(shù)字化的資料或數(shù)字原生資料,結(jié)合傳統(tǒng)文史哲等學(xué)科開展的綜合性研究[10]79。它依托新興技術(shù)對既有人文學(xué)科進(jìn)行研究,是新文科建設(shè)過程中文、理相結(jié)合的典范,具有鮮明的跨界性與交叉性?!爱?dāng)前,有5種數(shù)字技術(shù)常被數(shù)字人文引入,一是量化分析,二是文本分析,三是(GIS)空間分析,四是社會網(wǎng)絡(luò)分析,五是知識組織技術(shù)。這些技術(shù)可靈活組配,支持豐富的數(shù)字人文研究?!盵23]10這些方法均基于互聯(lián)網(wǎng)和數(shù)據(jù)庫而來,不需貪多求全,應(yīng)據(jù)研究對象靈活而選擇性地采用。
古代美學(xué)和文論中,很多核心元范疇最初萌芽于先秦兩漢時期,主要存在于先秦典籍中,在政治和哲學(xué)層面上使用。漢魏時期伴隨著人的覺醒和文藝的全面發(fā)展,才逐漸過渡到文論領(lǐng)域中來,其內(nèi)涵與外延發(fā)生了多元變化。在歷代文論家的理論總結(jié)下,不斷地被賦予新的內(nèi)涵。傳統(tǒng)搜集和檢索古籍獲得范疇的早期使用情況,比較零碎且工作量浩大,所收集的樣本也很難齊整和全面。主要建構(gòu)在定性分析基礎(chǔ)上,對早期范疇的使用情況及具體內(nèi)涵予以闡釋。由于研究者資料掌握、學(xué)術(shù)背景、思維方式的不同,在定性分析中概括、歸納、提煉方面有所差別。
二十多年來,已有資源庫中先秦典籍也較豐富、完備,在大數(shù)據(jù)時代可被充分利用起來建立結(jié)構(gòu)化數(shù)據(jù)庫,以量化方式輔助定性分析,則可以考察任何一個古典文論元范疇——如氣、象、味、韻、勢、和、志等——均能通過數(shù)據(jù)庫將典籍中出現(xiàn)此范疇相關(guān)語句(使用情況)分類提取,能迅速通過聚合、比照到其早期含義。而采用“定量輔助定性研究,將社會科學(xué)的定量研究方法與人文科學(xué)的定性研究方法結(jié)合起來,對文學(xué)文本的既有信息進(jìn)行檢索、提煉和呈現(xiàn),并從多層面、多維度生成二次信息,提出新的問題,得出新的結(jié)論”[9]176。與定性研究先有理論假設(shè)再尋找證據(jù)進(jìn)行推理論證不同,定量分析是對大量基礎(chǔ)數(shù)據(jù)進(jìn)行統(tǒng)計分析基礎(chǔ)上進(jìn)行的,得出的認(rèn)識較為客觀,避免了定性分析過多地主觀色彩,它更具科學(xué)精神,在當(dāng)前社會科學(xué)領(lǐng)域廣泛使用,并被廣大人文科學(xué)學(xué)者所借鑒、移用?!岸炕陀嬎慊谴髷?shù)據(jù)環(huán)境下人文學(xué)科數(shù)字人文研究的主要實現(xiàn)的思路與特征?!盵21]66在輸入相關(guān)詞匯或要求后,數(shù)字工具和平臺據(jù)建模要素迅速提取該范疇的詞頻、特征,并制成量表,通過數(shù)字、圖表來全網(wǎng)絡(luò)地呈現(xiàn)該關(guān)鍵詞在先秦典籍中的使用,從中管窺元范疇如何從本義走向引申義,并逐漸泛化及向文論滲透和過渡的過程。相比帶有理論假設(shè)的定性分析,輔以定量分析的數(shù)字人文研究介入“象”范疇研究,將有助于深入挖掘歷代“象”的隱性模式,發(fā)現(xiàn)定性方法根本無法發(fā)現(xiàn)的問題或得出具有創(chuàng)新性的研究結(jié)論[7]195。
數(shù)字人文作為一種全新的研究范式,幾乎成為人文社科研究史上的分水嶺。它以數(shù)字構(gòu)成、數(shù)字傳播的方式迥異于暢行了數(shù)千年之久的傳統(tǒng)紙媒閱讀和研究。此前研究文論的核心范疇,主要靠對文本線性的“細(xì)讀”來進(jìn)行,認(rèn)真研讀某一種典籍或某些史料(限于人力),對范疇進(jìn)行理論總結(jié)、探究范疇的內(nèi)涵演進(jìn)與外延拓展、范疇集群的形成及交織彌漫等,均靠研究者的文本分析和邏輯推導(dǎo),從中提煉和歸納問題,并依據(jù)獨立思考來撰寫和研究?!把芯空咄P(guān)注單一文學(xué)文本中少見而非泛在的寫作模式,深蘊而非淺顯的信息,更多地聚焦文學(xué)文本的差異性而非普遍性?!盵9]177即線性細(xì)讀模式下,獨特的發(fā)現(xiàn)、文本的差異、范疇蘊含的不同往往更容易被關(guān)注,而大數(shù)據(jù)時代的超文本有著獨特的信息生產(chǎn)和組合方式,“遠(yuǎn)讀”跨越一般到普遍,從諸多古代典籍和文論著作中將該范疇的使用聚類成為數(shù)據(jù),關(guān)注的是海量文獻(xiàn)基礎(chǔ)上的“共性”,大規(guī)模文學(xué)樣本數(shù)據(jù)之上的“規(guī)律”,它能克服研究者的個體認(rèn)知和閱讀局限,而這恰恰是人工智能時代平臺信息計算的優(yōu)勢所在?!斑h(yuǎn)讀模式所關(guān)注的文學(xué)文本的數(shù)據(jù)是散點的,而不是聚焦的,它的視覺效果是馬賽克式的,非遠(yuǎn)觀而不能窺其全景。”[9]177-178顯然,針對大規(guī)模超文本的“遠(yuǎn)讀”將極大地改變核心范疇的現(xiàn)有研究范式。
此前研究文論核心范疇是研究者基于文獻(xiàn)研讀和理解并結(jié)合大量語境進(jìn)行的理論詮釋,從而使范疇發(fā)展過程中豐富、多元而變動的內(nèi)涵呈現(xiàn)出來。總體上,是受現(xiàn)代西方學(xué)科話語體系和實證方法的影響,通過歷史還原、文獻(xiàn)考釋、文本釋義使原本在古代文論著作中模糊使用的范疇變得清晰和具體起來。在古典文論和美學(xué)中,任何一個核心范疇都經(jīng)歷了上千年的發(fā)展演進(jìn)歷程,在文學(xué)、藝術(shù)乃至文化的長河中浸染過,采用文本闡釋都能將之化為一部概念史的大書,至今出版的《歸趣難求——中國古代文論“趣”范疇研究》《中國美學(xué)“狂怪”范疇研究》等,每本上百頁、一詞數(shù)十萬字,均是史料基礎(chǔ)上文本闡釋的結(jié)晶。
而基于現(xiàn)代數(shù)字傳播和大數(shù)據(jù)技術(shù)形成的文本挖掘,相比研究者的文本闡釋具有無比強(qiáng)大的功能。在建立了不同文本的語料庫后,以統(tǒng)計分析的方式就典籍中某個詞匯、意象的使用與特質(zhì),就某個朝代或階段文學(xué)創(chuàng)作體現(xiàn)該范疇的創(chuàng)作實踐等,以數(shù)據(jù)聚類或打包的方式清晰地展現(xiàn)出來。文本挖掘(Text mining)不僅是數(shù)字人文的核心概念,也是一種主要的操作方法。它“是指為了發(fā)現(xiàn)知識,從文本數(shù)據(jù)中抽取隱含的、以前未知的、潛在有用的模式的過程。它是一個分析文本數(shù)據(jù),抽取文本信息,進(jìn)而發(fā)現(xiàn)文本知識的過程。這里的知識包括各種模式、模型、規(guī)則或趨勢等”[24]。“文本挖掘最常用的技術(shù),包括詞頻統(tǒng)計、特征提取、結(jié)構(gòu)分析、文本摘要、文本分類、主題模型、關(guān)聯(lián)分析等?!盵2]6這里所謂詞頻統(tǒng)計、結(jié)構(gòu)分析,實則與量化分析相關(guān)聯(lián)。所謂模型、趨勢,是在海量數(shù)據(jù)基礎(chǔ)上共建起來的。傳統(tǒng)研究文論范疇的模式,是較微觀和動態(tài)地考察其內(nèi)涵變遷、如何衍生子范疇并形成范疇群落,而文本挖掘則在提取大量數(shù)據(jù)后分析范疇發(fā)展與創(chuàng)作實踐之間的常見模型,及核心范疇與其他范疇交叉、滲透的幾種主要趨勢,乃至范疇被文論家理論歸納和總結(jié)的類型,都可通過文本挖掘來獲得。
日新月異的技術(shù)正改變著人們的生活方式,也注定會影響學(xué)術(shù)研究的思路與格局。將數(shù)字人文引入文學(xué)研究,才是近年來的事情,在一批敏銳學(xué)者的嘗試下,炙手可熱,遂逐漸成為學(xué)術(shù)前沿。而將之切入文論核心范疇之研究,則更屬新鮮了。作為一項“前無古人”的探索,我們并未有多少經(jīng)驗可借鑒,但作為一種主流趨勢,我們對數(shù)字人文深入文學(xué)學(xué)科展開各領(lǐng)域、各方向、各話題的研究前景,是一致看好的。盡管數(shù)字人文自產(chǎn)生以來,一致面對著不同的聲音和爭鳴,但它的實踐領(lǐng)域正在逐步擴(kuò)大,生命勢頭強(qiáng)勁,以之切入文論核心范疇研究,有眾多層面值得我們審視和反思。
大量專題數(shù)據(jù)庫的建設(shè),是從事數(shù)字人文研究的前提。數(shù)據(jù)庫越豐富、越全面、越準(zhǔn)確,將極大地提高研究的成效。古代文學(xué)理論與批評學(xué)科,像古代文學(xué)一樣也是一個老學(xué)科,二者在傳統(tǒng)社會并轡齊行,然而文論領(lǐng)域?qū)W者對技術(shù)的敏銳度不及古代文學(xué)界,對數(shù)字人文的使用也遲緩很多,所建資源科相比古代文學(xué)史,也要遜色很多。古代文論作為有百余年歷史的老學(xué)科,在郭紹虞、朱東潤、羅根澤、王運熙等諸多前輩的努力下,編選的各類資料異常豐富,無論是歷代主要文史典籍還是古代文論論著原文,很多已經(jīng)以電子形式存在并被讀者在研究中不斷檢索和利用,如《中國歷代文論選》(四卷本)、《中國古典文學(xué)理論批評專著選輯》(數(shù)十種)、《中國古典戲曲論著集成》[25]、《中國古代文藝?yán)碚搶n}資料叢刊》(全四冊)等,但這些都需要有意識地整合成結(jié)構(gòu)化的專題數(shù)據(jù)庫,才能真正走上“數(shù)字人文”研究的康莊大道,讓文論插上“數(shù)字”的翅膀。
我們認(rèn)為,鑒于古代文學(xué)和文論在學(xué)術(shù)上有血緣關(guān)聯(lián),當(dāng)前古代文學(xué)方面的數(shù)據(jù)有些可充分利用,如北京大學(xué)《全唐詩分析系統(tǒng)》《全宋詩分析系統(tǒng)》、中南民族大學(xué)《唐宋文學(xué)編年地圖平臺》等,這可有效避免古文論研究人手不夠、團(tuán)隊力量不強(qiáng)、條件不具備等種種弊病,實現(xiàn)文論數(shù)據(jù)庫與文學(xué)數(shù)據(jù)庫的共享及匯通。況且以大數(shù)據(jù)方式研究文論核心范疇,離不開對文學(xué)創(chuàng)作的積累和觀照,很多范疇的產(chǎn)生與創(chuàng)作實踐有著密切的關(guān)聯(lián)[26][27]。此外,在文論界已深入研究范疇四十余年的今天,還有兩類數(shù)據(jù)有待建設(shè):一是四十年各類范疇、關(guān)鍵詞研究的論文和著作目錄集成;二是四十年與文論范疇有關(guān)的重要立項成果。這將便于今人做范疇研究有新穎度,以及文獻(xiàn)綜述時通過數(shù)據(jù)提取和分類來研究范疇的成就與趨勢。再者,對各類數(shù)據(jù)庫和平臺,學(xué)術(shù)界要加大宣傳與推廣,在高校辦數(shù)字人文專業(yè)和設(shè)置相關(guān)課程時,多進(jìn)行宣傳,在不斷實踐中調(diào)整數(shù)據(jù)模型的建構(gòu)。劉芮在分析歐美數(shù)字人文教育后,指出當(dāng)前我國人文科學(xué)缺乏數(shù)字技術(shù)等課程設(shè)置。在優(yōu)化課程過程中,要將數(shù)據(jù)與技術(shù)思維融入教學(xué)中去[28]。徐孝娟等人也梳理、比照了國外數(shù)字人文專業(yè)課程開設(shè)后,對我國數(shù)字人文課程設(shè)置和人才培養(yǎng)提出了諸多建設(shè)性意見,認(rèn)為數(shù)字方法、技術(shù)的教學(xué)是重點[29]。這都是引入數(shù)字人文到核心范疇研究中急需補(bǔ)課的地方。
2018年劉煒、葉鷹認(rèn)為數(shù)字人文的本質(zhì)是方法與工具的變革,是一個“方法論的共同體”,研究人員既要熟知人文科學(xué)及其各分支學(xué)科的研究方法和一般規(guī)律,又要具備數(shù)據(jù)科學(xué)的應(yīng)用能力[30]。固然數(shù)字的技術(shù)、工具和媒介為人文學(xué)科的研究帶來新鮮血液,將極大地推動不同領(lǐng)域的學(xué)術(shù)創(chuàng)新,然而圍繞數(shù)字展開的技術(shù)、平臺,需要專門從事計算機(jī)技能的研究人員研發(fā),“我國數(shù)字人文研究因文本與語言的特殊性,要求基礎(chǔ)技術(shù)、數(shù)據(jù)庫和專業(yè)軟件的研發(fā)必須匹配中文語境,由此便構(gòu)成了漢字的多義性與機(jī)器分析的單一化、已知與未知、已行與未行之間錯綜交織的技術(shù)開發(fā)困境”[31]。而解決此種問題尚需要多學(xué)科人員聯(lián)合攻關(guān)。學(xué)者指出:“人文學(xué)科與信息科學(xué)的研究者之間最大的問題是‘互盲’。一方面,多數(shù)人文學(xué)者缺乏必要的數(shù)字技術(shù)基礎(chǔ),不可能參與到探索底層數(shù)據(jù)庫、系統(tǒng)數(shù)據(jù)流、跨平臺數(shù)據(jù)及其體系結(jié)構(gòu),還有應(yīng)用編程接口(APD)、移動視覺搜索(MVS)等相關(guān)技術(shù)和問題。”[2]3在數(shù)據(jù)庫建成后,從事核心范疇研究的學(xué)者對數(shù)字人文的操作技術(shù)要熟練,這需要學(xué)者參加相關(guān)培訓(xùn)或課程學(xué)習(xí),增強(qiáng)數(shù)字意識,培養(yǎng)數(shù)字敏感,熟悉文本挖掘、可視化分析、地理網(wǎng)絡(luò)信息系統(tǒng)的相關(guān)技術(shù)運用。在新文科建設(shè)時期,從事范疇研究的學(xué)者尤其需要有跨學(xué)科素養(yǎng)。
數(shù)字人文研究并非新事物,但它的確是新范式、新方法,對人文學(xué)科研究有著巨大的魅力和沖擊力。研究人員在提升技術(shù)素養(yǎng)的同時,也要尋求人文和數(shù)字的平衡。人文精神和工具理性的差異及其博弈,已為學(xué)界熟知。張耀銘指出過度依賴技術(shù)容易陷入倫理困境:“對數(shù)據(jù)的過度依賴,對算法的過度崇拜,造成數(shù)字人文研究人文屬性被輾軋而變得異常平庸化。重圖像、重制作、重編碼、重量化,輕文字、輕闡釋、輕洞察、輕思想,似乎已經(jīng)成為數(shù)字人文研究的一股潮流。這需要高度警惕,也需要批判反思。數(shù)字人文不是在技術(shù)祭壇上犧牲人文,而是數(shù)字與人文的融合發(fā)展。在兩者之間的融合發(fā)展中,技術(shù)只是工具和方法,人文才是靈魂和根本?!盵2]3一針見血地指出了數(shù)字人文引入人文學(xué)科已經(jīng)和可能存在的種種問題,當(dāng)文論研究者倚重網(wǎng)絡(luò)技術(shù)和新軟件、平臺,忽視了自身理論素養(yǎng)的提升,忽視了研究過程中人文精神的發(fā)揚,則極易踏入技術(shù)的陷阱、掉進(jìn)數(shù)字的牢籠而“樂不思蜀”。眾多學(xué)者都對數(shù)字技術(shù)化有可能侵蝕人文學(xué)科固有的人文精神表示擔(dān)憂[6],尤其是數(shù)字人文介入文論范疇研究后,學(xué)者沉迷于數(shù)字分析,而擱置理性思辨和批評質(zhì)疑能力之提升,使分析在冷冰冰的數(shù)字中進(jìn)行而喪失了人文學(xué)科應(yīng)有的溫度,對人的關(guān)懷及價值的肯定?!叭宋膶W(xué)科本身的問題意識、思辨模式、人文關(guān)懷、價值體系等影響著數(shù)字人文研究中的資源選擇、知識單元的標(biāo)引、研究問題的提出、模型的構(gòu)建,尤其影響數(shù)字人文計算結(jié)果的解釋和新知識的發(fā)現(xiàn),以及學(xué)術(shù)界對數(shù)字人文成果的最終評價?!盵23]9由此看出,數(shù)字和技術(shù)固然重要,但操作它們的人更為重要。在數(shù)字人文切入文論范疇研究中,對古典范疇體現(xiàn)出的古人的審美趣味、價值觀念、思維方式要有獨特的體認(rèn)和深刻的揭橥,忌諱沉湎于數(shù)字、填表中失去了人文關(guān)懷。
隨著新興技術(shù)的不斷滲透與使用,以及數(shù)字人文向多領(lǐng)域的轉(zhuǎn)移,研究經(jīng)驗不斷積累,人們主動、自覺運用數(shù)字人文展開文學(xué)研究的意識將更加強(qiáng)烈。近年來學(xué)界對逸、神、象、遠(yuǎn)、真、含蓄、雄渾等文論核心范疇的研究在如火如荼地展開,但基本上在傳統(tǒng)基于文獻(xiàn)而闡釋的老路子上行走。以數(shù)字人文研究文論核心范疇,無疑在當(dāng)前古代文論研究中具有先鋒性和前瞻性。由于經(jīng)驗的缺乏、思考不盡圓融,這種探究尚在路上,需要與其他學(xué)科進(jìn)行交叉研究,要在提升研究人員技術(shù)素養(yǎng)、建立和使用多種結(jié)構(gòu)化數(shù)據(jù)庫、平衡數(shù)據(jù)和提升人文精神等方面多著力。