陳大康
(華東師范大學 中文系,上海 200241)
統(tǒng)計學是研究如何搜集、整理資料和進行數(shù)量分析、推斷的綜合性科學,它根據(jù)特定問題設置指標,將眾多現(xiàn)象抽象為數(shù)字,并有針對性地設計數(shù)學模型來處理數(shù)據(jù),勾勒研究對象的行進軌跡,歸納其間的規(guī)律,以及展現(xiàn)非如此處理就難以觀察到現(xiàn)象。各種文學現(xiàn)象可抽象為數(shù)字,不同層次、側面或選取不同指標的統(tǒng)計,可得到容量可觀的數(shù)據(jù)體系,而面對大范圍或大數(shù)量事物數(shù),統(tǒng)計更有便于人們把握全體、描繪態(tài)勢、勾勒走向與顯示特征等獨特優(yōu)勢。
清代小說研究中,順治、康熙與雍正三朝歷來視為一個歷史階段,并認為此時間段里創(chuàng)作發(fā)展比較均衡平穩(wěn)??墒沁@90年里,(1)清軍占領小說主要創(chuàng)作與刊行地江浙一帶是順治二年(1645),此處所言90年,是指順治三年至雍正十三年(1735)。政治局勢與社會氛圍前后截然不同。前期戰(zhàn)亂頻仍,自然災害接連發(fā)生,直到康熙三十年(1891)左右社會才逐漸穩(wěn)定。其后凋敝的經濟逐漸恢復,經過約半個世紀發(fā)展,才迎來了乾隆盛世。將通俗小說按清初前、后期作統(tǒng)計,可發(fā)現(xiàn)其態(tài)勢完全不同:
前期的通俗小說幾為后期的五倍,即使將“時間不明”的20種都歸入后期,仍不及前期數(shù)量一半。數(shù)據(jù)揭示了先前未曾發(fā)現(xiàn)的事實:小說創(chuàng)作在戰(zhàn)亂動蕩的前期相當繁榮,在社會趨于穩(wěn)定、經濟逐漸恢復的后期反而是跌入蕭條。數(shù)據(jù)本身無法解釋為何會有如此之大的落差,但根據(jù)它的提示分段考察當時影響創(chuàng)作的實際情況,卻可有新的收獲。
前期的社會大動蕩迫使作家們直面現(xiàn)實生活, 同時也為創(chuàng)作提供了極為豐富、生動的素材,鼎革之變還為創(chuàng)作增添了兩類作家:一是不愿臣服新朝的遺民,陳忱創(chuàng)作是為了表達“肝腸如雪,意氣如云,秉志忠貞,不甘阿附”(《水滸后傳序》)的志向,寄托對權奸貴宦之憤與亡國孤臣之恨;寉市道人憤于變節(jié)求榮者的無恥,“摘所詳憶一事,迅筆直書”,寫才子佳人在“敵人分道南侵”之際立功的故事(《醒風流傳奇序》);七峰樵道人則在《海角遺編》中點名斥責錢謙益變節(jié)并揭露清軍的兇殘暴虐。沒有徹骨的亡國慘痛,他們未必會寫小說,而借助這行世廣遠的文體, 可在最大范圍內宣傳民族大義與表達愛國情操。另一類是原本向往乘時顯達的文人, 他們因美夢被戰(zhàn)亂粉碎而轉向創(chuàng)作。煙水散人痛于明亡而創(chuàng)作燕、齊兩國復國的《后七國樂田演義》,天花藏主人則有“女真雖興宋不亡,江山傾紀忠臣整”(《后水滸傳序》)的耿耿忠懷。他們創(chuàng)作含有自娛或擺脫謀食方艱困境的動因,但畢竟抒寫了對生活的感受,“凡紙上之可喜可驚,皆胸中之欲歌欲哭”,并又“借烏有先生以發(fā)泄其黃粱事業(yè)”(《平山冷燕序》),讓筆下主人公實現(xiàn)自己已付諸流水的向往與追求。沸騰劇變的現(xiàn)實是那些作家創(chuàng)作的大背景,封建統(tǒng)治者的腐敗貪酷與荒淫昏庸、為富不仁者的巧取豪奪與橫行霸道、儒林人物的投機鉆營與為虎作悵,以及下層勞動者的機智勇敢與高尚品格, 這些無不現(xiàn)身紙上,許多作品還直接描寫了眼前戰(zhàn)亂給人民帶來的苦難,這些內容構成了當時創(chuàng)作貼近現(xiàn)實的特點。
可是在社會安定的后期,文人們思想在封建正統(tǒng)教育禁錮下形成,對先前天下大亂至多只有依稀印象。他們熱衷科舉而不屑于創(chuàng)作,即使作小說者如石成金,也視此為“不獨并無學問,而且傷風敗俗,搖惑人心”的末等書,(2)石成金:《人事通》,鄭州:中州古籍出版社,2002年。他寫小說只是為了“曉示愚蒙”(袁載錫《雨花香序》),宣揚教化,而前期作家將小說與經傳并列,“終不敢以稗史為末技”(睡鄉(xiāng)祭酒《十二樓序》),甚至認為可“驚天動地,流傳天下,傳訓千古”。(3)佩蘅子:《吳江雪》第九回《小姐密傳心事,雪婆巧改家書》,《古本小說集成》第四輯,上海:上海古籍出版社,1994年。官方的打擊使小說地位在后期急速跌落,當時它被羅織了兩大罪狀:“宣淫誨詐,備極穢裊,汗人耳目”(4)湯斌:《湯子遺書》卷九《嚴禁私刻淫邪小說戲文告諭》,北京:人民出版社,2016年。,以及“其小者甘效傾險之輩,其甚者漸肆狂悖之詞”(5)琴川居士:《皇清奏議》卷二十二,引自王利器:《元明清三代禁毀小說戲曲史料》,上海:上海古籍出版社,1981年。??滴醯圻€親自批評小說“敗壞風俗,蠱惑人心”,(6)《大清圣祖仁皇帝實錄》卷一百二十九,北京:中華書局,2008年。下令嚴禁。一次次禁毀來勢兇猛,威懾影響前所未有,這是后期創(chuàng)作蕭條的重要原因。
上述誤判源于時間段劃分欠妥,有時產生誤判則是因為只顧及一點而未考慮周邊情況,或是僅靜態(tài)考察而未觀察其發(fā)展變化,如因某幾篇“多羼入詩詞。其甚者連篇累牘,觸目皆是,幾若以詩為骨干,而第以散文聯(lián)絡之者”,便將明代中篇傳奇判為“以詩與文拼合”的“詩文小說”。(7)孫楷第:《日本東京所見小說書目》卷六“明清部五”,北京:人民文學出版社,1981年。統(tǒng)計可核驗這一直被沿用的結論,下表中詩文篇幅占比與千字含詩詞數(shù)指標顯示了詩文羼入程度:
表二 明代中篇傳奇詩文羼入一覽表
(續(xù)表)
《鐘情麗集》與《龍會蘭池錄》詩文羼入篇幅都過半,《懷春雅集》的占比也超過40%,均可稱為“詩文小說”。不過這是中篇傳奇詩文占比上升的峰值,其后則呈下降態(tài)勢,除《金蘭四友傳》等三篇為30%外,余多為20%左右,而《傳奇雅集》只有6%,《癡婆子傳》更是跌至0.26%。以占比最高者為樣本,不顧其后詩文羼入占比進入下降通道的事實,將中篇傳奇都稱為“詩文小說”顯然不妥。而且,詩文羼入占比高的現(xiàn)象并非中篇傳奇所獨有,明初瞿佑的《剪燈新話》首開高比例羼入詩文的風氣,書中某些篇章占比相當高:
表三 《剪燈新話》部分篇章詩文羼入一覽表
書中這五篇詩文占比超過30%,另有七篇雖含詩文,但數(shù)量較少,而《三山福地志》等九篇無任何詩文插入。不過,瞿佑高比例羼入的格式頗為文士們賞識與效仿,隨后李昌祺《剪燈余話》收作品二十一篇,無一沒有詩文羼入,占比超過30%者已達十篇,有三篇竟超過50%:
表四 《剪燈余話》部分篇章詩文羼入一覽表
全書共60,827字,詩文羼入卻有17,424字,約占30%,書中含詩詞共有206首,已可集為詩集,篇幅與之相當?shù)摹都魺粜略挕匪娫~為70首。瞿祐首開先例,李昌祺又將這種樣式推至極端。
上兩部作品對后來創(chuàng)作影響極大,百年后陶輔創(chuàng)作《花影集》時就聲明,其“吐心葩,結精蘊”是效法瞿佑與李昌祺(《花影集引》),若無與時尚相適應的創(chuàng)作觀為支撐,他不會如此選擇。該書也以多羼入詩文為重要表現(xiàn)手法,有些作品羼入程度還超過了一般的中篇傳奇:
當時通俗小說創(chuàng)作中也常見多羼入詩文的手法,《西游記》第一回羼入詩詞18首,共1,211字,占比22.14%;《封神演義》第一回羼入詩詞7首,文1篇,共820字,占比26.60%。熊大木撰寫《大宋演義中興英烈傳》時以“岳王著述”為題寫道:“以王平昔所作文跡,遇演義中可參入者,即表而出之”,另又鑲嵌了許多詔旨、奏章、書信之類,書中某些章節(jié)已越出小說體例。其時話本創(chuàng)作亦是如此,《風月相思》中插入詩詞30首,文1篇,篇幅約占全文4,766字的38%,而后來早期擬話本創(chuàng)作,因承襲話本多征引詩詞手法,羼入占比也相當高。
總之,羼入詩文是當時創(chuàng)作的一種時尚,并非僅是中篇傳奇,而且自《鐘情麗集》之后,該流派羼入占比已在下降。萬歷中期以后中篇傳奇基本已無新作問世,但詩文羼入占比減少的趨勢仍在其他創(chuàng)作中繼續(xù)。到了清初,多羼入詩文現(xiàn)象已基本絕跡。即使以詩詞唱和為重要情節(jié)的才子佳人小說,千字所含詩詞一般也只是一首左右。綜合上述統(tǒng)計可知,命名中篇傳奇為“詩文小說”實不恰當。
對晚清傅蘭雅征集“時新小說”活動的統(tǒng)計,同樣也是糾正誤判的例證。光緒二十一年(1895)五月,英國傳教士傅蘭雅征集以消除鴉片、時文與纏足三大弊端為題材的小說,美國學者韓南率先稱此事為近代“新小說”先聲,并認為它“的確在某種程度上影響了晚清小說的總體方向”(8)韓南:《中國近代小說的興起》,上海:上海教育出版社,2004年。,一些國內學者也紛紛呼應。作出這一判斷時,誰也沒見過那些征集稿件;而且它們也從未發(fā)表,所謂“影響”晚清小說發(fā)展只是憑空想象。162篇征集稿中的150篇于2006年被發(fā)現(xiàn),征文活動的基本面目已可知曉,學界評價卻一仍其舊,或稱“激發(fā)了晚清小說變革的端緒”,“拉開了晚清新小說創(chuàng)作的序幕”(9)劉琦:《晚清“新小說”之先聲》,《北華大學學報》2012年第3期。,或云“啟發(fā)了晚清小說乃至譴責小說的發(fā)展方向”(10)許軍:《傅蘭雅小說征文目的考》,《山西師大學報》2012年第1期。,甚至“促成了中國現(xiàn)代小說的萌芽”(11)周欣平:《清末時新小說集序》,《清末時新小說集》第一冊,上海:上海古籍出版社,2011年。??墒悄切└寮H三分之一為小說,內容形式均與傳統(tǒng)小說無異,傅蘭雅甚至批評它們“仍不失淫詞小說之故套”(12)傅蘭雅:《時新小說出案》,光緒二十二年二月初五日《萬國公報》第八十六冊。。
翻閱那些稿件,濃厚的宗教氣息撲面而來。傅蘭雅要求針對鴉片、時文與纏足“撰著新趣小說,合顯此三事之大害,并祛各弊之妙法”(13)傅蘭雅:《求著時新小說啟》,光緒二十一年五月初二日《申報》。,可是他看到的卻是“要食救主魚餅,不吸毒煙鴉片;要讀圣神《書》、《約》,不尚虛假時文;要學夏娃大腳,不可愛小纏足”(14)毛芝生:《戒鴉片時文纏足小說》,《清末時新小說集》第十四冊,上海:上海古籍出版社,2011年。之類。應征者連篇累牘地頌揚上帝,將這次活動當作向教會表忠心的機會。下面是對那些來稿的統(tǒng)計:
約三分之二應征稿熱烈贊美天主,相關文字也證明教會在從中組織。莆田宋永泉“仿《天路歷程》寓意之例”(15)宋永泉:《啟蒙志要》,《清末時新小說集》第八冊,上海:上海古籍出版社,2011年。應征是看到福建教會《會報》的啟事;濟南府李鳳祺是“適有友人在浸禮會抄示題紙”(16)李鳳祺:《無名小說》所附信函,《清末時新小說集》第八冊,上海:上海古籍出版社,2011年。,這是教徒們輾轉相告教會發(fā)布的消息;青州府張德祥則云:“余方看《新約》一書,忽有人送題到,上有三題,命作時新小說?!?17)張德祥:《鴨(鴉)片、時文、纏足》,《清末時新小說集》第十四冊,上海:上海古籍出版社,2011年。上門送啟事,當?shù)亟虝ぷ骺芍^細致周到,“命作”則點明這是布置作業(yè)。孝感縣福音會堂是來稿大戶,該堂陶牧師還親到上海傅蘭雅處送稿,統(tǒng)一的稿紙與信封,連題目都一律為《鴉片時文纏足小說》。傅蘭雅在英文《教務雜志》的《有獎中文小說》中指出,征文活動依賴“在華各個傳教士機構的牧師”,以保證“用基督教語氣而不是單單用倫理語氣寫作的小說”(18)據(jù)周欣平:《清末時新小說集序》,《清末時新小說集》第一冊,上海:上海古籍出版社,2011年。。征文從開始就帶有濃重的宗教色彩,且來稿只有三分之一符合小說體例,宗教意義明顯大于文學意義,與后來的“新小說”更毫不相干。
認為晚清小說發(fā)展都在梁啟超“小說界革命”主張籠罩之下也是一種誤判。小說地位提升,作品數(shù)量爆炸式增長,這確是梁啟超倡導的效應。但他主張的關鍵是小說為政治服務,鼓動大眾擁護維新變法,故有“政治小說為功最高焉”(《譯印政治小說序》)之語??墒瞧浜笳涡≌f僅31種,只占總數(shù)0.59%,足證呼應者寡,而且那些描寫直露、偏于政治吶喊的作品被批評為“開口便見喉嚨”,“于小說體裁多不合也”(19)公奴(夏頌萊):《金陵賣書記》,張靜廬輯《中國現(xiàn)代出版史料(甲編)》,上海:上海書店出版社,2011年。,批評矛頭甚至直指梁啟超:“今言小說者,莫不多立名色,強比附于正大之名,謂足以益世道人心,為治化之助。說始于《論小說與群治之關系》一篇。”(20)獨應(周作人):《論文章之意義暨其使命因及中國近時論文之失》,光緒三十四年五月初七日《河南》第五期。當時偵探、言情小說最受歡迎,政治小說幾無人問津,書局為生存與發(fā)展,將迎合讀者閱讀意向列為經營的第一要素。事實偏離了梁啟超的預想,這又是必然的,因為主宰小說出版與傳播的是市場,而不是什么政治號召。
有些文學現(xiàn)象涉及對象眾多,頭緒撲朔迷離,難以厘清其間規(guī)律與變化趨勢,如近代小說在七十二年間就完成了古代小說到現(xiàn)代小說的轉換,其間作品題材、作家成分與傳播方式都發(fā)生了巨大變化,情況繁雜遠超以往。此時借助統(tǒng)計有助于框定那紛紜繁雜、把握不易的變化狀況與趨勢,勾勒其運動軌跡與規(guī)律。
表七 近代小說出版一覽表
(續(xù)表)
道光二十年(1840)至同治十三年(1874)的三十五年,是古代小說的慣性延續(xù),單行本小說年出2至3種,出版方式如同以往,報刊小說則在同治末剛開始出現(xiàn)。光緒元年(1875)到二十年小說觀及創(chuàng)作格局無較大變化,小說數(shù)量稍有增長。同時,印刷業(yè)開始近代化改造,從西方引進的先進印刷設備與技術逐漸占據(jù)主導地位,為其后小說迅猛發(fā)展提供了物質基礎。光緒二十一年(1895)至二十八年間,甲午戰(zhàn)敗、戊戌變法與庚子國變先后發(fā)生,小說單行本與報刊小說數(shù)量受時局急劇動蕩刺激明顯增加?!靶≌f界革命”使光緒二十九年(1903)小說單行本與報刊小說都出現(xiàn)跳躍式增長,光緒三十二年(1906)又一次猛增,這是人們小說觀改變后的普漲。此后,出版數(shù)量基本處于穩(wěn)定狀態(tài),表明影響小說發(fā)展各因素關系進入相對平衡階段。
小說單行本與報刊小說的發(fā)展態(tài)勢基本吻合,由此可看出近代小說發(fā)展的總趨勢,但表中也有兩處相異:報刊小說在光緒三十四年(1908)明顯增長,小說單行本卻變化不大;小說單行本在宣統(tǒng)朝呈下降態(tài)勢,報刊小說卻在繼續(xù)攀升。新的報刊不斷涌現(xiàn)以及翻譯小說單行本的變化是造成差異的主要原因:
表八 近代翻譯小說出版一覽表(21) 只統(tǒng)計新出翻譯小說,報刊登載后出版單行本者未統(tǒng)計在內。
翻譯小說單行本出版在光緒三十三年到達頂峰,其后迅速銳減,這是以往未曾意識到的重要現(xiàn)象。其實,翻譯小說出版到達頂峰時,營銷者已覺察到讀者熱情的衰退:“向之三月而易版者,今則遲以五月;初刊以三千者,今則減損及半”(22)徐念慈:《丁未年小說界發(fā)行書目調查表引言》,光緒三十四年二月《小說林》第九期。;“新譯者歲有增加,而購書者之總數(shù),日益見絀”(23)觚庵:《觚庵漫筆》,光緒三十三年十二月《小說林》第七期。,而這是由譯者與書局追求快速牟利所造成。《巴黎茶花女遺事》與福爾摩斯探案等介紹到中國后很快引起強烈反響,書局急于抓住商機又苦于譯稿不多,便愿以高價收購,為逐利“爭譯泰西各種小說”(24)陳春生:《再版自序》,載《五更鐘》,上海:美華書館,光緒三十三年。,催生了粗率風氣。譯者隊伍驟然擴充,“甚至學堂生徒,不專心肄業(yè),而私譯小說”(25)新庵(周桂笙):《說小說·海底漫游記》,光緒三十三年三月十五日《月月小說》第一年第七號。;“淺嘗之士,每未能融會書意,涂乙一二聯(lián)絡詞,鹵莽卒事,甚者且競騖牟謀為速,是尚不暇問于義之安否,馴致所譯之書格格不堪卒讀。”(26)開明書店:《群誼譯社廣告》,光緒二十九年正月十六日《大陸》第三號。翻譯小說出版高潮在此背景下形成,可是上過當?shù)淖x者很快覺悟,出版數(shù)量也就迅速隨之下降。讀者并沒有拒絕翻譯小說,經他們篩濾出的杰作還在不斷再版。讀者是閱讀市場上最強大的力量,其共同選擇迫使翻譯小說出版的虛火消退,重回正軌。
上表還揭示了一個事實:翻譯小說單行本出版及變化主要發(fā)生于上海,商務印書館與小說林社為其重鎮(zhèn)。當時上海近代化程度最高,對外交流發(fā)達,獲取海外書籍與報刊易于其他地區(qū),譯者也多集中于此;這里又書局林立,出版較易。同時,各地都出現(xiàn)不少也刊載翻譯小說的報刊,因此這類作品聚集于上海的程度便略低于單行本,下以日報所載為例:
表九 近代日報小說地域分布表(27) 未計海外日報小說?,F(xiàn)知海外日報小說共609種(自著577種,翻譯32種),其中轉載占不小比例。
上表同時又展現(xiàn)日報自著小說的地域分布,上海約占60%,若再扣除京津與粵港地區(qū),其他各地總和僅占二成,自“小說界革命”以降,整個近代小說產出的格局即是如此。根據(jù)研究需要還可設定不同的指標作統(tǒng)計,這樣通過若干統(tǒng)計表就基本把握了近代小說整體格局,了解其走向及重要變化,在隨后的研究中就可心中有數(shù),不致于發(fā)生大的偏移。
研究涉及的對象越繁雜,統(tǒng)計就更可展現(xiàn)其優(yōu)越性。數(shù)十年來明清小說研究論文數(shù)以萬計,對全局把握與趨勢估價難免會出現(xiàn)分歧,這不僅是因為各人觀察切入點與層次不同,更重要的是缺乏共同的客觀基礎,而這恰可由統(tǒng)計提供。操作時先分解為明、清兩塊,它們各自又分為通俗小說與文言小說,分別統(tǒng)計后再綜合為一個整體:
表十 1950~2000年明代通俗小說研究論文分布表(28) “三言二拍”常被作為一個整體研究,故表中歸為一類。以下考察也有類似情況,不另作說明。
“四大奇書”是研究熱點,相關論文6,183篇,占比87.99%,其中《水滸傳》更達2,748篇;“其他作品”雖包含小說百余種,可是相關論文僅256篇,占比3.64%,即相當大一部分作品未受關注,甚至未進入研究視野。數(shù)據(jù)反差之大,凸顯明代通俗小說研究分布的不平衡。明代文言小說共約500余種,遠多于通俗小說,可是五十一年里相關論文僅69篇,占明代小說研究論文總數(shù)7,096篇的0.97%,且又集中于《剪燈新話》。數(shù)據(jù)表明,明代小說研究狀態(tài)是文言小說冷、通俗小說熱,約九成力量集中于 “四大奇書”,研究狀態(tài)嚴重失衡。
清代小說研究狀況如下表:
表十一 1950~2000年清代通俗小說研究論文分布表
《紅樓夢》研究最醒目,五十一年間相關論文高達8,756篇,占比81.04%,而同階段明代“四大奇書”相關論文數(shù)之和才6,183篇。同時,歸入“其他作品”共有800余種,論文數(shù)卻僅占5.02%,顯然未受關注,甚至未進入研究視野的作品甚多。這些數(shù)據(jù)提示人們,清代通俗小說研究狀態(tài)的失衡,甚于明代通俗小說。
清代文言小說因有部《聊齋志異》,研究論文較多,分布如下表所示:
表十二 1950~2000年清代文言小說作家作品研究分布表
清代小說研究主要集中于《紅樓夢》,其次是《聊齋志異》與《儒林外史》,但后兩者論文數(shù)之和只抵得上前者四分之一,更遑論其他作品,狀態(tài)同樣是嚴重失衡。
依據(jù)以上三表184個數(shù)據(jù),可對五十一年間明清小說研究狀態(tài)作框架性把握,以它們?yōu)榛A再設置指標與計算,還可進一步具體了解。如通過對1977~2000年各作品研究在各時間段研究總體中的占比,可觀察到進入新時期以來研究的變化及趨勢。這二十四年里,《水滸傳》研究比重從近50%降至不到20%,而1989~2000年的十二年里,基本穩(wěn)定在18%左右;長期遭禁的《金瓶梅》的研究占比迅速增加,最初不到8%,高峰時竟已達37%強,受思想解放思潮的推動,相當一部分研究力量便移至此處。同時,“其他作品”的研究比重在不斷增長,但速度相當緩慢,首尾相較,只增長1.39%,呈現(xiàn)平緩上升態(tài)勢。對清代通俗小說研究作占比計算,也可發(fā)現(xiàn)類似變化。如果將《三國演義》《水滸傳》《金瓶梅》《西游記》《聊齋志異》《紅樓夢》《儒林外史》七部名著視為一個整體考察其研究占比,經計算可發(fā)現(xiàn)五十一年間無論是哪個時間段,人們的時間與精力主要都集中于它們,這也是明清小說研究狀態(tài)不平衡的重要表現(xiàn)。
整個古代文學研究界也同樣失衡。1990~1999年相關論文30,963篇,扣除文論研究3,272篇與少數(shù)民族作品研究740篇,則為26,951篇,下表按體裁與時間段顯示其分布:
表十三 1990~1999年古代文學研究論文分布表
按時間段,隋唐文學研究占比最高,其次是不含近代的清代文學,而兩漢文學研究占比相當?。话大w裁計,詩歌占比最高,其次是小說,兩者論文數(shù)占總數(shù)57%強。上述結果其實是同一指向,隋唐文學占比高的原因是唐詩研究論文多,而清代小說研究占清代文學研究74%。
若更精細切分指標再細察論文分布,失衡狀態(tài)更為嚴重。在26,951篇論文中,論述特定作家作品的論文18,368篇,占比68%強,它們又集中在個別的點上,這可由下面的“排行榜”證明:
表十四 1990~1999年古代文學作家作品研究前十名排行榜
古典文學中的作家作品何其多也,可是十年里集中在10個點上的論文已達8,256篇,將近占了一半。具體到各個領域也同樣如此,如唐詩研究中,對杜甫、李白、白居易、王維、李商隱、李賀六人的研究就占66%,而明代戲曲研究中,對湯顯祖一人的研究就約占53%,呈現(xiàn)的都是失衡格局。
重要作家作品確應重點研究,且應不斷向縱深開掘,但實際情況卻非如此。《紅樓夢》研究中,1950~2000年僅論題標明討論寶玉與黛玉愛情的就近400篇,雖未標明而實際討論者也以千計,寶黛愛情有必要弄出如此龐大的論文群?僅1990~1999年,關于《杜十娘怒沉百寶箱》的討論竟有數(shù)十篇之多,結論同一,論述方式甚至語言表述也大同小異。古代文學研究是一個極其廣袤的領域,統(tǒng)計數(shù)據(jù)卻表明,絕大部分研究力量都投置于數(shù)十個點,產出卻是大面積、高密度與低水平的重復。
此現(xiàn)象年復一年地再現(xiàn),經長期積淀已到觸目驚心的地步。它與發(fā)現(xiàn)、解決問題的研究初衷明顯抵觸,不少人卻樂此不疲。這與研究視野受局限相關,也有將研究價值,甚至研究者價值與研究對象價值掛鉤的誤解,但撰文者對所獲成果與投入時間、精力之比的考量起了決定作用。有關名著的資料經前輩學者辛勤耕耘已相當齊備,可參考的論述亦多,成文較為方便;若致力于幾無人問津的作家作品,僅搜尋相關資料就極費時費力,且不能保證短時間內就能有相應收獲。追求的目標只是論文發(fā)表,而非發(fā)現(xiàn)與解決問題,這種現(xiàn)象出現(xiàn)就不可避免,它竟形成大規(guī)模態(tài)勢,則意味著現(xiàn)行學術評價機制有嚴重缺陷。問題該如何解決,這不是統(tǒng)計所能承擔的任務,但它以可信的數(shù)據(jù)引導人們注意到嚴重性,就已作出了自己的貢獻。
一個流派從誕生到消亡,它的某些特征會逐漸變化,傳統(tǒng)的考察方法有時對此很難講清楚,而統(tǒng)計則可承擔這一工作。如有頭回與引證詩詞是擬話本的形式特征,而統(tǒng)計表明,隨著創(chuàng)作發(fā)展,它們是在逐漸走向消亡。
表十五 擬話本含頭回情況表
馮夢龍創(chuàng)作《三言》時似乎并不十分看重頭回,《喻世明言》、《警世通言》與《醒世恒言》都只約三分之一作品有頭回,稍后凌濛初《二拍》與周清源《西湖二集》中頭回占比都高達90%以上,該特征應是此時形成,但其后開始呈下降趨勢。《型世言》無頭回者已達40%,即使有頭回,與《三言二拍》的詳盡鋪敘也大不相同,多混入文前入話,且僅作為例子極簡略地提及。同時的《歡喜冤家》中,有頭回者已銳減到1篇,占比不到5%,《醉醒石》的占比也僅三分之一。入清后,頭回已是時有時無,占比高者如《豆棚閑話》約有60%,《生綃剪》中約占50%,其形態(tài)也是重議論且為簡略提及的例子。李漁的《十二樓》中,無頭回者竟占75%,《八段錦》是近90%,而《照世杯》與《五色石》中已不見頭回蹤影。作者們多不愿拘泥擬話本標準格式創(chuàng)作,李漁《連城璧》開篇即無頭回,并還特地解釋:“別回小說,都要在本事之前,另說一樁小事,做個引子”,但他卻認為“不須為主邀賓,只消借母形子,就從糞土之中,說到靈芝上,也覺得文法一新?!?29)李漁:《連城璧》子集《譚楚玉戲里傳情,劉藐姑曲終死節(jié)》,《古本小說集成》第1輯,上海:上海古籍出版社,1994年。
頭回出現(xiàn)是出于商業(yè)考慮而非創(chuàng)作必需。說書藝人為收入計,希望聽講的人越多越好,但到了約定時間又必須開講。設置頭回是兩全之法:已入場者為頭回吸引,不會煩燥喧鬧,場外人因正話尚未開始,也愿進場聽講。久而久之,它便成話本小說的形式標志。模擬話本者并無那樣的商業(yè)需求,構想與設置頭回還會成為創(chuàng)作累贅,因此逐漸減少乃至消失實是必然現(xiàn)象,上表數(shù)據(jù)有助于糾正擬話本必有頭回的錯覺。
擬話本剛興起時,也承襲了話本征引詩詞的特征,有的征引數(shù)量還相當多,如周清源《西湖二集》卷七《覺闍黎一念錯投胎》不足萬字,僅完整的詩詞就征引了39首。隨著擬話本創(chuàng)作發(fā)展,這一觀念逐漸淡薄,突出者如清初艾衲居士的《豆棚閑話》,除了《藩伯子破產興家》征引1首,《虎丘山賈清客聯(lián)盟》介紹蘇州風俗征引22首外,其余十則故事中竟無一首詩詞,傳統(tǒng)的篇首與篇尾詩詞也都省略了。下表顯示了擬話本征引詩詞數(shù)量由多到少的總趨勢:
表十六 擬話本征引詩詞情況表
(續(xù)表)
明末擬話本剛興起時,較明顯地受到話本多征引詩詞的影響,特別是《三言》相當部分作品就是據(jù)宋元話本改編,《西湖二集》作者周清源又曾有說書生涯。入清后,征引數(shù)量總體上明顯下降,這時作者的創(chuàng)造力主要表現(xiàn)于人物形象塑造與情節(jié)安排,已無必要以引證詩詞表明自己不俗或學問淵博。誰也不會懷疑李漁的文才,但《十二樓》中《奪錦樓》與《奉先樓》都只是在篇首引詩一首,而除《三與樓》與《生我樓》外,其余十篇竟然連篇尾都被略去。不過,作品中詩詞多少還與作者愛好與寫作習慣有關,在擬話本中征引詩詞普遍趨少的情況下,也會出現(xiàn)《五色石》這樣的特例,但個別現(xiàn)象并不妨礙對總體趨勢的判斷。總之,話本是說話人的底本,擬話本是為案頭閱讀而作,此差異決定了這些特征隨創(chuàng)作發(fā)展必然逐漸模糊淡化。
統(tǒng)計又可幫助把握清初才子佳人小說的源流及發(fā)展變化?!队駤衫妗贰镀缴嚼溲唷沸惺篮箢H受歡迎,隨后陸續(xù)有人模仿其情節(jié)編織故事,《紅樓夢》所說的“通共熟套”就是對這類作品的批評。該流派創(chuàng)作的雷同常被統(tǒng)而言之,或以幾部作品主要情節(jié)類似為例,如果逐部排比,不僅行文累贅,且使人感到頭緒雜亂,而統(tǒng)計可用一張表格清晰展現(xiàn)才子佳人小說創(chuàng)作的公式化程度:
表十七 清初才子佳人小說創(chuàng)作公式化一覽表
為更清晰地顯示總體概貌,這里對情節(jié)要素的考察以“★”為標記。表中各作品都有“生旦唱和”描寫,確如曹雪芹所批評“不過作者要寫出自己的那兩首情詩艷賦來,故假擬出男女二人名姓”;表中“又必旁出一小人其間撥亂”的批評也有落實,該情節(jié)絕大部分作品都有;除《平山冷燕》外,各作品都有“生旦別離”描寫,即曹雪芹批評的“忽離忽遇”。由于“私訂終身后花園”的說法給人印象深刻,男女主人公婚姻狀況的統(tǒng)計有點出人意外:婚事基本上都由長輩決定,雖有幾對曾有私下約定,但很快都得到長輩認可,真正私定終身的只有《錦香亭》。故事結局都是才子佳人結成良緣,才子多進士及第,只有《畫圖緣》里的花天荷未考進士,但他因戰(zhàn)功封大勛侯,妻子也被封一品夫人,總之都是大團圓。上表以各部作品統(tǒng)計為基礎,整體把握切實而可靠。
人們對才子佳人小說的源流曾追溯到唐傳奇,它確從唐傳奇汲取了養(yǎng)分,某些作品里也有些情節(jié)上的模擬。但唐傳奇中女主人公一般都是悲劇性形象,《無雙傳》中有情人雖終成眷屬,但只是靠外力援助,且又是虛幻性的描寫??墒遣抛蛹讶诵≌f卻是千篇一律的大團圓,作品中很難尋覓悲劇成分,故魯迅曾言:“察其意旨,每有與唐人傳奇近似者,而又不相關”(30)魯迅:《中國小說史略》第二十篇“明之人情小說(下)”,《魯迅全集》第九卷,北京:人民文學出版社,1980年。。唐傳奇中愛情故事確可視為才子佳人小說的源頭,但兩者間還有個中間環(huán)節(jié),那就是元明中篇傳奇,王重民先生就曾指出它“直開后來才子佳人派小說之源”(31)王重民:《中國善本書提要》“子部十四小說類”,上海:上海古籍出版社,1983年。。下表的統(tǒng)計也證實了它與才子佳人小說之間的關系:
表十八 元明中篇傳奇情節(jié)要素一覽表
表中第一行列上《鶯鶯傳》以供比較,因為后來中篇傳奇中丫鬟傳遞、互相唱和、別離以及私合等情節(jié)要素都承襲于此,多數(shù)作品還提到張生與崔鶯鶯故事,證明確實受其影響。中篇傳奇前期作品還在延續(xù)《鶯鶯傳》的悲劇氣氛,《嬌紅記》中王嬌娘和申純雙雙殉情,《賈云華還魂記》里女主人公因情而死,顯然也是悲劇,但作者最后又加上她借尸還魂與魏鵬團圓,所生三子皆為顯宦,又被封為鄯國夫人的結局,硬是翻案為喜劇?!剁娗辂惣分泄驾`和黎瑜娘經過激烈抗爭終于結成美滿婚姻,為中篇傳奇中悲劇創(chuàng)作劃上句號。此后作品無例外地都描寫了生旦團圓的喜劇,該流派反封建意味也隨之大為減弱。從唐傳奇中悲劇到清初才子佳人小說中千篇一律的喜劇,其間承擔轉折任務的正是明代中篇傳奇。
比對上兩表,可發(fā)現(xiàn)才子佳人小說中“丫鬟傳遞”“生旦唱和”“生旦別離”,以及才子進士及第等情節(jié)要素都承襲中篇傳奇,其他一些情節(jié)則是各篇相似程度不等,這幾乎是同一流派在不同歷史階段的創(chuàng)作展現(xiàn)。時代環(huán)境的不同必定會造成差異,中篇傳奇中才子進士及第后還握掌朝中權柄,多數(shù)作品又寫到他們辭官歸鄉(xiāng),這似是對當時宦海險惡的反映。后期《天緣奇遇》等作還添加了才子與眾夫人白日飛升的情節(jié),以此寄托當時一些士人的最高理想。才子佳人小說一般以進士及第與成婚為結局,這可能是那些作者多為落魄書生,若能如此,平生心愿已遂,因而未有更多奢望。兩者更醒目差異是對情與欲關系的處理。中篇傳奇中除《雙卿筆記》與《劉生覓蓮記》外,男女主人公都是婚前私合,但在前后期作品中,情與欲觀念的表現(xiàn)又有所不同。前期《鐘情麗集》中“倘若不遂所懷兮死也何妨,正好烈烈轟轟兮便做一場”等語,盡情宣泄了對明初以來程朱理學思想長期禁錮的逆反心理,與蓬勃興起的市民階層審美趣味相適應;可是后期作品中,敘及性行為時的含蓄喻示開始變成了露骨渲染,與此時士大夫腐朽墮落的世風相呼應。高儒《百川書志》著錄《嬌紅記》《鐘情麗集》等中篇傳奇后曾云:“以上六種,皆本《鶯鶯傳》而作,語帶煙花,氣含脂粉,鑿穴穿墻之期,越禮傷身之事,不為莊人所取,但備一體,為解睡之具耳?!?32)高儒:《百川書志》卷之六,上海:古典文學出版社,1957年。清初才子佳人小說的描寫正相反,男女主人公均是發(fā)乎情,止乎禮,壓根沒有婚前私合的念頭。清初統(tǒng)治者強力提倡忠孝廉節(jié)、敦仁尚讓,并厲禁“淫詞瑣語”,當是發(fā)生該變化的重要原因。在那樣的時代氛圍中,作者很注重“理”對“情”的規(guī)范,甚至還認為其創(chuàng)作具有教育功用,因為“情定則由此收心正性,以合于圣賢之大道不難矣”(素政堂主人《定情人序》)。
從唐傳奇愛情故事到元明中篇傳奇,再到清初才子佳人小說,以上兩表簡明扼要且清晰地展現(xiàn)了那些情節(jié)要素變化過程,如果舍棄統(tǒng)計,就很難直截了當?shù)赜^察到那些變化;對此若用文字表述,由于涉及作品多,需厘清頭緒繁雜,很可能花費很大篇幅也未必能講清楚。兩相對比,統(tǒng)計的優(yōu)越性十分明顯。
古代小說的地位卑微,許多作品無署名或署別名,須考證方知作者究為何人。然而苦于資料匱缺,考證往往難以下手,硬作判斷只會造成學界困擾。統(tǒng)計與語言學的結合為作者考辨開辟了新途徑,英國《朱利葉斯信函》與美國《聯(lián)邦主義者文獻》作者的判定是其成功的實踐。如此考辨的原理,是寫作時字、詞、句的使用常帶有偶然性,而對大量偶然性現(xiàn)象作統(tǒng)計分析,可揭示隱藏于其間的規(guī)律性,即作家的語體特征,據(jù)此可鑒別作品出自何人之手?!都t樓夢》后四十回是否為曹雪芹所寫也可用此法鑒別,比照對象是已確定為曹雪芹所寫前八十回。將全書分為A、B、C三組,各組字數(shù)與句數(shù)便由下表所示:
表十九 《紅樓夢》字、句數(shù)分組顯示表(33)統(tǒng)計采用人民文學出版社1982 年版,其前八十回以庚辰本為底本,后四十回則采用程甲本。由于第64、67 回缺文由程甲本補配,故B組中已扣除這兩回。
三組所含字、句數(shù)都相當龐大,可充分顯示作者的寫作習慣;同時,三組篇幅基本相當,保證了互作比較的合理性。
1. 詞的考察
有的詞在C組的出現(xiàn)明顯異于A、B組,如“端的”意為到底、究竟或始末、底細(“好端端的”中的“端的”不列入統(tǒng)計),它在A、B組分別出現(xiàn)14與19次,但C組從不出現(xiàn)?!岸说摹倍喑霈F(xiàn)于回末,如“要知端的,且聽下回分解”,A組8次,B組16次,為曹雪芹回末套語之一,后四十回作者顯然沒注意到這一點。
有些同義詞在三組中出現(xiàn)次數(shù)有明顯差異:
表二十 同義詞使用比較
“越性”與“索性”都表示干脆,或直截爽快。C組“越性”從不出現(xiàn),程乙本甚至還將前七十八回中的“越性”全改為“索性”或“越發(fā)”,如庚辰本第十五回中“越性都推給奶奶了”和“少不得越性辛苦一日罷了”,程乙本改為“越發(fā)都推給奶奶了”與“少不得索性辛苦了”。B組與C組正相反,始終只用“越性”而不用“索性”。A組情況稍復雜,主要用“越性”,而“索性”出現(xiàn)過三次。比對其他脂本,可以發(fā)現(xiàn)解釋該現(xiàn)象的線索:
庚辰本:想了一想,索性遲兩日。
甲戌本:想了一想,越性遲兩日。
戚序本:想了一想,越性遲兩日。
程甲本之前是傳抄本流行,“好事者每傳抄一部,置廟市中,昂其值得數(shù)十金”(34)程偉元:《紅樓夢序》,見一粟編:《紅樓夢卷》,北京:中華書局,1963年。。抄錄難免出錯,現(xiàn)存脂本又極少,無法追尋抄錄的線路圖。不過,由上列庚辰本作“索性”,甲戌本與戚序本都作“越性”,可以斷定庚辰本過錄時發(fā)生誤抄:抄寫者習慣用“索性”,抄寫時大部分“越性”會被保留,卻會有少量誤抄為“索性”。戚序本也有這樣的情況,它保留了許多“越性”,可是上述第十五回中的兩個“越性”都寫成了“率性”?!肮值馈迸c“怪不得”這對同義詞情況也是如此:后四十回從不用“怪道”,A、B兩組基本上都用“怪道”,而少量出現(xiàn)的“怪不得”,當是過錄時誤抄。
同樣,曹雪芹習慣使用的是“偏生”、“越發(fā)”與“才剛”,誤抄導致少量“偏偏”、“更加”與“剛才”的出現(xiàn)。庚辰本據(jù)己卯本過錄,A組出現(xiàn)5次“剛才”,其中4次己卯本作“才剛”,確證庚辰本為誤抄;己卯本也是過錄本,未被否定的那處“剛才”,很可能是它過錄時的誤抄:(35)B組中兩個“剛才”出現(xiàn)在第五十四回與第七十四回,己卯本缺此兩回,無法比對。
第3回 庚辰本:剛才老太太還念呢。
甲戌本:才剛老太太還念呢。
己卯本: 才剛老太太還念呢。
第32回 庚辰本: 剛才打水的人在那東南角上井里打水,……
己卯本:才剛打水的人在那東南角上井里打水,……
戚序本: 才剛打水的人在那東南角下井里打水,……
第32回 庚辰本:剛才我賞了他娘五十兩銀子,……
己卯本:才剛我賞了他娘五十兩銀子,……
戚序本:才剛我賞了他娘五十兩銀子,……
第40回 庚辰本:剛才那個嫂子倒了茶來,……
戚序本:才剛那個嫂子倒了茶來,……
己卯本: 才剛那個嫂子倒了茶來,……
后四十回主要使用“偏偏”、“更加”與“剛才”,但也出現(xiàn)了些“偏生”、“越發(fā)”與“才剛”,這可能因排版者用詞習慣而產生的誤排,也可能其間有曹雪芹少量殘稿。
2. 字的考察
首先觀察前、后出現(xiàn)情況迥異者。如文學作品中極少使用的“屄”,前七十八回中竟出現(xiàn)十余次,后四十回中從未出現(xiàn)。粗俗程度稍低的又有“屁”,前七十八回中也出現(xiàn)十余次,后四十回中只有賈政氣急時罵了聲“放屁”。還可比照一些較粗鄙的詞的使用。前七十八回薛蟠的酒令有“一根雞巴往里戳”之語,后四十回中從未有這樣的表述。又如“淫婦”與“娼婦”兩詞前七十八回各出現(xiàn)十余次,后四十回中從未見“淫婦”,“娼婦”只出現(xiàn)過一次。這里并非想說明后四十回語言較高雅,其實《紅樓夢》開篇處就批評“鬟婢開口即者也之乎,非文即理”是“大不近情理”,所以他筆下一些“臟”字就從奴婢嘴中脫口而出,就連王夫人或林黛玉都難免會說“放屁”,這些描寫更真實地再現(xiàn)了現(xiàn)實生活的場景。
句尾語助詞用法也不同。后四十回出現(xiàn)的種類很多,有呀、嗎、啊、咧、罷咧、罷、罷了、么、呢、呢么、呢嗎、吧、哩、呵、哪、呦等十余種,前七十八回常用的只是呢、罷、罷了三種,下表顯示了它們的差異:
表二十一 句尾語助詞使用比較
嗎、罷咧、阿、哪在后四十回的句尾出現(xiàn),在前七十八回不出現(xiàn)或基本不出現(xiàn),吧的情況正好與之相反。么、罷了、罷、呢在前、后部分都出現(xiàn)了,但么與罷了的用法卻有明顯差異。這方面的考察也表明前七十八回與后四十回的寫作習慣不同。
其次是考察虛字使用。實字使用與情節(jié)描寫有很大關系,如“黛”字在黛玉去世后就很少出現(xiàn)。虛字則不然,它是構成句子必不可少的成份,出現(xiàn)規(guī)律不受情節(jié)發(fā)展制約,而僅與作者寫作習慣有關。虛字有文言與白話之分,古人習慣文言寫作,但創(chuàng)作通俗小說時又得使用白話,因此它們在作品中都會出現(xiàn),但各自出現(xiàn)的程度因人而異。
A、B、C三組篇幅都相當可觀,虛字在各組的出現(xiàn)一般都服從正態(tài)分布,它由均值(頻率)μ與方差σ2決定。人們容易理解均值而不清楚方差,但均值相同并不意味著分布同一。如10個數(shù)字都是10,其均值是10;10個數(shù)字中一個為100其余都是0,其均值也是10,檢驗方差后,兩組數(shù)據(jù)的分布便可區(qū)分。檢驗兩組數(shù)據(jù)是否屬于同一分布需要運用概率論知識,敘述檢驗過程也較繁瑣,故而這里只排列一些虛字在A、B組出現(xiàn)頻率與C組有明顯差異者以供觀察,頻率相似的虛字需進一步作分布檢驗,此處不贅。
表二十二 虛字每千字出現(xiàn)次數(shù)比較
上列27個虛字的千字頻率基本上都是A、B組相似,而異于C組,分布檢驗結果也是如此。筆者共統(tǒng)計了47個虛字,另20個各組出現(xiàn)頻率相似,但A、B組屬同一分布,C組則與之不同。由虛字的檢測也得到同樣結論:前八十回與后四十回并非同一個作者。
3. 句的考察
寫作時會出現(xiàn)長短不一的句子,其中規(guī)律恐怕作者本人也不清楚,但卻能由統(tǒng)計揭示。英國統(tǒng)計學家Yule提出平均句長概念,并以此為判斷作家語體特征的重要依據(jù)。平均句長=總字數(shù)/總句數(shù),回平均句長=回字數(shù)/回句數(shù)。A、B、C三組平均句長分別是6.692、6.865與7.073,《紅樓夢》中2字句至13字句共98,758 句,占總數(shù)95.13%。檢驗的結果是不同長短句子在A、B 兩組分布同一,而C組中只有8字句分布與A、B 兩組同一。據(jù)此檢驗,也應拒絕后四十回為曹雪芹所作的假設。
4. 后四十回分兩段考察
程偉元聲稱對《紅樓夢》八十回后文字“竭力搜羅,自藏書家甚至故紙堆中無不留心,數(shù)年以來,僅積有廿余卷。一日偶與鼓擔上得十余卷,遂重價購之”(36)程偉元:《紅樓夢序》,見一粟編:《紅樓夢卷》,北京:中華書局,1963年。。此語不可輕信,卻無法排除確實搜羅到一些曹雪芹殘稿的可能性。由于一些曹雪芹習慣用詞偶爾也出現(xiàn)于后四十回前半段,故而將后四十回分為C1(第81至100回)與C2(第101至120回)組,A、B兩組合為一組記為AB,繼而比較其虛字千字頻率。有8個虛字的千字頻率都是C1組與AB組較相近,與 C2組明顯相異:
表二十三 8個虛字每千字出現(xiàn)次數(shù)比較
另有18個虛字千字頻率C1組有向AB組靠攏的趨勢,同時與 C2組拉開了距離:
表二十四 18個虛字每千字出現(xiàn)次數(shù)比較
偏但其亦別很一好了AB0.42120.42950.69860.69231,7550.214717.494.76027.42C10.22270.74520.24840.10271.2840.496814.815.48228.62C20.14480.87740.20440.16180.91150.519614.095.92928.99
句的考察可發(fā)現(xiàn)類似景象:C1組平均句長是6.940字,AB組6.781字,C2組7.210字,同樣出現(xiàn)向AB組靠攏而與C2組拉開距離的情形。綜合以上考察,有理由認為C1組含有曹雪芹的殘稿,但它與C2組畢竟還較接近,表明殘稿數(shù)量不多。統(tǒng)計只能指出這類文字大概所在區(qū)間,究竟哪些描寫屬于殘稿,還有待于其他方法的確認。
古代文學中有不少作品的作者至今不詳,雖有相關考證,但因資料匱缺,往往只是猜測,還導致長期爭論而無結果。如果還存有可比對作品,有些便可運用統(tǒng)計刻畫其語言風格并互相比對,從而作出較確定的判斷。
統(tǒng)計為文學研究提供了新方法,確可解決某些傳統(tǒng)方法難以應對的問題,但并非萬能工具,運用前須認真權衡其可行性與必要性。而且,統(tǒng)計學與文學都有自己的規(guī)律與特點,在雙重約束下,運用就不可能是簡單地搬用計算方法,它需要根據(jù)待解決問題的性質、特點精心設計。
首先須清楚可以使用統(tǒng)計的范圍。如果將某階段作品按優(yōu)秀、比較優(yōu)秀、一般、平庸與劣作五項進行統(tǒng)計,很快就會發(fā)現(xiàn)大量作品不知該如何歸類,各人評判的標準并不同一,硬作分類必遭質疑。內涵與外延都明確的精確概念可遵循排中律作歸類,但優(yōu)秀與平庸等概念內涵明確而外延模糊,此處忌用排中律。文學研究中模糊概念甚多,如對以往經驗與技巧的繼承或模仿、人物性格的復雜性、語言的生動或笨拙、氣氛的渲染與意境的營造等等,涉及到的都是模糊概念,對它們即使有心統(tǒng)計也會感到無從下手。在一般情況下,只有內涵與外延都明確的精確概念才能進行統(tǒng)計,這是統(tǒng)計范圍的限定。
即使在范圍之內,是否需要統(tǒng)計也須得估量。如果敘述已可清楚說明問題,改用統(tǒng)計表格僅使文章稍顯生動,此為不必要的統(tǒng)計。如果涉及層面較多,敘述繁瑣且不易突出要領,而一張統(tǒng)計表既能避免行文累贅,又能清晰展示問題要害,其優(yōu)越性顯而易見。在許多場合,如厘清頭緒、展現(xiàn)問題及把握框架等,恐怕就非得作統(tǒng)計不可。當然,前提條件是資料掌握的齊備。數(shù)據(jù)采集是統(tǒng)計第一環(huán)節(jié),充分性若得不到保證,統(tǒng)計結果就會與客觀事實相距甚遠,從而失去它的價值與意義。
準確、全面地采集數(shù)據(jù)并非易事,疏漏常會因這樣或那樣的原因而產生,有些在采集前已預知無法做到絕對準確。如近代小說新出單行本共1393種,其中1100余種為筆者親見,余下的是查閱各種著錄并作核對后所得。當年實際出版肯定會更多,總會有些藏于某處尚不為人知,有些今已失傳,甚至未曾被著錄,它們自然無法進入統(tǒng)計。近代報刊小說情況亦是如此,一些近代報刊已殘缺不全或已湮沒于歷史長河,它們是否刊載過小說或刊載過多少都無法知曉。不過當采集到大部分數(shù)據(jù)時,統(tǒng)計仍可進行。因為此時的目的是顯示研究對象的狀態(tài)與發(fā)展趨勢,誤差數(shù)量較小時對此不會影響整體格局的把握,即統(tǒng)計的有意義性并非絕對地依賴于精確性。當然,如果缺失的數(shù)據(jù)占比較大,統(tǒng)計結果就會與客觀事實相距較遠,因此統(tǒng)計前必須估量數(shù)據(jù)采集齊備性程度。
數(shù)據(jù)采集的針對性及其規(guī)定范圍取決于統(tǒng)計指標的設置,它也可根據(jù)研究進展作調整。如果要了解清初通俗小說數(shù)量,那只需簡單地計數(shù);若要進一步了解各流派情況,就得以講史、神魔等各創(chuàng)作題材為統(tǒng)計指標。如果將清初作為一個時間單位,所得便是那90年里屬各流派的作品數(shù),但如果將清初拆分為前、后兩個時間段并作比較,便立即顯示出后期創(chuàng)作陷入蕭條的景象,也因此發(fā)現(xiàn)以往研究未曾提及的現(xiàn)象。辨析各作品問世時間是統(tǒng)計的前提,至少得知道應歸于前期還是后期,這就需要根據(jù)各方面資料分析鑒別;同時增設“時間不明”指標以安置無法確定問世時間的作品,從而保證指標集合對統(tǒng)計對象的全覆蓋。統(tǒng)計對象都須能從屬于某個指標,這是指標設置的重要原則;同時,它們各自所對應的元素不得交叉,即具有排他性。如《西游記》只歸于神魔小說,而不可系于其他什么流派,《三國演義》只在講史演義名下才有位置而不可置于他處。如果作品描寫俠客故事,其中男女主人公談情說愛內容又占了不小篇幅,它究竟該歸于俠義小說還是言情小說?這時應尊重前人已有的分類,自行改動易造成混亂,更不可違背各指標互相間的排他性,將它同時置于俠義小說與言情小說。這里實際上已涉及模糊概念,但學界已約定俗成,故可參照精確概念使用排中律處理。
在對采集的數(shù)據(jù)作統(tǒng)計后,有時還得根據(jù)需要作指標歸并。如為把握1950~2000年明代通俗小說的研究格局及變化,就得統(tǒng)計所有作品的相關論文數(shù),各部小說都是統(tǒng)計指標。統(tǒng)計表中作品數(shù)為“行”,年份為“列”,將各作品相關論文數(shù)按年填入,便顯示出各年各部小說的研究狀況。這張統(tǒng)計表130余行、50余列,顯示7000多個數(shù)據(jù),要據(jù)此解讀出有價值的結論并非易事。為醒目展示結果,以助迅速得出有效判斷,就須適當歸并指標制作新表。第一輪統(tǒng)計表明,那些年里約120種作品相關論文數(shù)極少或只是0,它們可歸為“其他作品”指標。這樣可壓縮約120行,數(shù)據(jù)顯示的有效性可大幅提升。因逐年顯示并無必要,以“時間段”展示可更清晰,故而“列”的指標也可歸并,其劃分根據(jù)當時具體情況:1950~1966年研究態(tài)勢相對平穩(wěn),論文數(shù)也較少,故歸并為一個時間段;1967~1976年是特殊年代,自成一段;余下25年論文數(shù)顯著增加,故分四個時間段以便觀察。與原先龐大的表格相較,新表簡明緊湊,它有序顯示的60余個數(shù)據(jù)便于把握其意義及其內在聯(lián)系。
數(shù)據(jù)處理結果是絕對數(shù)字的顯示,它們可助人了解狀況、提供問題的解釋,而要相互比較或考察變化趨勢,還需引進指標“占比(%)”,將絕對數(shù)字轉換為相對比例。如中篇傳奇《李生六一天緣》羼入詩詞100首,《龍會蘭池錄》僅63首,據(jù)此并不能判定兩者羼入程度的高低,而結合其篇幅增設“千字含詩詞數(shù)”與“詩文占比(%)”指標,由那些相對數(shù)值可知,《龍會蘭池錄》詩文羼入程度遠高于《李生六一天緣》。凡涉及比較或考察變化狀況時,一般都需要設置“占比(%)”指標,觀察其間對應關系,從而避免誤判。
統(tǒng)計數(shù)字抽象于文學現(xiàn)象或事件,但此時卻僅有數(shù)學上的意義。無論杰作還是庸作,都被平等視為一個“1”,但經歷了數(shù)據(jù)采集階段,確可體會到似無意義差別的數(shù)字所蘊含的不同內容?!靶≌f界革命”前后小說單行本的內容迥然有異,數(shù)量有明顯差落,在對近代小說創(chuàng)作狀況已有基本了解的前提下統(tǒng)計,自然會明白那些數(shù)據(jù)的含義。而且,統(tǒng)計目的是把握近代小說單行本系統(tǒng)內部結構及其運行狀態(tài),它并不能取代具體的分析,卻能為深入研究啟發(fā)思路、提示方向,并提供整體框架的把握。這表明解讀統(tǒng)計結果時,對研究對象背景及相關文學現(xiàn)象或事件須有較充分了解,否則就無法憑借數(shù)據(jù)發(fā)現(xiàn)問題,也無法對那些數(shù)據(jù)作出合理的解釋。