潘 俊
自秦漢至晚清的中國社會被認為是選舉(察選考舉)社會,秦漢的選舉是一種自上而下“以賢選賢”的推薦,選舉過程主要由門閥世族把持[1]。隨著士族階層興起,選舉的中心環(huán)節(jié)逐漸由推薦轉向考試,最終于隋唐之際催生了綿延上千年、對中國社會產(chǎn)生深遠影響的科舉取士制度。迨至明代,科舉制已趨完備,成為國家的掄才大典,并在一定范圍內(nèi)促進了社會階層的流動[2]。有明一代登科進士總數(shù)24,595人[3]。這些經(jīng)由鄉(xiāng)試、會試、殿試而躋身朝堂的進士群體是明代維系國家秩序和運轉的核心政治力量。在這一群體之間,廣泛存在著宗族姻親、同年同鄉(xiāng)、同社同門、座師門生、學派師承、交游酬唱等一系列錯綜復雜的社會關系,形成一個經(jīng)緯交織、紛繁龐雜的網(wǎng)絡。研究這一網(wǎng)絡的形成、維系和演化過程,探索隱藏其中的豐富微妙的歷史細節(jié)和線索,有助于進一步認識明代社會結構和政治文化的變遷,厘清歷史事件背后人際因素的影響,從而為相關史學觀點和爭議提供新的辨析視角和實證依據(jù),乃至根據(jù)線索提出新的問題,按圖索驥尋求新的答案。
以士人社會關系為切入點的歷史研究由來已久。以往工作多以某個人物為個案,考證論述交游情況,或聚焦于某一家族、某一群體的人際交往[4-5]。這些研究主要依賴于研究者的思辨性和經(jīng)驗性,強調(diào)對相關史料文獻的搜集、梳理和考證能力,這也是傳統(tǒng)人文歷史研究最主要的研究范式。近年隨著信息技術飛速發(fā)展,人文歷史研究環(huán)境逐漸發(fā)生變化,面向數(shù)字人文的數(shù)據(jù)驅(qū)動型研究范式吸引了眾多領域?qū)W者的研究興趣[6]。與此同時,一批基于開放互聯(lián)理念的數(shù)字人文基礎設施正在逐步建成和完善[7-8],典型項目包括中國歷代人物傳記資料庫(CBDB)、中國歷史地理信息系統(tǒng)(CHGIS)、唐宋文學編年地圖等。盡管現(xiàn)階段對數(shù)字人文的研究范式仍存在爭議[9],但作為趨勢,數(shù)據(jù)驅(qū)動的人文社科研究有望成為新的學術生長點[10]。以歷史社會學為例,已經(jīng)出現(xiàn)了不少新成果。然而從技術角度看,現(xiàn)有方法還不夠深入,同時由于數(shù)據(jù)獲取等原因,針對中國歷史人物群體的工作,目前集中于唐宋社會,以明代社會士大夫精英群體為對象的研究較少。
為彌補當前研究中的不足,本文基于數(shù)字人文理念,以明代進士群體為中心,從數(shù)據(jù)獲取與集成、網(wǎng)絡構建與分析、關系挖掘與可視化3個方面展開實證研究。首先基于循證原則[11],從科舉文獻中整理并獲取明代進士人物關系數(shù)據(jù),與現(xiàn)有知識庫數(shù)據(jù)進行集成;其次構建進士社會關系網(wǎng)絡,計算網(wǎng)絡特征指標并分析其與明代政治、文化及社會結構變遷的關系;最后從多個維度對明代進士社會網(wǎng)絡進行關系挖掘,探微知著,與現(xiàn)有的史學觀點相互印證。
社會網(wǎng)絡屬于復雜網(wǎng)絡的范疇,用于表示具有社會屬性的關系網(wǎng)絡,其中網(wǎng)絡節(jié)點代表獨立的個體或組織,網(wǎng)絡連邊代表節(jié)點之間因接觸、關聯(lián)產(chǎn)生的一種或多種聯(lián)系。作為實證手段,社會網(wǎng)絡分析已成為人文社科領域的重要工具。殷沈琴等構建論文作者的社會網(wǎng)絡圖譜,分析數(shù)字圖書館研究中的主要學術合作群體[12]。黃娟等采用社會網(wǎng)絡分析方法,從多維度分析文獻著者的社會屬性和社會關系[13]。易明等依托社會化標簽系統(tǒng)中的社會網(wǎng)絡,構建基于社會網(wǎng)絡的知識推送網(wǎng)絡演化模型[14]。王雙等利用社會網(wǎng)絡分析方法,研究科技人才成長的一般特征和規(guī)律[15]。這些工作的思路是采集數(shù)據(jù),構建關系網(wǎng)絡,分析網(wǎng)絡結構特征和演化過程,發(fā)現(xiàn)節(jié)點間某些交互模式和規(guī)律,作為闡釋社會現(xiàn)象的基礎[16]。
一般來說,社會網(wǎng)絡分析的研究對象是當下的社會,而社會學與歷史學又有著天然聯(lián)系[17]。早在1940年代,費孝通就提出“差序格局”的經(jīng)典概念[18],拓寬了中國歷史社會學的論域。不同于傳統(tǒng)歷史研究強調(diào)的宏大敘事,歷史社會網(wǎng)絡分析聚焦于眾多微小的歷史細節(jié)和線索,旨在通過對歷史人物社會關系網(wǎng)絡的重現(xiàn)和探索,獲得對某些歷史問題更為豐富、立體而深刻的認識。
歷史社會網(wǎng)絡分析的開創(chuàng)性工作可追溯到1993年約翰·帕吉特(John Padgett)等對文藝復習時期佛羅倫薩梅迪奇(Medici)家族的研究,基于文獻資料構建梅迪奇家族與各種政治勢力的社會關系網(wǎng)絡,認為該網(wǎng)絡是家族崛起并保持其政治地位的主要因素[19]。由于數(shù)據(jù)獲取和分析技術的局限,早期工作所構建的網(wǎng)絡規(guī)模通常較小。近年隨著信息技術的進展和數(shù)據(jù)的積累,從整體上研究不同歷史時期的社會網(wǎng)絡具備了基礎條件,出現(xiàn)了一些代表性成果。杰克遜·康奈爾(Jackson Cornell)基于中世紀蘇格蘭人物數(shù)據(jù)庫構建社會關系網(wǎng)絡,以尋找當時社會的意見領袖[20]。王濤從《德意志人物志》中抽取數(shù)據(jù),使用社會網(wǎng)絡分析方法,研究德國社會的形態(tài)變遷[21]。包弼德(Peter Bol)基于CBDB和CHGIS數(shù)據(jù)庫,從群體人物和地理信息兩個方面探討社會網(wǎng)絡對宋代道學傳播的影響[22]。嚴承希等通過符號網(wǎng)絡構建宋代政治網(wǎng)絡,分析宋代相黨政治和黨爭格局的演化[23]。這些工作不同程度涉及文本挖掘、數(shù)據(jù)建模、網(wǎng)絡科學、可視化等技術在人文學科的應用,彰顯了數(shù)字人文跨學科研究的潛力。
數(shù)據(jù)驅(qū)動型研究首重數(shù)據(jù)。對當下社會,可以采用問卷、訪談、日志抽取等方式采集用戶信息以及關系數(shù)據(jù)。而對歷史上的社會,只能從浩如煙海的歷史文獻中采集數(shù)據(jù),這對文獻的選擇鑒別、對數(shù)據(jù)的抽取清洗都提出較高的要求。要保證數(shù)據(jù)質(zhì)量,較可靠的方式是人工從文獻史料中獲取關系數(shù)據(jù)。嚴程整理“秋紅吟社”女性詩人的往來詩作,構建以顧太清為中心的交游網(wǎng)絡[24]。阿帕姆·巴蘇(Aupam Basu)等整理文獻,構建早期英國劇作家、劇團和劇場的協(xié)作關系網(wǎng)絡[25]。然而,人工獲取數(shù)據(jù)依賴專家知識,耗時耗力,因此相關研究往往是針對個體、家族或地域性的小規(guī)模網(wǎng)絡。
為獲得大規(guī)模數(shù)據(jù),一些學者致力于從文獻中自動抽取人物關系的研究,但相關技術離實用還有較大距離,較為常用的是共現(xiàn)統(tǒng)計法,即統(tǒng)計人名在文本中的共現(xiàn)模式,自動為人物建立關聯(lián)。許超等基于《左傳》人物事件表,將屬于同一歷史事件中的人物視作關聯(lián)人物,構建人物關系矩陣[26]。馬蒂(Matje V.D.C.)等基于《荷蘭社會工人運動人物傳記辭典》,依據(jù)人名共現(xiàn)和詞匯特征構建社會網(wǎng)絡[27]。共現(xiàn)統(tǒng)計法建立在分布式假設[28]基礎上,這一假設認為語義相關的詞語往往會出現(xiàn)在相似的上下文中。然而,依據(jù)此假設自動生成的人物關系,盡管在宏觀上能反映人物之間可能存在的統(tǒng)計學關聯(lián),但從微觀看,每條人物關系記錄缺少相關證據(jù)支撐,因此難以用于人物關系的深度挖掘研究中。
中國歷代人物資料庫(CBDB)是由哈佛大學、北京大學等機構聯(lián)合開發(fā)維護的開放數(shù)據(jù)庫,旨在對中國歷史人物傳記資料進行數(shù)字化處理,為群體傳記學和歷史社會網(wǎng)絡分析提供支撐[29]。其數(shù)據(jù)來源包括正史、文集、墓志、墓表等原始文獻,以及經(jīng)過考訂的人物傳記資料、人物年表等工具類文獻。CBDB是在唐宋史研究中發(fā)展起來的,關于宋代人物的數(shù)據(jù)最豐富,對其他斷代資料的收錄相對不足,這或許也是基于CBDB的相關研究主要集中于唐宋時期的原因之一。本文認為,從“辨章學術、考鏡源流”角度看,要構建歷史社會網(wǎng)絡并進行關系挖掘,所抽取的人物關系數(shù)據(jù)應是可循證回溯的。為此,以CBDB 為主要數(shù)據(jù)源,并從《明代登科錄》《皇明貢舉考》《明朝館選錄》等明代科舉文獻中,整理了明代進士社會關系的部分數(shù)據(jù),與CBDB現(xiàn)有數(shù)據(jù)集成后,生成統(tǒng)一視圖的數(shù)據(jù)集,基于該數(shù)據(jù)集構建明代進士群體社會關系網(wǎng)絡,最后從多個維度展開關系挖掘和循證分析,從而對部分學者的研究成果和理論觀點給出實證支撐。
基于知識庫和文獻的歷史人物關系挖掘,主要內(nèi)容包括:(1)人物關系數(shù)據(jù)的獲取以及與人物信息、歷史事件等多源數(shù)據(jù)的融合;(2)關系網(wǎng)絡的定義,以及相關網(wǎng)絡指標的計算分析;(3)基于關系網(wǎng)絡的知識挖掘與可視化。
本研究的數(shù)據(jù)主要來源于CBDB數(shù)據(jù)庫和明代科舉文獻。CBDB數(shù)據(jù)庫中的人物數(shù)據(jù)包含人名、時間、地址、職官、入仕途徑、社會區(qū)分、親屬關系、社會關系、事件等,其中社會關系和親屬關系是構建人物關系知識庫的主要數(shù)據(jù)源。統(tǒng)計指數(shù)年段1368-1644年的明代人物,CBDB收錄107,290人。本文關注明代進士這一特定群體,為此編寫腳本抽取自洪武四年辛亥科(1371年)至崇禎十六年癸未科(1643年)的進士人物(含通過會試但未參加殿試的貢士),共計22,956人,其中庶吉士952 人。由于進士人物的社會關系有其獨特性,進一步從科舉文獻中抽取人物關系數(shù)據(jù)并與CBDB 數(shù)據(jù)集成。所構建或擴充的主要社會關系包括座師門生關系、庶吉士同學關系、館師庶吉士師生關系、同年進士關系、同鄉(xiāng)進士關系以及宗族和姻婭關系?;谏鲜鰳嫿ǖ纳鐣P系,通過映射規(guī)則將關系數(shù)據(jù)與CBDB 數(shù)據(jù)集成,采用數(shù)據(jù)核查技術來清洗噪點數(shù)據(jù)??紤]到有據(jù)可考的明代進士總數(shù)為24,595 人[3],庶吉士總數(shù)為1,204 人[30],該數(shù)據(jù)集可視作具有一定代表性的明代進士抽樣數(shù)據(jù)集。表1以李東陽為例,給出了進士人物特征及其部分社會關系。
表1 明代進士人物及社會關系特征樣本(以李東陽為例,部分)
要構建具體的社會關系網(wǎng)絡,還需確定網(wǎng)絡類型和特征指標等參數(shù),考慮到本實證研究的目標和數(shù)據(jù)集特征,將網(wǎng)絡表示為一個加權圖,并采用特征向量中心性來反映節(jié)點在網(wǎng)絡中的重要程度或影響力。特征向量中心性具有很強的現(xiàn)實意義,其節(jié)點影響力同時取決于該節(jié)點的鄰居數(shù)量及鄰居的影響力。也就是說,影響力高的人物,要么與重要人物擁有親密關系,要么具有很廣的人脈,或兼而有之。在人物關系網(wǎng)絡中,每種關系的權重先由人工按三分制標注。由于兩個節(jié)點之間往往存在多條邊,且有可能是單向邊(如舉薦關系)或雙向邊(如朋友關系),可能會導致兩個人物互指的親密度不一致。為此,在人物關系可視化呈現(xiàn)時,合并節(jié)點間的多條邊,親密度不一致時則取其較大值。同時,為簡化網(wǎng)絡,進一步刪除親密度小于指定閾值的冗余邊,最后計算節(jié)點的特征向量中心性并作為節(jié)點的權重。以指數(shù)年1550-1600 年段為例,采用ForceAtlas2圖布局算法對這一時期進士社會關系網(wǎng)絡進行可視化,如圖1所示。
社會關系網(wǎng)絡的拓撲結構可以用統(tǒng)計特征指標來描述,包括網(wǎng)絡直徑、平均路徑長度、聚類系數(shù)、平均度等。通過NetworkX①工具包對本文網(wǎng)絡,以及FaceBook②、豆瓣③、Digg friends④、Youtube⑤等公開數(shù)據(jù)集構建的網(wǎng)絡進行特征指標計算,表2給出了計算結果。
表2 明代進士關系網(wǎng)絡與典型社交網(wǎng)絡統(tǒng)計特征對比
圖1 明代進士社會關系網(wǎng)絡可視化(指數(shù)年1550-1600)
從網(wǎng)絡規(guī)模看,本研究構建的明代進士社會關系網(wǎng)絡尚不及現(xiàn)代社交網(wǎng)絡,但通過網(wǎng)絡統(tǒng)計特征的對比,依然發(fā)現(xiàn)了一些相似的性質(zhì)。由表2可知,本文構建的明代進士網(wǎng)絡中的人物,平均只需約4 至5 步就可建立聯(lián)系,每個人物平均與3 至4 個其他人物有聯(lián)系,每個人物的關系人之間,彼此存在聯(lián)系的概率為18.8%。這表明明代進士群體之間存在和現(xiàn)代社交網(wǎng)絡非常類似的小世界特性;并且從聚類系數(shù)看,明代進士群體之間的聯(lián)系還更緊密,呈現(xiàn)出較為典型的“六度分隔”特征。為探索網(wǎng)絡特征指標的歷時變化規(guī)律,進一步以20年為單位時間片來切分明代進士關系網(wǎng)絡,并計算歷時統(tǒng)計特征,如圖2所示。從圖2看出,明代進士社會關系網(wǎng)絡的平均路徑長度相對穩(wěn)定,介于3.8~4.4,而節(jié)點的平均度則從洪武時期的2.3逐漸上升,至弘治朝達到3.8,在萬歷朝達到頂峰值4.1,這表明網(wǎng)絡節(jié)點的活躍度存在一個隨著社會發(fā)展而逐步提升,并趨于平穩(wěn)的過程。另一方面,反映鄰居節(jié)點連接緊密程度的平均聚類系數(shù),從洪武時期的0.142 逐步上升,在弘治朝達到高點,并長期保持相對平穩(wěn)。圖2 的曲線變化從側面表明,明代社會風氣在弘治時期有一個較大的變化,進士人物的社會活躍程度顯著增加,進士群體之間的交往也更為緊密,這種趨勢一直持續(xù)到了萬歷朝。
當然,本文構建的進士網(wǎng)絡本質(zhì)上是一個人工網(wǎng)絡,無論數(shù)據(jù)的代表性和真實性如何提高,也始終是對真實網(wǎng)絡的部分還原,但依舊可以從明代社會的思想文化變化來解釋圖2所反映的變遷:明初對思想文化鉗制較嚴厲,程朱理學一統(tǒng)思想領域,法網(wǎng)嚴密,士人群體的社會活躍度較低;成弘之際,紀綱漸寬,思想文化漸趨活躍;正嘉時,陳獻章、王守仁的心學思想對程朱理學造成極大的沖擊,推動了士人的思想解放和個性解放,進士群體的思想觀念發(fā)生了顯著變化,整個社會的活躍度不斷提升;而到了隆萬時期,商品經(jīng)濟空前繁榮,社會風尚急劇變化,王守仁心學在發(fā)展過程中逐漸變異,士大夫心態(tài)出現(xiàn)嬗變,社會交往呈現(xiàn)更為多元化的特征。
為進一步理解這一具體變化,本文抽取不同時期進士人物的社會交往對象進行對比,發(fā)現(xiàn)成弘之前士人的社會交往多集中在士人群體內(nèi)部,大約在正嘉之后士大夫的交往對象出現(xiàn)較明顯的階層下移與擴大現(xiàn)象,商人、畫家、隱士、僧人、傳教士、藝妓、工匠、樂師等各階層人物紛紛進入士大夫的交游圈。圖3展示了晚明社會各階層人物與晚明進士群體交游的部分例子??梢钥闯觯砻魃鐣L氣開放而包容,以往傳統(tǒng)士大夫恥于為伍的商賈、工匠、樂師等階層的社會地位得到極大的提升;還出現(xiàn)了不少絕意仕進,轉而追求人生適意的名士、隱士和山人,表明晚明士人的心態(tài)發(fā)生較大變化。從圖3還看出,晚明社會思想活躍,藝術文化領域空前繁榮,可用晚明江西文人徐世溥在其信札中的一句評述來概括:“若……袁嘉興之窮理,焦秣林之博物,董華亭之書畫,徐上海、利西士之歷法,湯臨川之詞曲,李奉祠之本草……下而時氏之陶,顧氏之冶,方氏、程氏之墨、陸氏攻玉,何氏刻印,皆可與故作者同敝天壤?!笨梢灶A見,當數(shù)據(jù)持續(xù)積累時,還可以進一步應用社會網(wǎng)絡分析方法來分析網(wǎng)絡的動態(tài)演化,揭示網(wǎng)絡特征演進所折射出的不同歷史時期的社會結構和風尚的變遷過程。
圖3 晚明各階層人物與進士群體的社會交往
本研究基于數(shù)據(jù)集提供的維表,嘗試從更多維度觀察明代進士社會網(wǎng)絡,探索人物社會關系和親屬關系的分布,并結合史料進行循證分析、量化統(tǒng)計和關系挖掘。
2.3.1 高親密度進士人物發(fā)現(xiàn)與分析
通過對指數(shù)年段1368-1644 年的明代進士社會關系網(wǎng)絡的量化統(tǒng)計與分析,發(fā)現(xiàn)生活在科舉社會的士大夫群體,以血緣、地緣、學緣、業(yè)緣等關系為經(jīng)緯,形成了一個錯綜復雜的多元化社會關系網(wǎng)絡,他們之間通過唱和雅集、贈詩作文、序跋應酬、舉薦結社等一系列形形色色的社會活動,建立并維系著不同層次的社會關系,實現(xiàn)并強化彼此的身份認同。進一步定義兩個人物之間的親密度為節(jié)點之間全部關系以及關系發(fā)生次數(shù)的加權和,表3列出了歸一化后具有較高親密度的部分代表性人物及其具體關系,其中年號為人物的主要活動時期。由表3 可知,從橫向看,這些關系密切的進士之間普遍存在同鄉(xiāng)、同社、同年、同門、姻親等關系。
首先是以地緣為中心的鄉(xiāng)黨關系。對表中所列人物的循證分析表明,不少同鄉(xiāng)士子在入仕前,通過會講、會課等形式結成文社,相互砥礪學習。比如,顧清與李希顏是華亭同鄉(xiāng),二人為諸生時與錢福、黃明、曹閔、顧斌等共結六人社,互相辨析義理,探討制藝文章,后錢福于弘治三年高中狀元,顧清、李希顏、黃明三人于弘治六年考中進士。在京同鄉(xiāng)進士也常組織宴會雅集。比如,徐源與王鏊是蘇州府吳縣同鄉(xiāng),二人與吳寬、毛珵、李杰、陳璚等在京蘇籍進士,結成吳中文字會,輪流舉辦雅集,增進同鄉(xiāng)情誼。
其次是因會試締結的同年關系。應試舉子來自兩京十三省,雖然地域出身不同,但通過同年會等形式建立起新的社會關系,事實上,在明代,同年進士幾乎具有兄弟之義。例如,徐階以座師身份為《嘉靖癸丑科進士便覽錄》作序時便曾言:“有能明于兄弟之義者,可語于事君矣。”同年進士在官場上往往互相照應,形成重要的圈子網(wǎng)絡。
表3 具有高親密度的明代進士人物及主要關系(部分)
最后是同年同鄉(xiāng)進士之間,更易聯(lián)姻結親,使得進士之間的關系更為緊密。比如,表3中楊守祉之女就嫁于同鄉(xiāng)進士陸瑜的從孫陸偁(弘治六年進士);顧清與李希顏、王鏊與毛珵等也都結成兒女親家;張居正與李幼滋不僅是姻親,而且二人在政治上互為奧援,張居正父親去世,正是李幼滋首倡“奪情”。此外,舅甥關系自古密切。表3 中張璁與王激、徐溥與吳儼就屬舅甥關系,張璁長王激四歲,二人都從學于李階(正德六年進士),而吳儼選庶吉士時,其舅徐溥時任吏部左侍郎兼翰林學士,對吳儼提攜有加。明代進士之間的這種橫向聯(lián)系,吳寬曾概括為:“同時也,同鄉(xiāng)也,同朝也,而又同志也,同道也,因名之曰‘五同會’?!倍爸T同”之間的婚婭網(wǎng)絡,進一步鞏固了群體成員之間的聯(lián)結。
明代科舉社會中的功名具有序列性,其等級意識通過稱謂、服飾、地位等不斷得到強化。即便是沒有功名的童生,其社會地位已高于平民,獲得生員功名后,可享有廩膳月供、徭役優(yōu)免等特權,并能通過各種形式參與地方政治。舉人、進士的社會地位與庶民相比更是判若云泥。因此,明代科舉競爭異常激烈,要獲得最低的生員功名,一般也要經(jīng)縣、府、道三試。而考取舉人、進士的鄉(xiāng)試、會試,更帶有偶然性。所以,科舉各級考試的主試官,因其對所錄考生的提攜賞識之恩,往往被考生尊為座師。以會試產(chǎn)生的師生關系為例,一旦締結,座師門生名分終生不變,座師舉薦提攜門生不遺余力,門生則事座師如父,若師生同朝為官,往往互為奧援,甚至結成朋黨[31]。從縱向看,表3所列進士人物中,座主門生之間的交往非常密切。以弘治六年進士何孟春與其座師李東陽為例,經(jīng)循證分析發(fā)現(xiàn),李東陽對何孟春極為賞識,常將孟春之作介紹給同僚,稱“此吾楚后來之杰也”;何孟春則終身追慕李東陽,是李東陽茶陵派的核心成員,在其為李東陽百首《擬古樂府》所作的注解中,表明對李東陽師古觀的全面接受,而其所著《余冬詩話》也被視為對李東陽《懷麓堂詩話》的延續(xù)與變新。此外,庶吉士在3年的學習生涯中,往往會與館師結下深厚情誼。比如,隆慶二年庶吉士于慎行,曾將館師殷士儋的文集《金輿山房集》編次成書,并在序言中敘其恩澤;殷士儋去世后,于慎行“馳往伏哭”,親作祭文和行狀緬懷其師,多年后又造訪舊居并作詩懷念。
2.3.2 進士核心人物量化分析
通過網(wǎng)絡節(jié)點的特征向量中心性,可以對明代進士人物按影響力進行排序,表4列出了指數(shù)年1368-1644 年,特征向量中心性排名前100的核心進士人物。這些人物在當時社會享有較高的聲望和影響力,其中有李東陽、嚴嵩、張居正、王世貞等明代習見的著名人物,也有宋儀望、郭子章等未受重視的各類人物。
表4 基于特征向量中心性的明代進士Top100核心人物(指數(shù)年段1368-1644年)
通過對核心人物節(jié)點的相關維度特征的統(tǒng)計分析,發(fā)現(xiàn)這一具有高聲望的核心進士群體,呈現(xiàn)出3個特點。
(1)高科名現(xiàn)象。在表4的核心人物中,一甲進士13人,二甲進士44人,庶吉士37人,會試名次在百名以內(nèi)的57人,鄉(xiāng)試解元10人。實際上,明代官員銓選雖有多種途徑,但宣德之后選官以科甲為重,尤重翰林,天順之后逐漸形成非翰林不入內(nèi)閣的趨勢。庶吉士雖無品級,但3年后散館一般會得授翰林或科道等臺諫官,這些都是被視作“清華之選”的重要職位,《明史選舉志》更稱:“庶吉士始進之時,已群目為儲相?!北? 中,王恕、劉大夏、王廷相、張邦奇、呂本、王維楨、王材、殷士儋、許國、趙用賢等10人原為三甲進士,本來大多要被外放,但通過館選后成為庶吉士,散館后順利進入高層決策圈,這充分顯示高科名進士在政治上的絕對優(yōu)勢。
(2)高官階或高學術影響力。從仕途經(jīng)歷看,表4中仕至內(nèi)閣學士21人,其中曾任內(nèi)閣首輔的14人。此外,曾任會試考官的13人,擔任庶吉士教習的9 人。值得注意的是,21 名內(nèi)閣輔臣中,有14人曾主持過會試,這說明通過座師門生關系建立政治勢力是普遍現(xiàn)象。還有一類聲望較高的人物為名宗宿儒或書院山長,如“氣學”代表人物羅欽順和王廷相、“甘泉學派”的湛若水、“心學”的王守仁及其門人鄒守益、羅洪先、王畿。實際上,明中期之后,程朱理學受到以“心學”為代表的其他學說的不同程度的沖擊,這些聚合在學術領袖周圍的同門士子切磋學問,游從聚合,對文化學術和政治生活產(chǎn)生了重要影響。從這個意義上講,立功與立言始終是明代士大夫群體的兩個主要目標。
(3)中進士時年齡低,生源主要來自國子監(jiān)。據(jù)郭培貴考證,明代進士群體中式時的平均年齡為33.4歲[32],而表4中百名核心人物中進士時的平均年齡僅為28.5歲,其中年紀最小的何景明只有17歲,李東陽和楊一清均為18歲,成化二十三年狀元費宏20歲,是明代最年輕的狀元。當然,無論是庶吉士選考,還是吏部銓選,對進士的年齡都有限制,因此一些考生往往會少報年齡,即所謂的官年現(xiàn)象[33],但相對來看,本文構建的進士社會網(wǎng)絡中的核心人物,中進士時的平均年齡比整體進士的年齡要小5歲,表明年輕的進士更容易獲得政治資源,具有更大的仕途發(fā)展空間。此外,從生源看,核心進士中國子生出身的占到半數(shù),當然這與監(jiān)生本身的學業(yè)素質(zhì)有關系,一是優(yōu)貢選貢的生源本身質(zhì)量高,二是國子監(jiān)每科都會吸收落第舉人入監(jiān)學習,因而中式率更高,但也表明作為國家最高學府,明代國子監(jiān)教育水平居于全國前列。
2.3.3 關系子圖分析
對一些重要的進士人物,通過網(wǎng)絡關系子圖進一步來觀察他們之間的社會關系。以張居正為例,提取其政治類社會關系的子圖,如圖4 所示。張居正的改革政治群體以及反對者群體,主要由同年、同鄉(xiāng)、門生、姻親等人物組成。通過圖4提供的線索,經(jīng)循證分析可知,隆慶六年張居正擔任內(nèi)閣首輔后,為順利推行新政,開始大規(guī)模構筑政治勢力網(wǎng)絡。網(wǎng)絡成員主要包括殷正茂、宋儀望、凌云翼、徐栻、汪道昆、吳百朋、劉應節(jié)、李幼滋等嘉靖二十六年的同年進士;梁夢龍、龐尚鵬、張學顏、劉堯誨、陳瑞等嘉靖三十二年的門生進士;商為正、林應訓、朱璉、傅作舟等隆慶五年的門生進士,以及方逢時、耿定向、曾省吾、王宗載、李維楨等湖廣同鄉(xiāng)進士。這一進士群體在張居正主持的平定西南叛亂和東南倭寇、整飭邊防、治理漕河、清丈田畝和推行一條鞭法等歷史事件和過程中發(fā)揮了重要作用。
圖4 張居正與反對者的政治關系網(wǎng)絡
然而,改革不可避免會觸及各個階層的利益,在新政推進過程中,張居正也不斷遇到阻力。一是萬歷五年爆發(fā)的反對張居正“奪情”的事件,其反對派成員主要包括以吳中行為首的隆慶五年進士群體,以及以趙志皋為首的隆慶二年庶吉士群體。進一步觀察發(fā)現(xiàn),這些進士中不少人是江西籍進士,他們對張居正重用楚人感到不滿,借機上疏極諫張居正丁憂守制。然而,在張居正的強勢打壓下,反對派進士絕大部分被貶謫罷黜乃至下獄?!皧Z情”風波之后,次輔張四維與張居正關系開始惡化。萬歷十年張居正卒后,當權的張四維起復了大批之前被張居正貶謫的人,并與其萬歷五年的門生進士形成倒張聯(lián)盟,對張居正改革群體開始清算。圖4中的禮部尚書潘晟、吏部尚書梁夢龍、工部尚書曾省吾、兵部尚書吳兌、左副都御史勞堪、南京刑部尚書殷正茂、兩廣總督陳瑞、湖廣巡撫陳省、兵部左侍郎高文薦、光祿寺少卿傅作舟等張居正改革派核心人物,紛紛被彈劾罷斥。由此可見,以座師門生、年誼鄉(xiāng)誼、宗族姻親等關系為基礎的社會關系網(wǎng)絡演化到最后,容易形成政治同盟或政治對抗。有學者認為,晚明的門戶黨爭,在張居正奪情之爭時已埋下禍根,張居正去世之后,朋黨政治遽然興起,遂無法遏制[34],圖4從另一個視角印證了這一觀點。
隨著數(shù)字人文等概念的提出和興起,數(shù)據(jù)驅(qū)動的研究范式受到越來越多的關注。在此背景下,本文基于數(shù)字人文理念,提出一個基于知識庫和文獻的歷史人物關系挖掘方法,并對明代進士群體的社會網(wǎng)絡進行了實證研究。借助社會網(wǎng)絡分析技術和量化統(tǒng)計方法,得到如下結果:
(1)明代進士社會關系網(wǎng)絡具有類似現(xiàn)代社交網(wǎng)絡的小世界特性與高聯(lián)結現(xiàn)象,從網(wǎng)絡的平均度和聚類系數(shù)看,以弘治為界,明代中后期的網(wǎng)絡活躍度顯著高于明前期,反映明初思想文化鉗制嚴厲,弘治之后開始松動。此外,在晚明進士的社交圈中,不乏僧道、山人、工匠、樂伎、傳教士等社會各階層人物,表明隨著社會文化變遷,晚明社會風氣趨向開放,士人心態(tài)更加包容。
(2)明代科舉社會的進士群體形成一個縱橫交錯的關系網(wǎng)絡,表現(xiàn)在同年、同鄉(xiāng)、同學、同門等諸同關系,以及由各級科舉考試產(chǎn)生的座主門生、學術師承等關系。通過詩文唱和、記詠序跋、雅集宴飲等日常交游,以及薦舉保任、官場奧援、聯(lián)姻結親等行為,這些關系得以維系和加強,對明代社會的發(fā)展產(chǎn)生了深遠的影響。
(3)明代進士群體的核心人物具有鮮明的時代特征?;谔卣飨蛄恐行男缘暮诵娜宋锶后w特征表明,高影響力人物普遍具有高科名、高官階或高學術聲望等特點,中進士時的平均年齡顯著低于整體平均年齡,表明年輕進士更容易獲得政治資源。此外,分析核心人物的歷官可以發(fā)現(xiàn),內(nèi)閣首輔和學術大儒最具社會聲望,從側面說明在明代士大夫的精神世界中,事功和立言始終為其主要目標。
(4)核心政治人物的社會關系呈現(xiàn)類似差序格局的特點,無論是張居正新政群體,反對張居正“奪情”的群體還是張居正死后對其進行清算的群體,都是以座師門生、同鄉(xiāng)同年、宗族姻親等關系為基礎結成政治同盟,反映了晚明社會朋黨政治的結構特征。
作為一項實證研究,上述結果是對本文所構建的明代進士社會網(wǎng)絡的一種探索和嘗試。在本文框架下,可以繼續(xù)構建各種面向?qū)W術主題的數(shù)據(jù)集,并根據(jù)需求構建包括符號網(wǎng)絡在內(nèi)的各種其他類型的網(wǎng)絡,運用社會網(wǎng)絡分析技術和量化統(tǒng)計方法進一步展開研究,如探討晚明黨爭、東林書院網(wǎng)絡、內(nèi)閣政治變遷等一系列問題。需要說明的是,對任何歷史社會關系網(wǎng)絡的重建,只是數(shù)據(jù)化史料中反映的歷史,是對史實的“近真與頭緒”。因此,史料數(shù)據(jù)是否具有代表性和真實性是提煉相關觀點或發(fā)現(xiàn)的前提。此外,CBDB采用眾包方式,雖然積累了相當規(guī)模的數(shù)據(jù),但仍不可避免存在疏漏缺失之處,這就要求在使用CBDB時要充分考慮數(shù)據(jù)分布并作數(shù)據(jù)預處理。從這個角度來說,傳統(tǒng)研究范式所強調(diào)的對古籍史料的甄別思辨能力,在大數(shù)據(jù)背景下不但沒有削弱,反而顯得更重要了。事實上,從數(shù)據(jù)抽取與集成,網(wǎng)絡構建與分析,到知識挖掘和循證分析,每個階段都深感結合史料來思考和體悟的重要性。
本研究的意義在于為大數(shù)據(jù)環(huán)境下的歷史社會學研究提供了一種新思路,也展現(xiàn)了數(shù)據(jù)驅(qū)動的知識生產(chǎn)范式的潛力。通過構建歷史社會關系網(wǎng)絡,運用社會網(wǎng)絡分析方法,得以從全局的時空視角觀察明代進士網(wǎng)絡的特征與演變,并得到量化的、可復現(xiàn)的結果,而這些結果是傳統(tǒng)史料辨析方法難以發(fā)現(xiàn),或者至少難以輕易發(fā)現(xiàn)的。隨著網(wǎng)絡科學和機器學習等信息技術的進一步發(fā)展,以及更多更有效的數(shù)據(jù)獲取和分析手段的出現(xiàn),相信這種跨學科融合的多元化研究范式會帶來學術上的創(chuàng)新。然而,本研究仍然存在局限性,如數(shù)據(jù)的獲取依賴于領域知識,較難支持大批資料的系統(tǒng)化處理;而從傳統(tǒng)學者角度看,本文實證研究的相關結論可能仍顯“表淺”。未來筆者將繼續(xù)探索機器學習技術在歷史人物關系抽取中的應用,以獲得更大規(guī)模的數(shù)據(jù),并與相關領域?qū)W者合作,進行更有深度的人文知識挖掘研究。
注釋
①http://networkx.github.io/.
②數(shù)據(jù)來源:http://socialnetworks.mpi-sws.org/datawosn2009.html.
③數(shù)據(jù)來源:http://socialcomputing.asu.edu/datasets/Douban.
④數(shù)據(jù)來源:https://www.isi.edu/~lerman/downloads/digg2009.html.
⑤數(shù)據(jù)來源:http://snap.stanford.edu/data/com-Youtube.html.