王兆鵬
排行榜是以數(shù)據為基礎,數(shù)據指標的完備與否就成為排行榜的結果是否科學有公信力的前提。指標設置越多,越趨向科學、合理。問題是,文學作品的許多指標無法量化統(tǒng)計,有些能夠量化統(tǒng)計的,又無法取得完整的數(shù)據。能夠取得完整數(shù)據的指標,其價值和置信度也不同。比如我們要談論一個詩人的影響力,我們就渴望知道:他有多少作品傳世,作品有多少版本,歷代刻印發(fā)行量多大,碼洋多少,多少人學習、模仿、談論過、選過他的作品,海外知名度如何,石刻作品多少次,多少地方有他的遺跡和紀念地,美譽度或惡評如何,畫像有多少,有關他的文物拍賣價多高……總之,這些指標越多越詳細越好??上?,它們大部分無法取得準確的統(tǒng)計數(shù)據。
我們在做《唐詩排行榜》時,考慮過要統(tǒng)計每一首詩對后世詩人創(chuàng)作的影響,但數(shù)據采集相當困難。做《宋詞排行榜》時,為了統(tǒng)計每首宋詞對后世詞人的影響,我們采集了后世詞人追和宋詞的情況,但這也只是后世詞人學習仿效宋詞的一個方面,創(chuàng)作方法和創(chuàng)作精神上的仿效暫時還沒有好的辦法采集數(shù)據來統(tǒng)計。
對比“國家綜合實力排行榜”、“城市綜合競爭實力排行榜”的數(shù)十個指標,我們的唐詩宋詞排行榜只用三、五個指標,當然太少,難以讓人信服。努力尋找新的排行指標,增加指標的豐富度,借以提高可信度,將是改進文學影響力評價指標體系的主要途徑。理想的情況應該找到十種以上的排行數(shù)據源,然后進行數(shù)據處理。我們目前能考慮到的作品影響力的評價指標,大約可分三類:作品的典范性、美譽度和傳閱度。權重的設置,主要有客觀賦權和主觀賦權兩種??陀^賦權,是以定量分析的方法,根據數(shù)據的完備程度、分布密度和活躍程度等計算出各指標的權重;主觀賦權,是用定性分析的方法,根據各個指標影響因子的大小來人為設定各指標的權重。主觀賦權法,又有專家評判法和層次分析法兩種。唐詩宋詞排行榜主要用主觀賦權法中的專家評判法,雖然有一定的學理依據,但因為是初次嘗試,沒有前行的成果可資借鑒,也未經眾多專家的討論形成共識,所以對相關權重的設定,能是“一家之言”,未必能得到公眾和專家學者的認可。
文學排行榜評價指標的權重設置,最理想的狀態(tài)是客觀賦權法和主觀賦權法相結合。可以考慮:各種類別的指標用客觀賦權法,通過軟件計算來確定;而各個具體指標,用主觀賦權法來設置,定性分析中參用定量數(shù)據。比如選本,既要考慮選本這一大類指標在整個評價指標體系中的權重(用客觀賦權法計算),又要考慮每個選本指標的權重差異。試舉幾個宋詞選本為例說明:
南宋曾慥的《樂府雅詞》編成于南宋高宗紹興十六年(1146年),黃升的《花庵詞選》成書于理宗淳祐九年(1249年),明代陳耀文的《花草稡編》初刻于萬歷十一年(1583年),清代朱彝尊編選的《詞綜》始刊于清康熙三十年(1691年),近人朱彊邨《宋詞三百首》初印于1924年,宋詞排行榜中采用選本最晚的一種是2003年高等教育出版社出版的《中國古代文學作品選》。從傳播、出版的周期(時間長度)來看,如果以2008年統(tǒng)計得出《宋詞排行榜》的結果為下限,那么,《樂府雅詞》的出版周期已有862年,《花庵詞選》的周期有759年,《花草稡編》有425年,《詞綜》有317年,《宋詞三百首》為84年,《中國古代文學作品選》僅5年。傳播周期越長,其傳閱度應該越高,到達率、知曉率應該越高。如果不加區(qū)別地將每個選本入選的數(shù)據同等看待,當然是不公平、不合理的。這還僅僅是時間上的傳播周期的差別,還沒考慮空間上的傳播廣度。傳播廣度無法用數(shù)據來衡量,但可以依據每個選本的版本種數(shù)(印次)、印數(shù)(發(fā)行量)來評估。發(fā)行數(shù)百萬冊的《宋詞三百首》肯定比發(fā)行幾萬冊的《中國古代文學作品選》的到達率、傳播廣度要大得多。因此,每一部詞選,由于傳播周期(長度)和發(fā)行量(廣度)不同,而具備不同的傳播含金量,也就是傳播實際效率。因此,在統(tǒng)計不同作品入選頻次之前,應對所有詞選進行這種含金量的系數(shù)評定,使每一部詞選都有不同的傳播效率系數(shù)。一首作品入選不同的詞選,即獲得不同的系數(shù)積分。這與現(xiàn)代電視的收視率統(tǒng)計原理大致相同。
傳播周期與傳播廣度又如何設定分值?唐詩宋詞排行榜是按朝代來區(qū)分權重,尚嫌粗略。是否可以按年限來計算傳播周期的得分?比如,上述《樂府雅詞》的周期為862年,如果1年計1分,那么其傳播周期得分為862分,而《宋詞三百首》得84分,《中國古代文學作品選》得5分(具體統(tǒng)計時當然會對這些數(shù)值作標準化處理,否則數(shù)值過大,不便于比較分析)。那些出版年代不詳?shù)倪x本,可以據其成書的時代虛擬一個大致的周期時限。傳播廣度的得分,古代詞選按版本種類計算(如1種版本得1分),現(xiàn)代詞選按版次計算(重印或再版1次計1分),現(xiàn)代詞選還應考慮其印數(shù)的多少。傳播周期數(shù)與版本(版次)數(shù)的乘積,經過標準化處理后轉換成選本的效率系數(shù)。這些印數(shù)和發(fā)行量的數(shù)據,現(xiàn)在有的是可以獲得的。時過境遷之后,就很難說了。所以,我們應該注意搜集和保存這些出版發(fā)行量的資料數(shù)據。
在考量每個選本的傳播周期時,還應考慮每個選本的傳播時間差。這二者表面看起來,都涉及選本出版的時間長度,但實際上還是有區(qū)別,傳播周期是就選本在整個傳播歷程中的長度而言,傳播時間差是指同時代的選本出現(xiàn)的先后早晚。如唐詩選本中,盛唐的選本只可能入選初、盛唐人的詩作,無法入選此后中、晚唐的詩篇,以盛唐選本來統(tǒng)計和比較整個唐代詩人詩作的人選篇次,顯然對中、晚唐的詩人不公平,因為他們沒有“入選權”。同樣,宋人詞選中,南宋初期成書的《樂府雅詞》,就無法入選南宋中葉以后的詞人,如辛棄疾、張孝祥、陸游和姜夔、吳文英等人都沒有“入選權”;在黃升的《花庵詞選》中,宋末的周密、王沂孫、張炎、蔣捷和文天祥等人,也沒有機會入選。初唐人與晚唐人相差了兩百多年,宋初的詞人比宋末的詞人早了近三百年,前者有更多的傳播機會。把他們進行同等的傳播數(shù)量統(tǒng)計,必須將這個時間差考慮進去,以權重系數(shù)抹平彼此的時間差。評點數(shù)據中,對同時代被評的作家作品,也受這種時間差的影響,必須一并考慮其權重以平衡客觀數(shù)據存在的差異。