排行榜指標的權重設置

2017-07-18 16:06王兆鵬

當代作家 2017年7期

王兆鵬

排行榜是以數(shù)據為基礎，數(shù)據指標的完備與否就成為排行榜的結果是否科學有公信力的前提。指標設置越多，越趨向科學、合理。問題是，文學作品的許多指標無法量化統(tǒng)計，有些能夠量化統(tǒng)計的，又無法取得完整的數(shù)據。能夠取得完整數(shù)據的指標，其價值和置信度也不同。比如我們要談論一個詩人的影響力，我們就渴望知道：他有多少作品傳世，作品有多少版本，歷代刻印發(fā)行量多大，碼洋多少，多少人學習、模仿、談論過、選過他的作品，海外知名度如何，石刻作品多少次，多少地方有他的遺跡和紀念地，美譽度或惡評如何，畫像有多少，有關他的文物拍賣價多高……總之，這些指標越多越詳細越好?？上?，它們大部分無法取得準確的統(tǒng)計數(shù)據。

我們在做《唐詩排行榜》時，考慮過要統(tǒng)計每一首詩對后世詩人創(chuàng)作的影響，但數(shù)據采集相當困難。做《宋詞排行榜》時，為了統(tǒng)計每首宋詞對后世詞人的影響，我們采集了后世詞人追和宋詞的情況，但這也只是后世詞人學習仿效宋詞的一個方面，創(chuàng)作方法和創(chuàng)作精神上的仿效暫時還沒有好的辦法采集數(shù)據來統(tǒng)計。

對比“國家綜合實力排行榜”、“城市綜合競爭實力排行榜”的數(shù)十個指標，我們的唐詩宋詞排行榜只用三、五個指標，當然太少，難以讓人信服。努力尋找新的排行指標，增加指標的豐富度，借以提高可信度，將是改進文學影響力評價指標體系的主要途徑。理想的情況應該找到十種以上的排行數(shù)據源，然后進行數(shù)據處理。我們目前能考慮到的作品影響力的評價指標，大約可分三類：作品的典范性、美譽度和傳閱度。權重的設置，主要有客觀賦權和主觀賦權兩種?？陀^賦權，是以定量分析的方法，根據數(shù)據的完備程度、分布密度和活躍程度等計算出各指標的權重；主觀賦權，是用定性分析的方法，根據各個指標影響因子的大小來人為設定各指標的權重。主觀賦權法，又有專家評判法和層次分析法兩種。唐詩宋詞排行榜主要用主觀賦權法中的專家評判法，雖然有一定的學理依據，但因為是初次嘗試，沒有前行的成果可資借鑒，也未經眾多專家的討論形成共識，所以對相關權重的設定，能是“一家之言”，未必能得到公眾和專家學者的認可。

文學排行榜評價指標的權重設置，最理想的狀態(tài)是客觀賦權法和主觀賦權法相結合。可以考慮：各種類別的指標用客觀賦權法，通過軟件計算來確定；而各個具體指標，用主觀賦權法來設置，定性分析中參用定量數(shù)據。比如選本，既要考慮選本這一大類指標在整個評價指標體系中的權重（用客觀賦權法計算），又要考慮每個選本指標的權重差異。試舉幾個宋詞選本為例說明：

南宋曾慥的《樂府雅詞》編成于南宋高宗紹興十六年（1146年），黃升的《花庵詞選》成書于理宗淳祐九年（1249年），明代陳耀文的《花草稡編》初刻于萬歷十一年（1583年），清代朱彝尊編選的《詞綜》始刊于清康熙三十年（1691年），近人朱彊邨《宋詞三百首》初印于1924年，宋詞排行榜中采用選本最晚的一種是2003年高等教育出版社出版的《中國古代文學作品選》。從傳播、出版的周期（時間長度）來看，如果以2008年統(tǒng)計得出《宋詞排行榜》的結果為下限，那么，《樂府雅詞》的出版周期已有862年，《花庵詞選》的周期有759年，《花草稡編》有425年，《詞綜》有317年，《宋詞三百首》為84年，《中國古代文學作品選》僅5年。傳播周期越長，其傳閱度應該越高，到達率、知曉率應該越高。如果不加區(qū)別地將每個選本入選的數(shù)據同等看待，當然是不公平、不合理的。這還僅僅是時間上的傳播周期的差別，還沒考慮空間上的傳播廣度。傳播廣度無法用數(shù)據來衡量，但可以依據每個選本的版本種數(shù)（印次）、印數(shù)（發(fā)行量）來評估。發(fā)行數(shù)百萬冊的《宋詞三百首》肯定比發(fā)行幾萬冊的《中國古代文學作品選》的到達率、傳播廣度要大得多。因此，每一部詞選，由于傳播周期（長度）和發(fā)行量（廣度）不同，而具備不同的傳播含金量，也就是傳播實際效率。因此，在統(tǒng)計不同作品入選頻次之前，應對所有詞選進行這種含金量的系數(shù)評定，使每一部詞選都有不同的傳播效率系數(shù)。一首作品入選不同的詞選，即獲得不同的系數(shù)積分。這與現(xiàn)代電視的收視率統(tǒng)計原理大致相同。

傳播周期與傳播廣度又如何設定分值？唐詩宋詞排行榜是按朝代來區(qū)分權重，尚嫌粗略。是否可以按年限來計算傳播周期的得分？比如，上述《樂府雅詞》的周期為862年，如果1年計1分，那么其傳播周期得分為862分，而《宋詞三百首》得84分，《中國古代文學作品選》得5分（具體統(tǒng)計時當然會對這些數(shù)值作標準化處理，否則數(shù)值過大，不便于比較分析）。那些出版年代不詳?shù)倪x本，可以據其成書的時代虛擬一個大致的周期時限。傳播廣度的得分，古代詞選按版本種類計算（如1種版本得1分），現(xiàn)代詞選按版次計算（重印或再版1次計1分），現(xiàn)代詞選還應考慮其印數(shù)的多少。傳播周期數(shù)與版本（版次）數(shù)的乘積，經過標準化處理后轉換成選本的效率系數(shù)。這些印數(shù)和發(fā)行量的數(shù)據，現(xiàn)在有的是可以獲得的。時過境遷之后，就很難說了。所以，我們應該注意搜集和保存這些出版發(fā)行量的資料數(shù)據。

在考量每個選本的傳播周期時，還應考慮每個選本的傳播時間差。這二者表面看起來，都涉及選本出版的時間長度，但實際上還是有區(qū)別，傳播周期是就選本在整個傳播歷程中的長度而言，傳播時間差是指同時代的選本出現(xiàn)的先后早晚。如唐詩選本中，盛唐的選本只可能入選初、盛唐人的詩作，無法入選此后中、晚唐的詩篇，以盛唐選本來統(tǒng)計和比較整個唐代詩人詩作的人選篇次，顯然對中、晚唐的詩人不公平，因為他們沒有“入選權”。同樣，宋人詞選中，南宋初期成書的《樂府雅詞》，就無法入選南宋中葉以后的詞人，如辛棄疾、張孝祥、陸游和姜夔、吳文英等人都沒有“入選權”；在黃升的《花庵詞選》中，宋末的周密、王沂孫、張炎、蔣捷和文天祥等人，也沒有機會入選。初唐人與晚唐人相差了兩百多年，宋初的詞人比宋末的詞人早了近三百年，前者有更多的傳播機會。把他們進行同等的傳播數(shù)量統(tǒng)計，必須將這個時間差考慮進去，以權重系數(shù)抹平彼此的時間差。評點數(shù)據中，對同時代被評的作家作品，也受這種時間差的影響，必須一并考慮其權重以平衡客觀數(shù)據存在的差異。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

排行榜指標的權重設置