陳慶華,史定華
(1. 福建師范大學 福州 350007; 2. 上海大學數(shù)學系 上海 寶山區(qū) 200444)
復雜網(wǎng)絡科學[1]和與之相關的人類動力學[2]發(fā)現(xiàn),許多復雜現(xiàn)象存在令人驚奇的普適規(guī)律,即涌現(xiàn)標度特性。例如,復雜網(wǎng)絡的度分布呈現(xiàn)P(k)~k?γ的冪律形式,人類時空行為往往陣發(fā)而非隨機,導致任務等待時間也呈現(xiàn)這一形式。物理學家側重探索它們形成的動力學機制,如增長擇優(yōu)連線或任務優(yōu)先權規(guī)則等。然而確認標度律是否成立還同時需要得到廣泛的統(tǒng)計支持。文獻[3]就用一幅圖展示了標度律的兩大支柱:機制成熟和統(tǒng)計支持的景觀。
圖1 統(tǒng)計支持
統(tǒng)計學是一門古老的學科,也是統(tǒng)計物理的基礎,取得了許多重要成果,有著廣泛的實際應用。在我國高校,統(tǒng)計學已列入一級學科,人才供不應求??茖W出版社出版的《統(tǒng)計手冊》[4]有百余萬字厚達千頁,但卻沒有涉及標度律的統(tǒng)計方法。究其原因主要是定義不夠明確,冪律形式是指近似冪律關系,嚴格冪律分布還是重尾分布,認識并不統(tǒng)一。
網(wǎng)絡科學剛剛出現(xiàn)時,人們普遍采用簡單的圖估計方法進行統(tǒng)計。而且主要是在雙對數(shù)坐標上畫頻率圖,看上去基本成一條直線就認為服從標度律。由于大度數(shù)節(jié)點稀少,尾部擺動太大,就采用粗?;膶?shù)盒子圖。在確定幾何增長網(wǎng)絡度分布指數(shù)時出現(xiàn)了反復,人們才開始使用畫補分布圖。關于這三種圖的畫法與比較,詳細討論參見文獻[5]。畫補分布圖實質上等價于畫秩次圖,秩次圖早在研究人類語言規(guī)律時就已被采用。Zipf在研究文本中單詞出現(xiàn)頻次時,將所有單詞排序,用橫坐標表示序號,縱坐標表示對應的頻次,在雙對數(shù)坐標上畫圖得到了著名的Zipf標度律。文獻[6]用兩套數(shù)據(jù)比較了頻率圖和秩次圖的優(yōu)劣,數(shù)據(jù)1和數(shù)據(jù)2分別從冪律分布和指數(shù)分布產(chǎn)生,并分別畫在雙對數(shù)坐標和半對數(shù)坐標上,他們發(fā)現(xiàn)按秩次畫圖正確,按頻率畫圖會出現(xiàn)錯誤??梢娬_統(tǒng)計方法的重要性。
圖估計方法全憑經(jīng)驗,結果因人而異?,F(xiàn)在考慮數(shù)值方法,對于嚴格連續(xù)冪律分布:
這是參數(shù)γ的極大似然估計,它是有偏估計,因為。文獻[8]證明了針對連續(xù)冪律分布不存在有效無偏估計,只存在漸近有效無偏估計:
進一步,文獻[8]還討論了假設檢驗和似然比檢驗。引入連續(xù)伽瑪分布
然而,復雜網(wǎng)絡中的度是離散的,上述估計結果需修正。另外,實際網(wǎng)絡的最小度也是隨機變量,而且對估計結果有重要影響。前面的討論都是假定實際網(wǎng)絡的度分布服從冪律分布,而這是需要統(tǒng)計檢驗的。更為重要的是度分布往往不是嚴格冪律的,而是重尾分布。重尾分布是一個很大的分布類,嚴格冪律分布只是其中最簡單的代表。文獻[9]發(fā)現(xiàn)Waring分布為:
是另一個重要代表,幾乎所有無標度增長網(wǎng)絡模型的度分布都是Waring分布。如BA模型度分布是α=2,β=m;復制模型入度分布是α=1,β=1的Waring分布。因此,深入研究雙參數(shù)Waring分布的統(tǒng)計分析方法具有重要的理論意義和實際價值。
[1] BARABáSI A-L, ALBERT R. Emergence of scaling in random networks[J]. Science, 1999(286): 509-512.
[2] BARABáSI A-L. The origin of bursts and heavy tails in human dynamics[J]. Nature, 2005(435): 207-211.
[3] STUMPF M P H, PORTER M A. Critical truths about power laws[J]. Science, 2012(335): 665-666.
[4] 茆詩松, 王靜龍, 史定華, 等. 統(tǒng)計手冊[M]. 北京: 科學出版社, 2003.MAO Shi-song, WANG Jing-long, SHI Ding-hua, et al.Statistical handbook[M]. Beijing: Science Press, 2003.
[5] 史定華. 網(wǎng)絡度分布理論[M]. 北京: 高等教育出版社,2011.SHI Ding-hua. Theory of network degree distributions[M].Beijing: Higher Education Press, 2011.
[6] LI L, ALDERSON D, DOYLE J C, et al. Towards a theory of scale-free graphs: definitions, properties, and implications[J]. Internet Math, 2005(2): 431-523.
[7] CLAUSET A, ROHILIA S, NEWMAN M E J. Power-law distributions in empirical data[J]. SIAM Review, 2009(51):661-703.
[8] 陳慶華, 陳月萍, 史定華. 冪律分布的統(tǒng)計性質及其應用[C]//第八屆全國復雜網(wǎng)絡學術會議. 南京: [出版者不詳],2012.CHEN Qing-hua, CHEN Yue-ping , SHI Ding-hua. The statistic property of power-law distributions and its applications[C]//The 8th Chinese Conference on Complex Networks. Nanjing: [s.n.], 2012.
[9] 史定華. 關于無標度網(wǎng)絡[C]//第八屆全國復雜網(wǎng)絡學術會議. 南京: [出版者不詳], 2012.SHI Ding-hua. About scale-free networks[C]//The 8th Chinese Conference on Complex Networks. Nanjing: [s.n.],2012.