王光斌 楊菊英
摘 要: 通過對互聯(lián)網(wǎng)實際數(shù)據(jù)的分析,中國互聯(lián)網(wǎng)網(wǎng)站數(shù)量眾多,在復雜的網(wǎng)絡(luò)中真正有效的鏈接經(jīng)過試驗調(diào)查分析卻非常有限,本文進一步通過算法設(shè)計和計算機仿真,對中國互聯(lián)網(wǎng)的資源整合提出看法,旨在對互聯(lián)網(wǎng)資源的整合有較強的實用價值。
關(guān)鍵詞: 小世界網(wǎng)絡(luò) 互聯(lián)網(wǎng)資源 影響
1.引言
根據(jù)中國互聯(lián)網(wǎng)中心CNNIC發(fā)表的實測數(shù)據(jù)顯示,中國互聯(lián)網(wǎng)的網(wǎng)站數(shù)量已經(jīng)超過60多萬,而且數(shù)目在迅速增加,但是每一個網(wǎng)站的有效連接差別非常巨大。在這龐大復雜的信息網(wǎng)絡(luò)中,如何讓人們享受到更高的有價值信息?李德毅院士認為,當前的迫切目標是讓“適當?shù)娜嗽谶m當?shù)臅r候享用適當?shù)男畔ⅰ?。有用的信息未必都是每一個人需要的信息,李國杰院士指出:“信息取精是關(guān)鍵?!崩钣灼皆菏拷柚鷥绱味商岢龅幕ヂ?lián)網(wǎng)信息資源一分為二,對信息資源進行整合。
2.計算方法
網(wǎng)絡(luò)(Network)在數(shù)學上以圖(Graph)表示,圖的研究最早起源于18世紀瑞士著名數(shù)學家Euler的哥尼斯堡七橋問題。復雜網(wǎng)絡(luò)可以借助圖論的語言和符號精確簡潔地描述對復雜網(wǎng)絡(luò)研究進行研究過程中,人們提出許多概念和度量方法,用以表示復雜網(wǎng)絡(luò)的結(jié)構(gòu)特性。
表1 變量及說明
度分布(Degree Distribution),是網(wǎng)絡(luò)的一個重要統(tǒng)計特征。這里的度(Degree)也稱為連通度(Connectivity),節(jié)點的度指的是與該節(jié)點連接的邊數(shù),度分布則表示節(jié)點度的概率分布函數(shù)P(x),指的是節(jié)點有條邊連接的概率(見表1)。
平均路徑長度(Average Path Length,APL)。平均路徑長度是網(wǎng)絡(luò)中另一個重要的特征度量,是指網(wǎng)絡(luò)中所有節(jié)點對之間的平均最短距離,即節(jié)點之間經(jīng)歷的邊的最小數(shù)目,其中所有節(jié)點之間的最大距離稱為網(wǎng)絡(luò)的直徑(Diameter),其都是影響網(wǎng)絡(luò)的傳輸性能與效率的重要參數(shù)。
3.模型分析
表2 互聯(lián)網(wǎng)連接數(shù)目調(diào)查報告
通過表2可以看出,連接數(shù)量超過50家以上的網(wǎng)站,所占比例不到總網(wǎng)站的2.7%,超過97%的網(wǎng)站的連接數(shù)目少于50個,只有極少數(shù)網(wǎng)站才擁有穩(wěn)定的連接:
A照馬衛(wèi)東的對中國互聯(lián)網(wǎng)資源研究得知,目前中國的互聯(lián)網(wǎng)是一種無尺度網(wǎng)絡(luò),并求出冪值數(shù)為2.124。并通過計算機的模擬仿真結(jié)果顯示節(jié)點間距離和服務(wù)器數(shù)目之間的關(guān)系所示,度分布的計算為:
假如服務(wù)器數(shù)目假設(shè)達到3000,隨著服務(wù)器數(shù)目的增加,節(jié)點間的平均距離在縮短,說明網(wǎng)絡(luò)世界小世界網(wǎng)絡(luò)存在,并且差異極大,當服務(wù)器的數(shù)目接近2000個網(wǎng)站是中心,節(jié)點的距離出現(xiàn)反彈,當超過2000這個數(shù)目的時候,平均距離又開始降低,這個數(shù)目的網(wǎng)站,在互聯(lián)網(wǎng)中的數(shù)量是適當?shù)?,效果也是較佳的。
但是并不是意味著服務(wù)器的數(shù)目越少,效果更佳,通過大連理工大學劉建國和中國科技大學的王文旭的研究實驗結(jié)果如下圖發(fā)現(xiàn),當代互聯(lián)網(wǎng)絡(luò)的用戶數(shù)目在2000左右的時候,對數(shù)據(jù)訪問的效果情況是:
圖 萬維網(wǎng)的r隨s的變化
r的數(shù)值開始趨近于-1,小于2000這個數(shù)值,r會逐步減少,網(wǎng)絡(luò)有效連接反而提高,畢竟人能夠接受的生理連接是有限度的,說明這個時候正是一個結(jié)點,超過這個數(shù)值,小世界網(wǎng)路越明顯,網(wǎng)絡(luò)越復雜,人們開始獲取信息的難度開始增加,在2000附近的時候,人們獲取信息資源的渠道較多,獲取信息資源的難度也比較適中。如何整合主流的網(wǎng)站,網(wǎng)站的數(shù)量需要不斷整合,并且控制有效的連接數(shù)量,是互聯(lián)網(wǎng)絡(luò)資源整合的重點。
4.結(jié)語
經(jīng)過計算結(jié)果發(fā)現(xiàn):網(wǎng)絡(luò)直徑有明顯的下降表明萬維網(wǎng)的小世界性質(zhì)增強,但是網(wǎng)站的數(shù)量與客戶端的連接數(shù)m的增加卻是下降的,也就是說人們獲取信息的難度隨之增加。因此,只要整合兩三千個網(wǎng)站作為主流資源,就可以在很大的程度上滿足網(wǎng)民的日常需求。
參考文獻:
[1]Li Xiang,Chen G R.A local-world evolving network model[J].Physical A,2003,328:274-286.
[2]朱濤.改進的加權(quán)復雜網(wǎng)絡(luò)節(jié)點重要度評估的收縮方法.系統(tǒng)工程與電子技術(shù),2009.8.
[3]席運江,黨延忠.基于知識網(wǎng)絡(luò)的專家領(lǐng)域知識發(fā)現(xiàn)及表示方法.系統(tǒng)工程,2005,23(8):110-115.
[4]李幼平.和諧互補的文化傳播體系.中國傳媒科技,2008.4.
[5]李幼平.雙結(jié)構(gòu)互補網(wǎng)絡(luò)的研究.西南科技大學學報,2006.3.
[6]章忠志.BA網(wǎng)絡(luò)的一個等價演化模型.系統(tǒng)工程,2005.2.