彭 川 李元香
(1.中南民族大學(xué)計(jì)算機(jī)學(xué)院 武漢 430074)(2.武漢大學(xué)軟件工程國家重點(diǎn)實(shí)驗(yàn)室 武漢 430072)
?
在線社交網(wǎng)絡(luò)信息傳播問題研究綜述*
彭 川1,2李元香2
(1.中南民族大學(xué)計(jì)算機(jī)學(xué)院 武漢 430074)(2.武漢大學(xué)軟件工程國家重點(diǎn)實(shí)驗(yàn)室 武漢 430072)
在線社交網(wǎng)絡(luò)在社會生活的諸多領(lǐng)域中日益顯現(xiàn)出重大影響和作用,研究在線社交網(wǎng)絡(luò)的相關(guān)問題已經(jīng)成為學(xué)術(shù)界和產(chǎn)業(yè)界的共識和迫切需要。信息傳播是在線社交網(wǎng)絡(luò)的核心功能,也是最核心的研究內(nèi)容。論文首先討論了在線社交網(wǎng)絡(luò)的發(fā)展現(xiàn)狀和信息傳播問題的研究意義,然后對現(xiàn)有的相關(guān)研究工作特別是信息傳播模型進(jìn)行了詳細(xì)的討論和歸納。接著,論文從幾種不同的視角討論了信息傳播問題的研究思路。此外,論文還結(jié)合在線社交網(wǎng)絡(luò)的特點(diǎn)討論了現(xiàn)有工作的不足之處。最后,探討了當(dāng)前研究中面臨的問題和將來的挑戰(zhàn)。
在線社交網(wǎng)絡(luò); 信息傳播; 信息傳播模型; 研究思路
Class Number TP399
近年來,以Twitter、Facebook、新浪微博、人人網(wǎng)等為典型代表的在線社交網(wǎng)站不斷出現(xiàn)并呈現(xiàn)爆炸式的規(guī)模增長,這標(biāo)志著在線社交開始成為互聯(lián)網(wǎng)新時(shí)代重要的人際交往方式,傳統(tǒng)的線下社交網(wǎng)絡(luò)開始逐步推廣到互聯(lián)網(wǎng)中并形成了更龐大的在線社交網(wǎng)絡(luò)。雖然這些在線社交網(wǎng)站的主要功能和用途有所差別,但都表現(xiàn)出驚人的在線信息傳播能力。
相比于傳統(tǒng)社交網(wǎng)絡(luò),在線社交網(wǎng)絡(luò)具有更大的網(wǎng)絡(luò)規(guī)模、更便捷的信息發(fā)布手段、更迅速的信息傳播速度,所以其造成的社會影響力已經(jīng)不亞于甚至超出了線下社會網(wǎng)絡(luò)。在社會學(xué)領(lǐng)域里,信息在社會網(wǎng)絡(luò)中傳播的含義是:在一個(gè)相對封閉的社會系統(tǒng)中,隨著時(shí)間的推移,信息、想法、觀念通過某個(gè)流通途徑在個(gè)體之間進(jìn)行傳播的過程。而在互聯(lián)網(wǎng)的時(shí)代背景下,在線社交網(wǎng)絡(luò)的廣泛應(yīng)用使得線下的社會關(guān)系擴(kuò)展到線上,信息的傳播變得更加便捷、高效,這也使得信息傳播的概念具有了更加豐富的內(nèi)涵和更大的影響。在線社交網(wǎng)絡(luò)已經(jīng)逐步成為人們對各種政治、經(jīng)濟(jì)和社會重大事件發(fā)表觀點(diǎn)、看法以及表達(dá)興趣關(guān)注的更為重要的平臺。在線社交網(wǎng)絡(luò)中,眾多的用戶個(gè)體通過種種形式建立起彼此之間的關(guān)聯(lián)。這些個(gè)體之間的在線交互行為可以使得信息隨著從用戶到用戶的傳遞而被共享、修改、再加工,從而不斷地傳播下去,于是形成了信息在網(wǎng)絡(luò)中的級聯(lián)擴(kuò)散。由于互聯(lián)網(wǎng)本身具有的特點(diǎn),與傳統(tǒng)社交網(wǎng)絡(luò)相比,在線社交網(wǎng)絡(luò)中的信息傳播過程表現(xiàn)出更加復(fù)雜、多變、隱晦和難以理解的特點(diǎn)。
在線社交網(wǎng)絡(luò)的蓬勃發(fā)展,給現(xiàn)實(shí)社會帶來了重大的影響。一方面,給人們提供了前所未有的便利性。網(wǎng)絡(luò)用戶比以往任何時(shí)候都能更方便地發(fā)布、獲取信息。在線社交網(wǎng)絡(luò)的核心功能是進(jìn)行有意義的信息傳播,比如最新的新聞頭條、最即時(shí)的賽事結(jié)果、即將上映的新電影推薦、新產(chǎn)品的在線推廣等。在線社交網(wǎng)絡(luò)中,信息的有效傳播無論是對于信息發(fā)布者,還是信息獲取者都起著十分重要的作用。信息傳播的一個(gè)典型用途是用于病毒式市場營銷,其大體思路是從網(wǎng)絡(luò)中選擇少數(shù)有影響力的目標(biāo)客戶首先接受產(chǎn)品,然后通過在網(wǎng)絡(luò)中發(fā)布其對產(chǎn)品的體驗(yàn)、評價(jià)等正面信息去影響網(wǎng)絡(luò)中其他用戶,進(jìn)而通過這些被影響的用戶去吸引更多的用戶接受產(chǎn)品。隨著影響的逐級傳播,產(chǎn)品的信息會被越來越多的網(wǎng)絡(luò)用戶所接受,于是達(dá)到了產(chǎn)品推銷和宣傳的目的。實(shí)際上,在商業(yè)金融領(lǐng)域,利用在線社交網(wǎng)絡(luò)作為市場營銷的重要工具已經(jīng)成為常見的選擇。由此可見,在線社交網(wǎng)絡(luò)中蘊(yùn)藏著巨大的商業(yè)價(jià)值和經(jīng)濟(jì)規(guī)模。
另一方面,在線社交網(wǎng)絡(luò)也帶來了負(fù)面影響。任何事物都是利弊共存,在線社交網(wǎng)絡(luò)給我們的生活帶來了諸多好處的同時(shí),也帶來了潛在的弊端。常見的如不法分子蓄意制造和傳播有損國家和社會利益的謠言,以達(dá)到其特殊的政治目的;通過社交工具發(fā)布虛假信息,實(shí)施欺詐、詐騙等違法行為;利用網(wǎng)絡(luò)視頻分享應(yīng)用、社交平臺等傳播網(wǎng)絡(luò)色情和暴力信息以達(dá)到非法獲取利益的目的。由于這類信息本身往往比正常信息更具有誘惑性和煽動性,通常在網(wǎng)絡(luò)中會以更快的速度傳播到很廣的范圍,從而造成不良影響,嚴(yán)重的影響在線網(wǎng)絡(luò)環(huán)境甚至于最終危害到社會的和諧與穩(wěn)定。
鑒于在線社交網(wǎng)絡(luò)對社會生活的重大影響,迫切需要對在線社交網(wǎng)絡(luò)進(jìn)行研究,以便深入理解其機(jī)制和規(guī)律,從而更好地運(yùn)用在線社交網(wǎng)絡(luò)為社會生活服務(wù)。在線社交網(wǎng)絡(luò)的主要研究內(nèi)容可概括為三個(gè)核心要素即網(wǎng)絡(luò)關(guān)系結(jié)構(gòu)、群體交互行為、信息傳播規(guī)律。這三個(gè)要素之間相互關(guān)聯(lián)彼此影響,網(wǎng)絡(luò)關(guān)系結(jié)構(gòu)是網(wǎng)絡(luò)用戶通過各種聯(lián)系形成的復(fù)雜關(guān)系的總稱,網(wǎng)絡(luò)關(guān)系為群體互動和信息傳播提供了必要的前提;群體交互是用戶之間通過網(wǎng)絡(luò)的連接呈現(xiàn)出來的復(fù)雜動態(tài)特征,也是導(dǎo)致信息傳播的根本原因;信息傳播則是網(wǎng)絡(luò)關(guān)系結(jié)構(gòu)和用戶交互行為的直觀體現(xiàn)和結(jié)果,也是研究在線社交網(wǎng)絡(luò)的關(guān)鍵內(nèi)容和最終目的。研究社交網(wǎng)絡(luò)中的信息傳播,能夠幫助我們從信息傳播的角度對網(wǎng)絡(luò)的關(guān)系結(jié)構(gòu),用戶特征、屬性以及彼此之間的影響,以及信息傳播所遵循的基本規(guī)律有一個(gè)系統(tǒng)、全面的認(rèn)識。對信息傳播問題的研究成果則對于市場營銷、電子商務(wù)、在線金融、輿論監(jiān)控等諸多領(lǐng)域具有重要的意義,具有廣闊的應(yīng)用前景。
如前所述,研究在線社交網(wǎng)絡(luò)的信息傳播問題具有重大的現(xiàn)實(shí)意義:一方面,利用在線社交網(wǎng)絡(luò)進(jìn)行信息傳播可以達(dá)到產(chǎn)品推廣、觀念傳播等目的;另一方面通過掌握信息傳播的本質(zhì)規(guī)律,可以控制特定信息的傳播以實(shí)現(xiàn)輿論監(jiān)控等目的?;谛畔鞑栴}所具有的深刻內(nèi)涵和重要意義,在線社交網(wǎng)絡(luò)中的信息傳播問題引起了產(chǎn)業(yè)界和學(xué)術(shù)界的廣泛關(guān)注并開展了大量的研究工作。
在線社交網(wǎng)絡(luò)應(yīng)用的迅猛發(fā)展使得網(wǎng)絡(luò)用戶規(guī)模急劇增加,網(wǎng)絡(luò)中包含的在線信息數(shù)據(jù)也呈現(xiàn)高速增長趨勢。這些海量數(shù)據(jù)以及不斷成熟的數(shù)據(jù)獲取分析技術(shù)為研究人員研究信息傳播問題提供了豐富的研究素材和物質(zhì)基礎(chǔ),使得研究人員有可能基于真實(shí)的海量數(shù)據(jù)研究信息傳播機(jī)制,認(rèn)識信息傳播的規(guī)律,因此極大地推動了在線社交網(wǎng)絡(luò)的研究工作。近幾年來,學(xué)術(shù)界和企業(yè)界對在線社交網(wǎng)絡(luò)中信息傳播問題的相關(guān)研究已大量展開[1~9]。若干計(jì)算機(jī)互聯(lián)網(wǎng)相關(guān)的知名國際會議比如ACM SIGKDD的Conference on Knowledge Discovery and Data Mining(KDD)、IEEE International Conference on Data Mining(ICDM)、IEEE International Conference on Distributed Computing Systems(ICDCS)、IEEE International Conference on Computer Communications(INFOCOM)、IEEE Global Communications Conference(GLOBECOM)等每年都會收錄、發(fā)表關(guān)于在線社交網(wǎng)絡(luò)信息傳播的最新研究成果和進(jìn)展。
國際上,斯坦福大學(xué)的Jure Leskovec、Eldar Sadikov,哈佛大學(xué)的Nicholas Christakis,康奈爾大學(xué)的Jon Kleinberg,卡內(nèi)基梅隆大學(xué)的Christos Faloutsos等著名高校和研究機(jī)構(gòu)的學(xué)者較早對在線社交網(wǎng)絡(luò)信息傳播的相關(guān)問題進(jìn)行了研究[1~4,7]。由于在線社交網(wǎng)絡(luò)目前還屬于比較前沿的研究領(lǐng)域,在我國也剛剛處于起步階段,可參考和借鑒的研究成果相對較少。清華大學(xué)、南京大學(xué)、北京航空航天大學(xué)、中科院計(jì)算所等高校及科研單位取得了一些基礎(chǔ)性的理論研究成果[10~19]。文獻(xiàn)[10]對在線社會網(wǎng)絡(luò)隱含的拓?fù)浣Y(jié)構(gòu)、在線用戶的交互行為和網(wǎng)絡(luò)結(jié)構(gòu)的演化等方面進(jìn)行了綜述性討論,總結(jié)了常見的測量方法和典型的網(wǎng)絡(luò)拓?fù)鋮?shù),討論了用戶行為的表現(xiàn)特征、用戶行為對網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的影響以及信息傳播過程中網(wǎng)絡(luò)的動態(tài)演變過程。文獻(xiàn)[13]討論了基于理論分析的信息傳播模型和基于信息傳播級聯(lián)模式的研究。重點(diǎn)討論了信息傳播的整體特性、信息傳播概率、信息傳播最大化和競爭性的信息傳播最大化等問題。同時(shí)也研究了用戶影響力的計(jì)算問題和信息傳播的預(yù)測模型。文獻(xiàn)[14]提出了一個(gè)通過預(yù)測用戶傳播信息能力大小來分析和度量用戶社會影響力的方法,并通過實(shí)驗(yàn)證明了其方法的有效性。從大量已有的研究成果可以看到,許多的研究工作將重點(diǎn)放在分析和測量在線社會網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)[10,19~20]、網(wǎng)絡(luò)中用戶的交互行為[4~5,25]或網(wǎng)絡(luò)信息的內(nèi)容、流量等細(xì)節(jié)特征[22~23]。這些研究通常采用相對成熟的數(shù)據(jù)挖掘技術(shù)、統(tǒng)計(jì)模型方法等手段進(jìn)行充分的實(shí)驗(yàn)研究。
從大量研究結(jié)論可知,建立信息傳播模型是研究信息傳播問題的必要方法和可行手段[4,6~8],通過合理的信息傳播模型可以更真實(shí)、準(zhǔn)確地描述在線社交網(wǎng)絡(luò)中信息傳播的復(fù)雜動態(tài)過程和傳播規(guī)律,并且能較好的預(yù)測信息傳播結(jié)果及其造成的影響。此外,通過控制和調(diào)整模型的系統(tǒng)參數(shù),信息傳播模型還可用于比較不同類型信息具有的影響力差異性以及傳播結(jié)果的不同,或者反過來通過信息傳播的影響回溯定位信息傳播的源頭等頗有重要實(shí)際意義的工作。
如果能夠建立信息傳播的模型對信息傳播過程進(jìn)行描述并對信息傳播的結(jié)果進(jìn)行準(zhǔn)確預(yù)測,對于研究信息傳播問題具有至關(guān)重要的作用。信息傳播模型可分為兩大類,一類是基于理論分析的傳播模型。這一類模型的建立并不直接依賴于在線社交網(wǎng)絡(luò)中信息傳播的真實(shí)數(shù)據(jù),而是基于復(fù)雜網(wǎng)絡(luò)的理論研究成果,或者是結(jié)合在線社交網(wǎng)絡(luò)信息傳播的特點(diǎn),將其它傳統(tǒng)研究領(lǐng)域中經(jīng)典的傳播模型或者對這些模型進(jìn)行擴(kuò)展、改進(jìn)后再運(yùn)用于描述在線社交網(wǎng)絡(luò)中信息傳播的動態(tài)過程。比如社會學(xué)家、傳染病學(xué)家和市場營銷學(xué)家分別提出了創(chuàng)新傳播模型、流行病傳播模型、產(chǎn)品影響力傳播模型等,這些模型雖然是針對傳統(tǒng)社會網(wǎng)絡(luò)研究領(lǐng)域的問題而提出的,但由于這些模型所描述的傳播過程與在線社交網(wǎng)絡(luò)中的信息傳播過程具有高度的相似性,因此也可有效運(yùn)用于在線社交網(wǎng)絡(luò)中信息傳播問題的研究。類似的經(jīng)典模型比如流行病傳播模型(Epidemics Model)[9]、線性閾值模型(Linear Threshold Model,LTM)、獨(dú)立級聯(lián)模型(Independent Cascade Model,ICM)[20]、博弈理論傳播模型(Game-Theoretic Model)[21]等等。
另外一類傳播模型的建立則根據(jù)收集的真實(shí)信息傳播數(shù)據(jù),對其進(jìn)行大量實(shí)驗(yàn)研究找出信息傳播過程中隱含的傳播規(guī)律和特征,然后利用建模方法建立模型對信息傳播過程進(jìn)行刻畫和描述[24~26]。由于基于理論研究的信息傳播模型忽略了實(shí)際傳播數(shù)據(jù)的本質(zhì)特征,模型的建立和參數(shù)的選擇往往都是理論上設(shè)定的,因此雖然在某些場合也能對信息傳播現(xiàn)象進(jìn)行較好的模擬,但往往缺乏對信息傳播過程和結(jié)果進(jìn)行精確預(yù)測的能力。而基于真實(shí)傳播數(shù)據(jù)建立起來的模型,由于其相對準(zhǔn)確地描述了信息傳播的真實(shí)特征,一定程度上能反映和揭示信息傳播的內(nèi)在規(guī)律,因此能更準(zhǔn)確地表示信息傳播的復(fù)雜過程,并對信息傳播結(jié)果具有更優(yōu)的預(yù)測能力。
事實(shí)上,利用信息傳播的模型來描述和預(yù)測在線社會網(wǎng)絡(luò)中信息傳播過程的研究工作已經(jīng)大量展開并取得了不少階段性成果。文獻(xiàn)[27]研究了Facebook社交網(wǎng)絡(luò)中信息的傳播模式,并認(rèn)為在線社會媒體中信息傳播的動態(tài)模式往往由較短的“沖突鏈”觸發(fā)決定,而不是更早研究中認(rèn)為的信息傳播的主要模式是由一小部分“種子”節(jié)點(diǎn)的影響而產(chǎn)生的某些較長的傳播路徑?jīng)Q定的。文獻(xiàn)[28]利用流行病傳染模型研究了在線社會網(wǎng)絡(luò)中新聞和謠言的傳播過程。而文獻(xiàn)[29]則探討了如何建立模型來準(zhǔn)確預(yù)測隱性社會網(wǎng)絡(luò)中的信息傳播。值得注意的是,基于流行病學(xué)領(lǐng)域中病毒傳播理論的病毒傳播模型對在線社會網(wǎng)絡(luò)中信息傳播問題的研究提供了重要的借鑒和參考。許多信息傳播模型都是基于病毒傳播理論相關(guān)模型的改進(jìn)或者擴(kuò)展[28]。大量對于信息傳播問題的研究成果已經(jīng)逐步形成到互聯(lián)網(wǎng)的新技術(shù),有的已經(jīng)得到廣泛的應(yīng)用。比如互聯(lián)網(wǎng)在線推薦系統(tǒng)、在線廣告推送、在線用戶行為預(yù)測、垃圾郵件跟蹤過濾、網(wǎng)絡(luò)病毒的防御等等。
上述研究工作都充分表明,建立信息傳播模型對于研究在線社會網(wǎng)絡(luò)中的信息傳播問題是非常有效可行的重要研究手段,能夠較好地描述信息傳播的動態(tài)過程并能準(zhǔn)確預(yù)測信息傳播的結(jié)果。
從不同的研究方法和角度而言,對在線社交網(wǎng)絡(luò)中信息傳播問題的研究思路大致可分為三類:1)基于實(shí)驗(yàn)的特征分析方法;2)基于宏觀角度的信息傳播建模方法;3)基于微觀角度的信息傳播建模方法?;趯?shí)驗(yàn)分析方法的研究目的在于揭示不同的在線社交網(wǎng)絡(luò)中信息傳播過程中內(nèi)在的指標(biāo)特征。文獻(xiàn)[30]討論了微博網(wǎng)絡(luò)中信息傳播的動力學(xué)行為。文獻(xiàn)[31~32]則通過對大量數(shù)據(jù)的分析研究了圖像共享網(wǎng)站Flickr上照片的級聯(lián)傳播模式。文獻(xiàn)[33]通過提取Digg網(wǎng)絡(luò)和Twitter網(wǎng)絡(luò)中的信息傳播數(shù)據(jù)集,通過大量實(shí)驗(yàn)研究分析了用戶對于新聞的關(guān)注興趣是如何在網(wǎng)絡(luò)中進(jìn)行傳播的。
基于單純的實(shí)驗(yàn)分析方法可以發(fā)現(xiàn)信息傳播過程中的隱含的一些內(nèi)在規(guī)律,但不能很好地解決對信息傳播過程的準(zhǔn)確描述乃至預(yù)測,而如果能根據(jù)這些實(shí)驗(yàn)分析得到的特征,針對性的建立某個(gè)在線社交網(wǎng)絡(luò)的信息傳播模型則可能較好的解決傳播預(yù)測問題?;诤暧^視角建立的信息傳播模型往往從研究信息傳播過程的宏觀規(guī)律出發(fā),重點(diǎn)研究信息傳播過程中表現(xiàn)出來的整體變化和類似于用戶分布、影響力覆蓋范圍等總體規(guī)律特征。由于在線社交網(wǎng)絡(luò)中用戶規(guī)模巨大、拓?fù)浣Y(jié)構(gòu)復(fù)雜且動態(tài)變化、用戶間的交互也受到線上、線下的多種因素的影響,很多情況下難以對這些細(xì)節(jié)特征進(jìn)行描述和建模。此時(shí),可以忽略或者次要考慮這些微觀因素對于信息傳播的總體影響,而是直觀的從宏觀特征上準(zhǔn)確刻畫信息傳播的整體進(jìn)程和結(jié)果。
部分研究工作嘗試從宏觀的角度建立信息傳播模型以描述在線社交網(wǎng)絡(luò)中的信息傳播過程。文獻(xiàn)[8]不考慮用戶交互細(xì)節(jié),只考慮信息傳播的用戶分布、覆蓋范圍等宏觀因素,提出了一種線性傳播模型并進(jìn)行了信息傳播的預(yù)測。文獻(xiàn)[9]使用被廣泛討論的SIS(Susceptible-Infected-Susceptible)疾病傳染模型,描述給定時(shí)間窗內(nèi)在線社交網(wǎng)絡(luò)中信息傳播的覆蓋范圍。文獻(xiàn)[29]介紹了一種能夠預(yù)測信息傳播的線性影響力傳播模型,該模型能夠根據(jù)此前被新聞信息影響的用戶規(guī)模預(yù)測當(dāng)前時(shí)間點(diǎn)之后的某個(gè)階段中被影響的新用戶數(shù)量。文獻(xiàn)[35]在忽略網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)等微觀因素的前提下,討論了幾個(gè)不同的信息傳播模型,并利用這些模型預(yù)測了給定時(shí)間內(nèi)社交網(wǎng)絡(luò)中的信息傳播造成的影響。
不同于宏觀方法注重于討論信息傳播過程表現(xiàn)出的整體特征,微觀方法則主要研究諸如用戶的交互行為、用戶關(guān)系連接的強(qiáng)弱、拓?fù)涞木植孔兓燃?xì)節(jié)特征對于信息傳播造成的影響[34]。從微觀角度深刻理解用戶之間的交互行為也是非常必要的,因?yàn)闊o論對于信息傳播復(fù)雜動態(tài)過程的細(xì)節(jié)研究,還是超級影響力用戶的定位等等一系列重要問題都依賴于對用戶的交互細(xì)節(jié)的準(zhǔn)確把握。文獻(xiàn)[5]通過研究用戶的社會交互行為對信息傳播進(jìn)行了預(yù)測。文獻(xiàn)[36]提出了幾個(gè)傳播模型用以預(yù)測某個(gè)特定個(gè)體是否對其相鄰用戶有正面或者負(fù)面的影響。文獻(xiàn)[37]介紹了用戶-用戶模型(User to User Model)的交互式原理,通過提取網(wǎng)絡(luò)用戶間的交互細(xì)節(jié)而得到宏觀的用戶行為特征,并以此研究微博網(wǎng)絡(luò)中的用戶行為規(guī)律對信息傳播的影響。較早的研究文獻(xiàn)[38]中設(shè)計(jì)了基于用戶關(guān)系鏈的隱性可變傳播模型,并用該模型描述相鄰用戶間的加權(quán)朋友關(guān)系,這種方法相對于利用傳統(tǒng)的二值方法表示的好友關(guān)系更具有實(shí)際意義。
雖然已經(jīng)開展的研究工作取得了一定的研究成果,但這些工作仍然存在欠缺和諸多不足,主要體現(xiàn)在以下幾個(gè)方面。
1) 建模在線社交網(wǎng)絡(luò)的信息傳播是一項(xiàng)極具挑戰(zhàn)性的工作。如前所述,網(wǎng)絡(luò)個(gè)體之間錯綜復(fù)雜的動態(tài)行為和社會交互、隱晦難懂的網(wǎng)絡(luò)關(guān)系結(jié)構(gòu)、驚人的網(wǎng)絡(luò)規(guī)模以及網(wǎng)絡(luò)拓?fù)涞漠愘|(zhì)、多樣、多變等等特征,都使得建立精確的信息傳播模型特別是可通用性的傳播模型框架具有極大難度?,F(xiàn)有的大量工作嘗試了基于在線社交網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)對信息傳播的規(guī)律特征進(jìn)行研究,雖然在某些局部問題上取得了值得不錯的成果,但是無法從整體上準(zhǔn)確表達(dá)網(wǎng)絡(luò)本身及信息傳播過程。
2) 現(xiàn)有研究工作提出的許多信息傳播模型都是基于理論模型的擴(kuò)展,比如線性閾值模型、流行病傳播模型等等。這些模型在傳統(tǒng)領(lǐng)域獲得了較好的應(yīng)用,但由于對在線社交網(wǎng)絡(luò)中的信息傳播問題缺少定量的過程描述和準(zhǔn)確的參數(shù)表達(dá),因此往往無法具備精準(zhǔn)預(yù)測信息傳播的能力?;蛘咄ǔP枰浅?fù)雜的參數(shù)尋優(yōu)過程才能得到相對較好的預(yù)測能力,這使得研究工作本身變得更加繁瑣和難以實(shí)現(xiàn)。
3) 在線社交網(wǎng)絡(luò)中的信息傳播是一個(gè)同時(shí)具有時(shí)間和空間方向的二維問題。簡而言之信息傳播包含了兩個(gè)子問題,即信息傳播的速度和信息傳播的廣度。因此研究信息傳播問題應(yīng)該同時(shí)考慮信息傳播包含的時(shí)間特征和空間特征,并綜合這兩個(gè)維度的特征建立相應(yīng)的傳播模型?,F(xiàn)有的信息傳播模型或者只考慮了空間特征(如拓?fù)浣Y(jié)構(gòu)、個(gè)體分布)而忽略了時(shí)間特征,或者只考慮了時(shí)間特征(用戶興趣變化)而忽略了空間特征,缺乏對于信息傳播的實(shí)際特征的完整描述。這顯然不利于更加準(zhǔn)確的表示信息傳播過程。只有同時(shí)考慮信息傳播的時(shí)間特征和空間特征,才有可能建立能夠更加精確刻畫信息傳播的模型。
4) 現(xiàn)有的研究工作大多是在某個(gè)特定的在線社交網(wǎng)絡(luò)中提取其中的信息傳播數(shù)據(jù)子集,然后分析并獲得該數(shù)據(jù)集的各種特征,并根據(jù)這些特征進(jìn)行建模。因此,得到的信息傳播模型只對特定社交網(wǎng)絡(luò)中的信息傳播具有一定的刻畫能力,無法適用于不同類型的其它社交網(wǎng)絡(luò),具有較大的局限性。提出有效可行的信息傳播模型的通用框架,使得該框架能用于所有在線社交網(wǎng)絡(luò)信息傳播問題的研究是最終的理想目標(biāo),也是今后一段時(shí)間內(nèi)更具有挑戰(zhàn)性的問題。
在線社交網(wǎng)絡(luò)是互聯(lián)網(wǎng)發(fā)展新時(shí)代的產(chǎn)物,無論是在理論上還是相關(guān)技術(shù)上都屬于比較前沿的研究內(nèi)容。由于人們對用戶在線社交網(wǎng)絡(luò)的本質(zhì)特征和信息傳播基本規(guī)律的研究仍然處于初級階段,到目前為止仍缺乏完整的關(guān)于在線社交網(wǎng)絡(luò)和信息傳播的基礎(chǔ)理論和方法,所以仍然存在眾多未解決的問題,在線社交網(wǎng)絡(luò)本身極其復(fù)雜的特性也決定了這是一項(xiàng)非常具有挑戰(zhàn)性的工作,主要體現(xiàn)在三個(gè)方面:
1) 在線社交網(wǎng)絡(luò)規(guī)模巨大,包含的節(jié)點(diǎn)數(shù)量不計(jì)其數(shù),節(jié)點(diǎn)構(gòu)成的網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜多樣,而且呈現(xiàn)出隨時(shí)間變化的動態(tài)演變。除了信息本身具有的特征對信息傳播造成的影響,結(jié)構(gòu)的動態(tài)變化也是影響信息傳播的重要因素,而這種結(jié)構(gòu)變化由于節(jié)點(diǎn)數(shù)量的海量性變的晦澀難懂、難以把握。因此,研究社交網(wǎng)絡(luò)關(guān)系結(jié)構(gòu)的動態(tài)變化和信息傳播的動態(tài)特征都是極大的挑戰(zhàn)。
2) 在線社交網(wǎng)絡(luò)的群體互動具有強(qiáng)互動演變、公眾情緒漂移等特點(diǎn)。用戶群體的互動比如關(guān)注、分享、轉(zhuǎn)發(fā)等行為直接導(dǎo)致了信息的傳播,而群體互動本身則表現(xiàn)為難以刻畫和描述的在線行為。而且除了網(wǎng)絡(luò)群體的在線互動的作用之外,網(wǎng)絡(luò)用戶的線下情感變化也對信息傳播具有不可忽略的影響。因此,如何準(zhǔn)確理解復(fù)雜的在線交互以及網(wǎng)絡(luò)之外的因素對信息傳播的作用變得十分困難,充滿挑戰(zhàn)。
3) 在線社交網(wǎng)絡(luò)的信息傳播往往具有多源、并發(fā)的特點(diǎn)。在線營銷策略中,產(chǎn)品的推廣往往同時(shí)在多個(gè)節(jié)點(diǎn)發(fā)出;輿論傳播時(shí),從多個(gè)地方同時(shí)發(fā)出的信息往往具有更轟動的社會效應(yīng)。多源傳播的實(shí)際例子無處不在,而多源傳播本身的特點(diǎn)使得信息傳播的路徑多變,信息內(nèi)容相互影響、不斷演化,從而使得信息傳播過程更加復(fù)雜,這也給信息傳播的研究帶來了更大的困難和挑戰(zhàn)。
雖然存在諸多困難和挑戰(zhàn),但現(xiàn)有的研究成果給將來的研究工作打下了良好的基礎(chǔ)??梢灶A(yù)見,在眾多研究者的不斷努力下,對于在線社交網(wǎng)絡(luò)信息傳播問題的研究一定會不斷推進(jìn)和深入,從而不斷的揭示在線社交網(wǎng)絡(luò)中蘊(yùn)含的內(nèi)在規(guī)律和本質(zhì)特征,最終更好的利用在線社交網(wǎng)絡(luò)為社會生活的各個(gè)方面服務(wù)。
[1] Matsubara Y, Sakurai Y, Prakash B A, et al. Rise and fall patterns of information diffusion: model and implications[C]//Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM,2012:6-14.
[2] Cheng, J., Adamic, L., Dow, P. A., Kleinberg, et al. Can cascades be predicted? [C]//Proceedings of the 23rd international conference on World Wide Web. ACM,2014:925-936.
[3] Christakis N A, Fowler J H. Social contagion theory: examining dynamic social networks and human behavior [J]. Statistics in medicine,2013,32(4):556-577.
[4] Rahman M R. Characterizing and predicting information diffusion through social interactions [D]. Davis: University of California,2015.
[5] Matook S, Cummings J, Bala H. Are you feeling lonely? The impact of relationship characteristics and online social network features on loneliness [J]. Journal of Management Information Systems,2015,31(4):278-310.
[6] Gomez-Rodriguez M, Leskovec J, Sch?lkopf B. c[C]// Proceedings of the 3rd International Conference on Machine Learning,2013:666-674.
[7] Yang J, Leskovec J. Modeling information diffusion in implicit networks[C]// Proceedings of the International Conference on Data Mining. IEEE,2010:599-608.
[8] Wang F, Wang H, Xu K, et al. Characterizing information diffusion in online social networks with linear diffusive model[C]//Proceedings of the 33rd International Conference On Distributed Computing Systems. IEEE,2013:307-316.
[9] Saito K, Kimura M, Ohara K, et al. Efficient discovery of influential nodes for SIS models in social networks[J]. Knowledge and information systems,2012,30(3):613-635.
[10] 徐恪,張賽,陳昊,等.在線社會網(wǎng)絡(luò)的測量與分析[J].計(jì)算機(jī)學(xué)報(bào),2014,37(1):165-188. XU Ke, ZHANG Sai, CHEN Hao, et al. Measurement and Analysis of Online Social Networks[J]. Chinese Journal of Computers,2014,37(1):165-188.
[11] 吳信東,李毅,李磊.在線社交網(wǎng)絡(luò)影響力分析[J].計(jì)算機(jī)學(xué)報(bào),2014(4):735-752. WU Xindong, LI Yi, LI Lei. Influence Analysis of Online Social Networks[J]. Chinese Journal of Computers,2014(4):735-752.
[12] 鄭眾杰,林學(xué)練.SFEN-Inf:一種微博信息傳播網(wǎng)絡(luò)推理算法[J].計(jì)算機(jī)研究與發(fā)展,2014(2):94-101. ZHENG Zhongjie, Lin Xuelian. SFEN_Inf: An Inference Algorithm for Weibo Information Diffusion Network[J]. Journal of Computer Research and Development,2014(2):94-101.
[13] 李棟,徐志明,李生,等.在線社會網(wǎng)絡(luò)中信息擴(kuò)散[J].計(jì)算機(jī)學(xué)報(bào),2014,37(1): 189-206. LI Dong, XU Zhi, LI Sheng, et al. A Survey on Information Diffusion in Online Social Networks[J]. Chinese Journal of Computers,2014,37(1):189-206.
[14] 毛佳昕,劉奕群,張敏,等.基于用戶行為的微博用戶社會影響力分析[J].計(jì)算機(jī)學(xué)報(bào),2014,37(4):791-800. MAO Jiaxin, Liu Yiqun, ZHANG Min, et al. Social Influence Analysis for Micro-Blog User Based on User Behavior [J]. Chinese Journal of Computers,2014,37(4):791-800.
[15] Huang R, Sun X. Weibo network, information diffusion and implications for collective action in China [J]. Information, Communication & Society,2014,17(1):86-104.
[16] Yang Y, Tang J, Leung C W, et al. RAIN: Social Role-Aware Information Diffusion[C]// Proceedings of the Conference on Artificial Intelligence,2015:367-373.
[17] Lu Z, Wen Y, Cao G. Information diffusion in mobile social networks: The speed perspective[C]// Proceedings of the Conference on Computer Communications. IEEE,2014:1932-1940.
[18] Li Y, Qian M, Jin D, et al. Revealing the efficiency of information diffusion in online social networks of microblog[J].Information Sciences,2015,293:383-389.
[19] Zhan Q, Zhang J, Wang S, et al. Influence maximization across partially aligned heterogenous social networks[C]// Proceedings of the Pacific-Asia Conference on Knowledge Discovery and Data Mining. Springer International Publishing,2015:58-69.
[20] Kempe D, Kleinberg J, Tardos é. Maximizing the spread of influence through a social network[C]//Proceedings of the 9th ACM international conference on Knowledge discovery and data mining. ACM,2003:137-46.
[21] Young H P. The diffusion of innovations in social networks [J]. The Economy as an Evolving Complex System III: Current Perspectives and Future Directions,2006:267-282.
[22] Stieglitz S, Dang-Xuan L. Emotions and information diffusion in social media—sentiment of microblogs and sharing behavior[J]. Journal of Management Information Systems,2013,29(4):217-248.
[23] Myers S A, Zhu C, Leskovec J. Information diffusion and external influence in networks[C]//Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM,2012:33-41.
[24] 彭川,李元香.一種在線社會網(wǎng)絡(luò)的信息擴(kuò)散預(yù)測模型[J].計(jì)算機(jī)與數(shù)字工程,2014,42(11):2103-2106. PENG Chuan, Li Yuanxiang. A Prediction Model of Information Diffusion in Online Social Networks [J].Journal of Computer and Digital Engineering,2014,42(11):2103-2106.
[25] Li, Cheng-Te, et al. Modeling and evaluating information propagation in microblogging social network [J]. Social Network Analysis and Mining, 2013, 3(3):341-357.
[26] Chuan P, Kuai X, Feng W, Haiyan W. Predicting information diffusion initiated from multiple sources in online social networks[C]// Proceedings of 6th International Symposium on Computational Intelligence and Design. IEEE,2013(2):96-99.[27] Sun E, Rosenn I, Marlow C, et al. Modeling Contagion through Facebook News Feed[C]// Proceedings of the 3rd International AAAI Conference on Weblogs and Social Media. AAAI,2009:146-153.
[28] F. Fang. Epidemiological modeling of news and rumors on Twitter[C]//Proceedings of the 7th Workshop on Social Network Mining and Analysis. ACM,2013:8-15.
[29] Yang J, Leskovec J. Modeling information diffusion in implicit networks[C]//Proceedings of IEEE 10th International Conference on Data Mining. IEEE,2010:599-608.
[30] Gruhl D, Guha R, Liben-Nowell D, et al. Information diffusion through blogspace[C]// Proceedings of the Proceedings of the 13th international conference on World Wide Web. ACM,2004:491-501.
[31] Bourigault, Simon, et al. Learning social network embeddings for predicting information diffusion[C]// Proceedings of the 7th ACM international conference on Web search and data mining. ACM,2014:393-402.
[32] Karlova, Natascha A., and Karen E. Fisher. A social diffusion model of misinformation and disinformation for understanding human information behaviour[J]. Information Research,2013,18(1):1-17.
[33] Stieglitz, Stefan, and Linh Dang-Xuan. Emotions and Information Diffusion in Social Media—Sentiment of Microblogs and Sharing Behavior [J]. Journal of Management Information Systems,2013,29(4):217-248.
[34] An W. Models and methods to identify peer effects [J]. The Sage Handbook of Social Network Analysis London: Sage,2011:515-532.
[35] Ghosh, Rumi, and Kristina Lerman. A framework for quantitative analysis of cascades on networks[C]//Proceedings of the fourth ACM international conference on Web search and data mining. ACM,2011:665-674.
[36] Leskovec J, Huttenlocher D, Kleinberg J. Predicting positive and negative links in online social networks [C]// Proceedings of the 19th international conference on World wide web.ACM,2010:641-650.
[37] Goetz M, Leskovec J, McGlohon M, et al. Modeling Blog Dynamics[C]//Proceedings of the Third International AAAI Conference on Weblogs and Social Media. ACM,2009:26-33.
[38] Xiang R, Neville J, Rogati M. Modeling relationship strength in online social networks[C]// Proceedings of the 19th international conference on World Wide Web. ACM,2010:981-90.
Survey of Information Diffusion in Online Social Networks
PENG Chuan1,2LI Yuanxiang2
(1.School of Computer Science, South-Central University for Nationalities, Wuhan 430074) (2.State Key Laboratory of Software Engineering, Wuhan University, Wuhan 430072)
Nowadays, online social network increasingly plays a significant role in fields of politics, economy, culture and commercial. It is urgently important for either research community or industry to study problems related to online social network. Information diffusion is the most important one among the series of unresolved issues. Firstly, this paper gives out a detailed discussion on existing research works on information diffusion over online social networks, especially the information diffusion models. Then the paper comprehensively summarizes some research ideas from three different perspectives. Finally, the paper concludes current difficulties in research and gives out challenges in the future work.
online social network, information diffusion, diffusion model, research ideas
2016年5月8日,
2016年6月24日
國家自然科學(xué)基金(編號:61201268);中央高??蒲袠I(yè)務(wù)專項(xiàng)基金(編號:CZY15005)資助。
彭川,男,博士,講師,研究方向:智能計(jì)算、在線社交網(wǎng)絡(luò)。李元香,男,博士,教授,研究方向:智能計(jì)算。
TP399
10.3969/j.issn.1672-9722.2016.11.021