李鋒 王妍灃 胡錦亞
摘?要:P2P交易網(wǎng)站中,用戶被其他用戶的評(píng)價(jià)有正面評(píng)價(jià)也有負(fù)面評(píng)價(jià)。這使得網(wǎng)絡(luò)中意見領(lǐng)袖的觀點(diǎn)更加重要,而意見領(lǐng)袖的識(shí)別也變得更加復(fù)雜。本研究從一個(gè)比特幣交易網(wǎng)站上獲取用戶之間的評(píng)價(jià)數(shù)據(jù)集合,構(gòu)建了用戶評(píng)價(jià)的有向加權(quán)符號(hào)網(wǎng)絡(luò)。同時(shí),根據(jù)用戶評(píng)價(jià)他人的記錄和被其他用戶評(píng)價(jià)的記錄,對(duì)用戶進(jìn)行類別劃分。進(jìn)而,從復(fù)雜網(wǎng)絡(luò)分析的視角,對(duì)用戶的評(píng)價(jià)數(shù)量和評(píng)價(jià)值分類統(tǒng)計(jì);并且,計(jì)算了用戶各個(gè)屬性之間的相關(guān)性。計(jì)算和分析結(jié)果表明,描述用戶行為的多個(gè)屬性之間存在著較強(qiáng)的正向相關(guān)性;而用戶的網(wǎng)絡(luò)入度指標(biāo)或出度指標(biāo),都可以作為網(wǎng)絡(luò)意見領(lǐng)袖的評(píng)價(jià)指標(biāo)。
關(guān)鍵詞:意見領(lǐng)袖;比特幣交易網(wǎng)站;用戶評(píng)價(jià);社會(huì)網(wǎng)絡(luò)分析;加權(quán)符號(hào)網(wǎng)絡(luò)
中圖分類號(hào): F820.3?文獻(xiàn)標(biāo)志碼:A?文章編號(hào):1009-055X(2019)06-0064-10
doi:10.19366/j.cnki.1009-055X.2019.06.008
一、引?言
意見領(lǐng)袖是社會(huì)關(guān)系網(wǎng)絡(luò)中最具影響力的節(jié)點(diǎn),其對(duì)整個(gè)網(wǎng)絡(luò)的意見導(dǎo)向起到了關(guān)鍵和核心的作用。通常來說,意見領(lǐng)袖在社會(huì)關(guān)系網(wǎng)絡(luò)中超出普通用戶的“朋友/粉絲”數(shù)量,使得其發(fā)布或轉(zhuǎn)發(fā)的信息能夠迅速散開,極大提高了信息擴(kuò)散的網(wǎng)絡(luò)覆蓋率指標(biāo)。同時(shí),意見領(lǐng)袖建立起的網(wǎng)絡(luò)信譽(yù),使得其觀點(diǎn)能夠?yàn)椤芭笥?粉絲”所接受,并因此能夠在線上輿論中引導(dǎo)爭(zhēng)議性話題的發(fā)展方向。因此,對(duì)于意見領(lǐng)袖的識(shí)別和描述是線上社交網(wǎng)絡(luò)平臺(tái)上的熱點(diǎn)議題。
隨著社交電子商務(wù)的不斷發(fā)展和模式創(chuàng)新,意見領(lǐng)袖的經(jīng)濟(jì)價(jià)值更加凸顯[1]。一方面,意見領(lǐng)袖對(duì)于“新”產(chǎn)品的推薦,能夠使得該產(chǎn)品迅速在其社會(huì)關(guān)系網(wǎng)絡(luò)上擴(kuò)散開去,市場(chǎng)識(shí)別度甚至超過了傳統(tǒng)的廣告營銷。另一方面,意見領(lǐng)袖對(duì)于特定產(chǎn)品的好壞評(píng)價(jià),通過其社會(huì)關(guān)系網(wǎng)絡(luò)的擴(kuò)散,甚至能夠左右產(chǎn)品的市場(chǎng)需求。因此可以說,社交電子商務(wù)成功的關(guān)鍵之一就是在于找到產(chǎn)品在社交平臺(tái)上的意見領(lǐng)袖。
但是,當(dāng)前對(duì)于社會(huì)關(guān)系網(wǎng)絡(luò)上的意見領(lǐng)袖的識(shí)別還停留在對(duì)普通社交平臺(tái)上的用戶分析和評(píng)價(jià)。對(duì)于社交電子商務(wù)網(wǎng)站中的社會(huì)關(guān)系網(wǎng)絡(luò)、意見領(lǐng)袖的識(shí)別還處于探索階段,研究工作和成果并不多見。相較于普通社交平臺(tái)上的意見領(lǐng)袖識(shí)別,社交電子商務(wù)平臺(tái)上意見領(lǐng)袖的識(shí)別復(fù)雜性主要體現(xiàn)在以下兩點(diǎn):
(1)社交電子商務(wù)平臺(tái)上的用戶通常以產(chǎn)品交易雙方為主,意見領(lǐng)袖的涌現(xiàn)無法以普通社交平臺(tái)上的用戶“粉絲”數(shù)量評(píng)價(jià)。
(2)社交電子商務(wù)平臺(tái)上的用戶關(guān)系為買賣交易關(guān)系,而用戶之間的評(píng)價(jià)會(huì)因交易的產(chǎn)品和交易的過程有好有壞,意見領(lǐng)袖的輿論導(dǎo)向也分正面和負(fù)面兩類。
因此,對(duì)于社交電子商務(wù)平臺(tái)上的社會(huì)關(guān)系網(wǎng)絡(luò)必須采用能夠再現(xiàn)好/壞(正/負(fù))的復(fù)雜網(wǎng)絡(luò)形式——符號(hào)網(wǎng)絡(luò)。并且,對(duì)于意見領(lǐng)袖的識(shí)別也必須根據(jù)符號(hào)網(wǎng)絡(luò)中連接線和連接線符號(hào)的應(yīng)用含義來定制。
本文以一個(gè)P2P比特幣(Bitcoin)交易網(wǎng)站為例,通過構(gòu)建其用戶群體的社會(huì)關(guān)系網(wǎng)絡(luò),從中發(fā)現(xiàn)意見領(lǐng)袖。
二、國內(nèi)外研究現(xiàn)狀
意見領(lǐng)袖的識(shí)別問題原本是信息傳播領(lǐng)域中的熱點(diǎn)問題。隨著Web 2.0及線上社交平臺(tái)的繁榮,社交電子商務(wù)的興起,意見領(lǐng)袖的研究工作已經(jīng)逐步向社會(huì)和經(jīng)濟(jì)領(lǐng)域擴(kuò)散。對(duì)于企業(yè)而言,意見領(lǐng)袖的重要地位在于其對(duì)產(chǎn)品口碑營銷的貢獻(xiàn)[2]。
但是,當(dāng)前對(duì)于社會(huì)關(guān)系網(wǎng)絡(luò)中的意見領(lǐng)袖研究主要是針對(duì)一些大眾型的社交平臺(tái),如國外的Twitter[2]、Facebook[3],國內(nèi)的微博[4]、知乎[5]等。其中,對(duì)于社會(huì)關(guān)系網(wǎng)絡(luò)中的意見領(lǐng)袖識(shí)別,通常采用的是社會(huì)網(wǎng)絡(luò)分析中的網(wǎng)絡(luò)節(jié)點(diǎn)中心性指標(biāo)[6],計(jì)算節(jié)點(diǎn)重要性的PageRank算法[3]、HITS算法[3],以及引入用戶“畫像”屬性的指標(biāo)體系和多屬性評(píng)價(jià)模型[2],信息擴(kuò)散的主路徑分析方法[7]等。而為了驗(yàn)證意見領(lǐng)袖的影響力,采用的研究方法主要包括實(shí)證分析[8]和仿真分析[2,4,5]兩種。
這些前期工作中的社會(huì)關(guān)系網(wǎng)絡(luò)與本文所研究的P2P交易網(wǎng)站中用戶之間的社會(huì)關(guān)系網(wǎng)絡(luò)不同在于,P2P交易網(wǎng)站中的用戶節(jié)點(diǎn)關(guān)系為交易關(guān)系,即發(fā)生產(chǎn)品買賣的用戶之間的關(guān)系——社會(huì)關(guān)系網(wǎng)絡(luò)中節(jié)點(diǎn)連線相對(duì)稀疏;并且,P2P交易網(wǎng)站中賣家與買家之間的交易連線通常定義為買家對(duì)賣家的產(chǎn)品和服務(wù)的評(píng)價(jià),或賣家對(duì)買家的交易過程的評(píng)價(jià)——網(wǎng)絡(luò)中節(jié)點(diǎn)連線權(quán)值有大有小、有正有負(fù),難以采用傳統(tǒng)社會(huì)關(guān)系網(wǎng)絡(luò)分析中的無權(quán)網(wǎng)絡(luò)或加權(quán)網(wǎng)絡(luò)構(gòu)建其網(wǎng)絡(luò)模型。因此,必須采用復(fù)雜網(wǎng)絡(luò)分析中的加權(quán)符號(hào)網(wǎng)絡(luò)進(jìn)行系統(tǒng)建模[9]。
由于加權(quán)符號(hào)網(wǎng)絡(luò)中連線的正負(fù)、權(quán)值在不同的應(yīng)用背景中代表著不同的含義,對(duì)于加權(quán)符號(hào)網(wǎng)絡(luò)的研究工作更加發(fā)散。例如,從復(fù)雜網(wǎng)絡(luò)的視角研究加權(quán)符號(hào)網(wǎng)絡(luò)的網(wǎng)絡(luò)整體結(jié)構(gòu)屬性和節(jié)點(diǎn)特征[10-11];從符號(hào)網(wǎng)絡(luò)的視角(結(jié)構(gòu)平衡理論)研究節(jié)點(diǎn)之間連線符號(hào)的正確性,并對(duì)“缺失”的連線進(jìn)行符號(hào)預(yù)測(cè)[12-15]。而對(duì)網(wǎng)絡(luò)中意見領(lǐng)袖(關(guān)鍵節(jié)點(diǎn))的識(shí)別,多是在PageRank算法上進(jìn)行改進(jìn),使其能夠分別對(duì)正負(fù)權(quán)值分開處理[16-17];或者采用仿真的方法,以影響力最大化為目標(biāo)搜索出意見領(lǐng)袖集合[18]。但是,這些對(duì)網(wǎng)絡(luò)中關(guān)鍵節(jié)點(diǎn)/意見領(lǐng)袖的識(shí)別算法,都是將研究對(duì)象看作是一個(gè)無權(quán)符號(hào)網(wǎng)絡(luò),即網(wǎng)絡(luò)連線的權(quán)值僅為+1或-1。這一點(diǎn)與P2P交易網(wǎng)站中用戶評(píng)價(jià)分等級(jí)的實(shí)際情況差異較大。因此,必須結(jié)合具體的應(yīng)用問題,以及連線權(quán)值的含義針對(duì)性地定義意見領(lǐng)袖的評(píng)價(jià)指標(biāo)體系。
本文就是針對(duì)一個(gè)具有較長時(shí)間跨度的比特幣交易P2P網(wǎng)站,通過構(gòu)建交易用戶的加權(quán)符號(hào)網(wǎng)絡(luò),從中識(shí)別意見領(lǐng)袖。
三、比特幣交易平臺(tái)及數(shù)據(jù)集合
(一)比特幣交易平臺(tái)簡(jiǎn)介
本文研究的比特幣交易P2P網(wǎng)站為Bitcoin OTChttps://www.bitcoin?otc.com.。在此平臺(tái)上,比特幣買家可以與比特幣賣家直接聯(lián)系和交易,不需要網(wǎng)站對(duì)交易進(jìn)行監(jiān)管和擔(dān)保。
但是,為了避免用戶在交易中遇到不誠信用戶而上當(dāng)受騙,交易網(wǎng)站提供了一個(gè)用戶之間的打分評(píng)價(jià)系統(tǒng)。在此系統(tǒng)中,用戶可以對(duì)交易對(duì)象打分。分?jǐn)?shù)取值范圍為-10到+10,數(shù)值越大表明用戶對(duì)交易對(duì)方評(píng)價(jià)越高,數(shù)值越小表明用戶對(duì)交易對(duì)方評(píng)價(jià)越差https://wiki.bitcoin?otc.com/wiki/OTC_Rating_System.。因此,用戶被其他用戶的評(píng)價(jià)分?jǐn)?shù)值越高,表明與該用戶交易的風(fēng)險(xiǎn)越小;反之,用戶被其他用戶評(píng)價(jià)分?jǐn)?shù)值越低,則與該用戶交易的風(fēng)險(xiǎn)越大。
然而,不誠信用戶的存在使得用戶的交易風(fēng)險(xiǎn)評(píng)價(jià)變得非常復(fù)雜。不誠信用戶可以利用該系統(tǒng)獲得較高的被評(píng)價(jià)分?jǐn)?shù),從而有可能欺騙那些僅根據(jù)被評(píng)價(jià)分?jǐn)?shù)的高低來選擇交易對(duì)象的用戶。在Web 2.0時(shí)代,此類用戶被稱為“網(wǎng)絡(luò)水軍”,并大有人在[19]。因此,如何過濾掉這些用戶對(duì)評(píng)價(jià)系統(tǒng)的干擾,從而能夠有效地識(shí)別出網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)和意見領(lǐng)袖,成為一個(gè)非常復(fù)雜的問題。
(二)用戶相互評(píng)價(jià)的加權(quán)符號(hào)網(wǎng)絡(luò)
斯坦福大學(xué)的網(wǎng)絡(luò)分析項(xiàng)目(Stanford Network Analysis Project, SNAP)于2016年對(duì)Bitcoin OTC網(wǎng)站實(shí)施了數(shù)據(jù)抓取,發(fā)布了一個(gè)名為“bitcoin?otc”的數(shù)據(jù)集[14]。該數(shù)據(jù)集總共包括35?592條評(píng)價(jià)信息,涉及用戶數(shù)量為5?881人。數(shù)據(jù)集中每條評(píng)價(jià)信息包括四個(gè)字段:評(píng)價(jià)者、被評(píng)價(jià)者、評(píng)價(jià)分?jǐn)?shù)和評(píng)價(jià)時(shí)間。
本文以評(píng)價(jià)者、被評(píng)價(jià)者和評(píng)價(jià)分?jǐn)?shù)三個(gè)字段構(gòu)建有向、加權(quán)、符號(hào)網(wǎng)絡(luò)。其中,每個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)代表系統(tǒng)中唯一的一個(gè)用戶,而有向邊則定義了一位用戶對(duì)另外一位用戶的評(píng)價(jià)值。
所得到的加權(quán)符號(hào)網(wǎng)絡(luò)的基本統(tǒng)計(jì)信息如表1所示。忽略加權(quán)符號(hào)網(wǎng)絡(luò)中連線的方向和權(quán)值,可以計(jì)算得到網(wǎng)絡(luò)的平均聚類系數(shù)、網(wǎng)絡(luò)直徑和平均路徑長度等指標(biāo)。
對(duì)網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的入度指標(biāo)和出度指標(biāo)進(jìn)行統(tǒng)計(jì),得到網(wǎng)絡(luò)入度和出度指標(biāo)的分布情況如圖1所示:
對(duì)節(jié)點(diǎn)入度和出度指標(biāo)進(jìn)行冪律函數(shù)檢驗(yàn),得到入度指標(biāo)的冪律分布函數(shù)參數(shù)ν=2.270?4(KS檢驗(yàn)值為0.037?602,p檢驗(yàn)值為0.462?782);出度指標(biāo)的冪律分布函數(shù)參數(shù)ν=2.058?9(KS檢驗(yàn)值為0.035?791,p檢驗(yàn)值為0.143?565)。這個(gè)結(jié)果表明網(wǎng)絡(luò)節(jié)點(diǎn)的入度和出度指標(biāo)基本服從冪律分布,服從無標(biāo)度網(wǎng)絡(luò)的網(wǎng)絡(luò)定義[20]。
(三)用戶評(píng)價(jià)網(wǎng)絡(luò)的網(wǎng)絡(luò)整體描述
Bitcoin OTC網(wǎng)站的評(píng)價(jià)系統(tǒng)對(duì)于每一位交易用戶提供了以下統(tǒng)計(jì)數(shù)據(jù):
CI-1:該用戶評(píng)價(jià)其他用戶的總分?jǐn)?shù)。
CI-2:該用戶給其他用戶正面評(píng)價(jià)(評(píng)價(jià)值大于零)的總次數(shù)。
CI-3:該用戶給其他用戶負(fù)面評(píng)價(jià)(評(píng)價(jià)值小于零)的總次數(shù)。
CI-4:該用戶被其他用戶正面評(píng)價(jià)的總次數(shù)。
CI-5:該用戶被其他用戶負(fù)面評(píng)價(jià)的總次數(shù)。
本文借鑒這五個(gè)指標(biāo)對(duì)bitcoin?otc數(shù)據(jù)集中的5?881個(gè)節(jié)點(diǎn)進(jìn)行統(tǒng)計(jì)。得到這幾個(gè)指標(biāo)的分布如圖2所示:
另外,為了與指標(biāo)CI-1對(duì)應(yīng),本文計(jì)算并統(tǒng)計(jì)了:
CI-6:該用戶被其他用戶評(píng)價(jià)的總分?jǐn)?shù)。
從圖2可以看出,網(wǎng)絡(luò)節(jié)點(diǎn)的這6個(gè)統(tǒng)計(jì)指標(biāo)比較集中,只有少數(shù)節(jié)點(diǎn)的指標(biāo)值偏離均值。
為了進(jìn)一步發(fā)現(xiàn)網(wǎng)絡(luò)節(jié)點(diǎn)的特征,結(jié)合指標(biāo)CI-2、CI-3、CI-4和CI-5,下面分別給出了按照評(píng)價(jià)值的正負(fù)得出的統(tǒng)計(jì)分布。
對(duì)于用戶對(duì)其他用戶評(píng)價(jià)的分?jǐn)?shù)進(jìn)行統(tǒng)計(jì),按照評(píng)價(jià)值的正負(fù)分類統(tǒng)計(jì)。下面給出了分類統(tǒng)計(jì)的4個(gè)指標(biāo)值(如圖3):
CI-2-S:該用戶給其他用戶正面評(píng)價(jià)的分?jǐn)?shù)的累計(jì)值。
CI-2-A:該用戶給其他用戶正面評(píng)價(jià)的分?jǐn)?shù)的平均值。
CI-3-S:該用戶給其他用戶負(fù)面評(píng)價(jià)的分?jǐn)?shù)的累計(jì)值。
CI-3-A:該用戶給其他用戶負(fù)面評(píng)價(jià)的分?jǐn)?shù)的平均值。
同理,對(duì)用戶被其他用戶評(píng)價(jià)的分?jǐn)?shù)進(jìn)行統(tǒng)計(jì),按照評(píng)價(jià)值的正負(fù)分類統(tǒng)計(jì)(如圖4)。
從圖2、圖3和圖4所示的網(wǎng)絡(luò)節(jié)點(diǎn)的指標(biāo)來看,網(wǎng)絡(luò)中多數(shù)節(jié)點(diǎn)的指標(biāo)相對(duì)集中,只有少數(shù)節(jié)點(diǎn)的指標(biāo)值偏離集中值較多(從指標(biāo)CI-2-A、CI-3-A、CI-4-A、CI-5-A的統(tǒng)計(jì)分布上可以直觀看出這些特點(diǎn))。
四、意見領(lǐng)袖的特征識(shí)別
(一)用戶各指標(biāo)的一致性檢驗(yàn)
圖1至圖4所示網(wǎng)絡(luò)中節(jié)點(diǎn)的指標(biāo)統(tǒng)計(jì)結(jié)果顯示,多數(shù)節(jié)點(diǎn)的行為模式比較接近,呈現(xiàn)出類似正態(tài)分布的分布特征。
指標(biāo)CI-2-A、CI-3-A、CI-4-A、CI-5-A進(jìn)一步表明有少數(shù)節(jié)點(diǎn)表現(xiàn)出脫離大眾的行為特征。根據(jù)前期研究成果表明,這4個(gè)指標(biāo)的異常值所代表的用戶節(jié)點(diǎn)多數(shù)被證明是問題節(jié)點(diǎn)(“騙子”節(jié)點(diǎn))[11]。因此,剔除這些指標(biāo),采用pearson相關(guān)系數(shù)計(jì)算節(jié)點(diǎn)這些指標(biāo)的指標(biāo)值一致性。
通過表2所示的pearson相關(guān)系數(shù),可以看出:
(1)網(wǎng)絡(luò)用戶的出度指標(biāo)與入度指標(biāo)、CI-2和CI-4具有較強(qiáng)的正向相關(guān)性。
(2)指標(biāo)CI-6與出度、入度、CI-2和CI-4具有相對(duì)較強(qiáng)的正向相關(guān)性。
(3)指標(biāo)CI-1和指標(biāo)CI-3,指標(biāo)CI-5和指標(biāo)CI-6具有較弱的負(fù)向相關(guān)性。
根據(jù)加權(quán)符號(hào)網(wǎng)絡(luò)的構(gòu)建方法,網(wǎng)絡(luò)節(jié)點(diǎn)的出度實(shí)質(zhì)上是網(wǎng)絡(luò)用戶對(duì)其他用戶評(píng)價(jià)的總次數(shù),入度則是網(wǎng)絡(luò)用戶被其他用戶評(píng)價(jià)的總次數(shù)。因此,結(jié)合pearson相關(guān)系數(shù)的計(jì)算結(jié)果,可以得到以下結(jié)論:由于用戶對(duì)他人的評(píng)價(jià)值有正有負(fù),因此,用戶對(duì)其他用戶評(píng)價(jià)的總次數(shù)(出度)與用戶對(duì)其他用戶評(píng)價(jià)的總分?jǐn)?shù)(指標(biāo)CI-1)相關(guān)性不高。但是,節(jié)點(diǎn)的出度與節(jié)點(diǎn)的入度,以及與該用戶對(duì)其他用戶正面評(píng)價(jià)的總次數(shù)(指標(biāo)CI-2)和該用戶被其他用戶正面評(píng)價(jià)的總次數(shù)(指標(biāo)CI-4)具有較強(qiáng)的相關(guān)性。
根據(jù)節(jié)點(diǎn)的入度、出度、指標(biāo)CI-2和指標(biāo)CI-4之間的強(qiáng)正相關(guān)性,可以初步認(rèn)為網(wǎng)絡(luò)節(jié)點(diǎn)的重要性/意見領(lǐng)袖與節(jié)點(diǎn)的出度或入度具有較強(qiáng)的相關(guān)性。因此,可以以節(jié)點(diǎn)的出度或入度作為網(wǎng)絡(luò)節(jié)點(diǎn)的意見領(lǐng)袖特性評(píng)價(jià)。
(二)意見領(lǐng)袖特征的正確性檢驗(yàn)
以節(jié)點(diǎn)的出度或入度作為網(wǎng)絡(luò)意見領(lǐng)袖的判定標(biāo)準(zhǔn),但是結(jié)合比特幣交易網(wǎng)站的加權(quán)符號(hào)網(wǎng)絡(luò)描述,存在以下問題需要深入挖掘:用戶的出度或入度較高,但是如果被其他用戶給予負(fù)值評(píng)價(jià)時(shí),該用戶有可能是“騙子”用戶,此用戶不能被標(biāo)簽為網(wǎng)絡(luò)的意見領(lǐng)袖。
因此,根據(jù)用戶評(píng)價(jià)他人的情況,以及該用戶被他人評(píng)價(jià)的情況,將用戶分為以下八類:第1類簡(jiǎn)寫為(P,P),第2類簡(jiǎn)寫為(P,N),第3類簡(jiǎn)寫為(P,Z),第4類簡(jiǎn)寫為(N,P),第5類簡(jiǎn)寫為(N,N),第6類簡(jiǎn)寫為(N,Z),第7類簡(jiǎn)寫為(Z,P),第8類簡(jiǎn)寫為(Z,N)。其中,標(biāo)號(hào)“(X,X)”中第1個(gè)字母X描述了該用戶對(duì)其他用戶的評(píng)價(jià)總體情況,第2個(gè)字母則描述了其他用戶對(duì)該用戶的評(píng)價(jià)總體情況。具體來說,字母P表示正值(positive),代表用戶對(duì)其他用戶的評(píng)價(jià)全部為正值,或被其他用戶的評(píng)價(jià)也全部為正值;字母N表示負(fù)值(negative),代表用戶對(duì)其他用戶的評(píng)價(jià)有負(fù)值(并不強(qiáng)制要求所有的評(píng)價(jià)都是負(fù)值,即有正有負(fù)),或被其他用戶的評(píng)價(jià)也有負(fù)值;字母Z表示零(zero),代表用戶沒有對(duì)任何一個(gè)用戶進(jìn)行評(píng)價(jià),或被其他用戶評(píng)價(jià)。另外,如果一個(gè)用戶既沒有對(duì)其他用戶評(píng)價(jià),也沒有被其他用戶所評(píng)價(jià),(Z,Z)則表示該用戶沒有進(jìn)行任何交易。這樣的用戶在網(wǎng)站的用戶評(píng)價(jià)系統(tǒng)中數(shù)量為0。因此,后續(xù)并不對(duì)其進(jìn)行分析。
鑒于評(píng)價(jià)節(jié)點(diǎn)意見領(lǐng)袖的指標(biāo)(出度或入度),以及與其強(qiáng)正相關(guān)的指標(biāo)CI-2和指標(biāo)CI-4,表3對(duì)這8類節(jié)點(diǎn)進(jìn)行指標(biāo)統(tǒng)計(jì)。
從表3數(shù)據(jù)可以看出,分屬于類別(N,N)和(N,P)的節(jié)點(diǎn)在平均出度、平均入度、CI-2均值和CI-4均值都顯著高于其他類節(jié)點(diǎn)。
以不同類別節(jié)點(diǎn)的入度指標(biāo)進(jìn)行分類統(tǒng)計(jì),得到如圖5所示的統(tǒng)計(jì)結(jié)果。
不同類別的用戶節(jié)點(diǎn)具有較為相似的行為特征(指標(biāo)值),指標(biāo)值集中趨勢(shì)良好。
為了進(jìn)一步檢驗(yàn)網(wǎng)絡(luò)意見領(lǐng)袖的指標(biāo)特征,表4和表5分別以節(jié)點(diǎn)出度和節(jié)點(diǎn)入度作為評(píng)價(jià)意見領(lǐng)袖的指標(biāo),選取了指標(biāo)值排名前10的節(jié)點(diǎn)進(jìn)行指標(biāo)展示。
對(duì)比表4和表5中數(shù)據(jù),表4中以出度為評(píng)價(jià)指標(biāo)的意見領(lǐng)袖與表5中以入度為評(píng)價(jià)指標(biāo)的意見領(lǐng)袖有高度的重合。例如,表4和表5中,是同一節(jié)點(diǎn)的節(jié)點(diǎn)對(duì)序號(hào)分別是:(a-1)、(b-2)、(c-3)、(d-5)、(e-7)、(f-9)、(g-6)、(h-8),只有入度指標(biāo)判定的意見領(lǐng)袖i和j與出度指標(biāo)判定的意見領(lǐng)袖4和10沒有重合。
但是,表4和表5中入度和出度都非常高的節(jié)點(diǎn)(c-3)指標(biāo)CI-5均為41,這意味著有41位用戶給予此“意見領(lǐng)袖”以負(fù)面評(píng)價(jià)。
為此,進(jìn)一步對(duì)這41個(gè)節(jié)點(diǎn)進(jìn)行分析。統(tǒng)計(jì)結(jié)果顯示這41個(gè)節(jié)點(diǎn)有39個(gè)節(jié)點(diǎn)為(N,N)類節(jié)點(diǎn)(另外兩個(gè)節(jié)點(diǎn)為(N,P)類節(jié)點(diǎn))。將表3所示的(N,N)類節(jié)點(diǎn)的各指標(biāo)集中趨勢(shì)(平均值),與這39個(gè)(N,N)類節(jié)點(diǎn)的各指標(biāo)集中趨勢(shì)進(jìn)行對(duì)比,得到表6所示數(shù)據(jù)。
從表6數(shù)據(jù)對(duì)比可以看出,對(duì)編號(hào)為c的節(jié)點(diǎn)給出負(fù)面評(píng)價(jià)的節(jié)點(diǎn),其指標(biāo)值非常顯著地偏離了網(wǎng)絡(luò)中此類節(jié)點(diǎn)的整體特征。根據(jù)前期的研究分析[11],此類節(jié)點(diǎn)自身存在問題,具有較大的可能性屬于網(wǎng)絡(luò)中的“騙子”節(jié)點(diǎn),即有可能是“騙子”節(jié)點(diǎn)被識(shí)破后的報(bào)復(fù)行為。表6類似地給出其他幾個(gè)節(jié)點(diǎn)的情況(編號(hào)為b的節(jié)點(diǎn)指標(biāo)CI-5僅為1,所以只給出了該節(jié)點(diǎn)的指標(biāo)值)。
(三)小結(jié)
通過以上的數(shù)據(jù)分析,可以得出以下結(jié)論:
依據(jù)比特幣P2P交易網(wǎng)站上的用戶評(píng)價(jià)所構(gòu)建的加權(quán)符號(hào)網(wǎng)絡(luò),網(wǎng)絡(luò)中節(jié)點(diǎn)(用戶)行為模式非常相似;根據(jù)用戶對(duì)他人的評(píng)價(jià)值符號(hào),以及其他用戶對(duì)該用戶的評(píng)價(jià)值符號(hào),對(duì)網(wǎng)絡(luò)中的所有節(jié)點(diǎn)進(jìn)行分類,分類結(jié)果良好(相同類別中節(jié)點(diǎn)各指標(biāo)值較為集中,不同類別節(jié)點(diǎn)的各指標(biāo)值差異顯著);雖然用戶之間的評(píng)價(jià)值有正有負(fù),并且評(píng)價(jià)值有大有小,但是以節(jié)點(diǎn)的出度或入度作為其意見領(lǐng)袖的評(píng)價(jià)指標(biāo),指標(biāo)依然有效。
五、結(jié)論及展望
本文以當(dāng)前流行的P2P交易網(wǎng)站用戶群體為對(duì)象,通過構(gòu)建用戶相互評(píng)價(jià)的網(wǎng)絡(luò)來識(shí)別其中的意見領(lǐng)袖。通過分析發(fā)現(xiàn),雖然用戶之間的評(píng)價(jià)有好有壞、評(píng)價(jià)值也有高有低,但是采用復(fù)雜網(wǎng)絡(luò)分析中的節(jié)點(diǎn)出度指標(biāo)或入度指標(biāo)能夠簡(jiǎn)單快速并有效地識(shí)別網(wǎng)絡(luò)中的意見領(lǐng)袖。
參考文獻(xiàn):
[1]HAJLI N, SIMS J, ZADEH A H, et al.?A social commerce investigation of the role of trust in a social networking site on purchase intentions [J]. Journal of Business Research, 2017, 71(1): 133-141.
[2]LI F, DU TC.?Listen to me—evaluating the influence of micro?blogs [J]. Decision Support Systems, 2014, 62(1): 119-130.
[3]趙之瀅, 于海, 朱志良, 等.?基于網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)的節(jié)點(diǎn)傳播影響力分析 [J]. 計(jì)算機(jī)學(xué)報(bào), 2014, 37(4): 753-766.
[4]LI F, DU TC.?Maximizing micro?blog influence in online promotion [J]. Expert Systems with Applications, 2017, 70: 52-66.
[5]魏瑩, 劉冠, 李鋒.?線上社交網(wǎng)絡(luò)上信息擴(kuò)散中“隱形”關(guān)鍵節(jié)點(diǎn)的識(shí)別及影響力評(píng)價(jià)[J]. 情報(bào)科學(xué), 2018, 36(3): 138-143.
[6]任曉龍, 呂琳媛.?網(wǎng)絡(luò)重要節(jié)點(diǎn)排序方法綜述[J]. 科學(xué)通報(bào), 2014, 59(13):1175-1197.
[7]魏瑩, 李鋒.?基于主路徑分析的關(guān)鍵節(jié)點(diǎn)識(shí)別與謠言擴(kuò)散抑制研究[J]. 情報(bào)科學(xué), 2018, 36(6): 13-19.
[8]謝耘耕, 榮婷.?微博傳播的關(guān)鍵節(jié)點(diǎn)及其影響因素分析——基于30起重大輿情事件微博熱帖的實(shí)證研究 [J]. 新聞與傳播研究, 2013(3): 5-15.
[9]程蘇琦, 沈華偉, 張國清, 等.?符號(hào)網(wǎng)絡(luò)研究綜述 [J]. 軟件學(xué)報(bào), 2014, 25(1): 1-15.
[10]GU K, FAN Y, ZENG A, et al.?Analysis on large?scale rating systems based on the signed network [J]. Physica A, 2018, 507: 99-109.
[11]李鋒, 胡錦亞.?基于加權(quán)符號(hào)網(wǎng)絡(luò)的比特幣交易平臺(tái)用戶交易風(fēng)險(xiǎn)評(píng)價(jià) [J]. 華南理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2019, 21(1): 15-27.
[12]MA L, GONG M, YAN J, et al.?A decomposition?based multi?objective optimization for simultaneous balance computation and transformation in signed networks [J]. Information Sciences, 2017, 378(C): 144-160.
[13]DU H, HE X, WANG J, et al.?Reversing structural balance in signed networks [J]. Physica A, 2018, 503: 780-792.
[14]KUMAR S, SPEZZANO F, SUBRAHMANIAN V S, et al.?Edge weight prediction in weighted signed networks [C]. In Proceedings of 2016 IEEE 16th International Conference on Data Mining, Barcelona: IEEE, 2016, 221-230.
[15]伍杰華.?異構(gòu)符號(hào)網(wǎng)絡(luò)中正負(fù)社交關(guān)系的分類預(yù)測(cè)研究 [J]. 情報(bào)科學(xué), 2016, 34(1): 81-86.
[16]顧潔, 胡安安, 劉旭, 等.?社交網(wǎng)絡(luò)正、負(fù)影響力計(jì)算——基于符號(hào)網(wǎng)絡(luò)的PageRank算法改進(jìn) [J]. 情報(bào)學(xué)報(bào), 2015, 34(7): 725-733.
[17]曹林林, 鄭明春.?微博話題符號(hào)網(wǎng)絡(luò)下的意見領(lǐng)袖挖掘算法研究 [J]. 計(jì)算機(jī)應(yīng)用研究, 2017, 34(12): 3547-3551.
[18]LI D, WANG C, ZHANG S, et al.?Positive influence maximization in signed social networks based on simulated annealing [J]. Neurocomputing, 2017, 260: 69-78.
[19]莫倩, 楊柯.?網(wǎng)絡(luò)水軍識(shí)別研究 [J]. 軟件學(xué)報(bào), 2014, 25(7): 1505-1526.
[20]BARABASI AL, ALBERT R.?Emergence of scaling in random networks [J]. Science, 1999, 286(5439): 509-512.
Opinion Leader Identification and Analysis in a Bitcoin Trading P2P Website
LI Feng?WANG Yan?feng?HU Jin?ya
(School of Business Administration, South China University of Technology, Guangzhou 510640, Guangdong, China)
Abstract: Online users of P2P trading website usually were rated by others as being positive or negative. These made attitudes of opinion leaders more important, and identification of opinion leaders more complicated. This paper fetched rating records among users from a Bitcoin trading P2P website. Based on these data, a directed weighted signed network was constructed. Users were classified into several classes according to ratings they had sent and received. Moreover, statistics description of these users was given, along with data through social network analysis. Then, the correlation coefficients between features of users were calculated. Based on data analysis, strong positive correlation coefficients between several features of users were uncovered. More important, in?degree and out?degree of nodes (users in the network) were verified to recognize opinion leaders.
Keywords: opinion leader; Bitcoin trading website; peer?to?peer rating; social network analysis; weighted signed network