国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

微博客中轉(zhuǎn)發(fā)行為的預(yù)測研究

2012-10-15 01:38:10旸,路榮,楊
中文信息學(xué)報 2012年4期
關(guān)鍵詞:區(qū)分度重要性預(yù)測

張 旸,路 榮,楊 青

(中國科學(xué)院 自動化研究所 模式識別國家重點(diǎn)實驗室,北京100190)

1 引言

微博客(簡稱微博①本文提到的微博有兩層含義:一是指微博平臺如新浪微博,Twitter等,二是指在平臺上發(fā)布的狀態(tài),比如Twitter上的t weets等。),是一個基于用戶關(guān)系的信息分享、傳播以及獲取平臺。用戶可以經(jīng)由SMS、即時通信、電郵、網(wǎng)站或第三方應(yīng)用發(fā)布微博,輸入最多140字的更新。以前的研究指出[1],在信息時代,關(guān)注已經(jīng)取代信息本身,成為稀缺資源。特別的,在微博客中,微博通過轉(zhuǎn)發(fā)吸引大家的關(guān)注,如何準(zhǔn)確的預(yù)測一條微博是否會被轉(zhuǎn)發(fā)是信息傳播中的一個基本問題,也是本文研究的重點(diǎn)。

解決這個問題有如下好處。第一,被轉(zhuǎn)發(fā)的微博往往反映了用戶感興趣的話題,所以我們的研究可以應(yīng)用到微博推薦中;第二,Cash more等[2]指出,社會化內(nèi)容的分享(如微博的轉(zhuǎn)發(fā))不是隨機(jī)的,而是決定于其本身的“傳播性”。通過對微博轉(zhuǎn)發(fā)行為的研究,我們能更好的理解微博中的“傳播性”,并將之應(yīng)用于市場營銷或熱點(diǎn)提取等;第三,研究證明,讀者更傾向于分享那些能激發(fā)他們積極情緒(敬畏,憤怒)的社會化內(nèi)容,相反的,那些激發(fā)讀者消極情緒(悲傷)的內(nèi)容通常不會被分享[3]。所以,通過預(yù)測微博的轉(zhuǎn)發(fā),我們可以進(jìn)一步進(jìn)行微博上的情感分析及輿情監(jiān)控。

為了解決這個問題,基于微博中各個特征的重要性的差異,本文提出了特征加權(quán)的預(yù)測模型,其框架圖如圖1所示。具體來說,我們的方法分以下四步。第一,通過對大量數(shù)據(jù)的分析,我們得到微博上不同特征在被轉(zhuǎn)發(fā)的微博和沒被轉(zhuǎn)發(fā)的微博上的差異,得出它們的區(qū)分度;第二,利用那些區(qū)分度較好的特征,配合有監(jiān)督的機(jī)器學(xué)習(xí)方法,我們生成了基本的無加權(quán)的預(yù)測模型;第三,應(yīng)用特征選擇方法,分析哪些特征對轉(zhuǎn)發(fā)有著更重要的影響,得到了不同特征的重要性排名;第四,在基本模型中,通過對不同重要性的特征賦予不同的權(quán)重,得到最終的特征加權(quán)預(yù)測模型。

圖1 特征加權(quán)模型的框架圖

實驗結(jié)果表明,本文提到的方法很好地解決了微博上轉(zhuǎn)發(fā)行為的預(yù)測問題,能正確預(yù)測約86%的微博。

本文的組織結(jié)構(gòu)如下,第二節(jié)介紹微博的相關(guān)工作;第三節(jié)描述了我們的數(shù)據(jù)集,并分析了不同特征的區(qū)分度;我們在第四節(jié)介紹特征加權(quán)的預(yù)測模型。第五節(jié)給出了實驗的結(jié)果和分析;第六節(jié)是總結(jié)與展望。

2 相關(guān)工作

研究表明,微博在很多領(lǐng)域都發(fā)揮著重要作用,例如,政治選舉、市場營銷、突發(fā)災(zāi)難及日常生活中[4-7]。Tu masjan等[4]發(fā)現(xiàn),微博能有效地反映現(xiàn)實社會中選民的傾向。Bollen等[5]發(fā)現(xiàn)從微博中收集的情感信息,與道瓊斯指數(shù)緊密相關(guān)。Sakaki等[6]通過Twitter來迅速找出地震的震中,而Qu等[7]則通過研究2010年中國玉樹地震前后,新浪微博①http://weibo.com/.內(nèi)容的變化,進(jìn)一步指出微博在災(zāi)難面前所發(fā)揮的巨大且積極的作用。

當(dāng)前的很多研究都集中在微博的各種特性和轉(zhuǎn)發(fā)這一重要機(jī)能上[8-10]。Kwak等[8]分析了 Twitter的拓?fù)涮卣?,指出微博是一種新的信息分享媒介。Boyd等[9]對Twitter的轉(zhuǎn)發(fā)功能ret weet做了細(xì)致的分析,探討人們?nèi)绾无D(zhuǎn)發(fā),為什么轉(zhuǎn)發(fā)以及轉(zhuǎn)發(fā)什么的問題。Suh等[10]分析了影響轉(zhuǎn)發(fā)的各種因素,發(fā)現(xiàn)文本特征和社會化關(guān)系都對轉(zhuǎn)發(fā)有一定影響。

哪些用戶更容易被轉(zhuǎn)發(fā)?這個問題近來也吸引了越來越多研究者的關(guān)注[11-13]。例如,Cha等[11]通過粉絲的數(shù)量、以前被轉(zhuǎn)發(fā)的數(shù)量等特征去衡量一個用戶的影響力。Weng等[12]則利用用戶之間的相互關(guān)注關(guān)系和在不同話題上的相似程度,去尋找有影響力的用戶。Welch等[13]則改進(jìn)了 Weng等的做法,通過用戶之間的轉(zhuǎn)發(fā)關(guān)系代替關(guān)注關(guān)系。

近來,也有少數(shù)工作涉及了微博的轉(zhuǎn)發(fā)預(yù)測問題[14-16]。Hong等[14]嘗試通過分類去解決這個問題,而Zaman等[15]則引入了協(xié)同過濾的算法,可是他們的方法都不能取得令人滿意的預(yù)測結(jié)果。Petr ovic等[16]通過人工實驗證明了這個問題的可行性,然后利用改進(jìn)的passive-aggressive算法預(yù)測轉(zhuǎn)發(fā),可是也僅僅能正確預(yù)測46.6%的微博。

3 數(shù)據(jù)描述

本文中,我們以Twitter為例,研究微博上的轉(zhuǎn)發(fā)預(yù)測問題。本節(jié)我們介紹了在Twitter上收集數(shù)據(jù)的方法,并統(tǒng)計分析了微博上的不同特征在轉(zhuǎn)發(fā)微博和非轉(zhuǎn)發(fā)微博上的區(qū)別,以期找到那些具有良好區(qū)分度的特征。

3.1 數(shù)據(jù)收集

通過Twitter上提供的Strea ming API,從2011年3月11號到3月14號,我們抓取了Twitter上四天的公共微博數(shù)據(jù),共收集了6003346條微博,即平均每天隨機(jī)抓取了約150萬條微博。為了便于處理,剔除那些非英文的微博,最終得到4242405條微博。因為是通過分類預(yù)測一條微博是否會被轉(zhuǎn)發(fā),我們還需要把收集到的數(shù)據(jù)標(biāo)記為兩類,被轉(zhuǎn)發(fā)和未被轉(zhuǎn)發(fā)。根據(jù)微博數(shù)據(jù)集中一條微博被轉(zhuǎn)發(fā)的次數(shù),我們得到了556402條被轉(zhuǎn)發(fā)的微博,3686003條未被轉(zhuǎn)發(fā)的微博。選取前三天的數(shù)據(jù)作為訓(xùn)練集,余下的作為測試集。

3.2 特征的區(qū)分度

Twitter上的特征一般分為用戶特征和文本特征,本節(jié)將分別分析它們在被轉(zhuǎn)發(fā)和未被轉(zhuǎn)發(fā)兩類微博上的區(qū)分度。

3.2.1 用戶特征

用戶特征用來描述用戶的行為,例如,發(fā)微博的頻率,社交關(guān)系以及在Twitter上的影響力等。圖2描述了用戶的粉絲數(shù)及被列表數(shù)這兩個特征在被轉(zhuǎn)發(fā)的微博和未被轉(zhuǎn)發(fā)微博上的累計分布函數(shù)(CDF)。圖2直觀的反映了這兩個特征的區(qū)分度,由圖2可以看出,用戶的粉絲數(shù)和列表數(shù)都能很好的區(qū)分微博的轉(zhuǎn)發(fā)與否。例如,被轉(zhuǎn)發(fā)的那些微博的作者平均有277421名粉絲,而未被轉(zhuǎn)發(fā)的微博的作者只有831名。再如,在被轉(zhuǎn)發(fā)的作者中,被列表超過15次的用戶占71%,而在未被轉(zhuǎn)發(fā)的作者中,這一比例僅為23%。當(dāng)然,除了上述兩個特征外,還有其他許多具有良好區(qū)分度的用戶特征。例如,被轉(zhuǎn)發(fā)的微博的作者平均關(guān)注5541個用戶,發(fā)布10040條微博,而未被轉(zhuǎn)發(fā)的作者平均只關(guān)注722個用戶,發(fā)布7558條微博。約有11%的被轉(zhuǎn)發(fā)微博的作者通過了認(rèn)證,而只有0.09%的未被轉(zhuǎn)發(fā)作者通過認(rèn)證。

圖2 兩個用戶特征在轉(zhuǎn)發(fā)和非轉(zhuǎn)發(fā)上的分布

3.2.2 文本特征

文本特征描述了用戶發(fā)布微博的方式,例如,是否包含URL,是否包含hashtag,一條微博的長度等。表1給出了一些文本特征在轉(zhuǎn)發(fā)微博和非轉(zhuǎn)發(fā)微博上的對比??梢钥闯?,這些特征都能較好的分辨轉(zhuǎn)發(fā)和非轉(zhuǎn)發(fā),特別是是否提及他人、是否為回復(fù)、以前是否被轉(zhuǎn)發(fā)這三個特征。有一點(diǎn)值得注意,如果一條微博以前曾被轉(zhuǎn)發(fā),則它很難再被轉(zhuǎn)發(fā)(在被轉(zhuǎn)發(fā)中的比例遠(yuǎn)小于在未被轉(zhuǎn)發(fā)中的比例),這一現(xiàn)象從側(cè)面反映了大部分的微博只被轉(zhuǎn)發(fā)一次[8]??傊?,通過本小節(jié)和上一小節(jié)的分析,我們發(fā)現(xiàn),不管是用戶特征還是文本特征,都能較好的區(qū)別被轉(zhuǎn)發(fā)和未被轉(zhuǎn)發(fā)微博。

表1 文本特征在轉(zhuǎn)發(fā)和非轉(zhuǎn)發(fā)微博上的對比

4 特征加權(quán)的預(yù)測模型

本節(jié)將介紹特征加權(quán)模型。我們通過分類的方法實現(xiàn)預(yù)測,在我們的方法中,每條微博通過一組數(shù)值來表示,其中每個數(shù)值對應(yīng)于一個特征,利用前文提到的具有良好區(qū)分度的特征,并配合機(jī)器學(xué)習(xí)算法,我們訓(xùn)練得到預(yù)測模型。4.1節(jié)首先介紹了無加權(quán)的基本預(yù)測模型,4.2節(jié)分析了不同特征的重要性,最后4.3節(jié)在無加權(quán)模型的基礎(chǔ)上,通過對不同重要性的特征給予額外的賞罰,得到最終的特征加權(quán)模型。

4.1 無加權(quán)基本模型

首先介紹無加權(quán)模型所使用的特征。在3.2節(jié)我們已經(jīng)指出,微博上的特征分為用戶和文本兩大類,每類特征都能很好的區(qū)分被轉(zhuǎn)發(fā)和未被轉(zhuǎn)發(fā)微博。我們共選擇了以下22個特征來訓(xùn)練模型。用戶特征(11個):用戶的粉絲數(shù)、用戶的關(guān)注數(shù)、用戶的被列表數(shù)、注冊的天數(shù)、發(fā)布的微博總數(shù)、用戶名的長度、喜愛的微博的數(shù)目、是否被認(rèn)證、用戶每天發(fā)布的微博數(shù)、平均每條微博帶來的粉絲數(shù)、平均每天擁有的粉絲數(shù)。文本特征(11個):是否包含URL、是否包含hashtag、是否提及他人、是否為回復(fù)、URL的數(shù)量、hashtag的數(shù)量、提及他人的次數(shù)、微博的長度、微博中的字母數(shù)、發(fā)布的時間、以前是否被轉(zhuǎn)發(fā)。

然后我們通過支持向量機(jī)(SV M)來訓(xùn)練無加權(quán)模型。SV M的目標(biāo)是在N維空間中找到一個最優(yōu)的超平面,能夠分開訓(xùn)練集中的兩類數(shù)據(jù),并使它們有最大的間距。在本文中,我們使用基于徑向基核函數(shù)的SV M模型,并借助開源工具Lib SV M的幫助,訓(xùn)練得到基本的預(yù)測模型。

4.2 特征的重要性

Suh等[10]指出,在對微博轉(zhuǎn)發(fā)與否的影響上,不同的特征發(fā)揮的作用大不相同。為了定量評測各個特征的重要性,我們使用了一種廣泛使用的特征選擇算法,信息增益算法(IG)。相對于其他的特征選擇算法,例如,互信息,它往往更加簡潔有效[17]。一個特征的信息增益值越大,說明該特征越重要。

通過本節(jié)的分析,我們發(fā)現(xiàn),在用戶特征中,用戶的粉絲數(shù)和被列表數(shù)最為重要,而用戶發(fā)布微博的頻率和總數(shù)對轉(zhuǎn)發(fā)的影響則相對較小。在文本特征中,相比是否包含URL或hashtag,一條微博是否為回復(fù)及是否提及他人更能影響該微博的轉(zhuǎn)發(fā),以前是否被轉(zhuǎn)發(fā)這個特征則不像預(yù)想中的那么重要。我們將在實驗結(jié)果中給出各個特征重要性的具體排名。

4.3 特征加權(quán)模型

4.2節(jié)指出不同特征對于一條微博是否會被轉(zhuǎn)發(fā)有著顯著不同的影響,我們在設(shè)計預(yù)測模型時就應(yīng)該考慮不同特征的差異,賦予各個特征以不同的權(quán)重,以期獲得更好的結(jié)果。為了得到特征加權(quán)模型,在無加權(quán)模型的基礎(chǔ)上,我們?yōu)槊總€特征引入權(quán)重參數(shù),該參數(shù)將作為一個額外的賞罰因子作用到無加權(quán)模型中(本文中即為SV M)。4.2節(jié)中,我們通過IG值定量的描述了各個特征的重要程度,自然的,我們也依據(jù)不同特征的IG值為不同的特征選擇合適的權(quán)重參數(shù),IG值越大,則該特征的權(quán)重參數(shù)就越大。我們首先計算出所有特征的平均IG值IGMEAN,然后依據(jù)式(1)為每個特征f選擇權(quán)重:

其中,weight(f)表示特征f的權(quán)重,IG(f)表示特征f的信息增益值??梢钥吹?,如果某特征對微博的轉(zhuǎn)發(fā)與否有著重要影響,則它的IG值就會更高,對應(yīng)的權(quán)重參數(shù)就大于1,該特征相應(yīng)的在加權(quán)模型中就會發(fā)揮更大的作用。式(1)中的開平方是為了緩和該特征加權(quán)機(jī)制的影響。

5 實驗結(jié)果與分析

5.1 評測指標(biāo)

預(yù)測結(jié)果以表2中混淆矩陣的形式表示。為了評價預(yù)測模型的效果,我們選用信息檢索的標(biāo)準(zhǔn)指標(biāo),包括準(zhǔn)確率、查全率、總體命中率、F1值。準(zhǔn)確率是一類中被正確預(yù)測的微博占預(yù)測的屬于該類的全部微博的比例,例如,被轉(zhuǎn)發(fā)的微博這一類中,準(zhǔn)確率P為a/(a+c)。查全率為一類中被正確預(yù)測的微博占該類實際的全部微博的比例,例如還是被轉(zhuǎn)發(fā)的微博這一類中,查全率R為a/(a+b)??傮w命中率是各個類中所有被正確預(yù)測的微博占總數(shù)的比例,表2中的命中率為(a+d)/(a+b+c+d)。F1值折中考慮了準(zhǔn)確率和查全率,表中被轉(zhuǎn)發(fā)微博這一類的F1值為2PR/(P+R)。

表2 以混淆矩陣形式表示的預(yù)測結(jié)果

5.2 基本模型的預(yù)測結(jié)果

表3顯示了基本模型的預(yù)測結(jié)果??梢钥吹剑ㄟ^基本模型,大約72%的被轉(zhuǎn)發(fā)微博能被正確預(yù)測,而有將近92%的未被轉(zhuǎn)發(fā)微博被正確預(yù)測。

表3 基本模型的預(yù)測結(jié)果

5.3 特征的重要性分析

5.3.1 特征重要性排名

表4通過信息增益的方法,給出了各個特征的重要性排名。我們可以看到在表4的頂部(前4)全是用戶特征,例如,粉絲數(shù)、列表數(shù)。是否提及他人及是否為回復(fù)也同樣重要,排在第5和第7位。值得注意的是,有一些特征盡管具有良好的區(qū)分度,但對一條微博是否轉(zhuǎn)發(fā)卻發(fā)揮很小的作用。例如,關(guān)于URL的那些文本特征,如前所述能很好的區(qū)分被轉(zhuǎn)發(fā)和未被轉(zhuǎn)發(fā),但它們卻全都位于該表的底部(第20,第21),再如,關(guān)于hashtag的那些特征也僅僅位于表的中間。我們還發(fā)現(xiàn),盡管像粉絲數(shù)等用戶特征非常重要,也存在一些用戶特征對轉(zhuǎn)發(fā)與否的影響很小,例如,該用戶的微博總數(shù)和發(fā)微博頻率,分別位于第17位和第22位。這說明相較于用戶的影響力,用戶的活躍程度對他/她的微博的轉(zhuǎn)發(fā)與否影響很小。表4中也有一些有趣的現(xiàn)象,例如,用戶的關(guān)注數(shù)不像粉絲數(shù)那么重要,該微博以前是否被轉(zhuǎn)發(fā)過也不像我們預(yù)期的那樣重要。

表4 不同特征的重要性排名

續(xù)表

5.3.2 用戶特征和文本特征

我們將在本小節(jié)探討用戶特征和文本特征誰更重要的問題。表5列出了在特征的重要性排名中,前10名及前22名中用戶特征和文本特征的數(shù)目??梢钥闯觯还苁窃谇?0名中還是前22名中,這兩組特征的數(shù)目都是相等的,所以我們設(shè)想,用戶特征和文本特征對轉(zhuǎn)發(fā)行為的影響是相似的。為了證明我們的設(shè)想,在基本模型中,我們分別使用用戶特征和文本特征去預(yù)測微博的轉(zhuǎn)發(fā)。圖3給出了預(yù)測結(jié)果的對比。

表5 用戶特征和文本特征的數(shù)目

圖3 分別利用文本和用戶特征得到的預(yù)測結(jié)果

從圖3中可以看出,分別使用用戶特征和文本特征,所得的預(yù)測結(jié)果非常相近(77.6%和78.1%)。這說明了在對微博轉(zhuǎn)發(fā)的影響上,用戶特征和文本特征幾乎同等重要。這個結(jié)論在現(xiàn)實中有著重要的意義,例如,如果一個用戶希望自己發(fā)布的微博能盡可能多的被轉(zhuǎn)發(fā),他不必苦惱于自己的粉絲較少等很難在短時間內(nèi)改變的用戶特征,完全可以通過改進(jìn)發(fā)布微博的方式來達(dá)成這一目標(biāo)。

5.4 特征加權(quán)模型

圖4對比了無加權(quán)模型與特征加權(quán)模型的預(yù)測結(jié)果。我們可以看出,通過引入特征加權(quán)模型,預(yù)測的效果得到進(jìn)一步的提升。特征加權(quán)模型的總體命中率為85.9%,優(yōu)于基本模型的81.9%。另外,因為加權(quán)是按照特征重要性的排名進(jìn)行的,圖4的結(jié)果反過來證明了特征重要性排名的可信度,這也為微博上信息傳播的控制指明了方向。例如,如果我們想讓一條微博傳播的更遠(yuǎn),我們應(yīng)該專注于以下幾個方面。第一,我們需要吸引盡可能多的粉絲;第二,我們盡量不要在該微博中提及他人;第三,該微博最好不是一條回復(fù)。而其他一些方面,例如,該微博是否包含URL或hashtag,或者該作者是否活躍等,都不那么重要。

圖4 特征加權(quán)模型與無加權(quán)模型的預(yù)測結(jié)果比較

6 總結(jié)與展望

微博的轉(zhuǎn)發(fā)預(yù)測問題是理解信息在微博客上如何傳播的關(guān)鍵,也是本文研究的重點(diǎn)。在本文中,考慮到微博中各個特征的重要性的顯著差異,我們提出了特征加權(quán)的預(yù)測模型。通過特征加權(quán)機(jī)制,那些重要的特征就能在模型中得到進(jìn)一步加強(qiáng),反之則減弱。實驗表明,我們的模型很好的解決了轉(zhuǎn)發(fā)預(yù)測問題,大約有86%的微博被成功預(yù)測。

盡管如此,我們的工作仍存在一些需要改進(jìn)的地方,這也是以后工作的方向。第一,我們忽視了各個特征之間的聯(lián)系,例如,粉絲數(shù)和關(guān)注數(shù)就有很大的關(guān)聯(lián),這對我們的模型有一定程度的影響,將來的工作需要詳細(xì)討論特征之間的相互聯(lián)系。第二,關(guān)于各個特征的權(quán)重的選取,除了本文用到的根據(jù)信息增益的相對關(guān)系,還可以嘗試其他一些方法,例如,卡方分布等。

[1]R.Lahan.The Econo mics of Attention[M].University of Chicago Press,2006.

[2]Pete Cash more.You Tube:Why Do We Watch?[DB/OL].http://editin.cnn.com/2009/TECH/12/17/cash more.youtube/index.ht ml,2010.

[3]J.Berger,K.L.Milk man.Social Trans mission,E-motion,and the Virality of Online Content[R].Wharton Research Paper,2010.

[4]A.Tumasjan,T.O.Sprenger,P.G.Sandner,et al.Predicting Elections with Twitter:What 140 Characters Reveal about Political Senti ment[C]//Proceedings of the 4th Inter national AAAI Conference on Weblogs and Social Media.ICWSM'10,2010.

[5]J.Bollen,H.Mao,A.Pepe.Deter mining the public mood state by analysis of microblogging posts[C]//Pr oceedings of the Alife XII Conference MIT Press,2010.

[6]T.Sakaki,M.Okazaki,Y.Matsuo.Earthquake Shakes Twitter Users:Real-time Event Detection by Social Sensors[C]//Proceedings of WWW'10,2010.

[7]Y.Qu,C.Huang,P.Zhang,et al.Microblogging after a Major Disaster in China:A Case St udy of the Yushu Earthquake[C]//Proceedings of CSCW2011,2011.

[8]H.Kwak,C.Lee,H.Par k,et al.What is Twitter,a Social Net wor k or a News Media[C]//Proceedings of WWW'10,2010.

[9]D.Boyd,S.Golder,G.Lotan.Tweet,t weet,ret weet:Conversational aspects of ret weeting on Twitter[C]//Proceedings of 43rd Hawaii Inter national Conference on System Sciences,2010.

[10]B.Suh,L.Hong,P.Pirolli,et al.Want to be Ret weeted?Large Scale Analytics on Factors Impacting Ret weet in Twitter Net work[C]//Proceedings of IEEE 2nd Inter national Conference on Social Computing(Social Co m),IEEE.2010:177-184.

[11]M.Cha,H.Haddadi,F(xiàn).Benevenuto,et al.Measuring User Influence in Twitter:The Million Follower Fallacy[C]//Proceedings of AAAI'10,2010.

[12]J.Weng,E-P.Li m,J.Jiang,et al.Twitterrank:Finding topic-sensitive influential t witterers[C]//Proceedings of WSDM'10,2010.

[13]J.Welch,D.He,U.Schonfeld,et al.Topical Semantics of Twitter Links[C]//Proceedings of WSDM'11,2011.

[14]L.Hong,O.Dan,B.D.Davison.Predicting Popular Messages in Twitter [C]//Proceedings of WWW2011,2011.

[15]T.R.Zaman,R.Her brich,J.V.Gael and D.Ster n.Predicting inf or mation spreading in t witter[C]//Workshop on Computational Social Science and the Wisdo m of Cr owds,NIP'2010,2010.

[16]S.Petrovic,M.Osbor ne and V.Lavrenko.RT to Win!Predicting Message Pr opagation in Twitter[C]//AAAI2011,2011.

[17]徐艷,李錦濤,王斌,等.基于區(qū)分類別能力的高性能特征選擇方法[J].軟件學(xué)報,2008,19(1):82-89.

猜你喜歡
區(qū)分度重要性預(yù)測
無可預(yù)測
黃河之聲(2022年10期)2022-09-27 13:59:46
選修2-2期中考試預(yù)測卷(A卷)
選修2-2期中考試預(yù)測卷(B卷)
“0”的重要性
論七分飽之重要性
幼兒教育中閱讀的重要性
甘肅教育(2020年21期)2020-04-13 08:09:24
淺談試卷分析常用的幾個參數(shù)及其應(yīng)用
圖形推理測量指標(biāo)相關(guān)性考察*
江淮論壇(2018年4期)2018-08-24 01:22:30
不必預(yù)測未來,只需把握現(xiàn)在
淺觀一道題的“區(qū)分度”
托里县| 扶风县| 喀喇| 正宁县| 广宁县| 女性| 平潭县| 曲水县| 威宁| 太仆寺旗| 宜都市| 巴马| 同德县| 阿坝| 丹东市| 湖州市| 嘉善县| 淮安市| 保亭| 宜宾县| 耒阳市| 定陶县| 阿巴嘎旗| 铜川市| 厦门市| 朔州市| 汉中市| 沭阳县| 当阳市| 西和县| 黑山县| 灌阳县| 繁峙县| 蒙山县| 双江| 侯马市| 三门县| 大洼县| 泾源县| 桃江县| 土默特右旗|