国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺析移動(dòng)社交網(wǎng)絡(luò)語(yǔ)義話題的若干關(guān)鍵技術(shù)

2016-11-16 15:25:20趙建東陸奎李雪萍
電腦知識(shí)與技術(shù) 2016年25期
關(guān)鍵詞:移動(dòng)網(wǎng)絡(luò)

趙建東+陸奎+李雪萍

摘要:隨著移動(dòng)終端的普及,手機(jī)用戶之間的溝通、傳播與分享正在構(gòu)建自組織移動(dòng)社交網(wǎng)絡(luò)并逐步滲透到人們?nèi)粘I?、工作、學(xué)習(xí)和娛樂(lè)中,而移動(dòng)社交網(wǎng)絡(luò)也將成為一種全新的連接并融合物理空間和網(wǎng)絡(luò)空間的真實(shí)社會(huì)網(wǎng)絡(luò)模式。隨之而來(lái)的對(duì)日益海量和錯(cuò)綜復(fù)雜信息的移動(dòng)網(wǎng)絡(luò)語(yǔ)義話題的研究也日趨困難。因此,該文以海量的、高階異構(gòu)的移動(dòng)社會(huì)網(wǎng)絡(luò)數(shù)據(jù)為背景,提出了以語(yǔ)義話題發(fā)現(xiàn)、搜索和溯源為目標(biāo)來(lái)探究社交網(wǎng)絡(luò)及其語(yǔ)義話題的關(guān)鍵技術(shù)。

關(guān)鍵詞:移動(dòng)網(wǎng)絡(luò);語(yǔ)義話題;話題溯源;潛在語(yǔ)義;話題搜索

中圖分類號(hào):TP393.092 文獻(xiàn)標(biāo)識(shí)碼:A 章編號(hào):1009-3044(2016)25-0227-03

Abstract: With the popularity of mobile, the communication, spread and sharing between mobile phone users are building self-organization mobile social network and gradually permeating into Peoples Daily life, work, study and entertainment. Mobile social network will also become a new real social network model with connecting and integrating the physical space and cyberspace .Of course the increasing and complex information semantic topic research has become increasingly difficult. Therefore, based on the mass, the high order heterogeneous mobile social network data, This article put forward to found , search, and trace semantic topics to explore social network and the key technologies of semantic topics.

Key words: mobile network; semantic topic; topic roots; latent semantic; topic search

1 背景

隨著智能手機(jī)等移動(dòng)設(shè)備的普及,使用移動(dòng)設(shè)備來(lái)訪問(wèn)社交網(wǎng)絡(luò)逐漸成為主流,隨之帶來(lái)了大量嶄新的研究和應(yīng)用機(jī)會(huì),例如位置服務(wù)、傳感器技術(shù)與社交網(wǎng)絡(luò)的結(jié)合以及針對(duì)移動(dòng)社交網(wǎng)絡(luò)數(shù)據(jù)的管理與挖掘等。近期,在多個(gè)國(guó)際學(xué)術(shù)會(huì)議中,如UbiComp和ACM SIGSPATIAL,移動(dòng)社交網(wǎng)絡(luò)都是研究熱點(diǎn)。伴隨著SoLoMo(Social、Local、Mobile三個(gè)字母開(kāi)頭組合而成的,即社交加本地化加移動(dòng))概念的風(fēng)靡,國(guó)內(nèi)外創(chuàng)業(yè)公司也開(kāi)始關(guān)注這個(gè)領(lǐng)域。

互聯(lián)網(wǎng)的普及使人類以前所未有的廣度和深度及時(shí)記錄和存儲(chǔ)信息,且各種形式的Web社會(huì)網(wǎng)絡(luò)為用戶提供了一個(gè)信息傳播與信息共享的平臺(tái)。用戶與Web的高互動(dòng)性極大促進(jìn)了社會(huì)行為向Web行為、現(xiàn)實(shí)社會(huì)關(guān)系向網(wǎng)絡(luò)社會(huì)關(guān)系的轉(zhuǎn)化過(guò)程。然而,目前話題模型是單一同構(gòu)的純文本或純關(guān)系模型,無(wú)法體現(xiàn)移動(dòng)社會(huì)網(wǎng)絡(luò)中人-社區(qū)-知識(shí)三者間的異構(gòu)關(guān)系和動(dòng)態(tài)性。而且移動(dòng)社會(huì)網(wǎng)絡(luò)上社會(huì)化標(biāo)注不規(guī)范性的特點(diǎn)和一些不確定的話題來(lái)源會(huì)降低算法的效率和性能,使得無(wú)法揭示移動(dòng)社會(huì)網(wǎng)絡(luò)的結(jié)構(gòu)特性、進(jìn)而更準(zhǔn)確地對(duì)話題進(jìn)行發(fā)現(xiàn)、檢索以及溯源。因此,迫切需要在新的領(lǐng)域出現(xiàn)新的技術(shù)的出現(xiàn)對(duì)移動(dòng)社會(huì)網(wǎng)絡(luò)的特性進(jìn)行全面準(zhǔn)確地把握和利用。

2 移動(dòng)社交網(wǎng)絡(luò)語(yǔ)義話題的研究

2.1 遇到的問(wèn)題

由于以人、社區(qū)和知識(shí)為主體的移動(dòng)社交網(wǎng)絡(luò)呈動(dòng)態(tài)變化趨勢(shì),如個(gè)人社交環(huán)境的變化、社區(qū)成員的增減和語(yǔ)義話題的改變,使得在人-社區(qū)-知識(shí)間構(gòu)建穩(wěn)定的關(guān)聯(lián)模型變得十分復(fù)雜。目前話題模型是單一同構(gòu)的純文本或純關(guān)系模型,此類模型無(wú)法體現(xiàn)移動(dòng)社會(huì)網(wǎng)絡(luò)中人-社區(qū)-知識(shí)三者間的異構(gòu)關(guān)系,而且當(dāng)前的模型構(gòu)建算法均不能表達(dá)移動(dòng)社會(huì)網(wǎng)絡(luò)中人、社區(qū)和知識(shí)三大主體的動(dòng)態(tài)變化過(guò)程,因此如何有效的表達(dá)人-社區(qū)-知識(shí)間的異構(gòu)關(guān)系以及移動(dòng)社會(huì)網(wǎng)絡(luò)的動(dòng)態(tài)性是移動(dòng)社會(huì)網(wǎng)絡(luò)潛在語(yǔ)義話題發(fā)現(xiàn)的基礎(chǔ)問(wèn)題。

其次,移動(dòng)社會(huì)網(wǎng)絡(luò)上社會(huì)化標(biāo)注具有不規(guī)范性。如何對(duì)不規(guī)范的社會(huì)化標(biāo)注進(jìn)行準(zhǔn)確、智能的規(guī)范標(biāo)注是語(yǔ)義話題搜索面臨的新挑戰(zhàn)。另外,傳統(tǒng)的基于關(guān)鍵詞的匹配搜索已經(jīng)不能滿足移動(dòng)社會(huì)網(wǎng)絡(luò)上實(shí)體之間的高階異構(gòu)關(guān)聯(lián)特性。例如:當(dāng)用戶在社會(huì)網(wǎng)絡(luò)中搜索一個(gè)特定關(guān)鍵詞的時(shí)候,不僅需要預(yù)測(cè)用戶搜索目標(biāo)(如:人、文檔和社區(qū)),還需要在語(yǔ)義話題的層次上進(jìn)行匹配。這是因?yàn)樯鐣?huì)網(wǎng)絡(luò)生成的信息大多數(shù)是短文檔,很多短文檔在語(yǔ)義上和查詢相關(guān),但很可能不包含查詢的關(guān)鍵詞。因此,如何自動(dòng)預(yù)測(cè)用戶的查詢動(dòng)機(jī)以及如何在語(yǔ)義話題的層次上進(jìn)行語(yǔ)義搜索也是移動(dòng)社會(huì)網(wǎng)絡(luò)必須解決的難題。

最后,話題的來(lái)源具有不確定性。日常生活中話題的傳播范圍較小,而社會(huì)網(wǎng)絡(luò)的發(fā)展放大了個(gè)人的話題傳播范圍。比如,輿情在網(wǎng)絡(luò)上具有表達(dá)快捷、信息多元、互動(dòng)性強(qiáng)等傳統(tǒng)媒體無(wú)法比擬的優(yōu)勢(shì)。但同時(shí)也容易出現(xiàn)一些失真的、虛假的言論。各種不良話題開(kāi)始借助于社區(qū)媒體這種跨地域、跨國(guó)界、開(kāi)放式的通信方式進(jìn)行傳播。特別是反動(dòng)、不利于社會(huì)安定的言論傳播,需要找到話題的源頭,鎖定謠言的散布者以平息謠言,打擊非法分子,維護(hù)社會(huì)穩(wěn)定。目前的研究主要關(guān)注話題的檢測(cè)和跟蹤,而話題的溯源研究還沒(méi)有相關(guān)報(bào)道。因此,迫切需要在這方面開(kāi)展工作。

2.2 關(guān)鍵技術(shù)

具體而言,本課題的研究?jī)?nèi)容如圖1所示,主要包括如下幾個(gè)方面:

2.2.1 隱含語(yǔ)義空間中潛在語(yǔ)義話題的發(fā)現(xiàn)

LDA模型描述了社區(qū)與知識(shí)話題的生成過(guò)程,步驟如下:

1)對(duì)于每個(gè)社區(qū)dS,根據(jù)θd~Dir(α),得到多項(xiàng)式分布參數(shù)θd;

2)對(duì)于每個(gè)知識(shí)話題zK,根據(jù)Φz(mì)~Dir(β),得到多項(xiàng)式分布參數(shù)Φz(mì);

3)對(duì)于社區(qū)d中的第i個(gè)人md,i根據(jù)多項(xiàng)式分布zd,i~Mult(θd),得到話題zd,i;根據(jù)多項(xiàng)式分布md,i~Mult(Φz(mì)),得到社區(qū)d的成員md,i。

其中:Dir表示Dirichlet分布,Mult表示多項(xiàng)式分布。這一模型可由下圖2表示,改模型表示法也稱作“盤子表示法”。其中的陰影圓圈代表可觀測(cè)變量,隱含變量則由非陰影圓圈表示,箭頭方向代表兩變量間的條件依賴性,方框表示重復(fù)取樣并將重復(fù)次數(shù)顯示在方框的右下角。 根據(jù)LDA的生成模型,整個(gè)基于所有的參數(shù)和變量的聯(lián)合分布概率可以表示為:

使用吉布斯取樣法進(jìn)行Φ和θ的最大概率估算時(shí),為滿足語(yǔ)義網(wǎng)絡(luò)中人-社區(qū)-知識(shí)的動(dòng)態(tài)特性,分別建立人-社區(qū)計(jì)數(shù)矩陣C和個(gè)人-知識(shí)矩陣D,在每一次取樣循環(huán)中,社區(qū)di的潛在語(yǔ)義知識(shí)話題可通過(guò)對(duì)社區(qū)di中的第j個(gè)實(shí)體的語(yǔ)義知識(shí)話題結(jié)構(gòu)的整個(gè)條件后分布進(jìn)行取樣得到。

?ij表示人和社區(qū)對(duì)應(yīng)的知識(shí)結(jié)構(gòu)不在計(jì)數(shù)中,當(dāng)人-社區(qū)-知識(shí)概率結(jié)構(gòu)發(fā)現(xiàn)改變時(shí),矩陣C?ij和D?ij會(huì)被更新。在多次迭代之后社區(qū)-知識(shí)話題分布θd和個(gè)人-知識(shí)分布Φz(mì)的值可以用下以公式估算。

2.2.2 MapReduce的優(yōu)化策略研究

針對(duì)高階異構(gòu)對(duì)象的同構(gòu)化,研究統(tǒng)一關(guān)系矩陣中線性加權(quán)系數(shù)在一定區(qū)間范圍內(nèi)的最優(yōu)參數(shù),采用網(wǎng)格尋優(yōu)方法確定最優(yōu)參數(shù)??紤]到移動(dòng)社會(huì)網(wǎng)絡(luò)中數(shù)據(jù)的海量性,基于MapReduce實(shí)現(xiàn)高階異構(gòu)實(shí)體對(duì)象的同構(gòu)化算法。首先,在數(shù)據(jù)劃分階段將每個(gè)系數(shù)的范圍n等分,這樣n階異構(gòu)對(duì)象最多產(chǎn)生nn個(gè)網(wǎng)格區(qū)間,在這些網(wǎng)格區(qū)間上進(jìn)行MapReduce計(jì)算,每個(gè)計(jì)算的結(jié)果都是候選的最優(yōu)解,在Reduce階段將他們輸出到最優(yōu)解集合中。在map階段,如果map處理的數(shù)據(jù)網(wǎng)格所含數(shù)據(jù)較多會(huì)影響到map階段數(shù)據(jù)處理的性能。因此為了提高M(jìn)ap階段數(shù)據(jù)處理的性能,引入貪婪算法思想,在Map數(shù)據(jù)處理階段,用近似最優(yōu)解代替最優(yōu)解。基于該算法,從待計(jì)算的數(shù)據(jù)集中隨機(jī)抽取一部分?jǐn)?shù)據(jù),求出最優(yōu)解放入一個(gè)集合A中;然后在隨機(jī)抽取一部分?jǐn)?shù)據(jù)求出最優(yōu)解,加入到集合A中。直到次數(shù)足夠多,那我們可以認(rèn)為集合A中的最優(yōu)解就是原數(shù)據(jù)集的最優(yōu)解。MapReduce的執(zhí)行流程圖如圖3所示。

在Map階段產(chǎn)生的文件需要在Map端、Reduce端兩端并行的傳輸,而如果當(dāng)多個(gè)Reduce端同時(shí)讀取到一個(gè)Map端的數(shù)據(jù)時(shí),就會(huì)造成數(shù)據(jù)傳輸?shù)淖枞档托蕪亩沟眯阅芗眲∠陆?。因此,為了提高?shù)據(jù)傳輸?shù)男阅?,本文提出一種數(shù)據(jù)主動(dòng)推送的方式來(lái)代替MapReduce編程模型中Reduce節(jié)點(diǎn)讀取Map節(jié)點(diǎn)數(shù)據(jù)的規(guī)約方式。首先用代替原模型的集合,在執(zhí)行完Map操作后,調(diào)用NKV路由算法,計(jì)算出效率較高的集合。該集合表示key值為S-Key的結(jié)果,應(yīng)該被推送到key值為R-key的Reduce節(jié)點(diǎn)上。

2.2.3 話題溯源遞推過(guò)程的終止條件研究

話題溯源時(shí)確定話題的終止條件,必須掌握話題的傳播模型。已有的話題傳播模型假設(shè)網(wǎng)絡(luò)是靜態(tài)的,而沒(méi)有考慮到網(wǎng)絡(luò)的動(dòng)態(tài)變化過(guò)程,且假設(shè)每個(gè)節(jié)點(diǎn)僅僅有兩種狀態(tài)。為解決這些問(wèn)題,我們提出話題傳播的網(wǎng)絡(luò)動(dòng)力學(xué)模型ANR,使用三個(gè)狀態(tài),并基于場(chǎng)理論考慮網(wǎng)絡(luò)的動(dòng)態(tài)變化過(guò)程,研究話題端到端傳播的臨界點(diǎn)。以N表示未接觸話題狀態(tài)(未激活狀態(tài)),A表示接觸話題并傳播狀態(tài)(激活狀態(tài)),R表示接觸話題而不愿?jìng)鞑顟B(tài)(即免疫狀態(tài))。設(shè)未激活態(tài)到激活態(tài)的概率為,激活態(tài)到免疫態(tài)的概率為μ,則三種狀態(tài)的動(dòng)力學(xué)方程為:

設(shè)a(t),n(t),r(t)分別為A,N,R狀態(tài)的密度,當(dāng)傳播話題人員與不愿?jìng)鞑ピ掝}人員充分混合以后,ANR模型的動(dòng)力學(xué)可以用以下微分方程組描述

隨著時(shí)間的增加,話題溯源的范圍越小。經(jīng)過(guò)充分的迭代縮小話題范圍,最終話題的源頭就可以找到。話題的傳播密度r(T)與傳播率存在一一對(duì)應(yīng)關(guān)系。只有當(dāng)閾值<時(shí), 才能停止搜索話題的源頭。此處

其中為移動(dòng)社會(huì)網(wǎng)絡(luò)圖生成矩陣的最大特征值。

3 結(jié)束語(yǔ)

移動(dòng)互聯(lián)網(wǎng)的普及使人類以前所未有的廣度和深度及時(shí)記錄和存儲(chǔ)信息,且各種形式的社交網(wǎng)絡(luò)為用戶提供了一個(gè)信息傳播與信息共享的平臺(tái)。而本文以移動(dòng)社會(huì)網(wǎng)絡(luò)數(shù)據(jù)的海量性、高階異構(gòu)性和語(yǔ)義信息不完整性為應(yīng)用背景,以語(yǔ)義話題發(fā)現(xiàn)、搜索和溯源為目標(biāo),以建立移動(dòng)社會(huì)網(wǎng)絡(luò)信息關(guān)聯(lián)體系為核心,以移動(dòng)社會(huì)網(wǎng)絡(luò)中高階異構(gòu)的"人-社區(qū)-知識(shí)實(shí)體"海量信息關(guān)聯(lián)挖掘?yàn)榍腥耄瑥臐撛谡Z(yǔ)義話題發(fā)現(xiàn)、海量數(shù)據(jù)優(yōu)化策略算法以及話題溯源三個(gè)方面對(duì)移動(dòng)社交網(wǎng)絡(luò)語(yǔ)義話題進(jìn)行說(shuō)明,更好地處理和理解移動(dòng)社會(huì)網(wǎng)絡(luò)中的數(shù)據(jù),并在此基礎(chǔ)上實(shí)現(xiàn)語(yǔ)義話題的發(fā)現(xiàn)、檢索以及溯源,推進(jìn)社會(huì)網(wǎng)絡(luò)的進(jìn)一步發(fā)展。

參考文獻(xiàn):

[1] Fox J, Moreland J J. The dark side of social networking sites: An exploration of the relational and psychological stressors associated with Facebook use and affordances[J]. Computers in Human Behavior, 2015, 45(4): 168-176.

[2] Tsiotsou R H. The role of social and parasocial relationships on social networking sites loyalty[J]. Computers in Human Behavior, 2015, 48(5): 401-414.

[3] Van Royen K, Poels K, Daelemans W, et al. Automatic monitoring of cyberbullying on social networking sites: From technological feasibility to desirability[J]. Telematics and Informatics, 2015, 32(1): 89-97.

[4] Park J. The effects of personalization on user continuance in social networking sites[J]. Information Processing & Management, 2014, 50(3): 462-475.

[5] 楊建武. 基于核方法的XML文檔自動(dòng)分類[J]. 計(jì)算機(jī)學(xué)報(bào), 2011, 34(2): 353-359.

[6] 盧漢清,劉靜. 基于圖學(xué)習(xí)的自動(dòng)圖像標(biāo)注[J]. 計(jì)算機(jī)學(xué)報(bào), 2008, 31(9): 1629-1639.

[7] 王鵬,張磊,任超,等. 云計(jì)算系統(tǒng)相空間分析模型及仿真研究[J]. 計(jì)算機(jī)學(xué)報(bào), 2013, 36(2): 286-296.

[8] 史英杰,孟小峰. 云數(shù)據(jù)管理系統(tǒng)中查詢技術(shù)研究綜述[J]. 計(jì)算機(jī)學(xué)報(bào), 2013(2): 209-225.

猜你喜歡
移動(dòng)網(wǎng)絡(luò)
移動(dòng)網(wǎng)絡(luò)的大學(xué)英語(yǔ)微課自主學(xué)習(xí)引導(dǎo)研究
基于移動(dòng)互聯(lián)網(wǎng)的課程教學(xué)輔助系統(tǒng)的構(gòu)建及應(yīng)用
軟件工程(2016年11期)2017-01-17 19:36:41
網(wǎng)絡(luò)經(jīng)濟(jì)背景下PC網(wǎng)絡(luò)及移動(dòng)網(wǎng)絡(luò)博弈分析
蜂窩網(wǎng)絡(luò)終端直通通信功率控制研究
移動(dòng)網(wǎng)絡(luò)的信息安全管理
基于移動(dòng)網(wǎng)絡(luò)的語(yǔ)音集群通信系統(tǒng)
移動(dòng)網(wǎng)絡(luò)下社區(qū)醫(yī)療衛(wèi)生服務(wù)創(chuàng)新研究
東方教育(2016年3期)2016-12-14 20:02:31
論中學(xué)生沉迷手機(jī)的原因與危害及應(yīng)對(duì)措施
移動(dòng)網(wǎng)絡(luò)背景下高校圖書館在校園文化建設(shè)中的作用探析
東方教育(2016年16期)2016-11-25 01:01:09
移動(dòng)互聯(lián)網(wǎng)絡(luò)對(duì)大學(xué)生心理影響及對(duì)策研究
邻水| 宜君县| 永宁县| 兴业县| 木兰县| 正宁县| 玛沁县| 潼关县| 巴南区| 诸城市| 家居| 犍为县| 邵阳市| 鞍山市| 黄梅县| 白沙| 鄂托克旗| 从化市| 苗栗县| 桦南县| 濮阳县| 宿州市| 永城市| 中牟县| 淮滨县| 西充县| 宁远县| 肇州县| 东港市| 正宁县| 剑阁县| 东安县| 通辽市| 得荣县| 静乐县| 崇阳县| 金沙县| 故城县| 南部县| 绥阳县| 津市市|