国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于移動互聯(lián)網(wǎng)日志的搜索引擎用戶行為研究

2014-04-14 07:51倪志豪
中文信息學(xué)報 2014年2期
關(guān)鍵詞:分詞搜索引擎日志

萬 飛,趙 溪,梁 循,潘 登,倪志豪

(1.中國人民大學(xué)信息學(xué)院,北京100872;2.北京大學(xué)光華管理學(xué)院,北京100871)

1 引言

隨著通信技術(shù)的進(jìn)步、終端設(shè)備硬件水平的提升以及三網(wǎng)融合政策的逐步推進(jìn),移動互聯(lián)網(wǎng)得到迅速發(fā)展,網(wǎng)絡(luò)應(yīng)用內(nèi)容進(jìn)一步增加,用戶應(yīng)用體驗不斷提高,我國由此進(jìn)入移動互聯(lián)網(wǎng)的大時代。據(jù)CNNIC第29次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[1]顯示,截至2011年12月底,中國手機網(wǎng)民規(guī)模達(dá)到3.56億,占整體網(wǎng)民比例的69.3%,用戶規(guī)模增速已超過寬帶用戶。

鑒于如此大規(guī)模的用戶,互聯(lián)網(wǎng)應(yīng)用提供商紛紛布局移動互聯(lián)網(wǎng),主流應(yīng)用提供商均推出了相應(yīng)的WAP版本或客戶端,為客戶提供移動互聯(lián)網(wǎng)服務(wù),以移動搜索為代表的信息獲取已發(fā)展為移動互聯(lián)網(wǎng)的主流應(yīng)用。當(dāng)前,移動搜索引擎用戶數(shù)量眾多,應(yīng)用門檻較低,適用范圍較廣。在未來競爭中,搜索結(jié)果的精確程度與個性化服務(wù)將會成為保持用戶黏性的重要因素。為提高搜索準(zhǔn)確性,移動搜索服務(wù)提供商需要挖掘用戶特點和行為習(xí)慣,預(yù)測用戶潛在需求,以應(yīng)對市場競爭。

移動互聯(lián)網(wǎng)搜索服務(wù)提供商每天記錄大量的用戶搜索數(shù)據(jù),比如訪問者唯一標(biāo)志符、檢索詞、點擊頁面、訪問時間等,這些數(shù)據(jù)構(gòu)成了搜索引擎日志。搜索引擎日志包含很多對服務(wù)商非常有用的信息,可以反映出用戶的興趣及其行為特點,是研究搜索引擎用戶行為的重要載體。本文將通過對一周內(nèi)中文移動搜索引擎日志的分析,研究真實環(huán)境下移動搜索引擎用戶的行為特點。

本文安排如下:第2節(jié)總結(jié)目前搜索引擎用戶行為的研究現(xiàn)狀;第3節(jié)介紹本文使用的移動互聯(lián)網(wǎng)搜索引擎日志數(shù)據(jù);第4節(jié)根據(jù)上述日志數(shù)據(jù)進(jìn)行實證分析,分別研究移動互聯(lián)網(wǎng)環(huán)境下用戶查詢行為與用戶點擊行為;最后進(jìn)行總結(jié)和展望。

2 相關(guān)工作概述

目前,對互聯(lián)網(wǎng)的大規(guī)模搜索引擎日志的用戶行為分析已有一些研究成果,主要集中在搜索引擎用戶獨立查詢、查詢會話分析以及用戶點擊行為等方面,但基于移動互聯(lián)網(wǎng)的用戶行為分析相對極少。

Silverstein等(1998)對AltaVista用戶檢索行為進(jìn)行分析,提出在一個查詢會話中,用戶只進(jìn)行一次點擊的大約占63.8%,約有35.2%的用戶對于搜索詞進(jìn)行了完全的改變,12%的用戶增加或減少了搜索詞的數(shù)目[2]。Soyeon Park等(2005)選取韓國著名搜索引擎NAVER一周內(nèi)的日志數(shù)據(jù),經(jīng)過會話識別、查詢分類、數(shù)據(jù)預(yù)處理等操作后,對用戶檢索行為進(jìn)行分析,結(jié)果顯示同一會話中用戶輸入的查詢傾向于徹底更換查詢內(nèi)容,而不是增刪檢索詞項或修改檢索詞項[3]。Li Wei等(2011)統(tǒng)計了同一會話中檢索詞的個數(shù),發(fā)現(xiàn)同一會話中只有一個檢索詞的會話占所有會話數(shù)的70.866%[4]。王繼民等(2004)選取北大天網(wǎng)的用戶日志,對用戶訪問時間、用戶查詢類型、用戶查詢長度、用戶點擊次數(shù)進(jìn)行了統(tǒng)計分析,結(jié)論表明用戶訪問時間分布并不均等,多數(shù)用戶只輸入一個詞項查詢[5]。余慧佳等(2007)選取搜狗搜索引擎一個月內(nèi)的查詢?nèi)罩?,就用戶查詢長度、查詢頻度、查詢會話內(nèi)的查詢數(shù)目、查詢會話內(nèi)的查詢內(nèi)容以及用戶點擊行為進(jìn)行了分析,將相應(yīng)特征同英文搜索引擎用戶行為進(jìn)行對比,發(fā)現(xiàn)中文搜索引擎用戶使用高級檢索的比例遠(yuǎn)遠(yuǎn)低于英文搜索引擎,查詢重復(fù)率遠(yuǎn)高于英文搜索引擎[6]。岑榮偉等(2010)在文獻(xiàn)[6]工作的基礎(chǔ)上,對用戶搜索需求進(jìn)行區(qū)分,從查詢集合中提取了導(dǎo)航集和色情集這兩類特殊的查詢集合,針對不同檢索目的對上述統(tǒng)計特征進(jìn)行分析[7]。針對以上工作中用戶查詢會話分析的不足,王曉春等(2011)定義了8種查詢修改,在查詢會話基礎(chǔ)上分析了查詢修改動作、用戶點擊結(jié)果數(shù)同查詢修改次數(shù)之間的關(guān)系,發(fā)現(xiàn)查詢修改動作和查詢修改次數(shù)有關(guān),而點擊結(jié)果數(shù)量保持穩(wěn)定[8]。張磊等(2009)對于現(xiàn)有的網(wǎng)頁搜索引擎查詢?nèi)罩局胁樵儠挼膭澐址椒ㄟM(jìn)行了分析和總結(jié),提出了可以使用時間作為劃分會話的一種標(biāo)準(zhǔn)[9]。馬少平等(2011)基于搜狗搜索引擎2006年至2011年的搜索日志,對用戶查詢行為與用戶點擊行為進(jìn)行分析,分析總結(jié)了中文搜索引擎用戶行為的演化規(guī)律[10]。

而移動搜索引擎同桌面搜索引擎存在一定的差異,如用戶可以不受固定終端限制,隨時隨地搜索信息,具有很強的時效性;移動搜索可以同定位服務(wù)相結(jié)合,為用戶提供更具針對性以及精確的服務(wù);移動搜索屏幕有限,每頁顯示結(jié)果數(shù)量有限。這些差異在搜索引擎的使用上造成了一些不同,因此有必要對移動搜索引擎的用戶行為進(jìn)行分析,幫助移動搜索算法的改進(jìn),更好地為用戶服務(wù)。

3 實驗數(shù)據(jù)

本文實驗數(shù)據(jù)取自于某無線搜索服務(wù)提供商2011年6月1日至2011年6月7日共一周的日志記錄。其中日志中每條查詢記錄的格式如表1所示。

表1 移動互聯(lián)網(wǎng)網(wǎng)絡(luò)日志的數(shù)據(jù)格式

為正確把握基于移動搜索引擎的用戶行為特征,本文首先進(jìn)行了數(shù)據(jù)處理,其中有以下幾個問題需要說明。

(1)cookie問題。由于該無線搜索服務(wù)提供商采用cookie技術(shù)標(biāo)識用戶,本文假定用戶不主動刪除cookie,則同一用戶僅擁有一個cookie,不同用戶擁有不同cookie,cookie作為用戶唯一標(biāo)志;

(2)數(shù)據(jù)格式問題??紤]到用戶的異常操作,日志文件中存在極少量異常數(shù)據(jù),如用戶cookie格式錯誤等,在數(shù)據(jù)處理時,本文將cookie格式有誤,檢索詞長度大于100以及URL長度大于600的記錄予以刪除。

4 基于日志的用戶行為研究

經(jīng)過數(shù)據(jù)處理之后,我們共得到4 997 416條查詢記錄,其中含用戶1 751 612個,非重復(fù)查詢971 197個,非重復(fù)網(wǎng)頁1 613 762個,查詢會話2 317 215個。

4.1 查詢詞分析

4.1.1 查詢詞長度

查詢詞長度在本文中定義為用戶查詢詞中被空格所隔開的詞語或字的個數(shù)。本文從兩個層面分析查詢詞長度:一為分詞之前,即用戶自主輸入的用空格分開的查詢詞長度;二為分詞之后詞語個數(shù)。本文在進(jìn)行用戶查詢詞分詞操作時,充分考慮了用戶查詢需求以及這一時間段內(nèi)的熱點話題,將常用名詞如人名、流行詞、導(dǎo)航網(wǎng)址以及游戲名稱等導(dǎo)入分詞詞典,提高分詞準(zhǔn)確率。分析結(jié)果表明,分詞之前查詢詞平均長度為1.10個詞,分詞之后查詢詞長度為3.45個詞,這與文獻(xiàn)[7]中關(guān)于互聯(lián)網(wǎng)搜索引擎平均查詢長度的分析相一致。圖1顯示了查詢詞長度和相應(yīng)查詢數(shù)量之間的變化情況。

圖1 移動搜索引擎用戶查詢詞長度分布

通過對圖1進(jìn)行分析,分詞之前,用戶查詢詞長度多為1個詞,占總數(shù)的91.91%;而分詞之后查詢詞長度為2和3的檢索數(shù)目相對較多,查詢詞長度為1和4的檢索數(shù)目相對較少,但其差距不是很大。查詢詞長度在5以及5以上的檢索數(shù)目在分詞之前數(shù)量極少,但在分詞之后占了總數(shù)的23%。通過上述對比可以看到,用戶往往習(xí)慣直接輸入一個短語或短句進(jìn)行搜索,沒有自主分詞行為,這一點與互聯(lián)網(wǎng)搜索是一致的。但是,就查詢詞長度分布而言,查詢詞長度在分詞之前集中在1個詞,分詞之后查詢詞長度分布比較均勻,這與互聯(lián)網(wǎng)搜索中查詢詞長度同用戶數(shù)目呈指數(shù)分布這一點是截然不同的。

4.1.2 查詢詞頻度

查詢詞頻度指的是在這一段時間內(nèi),該查詢詞一共被提交的次數(shù)。本文對查詢次數(shù)排名前200的查詢詞,將其檢索次數(shù)與排名繪成圖2。

圖2 查詢頻度排名與檢索次數(shù)之間的關(guān)系

通過圖2可以看到,查詢頻度排名與檢索次數(shù) 之間呈冪律分布分布關(guān)系,隨著查詢頻度排名的增加,檢索次數(shù)迅速下降,少數(shù)查詢出現(xiàn)的次數(shù)很多。這說明在搜索引擎每天處理的大量查詢中,存在大量重復(fù)查詢。這與文獻(xiàn)[7]中互聯(lián)網(wǎng)搜索引擎的查詢頻度分析是一致的。對相應(yīng)用戶查詢詞內(nèi)容進(jìn)行分析,發(fā)現(xiàn)用戶需求集中在導(dǎo)航網(wǎng)址、生活信息、手機閱讀以及應(yīng)用程序下載這幾個領(lǐng)域,且與每一時段熱點密切相關(guān)。這說明移動搜索引擎服務(wù)與桌面搜索引擎相比更具有便利性,更貼近生活。

4.1.3 問題式查詢

用戶使用搜索引擎時存在多種檢索方式,問題式查詢則是用戶提出問題時最直接、最簡單的方式,我們統(tǒng)計了這部分查詢的比例。按照現(xiàn)代漢語語言習(xí)慣以及英語語言習(xí)慣,我們收集了44個疑問詞,比如“哪”、“什么”、“怎么”、“如何”等,如果用戶提交的查詢中使用到了某個疑問詞,就認(rèn)為此查詢?yōu)閱栴}式查詢。統(tǒng)計之后,我們共得到255 375條問題式查詢,占總查詢數(shù)的5.11%,遠(yuǎn)遠(yuǎn)大于文獻(xiàn)[7]中互聯(lián)網(wǎng)搜索引擎問題式查詢比例2.96%,這說明了移動搜索引擎用戶檢索習(xí)慣落后,檢索行為相對不成熟。

4.1.4 直接輸入URL作為查詢詞的比例

在使用移動搜索引擎時,存在一部分用戶直接輸入網(wǎng)址或網(wǎng)址的一部分進(jìn)行檢索的情況。我們綜合考慮了各種手機網(wǎng)站域名情況,如手機域名“.mobi”,商業(yè)域名“.biz”、“.cc”等,同時考慮用戶只輸入URL一部分的情況,統(tǒng)計發(fā)現(xiàn)有50 590條記錄是以URL作為檢索詞的,占總檢索數(shù)目的1.01%,遠(yuǎn)遠(yuǎn)低于文獻(xiàn)[6]中相應(yīng)比例。分析其原因,我們認(rèn)為由于移動設(shè)備輸入法限制,英文輸入較困難,而由于URL往往字符較多,增加了用戶輸入的難度,所以用戶更傾向于輸入網(wǎng)站名稱進(jìn)行檢索,輸入URL的情況相對較少。

4.2 查詢時間分析

在分析用戶檢索與時間的分布關(guān)系時,考慮到工作日與節(jié)假日對用戶搜索引擎使用次數(shù)存在影響,我們分別統(tǒng)計了每天每小時內(nèi)用戶檢索次數(shù),結(jié)果如圖3所示。

圖3 檢索次數(shù)隨時間變化趨勢圖

圖3顯示,不論工作日或節(jié)假日,每天21時、22時或23時是全天的最高峰,4時是全天的低谷。一天內(nèi),用戶檢索次數(shù)自4時開始增長,在上午10時達(dá)到第一個高峰,之后略有下降,后又緩慢增長,在12時或13時達(dá)到第二個高峰,21時、22時或23時達(dá)到全天最高峰。這同人們的生活娛樂習(xí)慣是一致的,工作日內(nèi)10時是進(jìn)行工作、學(xué)習(xí)的時段,節(jié)假日內(nèi)10時則是人們計劃娛樂的時段,這段時間人們需要檢索相關(guān)信息;12時或13時是午休時段,晚21時以后為睡前休閑娛樂時段,在娛樂時間往往會需要檢索相關(guān)信息。與文獻(xiàn)[5]中互聯(lián)網(wǎng)搜索引擎用戶檢索時間進(jìn)行對比,發(fā)現(xiàn)移動搜索引擎用戶訪問時間集中在休閑娛樂時段。

4.3 查詢會話分析

查詢會話(以下簡稱會話)可以理解為用戶在較短時間段內(nèi),針對某一特定話題而進(jìn)行的有目的的查詢。會話能夠更集中地反映出用戶在有特定目標(biāo)情況下的搜索、點擊行為,為研究用戶行為模式提供了更為準(zhǔn)確集中的數(shù)據(jù)基礎(chǔ)。我們參考文獻(xiàn)[9]關(guān)于會話劃分方法的總結(jié),結(jié)合對于數(shù)據(jù)的觀察,將每一個用戶30分鐘內(nèi)的查詢定義為一個會話,認(rèn)為在每一個會話中,用戶圍繞特定目標(biāo)進(jìn)行連續(xù)的操作。經(jīng)過處理,除去日志中點擊時間格式有錯誤的8 593條數(shù)據(jù),共區(qū)分出會話2 317 215個。

4.3.1 查詢數(shù)目分析

本文統(tǒng)計了一個會話中用戶的查詢次數(shù),發(fā)現(xiàn)在每個會話中用戶平均進(jìn)行2.15次查詢。

圖4 會話內(nèi)點擊數(shù)目分布

圖4顯示,有58%的用戶在一個會話中只進(jìn)行過一次查詢,這與文獻(xiàn)[2]中63.7%的數(shù)字接近。這可能是用戶通過一次查詢就已經(jīng)找到了令自己滿意的結(jié)果,所以不再進(jìn)行后續(xù)的查詢。也有可能是由于用戶發(fā)現(xiàn)使用手機的搜索并不能滿足自己的需求而使用其他工具(如電腦)進(jìn)行搜索。其中查詢數(shù)目小于3個的占到86%。由此可以看出,大部分用戶在3次查詢以內(nèi)找到了自己需要的結(jié)果,搜索引擎提供的結(jié)果是比較令用戶滿意的。同時我們發(fā)現(xiàn),有1%的用戶進(jìn)行了10次以上的查詢,說明用戶對于找到自己需要的結(jié)果是比較有耐心的。

4.3.2 查詢詞修改方式分析

如果用戶對于現(xiàn)有的查詢詞查詢結(jié)果不滿意,就有可能修改查詢詞,從而找到最適合的結(jié)果。本文中我們對于一個查詢會話中用戶修改查詢詞的方式進(jìn)行了統(tǒng)計,如表2所示。其中,Adding方式指后一個查詢詞在前一個查詢詞的基礎(chǔ)上增加了新的詞語;Deleting方式指后一個查詢詞在前一個查詢詞的基礎(chǔ)上減少了搜索詞;Order Change方式是指后一個查詢詞只是改變了前一個查詢詞的詞語排列順序;Partly Change方式指后一個查詢詞語對前一個查詢詞中的一部分進(jìn)行了改動,其余部分不變;Totally Change方式指后一個查詢詞較前一個查詢詞完全不同。

表2 一個會話內(nèi)用戶修改查詢方式的分布

我們可以看到,增加和減少搜索詞的用戶大約占25%,這與文獻(xiàn)[2]中的12%有較大的差距,有0.3%的用戶只是把原來的查詢詞順序進(jìn)行了調(diào)整,35.7%的用戶選擇更換掉原有搜索詞的一部分再進(jìn)行搜索,即共有61%左右的用戶會在原有的查詢詞基礎(chǔ)上進(jìn)行一定的修改再搜索,而不是完全更換為新的查詢詞。我們認(rèn)為這可能是移動互聯(lián)網(wǎng)用戶修改搜索內(nèi)容較固定終端用戶更為困難的緣故(手機輸入檢索詞成本更高)。而完全修改查詢詞的用戶約有38.7%,與文獻(xiàn)[2]中的英文搜索引擎結(jié)果相近,但與文獻(xiàn)[5]中文搜索引擎結(jié)果差距較大。

4.4 用戶點擊行為分析

4.4.1 點擊位置分布

當(dāng)搜索引擎返回用戶提交查詢的結(jié)果集之后,用戶會點擊其中可能相關(guān)的結(jié)果。本文就每天用戶點擊位置與點擊次數(shù)之間的關(guān)系進(jìn)行了分析,如圖5所示。

通過對用戶點擊位置的分析,我們發(fā)現(xiàn)用戶點擊行為與時間無關(guān),每天點擊位置與點擊次數(shù)分布基本一致。具體來說,用戶僅點擊了1~8、10~12、22、40這14個位置,說明用戶僅僅查看了返回結(jié)果的前幾頁位置。與互聯(lián)網(wǎng)搜索引擎用戶點擊行為進(jìn)行比較,用戶點擊位置與點擊次數(shù)之間的分布存在很大差異。其中,圖中的點擊位置0表示用戶并沒有在搜索引擎返回的結(jié)果集中進(jìn)行點擊,這里不予以考慮。文獻(xiàn)[7]中指出互聯(lián)網(wǎng)搜索引擎用戶點擊次數(shù)與點擊行為呈現(xiàn)冪律分布規(guī)律,而圖5顯示移動搜索引擎環(huán)境下該分布沒有明顯規(guī)律。究其原因,根據(jù)移動設(shè)備屏幕大小,搜索引擎每頁返回的檢索結(jié)果數(shù)為6個、7個或9個,每頁底部顯示5個分頁結(jié)果,用戶點擊集中在第一頁,其中搜索結(jié)果中排名第2的結(jié)果點擊次數(shù)最多,第二頁前幾個結(jié)果也存在少量點擊,這之后用戶直接點擊第4頁或第5頁的結(jié)果,而受網(wǎng)頁傳輸速度或操作的限制,用戶一般不會點擊下一組分頁結(jié)果。

圖5 用戶點擊位置與點擊次數(shù)之間的關(guān)系

4.4.2 首次點擊位置分布

在有特定目的的搜索中,用戶通過瀏覽搜索引擎反饋回的結(jié)果列表,點擊瀏覽,這時用戶的首次點擊位置反映了用戶在結(jié)果中最感興趣的內(nèi)容。如果這時用戶無法在第一頁獲得自己滿意的結(jié)果,則搜索引擎對于結(jié)果的排列不夠優(yōu)化。

圖6表明,92%以上的用戶的首次點擊位置在1-5之間,這表明搜索引擎提供的結(jié)果是比較符合用戶的期望的。

5 結(jié)論

本文中通過對某移動搜索引擎提供商2011年6月第一周日志記錄的分析,對移動互聯(lián)網(wǎng)用戶行為和互聯(lián)網(wǎng)用戶行為進(jìn)行了對比。結(jié)果顯示,移動互聯(lián)網(wǎng)用戶的查詢詞平均長度為1.10個詞,分詞之后查詢詞長度為3.45個詞;查詢頻度排名與檢索次數(shù)之間呈冪律分布關(guān)系;每個會話中用戶平均進(jìn)行2.15次查詢。這些都與互聯(lián)網(wǎng)用戶的行為基本一致。

但就其他特征來說,移動互聯(lián)網(wǎng)用戶和互聯(lián)網(wǎng)用戶的行為模式存在差異。其中在移動互聯(lián)網(wǎng)中,問題式查詢占總查詢數(shù)目的5.11%,遠(yuǎn)大于互聯(lián)網(wǎng)的2.96%;而查詢詞直接使用URL的比例為1.01%,低于互聯(lián)網(wǎng)中相應(yīng)的比例。在查詢詞修改方式的研究中,我們發(fā)現(xiàn)25%的用戶會通過增加或減少原有的檢索詞以得到滿意結(jié)果,這一比例遠(yuǎn)高于互聯(lián)網(wǎng)。同時,移動互聯(lián)網(wǎng)中用戶點擊位置與點擊次數(shù)之間的分布與互聯(lián)網(wǎng)存在很大差異,用戶點擊位置主要集中在返回結(jié)果集的前幾頁。結(jié)合以上與互聯(lián)網(wǎng)用戶行為的區(qū)別,我們總結(jié)出移動互聯(lián)網(wǎng)用戶的一些特點:

(1)移動搜索引擎用戶相對于互聯(lián)網(wǎng)用戶檢索習(xí)慣比較落后,檢索行為相對不成熟;

(2)移動搜索引擎用戶更傾向于減少檢索詞的更改,同時不喜歡搜索較長的URL;

(3)移動搜索引擎用戶通常點擊排名靠前的搜索結(jié)果;

(4)移動互聯(lián)網(wǎng)用戶的搜索主要集中在娛樂時段,這與移動互聯(lián)網(wǎng)設(shè)備的娛樂性有很大的關(guān)系。

用戶行為分析在網(wǎng)絡(luò)搜索領(lǐng)域有極其重要的價值,同時隨著移動互聯(lián)網(wǎng)的迅速發(fā)展,移動搜索用戶大規(guī)模增加,移動搜索引擎用戶行為分析對改進(jìn)搜索引擎性能,提高用戶體驗十分重要。在今后的工作中,我們將對數(shù)據(jù)進(jìn)行更深層次的分析,挖掘出更有效的用戶行為模式,以優(yōu)化移動搜索引擎性能。

[1] 第29次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[R].中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC),2012.

[2] Silverstein C,Marais H,Henzinger M,et al.Analysis of A Very Large Web Search Engine Query Log[C]//Proceedings of ACM SIGIR Forum.ACM,1999,33(1):6-12.

[3] Park S,Ho L J,Jin B H.End User Searching:A Web Log Analysis of NAVER,a Korean Web Search Engine[J].Library &Information Science Research,2005,27(2):203-221.

[4] Wei L,Yan Y,Hu J,et al.Search Engine Log Based User Behavior Analysis[J].Energy Procedia,2011,13:5082-5091.

[5] 王繼民,陳翀,彭波.大規(guī)模中文搜索引擎的用戶日志分析[J].華南理工大學(xué)學(xué)報(自然科學(xué)版),2004,32(增刊):1-5.

[6] 余慧佳,劉奕群,張敏,等.基于大規(guī)模日志分析的網(wǎng)絡(luò)搜索引擎用戶行為研究[J].中文信息學(xué)報,2007,21(1):109-114.

[7] 岑榮偉,劉奕群,張敏,等.基于日志挖掘的搜索引擎用戶行為分析[J].中文信息學(xué)報,2011,24(3):49-54.

[8] 王曉春,李生,楊沐昀,等.查詢會話中的用戶行為分析[J].哈爾濱工業(yè)大學(xué)學(xué)報,2011,43(5):76-79.

[9] 張磊,李亞楠,王斌,等.網(wǎng)頁搜索引擎查詢?nèi)罩镜腟ession劃分研究[J].中文信息學(xué)報,2009,23(2):54-61.

[10] 馬少平,劉奕群,劉健,等.中文搜索引擎用戶行為的演化分析[J].中文信息學(xué)報,2011,25(6):90-97.

[11] 王倩,劉奕群,馬少平,等.面向用戶互聯(lián)網(wǎng)訪問日志的異常點擊分析[J].中文信息學(xué)報,2010,24(3):44-48.

[12] 賴茂生,曲鵬.中文搜索引擎查詢與反饋詞語特征研究[J].中文信息學(xué)報,2009,23(4):41-47.

猜你喜歡
分詞搜索引擎日志
一名老黨員的工作日志
分詞在英語教學(xué)中的妙用
世界表情符號日
扶貧日志
結(jié)巴分詞在詞云中的應(yīng)用
結(jié)巴分詞在詞云中的應(yīng)用
雅皮的心情日志
雅皮的心情日志
網(wǎng)絡(luò)搜索引擎亟待規(guī)范
基于Lucene搜索引擎的研究
木兰县| 宜川县| 张家界市| 西城区| 冀州市| 津南区| 中西区| 屏山县| 昌邑市| 宁海县| 常熟市| 环江| 西峡县| 房产| 汝城县| 南丰县| 宜兰县| 平乡县| 禹城市| 县级市| 两当县| 桦川县| 德化县| 潮安县| 清徐县| 呼伦贝尔市| 广汉市| 渝北区| 丰镇市| 宁南县| 溧水县| 双柏县| 宜昌市| 长海县| 双桥区| 邯郸县| 益阳市| 宜川县| 原平市| 东乌珠穆沁旗| 西安市|