国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Web挖掘的物流信息平臺個(gè)性化推薦研究

2015-05-30 10:48:04趙影
中國市場 2015年19期
關(guān)鍵詞:個(gè)性化推薦

[摘 要]針對物流信息平臺信息資源日益增多、訪問和檢索越來越難的問題,本文提出了將個(gè)性化推薦服務(wù)應(yīng)用于物流信息平臺的構(gòu)想。構(gòu)建了一個(gè)基于Web挖掘的物流信息平臺個(gè)性化推薦系統(tǒng)框架,對系統(tǒng)中涉及的用戶興趣建模、Web使用挖掘、Web內(nèi)容分類等關(guān)鍵技術(shù)進(jìn)行了討論。

[關(guān)鍵詞]Web挖掘;物流信息平臺;個(gè)性化推薦

[DOI]10.13939/j.cnki.zgsc.2015.20.019

1 引 言

隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)已經(jīng)成為人們獲取信息的一個(gè)重要途徑。為了提高物流服務(wù)的運(yùn)作效率,各種類型的物流信息平臺紛紛建立。一般認(rèn)為,凡是能夠支持或者進(jìn)行物流服務(wù)供需信息的交互或交換的網(wǎng)站,均可視為物流信息平臺。物流信息平臺匯集了物流行業(yè)各方面的信息,通過Web頁面發(fā)布大量的物流資訊、物流人才、貨運(yùn)信息、物流服務(wù)等內(nèi)容,給用戶提供了獲取更快捷、更便宜的物流服務(wù)的手段。然而,隨著物流信息平臺整合信息資源種類和數(shù)量的增多,如何讓用戶在訪問網(wǎng)站時(shí)更準(zhǔn)確、更快捷地獲得自己需要的信息,是物流信息平臺發(fā)展面臨的一個(gè)問題。而目前來說,物流信息平臺通常是以系統(tǒng)內(nèi)搜索引擎或檢索工具幫助用戶檢索網(wǎng)站信息,但是大多數(shù)檢索功能缺少主動(dòng)性,沒有考慮用戶的興趣偏好和用戶間的差異,所以無法滿足用戶對信息的個(gè)性化需求,物流信息平臺亟待改進(jìn)其服務(wù)質(zhì)量。

借鑒電子商務(wù)網(wǎng)站個(gè)性化服務(wù)的應(yīng)用,個(gè)性化推薦服務(wù)可以作為物流信息平臺提高服務(wù)質(zhì)量的一個(gè)有效途徑。個(gè)性化推薦服務(wù)是根據(jù)用戶的信息需求、興趣或行為模式,將用戶感興趣的信息、產(chǎn)品和服務(wù)推薦給用戶,這樣就可以避免用戶花費(fèi)較多的時(shí)間進(jìn)行信息篩選,使用戶在更短的時(shí)間內(nèi)更準(zhǔn)確地獲得自己真正感興趣的信息。

實(shí)現(xiàn)個(gè)性化推薦,關(guān)鍵是獲知和描述用戶的個(gè)性特征以及興趣偏好。考慮到物流信息平臺是通過Web頁面發(fā)布大量的信息和服務(wù)資訊,用戶的訪問情況可以很容易地反映出其個(gè)性特征和興趣偏好,因此對于物流信息平臺的個(gè)性化推薦服務(wù)可以通過Web挖掘技術(shù)來實(shí)現(xiàn)。

2 基于Web挖掘的物流信息平臺個(gè)性化推薦系統(tǒng)

2.1 系統(tǒng)基本功能

個(gè)性化推薦系統(tǒng)的基本功能是:通過分析用戶對Web訪問的規(guī)律,尋找行為模式相似的用戶,形成虛擬用戶社區(qū),并建立用戶興趣庫,在對Web內(nèi)容挖掘的基礎(chǔ)上,將符合用戶興趣的信息資源(包括新聞、供求信息、物流服務(wù)等)推薦給當(dāng)前用戶。同時(shí),利用系統(tǒng)建立的用戶興趣庫,當(dāng)用戶輸入關(guān)鍵詞進(jìn)行檢索時(shí),將用戶檢索的結(jié)果按用戶的興趣程度排序,將用戶最有可能關(guān)注的信息或服務(wù)提供給用戶。

2.2 系統(tǒng)體系結(jié)構(gòu)

該系統(tǒng)的體系結(jié)構(gòu)主要由三個(gè)部分組成:數(shù)據(jù)采集及預(yù)處理、生成推薦模型與在線推薦部分。如圖1所示。

圖1 基于Web挖掘的物流信息平臺個(gè)性化推薦系統(tǒng)體系結(jié)構(gòu)

數(shù)據(jù)預(yù)處理模塊負(fù)責(zé)從Web服務(wù)器日志、Web使用記錄等中提取、分解、合并、轉(zhuǎn)換相關(guān)的數(shù)據(jù),供數(shù)據(jù)挖掘、偏好分析及推薦引擎使用,為實(shí)現(xiàn)個(gè)性化推薦任務(wù)提供必要的數(shù)據(jù)。為保證提供數(shù)據(jù)的準(zhǔn)確性,因此該模塊一般要經(jīng)過數(shù)據(jù)清洗(數(shù)據(jù)凈化)、用戶識別、會(huì)話識別、路徑補(bǔ)充、事務(wù)識別等過程。

模式生成是指用于個(gè)性化推薦的推薦模型的生成,該階段是推薦系統(tǒng)的主要部分,主要負(fù)責(zé)建立用戶興趣庫和虛擬用戶社區(qū)。該工作框架基于聚類算法。挖掘、創(chuàng)建模式數(shù)據(jù)庫是一個(gè)循環(huán)往復(fù)的過程。該階段也是離線進(jìn)行,為在線實(shí)時(shí)推薦提供支撐。

在線推薦是根據(jù)用戶的訪問情況,將其與系統(tǒng)挖掘生成的模型進(jìn)行匹配,找到與當(dāng)前用戶行為相似的虛擬社區(qū),按照該虛擬社區(qū)用戶的興趣庫實(shí)時(shí)地為用戶進(jìn)行在線推薦。通常采用的推薦方法為用戶登錄時(shí)以頁面的形式給出推薦頁面,也可將推薦內(nèi)容發(fā)送到用戶郵箱中。針對用戶群建立的虛擬用戶社區(qū),可將相同的信息推薦給同一社區(qū)中的所有用戶。

2.3 系統(tǒng)的技術(shù)實(shí)現(xiàn)思路

個(gè)性化推薦服務(wù)以Web內(nèi)容挖掘?yàn)橹?,首先對物流信息平臺上出現(xiàn)的物流信息進(jìn)行分析,提取出關(guān)鍵詞;根據(jù)關(guān)鍵詞確定該資源所屬的類別,對用戶興趣中對應(yīng)類別的權(quán)重達(dá)到設(shè)定閾值的用戶進(jìn)行推薦。

個(gè)性化檢索服務(wù)的工作主要是對檢索結(jié)果進(jìn)行2次處理。將頁面內(nèi)容按標(biāo)題提取關(guān)鍵詞后,根據(jù)關(guān)鍵詞將內(nèi)容歸為某一類,然后根據(jù)用戶的興趣,將檢索結(jié)果按與用戶興趣匹配程度從大到小排序后,再提供給用戶。

3 系統(tǒng)關(guān)鍵技術(shù)

3.1 Web使用記錄數(shù)據(jù)的處理

Web使用記錄是用戶興趣及虛擬社區(qū)建立的關(guān)鍵。它所包含的內(nèi)容主要來源于兩個(gè)方面:一方面是Web服務(wù)器日志記錄,另一方面是用戶在客戶端操作的記錄。前者可直接從服務(wù)器日志文件中獲得,但數(shù)據(jù)量龐大,需要經(jīng)過數(shù)據(jù)清洗(數(shù)據(jù)凈化)、用戶識別、會(huì)話識別、路徑補(bǔ)充、事務(wù)識別等一系列預(yù)處理過程;后者則必須通過對用戶的瀏覽操作進(jìn)行跟蹤記錄,可在網(wǎng)頁上增加對用戶下載、保存等與興趣程度相關(guān)操作的記錄,用小型代理的形式實(shí)現(xiàn)。

3.2 Web內(nèi)容挖掘中頁面內(nèi)容的表達(dá)與分類

在個(gè)性化推薦及個(gè)性化檢索服務(wù)中,首先要對待處理的資源進(jìn)行分類。若考慮整個(gè)頁面的內(nèi)容,則雖然能得到精確的內(nèi)容表達(dá),但對正文進(jìn)行處理費(fèi)時(shí)太多,所以采用對標(biāo)題進(jìn)行關(guān)鍵詞提取,再根據(jù)關(guān)鍵詞進(jìn)行分類的方法。分詞采用分詞軟件完成。頁面分類工作流程如圖2所示。

圖2 Web頁面分類工作流程

分類算法有決策樹分類、貝葉斯分類、基于遺傳算法的分類等。該系統(tǒng)采用KNN分類算法。分類過程中,將訓(xùn)練頁面及測試頁面經(jīng)過標(biāo)題提取及分詞后,形成相應(yīng)的矢量。

3.3 用戶興趣的表示

用戶興趣根據(jù)用戶對Web進(jìn)行訪問的各種瀏覽行為進(jìn)行挖掘而得。一些典型的操作,如用戶下載、較長時(shí)間的瀏覽、添加至收藏夾等行為,反映出用戶對相關(guān)內(nèi)容感興趣。用戶興趣采用向量空間描述,形如{(A1,W1),(A2,W2),…,(An,Wn)}。Wi取值范圍為[0,1],Wi值越大,說明相應(yīng)的興趣度越高。如,某用戶的興趣向量空間為{(貨源,0.8),(車源,0.2)},說明該用戶在貨源關(guān)鍵詞上的興趣值為0.8,而在車源關(guān)鍵詞上興趣值為0.2,興趣度較低。用戶興趣的向量空間中,每個(gè)關(guān)鍵詞對應(yīng)的權(quán)重是動(dòng)態(tài)變化的。當(dāng)用戶進(jìn)行相關(guān)內(nèi)容的下載、長時(shí)間瀏覽等操作時(shí),權(quán)重增加(增加至1時(shí)不再遞增);若長時(shí)間未進(jìn)行相關(guān)內(nèi)容的瀏覽操作,則權(quán)重值減少。設(shè)定一個(gè)閾值,當(dāng)某一關(guān)鍵詞對應(yīng)的權(quán)重低于該閾值時(shí),將相應(yīng)分項(xiàng)從向量空間中去除,同樣,當(dāng)某一新增關(guān)鍵詞的權(quán)重高于該閾值時(shí),要在向量空間中增加對應(yīng)分項(xiàng),使向量空間反映出用戶興趣的實(shí)際變化情況。

3.4 虛擬用戶社區(qū)的建立與維護(hù)

虛擬用戶社區(qū)的建立采用聚類的方法,將用戶聚合在不同社區(qū)中。常用的聚類算法有基于劃分方法、基于層次方法、基于密度方法、基于網(wǎng)格方法等。該系統(tǒng)采用較為簡單的K平均劃分方法進(jìn)行聚類處理,設(shè)聚類后簇的數(shù)目為K,具體操作步驟是:①隨機(jī)選取K個(gè)對象作為初始的K個(gè)簇的質(zhì)心;②將其余對象根據(jù)其與各個(gè)簇質(zhì)心的距離分配到最近的簇,再求新形成的簇的質(zhì)心;③上述迭代過程不斷重復(fù),直至目標(biāo)函數(shù)最小化。

為簡化算法,選擇最能體現(xiàn)用戶興趣的網(wǎng)絡(luò)訪問活動(dòng)進(jìn)行分析。主要考慮以下用戶行為:下載資源、瀏覽資源。分別構(gòu)建下載和瀏覽行為的相異度矩陣,再通過聚類算法生成虛擬用戶社區(qū)。

首先構(gòu)建下載行為的相異度矩陣。將下載活動(dòng)表示為(userid,KJ),其中userid為用戶標(biāo)識,KJ為下載的資源號以及下載時(shí)間。以在一段時(shí)間內(nèi)用戶下載相同資源的相同程度為基礎(chǔ),構(gòu)建相異度矩陣。如,有10個(gè)物流信息資源,編號分別為1~10,在同一段時(shí)間內(nèi)用戶A、B下載資源的情況為:A下載的資源集合為(1,2,5,7),B下載的資源集合為(1,2,4),A下載資源中與B相同的比例為50%,B與A相同的比例為66%,綜合考慮,得A、B兩個(gè)用戶下載資源活動(dòng)的相近程度為58%,則相異度為42%。經(jīng)過處理后,得到用戶下載情況的相異度矩陣。

然后構(gòu)建瀏覽行為的相異度矩陣。用戶的瀏覽行為與其興趣的相關(guān)程度在很大程度上取決于瀏覽時(shí)間,即用戶對某個(gè)頁面瀏覽時(shí)間越長,說明該用戶對頁面的興趣度越大。在以瀏覽行為為評價(jià)對象進(jìn)行用戶相似性聚類時(shí),除了考慮用戶瀏覽頁面的相同程度之外,還應(yīng)考慮瀏覽時(shí)間。為方便處理,將瀏覽時(shí)間按長短分為若干個(gè)等級,如瀏覽時(shí)間在1min之內(nèi),1~5min,5~10min,10min以上等。以用戶在一段時(shí)間內(nèi)訪問相同頁面時(shí)間長度等級的差異情況為主,構(gòu)建相異度矩陣。

分別對上述2個(gè)相異度矩陣采用K平均劃分方法進(jìn)行聚類,也可以將2個(gè)相異度矩陣合并,然后進(jìn)行聚類處理。合并時(shí)可以加上一定的權(quán)重,如側(cè)重瀏覽行為,則對瀏覽情況的相異值乘上一個(gè)較大的系數(shù)B(0

用戶的興趣是動(dòng)態(tài)變化的。相應(yīng)的虛擬社區(qū)應(yīng)根據(jù)用戶的興趣變化而變動(dòng)。若某個(gè)用戶的興趣發(fā)生變化,某類興趣值下降至設(shè)定的閾值,則將該用戶從相應(yīng)的社區(qū)中刪除;若用戶某類興趣值增加至設(shè)定的閾值,則將該用戶加入到對應(yīng)的社區(qū)中。對新用戶經(jīng)過一段時(shí)間的瀏覽行為跟蹤后,分配至合適的社區(qū)中。

4 結(jié) 論

隨著物流信息平臺整合資源和信息的增多,用戶訪問網(wǎng)站及時(shí)獲取所需信息的難度越來越大,而大多數(shù)物流信息平臺所具備的搜索功能又缺乏主動(dòng)性。本文主要針對網(wǎng)站的普通用戶獲取信息的問題,將電子商務(wù)的個(gè)性化推薦技術(shù)應(yīng)用其中。主要以Web挖掘技術(shù)從用戶的瀏覽行為間接地獲取用戶興趣進(jìn)而完成個(gè)性化推薦。系統(tǒng)中所用的算法只是選用了相關(guān)挖掘算法中比較典型的,具體選用算法還可以進(jìn)一步研究。

參考文獻(xiàn):

[1]趙影.基于Web使用挖掘的個(gè)性化推薦服務(wù)研究[D].大連:東北財(cái)經(jīng)大學(xué),2009.

[2]張紅霞.基于Web挖掘的電子商務(wù)個(gè)性化推薦系統(tǒng)[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2009,11(6).

[3]陳基漓,牛秦洲.Web挖掘在農(nóng)業(yè)信息網(wǎng)站個(gè)性化服務(wù)中的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2008,36(35).

[4]李宏基.物流服務(wù)平臺中推薦系統(tǒng)的框架設(shè)計(jì)[J].科技傳播,2010(10).

[5]Han JW,M Icheline Kamber.數(shù)據(jù)挖掘:概念與技術(shù)[M].范明,孟小峰,等,譯.北京:機(jī)械工業(yè)出版社,2001.

猜你喜歡
個(gè)性化推薦
基于用戶相似度加權(quán)的Slope One算法
軟件(2016年4期)2017-01-20 09:44:28
基于遠(yuǎn)程教育的個(gè)性化知識服務(wù)研究
東方教育(2016年8期)2017-01-17 19:47:27
基于鏈?zhǔn)酱鎯?chǔ)結(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計(jì)與實(shí)現(xiàn)
個(gè)性化推薦系統(tǒng)關(guān)鍵算法探討
基于協(xié)同過濾算法的個(gè)性化圖書推薦系統(tǒng)研究
文本數(shù)據(jù)挖掘在電子商務(wù)網(wǎng)站個(gè)性化推薦中的應(yīng)用
商(2016年34期)2016-11-24 16:28:51
圖書管理系統(tǒng)中個(gè)性推薦方法研究
國內(nèi)外錯(cuò)題管理研究綜述
無線定位個(gè)性化導(dǎo)覽關(guān)鍵技術(shù)在博物館中的運(yùn)用
一種基于協(xié)同過濾技術(shù)的個(gè)性化移動(dòng)學(xué)習(xí)資源推薦策略
商(2016年16期)2016-06-12 09:07:08
正定县| 闵行区| 石景山区| 大石桥市| 定远县| 德兴市| 宁陵县| 曲阜市| 无极县| 香格里拉县| 毕节市| 莲花县| 绥德县| 阿荣旗| 六安市| 云浮市| 德钦县| 南投县| 邹城市| 平江县| 嵩明县| 白水县| 寻乌县| 明光市| 辽阳县| 大同市| 石台县| 晋中市| 寻甸| 盐津县| 蒙自县| 巩留县| 祁连县| 甘泉县| 神农架林区| 韶关市| 霍林郭勒市| 中超| 孝义市| 丽水市| 永丰县|