国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡(luò)資源推薦系統(tǒng)關(guān)鍵技術(shù)的探索

2018-03-06 09:39:22周雪芳
關(guān)鍵詞:向量個(gè)性化目標(biāo)

◆周雪芳

網(wǎng)絡(luò)資源推薦系統(tǒng)關(guān)鍵技術(shù)的探索

◆周雪芳

(青島黃海學(xué)院 山東 266427)

本文主要具體介紹了當(dāng)今比較流行的個(gè)性化推薦技術(shù),基于內(nèi)容的過濾、基于關(guān)聯(lián)規(guī)則的推薦、協(xié)同過濾推薦,通過這幾種技術(shù)推薦算法、穩(wěn)定性、可讀性等優(yōu)缺點(diǎn)的比較,最終幫助開發(fā)者根據(jù)實(shí)際況選擇有利的推薦技術(shù),做出合理的選擇。

推薦技術(shù);推薦系統(tǒng)

0 前言

推薦技術(shù)作為推薦系統(tǒng)的關(guān)鍵和核心,指的是系統(tǒng)充分利用系統(tǒng)用戶的一些技術(shù)。因此,推薦算法的好壞、效率的高低直接影響著系統(tǒng)推薦的效率和質(zhì)量。目前存在一系列常用的推薦技術(shù)和算法,但目前在推薦系統(tǒng)中最常用的推薦技術(shù)主有三類:基于內(nèi)容(過濾)的推薦技術(shù)、基于規(guī)則的推薦技術(shù)和協(xié)同過濾推薦技術(shù),對(duì)于各種技術(shù)的具體介紹如下。

1 基于內(nèi)容(過濾)的推薦(Content-based Filtering Recommendation)技術(shù)

該技術(shù)最初起源于信息檢索領(lǐng)域,是信息過濾研究技術(shù)的延續(xù)和發(fā)展。基于內(nèi)容(過濾)的推薦技術(shù)通過分析系統(tǒng)資源信息和用戶描述文件(具體在后面小節(jié)中有介紹),根據(jù)該資源內(nèi)容與用戶描述文件之間的相似性程度為系統(tǒng)用戶提供個(gè)性化的資源推薦。具體來說,該推薦技術(shù)首先運(yùn)用TF-IDF方法(在后面小節(jié)中有介紹)計(jì)算出用戶當(dāng)前瀏覽的資源文檔中出現(xiàn)權(quán)重比較高的關(guān)鍵字,并將這些關(guān)鍵字構(gòu)成描述當(dāng)前用戶特征的向量,然后計(jì)算出系統(tǒng)中將要被推薦資源的資源特征項(xiàng)權(quán)重高的關(guān)鍵字,將其作為該推薦項(xiàng)的屬性特征。根據(jù)用戶評(píng)價(jià)過的資源建立基于向量空間模型的用戶的興趣特征(包括系統(tǒng)用戶的偏好和需求),通過將資源內(nèi)容特征進(jìn)行過濾,根據(jù)資源內(nèi)容與用戶描述文件間的相似性(這是推薦算法的核心,通過cosine方法來計(jì)算兩個(gè)向量之間夾角的cosine值來確定)的計(jì)算結(jié)果,最終確定兩個(gè)相似性最高(cosine值最大)的資源作為系統(tǒng)用戶最可能感興趣的資源項(xiàng)推薦給用戶從而完成推薦過程。根據(jù)用戶描述文件的不同,基于內(nèi)容(過濾)的推薦可以分為基于向量空間模型的推薦、基于關(guān)鍵詞分類的推薦、基于領(lǐng)域分類的推薦和基于潛在語義索引的推薦四種形式。

1.1基于向量空間模型的推薦

基于向量空間模型的推薦是目前最常用的基于內(nèi)容(過濾)推薦的方法。該推薦方法將資源表示成一個(gè)n維的特征向量,如:D(T1,T2,….Tn)其中D表示文件(Document),Tn則指的是該資源的眾多特征項(xiàng)。向量的每一維都是由一個(gè)關(guān)鍵詞(可以是資源的屬性值)和權(quán)重(可取布爾型和實(shí)數(shù)值)來組成的,分別用來表示用戶是否對(duì)某網(wǎng)絡(luò)資源感興趣以及感興趣的相關(guān)程度。在運(yùn)用基于空間向量方法處理文本資源的時(shí)候,系統(tǒng)將從該資源的名稱中抽取的屬性詞作為關(guān)鍵詞,并在向目標(biāo)用戶進(jìn)行推薦時(shí)將該用戶描述文件看成目標(biāo)資源,然后通過相似性算法來計(jì)算出系統(tǒng)資源與該目標(biāo)資源的相似值,最后,按照相似值從大到小的順序依次將資源輸出給目標(biāo)用戶,完成推薦過程。

1.2基于關(guān)鍵詞分類的推薦

基于關(guān)鍵詞分類的推薦則是將資源推薦的過程看做是資源分類問題:系統(tǒng)首先通過獲取到目標(biāo)用戶對(duì)某組已定義的資源進(jìn)行評(píng)價(jià)的結(jié)果來計(jì)算出每個(gè)資源的關(guān)鍵詞屬于某個(gè)類的條件概率,從而獲取到該用戶的特征描述。然后,根據(jù)此特征描述的計(jì)算結(jié)果獲取后驗(yàn)概率,最后將具有最高后驗(yàn)概率的資源推薦給系統(tǒng)用戶;基于領(lǐng)域分類的推薦則是將用戶興趣文件表示為用戶對(duì)不同領(lǐng)域感興趣的概率,并通過計(jì)算所有資源和用戶在一個(gè)事先建好的領(lǐng)域分類模型上的概率分布來最終確定推薦的資源[2]。

基于內(nèi)容(過濾)的推薦技術(shù)作為目前應(yīng)用比較廣泛的推薦技術(shù),具有如下所述的優(yōu)點(diǎn):

(1)穩(wěn)定性好:該推薦技術(shù)不受系統(tǒng)新注冊(cè)用戶用戶、新上傳的資源的影響,能夠通過分析用戶描述文件來完成個(gè)性化的推薦,這是協(xié)同過濾推薦技術(shù)所無法處理的。

(2)無冷開始、稀疏性問題:在實(shí)際資源評(píng)分過程中,很多的系統(tǒng)用戶由于各種原因都會(huì)對(duì)資源不予評(píng)價(jià),這就給協(xié)同過濾技術(shù)帶來了稀疏性問題。從而引發(fā)許多資源由于得不到用戶評(píng)分而無法得到系統(tǒng)推薦,這使得以最相鄰鄰居的興趣資源作為目標(biāo)用戶推薦資源的協(xié)同過濾推薦技術(shù)大大受限[4]。相反基于內(nèi)容的過濾則不需要其它用戶的數(shù)據(jù),僅是通過對(duì)個(gè)人用戶文件分析,不會(huì)受用戶是否評(píng)價(jià)的影響。

(3)容易理解、推薦結(jié)果直接。該技術(shù)的推薦過程相較于系統(tǒng)過濾簡單、高效,能夠方便系統(tǒng)在較短時(shí)間內(nèi)為用戶提供最合適的資源。

基于內(nèi)容過濾的推薦技術(shù)目前也面臨著一些問題:比如該推薦技術(shù)的使用范圍局被限于用戶以往瀏覽的資源及類似信息資源,而不能為用戶發(fā)現(xiàn)、提供新的資源推薦;此外,由于受信息獲取技術(shù)如自動(dòng)提取多媒體數(shù)據(jù)(圖像,視頻流,音頻等)的內(nèi)容特征等技術(shù)上的制約,影響了該技術(shù)對(duì)復(fù)雜資源特征提取的效果;最后,該技術(shù)由于獲取資源關(guān)鍵詞表征資源特征需要專業(yè)人士,這在某種程度上也增加了開發(fā)系統(tǒng)的開發(fā)負(fù)擔(dān)。

2 基于關(guān)聯(lián)規(guī)則的推薦(Rule-based Recommendation)技術(shù)

該推薦技術(shù)伴隨數(shù)據(jù)挖掘技術(shù)的興起而被重視,是以基于關(guān)聯(lián)規(guī)則作為理論基礎(chǔ)來完成推薦過程的技術(shù)。推薦方法中的每個(gè)系統(tǒng)資源都會(huì)被分成前部和后部兩個(gè)部分。其中前部相當(dāng)于一個(gè)興趣組,而后部則是這個(gè)興趣組所對(duì)應(yīng)的推薦。該技術(shù)認(rèn)定用戶在使用某個(gè)資源(前部)的時(shí)候會(huì)傾向使用與其相關(guān)的資源(后部)。由此,在推薦過程中,若系統(tǒng)用戶對(duì)某個(gè)資源的前部喜歡,那么系統(tǒng)就認(rèn)定后部也會(huì)滿足用戶的興趣偏好,并把該資源后部以一定可信度推薦給當(dāng)前用戶。比如用戶學(xué)習(xí)Servlet時(shí),在搜索資源Servlet資源的同時(shí)也會(huì)搜索JSP資源,因?yàn)閷W(xué)習(xí)JSP是Servlet的基礎(chǔ),兩者具有很高的相關(guān)度。

基于關(guān)聯(lián)規(guī)則推薦技術(shù)所具有的優(yōu)點(diǎn)有:

(1)簡單、快捷、容易發(fā)現(xiàn)新的興趣點(diǎn)。

(2)數(shù)據(jù)源簡單,不需要特殊數(shù)據(jù)源。

(3)能夠準(zhǔn)確預(yù)測用戶行為,挖掘用戶的潛在興趣。然而,該技術(shù)隨著關(guān)聯(lián)規(guī)則數(shù)量的增多,系統(tǒng)也將變得難以管理,同時(shí)當(dāng)關(guān)聯(lián)規(guī)則耗時(shí),會(huì)出現(xiàn)同一性、個(gè)性化程度低等問題,而影響推薦的質(zhì)量。

3 協(xié)同過濾推薦(Collaborative Filtering Recommendation)技術(shù)

該技術(shù)又被稱為社會(huì)過濾技術(shù),也是目前最常用的推薦技術(shù)之一,并且已被應(yīng)用到很多領(lǐng)域中。該技術(shù)具有以 “人”為推薦基礎(chǔ)的特點(diǎn),能夠通過分析目標(biāo)用戶的興趣偏好,在用戶群中找出和目標(biāo)用戶興趣愛好類似的用戶,并將它作為相似的最相鄰用戶,然后將相似用戶的興趣偏好推薦給目標(biāo)用戶,以滿足目標(biāo)用戶對(duì)于興趣資源的獲取。這種推薦方式能夠方便目標(biāo)用戶獲得意料之外的資源,從而挖掘用戶的潛在需要。協(xié)同過濾技術(shù)的主要任務(wù)就是找出目標(biāo)用戶的相應(yīng)的最近鄰居,從而根據(jù)最近鄰居的喜好對(duì)資源做出預(yù)測和推薦。

4 總結(jié)

總之,隨著個(gè)性化服務(wù)的發(fā)展,個(gè)性化推薦技術(shù)在各個(gè)領(lǐng)域中都發(fā)揮著重要的作用,服務(wù)著人們的工作、學(xué)習(xí)、生活。雖然不同的個(gè)性化推薦算法都有自己的側(cè)重點(diǎn)和優(yōu)勢(shì),但每個(gè)算法都有自己不可避免的缺陷。通過上述分析比較,本文采用基于內(nèi)容(過濾)的推薦技術(shù)來實(shí)現(xiàn)對(duì)系統(tǒng)用戶的資源推薦。雖然該推薦方法僅對(duì)于文本資源有效,但由于現(xiàn)在很多技術(shù)都可以實(shí)現(xiàn)從圖片、音樂、視頻中自動(dòng)抽取資源內(nèi)容信息,并且還能將抽取后的內(nèi)容以文本、關(guān)鍵詞(標(biāo)簽)、特征向量等方式表達(dá),因此系統(tǒng)對(duì)不同類型信息的處理方式文本處理是類似的。由此,選取基于內(nèi)容(過濾)的推薦完全能夠?qū)崿F(xiàn)為用戶推薦各種類型的個(gè)性化資源。

[1]RuanJian-hai. TheInternet-basedEducation: UsingtheInterne TAS school [J]. Proceeding of ICCE’ 98.

[2]舒蓓,申瑞民,王加俊.個(gè)性化的遠(yuǎn)程學(xué)習(xí)模型[J].計(jì)算機(jī)工程與應(yīng)用,2001.

[3]余力,劉魯.電子商務(wù)個(gè)性化推薦研究[J].計(jì)算機(jī)集成制造系統(tǒng),2004.

猜你喜歡
向量個(gè)性化目標(biāo)
向量的分解
聚焦“向量與三角”創(chuàng)新題
堅(jiān)持個(gè)性化的寫作
文苑(2020年4期)2020-05-30 12:35:12
新聞的個(gè)性化寫作
新聞傳播(2018年12期)2018-09-19 06:27:10
上汽大通:C2B個(gè)性化定制未來
向量垂直在解析幾何中的應(yīng)用
我們的目標(biāo)
向量五種“變身” 玩轉(zhuǎn)圓錐曲線
滿足群眾的個(gè)性化需求
新目標(biāo)七年級(jí)(下)Unit?。淳毩?xí)(一)
潮州市| 巴林右旗| 合肥市| 马山县| 安福县| 庄浪县| 界首市| 咸宁市| 陇南市| 扬中市| 随州市| 耿马| 贵溪市| 新野县| 盐源县| 贡嘎县| 望谟县| 定西市| 潞西市| 永寿县| 蒲城县| 天水市| 永川市| 九龙县| 西峡县| 改则县| 福建省| 开鲁县| 河南省| 普定县| 桦甸市| 吴川市| 农安县| 娄底市| 黄大仙区| 邛崃市| 平陆县| 当阳市| 菏泽市| 商都县| 汽车|