天津工業(yè)大學計算機科學與軟件學院 梁 宇
移動互聯(lián)網(wǎng)用戶的增加,將給移動互聯(lián)網(wǎng)企業(yè)帶來更大的利潤空間,隨之而來的是更多的移動互聯(lián)網(wǎng)企業(yè)的出現(xiàn),更多移動互聯(lián)網(wǎng)信息載體的出現(xiàn)。Internet上的個性化信息推薦已經(jīng)得到了很好的應用,國內外都有一些應用中的個性化推薦系統(tǒng),而在移動網(wǎng)絡上進行個性化推薦還處于起步階段,還沒有成熟的產(chǎn)品投入使用。
個性化推薦系統(tǒng)是應用知識發(fā)現(xiàn)技術,在與用戶互動的過程中為用戶提供個性化的信息,產(chǎn)品與服務。個性化推薦系統(tǒng)主要融合了用戶建模技術,數(shù)據(jù)庫中的知識發(fā)現(xiàn),Web挖掘技術等。個性化推薦技術主要分為三類:基于規(guī)則的推薦,基于內容分類的推薦和基于協(xié)同過濾技術的推薦。
基于規(guī)則的推薦主要根據(jù)用戶歷史瀏覽記錄,采取一定的方法,分析出信息之間的潛在的關聯(lián)關系,根據(jù)這種關聯(lián)關系建立規(guī)則庫,在其他用戶再次訪問某信息條目I時,在規(guī)則庫中查找與條目I對應規(guī)則,根據(jù)這些規(guī)則決定向用戶推薦的信息集。于規(guī)則的推薦結構簡單,易于應用。主要缺點是:規(guī)則的數(shù)量隨著數(shù)據(jù)量的增大急劇增加;規(guī)則集的確定依賴于支持度-可信度模型,而支持度、可信度的確定并沒有確定的標準,支持度或可信度的改變對規(guī)則集的大小影響較大;對用戶的推薦是根據(jù)當前已有的規(guī)則,并不能發(fā)現(xiàn)新的用戶偏好
基于內容分類的推薦(Content-based Recommendation)是建立在信息內容的基礎上,而不需要依據(jù)用戶對信息的評價,主要采用機器學習的方法將信息進行分類。并且根據(jù)用戶提供的定制信息類型或者用戶的興趣模型,將同類信息或者與用戶模型最為相似的信息條目推薦給用戶?;趦热莸耐扑]是建立在信息內容的基礎之上的,因此基于內容的推薦技術比較適用于機器容易識別的信息載體,如文本,而不適用與音頻,視頻等信息內容不容易獲取的信息載體?;趦热莸耐扑]系統(tǒng)的另外一個關鍵技術是文本特征的提取,基于內容的推薦技術是根據(jù)文本的特征與用戶的興趣模型進行匹配的程度來決定是否向用戶推薦該文本信息。因此文本的特征選擇在基于內容的推薦算法中尤為重要,特征選取的優(yōu)劣決定了個性化推薦的質量。
協(xié)同過濾推薦建立在群體性和多數(shù)原則的基礎之上,由于人具有社會屬性,因此個人的行為一定是包含了某類群體行為的表現(xiàn),在此假設基礎之上協(xié)同過濾推薦才會有意義。協(xié)同過濾推薦主要分為基于用戶的推薦(Userbased),基于項目的推薦(Item-based),基于模型的推薦(Model-based)三類。當前協(xié)同過濾推薦已經(jīng)廣泛的應用到電子商務網(wǎng)站,某些社會化網(wǎng)絡中。比較成功的應用主要有亞馬遜,當用戶購買某本書籍時系統(tǒng)會向用戶推薦可能喜歡的書籍列表。還有一些如豆瓣,一些視頻音樂網(wǎng)站等也都應用了協(xié)同過濾推薦技術,基于協(xié)同過濾的個性化推薦也應用到了博客、微博等網(wǎng)絡產(chǎn)品上。
協(xié)同過濾技術較基于規(guī)則與基于內容的推薦優(yōu)點:(1)能夠過濾機器難以進行自動內容分析的信息類型,如音樂,視頻等;(2)應用統(tǒng)計學原理,對大量的歷史記錄進行分析,推薦的精確度更高;(3)可以發(fā)現(xiàn)用戶興趣的變化,并且獲得用戶的新興趣;(4)利用了用戶的反饋信息,可以即時修正推薦集。但是,協(xié)同過濾也不是完美無缺的,比如它存在冷啟動,歷史記錄稀疏性,新項目推薦失效等問題,這需要在具體的推薦算法實現(xiàn)中去解決。
移動網(wǎng)絡較傳統(tǒng)Internet具有更多的特殊性,因此移動網(wǎng)絡上的個性化信息推薦質量不但受到推薦算法本身的影響,也會受到移動網(wǎng)絡資源的影響,本節(jié)將介紹影響移動網(wǎng)絡個性化信息推薦質量的關鍵因素。
個性化推薦技術需要一定的歷史信息作為依據(jù)來對用戶進行推薦,個性化推薦技術是建立在歷史信息記錄的基礎之上的,或是用戶顯性輸入的信息,或是通過機器學習分析出來的信息。而信息具有時效性和時滯性,信息在一定時間內是有效的信息,一旦超過了一定的期限它就沒有意義,此時就是無效信息。信息本身從信息源產(chǎn)生到需要該信息的宿主都需要一定的時間,因此信息又具有時滯性。因此時間的價值隨時間的流逝而變得越來越小,因此歷史信息在產(chǎn)生用戶推薦集的過程中發(fā)揮的作用是不盡相同的,如何使各個歷史階段的信息發(fā)揮不同的作用是移動網(wǎng)絡個性化推薦系統(tǒng)要考慮的問題之一。
系統(tǒng)初始化時由于系統(tǒng)積累的用戶信息或者瀏覽記錄信息不足,造成不能產(chǎn)生用戶推薦集,或者推薦集不準確,這個問題被稱為推薦系統(tǒng)的冷啟動問題。冷啟動在大多數(shù)軟件系統(tǒng)都存在,由于信息的積累需要一定的時間,因此在系統(tǒng)剛剛發(fā)布運行時不能產(chǎn)生正確的結果集。個性化推薦系統(tǒng)是建立在大量事實信息基礎之上的,因此要產(chǎn)生比較滿意的推薦結果需要積累大量的事實信息。因此如何解決推薦系統(tǒng)的冷啟動問題是改進推薦質量的又一關鍵問題。
移動終端的私有性可以保證用戶獲取到有效的用戶信息需求。但是移動終端設備在內存,處理能力方面比較有限,決定了移動終端設備不能處理復雜的人機交互功能,因此移動網(wǎng)絡信息推薦系統(tǒng)不能像傳統(tǒng)的Internet信息推薦系統(tǒng)那樣在客戶端運行監(jiān)控用戶行為特征的程序。移動終端屏幕大小的限制,以及操控能力的限制決定了移動終端在顯示能力方面的不足,它不可能像PC上以圖文并茂的方式進行信息顯示以及動態(tài)的輸入客戶端請求。移動設備的電源以及數(shù)據(jù)存儲能力方面的限制,決定了移動推薦系統(tǒng)不能不間斷的向終端用戶推薦信息。因此,針對移動終端設備的種種不足,對移動個性化推薦系統(tǒng)的推薦準確性,推薦信息類型,推薦方式以及終端的顯示與信息反饋形式都提出了新的要求。
移動網(wǎng)絡具有移動性,靈活性,使得人們獲取網(wǎng)絡信息不再約束在固定的位置上。移動網(wǎng)絡質量受到自身帶寬,地理位置等因素的限制,傳輸能力不能與傳統(tǒng)的有線網(wǎng)絡相比。因此移動網(wǎng)絡上進行信息傳遞需要考慮更多的問題,比如傳遞信息的格式,信息文件的大小,降低網(wǎng)絡延時等。移動網(wǎng)絡的個性化信息推薦對推薦的準確度,系統(tǒng)響應速度,獲取用戶信息反饋等方面都提出了新的要求。因此一個高效的移動個性化推薦系統(tǒng)應該具有運行簡單,響應速度快,推薦準確及時的特點。當前移動終端的計算能力相對有限,為了提高用戶的使用體驗,移動客戶端程序應該盡量減少計算數(shù)據(jù)量。
移動互聯(lián)網(wǎng)的迅速發(fā)展,勢必會使移動互聯(lián)網(wǎng)獲取有價值信息變得越困難,移動個性化推薦成為今后解決移動互聯(lián)網(wǎng)信息膨脹的主要方式。文章主要論述了與移動網(wǎng)絡中應用個性化信息推薦技術相關的技術,以及影響移動網(wǎng)絡個性化信息推薦的主要因素分析。
[1]劉枚蓮,叢曉琪,楊懷珍.改進鄰居集合的個性化推薦算法[J].計算機工程,2009(11).
[2]張瑞華,周延年,王樅,李蕾.移動終端離線瀏覽系統(tǒng)的新聞推薦研究[J].北京郵電大學學報,2006,12(6).