王自強(qiáng) 馮博琴
摘要:為了高效地解決協(xié)同過濾算法中的遺漏值問題,而不是簡單地用缺省值加以代替,提出了一種新的、在協(xié)同過濾中的遺漏值處理方法.其基本思想是,先利用具有最小方差的局部主成分,把包含有遺漏值的不完備數(shù)據(jù)集劃分成多個(gè)模糊聚類,然后通過求解廣義逆矩陣來獲得各個(gè)子聚類的主成分,最終在局部主成分的基礎(chǔ)上通過簡單的線性方程模型去估計(jì)聚類中的遺漏值.實(shí)驗(yàn)表明,這種方法的優(yōu)點(diǎn)是低內(nèi)存需求,具有較小的平均絕對偏差值,并且顯示出了比傳統(tǒng)推薦算法更好的推薦質(zhì)量.
關(guān)鍵詞:個(gè)性化推薦系統(tǒng);協(xié)同過濾;遺漏值;主成分分析;模糊聚類
中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):0253—987X(2004)08—0808—03