朱耀磷 蔡延光
摘要:信息時(shí)代中,新形態(tài)的教育方式應(yīng)運(yùn)而生。越來(lái)越多的網(wǎng)絡(luò)課程如同雨后春筍,以一種井噴式的態(tài)勢(shì)增長(zhǎng)著。但也存在一個(gè)無(wú)法忽視的痛點(diǎn),不同的網(wǎng)課平臺(tái)相互封鎖,伴隨之而來(lái)的矛盾是,用戶(hù)需要花費(fèi)更多的時(shí)間和精力到各個(gè)平臺(tái)搜索心儀的網(wǎng)絡(luò)課程。更有甚者,有部分用戶(hù)由于自身水平限制,在入門(mén)一個(gè)領(lǐng)域時(shí),常常由于缺乏對(duì)該領(lǐng)域的認(rèn)識(shí),在如何選擇合適的網(wǎng)絡(luò)課程時(shí)感到為難,這無(wú)疑是一塊巨大的絆腳石。信息過(guò)載已成為制約人們方便使用互聯(lián)網(wǎng)的絆腳石,網(wǎng)絡(luò)世界信息資源分布廣泛,使得人們產(chǎn)生信息迷失。推薦系統(tǒng)是信息過(guò)濾的衍生品,能更好地實(shí)現(xiàn)信息資源個(gè)性化推薦。從這個(gè)痛點(diǎn)出發(fā),本文基于協(xié)同過(guò)濾算法,創(chuàng)新地提出一種網(wǎng)絡(luò)課程推薦系統(tǒng)。并且,可從本文得到啟發(fā),并將此種方法應(yīng)用于其他行業(yè),諸如互娛、金融等。
關(guān)鍵詞:推薦;協(xié)同;過(guò)濾;網(wǎng)課;矩陣
中圖分類(lèi)號(hào):TP311.5 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.3969/j.issn.l003-6970.2017.08.009
本文著錄格式:朱耀磷,蔡延光.知識(shí)推薦的協(xié)同過(guò)濾算法[J].軟件,2017,38(8):50-53
引言
隨著計(jì)算機(jī)等智能設(shè)備的普及,數(shù)字化的教育方式、越來(lái)越多的網(wǎng)絡(luò)課程已然成為一個(gè)無(wú)可逆轉(zhuǎn)的趨勢(shì)與發(fā)展潮流。網(wǎng)絡(luò)的迅速普及、網(wǎng)絡(luò)資源不斷豐富、網(wǎng)絡(luò)信息量急劇增長(zhǎng),一方面人們可以獲取的信息資源越來(lái)越豐富,這給人們帶來(lái)很大好處;另一方面,面對(duì)海量的信息資源,人們被迫不得不以更多的時(shí)間精力去搜尋對(duì)其有用的信息,因而“信息超載”越來(lái)越突出,信息過(guò)量無(wú)法消化、難以辨識(shí)真假。
信息量暴漲與“怎樣準(zhǔn)確快速獲取有價(jià)值的網(wǎng)絡(luò)信息、怎樣理解已有歷史數(shù)據(jù)并用于預(yù)判未來(lái)行為”兩者之間的矛盾日益嚴(yán)重。為給用戶(hù)提供更高效率更方便更舒適的體驗(yàn),本文基于網(wǎng)課用戶(hù)和網(wǎng)絡(luò)課程協(xié)同推薦過(guò)濾,提出推薦系統(tǒng)的設(shè)計(jì)方法,將更好地服務(wù)于用戶(hù),解決用戶(hù)使用過(guò)程中耗時(shí)耗力的窘境,并且實(shí)現(xiàn)更加流暢透明的推薦功能,致力于網(wǎng)絡(luò)課程的發(fā)展,為更加先進(jìn)的教育方式搖旗助威[2,3,4]。
1 值的定義
本節(jié)主要闡述系統(tǒng)在開(kāi)發(fā)過(guò)程中所涉及的符號(hào)及變量的定義,在一定程度上,這將對(duì)理解本系統(tǒng)的設(shè)計(jì)有不錯(cuò)的幫助。
1.1 定義網(wǎng)課
首先是對(duì)網(wǎng)絡(luò)課程的定義說(shuō)明,這里統(tǒng)一采用10個(gè)量度指標(biāo)定義任意一門(mén)網(wǎng)絡(luò)課程,記任意一門(mén)網(wǎng)絡(luò)課程為A,A為列向量。
這里的為百分?jǐn)?shù),分別代表該門(mén)課程的10個(gè)指標(biāo),不妨假設(shè)為:文學(xué)、理工、計(jì)算機(jī)、小說(shuō)、數(shù)學(xué)、物理、外語(yǔ)、電子、材料、地理。
則代表該課程為文學(xué)類(lèi)課程的比例,%代表該課程為理工類(lèi)課程的比例,…以此類(lèi)推。
設(shè)第一門(mén)課程為4,第二門(mén)課程為,
1.2 定義用戶(hù)
對(duì)用戶(hù)的定義同樣采用10個(gè)指標(biāo)定義一位用戶(hù),這10個(gè)指標(biāo)代表著每一名用戶(hù)的個(gè)人特質(zhì)。假設(shè)任一名用戶(hù)為B,B為行向量。
同為占比百分?jǐn)?shù),分別設(shè)
為:喜好文學(xué)、喜好理工、…喜好地理。因此,代表改名用戶(hù)喜歡文學(xué)的比例,62代表改名用戶(hù)喜歡理工的比例,…定義第一位用戶(hù)為第二位用戶(hù)為…
2 系統(tǒng)建立過(guò)程分析
當(dāng)系統(tǒng)每引入一門(mén)課程時(shí),由課程的提供者(即“老師”)對(duì)該課程進(jìn)行標(biāo)記,該門(mén)課程被標(biāo)記為屬于哪種類(lèi)型。一門(mén)課程可同時(shí)屬于多個(gè)領(lǐng)域。
當(dāng)某一門(mén)課程被帶有某種屬于的用戶(hù)選擇之后,后臺(tái)系統(tǒng)捕捉這種行為,自動(dòng)為該門(mén)課程刷新屬性。例如,當(dāng)一門(mén)課程為的用戶(hù)點(diǎn)擊之后,后臺(tái)將課程修改為。
當(dāng)新用戶(hù)登錄系統(tǒng)時(shí),需要用戶(hù)對(duì)自己進(jìn)行標(biāo)記,修改設(shè)置行向量B,用戶(hù)可以擁有自己的朋友圈。當(dāng)用戶(hù)瀏覽選擇感興趣的課程,后臺(tái)根據(jù)用戶(hù)的行為,動(dòng)態(tài)修改用戶(hù)的B值,例如,當(dāng)一個(gè)新用戶(hù)將自己標(biāo)記為,那么當(dāng)他選擇了課程,時(shí),系統(tǒng)自動(dòng)為該用戶(hù)修改。
3 協(xié)同推薦
新用戶(hù)登錄系統(tǒng)時(shí),有兩種方法可為其推薦網(wǎng)課。一種是根據(jù)用戶(hù)對(duì)自己的標(biāo)記,選擇其朋友圈內(nèi)一個(gè)與改名用戶(hù)屬性最相近的人為目標(biāo),按照目標(biāo)的歷史網(wǎng)課記錄,推薦其最近一段時(shí)間的課程給新用戶(hù)。
另一種方法是,利用新用戶(hù)對(duì)自己的標(biāo)記,與系統(tǒng)內(nèi)已有數(shù)據(jù)進(jìn)行匹配,按照匹配度的高低來(lái)為新用戶(hù)推薦網(wǎng)課[6,7]。
無(wú)論采取何種方法,隨著用戶(hù)的活躍度提高,系統(tǒng)推薦的準(zhǔn)確度也將進(jìn)一步提高[8_13]。
4 數(shù)據(jù)過(guò)濾
完成上面的準(zhǔn)備工作后,每位用戶(hù)都擁有一個(gè)獨(dú)立的屬性值B,每一門(mén)網(wǎng)課也同樣擁有獨(dú)立的屬性值A(chǔ)。利用這些作為標(biāo)記的特征值,系統(tǒng)便可準(zhǔn)確地向目標(biāo)用戶(hù)推薦恰當(dāng)?shù)木W(wǎng)課。這里主要闡述數(shù)據(jù)過(guò)濾的手法,本文前面將用戶(hù)的屬性值B定義為行向量,將網(wǎng)課的屬性值A(chǔ)定義為列向量。
這里再定義。
C便為所謂的匹配度,系統(tǒng)將按照C值的大小向用戶(hù)推薦對(duì)應(yīng)的網(wǎng)課,C由大到小表示由最匹配到最不匹配。
當(dāng)然也可以直接用進(jìn)行判斷
5 結(jié)語(yǔ)
在本文中提到的此種框架下,任何商品(包括網(wǎng)課、娛樂(lè)信息等)都可便捷地構(gòu)建推薦系統(tǒng),協(xié)同推薦的方式很好地解決初入系統(tǒng)的信息被孤立的問(wèn)題。故而賦予了系統(tǒng)很好的適應(yīng)性,可移植至不同的領(lǐng)域。