国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CEP的校園推薦系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

2018-06-20 07:51:00苾,盧山,湯
關(guān)鍵詞:教學(xué)樓課外協(xié)同

周 苾,盧 山,湯 鯤

(1.武漢郵電科學(xué)研究院,湖北 武漢 430000;2.南京烽火軟件科技有限公司,江蘇 南京 210000;3.東南大學(xué) 計(jì)算機(jī)教學(xué)實(shí)驗(yàn)中心,江蘇 南京 210000)

0 引 言

隨著科技的快速發(fā)展,當(dāng)前正步入大數(shù)據(jù)時(shí)代,智慧校園的發(fā)展成為教育改革的一個(gè)熱點(diǎn)。高校學(xué)生在學(xué)習(xí)基礎(chǔ)課程和專(zhuān)業(yè)知識(shí)的同時(shí),也面臨越來(lái)越多的課外資源的選擇。一個(gè)好的課外資源推薦系統(tǒng)旨在向?qū)W生實(shí)時(shí)地推薦近期公開(kāi)課、知識(shí)講座、社團(tuán)活動(dòng)等,有效地解決信息資源過(guò)載的問(wèn)題,對(duì)大學(xué)生的全面發(fā)展起到了重要作用。

推薦算法作為推薦系統(tǒng)的核心環(huán)節(jié),對(duì)推薦系統(tǒng)的性能好壞起著至關(guān)重要的作用。協(xié)同過(guò)濾算法作為最常用的推薦算法,一定程度上提升了推薦的精度和準(zhǔn)度,但依然存在著冷啟動(dòng)、稀疏性等問(wèn)題[1]?;趨f(xié)同過(guò)濾算法的推薦系統(tǒng)大多只考慮了相鄰用戶(hù)或推薦內(nèi)容的相似性,而沒(méi)有將用戶(hù)的位置信息作為影響因子。

近年來(lái),隨著智能移動(dòng)終端的普及和無(wú)線網(wǎng)絡(luò)的全面覆蓋,國(guó)內(nèi)外學(xué)者開(kāi)始在推薦系統(tǒng)中引進(jìn)地理位置信息。Karatzoglou A等[2]在2010年提出了考慮用戶(hù)位置信息、情緒、天氣、環(huán)境等因素的高維張量分解模型,建立基于情境信息的推薦系統(tǒng)。Seo等[3]在2013年提出通過(guò)用戶(hù)的軌跡信息挖掘用戶(hù)之間的關(guān)聯(lián)性,結(jié)合內(nèi)容推薦的相關(guān)算法,提高了推薦系統(tǒng)的精度。

然而,考慮用戶(hù)地理位置信息的推薦系統(tǒng)帶來(lái)了新的挑戰(zhàn),其中實(shí)時(shí)性和準(zhǔn)確率成為亟待解決的問(wèn)題。針對(duì)這兩個(gè)問(wèn)題,文中提出基于CEP的課外資源推薦系統(tǒng)。基于高校學(xué)生基本信息及GPS地理位置信息,結(jié)合復(fù)雜事件處理(complex event processing,CEP)技術(shù),構(gòu)建學(xué)生課外資源推薦系統(tǒng)模型,向教學(xué)樓附近的學(xué)生推薦該樓近期的學(xué)輔資源,實(shí)現(xiàn)大數(shù)據(jù)環(huán)境下對(duì)課外資源的個(gè)性化推薦,旨在提高推薦的準(zhǔn)確率和實(shí)時(shí)性。

1 相關(guān)工作

1.1 復(fù)雜事件處理

CEP最初源于主動(dòng)數(shù)據(jù)庫(kù)研究,是近年來(lái)新興的一種數(shù)據(jù)處理技術(shù)[4]。它能夠高效、實(shí)時(shí)地處理輸入的動(dòng)態(tài)事件流,將簡(jiǎn)單事件流入到復(fù)雜事件處理引擎中,經(jīng)過(guò)處理引擎中相應(yīng)規(guī)則匹配后形成更具體的高級(jí)事件[5]。其核心是通過(guò)設(shè)定時(shí)間窗口,根據(jù)事件之間的因果、層次等關(guān)系,使用事件處理語(yǔ)言(event processing language,EPL)進(jìn)行事件的抽象及關(guān)聯(lián),得出利于決策的數(shù)據(jù)或預(yù)警等信息。

CEP不僅可以實(shí)現(xiàn)對(duì)事件流的實(shí)時(shí)響應(yīng),而且能處理多維數(shù)據(jù)源、異構(gòu)數(shù)據(jù)源,對(duì)輸入的數(shù)據(jù)流沒(méi)有限制,并且打破了以往推薦系統(tǒng)只能處理單一數(shù)據(jù)源的局限。

1.2 協(xié)同過(guò)濾算法

協(xié)同過(guò)濾算法是最常用的個(gè)性化推薦算法,它利用用戶(hù)反饋回來(lái)的對(duì)Item的評(píng)分信息,查找用戶(hù)或Item之間的關(guān)聯(lián)性,然后再根據(jù)這些關(guān)聯(lián)進(jìn)行相關(guān)推薦[6]。協(xié)同過(guò)濾的基本思想是:對(duì)某個(gè)Item評(píng)分接近的用戶(hù),很有可能對(duì)另一些Item的評(píng)分也相近。比如:兩個(gè)喜歡同一風(fēng)格衣服的用戶(hù)很有可能都喜歡同一品牌的包包。

計(jì)算用戶(hù)與用戶(hù)之間相似度的常用方法包含基于余弦、皮爾森相關(guān)系數(shù)、矯正余弦等[7]。后面將選取最常用的基于余弦相似度的協(xié)同過(guò)濾算法與文中推薦系統(tǒng)進(jìn)行準(zhǔn)確度比較。

(1)

2 課外資源推薦系統(tǒng)設(shè)計(jì)

選取高校智慧校園為研究背景,對(duì)學(xué)生課外資源推薦系統(tǒng)作實(shí)證分析。高校學(xué)生課外資源推薦是一個(gè)復(fù)雜事件,推薦系統(tǒng)的準(zhǔn)確度受到多方面因素的影響。引入學(xué)生的實(shí)時(shí)位置信息、往常簽到信息,有利于更準(zhǔn)確地捕捉到學(xué)生潛在更傾向的資源地點(diǎn)[9]。學(xué)生的日常行為、同學(xué)之間的相互影響,也會(huì)在一定程度上決定學(xué)生對(duì)資源的選擇。

考慮到這些影響因素,下面構(gòu)造四種條件作為向?qū)W生個(gè)性化推薦講座、公開(kāi)課等課外資源的依據(jù):

在校園內(nèi)選定常用教學(xué)樓作為位置點(diǎn),當(dāng)學(xué)生距離某棟教學(xué)樓較近時(shí),優(yōu)先推送該教學(xué)樓近期資源;根據(jù)學(xué)生在不同樓的簽到信息,轉(zhuǎn)換成學(xué)生對(duì)該棟樓的評(píng)分,常去的樓評(píng)分較高,在推薦時(shí)加大權(quán)重;根據(jù)學(xué)生在圖書(shū)館的借閱信息,推測(cè)他近期可能感興趣的方向;考慮關(guān)系關(guān)聯(lián),將同一宿舍的學(xué)生作為一個(gè)親密好友集,向處于一個(gè)親密好友集的學(xué)生推薦同一資源。推薦系統(tǒng)流程如圖1所示。

圖1 個(gè)性化推薦系統(tǒng)流程

這里將從運(yùn)營(yíng)商處獲得的移動(dòng)終端設(shè)備的學(xué)生地理位置信息及學(xué)生個(gè)人基本信息數(shù)據(jù)流作為輸入事件流,并對(duì)學(xué)生課外資源推薦系統(tǒng)中的相關(guān)變量、基本事件和復(fù)雜事件進(jìn)行定義。

(1)變量定義。

系統(tǒng)中用到的變量名定義如表1所示。

表1 變量名定義

(2)推薦系統(tǒng)基本事件定義。

設(shè)A為課外資源推薦系統(tǒng)中的事件集合,a為事件屬性集[10]:

A={an|n=1,2,…,n},an={id,e,t}

SE(SourceEvent)為人群移動(dòng)狀態(tài)事件,SE={an|n=1,2,…,n},an={id,e,t},e={ID,RmNo,PhnNo,Lng,Ltd,Dist,B,S,LK,SK,SI}。

(3)推薦系統(tǒng)復(fù)雜事件定義。

事件1:將高校內(nèi)常用的教學(xué)樓、圖書(shū)館等六個(gè)建筑分別以A、B、C、D、E、F標(biāo)記,學(xué)生移動(dòng)至某樓監(jiān)測(cè)范圍內(nèi)。

事件2:根據(jù)學(xué)生一段時(shí)間內(nèi)的簽到信息,選出六棟教學(xué)樓中評(píng)分最高的一棟作為該學(xué)生最喜歡去的教學(xué)樓。

用類(lèi)似TF-IDF(term frequency-inverse document frequency)的方法[11]將學(xué)生在某棟樓簽到的次數(shù)轉(zhuǎn)換成學(xué)生對(duì)該樓的評(píng)分。假設(shè)數(shù)據(jù)集中包含M個(gè)學(xué)生,其中有N個(gè)在Buildingi處簽過(guò)到,用戶(hù)uj在Buildingi處簽到次數(shù)為K,則uj對(duì)Buildingi的評(píng)分為K×log(M/(1+N))。從教務(wù)系統(tǒng)中獲取100名學(xué)生一周內(nèi)在6個(gè)地點(diǎn)的1 752條簽到信息,經(jīng)過(guò)評(píng)分轉(zhuǎn)換預(yù)處理后的部分?jǐn)?shù)據(jù)集見(jiàn)表2。

表2 部分預(yù)處理后的簽到評(píng)分?jǐn)?shù)據(jù)集

事件3:根據(jù)圖書(shū)館系統(tǒng)的數(shù)據(jù)庫(kù)信息,由學(xué)號(hào)獲取該學(xué)生一段時(shí)間T內(nèi)的借書(shū)記錄,根據(jù)借書(shū)種類(lèi)推測(cè)該學(xué)生近期可能感興趣的方向。

事件4:向同一宿舍的學(xué)生推薦同一資源。根據(jù)社交影響理論[12],推薦系統(tǒng)可以利用學(xué)生之間的各種關(guān)系(友誼關(guān)系、信任關(guān)系等)進(jìn)行有效推薦。這里選取同一個(gè)宿舍的同學(xué)為親密好友集[13],在事件1發(fā)生時(shí),該學(xué)生及其舍友的事件4記為1,其他學(xué)生的事件4記為0。

這里選取的事件所占權(quán)重如表3所示,當(dāng)某一個(gè)課外資源在該學(xué)生處的占比不小于70%時(shí),確定向其推送該資源。

表3 事件所占權(quán)重表

每個(gè)事件所占的權(quán)重可以根據(jù)實(shí)際情況進(jìn)行調(diào)整,以適應(yīng)不同時(shí)期不同環(huán)境下的學(xué)生需求。比如畢業(yè)季來(lái)臨時(shí),可適當(dāng)加大各種招聘信息的權(quán)重,建黨節(jié)前夕,增加黨建會(huì)議及宣傳講座的權(quán)重。

3 資源推薦系統(tǒng)的實(shí)現(xiàn)及分析

復(fù)雜事件描述語(yǔ)言(EPL)是CEP技術(shù)的核心,它是一種類(lèi)SQL語(yǔ)言,主要包含數(shù)據(jù)流查詢(xún)語(yǔ)言、事件代數(shù)表達(dá)式和產(chǎn)生式規(guī)則三種不同類(lèi)型[14]。EPL可以通過(guò)設(shè)定不同時(shí)間窗口來(lái)描述事件之間的條件、關(guān)聯(lián)等關(guān)系。

3.1 EPL規(guī)則定義

根據(jù)推薦課外資源事件的相關(guān)變量定義及事件描述,使用EPL定義相應(yīng)的規(guī)則。

規(guī)則1:對(duì)應(yīng)事件1,監(jiān)測(cè)學(xué)生與選定的教學(xué)樓之間的距離,當(dāng)學(xué)生與某棟樓之間的距離小于50 m時(shí)[15],可以判斷該學(xué)生事件1記為1。對(duì)應(yīng)的EPL語(yǔ)句為:

Select Distance(B,ID) as Dist from SE.win:time(30 min) where Distance(B,ID)<=50

規(guī)則2:對(duì)應(yīng)事件2,學(xué)號(hào)為ID的學(xué)生,選出該學(xué)生評(píng)分最高的教學(xué)樓,向他推送更傾向去的教學(xué)樓的課外資源。對(duì)應(yīng)的EPL語(yǔ)句為:

Select ID,B,max(S) as maxS from SE.win:time(60 min) group by ID

規(guī)則3:對(duì)應(yīng)事件3,將課外資源信息的關(guān)鍵字與學(xué)生圖書(shū)館借閱信息的關(guān)鍵字進(jìn)行匹配,匹配到關(guān)鍵字的課外資源信息記為1,否則記為0。對(duì)應(yīng)的EPL語(yǔ)句為:

Select e.SI as SI from SE.win:time(100 sec) where e.SK=(select LK from Library where a.LK = LK)

規(guī)則4:對(duì)應(yīng)事件4,當(dāng)學(xué)生移動(dòng)至距離某教學(xué)樓50 m以?xún)?nèi)時(shí),系統(tǒng)更傾向于將該樓里的課外資源推薦給該學(xué)生親密好友集里的學(xué)生。對(duì)應(yīng)的EPL語(yǔ)句為:

Select ID,a.RmNo as RmNo from SE.win:time(100 sec) where (b=SE(b.RmNo=a.RmNo))

3.2 實(shí)驗(yàn)結(jié)果及分析

部分運(yùn)行結(jié)果如圖2和圖3所示。

圖2 輸入事件流運(yùn)行圖

圖3 推薦結(jié)果運(yùn)行圖

根據(jù)實(shí)驗(yàn)推薦結(jié)果,以學(xué)號(hào)為009的學(xué)生為例,對(duì)推薦過(guò)程進(jìn)行分析。從輸入的事件流看出,該學(xué)生距離任意教學(xué)樓的距離都在50 m以外,最常去的教學(xué)樓為F,根據(jù)圖書(shū)館借閱信息檢索到的關(guān)鍵字為英語(yǔ),宿舍號(hào)為19樓201室,與學(xué)號(hào)為002的學(xué)生是室友。根據(jù)事件4,學(xué)號(hào)為002的學(xué)生距離D樓在50 m以?xún)?nèi),則學(xué)號(hào)009的學(xué)生由于與002的學(xué)生屬于同一親密好友集,D樓資源也占20%。對(duì)于該學(xué)生來(lái)說(shuō),D教學(xué)樓內(nèi)的英語(yǔ)方面的資源評(píng)分為0.3+0+0.3+0.2=0.8>0.7,所以系統(tǒng)向其推薦地點(diǎn)在D教學(xué)樓的英語(yǔ)資源。

3.3 推薦系統(tǒng)評(píng)價(jià)指標(biāo)

平均絕對(duì)偏差(mean absolute error,MAE)是統(tǒng)計(jì)度量方法中的一種,通常被用來(lái)作為衡量推薦系統(tǒng)好壞的指標(biāo)[16]。MAE通過(guò)計(jì)算用戶(hù)預(yù)測(cè)評(píng)分和真實(shí)評(píng)分之間的偏差來(lái)度量系統(tǒng)的準(zhǔn)確度。MAE值越小,表明該系統(tǒng)推薦質(zhì)量越好。MAE定義為:

(2)

其中,{p1,p2,…,pn}為預(yù)測(cè)評(píng)分集合;{q1,q2,…,qn}為真實(shí)評(píng)分集合。

以郵科院2017年6月份學(xué)生數(shù)據(jù)信息為試驗(yàn)對(duì)象,隨機(jī)抽取了1 000名學(xué)生進(jìn)行線上問(wèn)卷調(diào)查,以校內(nèi)郵件的形式采集到學(xué)生對(duì)校內(nèi)100個(gè)課外資源的2 878個(gè)評(píng)分作為真實(shí)評(píng)分,將推薦系統(tǒng)的推薦結(jié)果轉(zhuǎn)換成預(yù)測(cè)評(píng)分,計(jì)算兩者之間的MAE,并選取基于余弦的協(xié)同過(guò)濾推薦算法與文中算法進(jìn)行對(duì)比。通過(guò)計(jì)算MAE,推薦系統(tǒng)準(zhǔn)確度比較如圖4所示。

通過(guò)圖4觀察到,相對(duì)于基于協(xié)同過(guò)濾算法的推薦系統(tǒng),文中系統(tǒng)具有更小的MAE值,一定程度上提高了推薦系統(tǒng)的準(zhǔn)確度。

圖4 MAE隨樣本數(shù)量變化曲線

在不同的輸入流速率下,測(cè)試系統(tǒng)的響應(yīng)時(shí)延,如圖5所示。

圖5 處理時(shí)延隨輸入流速率變化曲線

由圖5可知,文中基于CEP的課外資源推薦系統(tǒng)相比協(xié)同過(guò)濾,具有更小的平均時(shí)延。當(dāng)輸入流速率為1 000條/秒時(shí),隨著輸入流速率的增大,基于協(xié)同算法的推薦系統(tǒng)處理平均時(shí)延接近9 ms[17]。文中預(yù)期將處理時(shí)延的均值縮短到7 ms以?xún)?nèi),經(jīng)過(guò)實(shí)驗(yàn)達(dá)到了預(yù)期效果,輸入事件流速率為1 000條/秒時(shí),將處理時(shí)延縮短至6.8 ms。

4 結(jié)束語(yǔ)

大數(shù)據(jù)時(shí)代下為學(xué)生提供海量資源不再是難題,但是卻帶來(lái)了信息過(guò)載的問(wèn)題。個(gè)性化課外資源推薦系統(tǒng)對(duì)于構(gòu)建智慧校園,培養(yǎng)學(xué)生全面發(fā)展具有重要意義。文中引入CEP技術(shù),設(shè)計(jì)高校推薦情境,構(gòu)造復(fù)雜事件和關(guān)聯(lián)匹配規(guī)則,基于Esper平臺(tái)使用EPL語(yǔ)句編寫(xiě)程序,實(shí)現(xiàn)了學(xué)生課外資源的實(shí)時(shí)推薦。與基于協(xié)同過(guò)濾算法的推薦系統(tǒng)相比,該系統(tǒng)提升了推薦的準(zhǔn)確性和實(shí)時(shí)性,驗(yàn)證了所構(gòu)建的推薦模型的可行性和實(shí)用性,為個(gè)性化推薦系統(tǒng)的實(shí)現(xiàn)和研究提供了一種新的思路。

參考文獻(xiàn):

[1] 王 義,馬尚才.基于用戶(hù)行為的個(gè)性化推薦系統(tǒng)的設(shè)計(jì)與應(yīng)用[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010,19(8):29-33.

[2] KARATZOGLOU A,AMATRIAIN X,BALTRUNAS L,et al.Multiverse recommendation:n-dimensional tensor factorization for context-aware collaborative filtering[C]//Proceedings of the fourth ACM conference on recommender systems.Barcelona,Spain:ACM,2010:79-86.

[3] SEO Y,AHN J.Novel method for enhancing contents recommendation accuracy using LBS-based users viewing path similarity[J].International Journal of Multimedia & Ubiquitous Engineering,2013,8(2):8-15.

[4] 祝錫永,韓會(huì)平.基于CEP的消防物聯(lián)網(wǎng)火警誤報(bào)監(jiān)測(cè)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2015,24(3):57-62.

[5] 湯玲麗.復(fù)雜事件處理引擎關(guān)鍵技術(shù)研究[D].哈爾濱:哈爾濱工程大學(xué),2012.

[6] 張應(yīng)輝,司彩霞.基于用戶(hù)偏好和項(xiàng)目特征的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2017,27(1):16-19.

[7] 劉樹(shù)棟,孟祥武.基于位置的社會(huì)化網(wǎng)絡(luò)推薦系統(tǒng)[J].計(jì)算機(jī)學(xué)報(bào),2015,38(2):322-336.

[8] 陳宗言,顏 俊.基于稀疏數(shù)據(jù)預(yù)處理的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2016,26(7):59-64.

[9] 孫冬婷,何 濤,張福海.推薦系統(tǒng)中的冷啟動(dòng)問(wèn)題研究綜述[J].計(jì)算機(jī)與現(xiàn)代化,2012(5):59-63.

[10] 荊 心,張 璟,李軍懷.復(fù)雜事件處理技術(shù)及其在物流物聯(lián)網(wǎng)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2013,33(7):2026-2030.

[11] 王中主.智慧校園中基于位置服務(wù)的教育資源推薦系統(tǒng)研究[D].上海:華東師范大學(xué),2016.

[12] 房 旋,陳升波,宮 婧,等.基于社交影響力的推薦算法[J].計(jì)算機(jī)技術(shù)與發(fā)展,2016,26(6):31-36.

[13] LEE D H,BRUSILOVSKY P.Improving personalized recommendations using community membership information[J].Information Processing & Management,2017,53(5):1201-1214.

[14] 祝錫永,潘 悅.基于CEP的物聯(lián)網(wǎng)智能水表實(shí)時(shí)漏水監(jiān)測(cè)研究[J].成組技術(shù)與生產(chǎn)現(xiàn)代化,2015,32(1):23-28.

[15] GUO Jianhui,LIU Xianzhong,WANG Zhongzhu.Optimized indoor positioning based on WIFI in mobile classroom project[C]//International conference on natural computation.Zhangjiajie,China:IEEE,2015:1208-1212.

[16] PARK H,PARK D,JEONG I J.An effects analysis of logistics collaboration in last-mile networks for CEP delivery services[J].Transport Policy,2016,50:115-125.

[17] 梁向陽(yáng),張博倫.協(xié)同過(guò)濾推薦技術(shù)歸類(lèi)分析與探討[J].計(jì)算機(jī)與現(xiàn)代化,2016(12):67-72.

猜你喜歡
教學(xué)樓課外協(xié)同
小滿課外班
我的“課外老師”
蜀道難:車(chē)與路的協(xié)同進(jìn)化
“四化”協(xié)同才有出路
教學(xué)樓,作文本里的方格 組詩(shī)
基于遺傳算法的教學(xué)樓智能照明控制系統(tǒng)設(shè)計(jì)
電子制作(2017年17期)2017-12-18 06:40:41
教學(xué)樓自動(dòng)門(mén)控制系統(tǒng)研究與設(shè)計(jì)
三醫(yī)聯(lián)動(dòng) 協(xié)同創(chuàng)新
白城市新區(qū)學(xué)校教學(xué)樓結(jié)構(gòu)設(shè)計(jì)
轉(zhuǎn)動(dòng)小腦瓜
革吉县| 吴旗县| 青铜峡市| 铜山县| 同德县| 肃宁县| 云和县| 邵东县| 城市| 永宁县| 寿光市| 乌恰县| 巨野县| 茌平县| 扎囊县| 甘谷县| 同德县| 敦煌市| 汪清县| 濉溪县| 桐乡市| 长阳| 英德市| 太谷县| 长治县| 桦甸市| 朝阳区| 綦江县| 昆山市| 海丰县| 巴彦淖尔市| 马边| 舒兰市| 西林县| 陇南市| 西乌珠穆沁旗| 彰化市| 大同市| 北川| 甘泉县| 云阳县|