摘 要:伴隨移動網(wǎng)絡(luò)科技的進(jìn)步,在移動互聯(lián)網(wǎng)上取得有價(jià)值的咨詢將變得不那么容易。個性化推介系統(tǒng)的誕生與運(yùn)用,讓以往因特網(wǎng)上信息過載的情況得到改善。作者在已有的推薦算法的前提下,給出一類以客戶分類與記錄信譽(yù)度加權(quán)的協(xié)同過濾推介算法。并利用J2ME科技創(chuàng)建移動互聯(lián)網(wǎng)個性化推介原型系統(tǒng)。
關(guān)鍵詞:中小學(xué)生;移動智能;推介系統(tǒng)
經(jīng)過若干年的發(fā)展,伴隨移動網(wǎng)絡(luò)的迅猛進(jìn)步——尤其是我國3G牌照落地,移動網(wǎng)絡(luò)使用人數(shù)暴增。我國互聯(lián)網(wǎng)信息中心統(tǒng)籌的數(shù)據(jù)說明,2012年前半年我國網(wǎng)絡(luò)使用人數(shù)高達(dá)5.38億,而移動設(shè)備使用人數(shù)逼近3.88億。而伴隨這種情況的還有移動網(wǎng)絡(luò)方面信息的呈幾何級數(shù)增加,讓大眾通過移動互聯(lián)網(wǎng)取得有意義的信息變得不那么簡單。為化解因特網(wǎng)上信息湮沒的困局,個性化推介科技開始“大顯身手”。參考移動網(wǎng)絡(luò)的特別屬性,作者將以往老舊的因特網(wǎng)上的個性化推介科技與移動網(wǎng)絡(luò)對接,形成了移動個性化推介的離線化解方案,而且創(chuàng)設(shè)了以J2ME為核心的移動個性化推介系統(tǒng),這是對以往模式的一種升級,并且讓用戶獲取信息的途徑更為便捷。
1 ATC與CF融合的推介系統(tǒng)
1.1 有關(guān)科技概論
為消除文本分類過程中人為因素的影響,自動文本分類科技有著良好的發(fā)展前景。當(dāng)前較為普及的是KNN、樸素貝葉斯模式、SVM等。這類模式均牽涉到統(tǒng)籌學(xué)領(lǐng)域,通過特征提取來注釋文本文檔,構(gòu)建文檔模型后,應(yīng)該使用有差別的分類器來劃分文本文檔。文本文檔分類構(gòu)建是通過讀取大批文檔實(shí)現(xiàn)的,進(jìn)而統(tǒng)一了對文本文檔的分類意見,讓分類流程中的人為影響盡可能小。
協(xié)同過濾,又被稱作協(xié)作型過濾,其在信息過濾與信息獲取方面廣泛應(yīng)用。協(xié)作型過濾算法,一般要召集一大批人實(shí)施搜尋,并通過這種算法獲得與客戶愛好相似的一小撥人,并對這部分客戶的愛好實(shí)施查證,將結(jié)果聯(lián)合獲得有著嚴(yán)謹(jǐn)排序的推介表格。協(xié)同過濾科技的種類有以客戶類似度為核心的協(xié)同過濾、以推介事項(xiàng)為核心的協(xié)同過濾、以模具為核心的協(xié)同過濾三種。Userbased協(xié)同過濾是通過尋求類似客戶團(tuán)體,依照其網(wǎng)上沖浪的記載內(nèi)容,尋求到有類似愛好并推介給客戶;Item-based協(xié)同過濾算法是推介事項(xiàng)間的類似度,參照客戶的沖浪喜愛,將事項(xiàng)推介給客戶;Model-based協(xié)同過濾,應(yīng)構(gòu)建個性化推介的數(shù)模,依照數(shù)模來推算推介集。
作者通過樸素貝葉斯分類器和以項(xiàng)目為核心的協(xié)同過濾計(jì)算來構(gòu)建移動互聯(lián)網(wǎng)的個性化推介系統(tǒng)。
1.2 個性化推介模型
以J2ME科技為核心的個性化推介體系的結(jié)構(gòu),系統(tǒng)模型使用C/S構(gòu)造設(shè)計(jì),用戶端使用J2ME科技來完成移動設(shè)備用戶對訊息的獲取,伺服器終端使用Servlet。
而推介模型能夠劃定為四個重要版塊:
(1)客戶訊息收集劃定為顯性的信息收集與隱蔽的信息收集兩種模式。顯性的學(xué)習(xí)收集模式在客戶的終端瀏覽頁面創(chuàng)設(shè)訊息回饋版塊,在該版塊內(nèi)客戶能夠參照自身的偏好獲得對應(yīng)的訊息;隱蔽的訊息收集模式是客戶參考對訊息的瀏覽時(shí)長,決定是否儲蓄訊息、是不是轉(zhuǎn)載訊息等。
(2)訊息發(fā)布系統(tǒng)的功能通常是增加推介訊息,在此流程中,利用樸素貝葉斯文本分類器對文檔種類實(shí)施劃定。
(3)個性化推介引擎利用以客戶背景訊息分類與國王使用記載可信度加權(quán)的Item-Based協(xié)同過濾計(jì)算,來逐漸推介訊息集。
(4)終端系統(tǒng)使用以J2ME科技為核心的模式,實(shí)現(xiàn)訊息獲取與客戶愛好收集等工作。
1.3 樸素貝葉斯文本類別的劃分
文本類別的劃分是把無法預(yù)知的文本種類劃定到既定的種類中,進(jìn)而減少人為元素的影響。樸素貝葉斯類別劃分涉及到古典數(shù)理知識,分類情況較為理想,并且模型構(gòu)造簡易,優(yōu)勢明顯。所以,面向中小學(xué)生,作者挑選樸素貝葉斯分類器來對文本進(jìn)行類別的劃分。
作者所應(yīng)用的以樸素貝葉斯分類為核心的文本分類流程是:
1.3.1 練習(xí)文本的向量空間顯示
構(gòu)建向量空間模型的步驟包含文本分詞處置、消除停用詞、特點(diǎn)抉擇等。通過各版塊的銜接,最后將明確組別內(nèi)的特征詞當(dāng)成特征詞空間W={w1,w2,w3,…Wn},W是特征詞。把文本放入這個組別的特征詞空間,讓文本的闡述變成T(A)={PA1、PA2、PA3,…PAn},PA1是文本頻率法表示詞Wi在文本A上的加權(quán)。PAi能夠使用信息增益模式,開放擬合檢測等其他模式來顯示。
1.3.2 換算每一特征詞的種類的概率分布
換算每一特征詞隸屬何種種類的幾率,其具象化的換算模式是:分開驗(yàn)算每種文本的質(zhì)心,并換算詞映射每個種類的幾率,最后構(gòu)成特征詞-文檔種類的相應(yīng)矩陣。而有關(guān)文本集質(zhì)心的換算此處不再贅述,可以查找相關(guān)資料獲得對應(yīng)算法。
1.3.3 向量空間模型的構(gòu)成
依照既定的特征詞空間,把即將進(jìn)行類別劃分的文本放入特征詞空間內(nèi),讓其顯示為向量空間模式:T(X)={Px1,Px2,Px3…Pxm}。
1.3.4 依照特征詞的幾率分布狀況,換算即將進(jìn)行類別劃分的文本的種類
明確類別劃分文本T(X)隸屬類別劃分Ck(Ck∈{C1,C2,C3…Cn})的幾率R(k),并進(jìn)行換算。
1.3.5 明確將濟(jì)寧類別劃分的文本的種類
使用對應(yīng)的算式把即將劃分類別的文本隸屬每一類別的幾率R(k),算出極大值R(k)的種類就是文本的終極分類。
1.4 以用戶類別劃分與記載可行度權(quán)重為核心的協(xié)同過濾算法
作者給出的改善后的協(xié)同過濾算法,與以往的協(xié)同過濾算法的差異在于:根據(jù)客戶的背景條件實(shí)施類別的劃分以及客戶過往的記載訊息甲醛。依照客戶背景條件實(shí)施過濾的思維源自于一類假設(shè):同樣背景訊息的客戶有著近似的訊息需要,依照客戶的背景訊息清理關(guān)系不大的客戶團(tuán)體記載,能夠減少過往考評記載的維數(shù),提升系統(tǒng)的運(yùn)轉(zhuǎn)質(zhì)量。而權(quán)衡到客戶的喜好會不斷改變,過往的考評記載無法完整映射用戶的喜好,所以對客戶的過往考評記載實(shí)施加權(quán)處置,讓與目前時(shí)態(tài)最為趨近的考評記載獲得很高的權(quán)限,如此能夠在參考過往記載的基礎(chǔ)上,提升考評的可靠性。
而對客戶的種類進(jìn)行劃分,通常要過濾掉與用戶關(guān)系不大的冗雜訊息,提取客戶的真正背景訊息,這樣的訊息被叫做關(guān)鍵元素。以取得的關(guān)鍵元素為核心,對客戶實(shí)施類別的劃分??蛻纛悇e的劃分通常要注意:
(1)統(tǒng)籌客戶最感興趣的隸屬類別,即客戶的喜好狀況。
(2)換算客戶訊息基礎(chǔ)訊息集的訊息熵。
(3)換算客戶基礎(chǔ)訊息內(nèi)每一屬性的信息增益,并挑選信息增益最為明顯的特性,并將其看成是左右客戶獲得訊息的關(guān)鍵要素,并把關(guān)鍵要素看成是客戶背景訊息分類的準(zhǔn)則,來劃定不同種類的客戶。
而應(yīng)注意的是,如果用戶背景訊息類別劃分的強(qiáng)度過高,或者客戶過往記載訊息量極大,那么應(yīng)使用若干個用戶背景訊息聯(lián)合的模式來獲得關(guān)鍵要素。信息增益與信息熵的有關(guān)使用效果,應(yīng)通過ID3分類算法完成。另外,還包含一部分以信息增益為核心的特征抉擇模式。另外,還有信息近似度算法等,此處不再一一贅述。
2 面向中小學(xué)生的移動個性化推介系統(tǒng)設(shè)計(jì)
2.1 整體結(jié)構(gòu)
首先,應(yīng)構(gòu)建J2ME的移動互聯(lián)網(wǎng)個性化訊息推介系統(tǒng)的層級模型。其通常分成用戶端參數(shù)獲得層、Web層、參數(shù)操控層、參數(shù)儲蓄層。用戶端通常以向終端客戶提供推介訊息,來獲得客戶的顯性數(shù)據(jù)與客戶的隱蔽數(shù)據(jù);Web層通常通過Servlet、JSP等,向系統(tǒng)的參數(shù)庫供應(yīng)推介的訊息,并且通過Servlet為J2ME用戶端程序以HTTP/HTTPS等形式來取得或增添訊息;參數(shù)操控層通常包含JAVA BEAN,這部分JAVA BEAN封裝了參數(shù)操控API,并為外部環(huán)境供應(yīng)一致性強(qiáng)的訪問端口;參數(shù)儲蓄層使用的則是Oracle 10g參數(shù)庫管控軟件。
2.2 用戶端程序流程
用戶端開啟是依靠主MIDlet實(shí)現(xiàn)的,其完成了推介訊息留存、訊息搜索、客戶個體愛好回饋等工作,是最先使用用戶端程序來進(jìn)行客戶注冊、密碼設(shè)定與訊息閱覽等工作的。之后能夠直觀地使用RMS內(nèi)的個體訊息完成登錄,通過檢驗(yàn)達(dá)標(biāo)后,客戶就可以在自身權(quán)限范圍內(nèi)完成操控。
2.3 伺服器端程序構(gòu)造
伺服器端程度關(guān)鍵版塊是文本類別劃分版塊、個性化推介版塊。為減少客戶的等待時(shí)長,這兩類版塊的運(yùn)轉(zhuǎn)在線下進(jìn)行。就是說預(yù)設(shè)既定的運(yùn)轉(zhuǎn)時(shí)長或人工操控來設(shè)定特征詞空間、幾率分布訊息、客戶的類別劃分特性、推介集訊息等。
此處,作者僅闡述個性化訊息推介版塊。其通常會生成并保護(hù)客戶間的推介訊息集。該流程應(yīng)確保推介訊息的新奇性,所以,應(yīng)在后臺開啟運(yùn)轉(zhuǎn)線程,讓推介集訊息能夠推陳出新。
3 結(jié)束語
作者在文章中為化解移動互聯(lián)網(wǎng)的訊息過量的困局給出了一類化解模式,并且這是面向中小學(xué)生的移動智能推介系統(tǒng),基本上完成了以J2ME為核心的移動互聯(lián)網(wǎng)個性化推介原型系統(tǒng),而且其被實(shí)踐證明是切實(shí)可行的。因?yàn)檫€存在一部分漏洞,比如:如何加入誘導(dǎo)因子,讓學(xué)生興趣引導(dǎo)到健康方向上來,如何根據(jù)年齡段提供智能推介信息等,作者提出的原型系統(tǒng)在推介效果以及普及性方面還需不斷加強(qiáng)。
參考文獻(xiàn)
[1]賦能技術(shù)創(chuàng)建智能國度尖端科技展會搶盡風(fēng)——亞洲通信展2014、企業(yè)資訊科技展2014和亞洲廣播展2014圓滿落幕[J].移動通信,2014(14):96.
[2]孫斌.個性化智能推薦引擎算法研究及應(yīng)用[D].華中科技大學(xué),2012,5.
[3]郭磊.試論移動智能終端APP的發(fā)展趨勢及面臨的安全挑戰(zhàn)[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2015(7):97-98.
[4]李剛.基于移動智能終端的交互式滅火救援指揮決策系統(tǒng)的探討[J].科技創(chuàng)新導(dǎo)報(bào),2014(10):53-54.
[5]2015中國移動互聯(lián)網(wǎng)+教育暨移動智能教育峰會(西安)要點(diǎn)擷英[J].陜西廣播電視大學(xué)學(xué)報(bào),2015,17(4):5-9.
[6]王永固.現(xiàn)代教育技術(shù)與中小學(xué)生信息素養(yǎng)的培養(yǎng)[J].中國電化教育,2001(5):26-28.
[7]辛陽.一種專利智能推薦算法設(shè)計(jì)與軟件實(shí)現(xiàn)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2013(1):70-73.
作者簡介:歐陽子凌(1999-),男,漢族,湖南省寧鄉(xiāng)一中高二679班學(xué)生。
科技創(chuàng)新與應(yīng)用2016年31期