国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度學(xué)習(xí)的學(xué)生畫像選課系統(tǒng)研究

2021-06-28 19:10:38李沁穎易豪
電腦知識與技術(shù) 2021年10期
關(guān)鍵詞:深度學(xué)習(xí)

李沁穎 易豪

摘要:目前,深度學(xué)習(xí)利用自身優(yōu)勢,已在語音識別、圖像處理等方面取得了重大的突破與成就。然而,深度學(xué)習(xí)在選課推薦系統(tǒng)領(lǐng)域的研究與應(yīng)用還處于早期階段??紤]傳統(tǒng)的選課系統(tǒng)難以考慮到影響學(xué)生選課的多因素,本文基于深度學(xué)習(xí),結(jié)合協(xié)同過濾技術(shù)在選課系統(tǒng)中的應(yīng)用,實現(xiàn)對學(xué)生的多方面畫像,構(gòu)建出一個實時感知學(xué)生喜好變化,且對其進行智能推薦選課的平臺,實現(xiàn)從學(xué)生到課程的無誤差匹配。

關(guān)鍵詞: 用戶畫像技術(shù);深度學(xué)習(xí);協(xié)同過濾技術(shù);學(xué)生選課系統(tǒng)

中圖分類號:TP391? ? ? ?文獻標(biāo)識碼:A

文章編號:1009-3044(2021)10-0184-03

Abstract: At present, deep learning has made great breakthroughs and achievements in speech recognition and image processing by taking advantage of its own advantages. However, the research and application of deep learning in the field of course selection recommendation system is still in the early stage. Considering the traditional course selection system is difficult to consider the many factors influencing students' course selection, based on the deep learning, combining the application of collaborative filtering technology in the course system, realize to the students' various portraits, construct a real-time perception student preferences change, and carries on the intelligent recommended course platform, from students to the course of matching error.

Key words: User Portrait Technology; Deep learning; Collaborative Filtering Technology; Course selection recommendation system

1 引言

隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展與人們物質(zhì)生活水平的日益提升,移動終端設(shè)備普及度上升,各種移動應(yīng)用也競相進入人們的日常生活中,導(dǎo)致互聯(lián)網(wǎng)信息呈爆炸式增長。面對海量信息及當(dāng)下社會不斷加快的生活節(jié)奏,人們正面臨著信息篩選困難,信息處理效率低下,信息交流冗雜等的困擾,不可避免地使企業(yè)由于對用戶的營銷不夠細(xì)化,繼而推送一些不合時宜、不符偏好的信息為用戶帶來騷擾,甚至引起客戶流失。因此,如何處理、利用與用戶各方面相關(guān)的信息,構(gòu)建實時標(biāo)簽化體系,并實現(xiàn)在用戶及其信息需求之間精準(zhǔn)地自動化匹配,成為現(xiàn)今各大企業(yè)主要研究的目標(biāo),用戶畫像及其相關(guān)技術(shù)就在這種背景下誕生并發(fā)展。

目前針對用戶畫像的研究方法大多基于“收集信息-行為建模-構(gòu)建畫像”技術(shù),以構(gòu)建淺顯的用戶畫像。這一方法未將用戶行為信息、偏好信息等特征之間的聯(lián)系進行更深層挖掘。此外,用戶信息處理也面臨著數(shù)據(jù)信息量大、緯度高、相互獨立等問題,使得基于淺層構(gòu)建方法的預(yù)測效果較差。

2 用戶畫像技術(shù)

用戶畫像(Persona)是一種研究用戶的系統(tǒng)化偏重類方法,也被稱為用戶角色。該技術(shù)通過收集用戶的統(tǒng)計信息、偏好信息、行為信息,對大量目標(biāo)用戶群的真實信息進行處理,構(gòu)建用戶標(biāo)簽化體系,針對產(chǎn)品或服務(wù)的目標(biāo)用戶群做典型特征描述,從而讓產(chǎn)品經(jīng)理更直觀地了解用戶,設(shè)計出更符合需求的產(chǎn)品原型。因此,用戶畫像成為用戶需求與產(chǎn)品設(shè)計之間聯(lián)系的樞紐。

加利福尼亞大學(xué)的Syskill和Webert通過顯式地收集網(wǎng)站用戶對網(wǎng)頁的滿意度信息,再通過信息統(tǒng)計分析和逐層學(xué)習(xí),構(gòu)建出用戶興趣模型[1]。CUM 大學(xué)開發(fā)的Web Watcher 以及后來的 Personal Web Watcher[2],可以通過數(shù)據(jù)采集器,采集并統(tǒng)計互聯(lián)網(wǎng)上用戶的瀏覽行為和瀏覽偏好,成功構(gòu)建出用戶的興趣模型,并隨著各項數(shù)據(jù)信息的積累實現(xiàn)系統(tǒng)模型更新。不同研究領(lǐng)域的用戶畫像研究方法也會有所差異,常用的有決策樹[3-4]、邏輯回歸[5]、支持向量機[6]及神經(jīng)網(wǎng)絡(luò)[7-8]等模型。在使用傳統(tǒng)方法對用戶畫像構(gòu)建時,數(shù)據(jù)來源局限于個人收集、業(yè)務(wù)收集、關(guān)系收集等,其中的部分信息不全面或者魚龍混雜,導(dǎo)致對用戶畫像的勾勒較為粗糙且片面。隨著現(xiàn)在大數(shù)據(jù)技術(shù)的發(fā)展與成熟,用戶數(shù)據(jù)的來源愈加廣泛,可獲取用戶的社交、興趣、屬性、環(huán)境等多方面信息,進而細(xì)化出精準(zhǔn)的用戶畫像。精準(zhǔn)用戶畫像技術(shù)廣泛應(yīng)用于多個領(lǐng)域中,其中有用戶畫像在電商領(lǐng)域中的應(yīng)用、網(wǎng)絡(luò)安全用戶行為畫像安全設(shè)計。

3 學(xué)生畫像選課系統(tǒng)

3.1 學(xué)生選課系統(tǒng)

信息化時代的發(fā)展使得線上教學(xué)變得更加便捷,為了調(diào)動學(xué)生自主學(xué)習(xí),自主選擇的熱情,各種學(xué)生在線選課系統(tǒng)應(yīng)運而生?;鵆#的學(xué)生系統(tǒng)[9]主要運用了Microsoft SQL Sever2000, Microsoft SQL Sever及C#等工具,優(yōu)化了程序代碼、避免數(shù)據(jù)冗余,執(zhí)行高效,便于統(tǒng)籌管理。隨著互聯(lián)網(wǎng)技術(shù)的進一步發(fā)展和移動終端設(shè)備普及度的提升,使得各種以在線選課系統(tǒng)為功能的手機App也被開發(fā)出來,基于Andriod平臺的校園選課系統(tǒng)成為主流,利用C/S架構(gòu),客服端通過JSON和服務(wù)端進行交互,而JSON數(shù)據(jù)體積小,這種輕量化的傳輸模式,更加易于解碼,與XML相比減少了解碼難度、運行時的兼容問題以及傳輸速度更快。目前,選課系統(tǒng)大都在使用網(wǎng)頁B/S的模式,這種模式對服務(wù)器要求高,傳輸速度慢。所以學(xué)校服務(wù)器可能在選課高峰期崩潰,使得部分學(xué)生無法第一時間選擇自己喜歡的課程,并考慮到現(xiàn)在的選課系統(tǒng)大都只由學(xué)生片面的第一主觀意識選擇,并未綜合學(xué)生的自身情況與學(xué)校培養(yǎng)計劃兩者考慮,可能導(dǎo)致學(xué)生在選課后對所選課程并無興趣,缺少對該課程學(xué)習(xí)的熱情,學(xué)生學(xué)而未學(xué),老師教而未教。因此,基于深度學(xué)習(xí)的學(xué)生畫像選課系統(tǒng)的研究便十分重要,通過深度學(xué)習(xí)建立學(xué)生用戶模型,能實時感知到學(xué)生對課程的喜好并準(zhǔn)確、精細(xì)地對學(xué)生用戶畫像個性化標(biāo)簽,使得學(xué)生有目的了解和選上自己合適、喜愛的課程。

3.2 學(xué)生畫像技術(shù)

學(xué)生畫像技術(shù)是用戶畫像技術(shù)的一個分支,通過對學(xué)生進行數(shù)據(jù)收集,行為、偏好分析再建立準(zhǔn)確且細(xì)致的學(xué)生標(biāo)簽?zāi)P?,這些模型就是學(xué)生畫像。在數(shù)據(jù)收集,行為、偏好分析這個過程中所總結(jié)出的學(xué)生特征,就是學(xué)生標(biāo)簽。學(xué)生畫像技術(shù)將在下一階段教育信息化建設(shè)中起到重要引導(dǎo)方向。

3.3 學(xué)生畫像的構(gòu)建過程

通過用戶畫像技術(shù)的概述我們不難發(fā)現(xiàn),學(xué)生用戶畫像的構(gòu)建主要通過以下四個步驟來實現(xiàn),如圖1所示。

3.3.1 學(xué)生數(shù)據(jù)采集

在學(xué)生數(shù)據(jù)的采集過程中,主要通過三個方面去收集。第一項是學(xué)生基本數(shù)據(jù)信息,此項信息可以從教務(wù)系統(tǒng)中獲取,獲取方式簡單且信息準(zhǔn)確。第二項是學(xué)生行為數(shù)據(jù)信息,包含了學(xué)生自己的一些主觀喜好及想法,在學(xué)生自主選課過程中有主導(dǎo)作用。第三項是大數(shù)據(jù)信息,包括學(xué)生的瀏覽、消費、社交等方面偏好的數(shù)據(jù)記錄,此項信息量較大,故需通過算法生成學(xué)生的部分標(biāo)簽。在學(xué)生數(shù)據(jù)采集的過程中,應(yīng)該聯(lián)系各項信息之間的關(guān)系來聯(lián)動采集。

3.3.2 數(shù)據(jù)分析處理

經(jīng)初步采集得到的原始數(shù)據(jù),多數(shù)情況下會有數(shù)據(jù)差異,數(shù)據(jù)缺失,以及格式不統(tǒng)一的問題出現(xiàn),所以要對數(shù)據(jù)進一步清洗篩選及分析等處理。最關(guān)鍵的是對所得的數(shù)據(jù)探究性分析和處理,包含了對數(shù)據(jù)的理解、過濾、補充、糾正,最后實現(xiàn)數(shù)據(jù)的歸一化,提高信息的價值相對性,輸出后成為用戶標(biāo)簽建模的基礎(chǔ)。

3.3.3 學(xué)生標(biāo)簽建模

在數(shù)據(jù)分析處理完成后,就要著手構(gòu)建標(biāo)簽?zāi)P?。通過每個學(xué)生的具體化標(biāo)簽,推算出符合學(xué)生潛在偏好的課程,完成數(shù)據(jù)可視化。在學(xué)生標(biāo)簽?zāi)P蜆?gòu)建的過程中需要多種算法支持,經(jīng)計算后得到每個學(xué)生的個性化標(biāo)簽,例如用來神經(jīng)網(wǎng)絡(luò)算法和決策樹算法來計算出學(xué)生的時空標(biāo)簽、基本特征及其延展;通過TF-IDF算法可計算出學(xué)生標(biāo)簽權(quán)重。處理不同的數(shù)據(jù),所需的算法模型一般不相同,處理一項具體信息時要使用對應(yīng)的算法,才能提高數(shù)據(jù)分析及特征處理工作的效率。

3.3.4 學(xué)生畫像成型及分類

結(jié)合上述步驟,學(xué)生系統(tǒng)就可以依據(jù)每個學(xué)生全面的信息實現(xiàn)個性標(biāo)簽化,并可以依據(jù)學(xué)生間的關(guān)聯(lián)與差異進行不同的歸類。再加以上深度學(xué)習(xí)的支持,能在分析學(xué)生基礎(chǔ)標(biāo)簽后計算產(chǎn)生新的標(biāo)簽,進一步更新并擴充學(xué)生標(biāo)簽,使學(xué)生畫像更為生動,流程圖如圖2所示。

4 深度學(xué)習(xí)在學(xué)生畫像選課系統(tǒng)中的應(yīng)用

深度學(xué)習(xí)通過構(gòu)建具有很多隱層的機器學(xué)習(xí)模型和訓(xùn)練數(shù)據(jù),能夠提高分類的準(zhǔn)確性,加之大數(shù)據(jù)技術(shù)的強大計算能力,通過對現(xiàn)有的標(biāo)簽?zāi)P头治?,可提前較為準(zhǔn)確推測出學(xué)生將產(chǎn)生的新行為和新標(biāo)簽,在學(xué)生選課系統(tǒng)中的作用必不可少。

4.1學(xué)生標(biāo)簽的建模

標(biāo)簽建模的方法主要分為兩大類,人工建模和機器建模,兩種建模方式各有優(yōu)劣勢。深度學(xué)習(xí)機器建模在學(xué)生標(biāo)簽建模過程中作用非常廣泛,機器建模通過機器對學(xué)生標(biāo)簽樣本的多維度學(xué)習(xí),然后建立機器自學(xué)習(xí)的標(biāo)簽?zāi)P?,調(diào)整學(xué)生樣本數(shù)據(jù)、標(biāo)簽?zāi)P徒Y(jié)構(gòu)及參數(shù)可逐步完善模型。

將學(xué)生的多方面信息作為模型訓(xùn)練的數(shù)據(jù),并通過對信息篩選和過濾出學(xué)生偏好方面的信息,以學(xué)生標(biāo)簽就可以完成簡單的深度學(xué)習(xí)建模。

4.2 多元化模型

因為學(xué)生標(biāo)簽受多方面的影響,所以模型中需要考慮其他影響因素,比如說學(xué)生借閱的圖書的種類,以及查詢學(xué)習(xí)資料的記錄等。要通過深度學(xué)習(xí)將簡單的模型多元化。

在模型的特征維度上按影響因素展開,將影響因素放在一個軸上,這樣可以讓模型獲取更立體的訓(xùn)練數(shù)據(jù),這樣就利于模型準(zhǔn)確推測出學(xué)生的偏好標(biāo)簽。比如學(xué)生某門選修課成績?yōu)閮?yōu)秀,并不能斷定該學(xué)生對這門課很感興趣,但如果同時借閱相關(guān)書籍并且在上網(wǎng)查找了該方面的學(xué)習(xí)資料時,和標(biāo)簽結(jié)果就有一定相關(guān)性了。就是加上學(xué)生前后學(xué)習(xí)行為的來龍去脈,而讓數(shù)據(jù)更立體,更豐富,讓學(xué)生模型對標(biāo)簽的判斷更準(zhǔn)確。

4.3 嵌入矩陣技術(shù)

采用嵌入矩陣技術(shù),其包含多維信息及影響因素,以學(xué)生標(biāo)簽影響因素為例,同上文兩個因素的判斷嵌入矩陣??赡艹霈F(xiàn)這兩個因素對于選課的影響情況,某些情況下這些影響因素可以對應(yīng)多種事物,而且這種嵌入式的機制通常包含很多因素,在訓(xùn)練模型時就需要不斷更新這些矩陣,使用MovieLens數(shù)據(jù)集示例,標(biāo)準(zhǔn)協(xié)同過濾技術(shù),將為學(xué)生和學(xué)生偏好提供嵌入矩陣,矩陣的大小是由選擇的因素數(shù)量決定的,關(guān)于選擇嵌入矩陣中的因子數(shù)量,這需要一些反復(fù)試驗。

4.4 基于協(xié)同過濾技術(shù)的選課推薦

協(xié)同過濾其通常分為兩類:分別是Memory-based與Model-based。其中Memory-based可以分為Item-based方法與User-based方法。Item-based方法是根據(jù)用戶對相似項目的評分?jǐn)?shù)據(jù)預(yù)測目標(biāo)項目的評分。所以可以將評分?jǐn)?shù)據(jù)視為學(xué)生的喜好,收集學(xué)生以往行為來獲得學(xué)生對課程喜好的顯隱信息,利用Item-based方法,根據(jù)學(xué)生一些喜好信息,發(fā)現(xiàn)喜好之間的相關(guān)性,我們可以基于這些相關(guān)性對其他學(xué)生進行推薦。

Memory-based推薦方法通過運行最近搜索,將每一個User或Item看成一個向量,計算其他所有User或者Item與它的相似度。得到User或Item之間的兩兩相似度后,即可進行預(yù)測與推薦。

5結(jié)論

現(xiàn)今,大多主流的學(xué)生選課系統(tǒng)功能較為單一,缺乏對學(xué)生顯隱性愛好的分析和發(fā)掘。而本文研究了基于深度學(xué)習(xí)從學(xué)生畫像到選課系統(tǒng)上的應(yīng)用,通過多元化模型、嵌入矩陣、基于協(xié)同過濾技術(shù)深度學(xué)習(xí)搭建學(xué)生用戶標(biāo)簽?zāi)P?,提供一個既可實時感知學(xué)生喜好變化,又能顯示學(xué)生顯隱愛好信息,并且為對象進行智能推薦選課的多元化平臺。

參考文獻:

[1] Mladenic, D. Machine learning for better Web browsing. In: Rogers, S., Iba, W., eds. AAAI 2000 Spring Symposium Technical Reports on Adaptive User Interfaces. Menlo Park, CA: AAAI Press, 2000. 82-84.

[2] Chen P M, Kuo F C. An information retrieval system based on a user profile[J]. Journal of Systems & Software, 2000, 54(1):3-8.

[3] 楊曉峰, 嚴(yán)建峰, 劉曉升,等. 深度隨機森林在離網(wǎng)預(yù)測中的應(yīng)用[J]. 計算機科學(xué), 2016, 43(6):208-213.

[4] 王靖, 王興偉, 趙悅. 基于變精度粗糙集決策樹垃圾郵件過濾[J]. 系統(tǒng)仿真學(xué)報, 2016, 28(3):705-710.

[5] 徐建民, 粟武林, 吳樹芳,等. 基于邏輯回歸的微博用戶可信度建模[J]. 計算機工程與設(shè)計, 2015(3):772-777.

[6] Dong L, Wesseloo J, Potvin Y, et al. Discrimination of Mine Seismic Events and Blasts Using the Fisher Classifier, Naive Bayesian Classifier and Logistic Regression[J]. Rock Mechanics & Rock Engineering, 2016, 49(1):183-211.

[7] 李翠停. 基于神經(jīng)網(wǎng)絡(luò)模型的蘋果手機預(yù)約數(shù)據(jù)的分析[D].南京:東南大學(xué), 2016.

[8] 陳巧紅, 孫超紅, 余仕敏,等. 基于遞歸神經(jīng)網(wǎng)絡(luò)的廣告點擊率預(yù)估研究[J]. 浙江理工大學(xué)學(xué)報, 2016,35(6):880-885.

[9] 曾偉洪,周軍城.基于C#的學(xué)生選課系統(tǒng)[J]. 2016,3(2):7-8.

【通聯(lián)編輯:王力】

猜你喜歡
深度學(xué)習(xí)
從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
面向大數(shù)據(jù)遠(yuǎn)程開放實驗平臺構(gòu)建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學(xué)習(xí)的三級階梯
有體驗的學(xué)習(xí)才是有意義的學(xué)習(xí)
電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
利用網(wǎng)絡(luò)技術(shù)促進學(xué)生深度學(xué)習(xí)的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
福清市| 新郑市| 额敏县| 吉林省| 白城市| 壶关县| 乐山市| 丰城市| 合作市| 洪湖市| 温宿县| 沂源县| 泊头市| 安徽省| 株洲市| 商南县| 本溪市| 大港区| 霸州市| 西城区| 玉树县| 思茅市| 长沙县| 芜湖市| 乌审旗| 申扎县| 金门县| 河东区| 岳池县| 长沙市| 东丰县| 礼泉县| 尤溪县| 内江市| 平山县| 桐庐县| 仁寿县| 德昌县| 丰城市| 建平县| 江阴市|