韓 后 殷紅巖 王冬青
兒童數(shù)字閱讀個(gè)性化推薦服務(wù)的設(shè)計(jì)與應(yīng)用*
韓 后1殷紅巖2王冬青3
(1.華南師范大學(xué) 文學(xué)院,廣東廣州,510631;2.滕州市荊河街道河陽(yáng)路小學(xué),山東棗莊,277500;3.華南師范大學(xué) 教育信息技術(shù)學(xué)院,廣東廣州,510631)
隨著智能終端的普及應(yīng)用和數(shù)字出版行業(yè)的發(fā)展,數(shù)字閱讀已成為兒童閱讀的重要方式。在有限的數(shù)字閱讀時(shí)間內(nèi),如何為兒童推送合適的圖書(shū)是家長(zhǎng)、教師與研究者共同關(guān)注的主題。然而,當(dāng)前面向兒童的數(shù)字閱讀應(yīng)用大多基于閱讀能力或圖書(shū)主題推薦圖書(shū),存在推薦結(jié)果單一、未考慮兒童閱讀興趣隨時(shí)間變化等問(wèn)題?;诖耍恼率紫仍诜治鰞和瘮?shù)字閱讀特點(diǎn)的基礎(chǔ)上,構(gòu)建了基于隱式反饋的兒童數(shù)字閱讀興趣模型,然后選用時(shí)間依賴的協(xié)同過(guò)濾算法實(shí)現(xiàn)了兒童數(shù)字閱讀個(gè)性化推薦服務(wù),最后利用“寒/暑假閱讀活動(dòng)”驗(yàn)證了該服務(wù)的有效性。文章通過(guò)研究,期望為兒童數(shù)字閱讀的個(gè)性化推薦提供一種解決方法,推動(dòng)數(shù)字閱讀走向智能閱讀。
隱式反饋;兒童閱讀興趣;數(shù)字閱讀;個(gè)性化推薦
《全民閱讀“十三五”時(shí)期發(fā)展規(guī)劃》提出少兒閱讀是全民閱讀的重點(diǎn),要從小培養(yǎng)兒童的閱讀習(xí)慣、閱讀興趣、閱讀能力,提高數(shù)字閱讀質(zhì)量與水平[1]。其中,閱讀興趣是促使兒童閱讀的心理動(dòng)力[2],閱讀興趣度越高的兒童對(duì)閱讀內(nèi)容的回憶和理解程度越高[3][4]。隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和智能終端的廣泛普及應(yīng)用,數(shù)字閱讀逐漸成為兒童閱讀的重要方式[5]。在數(shù)字閱讀過(guò)程中,如何為讀者推送個(gè)性化閱讀內(nèi)容,已經(jīng)成為實(shí)現(xiàn)閱讀服務(wù)精準(zhǔn)化的重要方向。
當(dāng)前,面向兒童數(shù)字閱讀的圖書(shū)推薦主要有兩種方式:①基于兒童閱讀能力的評(píng)測(cè)結(jié)果為兒童推薦適宜難度的圖書(shū);②根據(jù)兒童選擇的感興趣的主題為其推薦同主題或同系列的圖書(shū)。然而,這兩種推薦方式存在推薦結(jié)果較為單一、沒(méi)有考慮兒童的閱讀興趣或者默認(rèn)兒童的閱讀興趣固定不變等問(wèn)題,有悖于兒童閱讀興趣隨時(shí)間變化而變化的規(guī)律。對(duì)此,有研究者發(fā)現(xiàn)數(shù)字閱讀環(huán)境能夠伴隨式記錄兒童的閱讀行為過(guò)程數(shù)據(jù),對(duì)這類數(shù)據(jù)進(jìn)行分析能夠?qū)和拈喿x傾向和閱讀行為的變化做出準(zhǔn)確判斷[6],進(jìn)而解決上述問(wèn)題。這類數(shù)據(jù)在個(gè)性化推薦系統(tǒng)中被稱為隱式反饋數(shù)據(jù)[7],而基于隱式反饋數(shù)據(jù)量化用戶的閱讀興趣是圖書(shū)推薦系統(tǒng)中常用的一種興趣計(jì)算方法?;诖?,本研究構(gòu)建了基于隱式反饋數(shù)據(jù)的兒童數(shù)字閱讀興趣模型,設(shè)計(jì)了個(gè)性化推薦算法,并在自主研發(fā)的系統(tǒng)EreadingAD中實(shí)現(xiàn)了由兩者組合形成的數(shù)字閱讀個(gè)性化推薦服務(wù)。同時(shí),本研究選取小學(xué)二年級(jí)的學(xué)生為研究對(duì)象,在“數(shù)字閱讀活動(dòng)”期間應(yīng)用該服務(wù)為其推送閱讀書(shū)單,通過(guò)調(diào)查與訪談發(fā)現(xiàn)該服務(wù)能夠?yàn)閮和扑推涓信d趣的數(shù)字化圖書(shū)。本研究旨在為兒童數(shù)字閱讀的個(gè)性化推薦提供一種解決方法,助力“數(shù)字閱讀走向智能閱讀”[8]。
本研究在分析兒童數(shù)字閱讀特點(diǎn)及相關(guān)研究的基礎(chǔ)上,從基于隱式反饋數(shù)據(jù)的兒童數(shù)字閱讀興趣模型與個(gè)性化推薦算法兩個(gè)方面設(shè)計(jì)了兒童數(shù)字閱讀個(gè)性化推薦服務(wù),并將推薦結(jié)果以閱讀記錄卡的形式反饋給兒童,其流程設(shè)計(jì)如圖1所示。接下來(lái),本研究將詳細(xì)闡述其中模型構(gòu)建與算法設(shè)計(jì)的內(nèi)容。
圖1 兒童數(shù)字閱讀個(gè)性化推薦服務(wù)的流程設(shè)計(jì)
用戶興趣模型是一種根據(jù)用戶的行為和偏好建立的數(shù)學(xué)模型,它反映用戶在一段時(shí)期內(nèi)對(duì)信息需求的主要傾向[9]。兒童數(shù)字閱讀興趣模型是個(gè)性化推薦的基礎(chǔ),其構(gòu)建過(guò)程包括數(shù)據(jù)采集、隱式反饋數(shù)據(jù)指標(biāo)選取與閱讀興趣度量化三個(gè)環(huán)節(jié)。
(1)數(shù)據(jù)采集
兒童在閱讀過(guò)程中生成的閱讀行為數(shù)據(jù)(如點(diǎn)擊開(kāi)始閱讀、收藏行為、分享行為等)能夠更加準(zhǔn)確地反映其閱讀興趣,這類數(shù)據(jù)可以通過(guò)分析數(shù)字閱讀APP的日志數(shù)據(jù)獲取。此外,在兒童數(shù)字閱讀過(guò)程中,系統(tǒng)自動(dòng)采集的數(shù)據(jù)還包括兒童的基本信息(如姓名、性別、所在年級(jí)等)以及數(shù)字化圖書(shū)的基本信息(如圖書(shū)名稱、主題、頁(yè)數(shù)等)。
數(shù)字化圖書(shū)是集文本、圖像、音頻、視頻和交互等多種信息于一體的多媒體讀物[10]。由于兒童的自主學(xué)習(xí)能力尚未發(fā)展成熟,在數(shù)字閱讀過(guò)程中容易被無(wú)關(guān)信息吸引[11],存在短暫離開(kāi)、盲目翻頁(yè)、誤操作等行為,因此需要對(duì)采集的數(shù)據(jù)進(jìn)行清洗,并在此基礎(chǔ)上選取有代表性的數(shù)字閱讀行為數(shù)據(jù)指標(biāo),以保證推薦結(jié)果的準(zhǔn)確性。
(2)隱式反饋數(shù)據(jù)指標(biāo)選取
隱式反饋數(shù)據(jù)是在用戶沒(méi)有察覺(jué)的情況下自動(dòng)收集的用戶偏好信息,受用戶主觀影響小且數(shù)據(jù)量大。本研究參考隱式反饋行為分類框架[12]并借鑒相關(guān)研究成果,從采集并清洗后的數(shù)字閱讀行為數(shù)據(jù)中選取能夠反映兒童閱讀興趣的隱式反饋數(shù)據(jù)指標(biāo)。
隱式反饋行為分類框架將用戶閱讀文檔過(guò)程中與文檔、視頻等對(duì)象的交互方式歸納為四類(包括檢查、保留、參考和注釋),每類行為包含若干行為亞類[13]。Kelly等[14]在此基礎(chǔ)上新增了“創(chuàng)建”行為,并在原框架“檢查”行為中增加了滾動(dòng)、查找、查詢和瀏覽等行為亞類。本研究聚焦檢查(瀏覽)與創(chuàng)建兩類兒童在數(shù)字閱讀過(guò)程中經(jīng)常出現(xiàn)的行為構(gòu)建兒童數(shù)字閱讀興趣模型,通過(guò)瀏覽行為可以了解兒童是否開(kāi)始閱讀數(shù)字化圖書(shū)、是否完整閱讀、完整閱讀的次數(shù)以及閱讀數(shù)字化圖書(shū)過(guò)程中頁(yè)面的停留時(shí)間等,創(chuàng)建行為則關(guān)注兒童在閱讀數(shù)字化圖書(shū)過(guò)程中是否錄音或上傳作品。此外,封面點(diǎn)擊次數(shù)、分享對(duì)于預(yù)測(cè)電子書(shū)的受歡迎程度也起到重要作用[15][16],其中分享有助于激勵(lì)學(xué)生持續(xù)參與學(xué)習(xí)活動(dòng)[17],為此需要關(guān)注兒童在數(shù)字閱讀過(guò)程中的分享行為,如向朋友推送內(nèi)容。最后,項(xiàng)目流行度偏差也是研究者構(gòu)建用戶興趣度模型時(shí)考慮較多的因素[18],在構(gòu)建兒童數(shù)字閱讀興趣模型的過(guò)程中,同樣存在熱門圖書(shū)導(dǎo)致閱讀興趣相似度過(guò)大的問(wèn)題,需要引入項(xiàng)目流行度權(quán)重因子(圖書(shū)熱門程度),降低熱門圖書(shū)對(duì)兒童閱讀興趣計(jì)算的影響,提高推薦的精準(zhǔn)度。
綜上,本研究選取8個(gè)隱式反饋數(shù)據(jù)指標(biāo)構(gòu)建兒童數(shù)字閱讀興趣模型,具體如表1所示。其中,C1~C5直接從用戶行為日志中獲取,C6~C8需進(jìn)一步分析得到,取值范圍與權(quán)重將在下文具體闡述。
表1 隱式反饋數(shù)據(jù)指標(biāo)的類型、取值與權(quán)重
(3)閱讀興趣度量化
由于不同行為或相同行為在不同情境下能夠表征的用戶興趣度不同[19],因此在選定表1所示的數(shù)據(jù)指標(biāo)后,本研究采用加權(quán)統(tǒng)計(jì)方法對(duì)兒童數(shù)字閱讀興趣進(jìn)行量化,如公式(1)所示。
①A6:完整閱讀次數(shù)。完整閱讀次數(shù)是預(yù)測(cè)電子書(shū)受歡迎程度的重要數(shù)據(jù)之一[20]。本研究通過(guò)對(duì)已采集數(shù)據(jù)的觀察與分析,發(fā)現(xiàn)兒童對(duì)不同數(shù)字化圖書(shū)的完整閱讀次數(shù)集中在1~9次。因此,本研究將完整閱讀次數(shù)不足2次的賦值為0,在2~9次之間的依次賦值為1~4,超過(guò)9次以上的賦值為5。
②A7:頁(yè)面停留時(shí)間。由于篇幅較長(zhǎng)的圖書(shū)需要的閱讀時(shí)間較長(zhǎng),加上不同兒童之間的閱讀風(fēng)格與閱讀速度等存在較大差異,因此本研究關(guān)注某圖書(shū)每一頁(yè)的平均停留時(shí)間,并將兒童閱讀數(shù)字化圖書(shū)的平均頁(yè)面停留時(shí)間T與兒童閱讀所有數(shù)字化圖書(shū)的平均頁(yè)面停留時(shí)間T進(jìn)行比較,以量化該指標(biāo)。當(dāng)T小于T時(shí),賦值為0;當(dāng)T大于或等于T時(shí),賦值為1。
③A8:圖書(shū)熱門程度。通過(guò)對(duì)已采集數(shù)據(jù)的分析,本研究將所有數(shù)字化圖書(shū)中完整閱讀次數(shù)位于前15%的定義為熱門圖書(shū),其余為非熱門圖書(shū)。通過(guò)“是否完整閱讀”“是否為熱門圖書(shū)”兩個(gè)因素,將圖書(shū)熱門程度量化為0~3四個(gè)水平。其中,0表示“未完整閱讀/熱門”,1表示“未完整閱讀/非熱門”,2表示“完整閱讀/熱門”,3表示“完整閱讀/非熱門”,以此提升非熱門圖書(shū)在兒童數(shù)字閱讀興趣計(jì)算中的影響。
個(gè)性化推薦算法的選擇需要考慮推薦內(nèi)容和用戶特征。由于數(shù)字化圖書(shū)的文本、圖片、聲音等內(nèi)容特征提取難度較大,因此本研究選用不依賴內(nèi)容屬性的協(xié)同過(guò)濾推薦算法進(jìn)行數(shù)字化圖書(shū)推薦??紤]到兒童閱讀興趣隨著時(shí)間推移與智力發(fā)展而改變[21],本研究在傳統(tǒng)協(xié)同過(guò)濾算法的基礎(chǔ)上,引入時(shí)間衰減函數(shù),構(gòu)成時(shí)間依賴的協(xié)同過(guò)濾算法,捕捉兒童閱讀興趣隨時(shí)間產(chǎn)生的變化。
(1)時(shí)間衰減函數(shù)
由于兒童的閱讀興趣在短時(shí)間內(nèi)相對(duì)穩(wěn)定,而在一個(gè)階段內(nèi)時(shí)間的變化是非線性的,因此本研究借鑒牛頓冷卻定律,將兒童對(duì)某本數(shù)字化圖書(shū)的閱讀興趣看作一個(gè)服從指數(shù)衰減的自然冷卻過(guò)程,可以表示為。其中,是閱讀興趣關(guān)于時(shí)間的函數(shù),表示興趣變化的速率,表示最低基礎(chǔ)興趣值,表示閱讀興趣與最低基礎(chǔ)興趣值的差值(正值),常數(shù)表示最低基礎(chǔ)興趣值與興趣變化速率之間的比例關(guān)系,負(fù)號(hào)表示興趣衰減。
當(dāng)時(shí),得到閱讀興趣的表達(dá)式為)e,e表示和時(shí)間有關(guān)的閱讀興趣衰減函數(shù)。本研究采用的時(shí)間衰減函數(shù)如公式(2)所示,其中t表示兒童對(duì)數(shù)字化圖書(shū)產(chǎn)生閱讀行為的時(shí)間;是時(shí)間衰減因子,其取值根據(jù)實(shí)際需要而定——取值越大,代表閱讀興趣衰減速度越快。
(2)時(shí)間依賴的協(xié)同過(guò)濾算法
為增加近期閱讀行為的影響力,本研究在傳統(tǒng)協(xié)同過(guò)濾算法的計(jì)算與預(yù)測(cè)相似度環(huán)節(jié)中加入時(shí)間衰減函數(shù)。融合時(shí)間衰減函數(shù)的協(xié)同過(guò)濾算法的實(shí)現(xiàn)步驟如下:
①構(gòu)建兒童-圖書(shū)興趣度矩陣。首先應(yīng)用公式(1),對(duì)兒童已經(jīng)閱讀的數(shù)字化圖書(shū)的興趣度進(jìn)行量化。然后將兒童數(shù)字閱讀興趣模型映射為“兒童(U)-圖書(shū)(I)”興趣度(S)矩陣,S表示兒童對(duì)數(shù)字化圖書(shū)的閱讀興趣度。
③預(yù)測(cè)兒童的閱讀興趣度。首先,從目標(biāo)兒童的前個(gè)相似鄰居閱讀過(guò)的數(shù)字化圖書(shū)集合中找出目標(biāo)兒童沒(méi)有讀過(guò)的數(shù)字化圖書(shū)集合,形成待推薦列表。然后,預(yù)測(cè)目標(biāo)兒童對(duì)待推薦列表中數(shù)字化圖書(shū)的興趣度,引入時(shí)間衰減函數(shù)的計(jì)算如公式(4)所示。其中,表示兒童對(duì)數(shù)字化圖書(shū)的預(yù)測(cè)興趣度,表示兒童與相似鄰居集合中第個(gè)兒童的相似度,S表示第個(gè)兒童對(duì)數(shù)字化圖書(shū)的閱讀興趣度,表示兒童的相似鄰居集合,表示喜歡數(shù)字化圖書(shū)的兒童集合;t表示推薦的當(dāng)前時(shí)間,t表示兒童對(duì)數(shù)字化圖書(shū)產(chǎn)生閱讀操作的時(shí)間。
④形成數(shù)字化圖書(shū)推薦列表。將目標(biāo)兒童對(duì)數(shù)字化圖書(shū)的預(yù)測(cè)興趣度按降序排列,并將兒童所在年級(jí)作為篩選條件,選擇預(yù)測(cè)興趣度高的前本數(shù)字化圖書(shū)作為目標(biāo)兒童的推薦結(jié)果。
本研究團(tuán)隊(duì)在自主研發(fā)的數(shù)字閱讀行為數(shù)據(jù)可視化分析方法及系統(tǒng)(EreadingAD)中實(shí)現(xiàn)了基于隱式反饋的兒童數(shù)字閱讀個(gè)性化推薦服務(wù)功能。EreadingAD能夠從采集的原始數(shù)字閱讀行為數(shù)據(jù)集中提取有用信息,并對(duì)提取的信息進(jìn)行深入挖掘分析,最后將挖掘分析的結(jié)果通過(guò)可視化模塊呈現(xiàn)給學(xué)生、家長(zhǎng)與教師等用戶[22]。表1中的C1~C5五類數(shù)據(jù)來(lái)源于一款教育類兒童數(shù)字閱讀APP“WaWaYaYa+愛(ài)讀”自動(dòng)采集的行為數(shù)據(jù),然后由EreadingAD按照?qǐng)D1隱式反饋數(shù)據(jù)指標(biāo)的類型提取得到,C6~C8三類數(shù)據(jù)則由EreadingAD進(jìn)一步計(jì)算得到。此外,EreadingAD實(shí)現(xiàn)了上文所述的個(gè)性化推薦算法,能夠讓兒童得到所需的數(shù)字化圖書(shū)推薦書(shū)單。
為了解兒童對(duì)推薦書(shū)單的滿意度,本研究以廣州市天河區(qū)S小學(xué)的39名二年級(jí)學(xué)生為研究對(duì)象,在二年級(jí)暑假“數(shù)字閱讀活動(dòng)”(為期一個(gè)月)期間對(duì)其開(kāi)展調(diào)查與訪談。在此之前,這些學(xué)生已經(jīng)連續(xù)參與了一年級(jí)寒假、一年級(jí)暑假、二年級(jí)寒假三次“寒/暑假數(shù)字閱讀活動(dòng)”。每一次活動(dòng)期間,學(xué)生均需在“WaWaYaYa+愛(ài)讀”上自主完成50本數(shù)字化圖書(shū)的閱讀任務(wù)并參加教師組織的“讀圖書(shū)創(chuàng)編故事”“推薦喜愛(ài)的圖書(shū)”等閱讀活動(dòng)。
EreadingAD基于前三次活動(dòng)的閱讀數(shù)據(jù),預(yù)測(cè)這些二年級(jí)學(xué)生的數(shù)字閱讀興趣,并選取推薦結(jié)果的前20本數(shù)字化圖書(shū)形成進(jìn)行推薦書(shū)單。推薦書(shū)單以閱讀記錄卡的形式發(fā)放給學(xué)生,學(xué)生在“WaWaYaYa+愛(ài)讀”中閱讀數(shù)字化圖書(shū)并在閱讀記錄卡中填寫自己對(duì)推薦圖書(shū)的閱讀時(shí)長(zhǎng)、閱讀方式(家長(zhǎng)陪讀/自己讀)、是否完成閱讀、喜歡程度以及感知難易度等。其中,喜歡程度與感知難易度采用五級(jí)量表的形式評(píng)分,即1~5分別表示“非常不喜歡/非常難”“不喜歡/比較難”“一般”“喜歡/容易”“非常喜歡/非常容易”。結(jié)合學(xué)生閱讀記錄卡的填寫情況,研究人員對(duì)未完成閱讀或者不喜歡EreadingAD推薦的數(shù)字化圖書(shū)的兒童進(jìn)行訪談。閱讀記錄卡以紙質(zhì)方式發(fā)放,共計(jì)發(fā)放39份,回收有效記錄卡32份,有效回收率為82.05%。
(1)學(xué)生對(duì)已推薦的數(shù)字化圖書(shū)的喜歡程度分析
研究結(jié)果顯示,學(xué)生對(duì)推薦的20本數(shù)字化圖書(shū)的平均閱讀量為17.3本,對(duì)已閱讀的數(shù)字化圖書(shū)的喜愛(ài)程度均值為4.01,介于4(喜歡)與5(非常喜歡)之間。由此表明,學(xué)生對(duì)推薦的數(shù)字化圖書(shū)的整體喜歡程度較高。本研究對(duì)11.35%選擇“不喜歡”或“很不喜歡”推薦的數(shù)字化圖書(shū)的學(xué)生進(jìn)行訪談,發(fā)現(xiàn)學(xué)生“不喜歡”的原因主要有兩點(diǎn):①圖書(shū)內(nèi)容多少不統(tǒng)一。推薦書(shū)單中的部分圖書(shū)內(nèi)容較少,難以讓學(xué)生獲得閱讀的滿足感;部分圖書(shū)內(nèi)容較多,學(xué)生在閱讀過(guò)程中容易失去耐心。②圖書(shū)難度不統(tǒng)一。部分圖書(shū)內(nèi)容簡(jiǎn)單、難度小,學(xué)生閱讀缺乏挑戰(zhàn)性;部分圖書(shū)內(nèi)容難度大,學(xué)生難以堅(jiān)持閱讀。由于缺少數(shù)字化圖書(shū)語(yǔ)言難度及思想深度的相關(guān)信息,學(xué)生閱讀推薦書(shū)單的滿足感也會(huì)受到影響,因此未來(lái)需要在分析數(shù)字化圖書(shū)內(nèi)容的基礎(chǔ)上進(jìn)一步優(yōu)化數(shù)字閱讀興趣模型。
(2)學(xué)生對(duì)已推薦的數(shù)字化圖書(shū)的感知難易度分析
難度適宜的圖書(shū)能夠激發(fā)學(xué)生的閱讀興趣。研究結(jié)果顯示,學(xué)生對(duì)閱讀記錄卡中推薦的數(shù)字化圖書(shū)的感知難易度均值為4.1,介于4(容易)與5(非常容易)之間。由此表明,學(xué)生認(rèn)為閱讀記錄卡中推薦的數(shù)字化圖書(shū)大多數(shù)比較容易閱讀。盡管在形成推薦書(shū)單時(shí),本研究已經(jīng)根據(jù)兒童所在年級(jí)對(duì)推薦的數(shù)字化圖書(shū)進(jìn)行了篩選,但相同階段兒童的閱讀能力發(fā)展存在一定差異。未來(lái)可以增加兒童閱讀能力測(cè)評(píng)模塊,以更加準(zhǔn)確地獲取兒童的閱讀能力水平,從閱讀興趣和閱讀能力兩個(gè)方面為兒童推薦更加適合的數(shù)字化圖書(shū)。
(3)未完成推薦書(shū)單閱讀的原因分析
本研究對(duì)閱讀記錄卡完成率低于50%的學(xué)生進(jìn)行訪談,發(fā)現(xiàn)影響兒童閱讀推薦數(shù)字化圖書(shū)的原因主要是:家長(zhǎng)限制兒童使用電子設(shè)備閱讀數(shù)字化圖書(shū)的時(shí)間,大部分兒童每天的數(shù)字閱讀時(shí)長(zhǎng)約為30~60分鐘。盡管沒(méi)有研究表明近視是由數(shù)字閱讀引起的,但家長(zhǎng)認(rèn)為長(zhǎng)時(shí)間使用電子設(shè)備進(jìn)行閱讀,容易對(duì)孩子的視力造成損害。由此表明,數(shù)字閱讀活動(dòng)的開(kāi)展需要家校配合。另外,如何在有限的數(shù)字閱讀時(shí)間內(nèi)減少兒童查找圖書(shū)、盲目翻頁(yè)等數(shù)字閱讀行為,提升數(shù)字閱讀服務(wù)的精準(zhǔn)性,是未來(lái)需要持續(xù)關(guān)注的問(wèn)題。
在數(shù)字化圖書(shū)資源隨處可見(jiàn)但是家長(zhǎng)限制兒童使用電子設(shè)備時(shí)間的條件下,如何準(zhǔn)確了解兒童數(shù)字閱讀興趣的變化,并為兒童提供個(gè)性化閱讀推送服務(wù),是面向兒童的數(shù)字閱讀的研究熱點(diǎn)。本研究基于隱式反饋數(shù)據(jù)構(gòu)建兒童數(shù)字閱讀興趣模型,采用時(shí)間依賴的協(xié)同過(guò)濾算法實(shí)現(xiàn)了兒童數(shù)字閱讀個(gè)性化推薦服務(wù),并通過(guò)應(yīng)用實(shí)踐驗(yàn)證了該服務(wù)的有效性,對(duì)教師引導(dǎo)下的兒童個(gè)性化閱讀活動(dòng)開(kāi)展具有指導(dǎo)意義。然而,本研究還存在數(shù)字化圖書(shū)內(nèi)容數(shù)據(jù)采集不夠全面、實(shí)踐應(yīng)用的樣本數(shù)量相對(duì)較少等問(wèn)題。對(duì)此,后續(xù)研究將在豐富數(shù)字化圖書(shū)內(nèi)容數(shù)據(jù)與引入閱讀能力測(cè)評(píng)數(shù)據(jù)的基礎(chǔ)上,進(jìn)一步優(yōu)化兒童數(shù)字閱讀興趣模型,為兒童提供更加精準(zhǔn)的數(shù)字化圖書(shū)推薦服務(wù)。此外,后續(xù)研究還將擴(kuò)大實(shí)踐應(yīng)用的樣本數(shù)量并結(jié)合兒童數(shù)字閱讀APP記錄的閱讀行為數(shù)據(jù),來(lái)進(jìn)一步驗(yàn)證數(shù)字化圖書(shū)推薦服務(wù)的有效性。
[1]國(guó)家新聞出版廣電總局.全民閱讀“十三五”時(shí)期發(fā)展規(guī)劃[OL].
[2]汪全莉,陳邦.英語(yǔ)國(guó)家兒童及家庭閱讀現(xiàn)狀與啟示——解讀《兒童及家庭閱讀報(bào)告》[J].圖書(shū)館雜志,2019,(3):39-44.
[3]Krapp A. Interest, motivation and learning: An educational-psychological perspective[J]. European Journal of Psychology of Education, 1999,(1):23-40.
[4]Hidi S. Interest, reading, and learning: Theoretical and practical considerations[J]. Educational Psychology Review, 2001,13:191-209.
[5]樊敏生,武法提,王瑜.數(shù)字閱讀:電子書(shū)對(duì)小學(xué)生語(yǔ)文閱讀能力的影響[J].電化教育研究,2016,(12):106-110、128.
[6]Hwang G J, Tu N T, Wang X M. Creating interactive e-books through learning by design: The impacts of guided peer-feedback on students’ learning achievements and project outcomes in science courses[J]. Educational Technology & Society, 2018,(1):25-36.
[7]Goldberg D, Nichols D A, Oki B, et al. Using collaborative filtering to weave an information tapestry[J]. Communications of the ACM, 1992,(12):61-71.
[8]王佑鎂,宛平,南希烜,等.走向數(shù)字閱讀3.0:智能閱讀的特征,應(yīng)用與發(fā)展[J].現(xiàn)代遠(yuǎn)程教育研究,2021,(5):26-32.
[9]葉加加,趙逢禹.基于興趣預(yù)測(cè)和熱點(diǎn)分析的聯(lián)合推薦算法研究[J].軟件導(dǎo)刊,2016,(9):25-28.
[10]Reed H C, Hurks P P M, Kirschner P A, et al. Preschoolers’ causal reasoning during shared picture book storytelling: A cross-case comparison descriptive study[J]. Journal of Research in Childhood Education, 2015,29:367-389.
[11]Kavanagh L. Relations between children’s reading motivation, activity and performance at the end of primary school[J]. Journal of Research in Reading, 2019,(3-4):562-582.
[12][13]Oard D W, Kim J. Modeling information content using observable behavior[OL].
[14]Kelly D, Teevan J. Implicit feedback for inferring user preference: A bibliography[J]. ACM SIGIR Forum, 2003,(2):18-28.
[15]Nú?ez-Valdez E R, David Q, Ruben G C, et al. A recommender system based on implicit feedback for selective dissemination of ebooks[J]. Information Sciences, 2018,467:87-98.
[16]Nú?ez-Valdez E R, Lovelle J M C, Martinez O S, et al. Implicit feedback techniques on recommender systems applied to electronic books[J]. Computers in Human Behavior, 2012,(4):1186-1193.
[17]Naghdipour B, Eldridge N H. Incorporating social networking sites into traditional pedagogy: A case of facebook[J]. TechTrends, 2016, 60:591-597.
[18]魏甜甜,陳莉,范婷婷,等.結(jié)合項(xiàng)目流行度加權(quán)的協(xié)同過(guò)濾推薦算法[J].計(jì)算機(jī)應(yīng)用研究,2020,(3):676-679.
[19]石宇,胡昌平,時(shí)穎惠.個(gè)性化推薦中基于認(rèn)知的用戶興趣建模研究[J].情報(bào)科學(xué),2019,(6):37-41.
[20]Crespo R G, Martinez O S, Lovelle J, et al. Recommendation system based on user interaction data applied to intelligent electronic books[J]. Computers in Human Behavior, 2011,(4):1445-1449.
[21]Stauffer S M. Developing children’s interest in reading[J]. Library Trends, 2007,(2):402-422.
[22]王冬青,韓后,凌海燕.一種數(shù)字閱讀行為數(shù)據(jù)可視化分析方法及系統(tǒng)[P].中國(guó)專利:202010122594.9,2020-6-30.
Design and Application of Personalized Recommendation Service for Children’s Digital Reading
HAN Hou1YIN Hong-yan2WANG Dong-qing3
With the popularization and application of intelligent terminals and the development of the digital publishing industry, digital reading has become an important way for children to read. In the limited digital reading time, how to push suitable books for children is a common concern for parents, teachers, and researchers. However, at present, most of the current digital reading applications of recommendation service for children’s digital reading is based on reading ability or subject, and there are some problems such as single recommendation result and no consideration of children’s reading interest over time. Based on this, the paper firstly analyzed the characteristics of children’s digital and constructed a children’s digital reading interest model based on implicit feedback. Then, a time-dependent collaborative filtering algorithm was adopted to realize a personalized recommendation service fochildren’s digital reading. Finally,F(xiàn)inally, the validity of this service was verified by “winter/summer reading activities”. Through research, the paper aimed to provide a solution for personalized recommendation of children’s digital reading, promote digital reading towards intelligent reading.
implicit feedback; children’s reading interest; digital reading; personalized recommendation
G40-057
A
1009—8097(2023)12—0111—08
10.3969/j.issn.1009-8097.2023.12.011
本文為教育部人文社會(huì)科學(xué)研究青年基金項(xiàng)目“‘互聯(lián)網(wǎng)+’模式下兒童數(shù)字閱讀行為數(shù)據(jù)的分析設(shè)計(jì)與應(yīng)用”(項(xiàng)目編號(hào):17YJC880032)的階段性研究成果。
韓后,講師,博士,研究方向?yàn)閿?shù)字閱讀行為數(shù)據(jù)分析,郵箱為hanhou99@qq.com。
2023年6月6日
編輯:小時(shí)