楊曉娟 廖晨輝
【摘要】隨著開(kāi)放教育資源運(yùn)動(dòng)開(kāi)展與深入,在互聯(lián)網(wǎng)絡(luò)中形成開(kāi)放的、超大規(guī)模的、世界范圍內(nèi)最先進(jìn)的多媒體教育資源網(wǎng)頁(yè)集群。然而使用搜索引擎檢索的結(jié)果中存在大量的重復(fù)網(wǎng)頁(yè),導(dǎo)致資源獲取難、利用率低的問(wèn)題。文章在總結(jié)現(xiàn)有網(wǎng)頁(yè)消重方法的基礎(chǔ)上提出一種可行的兩階段的多媒體教育資源網(wǎng)頁(yè)消重方法,實(shí)驗(yàn)證明,通過(guò)對(duì)網(wǎng)頁(yè)文本信息及多媒體信息分開(kāi)消重,能有效地提高消重的效果。
【關(guān)鍵詞】開(kāi)放教育資源;基于簽名的消重方法;基于關(guān)鍵詞的消重方法;shingling算法
【中圖分類(lèi)號(hào)】G40-057【文獻(xiàn)標(biāo)識(shí)碼】A【論文編號(hào)】1009-8097(2012)09-0093-04