霍 華 馮博琴
摘要:為進一步提高Web的檢索性能,提出了一種基于微分流型的Web檢索算法.該算法的核心思想為:用微分流型描述Web空間,用流型的切平面模擬Web的切空間,將流型上2點之間的測地線距離轉(zhuǎn)化為二維平面上點與點之間的歐氏距離,基于距離的匹配過程由原來的在整個文檔集合中進行,轉(zhuǎn)換為僅在查詢的鄰域內(nèi)進行,以減少匹配過程的計算量.實驗結(jié)果表明,該算法的查準(zhǔn)率比Google和IIT分別提高35.24%和40.93%,它更適合于大型異構(gòu)Web文檔集合的檢索.
關(guān)鍵詞:Web空間;微分流型;查準(zhǔn)率;查全率
中圖分類號:TP391文獻標(biāo)識碼:A文章編號:0253—987X(2005)02—0130—04