彭行雄+肖如良
摘 要:針對仿真生成算法采用靜態(tài)分布模型生成Web日志,會造成與真實數(shù)據(jù)之間存在較大差異的問題,提出一種基于用戶興趣遷移的Web日志仿真生成(WLSG)算法。該算法首先對Web日志與時間的關(guān)系進行了建模;其次,模擬了用戶在不同時間訪問文件時用戶的興趣遷移;最后,也模擬了用戶自適應(yīng)訪問當(dāng)前時刻最感興趣的文件。相對于現(xiàn)有的采用靜態(tài)分布模型的仿真算法,所提算法能夠提高自相似性指標(biāo)約2.86%。實驗結(jié)果表明,該算法通過用戶的興趣遷移來改變用戶的訪問序列,能夠較好地模擬真實Web日志,有效地應(yīng)用于Web日志的仿真生成。
關(guān)鍵詞:興趣遷移;時間序列;日志分析;自相似;仿真生成
中圖分類號:TP311
文獻標(biāo)志碼:A
文章編號:1001-9081(2016)12-3476-05