丁要軍 蔡皖東
摘要:針對識別加密P2P網(wǎng)絡(luò)流量比較困難的問題,提出一種基于K均值和直推式支持向量機(jī)(TSVM)的半監(jiān)督學(xué)習(xí)模型——兩階段策略模型(KTSVM,k-means based transductive supportvector machine),以提高P2P流量的識別精度.該模型首先使用K均值半監(jiān)督聚類算法計算訓(xùn)練集中正例樣本的數(shù)目,然后根據(jù)正例樣本的數(shù)目來訓(xùn)練TSVM分類模型,提高了TSVM模型的穩(wěn)定性和準(zhǔn)確性.該模型的優(yōu)勢是可以使用未標(biāo)注樣本和標(biāo)注樣本共同訓(xùn)練分類模型,非常適合于識別標(biāo)注比較困難的P2P流量.實驗結(jié)果表明,在標(biāo)注樣本較少的情況下,該模型的識別精度和穩(wěn)定性均優(yōu)于TSVM模型和SVM模型。
西安交通大學(xué)學(xué)報2012年2期