許鈺
摘要:為了解決多標(biāo)簽SVM主動(dòng)學(xué)習(xí)對(duì)不均衡數(shù)據(jù)集學(xué)習(xí)效率低下問題,該文提出一種基于偏側(cè)分類間隔的SVM主動(dòng)學(xué)習(xí)選擇策略,即依據(jù)當(dāng)前分類器,選擇樣本數(shù)量少,位于分類超平面一側(cè)分類間隔中間的正類樣本進(jìn)行標(biāo)記,加入訓(xùn)練集,訓(xùn)練分類器。實(shí)驗(yàn)證明在相同訓(xùn)練樣本情況下,基于偏側(cè)分類間隔的選擇策略與傳統(tǒng)的基于版本空間SVM主動(dòng)學(xué)習(xí)選擇策略相比能夠獲得更高分類精度。
關(guān)鍵詞:多標(biāo)簽SVM主動(dòng)學(xué)習(xí);不均衡數(shù)據(jù)集;偏側(cè)分類間隔;選擇策略
中圖分類號(hào):TP312 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2012)35-8349-04