潘巍 馬培軍 李東
0引言
特征選擇在機(jī)器學(xué)習(xí)和模式識(shí)別領(lǐng)域扮演著重要的角色,可以有效降低數(shù)據(jù)存儲(chǔ)空間和分類學(xué)習(xí)的計(jì)算時(shí)間。最近十幾年,特征選擇已經(jīng)在圖像識(shí)別Ⅲ,漢字識(shí)別,基因分類等方面得到了廣泛的應(yīng)用。通常來(lái)說(shuō),可以將特征選擇方法按照其構(gòu)造的模式分為兩類:Filter模式和wrap—per模式。在wmpper模式中,特征選擇的方法主要是在特征選擇空間中對(duì)所有可能的特征子集進(jìn)行評(píng)估的一種方法,這種方法是比較費(fèi)時(shí)的。Filter模式是根據(jù)一定的評(píng)估甬?dāng)?shù)作為搜索策略,并使這個(gè)函數(shù)最大化或最小化從而選取特征子集;例如基于距離的特征評(píng)估算法,互信息方法等方法都屬于后者。