宋靜
摘要:該文將支持向量機應用到組塊識別中,并利用支持向量機算法完成了組塊識別任務。實驗結果表明支持向量機算法在組塊識別中有較好的應用。該文的研究結果可以廣泛的應用到自然語言處理領域中。
關鍵詞:支持向量機;核函數(shù);組塊識別
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2012)33-8060-03
在二十世紀九十年代支持向量機作為一種新的機器學習算法而被人們所熟識。支持向量機(SVM)是依托統(tǒng)計學習理論的基礎,根據(jù)有限的的信息條件得到較好的的結果。SVM作為統(tǒng)計學的一個新分支,仍舊有很多理論需要進一步研究探討。支持向量機算法應用十分廣泛,除了應用于模式識別等領域,也廣泛的應用在自然語言處理技術中,其作用越來與突出。
上個世紀90年代,人們開始將組塊識別應用到自然語言處理中。最初應用到英語和日語中,隨后應用到漢語等各類自然語言中作用越來越突出。
組塊分析也叫做淺層分析[1]。組塊識別的目的就是簡化句子結構,降低句法分析的復雜性。同時支持向量機還可以廣泛的應用于機器翻譯、信息檢索等領域。
1支持向量機介紹
1.1SVM的基本思想
支持向量機最早應用于二維線性可分的情況。圖1就是支持向量機的基本思想。