国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于單層標注級聯(lián)模型的篇章情感傾向分析

2012-06-29 06:29李本陽董喜雙
中文信息學(xué)報 2012年4期
關(guān)鍵詞:級聯(lián)語料句型

李本陽,關(guān) 毅,董喜雙,李 生

(哈爾濱工業(yè)大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,黑龍江 哈爾濱 150001)

1 引言

情感分析目的是確定文本所表達的態(tài)度或觀點[1],近幾年來已經(jīng)成為信息檢索和自然語言處理領(lǐng)域的一個熱點問題。情感分析分為兩個方面: 情感(emotion)和情感傾向(sentiment/opinion)。這兩個方面都是人物主觀意愿的反映,情感表達人物自身的情緒起伏,例如,快樂、悲傷等;情感傾向則表達人物對外界事物的態(tài)度或者喜愛的程度,例如,贊成、反對等[2-3]。情感分析一般分為四個層級,即詞級,短語級,句子級和篇章級。本文是針對篇章情感傾向的研究,篇章情感傾向分為兩類: 支持和反對。

情感分析應(yīng)用十分廣泛,在輿情分析、有害信息過濾、影視評價、產(chǎn)品調(diào)查等方面都有廣闊的應(yīng)用前景,但是目前公開的情感分析語料還比較少,給研究帶來很大的困難。作者參加了中文傾向性分析評測會議2009詞級與句子級情感分析的評測,并且在句子情感分析中獲得第一名[4],但是從評測效果上看,目前情感分析還是比較初步,要使情感分析達到可應(yīng)用的程度,還有很長的路要走。

2 相關(guān)工作

2.1 情感傾向分析相關(guān)工作

國內(nèi)外許多學(xué)者對篇章情感傾向分析做了相關(guān)研究,這些研究大致可以分為三類: 情感分類方法對比研究、情感分類特征研究和其他方法。在情感分類方法對比研究方面: Pang[5]通過實驗比較了特征表示為二值或者詞頻以及分類模型選擇NB(Na?ve Bayes)、ME(Maximum Entropy)、SVM(Support Vector Machines)的效果,實驗結(jié)果表明選擇二值的特征表示和SVM分類器效果最好。唐慧豐[6]對比了n-gram作為文本特征,以互信息、信息增益、CHI統(tǒng)計量和文檔頻率作為不同的特征選擇方法,以中心向量法、KNN、Winnow、NB和SVM作為不同的文本分類方法的效果,得到的結(jié)論是,在足夠大訓(xùn)練集和選擇適當數(shù)量特征的情況下,采用Bigrams特征表示方法、信息增益特征選擇方法和SVM的情感分類取得較好的效果。徐軍[7]對詞頻和二值的特征表示、NB和ME作為分類模型在新聞情感分類的效果做了探討,結(jié)果表明使用二值的特征表示和ME做分類模型可以取得更好的效果。在情感分類特征研究方面: Matsumoto[8]在情感分類中,提出頻繁詞序列和頻繁子樹作為情感分類特征提高情感分類效果的方法。陳錦禾[9]把識別的情感詞作為情感分類的重要特征,提出了先提取情感詞,再利用情感詞分類的方法。在其他方法方面: Turney[10]提出了基于語義學(xué)信息的無監(jiān)督方法,進行篇章級情感傾向分析。Pang又在文獻[1]中提出了一種使用最小割的方法,區(qū)分情感句和非情感句,并對區(qū)分后的句子進行分析,獲得篇章的情感傾向。McDonald[11]提出了由細到粗使用結(jié)構(gòu)模型的方法對多個層級進行情感分析,取得了比任意單層情感分類更好的效果。李鈍[12]研究了基于一個或多個中心的短語模式,并通過短語模式進行情感傾向分析。

邢福義[13]在《小句中樞說》指出小句是“最小的具有表述性和獨立性的語法單位”。因此獲得小句級情感傾向?qū)τ谄虑楦袃A向分析有很大幫助。小句是指單句、復(fù)句中的分句、相當于充當句子成分的主謂短語、相當于在思維中可完形為小句的其他單位[14]。單句和復(fù)句中的分句是小句主要組成。本文經(jīng)過兩層分析獲得篇章情感傾向,即小句級和篇章級。

McDonald注意到了不同層級之間相互影響,提出了使用聯(lián)合結(jié)構(gòu)模型,對句子級和篇章級同時進行情感分析的方法,所使用的模型是Collins[15]提出的感知器模型。使用當前句、前一句子以及篇章的類別聯(lián)合作為特征,對于每個篇章類別,句子類別序列可以使用維特比進行解碼,在取得概率最大的句子類別序列的同時,也確定了篇章的類別。聯(lián)合模型使得篇章級的類別和句子類別相互影響,在兩個層級都產(chǎn)生了更好的效果,句子級的提高更明顯。

本文方法與McDonald的方法雖然都關(guān)注層次模型,但有本質(zhì)的不同。

(1) McDonald關(guān)注的是句子和篇章的相互影響,一同產(chǎn)生兩個層次的情感類別,而本文是針對篇章級的情感分析,關(guān)注的是細化到小句并融入小句信息對篇章級情感分析的提高。因此本文提出單層標注的級聯(lián)模型,只需要篇章級的標注。

(2) McDonald使用的是基于感知器的聯(lián)合結(jié)構(gòu)模型,而本文使用的是單層標注級聯(lián)模型。聯(lián)合模型使用多層的類別聯(lián)合作為特征,使特征數(shù)量激增,而單層標注級聯(lián)模型將劃分下層特征和上層特征,下層的輸出作為上層輸入,特征數(shù)量將少于聯(lián)合模型,因此在時間上比聯(lián)合模型有優(yōu)勢。

(3) 本文根據(jù)“小句中樞理論”,在模型的下層為小句,而非句子,這樣更容易加入句型等信息。同時本文引入了小句句型以及位置等信息,使得篇章級的情感傾向分析效果得到提高。

本文使用級聯(lián)模型對篇章情感傾向進行分析。首先使用ME獲得小句情感分類結(jié)果,再使用小句級分類結(jié)果與句型、句子的位置等信息相結(jié)合作為上層篇章級的輸入特征,進而用SVM模型對篇章級進行情感分類。這一方法有三個特點: 1)處理層面細化到小句,使得小句結(jié)構(gòu)更加明確;2)級聯(lián)模型使得加入句型及位置等句子信息更容易;3)本文提出的單層標注的級聯(lián)模型,克服了級聯(lián)模型對多層次分類需要每個層次的標注的問題。本文情感傾向分析方法結(jié)果準確率,由使用ME的結(jié)果0.849提高到了0.874。

2.2 相關(guān)模型簡介

2.2.1 最大熵模型

文獻[16]在1957年基于香農(nóng)信息熵理論建立了最大熵模型。信息熵代表信息系統(tǒng)的測度和可信度。在一定的限制條件下,選擇一個系統(tǒng)的最優(yōu)分布時,如果這些限制條件無法確定唯一的系統(tǒng)分布,那么最好的分布就是在滿足所有限定條件下,系統(tǒng)的信息熵最大的分布。經(jīng)過公式轉(zhuǎn)化得到式(1):

2.2.2 支持向量機模型

支持向量機模型(SVM)是基于統(tǒng)計學(xué)習(xí)理論(SLT)發(fā)展起來的通用分類模型,其核心內(nèi)容是在1995年提出的[17],目前還在不斷發(fā)展階段。較好地解決了小樣本、非線性、高維數(shù)、局部極小點等實際問題[18]。

支持向量機模型在進行分類時分兩種情況: 線性可分和線性不可分。對于線性可分的情況,尋找支持平面,并選擇最優(yōu)分類平面。最優(yōu)的分類平面就是要求分類平面不但能將兩類正確分開(訓(xùn)練錯誤率為0),而且使分類間隔最大。對于線性不可分的情況,支持向量機采用不同的核函數(shù)將其映射到高維空間成為線性可分問題,這樣就很好地解決線性不可分的問題。

3 基于單層標注級聯(lián)模型的情感分析

3.1 單層標注級聯(lián)模型

本文將篇章情感傾向分析分為兩層: 小句級和篇章級。如果使用級聯(lián)模型進行情感分析,兩個層級都使用有監(jiān)督學(xué)習(xí)模型,需要對每個層級標注。但是,大多數(shù)應(yīng)用只需要篇章一個層級的情感傾向。例如,通過電影評論獲得某部電影評價,不需要小句級的電影評價,只需對多篇評論進行情感分析就可以知道大家對這部電影的喜愛程度。如果仍然使用多層標注,就會帶來更多工作量。因此本文提出了單層標注的級聯(lián)模型,使用上一個層級篇章級的類別標注篇章內(nèi)的所有小句,再使用小句級模型對小句的傾向進行重新的預(yù)測,篇章級模型會利用小句預(yù)測結(jié)果作為輸入進行篇章分析。

圖1 級聯(lián)模型結(jié)構(gòu)圖

如圖1所示,級聯(lián)模型分為訓(xùn)練和預(yù)測兩部分。在單層標注級聯(lián)模型中,下層使用篇章類別標注的小句級訓(xùn)練語料訓(xùn)練小句級模型,再利用該模型對小句級語料進行重新預(yù)測分類。之后,使用小句級的預(yù)測結(jié)果作為上層輸入特征訓(xùn)練篇章級分類模型。為了獲得訓(xùn)練部分所有小句的預(yù)測結(jié)果,本文使用了交叉驗證方法的思想,如下所示。

input:D=d1,d2...dn;

(1) predict_all=NULL;

(2) Fold=splitFold(D,v);

(3) for i=1 to v

(4) trainClause(D-Fold[i],model);

(5) result=predictClause(Fold[i],model);

(6) predict_all+=result;

(7) endfor

(8) return predict_all。

其中,D表示篇章級訓(xùn)練語料,由篇章d1,d2...dn組成,而每個篇章由若干小句組成,predict_all保存全部訓(xùn)練語料的預(yù)測結(jié)果,F(xiàn)old保存分份后的語料結(jié)果。為了獲得訓(xùn)練數(shù)據(jù)的預(yù)測結(jié)果,交叉驗證方法首先使用將篇章級訓(xùn)練語料分成v份,i從1循環(huán)到v,做如下操作: 除了第i份以外其他部分語料作為訓(xùn)練語料,用以訓(xùn)練小句級分類模型;第i份語料作為預(yù)測部分;將分類產(chǎn)生小句預(yù)測結(jié)果保存在predict_all中。最終返回predict_all。

此處使用交叉驗證方法是為了獲得所有訓(xùn)練語料中小句預(yù)測類別。所選取的份數(shù)v同實驗中訓(xùn)練和預(yù)測所分的總份數(shù)相同,這樣盡量保持訓(xùn)練語料和預(yù)測語料小句預(yù)測結(jié)果分布是相近的。本文實驗中將v置為4,三份做訓(xùn)練一份做預(yù)測。這使得上層訓(xùn)練和預(yù)測的小句特征都是下層輸出預(yù)測類別,就解決了訓(xùn)練和預(yù)測語料上層輸入特征分布不一致以及訓(xùn)練語料上下層標注一致起不到分類作用的問題。

通過上面的過程可以看到,本文直接使用篇章級情感標注小句級的情感,然后選取部分標注小句作為訓(xùn)練語料,對另一部分小句進行預(yù)測,重復(fù)上一過程,獲得所有小句的預(yù)測結(jié)果,最終篇章級情感預(yù)測使用的是小句級的預(yù)測結(jié)果做特征。這樣就使得細化到小句的篇章情感傾向分析只需要篇章單層的標注結(jié)果。

使用篇章級的情感直接標注小句,本身是會有一些偏差的,因為在一個傾向篇章中可能含有另一個傾向的小句,實驗中發(fā)現(xiàn)經(jīng)過一次預(yù)測可以有效地糾正這種錯誤,同時被誤判的句子很多表現(xiàn)出言外的反向傾向意義,例如,“雖然房間很整潔”,這個小句更容易出現(xiàn)在反對情感的篇章中。小句標注錯誤對篇章傾向預(yù)測的影響在本文實驗中表明是有限的。

3.2 基于單層標注級聯(lián)模型的情感傾向分析方法

篇章情感傾向分析大多使用有監(jiān)督分類模型(如最大熵,支持向量機等)進行情感分類,這類方法重點是提取合適的特征,而且能夠達到較高的準確率。但是情感分類方法存在著難以細化結(jié)構(gòu)并融入結(jié)構(gòu)特征的問題。例如,在篇章情感分類中,多個詞匯出現(xiàn)的小句范圍、句子的句型和小句在篇章中的位置等信息都難以反映出來并融入模型。如果把這些信息與相應(yīng)的上下文特征聯(lián)合作為特征,會使特征空間增大,而引起上下文特征稀疏問題。然而細化篇章結(jié)構(gòu)可以使篇章的結(jié)構(gòu)更加清晰,同時更容易加入相應(yīng)的結(jié)構(gòu)特征,有助于分析整個篇章的情感傾向。本文使用單層標注級聯(lián)模型將篇章情感傾向分析細化到小句級,再由小句級結(jié)果融入更多的句子信息過渡到篇章級情感傾向分析。

如圖2所示,本文使用單層標注級聯(lián)模型進行情感傾向分析過程如下。

圖2 級聯(lián)模型情感分析過程

(1) 分句。首先根據(jù)篇章中的標點符號以及一些糾正規(guī)則將篇章級語料分解成小句。本文中劃分小句的標點符號有: “……”、“!”、“!”、“?”、“?”、“?!?、“.”、“;”、“;”、“: ”、“: ”、“,”、“,”。糾正規(guī)則包括重復(fù)標點的去除等。

(2) 小句級情感傾向分析。去掉不含有情感特征的小句,使用最大熵模型對含有特征的小句進行分類,獲得相應(yīng)的情感傾向類別。

(3) 結(jié)合句子特征。由于不同句型將會對篇章情感產(chǎn)生影響,同時小句所在位置不同對篇章情感的影響程度也不同,將小句的預(yù)測結(jié)果與小句句型、位置等特征相結(jié)合,作為上一層篇章級情感傾向分類的輸入特征。

(4) 篇章級情感傾向分析。使用支持向量機模型利用結(jié)合后的特征對篇章進行分類,得到了最終的篇章情感傾向分類結(jié)果。

本文選取情感詞等作為小句級特征對小句進行情感分類,選取句子句型、小句位置等信息與小句類別結(jié)合作為篇章級特征進行篇章級情感分類。這樣的特征結(jié)合比句型等信息和小句級特征結(jié)合更自然,同時避免了句型等信息與小句級特征相結(jié)合帶來的特征激增和小句級特征稀疏問題,使得模型訓(xùn)練和預(yù)測的時間都會減少,同時也降低了過多特征一起使用發(fā)生過擬合的可能性。

3.3 分類特征

如表1所示,本文將所有的特征分為兩類: 小句級特征和篇章級特征。在小句級,使用的是二值特征表示形式,即特征出現(xiàn)或不出現(xiàn)。在篇章級,使用特征頻率的特征表示,即不同傾向的小句分別做累計,將累計結(jié)果作為篇章傾向分析特征。

情感詞、否定詞和程度副詞作為小句級特征,這三類詞匯都是情感傾向分析重要詞匯,其中情感詞是情感分析的基礎(chǔ),分為支持和反對兩類。否定詞會改變原本所表達的情感傾向,程度副詞能改變所表達情感傾向的程度。

表1 特征

句型是一個重要特征。句型分為單句和復(fù)句,單句又分為疑問句、感嘆句等;復(fù)句又分為轉(zhuǎn)折復(fù)句、假設(shè)復(fù)句、條件復(fù)句等。句型會改變小句原來的情感傾向,因此也是情感傾向分析重要特征。本文選取了(1)轉(zhuǎn)折句_雖然(2)轉(zhuǎn)折句_雖(3)假設(shè)句_如果(4)條件句_即使這四種常用句型與小句結(jié)果聯(lián)合作為篇章級特征。這四種句型是通過相應(yīng)的關(guān)鍵詞以及標點符號進行識別的。位置信息也非常重要,通常會把篇章的總結(jié)放在開頭或結(jié)尾,因此位置也與小句結(jié)果聯(lián)合作為篇章級特征。本文將句型、位置以及小句級結(jié)果這三類結(jié)合作為特征劃分為三種,即句型和小句級輸出結(jié)果聯(lián)合作為特征,位置與和小句級輸出結(jié)果聯(lián)合作為特征,三者聯(lián)合作為特征。形式為“POSI_情感”、“SENT_情感”、“POSI_SENT_情感”,“POSI”表示小句位置,取值為(1,2,-1,-2,0),即表示是否為開頭的第1句、第2句、結(jié)尾第1句、結(jié)尾第2句或其他?!癝ENT”表示句型信息,取值為(1,2,3,4,0),分別為上述四種句型以及其他。情感表示為支持還是反對。

本文在篇章中使用的其他特征有: 小句輸出頻率值最大的類別,各小句輸出類別頻率值,句子總數(shù)。小句輸出頻率值最大的類別作為特征是因為篇章中某類別的小句越多,篇章情感傾向越可能是某類別,同時小句輸出類別頻率值本身也很重要,也作為特征使用。通常表示反對的篇章要更長一些,所以句子總數(shù)也作為情感分類特征。

4 實驗及分析

4.1 實驗

本文使用的是譚松波公開的情感分析語料。該語料是一個較大規(guī)模的酒店評論語料。語料規(guī)模為10 000篇,其中平衡語料6 000篇。在使用該語料時發(fā)現(xiàn)語料中存在部分重復(fù)的問題,因此在做實驗之前對語料進行了去重處理,在去重后的語料中隨機選取了3 000篇語料,支持和反對類別各1 500篇。把3 000篇語料隨機分成四份,三份訓(xùn)練,一份做預(yù)測。表2顯示了句型特征在語料中的統(tǒng)計結(jié)果。

表2 句型

本文基準實驗選取的是情感分類方法,該方法是目前主要的情感傾向分析方法,選取的分類模型是最大熵模型,使用的特征是情感詞、程度副詞和否定詞。本文采用的最大熵模型是實驗室開發(fā)的最大熵模型,支持向量機模型采用的是林智仁先生開發(fā)的LIBSVM。實驗結(jié)果如表3所示。

表3 實驗結(jié)果

從實驗結(jié)果可以看出: 最大熵模型作為分類模型以及情感詞、程度副詞和否定詞作為特征可以達到0.849的準確率,說明這三類詞是非常重要的特征,單獨使用即可達到較高的準確率。當使用級聯(lián)模型時,下層使用和基準實驗相同的特征,上層使用下層的輸出結(jié)果(即使用小句輸出頻率值最大的類別和各個類別的頻率值)作為特征,利用支持向量機模型進行分類,準確率提高到了0.852,說明級聯(lián)模型對比單一分類模型存在優(yōu)勢。當在上一個實驗的基礎(chǔ)上加上了句型信息和位置信息等特征時,準確率提高到了0.874,比基準實驗提高了2.53%。

4.2 分析

本文方法準確率較基準實驗有了比較大提高,作者認為主要有以下幾點原因。

(1) 細化結(jié)構(gòu)。本文將篇章劃分到小句級,并使用級聯(lián)模型對小句級和篇章級進行情感傾向分析。使得結(jié)構(gòu)更加細化,并且可以明確不同的特征所屬小句范圍以及小句的位置。這樣對于篇章情感傾向分析起到了重要作用。

(2) 兩種分類模型互補。本文在不同的層級使用了不同的分類模型: 最大熵和支持向量機。這兩種分類模型原理不同,在不同的層級用于情感傾向分析,可能會對情感傾向分析結(jié)果產(chǎn)生一些互補,而使效果有所提高。

(3) 級聯(lián)模型能融入更多的句子特征。使用級聯(lián)模型使得句子結(jié)構(gòu)得以清晰刻畫,因此句子的特征能夠更方便地融合進來。例如,句子位置、句型信息、句子數(shù)量等,這些特征對實驗結(jié)果的提高也起了很大作用。通過統(tǒng)計可以看出句型信息在實驗語料中出現(xiàn)的次數(shù)并不多,如果語料中句型信息更豐富,可能會發(fā)揮更大作用。

5 結(jié)論與展望

本文提出單層標注級聯(lián)模型對篇章情感傾向進行分析,將篇章情感傾向分析分為兩級,即小句級和篇章級。通過實驗結(jié)果可以看出,使用最大熵模型且情感詞、否定詞、程度副詞作為特征的情感分類準確率為0.849,本文方法為0.874,提高了2.53%。這表明了細化結(jié)構(gòu)到小句級對篇章級情感傾向分析是非常必要的,同時使用單層標注級聯(lián)模型進行情感分類以及句型、句子位置等句子特征是非常有效的。

在下一步的研究里,對單層標注級聯(lián)模型與多層標注級聯(lián)模型在情感分類中的分類效果,仍需要做更多對比研究,同時對于單層標注級聯(lián)模型不同層次之間的影響做進一步的探討。

另外王根、趙軍[19]和劉康、趙軍[20]利用CRFs模型在句子主客觀和褒貶分析方面做了有益的工作,由于本文側(cè)重利用小句分析提高篇章情感分析,未作對比,后續(xù)將結(jié)合CRFs模型和本文的方法進行對比研究。

致謝首先感謝中國科學(xué)院計算技術(shù)研究所的譚松波博士提供的情感分析語料,給我們的實驗帶來很大幫助,同時感謝臺灣大學(xué)林智仁先生公開了高效易用的支持向量機模型。還要向?qū)Ρ疚墓ぷ鹘o予支持的同學(xué)表示感謝,他們是呂新波、孫慧和薛璐影,以及實驗室最大熵模型的編寫者陳志杰、李赟和閻于聞。

[1] Bo Pang, Lillian Lee. A sentimental education: Sentiment analysis using subjectivity summarization based on minimum cuts [C]//Proceedings of the ACL, Barcelona, Spain: 2004, 201-208.

[2] Mike Thelwall, David Wilkinson, Sukhvinder Uppal. Data mining emotion in social network communication: Gender differences in MySpace [J]. Journal of the American Society for Information Science and Technology,2010, 1(64): 190-199.

[3] 許洪波,姚天昉,黃萱菁.第二屆中文傾向性分析評測技術(shù)報告[C]//第二屆中文傾向性分析評測.上海: 2009, 1-23.

[4] 董喜雙,關(guān)毅,李本陽.基于最大熵模型的中文詞與句情感分析研究[C]//第二屆中文傾向性分析評測.上海: 2009, 50-58.

[5] Bo Pang, Lillian Lee, Shivakumar Vaithyanathan. Thumbs up? Sentiment classification using machine learning techniques[C]//Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language processing. 2002: 79-86.

[6] 唐慧豐,譚松波,程學(xué)旗.基于監(jiān)督學(xué)習(xí)的中文情感分類技術(shù)比較研究[J].中文信息學(xué)報,2007, 21 (6): 88-94.

[7] 徐軍,丁宇新,王曉龍.使用機器學(xué)習(xí)方法進行新聞的情感自動分類[J].中文信息學(xué)報,2007,21(6): 95-100.

[8] Shotaro Matsumoto, Hiroya Takamura, Manabu Okumura. Sentiment Classification Using Word Sub- sequences and Dependency Sub-trees[C]//Proceedings of PAKDD. 2005: 301-311.

[9] 陳錦禾,范新,沈聞,等.基于情感詞識別的BBS情感分類研究[J].計算機技術(shù)與發(fā)展, 2009, 7(19): 120-123.

[10] Peter Turney. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of

reviews[C]//Proceedings of the ACL. 2002: 417-424.

[11] Ryan McDonald, Kerry Hannan, Tyler Neylon, et al. Structured Models for Fine-to-Coarse Sentiment Analysis[C]//Proceedings of the ACL. 2007: 432-439.

[12] 李鈍,曹付元,曹元大,等.基于短語模式的文本情感分類研究[J].計算機科學(xué), 2008, 4: 132-134.

[13] 邢福義.小句中樞說[J].中國語文,1995, 6.

[14] 黃忠廉.小句中樞全譯說[J].漢語學(xué)報, 2005, 2.

[15] Michael Collins. Discriminative training methods for hidden Markov models: Theory and experiments with perceptron algorithms[C]//Proceedings of EMNLP. Philadelphia, PA: 2002: 1-8.

[16] T. Jaynes. Information Theory and Statistical Mechanics [J]. Physics Reviews. 1957, 106: 620-630.

[17] C Cortes, V Vapnik. Support vector networks [J]. Machine Learning, 1995, 20: 273-297.

[18] 閻威武,邵惠鶴.支持向量機分類器在醫(yī)療診斷中的應(yīng)用研究[J].計算機仿真,2003, 20(2): 69-70.

[19] 王根,趙軍.基于多重冗余標記CRFs的句子情感分析研究[J]. 中文信息學(xué)報,2007,21(5): 51-55,86.

[20] 劉康,趙軍.基于層疊CRFs模型的句子褒貶度分析研究[J].中文信息學(xué)報,2008,22(1): 123-128.

[21] 王素格.基于Web的評論文本情感分類問題研究[D].上海: 上海大學(xué),2008.

[22] 王國勝.支持向量機的理論與算法研究[D].北京: 北京郵電大學(xué),2008.

[23] Jiang Wenbin, Huang Liang, Liu Qun, et al. A cascaded linear model for joint chinese word segmentation and part-of-speech tagging[C]//Proceedings of the ACL. 2008: 897-904.

猜你喜歡
級聯(lián)語料句型
鈾濃縮廠級聯(lián)系統(tǒng)核安全分析
基于歸一化點向互信息的低資源平行語料過濾方法*
典型句型大聚會
富集中間組分同位素的級聯(lián)
—— “T”級聯(lián)
對外漢語教學(xué)領(lǐng)域可比語料庫的構(gòu)建及應(yīng)用研究
——以“把”字句的句法語義標注及應(yīng)用研究為例
強調(diào)句型的it和引導(dǎo)詞it有什么區(qū)別?
國內(nèi)外語用學(xué)實證研究比較:語料類型與收集方法
整體級聯(lián)式增壓空氣冷卻器的進氣模塊
高中英語表示比較和對照關(guān)系的句型
異種語料融合方法: 基于統(tǒng)計的中文詞法分析應(yīng)用
朔州市| 宁南县| 北安市| 龙游县| 沧州市| 托克逊县| 措勤县| 肥城市| 开化县| 保康县| 五峰| 徐汇区| 合江县| 德令哈市| 固阳县| 清丰县| 日土县| 天水市| 苏州市| 新乡市| 商城县| 高青县| 图们市| 延吉市| 屏南县| 葫芦岛市| 吉木乃县| 镇宁| 云阳县| 上饶县| 古田县| 彰化县| 南阳市| 浦东新区| 绿春县| 玉屏| 卢湾区| 罗田县| 安义县| 南安市| 当涂县|