邵景波++胡名葉++許萬有
摘要:本研究從在線評論的情感屬性出發(fā)探索在線評論文本特征的動態(tài)變化走勢,借鑒已有的情感分析框架,選取文本的主客觀性、文本的情感極性和文本的情感強度三個維度,并從評論內容和標題文本兩個角度提出研究假設。實證分析階段,通過編寫java程序采集京東網(wǎng)站上iPhone 4手機的評論數(shù)據(jù),利用逐步回歸分析法對在線評論情感屬性變量進行模型擬合,跟蹤消費者在線評論內容的情感變化,結果顯示評論內容的情感屬性在三個維度上均存在動態(tài)變化特征,而標題文本的情感屬性沒有穩(wěn)定的變化。研究結果豐富和完善了情感分析理論,對企業(yè)把握用戶消費習慣以及有效管理在線評論提供了決策依據(jù)。
關鍵詞:在線評論;情感分析;情感極性;情感強度
中圖分類號:F713.55文獻標識碼:A文章編號:1003-5192(2016)05-0009-07doi:10.11847/fj.35.5.9
1引言
在線評論(online reviews)是消費者在網(wǎng)絡平臺上發(fā)表的,對某種商品或服務進行評價的信息。通過在線評論,消費者可以更好地獲取商品質量信息、評估商家信譽。根據(jù)eMarketer的調查,92%的消費者購買商品前會閱讀在線評論,消費領域67%的銷售額受到在線評論的影響[1]。在線評論已成為消費者口碑傳播的重要形式,同時也是商家預測未來銷售收入的重要依據(jù)[2]。
已有的研究基本包含了在線評論的所有信息要素,如評論者特征、評論數(shù)量、評論評分以及評論文本等。其中,評分與評論文本直觀反映了消費者的態(tài)度與情感,對企業(yè)而言應用價值更大。一般情況下,評分被設置為1星到5星五個等級,5星評分代表最好評,1星代表最差評,而3星評分被認為是中性評價,評分越高對消費者購買可能性的正向影響越大,但商品類型對該影響程度存在調節(jié)作用[3]。也有學者關注于在線評分的分布規(guī)律,Clemons等[4]認為評分成正態(tài)分布,Hu等[5]則認為評分成J型分布,即多數(shù)為5星和少數(shù)為1星,中間評分幾乎沒有。雖然學者們針對評分進行了廣泛的探討,但對于評分的研究只是關注于評分數(shù)值的統(tǒng)計特性,大量隱含在非結構化信息中的文本特征仍未得到充分的挖掘和利用。隨著文本挖掘技術的發(fā)展,研究者對評論內容的分析不斷深入。Cao等[6]利用文本挖掘技術,研究了評論的文體特征和語義特征對在線評論有用性投票的影響,發(fā)現(xiàn)語義特征的影響最大。Ghose和Ipeirotis[7]也做了類似的研究,發(fā)現(xiàn)評論的主觀性、可讀性對評論有用性和產(chǎn)品銷量有著顯著影響。除了對評論文本特征的研究,越來越多的學者對文本情感分析(sentiment analysis)表現(xiàn)出極大的興趣。Liu[8]將電影評論褒貶性加入票房收入的預測模型大大提高了結果的精確度。Hu等[5]發(fā)現(xiàn)評論文本的情感屬性可以顯著影響消費者對商家的感知信任和所支付的價格溢價。
然而,這些研究大多是基于截面數(shù)據(jù)在靜態(tài)層面上進行的,基于面板數(shù)據(jù)在動態(tài)層面上探討消費者對在線評論的接受、感知進而影響購買決策的研究還很缺乏。Godes和Silva[9]以亞馬遜網(wǎng)站為例探索數(shù)字評分的變化規(guī)律,發(fā)現(xiàn)評分存在下降趨勢,他們從消費者的自我選擇和自我激勵角度對該變化進行了解釋。但消費者更關注評論的文本內容而不僅僅依賴簡單的數(shù)字評分,文本內容是影響消費者選擇的重要因素[10],僅從數(shù)字評分的角度探索在線評論的動態(tài)變化,不利于有效識別和刻畫在時間推移過程中在線評論動態(tài)變化形成的真正原因,關注文本特征也許更有利于揭示真相。然而在線評論的文本具有多方面的特征,如文本結構、句子長度、情感屬性等,鑒于文本情感屬性能直觀反映消費者對企業(yè)、品牌和產(chǎn)品的態(tài)度,表達了消費者的心聲,無論正面還是負面的口碑都會在網(wǎng)絡平臺上病毒式傳播,對企業(yè)的經(jīng)營活動產(chǎn)生更大的影響[11]。因此本文基于已有的研究成果,從在線評論的情感屬性入手,探究在線評論文本情感屬性的動態(tài)變化,以幫助企業(yè)把握在線評論情感屬性的時間序列特征,指導企業(yè)有效管理在線評論,從而更好地了解消費者購買的心理、行為和習慣。
2理論基礎
文本情感分析也稱為意見挖掘(opinion mining),是指利用自然語言處理或機器學習等技術判別文本的觀點[12]?,F(xiàn)有文獻中對于情感分析的維度還沒有統(tǒng)一的觀點,已有的情感分析維度包括主客觀分類、褒貶分類[13],還有少數(shù)研究更細化地分出喜怒哀樂等[14]。王洪偉等[15]總結前人研究成果,將文本情感分析系統(tǒng)性地概括為文本主客觀分析、情感極性分析和情感強度分析三個維度,較為清晰地勾勒了文本情感分析的理論框架,本文也將沿用此觀點,從這三個維度分析在線評論文本情感屬性的動態(tài)變化。
2.1文本的主客觀分析
主觀文本是指評論者發(fā)表的表達消費者個人情感、偏好的文字??陀^文本是評論者對客觀事實的描述,不包含個人情感和偏見[16]。如關于手機的在線評論中:“電池待機時間長”是客觀性文本,“這是我用過的最漂亮的手機”屬于主觀性文本。Bruce和Wiebe是最早對主客觀文本分類進行研究的學者[17],但他們使用的主觀表達式密度變量及概率方法僅適用于英文。葉強等在中文語境下提出根據(jù)連續(xù)雙詞詞類組合模式自動判別句子主觀性程度的方法,其實驗表明當閾值為0.12時,主觀文本的分類查準率達到76%[18],但仍低于英文90%左右的精度。這主要由于影響中文文本主客觀判斷的因素遠遠比英文多而復雜,除了詞義、詞性之外,詞語的用法也會影響到文本的主客觀性,所以,大多數(shù)中文主客觀分析的研究多采用人為標注的方式。此外,借鑒Ghose和Ipeirotis[7]選擇平均值和標準差對評論文本特征進行研究的做法,本研究將考察評論文本的平均主觀性傾向和評論文本的主客觀混雜度兩個指標的變化趨勢。
2.2文本的情感極性分析
文本情感極性分析就是識別主觀文本的情感是正面的贊賞和肯定,還是負面的批評與否定。目前的研究主要集中在情感極性的分類方法上,且以英文文本為樣本的研究居多。Turney[19]提出PMI-SO語義分類方法,通過計算從評論文本中提取出的所有情感詞組的平均語義傾向性來區(qū)分情感極性。而Dave等[20]則通過對語料中的每個詞打分,計算評論文本中所有詞的得分總和,以判斷觀點的情感極性。在中文情感極性分析方面,金聰和金平[21]將Turney的PMI-SO方法應用到對中文語料的情感判斷上,同時用典型文檔的語義傾向值的平均值代替零值作為正負情感的分類界限,改善了分類效果。
2.3文本的情感強度分析
文本情感強度是指評論者表達對產(chǎn)品或服務的喜愛或厭惡的強烈程度,一般通過帶有強烈感情色彩的形容詞或者副詞表現(xiàn),如“很”、“非?!钡取G楦袕姸雀叩脑诰€評論會對消費者產(chǎn)生較大的心理震撼,影響購買決策;Thelwall等[22]將文本情感強度分成強烈貶抑、一般貶抑、客觀、一般褒揚、強烈褒揚五個類別,并采用LSPM模型對語句的五類情感強度進行了計算,遺憾的是,此方法得到的結果忽略了情感的漸變過程,造成訓練模型不夠準確,影響了分類精度。Zhang等[23]在判斷中文文本情感強度時提出了一種方法,即以一定標準為詞匯賦值:正向情感詞賦值+1分,負向情感詞賦值-1分,有否定詞修飾的詞匯賦值-1分;并由三位對評論內容較熟悉的人員對評論文本的情感強度進行人工打分,最后通過取平均值獲得情感值,該方法對中文文本情感強度的判別更加準確,但工作量很大??傮w而言,相對于文本情感極性的研究,有關情感強度的研究相對薄弱,仍缺乏堅實的語言學與心理學基礎,對文本情感強度判別的準確性有待提高。
3理論分析與假設提出
3.1評論內容主客觀性的動態(tài)變化分析
主觀性文本表達的是說話者對某人、某物或某事的態(tài)度和看法,包含個人的主觀情感色彩。與之相對應的客觀性文本則描述客觀存在的事實,說話者往往持有中立和客觀的情感。從產(chǎn)品生命周期的角度分析,產(chǎn)品進入市場初期,廣告宣傳和品牌營銷活動較多,消費者對產(chǎn)品具有新鮮好奇之感,對產(chǎn)品功能屬性了解不深,在線發(fā)表的評論內容傾向于主觀描述,評論文本的平均主觀性較強[24]。隨著時間的推移,消費者對產(chǎn)品的了解加深,對產(chǎn)品的熱情逐漸下降[25],評論的平均主觀性降低,逐漸傾向于客觀性描述。
同時,評論者在生成在線評論時,會希望自己的評論引起后續(xù)消費者的關注,更愿意發(fā)表對其他消費者有用性高的評論內容。由于主客觀文本同時存在的評論內容會給人以更為全面和客觀的感覺,消費者對主客觀混雜度高的評論內容感知有用性更高[26]。此外,消費者發(fā)表評論時會受到先前評論者觀點的影響,產(chǎn)生與之相似的評論內容,但這種相似性會隨著時間與評論數(shù)量的增加逐漸減弱[9]。因此,消費者在參照先前評論者觀點的過程中,逐漸傾向于貢獻感知有用性高且區(qū)別于先前評論內容的觀點。由此,提出假設:
H1a評論內容的平均主觀性傾向與評論發(fā)表時間呈負相關關系。
H1b評論內容的平均主客觀混雜度與評論發(fā)表時間呈正相關關系。
3.2評論內容情感極性的動態(tài)變化分析
當評論者喜愛某種產(chǎn)品時,其評論內容較為正面;反之,其評論內容趨向于負面。消費者在處理產(chǎn)品信息的時候會產(chǎn)生“負面偏差”效應,負面產(chǎn)品信息和正面產(chǎn)品信息在影響消費者的滿意度、產(chǎn)品情感和重購意愿時是不對稱的,負面信息的負向影響要大于正面信息的正向影響[27]。消費者在選擇商品時也更傾向于重視負面評論,認為其效用比正面評論更大。因此,如果消費者希望自己的評論信息能引起別人的關注,就可能對負面評論有一定傾向,以發(fā)表對其他人影響效用大的評論,和區(qū)別于先前評論信息的言論[28]。因此,隨著時間的推移,消費者后續(xù)的評論信息會更傾向于負面評論,由此,提出假設:
H2評論內容的平均正向情感極性與評論發(fā)表的時間呈負相關關系。
3.3評論內容情感強度的動態(tài)變化分析
評論者在發(fā)表評論時,必然體現(xiàn)出個人情感,無論是正向情感還是負向情感,評論者表達的強烈程度會有所差別。從產(chǎn)品生命周期的角度分析,產(chǎn)品剛進入市場時,購買產(chǎn)品的消費者進行評價的熱情較高,但由于他們對產(chǎn)品的功能屬性還不夠熟悉,評論內容表現(xiàn)出較強的主觀性,同時早期購買者對品牌的忠實和喜愛程度較高[23],更容易發(fā)表帶有極端感情色彩的觀點,造成評論情感強度較大;隨著時間的推移,消費者對產(chǎn)品的了解加深,評論觀點逐漸傾向于客觀理性,情感強度激烈的表述慢慢減少[26],評論內容的情感強度會減弱。由此,提出假設:
H3評論內容的平均情感強度與評論發(fā)表時間呈負相關關系。
3.4標題文本情感屬性的動態(tài)變化分析
在線評論的文本由評論內容和標題文本組成。標題文本濃縮了評論者對產(chǎn)品最主要的態(tài)度。已有的研究中,評論標題并未被列為評論文本來加以考察[7],而新聞學研究領域的學者證實,標題影響了讀者的閱讀選擇,如果標題沒有吸引力,不能反映明確、具體的觀點,讀者不會繼續(xù)瀏覽新聞稿件的內容[29]。評論標題影響著評論內容被閱讀并產(chǎn)生影響的可能性,從而影響著消費者對評論有用性的評價?;谝陨贤评?,本研究認為,隨著時間推移,標題文本情感屬性特征與評論內容情感屬性特征的變化一致。同時由于標題文本通常有字數(shù)限制,消費者會使用一個或多個關鍵詞的組合作為標題,導致無法判斷標題文本的主客觀性,因此,對于標題文本的情感屬性只考慮情感極性和情感強度兩個維度。由此,提出假設:
H4a標題文本的平均正向情感極性與評論發(fā)表時間呈負相關關系。
H4b標題文本的平均情感強度與評論發(fā)表時間呈負相關關系。
基于以上分析,構建本研究的理論分析框架(如圖1)。
4模型擬合與結果分析
4.1數(shù)據(jù)的收集
本研究選取京東網(wǎng)站中關于iPhone 4手機的在線評論作為研究對象。通過編寫java程序抓取iPhone 4手機銷售頁面上的所有在線評論,共收集到9355條數(shù)據(jù)。由于京東網(wǎng)站在2013年4月對評論頁面格式進行過調整,調整前的評論內容的字段分類更為詳細,因此考慮到數(shù)據(jù)處理的便利性和一致性,選取2013年4月18號以前的評論內容進行研究,共計4456條評論,數(shù)據(jù)信息包括評論者ID、評論時間、總體印象、優(yōu)點、不足、使用心得、星級評分和產(chǎn)品鏈接8個字段。
研究采用回歸模型驗證假設,表1對模型所涉及的變量進行了解釋說明。網(wǎng)絡購物中多數(shù)消費者不會閱讀完所有評論,有學者調查發(fā)現(xiàn),消費者平均閱讀的數(shù)量一般不超過20條[30]。鑒于此,本研究將每20條評論作為劃分單位,將原始數(shù)據(jù)按照時間順序分成223組,形成序數(shù)為1-223號的編組數(shù)據(jù),由此可以計算因變量lnt(在線評論序數(shù)的自然對數(shù)值)。
4.2文本識別方法
通常評論文本的識別采用Lingpipe文本分析軟件,但由于中文表達與英文相比更加復雜,如相同的詞語在不同情境下表達的意思會有所差別,而Lingpipe文本分析軟件無法識別語境的變化,影響了詞語分類的準確率;相比而言,人工打分的方法能夠更準確靈活地識別中文在線評論的情感屬性。因此,本研究選擇人工打分的方式對文本進行識別,同時為了控制打分者情緒因素的影響,每條評論都由3位打分者獨立判定給出分數(shù),對差異較大的內容再次討論確定最終分數(shù)。文本主客觀性的賦值方法設定為主觀性文本賦值為1,客觀性文本賦值為0;通過正面詞匯數(shù)目(a)與負面詞匯數(shù)目(b)相減后確定文本的情感極性值為(a-b);文本情感強度的賦值方法為極端性詞匯賦值為1,中性詞匯為0。最終可以計算出223組在線評論情感屬性相關變量的數(shù)值。
4.3基于逐步回歸法的模型擬合
本研究的目標是準確識別在線評論文本情感屬性動態(tài)變化的維度與特征,要求模型中保留的解釋變量必須是重要的且不存在多重共線性。而逐步回歸法在擬合變量間關系、篩除非關聯(lián)性因素方面具有明顯的優(yōu)勢,同時又可以解決變量間多重共線性的問題。該方法的基本思想是,將變量逐個引入模型,當原來引入的解釋變量由于后面解釋變量的引入變得不再顯著時,將其刪除,反復試驗直到既沒有顯著的解釋變量進入回歸方程,也沒有不顯著的解釋變量從回歸方程中剔除為止,以保證最后的模型擬合結果是最優(yōu)的。因此,在模型擬合的過程中,通過逐步回歸法進入模型的解釋變量即是對因變量影響關鍵且顯著的因素,而沒有進入的解釋變量即是對因變量影響不顯著的因素。
利用SPSS 17.0統(tǒng)計軟件對數(shù)據(jù)進行處理。X5和X6的相關系數(shù)為0.731,說明這兩個變量存在多重共線性。逐步回歸分析結果如表2和表3所示,其中,表2反映了模型的擬合效果,R2值越接近于1,說明模型的擬合效果越好。因此,回歸模型4的擬合效果最優(yōu),進入最終模型的變量有:X1(評論內容的平均主觀性傾向)、X2(評論內容的主客觀混雜度)、X3(評論內容的平均正向情感極性)和X4(評論內容的平均情感強度),且這4個變量均通過顯著性檢驗。而變量X5(標題文本的平均正向情感極性)和X6(標題文本的平均情感強度)則沒有進入模型。
因此,在線評論情感屬性的動態(tài)變化規(guī)律可以(1)式描述。
lnt=7.969-1.322X1t+2.086X2t-0.753X3t-0.766X4t(1)
4.4結果分析
根據(jù)表3的逐步回歸結果可以看出,關于評論內容情感屬性的4個假設得到驗證,而關于評論標題文本的情感屬性的2個假設被拒絕。下面分別對假設驗證結果進行詳細分析。
X1的系數(shù)是-1.322,sig.<0.001,結果顯著,H1a假設通過,即評論內容的平均主觀性傾向與評論發(fā)表時間呈負相關關系。隨著時間的推移,評論內容逐漸趨于客觀,說明評論者對產(chǎn)品的總體印象從先前的心理感知、主觀意向逐步向對產(chǎn)品的功能屬性、客觀評價轉變。產(chǎn)品在投入市場初期和成長期,消費者對產(chǎn)品的喜愛更多的是心理上的感知,對其客觀屬性并不熟悉,因而主觀性評價較多,隨著產(chǎn)品趨于成熟期,其缺點逐漸被消費者感知到,消費者通過產(chǎn)品體驗和閱讀以前的評論,了解了更多的產(chǎn)品客觀信息,使得評價逐漸趨于客觀化。
X2的系數(shù)是2.086,sig.<0.001,結果顯著,H1b假設通過,即評論內容的主客觀混雜度與評論發(fā)表時間呈正相關關系。為了提高在線口碑對他人的影響力,購買iPhone 4手機的消費者會傾向于發(fā)表區(qū)別于先前購買者并對后續(xù)消費者感知有用性高的的評論觀點,即主客觀混雜度高的在線評論。消費者的這種心理使得評論內容的平均主客觀混雜度隨著時間的推移逐漸增高。
X3的系數(shù)是-0.753,sig.<0.001,結果顯著,H2假設通過,即評論內容的平均正向情感傾向與評論發(fā)表時間呈負相關關系。眾所周知,iPhone 4手機的問世開創(chuàng)了智能手機的先河,與傳統(tǒng)手機完全封閉的操作系統(tǒng)不同,智能手機通過生動的用戶交互界面和先進的多點觸控技術為用戶帶來了前所未有的便利體驗。因此,當iPhone 4手機剛進入市場時,受到了消費者的瘋狂追捧,評論中對產(chǎn)品優(yōu)點的評價非常多。隨著產(chǎn)品逐漸進入成熟期,消費者對iPhone 4手機的各項功能屬性越來越熟悉,消費者的需求更加明確,評論內容中出現(xiàn)較多的產(chǎn)品不足和改進建議。此外,隨著競爭廠商的加入,消費者在高端智能手機領域可選擇的種類增多,消費者會通過對比不同品牌的產(chǎn)品逐漸發(fā)現(xiàn)產(chǎn)品需要改進的方面,評論中關于產(chǎn)品缺點的屬性詞出現(xiàn)的頻率增多。由此使得評論內容的平均正向情感傾向隨著時間推移呈現(xiàn)下降的趨勢。
X4的系數(shù)是-0.766,sig.<0.01,結果顯著,H3假設通過,即評論內容的平均情感強度與評論發(fā)表時間呈負相關關系。情感強度反映了評論者對產(chǎn)品的極端感情傾向。iPhone 4手機是蘋果品牌的主打產(chǎn)品,消費者熱愛并推崇蘋果品牌,使得初期的評論者觀點中帶有極端感情色彩的較多,隨著產(chǎn)品進入成熟期以及競爭對手的出現(xiàn),使得后續(xù)評論者對產(chǎn)品的熱度降低,評論者趨于理性,評論內容中的極端感情色彩詞語逐漸減少。
X5和X6沒有進入逐步回歸模型,說明標題文本的平均正向情感極性和平均情感強度對因變量影響不顯著,即假設H4a和H4b均沒有通過。說明標題文本的情感屬性在時間序列上沒有穩(wěn)定的變化特征。導致這一現(xiàn)象的原因可能是評論者的語言總結能力參差不齊,存在標題文本與評論內容信息不一致的現(xiàn)象,在數(shù)據(jù)收集和整理過程中還發(fā)現(xiàn),有些標題文本與評論內容完全沒有相關性。
5討論
研究結果顯示,在線評論的情感屬性具有明顯的動態(tài)變化特征,并且在不同維度上存在差異:隨著時間的推移,評論內容的平均主觀性傾向、平均正向情感極性和平均情感強度呈下降趨勢,評論內容的主客觀混雜度呈上升趨勢;而標題文本的情感屬性特征不存在明顯的變化趨勢。這一結論為網(wǎng)絡營銷及在線評論研究提供了新的視角,豐富和完善了在線評論情感分析的理論。
對管理實踐而言,研究結果將對企業(yè)有效管理在線評論提供有益參考。首先,企業(yè)根據(jù)評論內容的動態(tài)變化,可以了解消費者在產(chǎn)品生命周期不同階段的心理,相應調整銷售與推廣策略。如在產(chǎn)品成熟期,消費者評論熱情降低但貢獻的評論內容主客觀混雜度增高,此時企業(yè)應采取一定激勵措施(如參與評價可提高會員等級或贈送優(yōu)惠券等)鼓勵消費者積極參與購后評論,一方面可以促進在線口碑傳播的持續(xù),另一方面可以通過更多的客觀性評價獲取產(chǎn)品優(yōu)點和不足的信息,為企業(yè)持續(xù)完善產(chǎn)品和服務提供依據(jù)。其次,企業(yè)應考慮優(yōu)化評價頁面,合并相似評論,對評論中出現(xiàn)的相同屬性詞進行統(tǒng)計并列示在顯著位置,以幫助消費者更快地獲得有用信息,提高決策效率。最后,標題文本應準確反映評論者的綜合評價,以節(jié)省閱讀者的時間和精力成本。因此,為避免標題文本的無效性,企業(yè)可以考慮采取一定的技術手段提高標題文本信息總結的準確性和清晰性,如考慮運用語義分析算法抓取評論內容的關鍵詞,自動生成標題文本,取代消費者主觀歸納的方式,避免出現(xiàn)標題文本無法反映評論內容的情況。
本研究雖然得出了一些有價值的結果和啟示,但仍存在諸多局限。首先,由于數(shù)據(jù)收集和處理的限制,僅以iPhone 4手機的在線評論為研究對象進行了實證分析,關于在線評論情感屬性動態(tài)變化的研究結果是否適用于其他類別商品或者可推廣到C2C電子商務模式,還需要進一步檢驗。其次,反映在線評論文本特征的變量有許多,本研究僅關注了情感屬性在時間序列上的變化,其他變量是否也存在某些動態(tài)變化特征有待證實。這也是本文未來的研究方向。
參考文獻:
[1]Tang T, Fang E, Wang F. Is neutral really neutral? The effects of neutral user-generated content on product sales[J]. Journal of Marketing, 2014, 78(4): 41-58.
[2]楊強,武一波,張宇.服務補救對消費者正面口碑傳播意愿的影響:品牌依戀的調節(jié)作用分析[J].預測,2015,34(4):21-26.
[3]Pan Y, Zhang J Q. Born unequal: a study of the helpfulness of user-generated product reviews[J]. Journal of Retailing, 2011, 87(4): 598-612.
[4]Clemons E K, Gao D G, Hitt L M. When online reviews meet hyper differentiation: a study of craft beer industry[J]. Journal of Marketing Research, 2006, 23(2): 149-171.
[5]Hu N, Pavlou P, Zhang J. Overcoming the J-shape distribution of product reviews[J]. Communications of the ACM, 2009, 52(10): 144-147.
[6]Cao Q, Duan W, Gan Q. Exploring determinants of voting for the “helpfulness” of online user reviews: a text mining approach[J]. Decision Support Systems, 2011, 50(2): 511-521.
[7]Ghose A, Ipeirotis P. Estimating the helpfulness and economic impact of product reviews: mining text and reviewer characteristics[J]. IEEE Transactions on Knowledge and Data Engineering, 2010, 23(10): 1498-1512.
[8]Liu Y. Word of mouth for movies: its dynamics and impact on box office revenue[J]. Journal of Marketing, 2006, 70(3): 74-89.
[9]Godes D, Silva J C. Sequential and temporal dynamics of online opinion[J]. Marketing Science, 2012, 31(3): 448-473.
[10]Chevalier J A, Mayzlin D. The effect of word of mouth on sales: online book reviews[J]. Journal of Marketing Research, 2006, 43(3): 345-354.
[11]李金海,何有世,馬云蕾.大數(shù)據(jù)時代基于在線評論挖掘的企業(yè)網(wǎng)絡口碑危機預警研究[J].情報雜志,2015,34(2):53-58.
[12]Pekar V, Ou S. Discovery of subjective evaluations of product features in hotel reviews[J]. Journal of Vacation Marketing, 2008, 14(2): 145-155.
[13]Kahn J H, Tobin R M, Massey A E. et al.. Measuring emotional expression with the Linguistic Inquiry and Word Count[J]. The American Journal of Psychology, 2007, 120(2): 263-286.
[14]樂國安,董穎紅.情緒的基本結構:爭論,應用及其前瞻[J].南開學報(哲學社會科學版),2013,(1):140-150.
[15]王洪偉,劉勰,尹裴,等.Web文本情感分類研究綜述[J].情報學報,2010,29(5):931-938.
[16]Sen S, Lerman D. Why are you telling me this? An examination into negative consumer reviews on the web[J]. Journal of Interactive Marketing, 2007, 21(4): 76-94.
[17]Bruce R F, Wiebe J M. Recognizing subjectivity: a case study in manual tagging[J]. Natural Language Engineering, 1999, 5(2): 187-205.
[18]葉強,張紫瓊,羅振雄.面向互聯(lián)網(wǎng)評論情感分析的中文主觀性自動判別方法[J].信息系統(tǒng)學報,2007,1(1):79-91.
[19]Turney P D. Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews[A]. Proceedings of the 40th Annual Meeting on Association for Computational Linguistics[C]. Association for Computational Linguistics, Stroudsburg, 2002. 417-424.
[20]Dave K, Lawrence S, Pennock D M. Mining the peanut gallery: opinion extraction and semantic classification of product reviews[A]. Proceedings of the 12th International Conference on World Wide Web[C]. ACM Association for Computing Machinery, New York, 2003. 519-528.
[21]金聰,金平.網(wǎng)絡環(huán)境下中文情感傾向的分類方法[J].語言文字應用,2008,5(2):139-144.
[22] Thelwall M, Buckley K, Paltoglou G, et al.. Sentiment strength detection in short informal text[J]. Journal of the American Society for Information Science and Technology, 2010, 61(12): 2544-2558.
[23]Zhang W, Xu H, Wan W. Weakness finder: find product weakness from Chinese reviews by using aspects based sentiment analysis[J]. Expert Systems with Applications, 2012, 39(11): 10283-10291.
[24]Li X, Hitt L M. Self-selection and information role of online product reviews[J]. Information Systems Research, 2008, 19(4): 456-474.
[25]Zhu F, Zhang X. Impact of online consumer reviews on sales: the moderating role of product and consumer characteristics[J]. Journal of Marketing, 2010, 74(2): 133-148.
[26]Wu F, Huberman B A. How public opinion forms[M]. Berlin: Springer Berlin Heidelberg, 2008. 334-341.
[27]Mittal V, Ross W T, Baldasare P M. The asymmetric impact of negative and positive attribute-level performance on overall satisfaction and repurchase intentions[J]. Journal of Marketing, 1998, 62(1): 33-47.
[28]Adava R. Sometimes it just feels right: the differential weighting of affect-consistent and affect-inconsistent product information[J]. Journal of Consumer Research, 2001, 28(1): 1-17.
[29]馬少華.從信息量的角度考察新聞評論標題[J].新聞大學,2003,(3):77-79.
[30]龔詩陽,劉霞,劉洋,等.網(wǎng)絡口碑決定產(chǎn)品命運嗎——對線上圖書評論的實證分析[J].南開管理評論,2012,(4):118-128.