陳燕方 譚立輝
(華中師范大學(xué)信息管理學(xué)院,華中師范大學(xué)湖北省電子商務(wù)研究中心,湖北 武漢430079)
隨著互聯(lián)網(wǎng)和電子商務(wù)的迅速發(fā)展,在線(xiàn)商品評(píng)論開(kāi)始產(chǎn)生,消費(fèi)者可以在網(wǎng)上自由發(fā)布對(duì)已購(gòu)買(mǎi)商品的評(píng)論信息。隨著這些在線(xiàn)商品評(píng)論信息商業(yè)和公眾價(jià)值的不斷提升,同時(shí)由于存在法律的缺失以及網(wǎng)絡(luò)監(jiān)管措施的不到位和評(píng)論的非結(jié)構(gòu)化等因素,促使虛假評(píng)論開(kāi)始出現(xiàn)在人們的視野。在線(xiàn)商品虛假評(píng)論即指那些會(huì)誤導(dǎo)消費(fèi)者做出錯(cuò)誤購(gòu)買(mǎi)決策的評(píng)論,他們常常通過(guò)“喬裝掩飾”成正面有用的評(píng)論,從而誘使消費(fèi)者購(gòu)買(mǎi)過(guò)分吹捧的劣質(zhì)商品,或是阻止消費(fèi)者購(gòu)買(mǎi)蓄意詆毀的正常商品,以達(dá)到自己的非法目的。虛假評(píng)論使?jié)撛谙M(fèi)者無(wú)法做出正確的選擇,讓商家處于惡性競(jìng)爭(zhēng)的環(huán)境中,造成在線(xiàn)商品交易平臺(tái)的評(píng)論信息魚(yú)龍混雜。由此可見(jiàn),在線(xiàn)商品虛假評(píng)論信息的治理策略研究具有非常的必要性和緊迫性。
目前國(guó)內(nèi)外對(duì)于在線(xiàn)商品虛假評(píng)論治理研究中,多停留在從文本處理角度出發(fā)的虛假評(píng)論識(shí)別研究中,然而虛假評(píng)論作為一個(gè)具有極強(qiáng)主觀性的非結(jié)構(gòu)化數(shù)據(jù)文本,無(wú)論是其識(shí)別還是治理過(guò)程都需要對(duì)其整個(gè)形成過(guò)程中的行為主體、路徑節(jié)點(diǎn)有一個(gè)系統(tǒng)的研究,才能更全面地挖掘虛假評(píng)論文本的特點(diǎn)以進(jìn)一步提升識(shí)別模型的準(zhǔn)確率和計(jì)算效率,同時(shí)也使得法律監(jiān)管體制有更加明確和清晰的方針政策。因而,本文作為“在線(xiàn)商品虛假評(píng)論識(shí)別及其治理研究”課題研究成果之一,繼《在線(xiàn)商品虛假評(píng)論形成路徑研究》之后系統(tǒng)地闡述了在線(xiàn)商品虛假評(píng)論信息治理策略[1],針對(duì)當(dāng)前研究中存在的不足之處,從治理目標(biāo)的重組、治理對(duì)象的明確以及治理途徑的豐富和完善3 個(gè)方面完整地指出了在線(xiàn)商品虛假評(píng)論信息的治理策略。
在線(xiàn)商品虛假評(píng)論不僅會(huì)誤導(dǎo)消費(fèi)者做出錯(cuò)誤的購(gòu)買(mǎi)決策,引起在線(xiàn)商家之間的不正當(dāng)競(jìng)爭(zhēng),更在極大程度上降低了在線(xiàn)商品評(píng)論的可信度,給電子商務(wù)評(píng)論體系帶來(lái)了前所未有的挑戰(zhàn)。不少學(xué)者試圖從法律角度解決虛假評(píng)論、信用泛濫等問(wèn)題[2],但一味依賴(lài)法律保障并不能取得良好的預(yù)防效果,一方面這些對(duì)策建議很難立法實(shí)施;另一方面法律只能事后制裁卻很難及時(shí)預(yù)防。
由于虛假評(píng)論檢測(cè)技術(shù)已逐漸成為國(guó)內(nèi)外研究熱點(diǎn),學(xué)者們通常將虛假評(píng)論識(shí)別視為一個(gè)二分類(lèi)問(wèn)題,通過(guò)選取一定的測(cè)度指標(biāo)和測(cè)度技術(shù)來(lái)鑒別虛假評(píng)論。但當(dāng)前研究往往局限于某一商品類(lèi)型(如酒店類(lèi)[3]、圖書(shū)類(lèi)[4]),缺乏檢測(cè)通用性。同時(shí),二分類(lèi)的檢測(cè)方式難免過(guò)于武斷,評(píng)論信息主觀性強(qiáng),虛假評(píng)論者作弊手段高,評(píng)論信息難辨真?zhèn)?,任何檢測(cè)技術(shù)都很難達(dá)到100%的準(zhǔn)確率。
因此筆者認(rèn)為,要達(dá)到發(fā)現(xiàn)虛假、嚴(yán)懲虛假的目的,必須以完善的信用體系制度、健全的法律制度作為外在輔助,以高效的檢測(cè)模型作為內(nèi)在動(dòng)力才能更有效地治理虛假評(píng)論。法制監(jiān)管需要明確在線(xiàn)商品虛假評(píng)論形成過(guò)程中的各個(gè)行為主體,才能有的放矢地對(duì)其加以管制。檢測(cè)模型要采用合適的測(cè)度指標(biāo),具備一定的普適性,并將原有的二分類(lèi)識(shí)別方法進(jìn)行改進(jìn),以達(dá)到以評(píng)論可信度進(jìn)行排序的識(shí)別方法,而不是僅僅給出“真”或是“假”的判斷。
在以往對(duì)虛假評(píng)論二分類(lèi)的研究中,往往將檢測(cè)定義為虛假的評(píng)論信息直接過(guò)濾刪除,但在本文提出的以評(píng)論可信度進(jìn)行排序的檢測(cè)模型設(shè)想中,則要求按照某一規(guī)定閾值,將可信度較高的評(píng)論展現(xiàn)給用戶(hù)、而可信度較低的評(píng)論則存儲(chǔ)起來(lái),等到下一條評(píng)論進(jìn)入時(shí),再將所有評(píng)論全部調(diào)用計(jì)算。這樣就盡可能地降低由于檢測(cè)誤差而導(dǎo)致判斷失真的可能性。如:某一商家請(qǐng)大量親朋好友真實(shí)購(gòu)買(mǎi),并做出十分逼真的好評(píng),而真實(shí)的消費(fèi)者交易后給出的差評(píng)很可能會(huì)被誤判為虛假,而接下來(lái)大量的消費(fèi)者均給出差評(píng)時(shí),此時(shí)便可很快得出前面的好評(píng)都是虛假的。
虛假評(píng)論者分為正常評(píng)論者、一般虛假評(píng)論者以及職業(yè)虛假評(píng)論者。正常評(píng)論者指那些由于個(gè)人“過(guò)度完美”或“過(guò)度寬容”的評(píng)論風(fēng)格,或者當(dāng)時(shí)處于極端的情感狀態(tài),而產(chǎn)生的由過(guò)強(qiáng)主觀性導(dǎo)致的不真實(shí)評(píng)論信息。此類(lèi)評(píng)論者只能通過(guò)可信度排序盡量將其評(píng)論排后,并通過(guò)規(guī)范化評(píng)論內(nèi)容來(lái)盡量減小由個(gè)人主觀情感帶來(lái)的偏差。一般虛假評(píng)論者很可能是受到商家的利益誘使或騷擾。一方面,交易平臺(tái)需要進(jìn)一步細(xì)化交易信用規(guī)則,倘若商家銷(xiāo)售中以及旺旺聊天中頻繁出現(xiàn)“好評(píng)返利”等字樣,均將其信用度適當(dāng)降低;另一方面,消費(fèi)者需加強(qiáng)維權(quán)意識(shí),當(dāng)遇到不正當(dāng)騷擾時(shí),應(yīng)積極向平臺(tái)客服申訴。而職業(yè)虛假評(píng)論者,大多是與職業(yè)虛假評(píng)論中介相依相存的。雖然有些平臺(tái)規(guī)定將被發(fā)現(xiàn)的職業(yè)虛假評(píng)論炒作者處以封號(hào)等嚴(yán)懲[5],但在百度等網(wǎng)站仍隨處可見(jiàn)虛假評(píng)論中介的廣告宣傳。因此只有法律的明文禁止與嚴(yán)懲才能有效地杜絕職業(yè)虛假評(píng)論中介和職業(yè)虛假評(píng)論者的存在。2013 年7 月23日全國(guó)首例惡意差評(píng)師案在杭州宣判,被告楊某為首的12名“惡意差評(píng)師”團(tuán)伙被以敲詐勒索罪判刑[6],同樣,對(duì)于刷信用平臺(tái)的不正當(dāng)商業(yè)競(jìng)爭(zhēng)也亟待法律的制約。
在線(xiàn)商家的虛假炒作一直是電子商務(wù)在線(xiàn)交易平臺(tái)的頑疾,虛假方式分為正面炒作和負(fù)面炒作。正面炒作使得電子商務(wù)交易信用積累不再依靠真實(shí)的交易途徑,而是對(duì)電商長(zhǎng)期有序競(jìng)爭(zhēng)環(huán)境的破壞,已經(jīng)嚴(yán)重侵犯了電商的公平競(jìng)爭(zhēng)權(quán),長(zhǎng)此以往,必將導(dǎo)致劣幣驅(qū)逐良幣效應(yīng),最終致使市場(chǎng)失靈。而負(fù)面炒作,在主觀上帶有詆毀同行的意圖,已構(gòu)成反不正當(dāng)競(jìng)爭(zhēng)法中詆毀商譽(yù)的行為,是一種惡性的商業(yè)競(jìng)爭(zhēng)行為,應(yīng)承擔(dān)相應(yīng)的賠償責(zé)任。面對(duì)虛假炒作商家,某平臺(tái)曾多次重拳出擊,打擊方式包括:下架商品、降低商家的信用等級(jí)、查封店鋪等。但僅少量網(wǎng)站的微薄之力,很難改善整個(gè)電商的競(jìng)爭(zhēng)環(huán)境。需根據(jù)虛假炒作的特點(diǎn)有針對(duì)性地建立法律規(guī)范,完善在線(xiàn)交易信用體系。使商家的虛假炒作得到嚴(yán)懲。
在線(xiàn)商品虛假評(píng)論形成路徑的基本要素包括:在線(xiàn)銷(xiāo)售商家、虛假評(píng)論中介、消費(fèi)者以及在線(xiàn)商品交易平臺(tái)四個(gè)部分。要達(dá)到監(jiān)管和控制基本要素的目的,一方面,需要有效地利用法律力量嚴(yán)懲虛假炒作商家以及虛假評(píng)論中介,以儆效尤。必須通過(guò)宣傳教育,使消費(fèi)者加強(qiáng)維權(quán)意識(shí)。平臺(tái)需對(duì)真實(shí)客觀的評(píng)價(jià)和積極舉報(bào)揭發(fā)者給予一定的獎(jiǎng)勵(lì)。另一方面,對(duì)于在線(xiàn)商品交易平臺(tái),雖然開(kāi)放型平臺(tái)并沒(méi)有參與銷(xiāo)售,但平臺(tái)的利益仍與交易量有著直接的關(guān)系,而自營(yíng)型平臺(tái)會(huì)直接參與銷(xiāo)售盈利。因此,惟有第三方信用監(jiān)管平臺(tái)才能以一個(gè)更公正的身份,通過(guò)認(rèn)證中心(CA)向商家發(fā)放數(shù)字證書(shū),并定期對(duì)其進(jìn)行信任認(rèn)證和評(píng)級(jí),為消費(fèi)者提供一個(gè)更加真實(shí)可信的電商購(gòu)物平臺(tái)。
在線(xiàn)商品虛假評(píng)論信息的誘導(dǎo)因素主要在于交易主體具有不可見(jiàn)性以及評(píng)論內(nèi)容的主觀性。此外,現(xiàn)有信用評(píng)價(jià)體制在評(píng)價(jià)的權(quán)威性、細(xì)化度等方面的缺失也培育了虛假評(píng)論信息滋生的溫床。
一條完整的評(píng)論包含消費(fèi)者ID,消費(fèi)者信譽(yù)、評(píng)論時(shí)間、商品打分、有用性投票、評(píng)論內(nèi)容等。其中,評(píng)論內(nèi)容為自由文本(非結(jié)構(gòu)化數(shù)據(jù)),極易滋生虛假的類(lèi)似“滿(mǎn)意”、“寶貝不錯(cuò)”等空泛的評(píng)論或其他無(wú)關(guān)評(píng)論。因而,可采用半結(jié)構(gòu)化評(píng)論文本來(lái)提高制造虛假評(píng)論的時(shí)間成本和人力成本,將在一定程度上減弱虛假評(píng)論的形成。例如:根據(jù)服裝類(lèi)商品屬性,設(shè)置是否合身,是否存在色差等選項(xiàng),并通過(guò)獎(jiǎng)勵(lì)來(lái)促進(jìn)消費(fèi)者盡量完善半結(jié)構(gòu)化評(píng)論內(nèi)容,提升評(píng)論內(nèi)容的可信度。同時(shí),可在現(xiàn)有信用體系的基礎(chǔ)上,建立第三方信用評(píng)價(jià)機(jī)制,針對(duì)虛假評(píng)論產(chǎn)生的因素,增加虛假評(píng)論的發(fā)布代價(jià),使得消費(fèi)者、商家、在線(xiàn)商品交易平臺(tái)都自動(dòng)規(guī)避風(fēng)險(xiǎn),遵守信用規(guī)則。
根據(jù)目前在線(xiàn)商品評(píng)論信息的收集顯示,由于非結(jié)構(gòu)化文本對(duì)評(píng)論者沒(méi)有太多的束縛,所以大多數(shù)的正常消費(fèi)者做出的評(píng)論很多都是類(lèi)似于“很好”、 “還不錯(cuò)”、 “還行”等之類(lèi)的空泛性評(píng)論,這對(duì)潛在消費(fèi)者在購(gòu)物決策上并沒(méi)有太大的幫助。正是由于正常消費(fèi)者沒(méi)有做出中肯的評(píng)論才讓虛假評(píng)論者有機(jī)可乘,促使這些虛假評(píng)論員通過(guò)詳細(xì)的敘述商品的信息,以及商品的體驗(yàn),來(lái)誘使或者阻止消費(fèi)者做出購(gòu)買(mǎi)決策。
綜上,一方面建議商家可以通過(guò)獎(jiǎng)勵(lì)的方式來(lái)鼓勵(lì)消費(fèi)者發(fā)表包含商品信息以及體驗(yàn)商品之后的心得等方面的真實(shí)有用的評(píng)論,然后通過(guò)潛在消費(fèi)者自愿為評(píng)論者發(fā)表的評(píng)論進(jìn)行投票選擇“有用”或“無(wú)用”,最后以票數(shù)作為依據(jù),通過(guò)贈(zèng)積分、送紅包、增加會(huì)員特權(quán)等方式定期為票數(shù)高的評(píng)論者給予獎(jiǎng)勵(lì);另一方面建議電商網(wǎng)站平臺(tái)建設(shè)者構(gòu)造更具有結(jié)構(gòu)化的評(píng)論體系,以減少評(píng)論者的“惰性行為”或主觀性的影響。
虛假評(píng)論識(shí)別技術(shù)是協(xié)助法律監(jiān)管和第三方信用評(píng)定機(jī)制的一個(gè)有效工具。當(dāng)前的虛假評(píng)論檢測(cè)技術(shù)一般是建立在文本分類(lèi)的思想上進(jìn)行處理,其完整識(shí)別及驗(yàn)證過(guò)程如下:首先通過(guò)網(wǎng)絡(luò)爬蟲(chóng),獲取一定規(guī)模的數(shù)據(jù)集,并構(gòu)建適量的樣本訓(xùn)練集,然后從不同角度通過(guò)實(shí)驗(yàn)或觀察分析提取虛假評(píng)論的相關(guān)特征,并根據(jù)這些特征建立適當(dāng)?shù)臋C(jī)器學(xué)習(xí)模型(如logistic 回歸、SVM、貝葉斯等),最后用余下數(shù)據(jù)作為測(cè)試集測(cè)試模型的準(zhǔn)確率和召回率。
但在以上識(shí)別過(guò)程中,主要存在以下兩個(gè)難題:
3.4.1 樣本訓(xùn)練集獲取難
樣本訓(xùn)練集的獲取將直接影響模型驗(yàn)證的準(zhǔn)確率和召喚率。在以往的研究過(guò)程中,大多數(shù)研究者通過(guò)采用人工標(biāo)注方法進(jìn)行處理,但誤差往往較大。Liu 等[7]則通過(guò)采用杰卡德相似度比較評(píng)論內(nèi)容,檢測(cè)出重復(fù)評(píng)論,并將重復(fù)的評(píng)論作為正向的訓(xùn)練集建立logistic 回歸模型來(lái)識(shí)別虛假評(píng)論,無(wú)疑遺漏了許多非重復(fù)的虛假評(píng)論。Ott 等[8]請(qǐng)Mechanical Turk 充當(dāng)虛假評(píng)論者對(duì)20 家酒店做出虛假評(píng)論作為訓(xùn)練樣本集。由于虛假仿真度難以保證,更無(wú)法模擬出真實(shí)的網(wǎng)絡(luò)購(gòu)物評(píng)價(jià)環(huán)境,但這仍為樣本數(shù)據(jù)集的獲取提供了新思路。
3.4.2 虛假評(píng)論信息模式鑒別難
當(dāng)前研究分兩個(gè)方面:
(1)基于評(píng)論內(nèi)容的信息模式研究。包括文本相似度檢測(cè)[7],基于產(chǎn)品特征概念層重復(fù)的檢測(cè)[9],以及基于情感分析的檢測(cè)模型[10]等。
(2)基于評(píng)論者行為的識(shí)別,包括評(píng)論者的打分行為偏差[11]、評(píng)論者反常行為模式的評(píng)論模型[12]等。
以上研究以文本挖掘?yàn)榛A(chǔ),多采用自然語(yǔ)言處理技術(shù)。然而,在線(xiàn)商品評(píng)論信息屬于一個(gè)特殊的短文本信息,評(píng)論內(nèi)容有其獨(dú)特的特點(diǎn)。比如,其情感詞匯語(yǔ)料就不同于自然語(yǔ)言文本,類(lèi)似“好評(píng)”、“寶貝不錯(cuò)”的字樣都是在線(xiàn)商品評(píng)論文本獨(dú)特具備的。而消費(fèi)者的行為研究則更有待于從評(píng)論時(shí)間、評(píng)論停留時(shí)間、評(píng)論者社交網(wǎng)絡(luò)關(guān)系等方面進(jìn)行探索。因此通過(guò)優(yōu)化文本識(shí)別技術(shù)、加強(qiáng)消費(fèi)者行為研究來(lái)提高鑒別準(zhǔn)確率是迫切需要的。
本文分別從重組治理目標(biāo)、明確治理對(duì)象和完善治理途徑三方面,對(duì)在線(xiàn)商品虛假評(píng)論信息治理策略進(jìn)行了定性分析,詳細(xì)闡述了在線(xiàn)商品虛假評(píng)論信息針對(duì)不同治理對(duì)象的法律監(jiān)管制度以及今后識(shí)別模型的優(yōu)化方向,從而達(dá)到切實(shí)可行的發(fā)現(xiàn)虛假、嚴(yán)懲虛假的目的,以形成一個(gè)競(jìng)爭(zhēng)有序的電商購(gòu)物環(huán)境。而宏觀法律層面的治理策略,包括對(duì)虛假評(píng)論行為主體的監(jiān)管與懲處體系等仍有待完善。而對(duì)本文提出的優(yōu)化檢測(cè)模型策略將是課題小組下一步的研究重點(diǎn)與難點(diǎn)。
[1] 陳燕方,婁策群. 在線(xiàn)商品虛假評(píng)論形成路徑研究[J]. 現(xiàn)代情報(bào),2015,(1):49-53.
[2] 王小燕. 電子商務(wù)中的信用炒作行為法律規(guī)制研究[D]. 中國(guó)社會(huì)科學(xué)院,2013.
[3] Yoo K H,Gretzel U. Comparison of deceptive and truthful travel reviews [M] ∥Information and communication technologies in tourism 2009. Springer Vienna,2009:37-47.
[4] Hu N,Bose I,Gao Y,Liu L. Manipulation in digital word-of-mouth:A reality check for book reviews [J]. Decision Support Systems,2011,50 (3):627-635.
[5] 淘寶網(wǎng). 淘寶規(guī)則[EB/OL]. http:∥rule. taobao. com/detail-62.htm,2014-03-10.
[6] 新華網(wǎng). 首例差評(píng)師案告破[EB/OL]. http:∥news. sina.com.cn/o/2013-07-04/050927571266.shtml,2014-03-10.
[7] Jindal N,Liu B. Opinion spam and analysis [C] ∥Proceedings of the international conference on Web search and web data mining.ACM,2008:219-230.
[8] Ott M,Choi Y,Cardie C,Hancock J T. Finding deceptive opinion spam by any stretch of the imagination [J]. arXiv preprint arXiv:1107. 4557,2011.
[9] Algur S P,Patil A P,Hiremath P S,Shivashankar S. Conceptual level similarity measure based review spam detection [C] ∥Signal and Image Processing (ICSIP),2010 International Conference on. IEEE,2010:416-423.
[10] 彭慶喜,錢(qián)鐵云. 基于量化情感的網(wǎng)店垃圾評(píng)論檢測(cè)[J].山東大學(xué)學(xué)報(bào):理學(xué)版,2013,(11):7-11.
[11] Lim E P,Nguyen V A,Jindal N,Liu B,Lauw H W. Detecting product review spammers using rating behaviors [C] ∥Proceedings of the 19th ACM international conference on Information and knowledge management. ACM,2010:939-948.
[12] Jindal N,Liu B,Lim E P. Finding unusual review patterns using unexpected rules [C] ∥Proceedings of the 19th ACM international conference on Information and knowledge management.ACM,2010:1549-1552.