国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

在線評論中產(chǎn)品屬性提取研究現(xiàn)狀——基于2006—2020年CNKI文獻(xiàn)計量分析

2022-04-13 01:10:30王召義
關(guān)鍵詞:特征提取數(shù)量文獻(xiàn)

江 楠,汪 琪,王召義

在線評論中產(chǎn)品屬性提取研究現(xiàn)狀——基于2006—2020年CNKI文獻(xiàn)計量分析

江楠,汪琪,王召義

(安徽商貿(mào)職業(yè)技術(shù)學(xué)院 電子商務(wù)學(xué)院,安徽 蕪湖 241002)

采用文獻(xiàn)計量與可視化分析方法,對我國電子商務(wù)領(lǐng)域中在線評論的產(chǎn)品屬性提取進(jìn)行探索研究,總結(jié)知識結(jié)構(gòu),分析研究現(xiàn)狀,為我國未來在線評論產(chǎn)品屬性提取研究的發(fā)展提供參考依據(jù)。

屬性提?。辉诰€評論;計量分析

一、引言

隨著電子商務(wù)的快速發(fā)展,大多數(shù)消費(fèi)者都選擇更加便捷的電商購物消費(fèi)方式。消費(fèi)者在購物前會查看賣家提供的商品屬性信息,當(dāng)賣家提供的商品屬性信息吸引了消費(fèi)者后,消費(fèi)者在最終決定購買該商品前會查看歷史消費(fèi)者留下的商品評價。從評論中挖掘出備受關(guān)注的產(chǎn)品屬性信息是更好地利用這些價值的一個行之有效的方法。[1]產(chǎn)品屬性提取可以為潛在用戶提供購買決策,可以幫助商家定位市場需求,同時還有助于商業(yè)價值的發(fā)現(xiàn)。[2]有關(guān)在線評論中產(chǎn)品屬性提取的研究應(yīng)運(yùn)而生,并成為近幾年電商領(lǐng)域的研究熱點(diǎn)。

二、文獻(xiàn)綜述

國內(nèi)外對于商品特征提取的研究主要有Hu和Liu發(fā)表的文章,文中提出首先利用關(guān)聯(lián)規(guī)則挖掘提取數(shù)據(jù)以及使用修剪搜索來獲得特征對象候選集合中的真實(shí)特征對象。[3]Liu等人提出應(yīng)用于推薦系統(tǒng)的觀點(diǎn)提取和產(chǎn)品特征提取的方法[4],使用形容詞跟隨在副詞之后的關(guān)聯(lián)規(guī)則挖掘觀點(diǎn)對象,并且通過n-gram窗口圍繞觀點(diǎn)對象來提取產(chǎn)品特征對象。ZhijunYan,Meiming Xing等人提出了Page Rank算法進(jìn)行商品特征提取[5],并對該算法進(jìn)行適當(dāng)?shù)臄U(kuò)展和優(yōu)化,取得了比較好的效果。李實(shí)等基于Hu等人的研究方法并結(jié)合中文評論的語言特點(diǎn)對方法進(jìn)行了改進(jìn)[6],提出適用于中文的商品特征提取方法。史偉等將TF-IDF公式與加權(quán)方法相結(jié)合[7],并將結(jié)果按TF-IDF的計算值進(jìn)行降序排列以提取特征詞。林欽和等人運(yùn)用情感計算理論[8],挖掘商品評論信息中的商品特征及相應(yīng)的情感褒貶態(tài)度,利用依存關(guān)系找到特征—極性詞對以及程度副詞和否定詞,并提出了商品評論情感傾向程度的計算方式。劉鴻宇等基于評論詞與商品特征的依存關(guān)系[9],結(jié)合點(diǎn)互信息、名詞剪枝、結(jié)合頻度的評論詞的過濾方法提取商品特征。肖璐、陳果提出了利用詞頻過濾掉一些無用的特征的自動提取方法和用人工的手段刪除描述產(chǎn)品特征較弱的詞的人工提取相結(jié)合的方式提取特征詞。[10]

雖然學(xué)界對于產(chǎn)品屬性提取的研究時間較長,但對于產(chǎn)品屬性提取尚未形成一定的理論體系。在此背景下,對產(chǎn)品屬性提取研究進(jìn)行文獻(xiàn)計量研究,采用文獻(xiàn)計量、詞頻分析以及數(shù)據(jù)可視化等方法對有關(guān)論文分別從數(shù)據(jù)整體描述、研究內(nèi)容、關(guān)鍵詞三個方面進(jìn)行統(tǒng)計分析,有助于準(zhǔn)確把握產(chǎn)品屬性提取研究的發(fā)展路徑、揭示產(chǎn)品屬性提取研究的主要特點(diǎn)、展望產(chǎn)品屬性提取研究的未來發(fā)展方向,對未來在線評論中商品屬性提取的理論研究及實(shí)踐應(yīng)用具有一定的參考價值。

三、研究方法

(一)描述性統(tǒng)計分析

描述性分析是統(tǒng)計分析的第一個步驟,對調(diào)查所得的大量數(shù)據(jù)資料進(jìn)行初步的整理和歸納,以找出這些資料的內(nèi)在規(guī)律、集中趨勢和分散趨勢。主要借助各種數(shù)據(jù)所表示的統(tǒng)計量,如均數(shù)、百分比等,對數(shù)據(jù)進(jìn)行單因素分析。本文對于統(tǒng)計得到的文獻(xiàn)從研究論文的年度發(fā)文量、研究機(jī)構(gòu)、基金支持等方面進(jìn)行描述性統(tǒng)計分析。

(二)德爾菲法

研究內(nèi)容可以反映相關(guān)領(lǐng)域研究的熱點(diǎn)及趨勢,往往不是單一的,而是經(jīng)常與其他內(nèi)容相結(jié)合,形成完整的體系。隨著產(chǎn)品屬性提取研究的不斷深入,研究內(nèi)容也在不斷豐富,要想了解產(chǎn)品屬性提取研究的熱點(diǎn)及發(fā)展趨勢,需對現(xiàn)有文獻(xiàn)的主要研究內(nèi)容進(jìn)行分析研究。作者邀請學(xué)校及企業(yè)專家共5位,采用德爾菲法,背靠背地征詢專家意見,分析產(chǎn)品屬性提取研究的熱點(diǎn)及發(fā)展趨勢。

德爾菲法也稱專家調(diào)查法,1946年由美國Olaf Helmer和T.Gordon發(fā)明。具體做法是選取研究課題領(lǐng)域內(nèi)的專家組成專家小組,通過匿名的方式征求各專家的意見,經(jīng)過專家多次的反饋和修正,最終使得專家的意見達(dá)成一致,匯總專家綜合意見以對研究對象做出預(yù)測和評價。[11]在本文中的具體應(yīng)用步驟如下:

步驟一:向所有專家提出分析產(chǎn)品屬性提取領(lǐng)域研究的熱點(diǎn)及發(fā)展趨勢預(yù)測的問題,并附上有關(guān)問題的所有背景材料,同時請專家提出還需要什么材料,然后由專家做書面答復(fù);

步驟二:各個專家根據(jù)收到的材料提出自己的預(yù)測意見并說明自己是怎樣利用這些材料并提出預(yù)測結(jié)果的;

步驟三:將各位專家第一次判斷意見匯總,列成圖表進(jìn)行對比,再分發(fā)給各位專家,讓專家比較自己同他人的不同意見,修改自己的意見和判斷;

步驟四:將所有專家的修改意見收集起來并進(jìn)行匯總,將匯總結(jié)果再次分發(fā)給各位專家,以便做第二次修改。向?qū)<疫M(jìn)行反饋的時候,只給出各種意見,但并不說明發(fā)表各種意見的專家的具體姓名。重復(fù)進(jìn)行這一過程直到每一個專家不再改變自己的意見為止;

步驟五:對專家的意見進(jìn)行綜合處理。

(三)關(guān)鍵詞共現(xiàn)分析法

關(guān)鍵詞是對文章研究內(nèi)容及方法的概括凝練,對關(guān)鍵詞的整理分析可以從總體上反映該研究領(lǐng)域的研究內(nèi)容主要特點(diǎn)、相關(guān)研究內(nèi)容之間的內(nèi)在邏輯關(guān)系、研究主題發(fā)展變化規(guī)律及研究熱點(diǎn)問題。[12]兩個或更多個關(guān)鍵詞在同一篇文獻(xiàn)中同時出現(xiàn)時叫關(guān)鍵詞的共現(xiàn),對關(guān)鍵詞的共現(xiàn)分析可以恰當(dāng)描述某一學(xué)科領(lǐng)域內(nèi)部組成關(guān)系及其結(jié)構(gòu),揭示學(xué)科的發(fā)展動態(tài)和發(fā)展趨勢,還可以用于發(fā)現(xiàn)新的學(xué)科增長點(diǎn)和突破口。如果兩個關(guān)鍵詞同時與某關(guān)鍵詞有較強(qiáng)的共現(xiàn)關(guān)系,則這兩個關(guān)鍵詞之間也可能存在某種關(guān)聯(lián),有可能產(chǎn)生學(xué)科上的創(chuàng)新。[13]

Citespace軟件是美國德雷賽爾大學(xué)華人學(xué)者陳超美博士開發(fā)的用于計量和分析科學(xué)文獻(xiàn)數(shù)的JAVA應(yīng)用程序,可以通過一系列可視化圖譜的繪制來形成對學(xué)科演化潛在動力機(jī)制的分析和學(xué)科發(fā)展前沿的探索。[14]通過Citespace軟件對文獻(xiàn)關(guān)鍵詞進(jìn)行分析,可以得出關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)。關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)中節(jié)點(diǎn)數(shù)就是關(guān)鍵詞個數(shù),邊數(shù)就是關(guān)鍵詞之間的連線數(shù)。只要關(guān)鍵詞在同一篇文獻(xiàn)中出現(xiàn)過,兩者之間就會有一條連線。關(guān)鍵詞大小代表的是關(guān)鍵詞頻次,頻次越大,關(guān)鍵詞越大。同時Citespace軟件還可以生成時域和空間網(wǎng)絡(luò)圖,時域圖可以更好地反映研究內(nèi)容隨時間的變化特點(diǎn)。本文選擇Citespace軟件對關(guān)鍵詞進(jìn)行共現(xiàn)分析。

四、數(shù)據(jù)分析

本文將從數(shù)據(jù)整體描述、研究內(nèi)容、關(guān)鍵詞三個方面對產(chǎn)品屬性提取研究進(jìn)行分析。

(一)描述性分析

中國知網(wǎng)(CNKI)是目前國內(nèi)期刊資源最完備、更新速度最快的論文期刊數(shù)據(jù)庫,文章以被中國知網(wǎng)(CNKI)收錄的有關(guān)商品屬性提取的論文為研究對象。專家學(xué)者對于“產(chǎn)品屬性提取”字段有不同的字段表達(dá),相近詞主要包括“商品特征提取”,所以在中國知網(wǎng)(CNKI)設(shè)置“商品特征提取”并含“產(chǎn)品屬性提取”為檢索主題詞,檢索出初始文獻(xiàn)152條,剔除無關(guān)論文18篇,獲得有效論文134條。利用八爪魚軟件對文獻(xiàn)進(jìn)行清洗與挖掘,將研究論文的年度發(fā)文量、研究機(jī)構(gòu)、基金支持等信息輸入Excel進(jìn)行簡單的統(tǒng)計分析。

年度發(fā)文量可以反映專家學(xué)者對某一領(lǐng)域的研究和關(guān)注程度。如圖1所示,關(guān)于產(chǎn)品屬性提取的研究開始于2006年,2006年至2018年局部有減弱,整體呈上升趨勢,2019年和2020年文獻(xiàn)量有所下降。根據(jù)年度文獻(xiàn)量可以將研究階段分為三個階段:第一階段(2006-2010年)為起步階段,該階段為理論探索階段,文獻(xiàn)數(shù)量占總文獻(xiàn)數(shù)量的7.46%,文獻(xiàn)數(shù)量很少。第二階段(2011-2016年)為發(fā)展階段,該階段研究不斷深入,研究成果數(shù)量在快速增加,文獻(xiàn)數(shù)量占總文獻(xiàn)數(shù)量的37.3%,文獻(xiàn)數(shù)量較多。第三階段(2017-2020年)為穩(wěn)定期,該階段研究的范圍不斷擴(kuò)大,文獻(xiàn)成果呈現(xiàn)穩(wěn)定高產(chǎn)特征,文獻(xiàn)數(shù)量占總文獻(xiàn)量的53.73%。近幾年文獻(xiàn)數(shù)量的穩(wěn)定高產(chǎn)與消費(fèi)者逐漸認(rèn)識到在線商品評論中相關(guān)信息重要性有關(guān)。隨著近幾年在線商品評論數(shù)量的不斷增加,其中蘊(yùn)含的有用信息逐漸被商家、消費(fèi)者以及平臺所認(rèn)識到,而對于在線評論中產(chǎn)品屬性提取研究的重要性逐漸被專家學(xué)者們所重視,對于其相關(guān)研究也就更加深入全面。

圖1 2006—2020年研究文獻(xiàn)數(shù)量統(tǒng)計

機(jī)構(gòu)發(fā)文量是判斷該機(jī)構(gòu)在相關(guān)領(lǐng)域研究深度的重要指標(biāo)。通過對產(chǎn)品屬性提取的134篇文獻(xiàn)作者工作機(jī)構(gòu)研究,排名前三的分別是電子科技大學(xué)、大連理工大學(xué)、北京郵電大學(xué)及天津大學(xué)(北京郵電大學(xué)與天津大學(xué)并列第三)。表1為研究機(jī)構(gòu)具體發(fā)文數(shù)量(發(fā)表論文數(shù)大于或等于3),從表中可以看出發(fā)表論文數(shù)量大于或等于3的機(jī)構(gòu)為12所,共計文獻(xiàn)48篇,剩余86篇以發(fā)表量1或2篇的形式分散于其他機(jī)構(gòu),說明對于產(chǎn)品屬性提取研究相對廣泛。

表1 研究機(jī)構(gòu)發(fā)文數(shù)量統(tǒng)計結(jié)果

文獻(xiàn)基金支持狀況可以直觀反映相關(guān)部門對于該研究領(lǐng)域的重視程度。通過對產(chǎn)品屬性提取的134篇文獻(xiàn)基金支持狀況進(jìn)行分析,具體數(shù)據(jù)見表2(文獻(xiàn)數(shù)量大于等于2篇),獲得國家自然科學(xué)基金支持文獻(xiàn)數(shù)量的最多,總計27篇,占比20.15%,在支持?jǐn)?shù)量超過2篇的基金中也可以發(fā)現(xiàn)國家級基金還有另外3項,教育部基金1項,省級基金2項,說明國家層面和省部級層面對產(chǎn)品屬性提取相關(guān)領(lǐng)域重視程度較高。

表2 文獻(xiàn)基金支持統(tǒng)計結(jié)果

(二)研究內(nèi)容分析結(jié)果

對134篇文獻(xiàn)的研究內(nèi)容進(jìn)行統(tǒng)計整理,并采用德爾菲法進(jìn)行分析。根據(jù)分析結(jié)果發(fā)現(xiàn)文獻(xiàn)研究內(nèi)容主要包括四大部分,一是理論基礎(chǔ)研究,二是特征提取,三是情感分析,四是推薦系統(tǒng),每一大部分研究內(nèi)容中又包括小的研究內(nèi)容,具體研究內(nèi)容見表3。從表3中的統(tǒng)計數(shù)據(jù)可以看出,在商品屬性提取研究中,對于理論基礎(chǔ)的研究文獻(xiàn)數(shù)量并不多,大多文獻(xiàn)綜述集中于研究方法的介紹。涉及特征提取的研究文獻(xiàn)數(shù)量最多,其中,對于文本預(yù)處理以及特征詞提取與過濾的研究文獻(xiàn)數(shù)量最多,分別為65篇及37篇。對于情感分析的研究數(shù)量同樣較多,特別是情感詞典的構(gòu)建與情感極性預(yù)測,均為19篇。對于推薦系統(tǒng)的研究文獻(xiàn)數(shù)量較少,最多的部分僅為11篇。

從這些研究內(nèi)容的分布頻數(shù)來看,理論基礎(chǔ)研究并不是該領(lǐng)域的研究重點(diǎn),這與商品屬性提取研究的性質(zhì)有關(guān)。產(chǎn)品屬性提取研究側(cè)重于技術(shù)研究,更加注重研究的方式方法,所以理論基礎(chǔ)研究相對較少。涉及特征提取的文獻(xiàn)數(shù)量最多,這與特征提取是情感分析以及推薦系統(tǒng)兩部分研究內(nèi)容的必備條件有關(guān)。由于文本預(yù)處理以及特征詞提取及過濾的方法較為復(fù)雜,所以對這兩部分研究文獻(xiàn)數(shù)量較多。近幾年的特征提取研究往往與情感分析相結(jié)合,從而分析特征詞的情感極性,并應(yīng)用于特征價格研究、商家信譽(yù)維度構(gòu)建及維護(hù)、用戶推薦等方面,所以情感分析內(nèi)容以及推薦系統(tǒng)的研究在近幾年逐漸成為該領(lǐng)域的研究熱點(diǎn)問題。從所涉及相關(guān)研究內(nèi)容的文獻(xiàn)數(shù)量來看,對于情感分析的研究相對推薦系統(tǒng)來說更加廣泛與成熟。未來對于產(chǎn)品屬性提取研究的重點(diǎn)應(yīng)向推薦系統(tǒng)等實(shí)際應(yīng)用方面轉(zhuǎn)變。

表3 文獻(xiàn)研究內(nèi)容統(tǒng)計結(jié)果

(三)關(guān)鍵詞分析結(jié)果

1.關(guān)鍵詞統(tǒng)計分析

利用Citespace對134篇文獻(xiàn)的關(guān)鍵詞進(jìn)行共現(xiàn)分析,得出關(guān)鍵詞共現(xiàn)圖譜(圖2),其中,頻次排名靠前的關(guān)鍵詞為“特征提取”“情感分析”“商品評論”“在線評論”和“推薦系統(tǒng)”,可以看出特征提取、情感分析與推薦系統(tǒng)等應(yīng)用型研究是該領(lǐng)域的研究熱點(diǎn),這與前文關(guān)于研究內(nèi)容的分析結(jié)果不謀而合。通過關(guān)鍵詞之間的線性連接發(fā)現(xiàn)“特征提取”“情感分析”這兩個關(guān)鍵詞與其他關(guān)鍵詞之間的連接更為密切,是商品特征提取研究領(lǐng)域的基礎(chǔ)。通過統(tǒng)計發(fā)現(xiàn)其中出現(xiàn)頻次大于3的關(guān)鍵詞如表4所示,從這些關(guān)鍵詞中我們可以發(fā)現(xiàn),多數(shù)關(guān)鍵詞集中于研究方法的表述,表明對于產(chǎn)品屬性提取的研究內(nèi)容比較固定,但是研究方法具有多樣性特點(diǎn)。

圖2 關(guān)鍵詞共現(xiàn)圖譜

表4 關(guān)鍵詞頻次統(tǒng)計結(jié)果

2.關(guān)鍵詞演化分析

關(guān)鍵詞的演化能夠反映該領(lǐng)域研究內(nèi)容的演變過程、研究熱點(diǎn)及研究重點(diǎn),本文從關(guān)鍵詞的歷年分布情況、歷年新增熱門關(guān)鍵詞兩個方面進(jìn)行分析研究。

首先是關(guān)鍵詞的歷年分布統(tǒng)計分析,從2006年至今共獲得關(guān)鍵詞491個,歷年關(guān)鍵詞具體數(shù)量見圖3,從圖3中可以發(fā)現(xiàn),自2006年以來,關(guān)鍵詞數(shù)量總體呈上升趨勢,特別是從2015年開始關(guān)鍵詞數(shù)量快速增長,說明對于產(chǎn)品屬性提取的研究重視程度得到大幅度提升。

圖3 歷年關(guān)鍵詞數(shù)量統(tǒng)計結(jié)果

新增關(guān)鍵詞在一定程度上反映該研究領(lǐng)域新的研究主題出現(xiàn),筆者利用citespace軟件對關(guān)鍵詞進(jìn)行時區(qū)分析,得到關(guān)鍵詞時區(qū)圖譜(圖4)。從關(guān)鍵詞時區(qū)圖譜中可以看出研究熱點(diǎn)的變化情況,從最早的文本挖掘、情感分析為研究熱點(diǎn),到產(chǎn)品屬性及特征提取,一直到近兩年對于推薦系統(tǒng)以及目標(biāo)檢測的研究,反映了研究內(nèi)容的不斷深入和研究的應(yīng)用性的不斷加強(qiáng)。根據(jù)關(guān)鍵詞時區(qū)分布,本文將關(guān)鍵詞研究年份按關(guān)鍵詞增長速度劃分為2006—2014年、2015—2020年兩個階段(表5),根據(jù)表5可以看出2006—2014年出現(xiàn)頻次排名靠前的關(guān)鍵詞分別是商品評論、特征提取、文本分類、文本挖掘、語義理解和極性分析,從這些關(guān)鍵詞可以看出,在2006—2014年對于產(chǎn)品屬性提取研究的主題主要集中于對評論文本的特征提取及基礎(chǔ)分析。2015-2020年出現(xiàn)頻次排名靠前關(guān)鍵詞分別為情感分析、特征提取、在線評論、推薦系統(tǒng)、卷積神經(jīng)網(wǎng)絡(luò)、商品評論、深度學(xué)習(xí)和主題模型等,從關(guān)鍵詞分布可以看出,2015—2020年相較于2006—2014年,對于產(chǎn)品屬性提取的研究不再局限于特征提取,而是增加了情感分析、推薦系統(tǒng)這一類將文本分析運(yùn)用到實(shí)際中的研究,同時也增加了卷積神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、主題模型這一類方法研究關(guān)鍵詞,突出了現(xiàn)階段研究方法的重要性,表明對于該領(lǐng)域的研究方法在不斷更新完善。

圖4 關(guān)鍵詞時區(qū)圖譜

表5 分階段關(guān)鍵詞統(tǒng)計分析

五、研究結(jié)果與不足

(一)研究結(jié)果

論文主要通過對中國知網(wǎng)中以產(chǎn)品屬性提取為研究主題的134篇文獻(xiàn)進(jìn)行總體數(shù)據(jù)統(tǒng)計、研究內(nèi)容、研究方法以及關(guān)鍵詞四個方面進(jìn)行研究分析,得出以下四個方面的結(jié)果:

第一,在總體研究趨勢方面,通過統(tǒng)計分析得出,研究文獻(xiàn)數(shù)量在逐年增加,文獻(xiàn)基金支持狀況中國家自然科學(xué)基金數(shù)遙遙領(lǐng)先,說明對產(chǎn)品屬性提取領(lǐng)域的研究重視程度在不斷提高。通過機(jī)構(gòu)發(fā)文量研究發(fā)現(xiàn),機(jī)構(gòu)研究文獻(xiàn)數(shù)量相對比較平均,大多數(shù)機(jī)構(gòu)研究文獻(xiàn)數(shù)量僅為1篇,說明研究機(jī)構(gòu)分散,沒有代表性機(jī)構(gòu),機(jī)構(gòu)間合作性較差。在未來的研究工作中,機(jī)構(gòu)應(yīng)加強(qiáng)領(lǐng)域研究的系統(tǒng)性,充分發(fā)揮出研究機(jī)構(gòu)的研究優(yōu)勢,強(qiáng)化研究機(jī)構(gòu)之間的合作深度,使得該領(lǐng)域的研究范圍擴(kuò)大,研究深度加深。

第二,在研究內(nèi)容方面,對于產(chǎn)品屬性提取的研究內(nèi)容主要包括特征提取、情感分析以及推薦系統(tǒng)這三部分應(yīng)用型研究,理論基礎(chǔ)研究薄弱,個別理論基礎(chǔ)研究也僅限于研究方法理論,缺乏其他相關(guān)領(lǐng)域的結(jié)合,在未來的研究中產(chǎn)品屬性提取可以結(jié)合經(jīng)濟(jì)學(xué)、市場營銷和心理學(xué)等領(lǐng)域的相關(guān)理論來進(jìn)行研究,這些理論能夠為產(chǎn)品屬性提取研究提供新的視角。

第三,在關(guān)鍵詞分析方面,本文通過對歷年關(guān)鍵詞數(shù)量以及不同階段關(guān)鍵詞變化的研究清楚了解到產(chǎn)品屬性提取領(lǐng)域的研究熱點(diǎn)和研究趨勢,同時探知到這個領(lǐng)域的未來潛在研究價值點(diǎn)所在。[15]隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,產(chǎn)品屬性提取的研究主題也在不斷更新,推薦系統(tǒng),深度學(xué)習(xí)、記憶網(wǎng)絡(luò)等都是目前的研究熱點(diǎn),未來與產(chǎn)品屬性提取相關(guān)的應(yīng)用研究如屬性提取與價格、屬性提取與消費(fèi)者行為預(yù)測、屬性提取與供應(yīng)鏈管理等都將是未來研究的主題。

(二)不足

本文立足于中國知網(wǎng)(CNKI)進(jìn)行文獻(xiàn)收集,收集主題僅為“產(chǎn)品屬性提取”“商品特征提取”,收集到的數(shù)據(jù)難免不足,而且筆者在統(tǒng)計作者數(shù)據(jù)時并未將重名作者進(jìn)行處理,對研究的結(jié)果均具有一定的影響。在研究內(nèi)容方面,僅對文獻(xiàn)進(jìn)行了描述性統(tǒng)計分析以及研究內(nèi)容和關(guān)鍵詞分析,研究的全面性不夠,這些都是本文的不足之處,爭取在以后的研究過程中慢慢改進(jìn)。

[1]王浩.電子商務(wù)個性化信息推薦服務(wù)計量分析與發(fā)展對策研究[J].內(nèi)蒙古科技與經(jīng)濟(jì),2016(8):59-62.

[2]趙妍妍,秦兵,劉挺.文本情感分析綜述[J].軟件學(xué)報,2010(8):1834-1848.

[3]Hu,Liu.Mining and summarizing customer reviews[C].Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Seattle, Washington. USA, August.DBLP,2004:168-177.

[4]Liu Y, Pi D ,Cheng Q. Ensemble Kernel Method: SVM Classification Based on Game Theory[J].Journal of Systems Engineering and Electronics,2016(1):251-259.

[5]Yan Z J,Xing M M, Zhang D S.EXPRS:an extended pagerank method for product feature extraction from online consumer reviews[J].Information&management,2015(7):850-858.

[6]李實(shí),葉強(qiáng),李一軍,等.中文網(wǎng)絡(luò)客戶評論的產(chǎn)品特征挖掘方法研究[J].管理科學(xué)學(xué)報,2009(2):3016-3019.

[7]史偉,洪偉,何紹義.基于微博的產(chǎn)品評論挖掘:情感分析的方法[J].情報學(xué)報,2014(12):1311-1321.

[8]林欽和.基于情感計算的商品評論分析系統(tǒng)[J].計算機(jī)應(yīng)用于軟件,2014(12):39-44.

[9]劉鴻宇,趙妍妍,秦兵,等.評價對象抽取及其傾向性分析[J].中文信息學(xué)報,2010(1):84-88.

[10]肖璐,陳果,劉繼云.基于情感分析的企業(yè)產(chǎn)品級競爭對手識別研究——以用戶評論為數(shù)據(jù)源[J].圖書情報工作,2016(1):83-90+97.

[11]馬志翠.X學(xué)院物流管理專業(yè)大學(xué)生就業(yè)能力評價與提升研究[D].石家莊:河北科技大學(xué),2020.

[12]王楓云,韋梅.中國城市治理模式研究的文獻(xiàn)計量分析——以2002-2019年CNKI中文文獻(xiàn)為樣本[J].城市治理,2020(3):61-69.

[13]張勤,徐緒松.定性定量結(jié)合的分析方法——共詞分析法[J].技術(shù)經(jīng)濟(jì),2010(6):20-24.

[14]候劍華,胡志剛.citespace軟件應(yīng)用研究的回顧與展望[J].信息計量學(xué)研究與應(yīng)用,2013(4):99-103.

[15]李良強(qiáng),楊銳,曹云忠,等.我國涉農(nóng)電子商務(wù)研究回顧——基于CSSCI的文獻(xiàn)計量分析[J].電子科技大學(xué)學(xué)報,2018(2):24-30.

Current Status of Research on Product Attribute Extraction Among Online Reviews——Based on the bibliometric analysis of CNKI from 2006 to 2020

Jiang Nan, Wang Qi, Wang Zhaoyi

Using bibliometrics and visual analysis methods, this paper explores the product attribute extraction of online reviews in the field of e-commerce in China. Based on the research, we can summarize the knowledge structure, analyze the research status, and provide a reference for the development of China’s future online review.

Attribute extraction; Online comments; Quantitative analysis

2021-09-23

安徽省高等學(xué)校自然科學(xué)研究項目(KJ2020A1075);安徽商貿(mào)職業(yè)技術(shù)學(xué)院科研項目(2020KZZ05);安徽商貿(mào)職業(yè)技術(shù)學(xué)院學(xué)科(專業(yè))拔尖人才學(xué)術(shù)資助項目(Smbjrc202101 )

江楠(1992- ),女,安徽池州人,安徽商貿(mào)職業(yè)技術(shù)學(xué)院電子商務(wù)學(xué)院助教,碩士。

10.13685/j.cnki.abc. 000607

F724.6;F274

A

1671-9255(2022)01-0022-06

猜你喜歡
特征提取數(shù)量文獻(xiàn)
Hostile takeovers in China and Japan
速讀·下旬(2021年11期)2021-10-12 01:10:43
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
大東方(2019年12期)2019-10-20 13:12:49
統(tǒng)一數(shù)量再比較
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
Bagging RCSP腦電特征提取算法
The Role and Significant of Professional Ethics in Accounting and Auditing
商情(2017年1期)2017-03-22 16:56:36
頭發(fā)的數(shù)量
我國博物館數(shù)量達(dá)4510家
基于MED和循環(huán)域解調(diào)的多故障特征提取
塘沽区| 南澳县| 临高县| 调兵山市| 瓦房店市| 阳新县| 南华县| 宁蒗| 宽城| 兰坪| 双柏县| 宾阳县| 上思县| 胶州市| 高淳县| 余庆县| 龙游县| 贵阳市| 宜兰市| 永泰县| 平江县| 沾益县| 安新县| 偃师市| 枣阳市| 陇川县| 丰原市| 永清县| 勃利县| 淮南市| 庄河市| 梅河口市| 霍邱县| 兴化市| 洪洞县| 微山县| 阿城市| 六枝特区| 闵行区| 九龙坡区| 东至县|