国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Word2vec及TF-MONO算法的中國觀眾對中外電影的需求與滿意度比較研究

2022-06-14 09:22李敏張怡王善玲
情報工程 2022年2期
關(guān)鍵詞:特征詞特征提取特征

李敏 張怡 王善玲

南京航空航天大學(xué)經(jīng)濟與管理學(xué)院 南京 211106

引言

十四五規(guī)劃提出將“文化強國”擺在重要位置,在新發(fā)展格局下,影視產(chǎn)業(yè)建設(shè)將成為下一階段我國的重中之重。近年來中外電影合作不斷加強,極大地擴大了電影市場開放程度。2012—2019年,中國電影產(chǎn)業(yè)呈螺旋式增長的態(tài)勢,這反映了我國人文藝術(shù)與技術(shù)創(chuàng)新的深度融合[1]。2020年上半年,受新冠疫情影響,北美票房遭遇近四十年新低,全球票房銳減2046億。2020年10月15日,#中國電影票房超北美成為全球第一#沖上微博熱搜。中國電影市場成為全球最熱門的電影市場。新時代背景下,人們增長起來的精神文化需求未能被充分滿足,基于娛樂和社交等的觀影需求越來越呈現(xiàn)多樣化,復(fù)雜性和不確定性等特點。

顧客滿意度測量的是消費者消費之后對于消費對象和消費過程的一般性評價[2]。當(dāng)消費者的實際消費體驗與期望一致時,他們便會產(chǎn)生這種滿意情感[3]。這種滿意情感能夠揭示顧客價值創(chuàng)造過程和傳遞方面存在的問題。Cardozo[4]對顧客滿意相關(guān)研究做出了開創(chuàng)性的貢獻之后顧客滿意便成為現(xiàn)代營銷學(xué)的中心理論之一[5],也是各種商業(yè)活動開展時關(guān)注的焦點[6]。以往關(guān)于電影觀眾滿意度的研究往往采用問卷調(diào)查[5,7-9]、深度訪談[10]等,但是問卷調(diào)查時采用的最為常見的量表不具有普適性;抽樣調(diào)查也往往會帶來抽樣偏差[11],造成左偏;深度訪談或者電話訪談的對象和準(zhǔn)實驗調(diào)查的樣本較小不具有代表性,樣本容量適中的話又產(chǎn)生了調(diào)研成本較高的問題。這些局限性是傳統(tǒng)研究方法不可避免的。電影作為一種體驗型產(chǎn)品[7],體驗構(gòu)成了消費的關(guān)鍵價值。觀影者在觀看電影這一體驗消費之后會在社交平臺上發(fā)表自己的看法。好的體驗有助于形成良好的口碑,這會對短時間內(nèi)后續(xù)票房的增長[12]、續(xù)集以及系列電影[13],甚至是電影相關(guān)衍生品[14]都有積極的影響。這些反映消費者想法的文本猶如一扇窗,讓市場營銷人員能夠挖掘出隱藏在這些文本之下的觀影者的情感[15]。UGC成為研究消費者滿意度的不可或缺的數(shù)據(jù)來源[11]。隨后,Mishra等[16]將基于文本情感分析的方法運用到電影觀眾滿意度的研究當(dāng)中,以寶萊塢電影為背景進行研究,結(jié)果發(fā)現(xiàn)愉悅、喚醒等消費者情緒是客戶滿意度的重要預(yù)測因素。隨后Yan等[17]、Tang和Yu[18]以及辛雨璇和王曉東[19]紛紛基于影評內(nèi)容進行情感傾向分析,并取得了不錯的成果,但他們并沒有很好地實現(xiàn)電影觀眾滿意度的量化。為了更好地改善顧客滿意水平,必須準(zhǔn)確的測量顧客滿意度。因此,王善玲等[20]利用句法依存的方法基于影評內(nèi)容對中國電影海外滿意度進行研究,其結(jié)果在一定程度對顧客滿意度進行了量化。

以往的研究往往致力于單一來源國電影在單一市場的績效研究,本文將補充以往研究的空白,基于影評內(nèi)容利用情感分析的方法對中國電影觀眾的觀影需求發(fā)掘到極致。為此,本文提出Word2vec模型與TF-MONO算法相結(jié)合的情感分析方法。首先利用Word2vec對影評文本進行電影特征提取,引入情感詞典對電影特征進行情感分析。而后結(jié)合TF-MONO算法識別中國觀眾的觀影需求所在,并實現(xiàn)中國觀眾對不同國家電影整體滿意度的測算。該方法的主要特點在于基于對影評大數(shù)據(jù)的挖掘和自然語言處理技術(shù)實現(xiàn)中國電影觀眾滿意度的量化,這種量化能夠發(fā)掘消費者潛在的觀影需求和滿意度,有助于中國電影工作者了解到海外電影的哪些特質(zhì)是值得我們學(xué)習(xí)的,中國電影的哪些特質(zhì)是我們的優(yōu)勢,是值得繼續(xù)發(fā)揮的。

1 理論基礎(chǔ)

1.1 基于Word2vec模型產(chǎn)品特征提取

與產(chǎn)品特征相關(guān)的文本一般都是由自然語言組成的。這些自然語言十分復(fù)雜,具有模糊性也沒有很好的定義[21]。對這些語言進行情感分析主要有兩項任務(wù),一是對其進行特征提取,二是對其進行意見傾向識別[22]。產(chǎn)品特征提取對于了解消費者需求特征十分重要。關(guān)于產(chǎn)品特征提取的方法已有很多學(xué)者對其進行了研究。Liu[23]首次使用Apriori算法從自然語言中提取產(chǎn)品特征。Popescu 和Etzioni[24]在此基礎(chǔ)上利用候選特征和產(chǎn)品類別相結(jié)合的方法改進了單獨使用Apriori算法的局限性,能夠考慮對特征詞進行修飾的形容詞對觀點的表達的影響。Quan等[25]將互信息法引入TF-IDF算法中,實現(xiàn)無監(jiān)督提取產(chǎn)品特征?;赥F-IDF算法的特征提取可以排除一些無關(guān)緊要的詞語對特征提取的影響,但它并沒有考慮文本上下文的語義關(guān)系。Zhuang等[26]在對電影評論文本進行特征提取時套用了句法依存模板,識別影評內(nèi)容的特征詞與其對應(yīng)的觀點詞兩者之間的顯式和隱式關(guān)系。彭云等[27]利用句法依存關(guān)系,將中文評論文本的語言結(jié)構(gòu)和語言特點考慮在內(nèi),將語言關(guān)系和LDA結(jié)合起來提出SRC-LDA模型用以挖掘細粒度產(chǎn)品特征詞與觀點詞的相關(guān)性。后來,王學(xué)賀和趙華[28]提出的基于Word-2vec和多分類器的影評情感分類方法,并表示W(wǎng)ord2vec可有效捕捉詞的語義,顯著提高情感分類算法的性能。

Word2vec是深度學(xué)習(xí)領(lǐng)域的一群用來產(chǎn)生詞向量的相關(guān)模型,它主要是通過映射或者變換的方法對原始特征進行降維,常用于自然語言處理。為了改善關(guān)鍵詞的抽取性能,Soujanya等[29]將詞嵌入和CNN相結(jié)合提出了基于深度學(xué)習(xí)的提取方法。文秀賢等[30]將Word2vec模型運用到產(chǎn)品特征提取中,對評論文本的關(guān)鍵詞進行向量化后引用K-means來確定商品維度,從而提高特征提取的準(zhǔn)確性。Word2vec作為一種訓(xùn)練詞向量的工具,無需進行人工標(biāo)注便可實現(xiàn)無監(jiān)督學(xué)習(xí)大量文本評論中詞語的向量表示。文本內(nèi)容經(jīng)過Word2vec的訓(xùn)練,便可以在K維向量空間中來進行向量運算。向量空間上的相似度就相當(dāng)于文本語義上的相似度[31]。

所以本文擬采用詞頻統(tǒng)計和Word2vec相結(jié)合的方法來實現(xiàn)影評特征詞提取,利用Python的gensim模塊提供的Word2vec 工具包對某一類特征詞進行訓(xùn)練①https://radimrehurek.com/gensim/models/Word2vec.html。這類特征詞經(jīng)過向量空間相似度的運算能夠拓展該特征類別下的盡可能多的特征詞。

表1展示的是gensim模塊中的部分參數(shù)表所表達的含義,其中參數(shù)表一列等號右邊表示默認值。

表1 gensim模塊部分參數(shù)表含義

1.2 TF-MONO權(quán)重計算法

術(shù)語加權(quán)法可以追溯到TF-IDF[32],該方法通過詞頻對此項進行加權(quán)。到目前為止,人們已經(jīng)提出了幾種術(shù)語加權(quán)方案用于文本分類。如TF-IDF-icf[33]、TF-RF[34]、TF-IDF- icsdf[33]和TF-IGM term[35]等。Dogan等[36]提 出TF-MONO加權(quán)策略能夠執(zhí)行類內(nèi)文檔縮放,能夠更好地區(qū)分同一數(shù)量類中不同數(shù)量文檔中出現(xiàn)的術(shù)語。經(jīng)實比較分析,TF-MONO優(yōu)于以上集中加權(quán)方法[36]。故本文將采用TF-MONO加權(quán)法對電影特征進行權(quán)重計算。

計算MOit,表示ti發(fā)生次數(shù)最多的類中的文本文檔數(shù)量與對應(yīng)類中的文本文檔總量的比值。

NOti表示未發(fā)生ti的其他類中的文本文檔數(shù)量與其他類中的文本文檔總量之間的比率。

MOti與NOti的比值乘積。乘積運算的結(jié)果被指定為ti項的局部單權(quán)重。

最后,計算ti項的全局單權(quán)重如下(公式4)。其中,α是作為平衡參數(shù)來設(shè)置權(quán)重周期內(nèi)全局權(quán)重值的范圍,取值范圍為[5,9]。

2 研究框架與研究方法

由中國觀眾的影評文本入手探索中國觀眾的觀影需求和滿意度。為此,本研究構(gòu)建基于影評內(nèi)容的中國觀眾對不同來源國(地區(qū))電影需求特征的識別與滿意度測算模型,如圖1所示。

圖1中描述了本文的研究流程,在此過程中實現(xiàn)了對中國觀眾觀影需求特征識別與滿意度的測算。

圖1 中國觀眾觀影需求特征識別與滿意度測算模型

首先利用python編寫爬蟲程序,從豆瓣上爬取影評數(shù)據(jù),然后對影評文本進行清洗、篩選、去除停用詞、分詞等預(yù)處理。第二步,利用微詞云詞頻分析軟件對上一步處理之后的影評進行詞頻統(tǒng)計,根據(jù)詞頻統(tǒng)計和特征提取結(jié)果可以識別到觀眾的感知需求所在。第三步,提取電影特征詞。利用python中g(shù)ensim模塊實現(xiàn)Word2vec來訓(xùn)練處理之后的影評詞組,提取特征類別包含的所有特征詞來完成電影特征詞典的構(gòu)建。特征評論的兩種形式分別是“特征詞+程度副詞+情感詞”和“特征詞+情感詞”[37]。所以在第四步中利用word2vec算法對第一步預(yù)處理之后的影評數(shù)據(jù)進行訓(xùn)練構(gòu)建出電影滿意度情感詞詞典,并引用馬風(fēng)才等[37]構(gòu)建的程度副詞詞典,計算出每個電影特征的情感得分。根據(jù)情感分析結(jié)果可以得到中國觀眾的觀影滿意度,我們將會了解到進口電影的哪些特質(zhì)是值得國產(chǎn)電影學(xué)習(xí)的,哪些國產(chǎn)電影的特質(zhì)是我們的優(yōu)勢,值得繼續(xù)發(fā)揮的。最后利用TF-MONO權(quán)重計算方法計算特征詞權(quán)重、識別中國觀眾感知需求。最終,根據(jù)權(quán)重計算結(jié)果來計算中國觀眾對各個來源國(地區(qū))電影的整體滿意度。

2.1 數(shù)據(jù)采集及預(yù)處理

2020年,中國電影票房超越北美票房成為全球最大的電影消費市場。因此本文致力于對中國電影觀眾的感知需求與滿意度展開研究。在藝恩票房網(wǎng)站上搜集到每一年在中國大陸上映的電影,其中數(shù)量最多的是中國本土電影、然后是美國電影、日本電影、英國以及法國電影等。英國、法國、德國、意大利這幾個國家的電影在中國熒幕上放映的數(shù)量有限,樣本較少,且該地區(qū)具有一定的文化統(tǒng)一性[38],所以本次研究將這幾個國家的電影歸類為歐洲電影展開研究。

本文利用python爬取豆瓣上2017—2020年中國大陸上映的423部電影,181部中國電影和242部外國電影的影評文本。外國電影包括163部美國電影,41部日本電影,38部歐洲電影。我們的樣本涵蓋2017—2020這四個國家(地區(qū))在中國電影市場放映的低、中、高票房電影。

其中,豆瓣影評是按照支持度(點贊率由高到低)進行排序的,因此越往前的影評越能代表大多數(shù)觀影者的看法,更符合大眾審美。所以,我們爬取每部電影的前200條影評。排除豆瓣反爬蟲影響,最終獲得共計75548條文本信息。對收集到的文本信息進行清洗、篩選、去除停用詞、分詞等預(yù)處理之后進行存儲,以備下一步特征提取使用。

2.2 中國觀眾觀影需求識別

2.2.1 基于Word2vec的電影特征提取

利用詞頻統(tǒng)計軟件將所獲得的影評數(shù)據(jù)分別按照中國、美國、日本以及歐洲四個國家(地區(qū))分類提取,進一步根據(jù)詞頻統(tǒng)計結(jié)果列出了消費者最關(guān)注的關(guān)鍵詞詞頻數(shù)據(jù)如表表2所示。中國觀眾對四個來源國(地區(qū))電影最在意的就是電影本身,電影所講述的故事、劇情,演員,導(dǎo)演,特效等。

表2 中國觀眾對四個國家(地區(qū))電影影評詞頻統(tǒng)計

由于同類特征詞還有其他表達方式,如表中的“故事”和“情節(jié)”以及“劇情”等詞表達的都是一個電影講述的內(nèi)容;特效也有“3D”“IMAX”和“場景”等說法;“演員”、“演技”也可以歸為一類…….根據(jù)以上詞頻統(tǒng)計結(jié)果我們將電影特征類別分為故事、導(dǎo)演/團隊、演員、特效、動作、角色和藝術(shù)七類。為了能夠更為全面的捕獲到觀影者影評中的特征主體,本文運用Word2vec神經(jīng)網(wǎng)絡(luò)的方法對爬取到的75548條影評進行特征提取。并根據(jù)提取結(jié)果構(gòu)建了如下電影特征詞詞典如表3所示。

表3 電影特征詞詞典

2.2.2 基于TF-MONO方法的電影特征權(quán)重計算

我們選取的國家(地區(qū))分別是中國、美國、歐洲及日本四個國家及地區(qū)電影的影評。為了使每個國家(地區(qū))影評文檔內(nèi)影評數(shù)量一致便于后續(xù)計算,我們結(jié)合表2的詞頻統(tǒng)計結(jié)果和表3電影特征詞詞典,得到特征類別在四個國家(地區(qū))影評文檔中出現(xiàn)頻數(shù)。公式1中的就代表國家(地區(qū))獲取的10000條影評中某一特征出現(xiàn)的頻數(shù)。如表4所示:

表4 特征詞類別在四個國家(地區(qū))影評文檔中出現(xiàn)頻數(shù)(每個影評文檔含有10000條影評)

利用TF-MONO權(quán)重計算方法對表4中的數(shù)據(jù)進行迭代計算。

2.3 電影特征滿意度測算

2.3.1 電影情感詞典構(gòu)建

目前,我們可獲取的且較為常用的中文情感詞典主要有知網(wǎng)HOWNET情感詞典②http://www. keenage.com/html/c_index.html、臺灣大學(xué)自然語言處理實驗室構(gòu)建的情感詞典“NTUSD”③http://nlg.csie.ntu.edu.tw和大連理工大學(xué)情感詞典[39]。這些情感詞典通用性較好,但其領(lǐng)域適應(yīng)性較差[40]。本文以知網(wǎng)HOWNET情感詞典為基礎(chǔ),運用Word2vec淺層神經(jīng)網(wǎng)絡(luò)拓展構(gòu)建了與電影產(chǎn)品相關(guān)的情感詞典,包含4761個正向詞和4549個負向詞。

2.3.2 情感程度副詞典構(gòu)建

在影評中,往往會有不同的程度副詞來對該情感詞進行修飾,如“非常”“特別”或者是“有點”“稍微”等。根據(jù)不同程度副詞表達出來的情感強烈程度進行分值區(qū)分,我們整理出來了情感程度副詞得分如表5所示。

表5 情感程度副詞計分

換言之,情感詞的正向或負向表達了影評作者的情感傾向,而修飾該情感詞的程度副詞則表達了這種情感傾向的激烈程度。比如在句中會有這種情況出現(xiàn),如“劇情設(shè)置不是很巧妙!”那么里面的情感詞可以是“巧妙”,程度副詞為“很”。那么按照計分原則可能會將其判斷為正向情感,但它實際上表達的是負向情感。為了防止這種情況的出現(xiàn)以及計算的簡便,我們在分析過程中加了一步——識別否定詞。否定詞一旦出現(xiàn),情感傾向就發(fā)生變化。又由于中文表達中常出現(xiàn)雙重否定表肯定,我們引入(–1)n,其中n表示否定詞出現(xiàn)的次數(shù),若為兩次,則為正,情感傾向不變。

2.3.3 電影特征滿意度測算

我們將正向情感詞賦為2分、負向情感詞賦分為-2分。若分數(shù)為正,分值越高則為更為強烈的正向情感,分值越低則為較弱的正向情感;若分數(shù)為負,分值越高則為較弱的負向情感,分值越低則為強烈的負向情感。

運用python程序語言,編寫程序以實現(xiàn)以下操作步驟。首先依次歷遍整個文檔定位到特征詞,提取臨近特征詞[-3,3]區(qū)間內(nèi)的詞段。然后將整理好的情感詞典以及情感副詞詞典導(dǎo)入。最后計算該特征詞所在詞段的分值。

具體計算公式如下:

fj為評論中特征j對應(yīng)的得分,a為程度副詞的分值,sj為評論中特征j的情感詞分值,n代表否定詞出現(xiàn)的次數(shù)。該影評文本特征j情感得分時取fj的平均值。

2.4 整體滿意度計算

利用表4中電影特征的TF-MONO權(quán)重計算結(jié)果來計算中國觀眾對不同來源國(地區(qū))整體滿意度得分。計算公式如下:

S表示中國觀眾對該國電影的整體滿意度得分,wj表示電影特征j的權(quán)重,表示該國電影特征j的得分。

3 研究結(jié)果分析

3.1 中國觀眾觀影感知需求特征分析

利用TF-MONO權(quán)重計算方法對表4中的數(shù)據(jù)進行迭代計算,得到七個電影特征得權(quán)重如圖2所示。該權(quán)重計算結(jié)果統(tǒng)一了四個國家(地區(qū))的結(jié)論,反映了中國觀眾整體觀影的需求偏好所在。

從圖2可以看到中國觀眾對于電影的故事的感知需求最高,其次是角色、演員。中國觀眾對電影在藝術(shù)、特效、導(dǎo)演/團隊方面感知需求相差不多,對于動作特征感知需求最低。好故事體現(xiàn)在劇本中,劇本又是電影創(chuàng)作的第一道工序,是一部劇的根本。一部敘事作品是在以故事為中心的基礎(chǔ)上展開的虛構(gòu)的藝術(shù)作品。整體來說,往往講好故事、塑造生動又飽滿的角色是提升中國觀影者整體滿意度的最佳途徑。

圖2 電影特征權(quán)重

3.2 中國觀眾對不同來源國不同電影特征滿意度比較分析

我們運用python編程,加入特征提取結(jié)果以及整理好的情感詞典和情感副詞詞典,對提取出的詞段進行分值計算。計算結(jié)果如表6所示。

表6 四個國家(地區(qū))七大電影特征情感得分

為了更為直觀地反映出不同來源國(地區(qū))電影特征情感得分比較根據(jù)所得數(shù)據(jù)繪制簇狀柱形圖如圖3所示。

圖3 四個國家(地區(qū))七大電影特征情感得分比較

圖3顯示在故事、角色、演員、特效、動作、導(dǎo)演/團隊以及藝術(shù)七個電影特征中表現(xiàn)最佳的國家(地區(qū))依次為歐洲、美國、美國、美國、中國、日本和日本。中國動作情感的分較高究其原因在于中國動作電影展示的不僅僅是單一的打斗動作,更是與中華武術(shù)精神,中華文化相融合的、有內(nèi)涵的中華武術(shù)。這樣的動作電影不僅能將中國武術(shù)的精神內(nèi)核傳遞給觀眾,引起觀眾情感上的共鳴,又能同時激發(fā)中國觀影的愛國主義情懷。美國擁有DC漫畫公司、漫威漫畫公司兩大漫畫巨頭。在特效方面,漫威以《鋼鐵俠》《美國隊長》《銀河護衛(wèi)隊》等特效超強的電影,最終形成了《復(fù)仇者聯(lián)盟》。DC漫畫公司出品的《神奇女俠》《海王》等優(yōu)秀的電影作品也深受中國觀眾的喜愛。然而,部分美國大片一直以先進的技術(shù)和優(yōu)質(zhì)的特效聞名,而忽視了故事的講述。本文在對日本電影影評進行詞頻統(tǒng)計時高頻出現(xiàn)并且是其他三個國家(地區(qū))沒有的就是畫面、畫風(fēng)和宮崎駿。日本動漫產(chǎn)業(yè)蓬勃發(fā)展,已經(jīng)成為日本的第三大產(chǎn)業(yè),是世界動漫的領(lǐng)軍人。真人拍電影往往受限于機位、角色活動以及自然光照和色彩規(guī)律。但動畫電影可以充分發(fā)揮創(chuàng)作者的想象力,色彩的運用和場景的布置可以是極其豐富的,再加之優(yōu)美動人的音樂背景,以此來滿足劇情的需要。

我們將中國觀眾對該電影特征滿意度最高的對應(yīng)國家(地區(qū))電影的滿意影評篩選出來,并對選出來的積極的影評生成可視化云圖進行分析,整理使觀眾滿意度高的電影特征的特點,如表7所示:

表7 高滿意度特征影評可視化

四個國家(地區(qū))電影的角色特征、導(dǎo)演/團隊特征差異不大。就動作這一電影特征而言,中國電影表現(xiàn)突出,得分為1.11分,遠遠領(lǐng)先其他三個國家(地區(qū))。但是中國電影故事的情感得分較低。所以未來中國電影在涉及動作場景設(shè)計時要注重與中華武術(shù)的結(jié)合,保持中國動作特征的領(lǐng)先優(yōu)勢,同時應(yīng)注重提升故事講述、情節(jié)設(shè)計。

美國電影特效特征表現(xiàn)較其他國家來說較為優(yōu)秀,其次是歐洲。因此,美國電影應(yīng)繼續(xù)將電影特效作為在中國營銷的重點,避免依賴續(xù)集、系列電影,創(chuàng)作出更多新穎的好故事,努力提升其故事講述能力。

歐洲電影故事特征情感得分較高,其它六個特征表現(xiàn)平穩(wěn)。應(yīng)加大其傳播力度,提升其傳播至中國電影市場的電影數(shù)量、電影類型。

日本電影在特效方面表現(xiàn)平平是因為在我們所選取的2017—2020年的41部日本電影中動漫所占比率約為75%。動漫不需要很復(fù)雜的特效,只求畫面美觀。這也是日本電影藝術(shù)特征情感得分較高的原因。日本電影演員特征得分較低,究其原因是動漫中不涉及真人表演,觀眾對少數(shù)上映的真人電影評論熱度低,對日本演員不熟悉。從圖7中可以看出日本藝術(shù)特征和導(dǎo)演/團隊特征情感得分領(lǐng)先于其他國家(地區(qū))。日本電影在中國營銷時可以注重導(dǎo)演/團隊的介紹,海報制作,主題曲的營銷傳播等,同時應(yīng)該提升傳播至中國電影市場的電影類型。

3.3 中國觀眾對不同來源國電影整體滿意度比較分析

利用公式6來計算中國觀眾對各個國家(地區(qū))的整體滿意度得分。計算結(jié)果如圖4所示:

圖4 中國觀眾對四個國家(地區(qū))電影整體滿意度對比

整體來看,中國觀眾對歐洲電影的整體滿意度最高。其次是美國電影、日本電影,最后是中國電影。中國電影盡管在動作方面領(lǐng)先其它另外三個國家(地區(qū)),但是動作所占的權(quán)重是其他電影特質(zhì)中占比最低的。換言之,中國觀眾對電影的動作方面關(guān)注度不高,他們更偏好擁有好故事、設(shè)定好角色以及演員演技和特效制作方面。這使得中國觀眾對故事方面領(lǐng)先的歐洲電影以及特效方面領(lǐng)先的美國電影滿意度更高。日本電影在中國電影市場放映的更多的是動漫,這樣就使得演員方面是日本電影較為欠缺的部分,加之中國觀眾對演員這一特質(zhì)關(guān)注度較高,所以藝術(shù)方面遙遙領(lǐng)先的日本電影在整體方面表現(xiàn)不佳。總之,提升整體滿意度最有效的途徑是抓住觀眾的最在意的電影特質(zhì),即權(quán)重最高的電影特質(zhì):故事、角色。

4 研究結(jié)論及管理啟示

本研究利用文本挖掘技術(shù)爬取豆瓣上2017—2020年在中國電影市場上映的中國電影、美國電影、歐洲電影以及日本電影的在線影評進行需求挖掘,利用詞頻統(tǒng)計法與Word2vec特征提取法對所收集到的影評進行特征提取,將電影特征分為故事、角色、演員、導(dǎo)演/團隊、特效、動作以及藝術(shù)七大類,分別測算不同國家(地區(qū))各個電影特征情感得分。又通過TF-MONO權(quán)重計算法計算出七大電影特征的權(quán)重,測算出中國觀眾對四個國家(地區(qū))電影的整體滿意度。最終得出如下結(jié)論:

(1)中國觀眾的觀影需求有故事、角色、導(dǎo)演/團隊、特效、藝術(shù)、演員、動作七類。

本文的新發(fā)現(xiàn)在于:以往關(guān)于電影觀眾滿意度的研究在對電影特質(zhì)進行分類時往往根據(jù)主觀判斷,本文結(jié)合詞頻統(tǒng)計和word2vec對觀眾在意的電影特質(zhì)類別進行了更為系統(tǒng)、客觀的分類。并根據(jù)TF-MONO權(quán)重計算結(jié)果識別故事和角色的權(quán)重最高。Yu-Chen Hung和關(guān)沖[41]對電影梗概進行研究,結(jié)果表明,電影劇情中包含的語言線索與消費者在閱讀電影梗概時產(chǎn)生的心理預(yù)期一致時會在一定程度上促進電影票房增長。觀影者之所以關(guān)注電影梗概是因為梗概中包含了觀影者所看重的故事這一電影特征,這與我們的研究結(jié)果是一致的。

(2)根據(jù)中國觀眾對中國電影動作特征表現(xiàn)為高滿意;對美國電影的特效、角色、演員這三個特征滿意度較高;歐洲電影的故事較其他三個來源國電影表現(xiàn)更為突出。日本電影的藝術(shù)、導(dǎo)演/團隊特征更能使中國觀眾滿意。整體來看,中國觀影者對歐洲電影整體滿意度最高,其次是美國電影、日本電影,最后是中國電影。

本文進一步對高評分電影特征的影評進行可視化分析,結(jié)果顯示高評分的故事具有完整、真實、有趣、幽默、溫馨、感動、輕松等特點;高評分的角色具有立體、飽滿、真實的特點。中國觀眾感知需求在于故事、角色,歐洲電影故事特征情感得分在四個國家(地區(qū))最高,使得中國觀眾對歐洲電影整體滿意度最高。因此,把握觀眾最在意的電影屬性類別是提升觀眾整體滿意度的最有效的方式。

本研究的結(jié)論為不同國家/地區(qū)來源國電影在中國電影市場的營銷提供了以下啟示:

(1)提升電影觀眾整體滿意度的關(guān)鍵在于講好故事、塑造好角色。電影的制作往往需要耗費大量的成本,電影制片商應(yīng)根據(jù)電影觀眾的需求所在進行合理的資源配置,用盡可能低的成本提升電影質(zhì)量。應(yīng)該將較多關(guān)注故事的講述、情節(jié)的設(shè)計、角色的塑造以及自身優(yōu)勢的凸顯,還要縮減不必要的成本投入。比如美國電影的演員特征、特效特征評分較高,則可以考慮在這兩方面進行高投入,繼續(xù)以精湛的特效、強大的陣容保持自身的優(yōu)勢。而對于演員滿意度較低的日本電影應(yīng)盡小縮減這方面的成本投入。

(2)不同國家的電影在傳播至中國電影市場時要進行有側(cè)重點的營銷宣傳。簡短的宣傳片和營銷海報要能夠突出重點來吸引中國觀眾。比如日本電影宣傳的側(cè)重點可以體現(xiàn)在優(yōu)美的主題曲,導(dǎo)演、制作團隊的宣傳,還有歐洲電影的故事情節(jié),美國電影的特效、陣容以及國產(chǎn)電影的動作等,盡可能凸顯自身優(yōu)勢。利用中國觀眾對該國家電影的刻板印象進行有效宣傳。

本研究也存在一些不足:首先,本研究的樣本中只包含上映數(shù)量較多的國產(chǎn)電影、美國電影、歐洲電影以及日本電影,沒有考慮一些其他的來源國電影,如印度電影等。未來研究可以將這些來源國(地區(qū))電影也考慮在內(nèi),甚至可以考慮未在大熒幕上映的、僅僅在媒體播放平臺上播放的更多來源國(地區(qū))電影。其次,本研究僅僅考慮到部分樂意在社交媒體網(wǎng)站(這里特指豆瓣)上發(fā)表評論的觀眾的意見,并沒有考慮到一部分沒有上網(wǎng)評價的觀眾的意見。未來的研究可以嘗試線上線下相結(jié)合的方法獲得更全面的樣本。

猜你喜歡
特征詞特征提取特征
根據(jù)方程特征選解法
離散型隨機變量的分布列與數(shù)字特征
基于類信息的TF-IDF權(quán)重分析與改進①
基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
不忠誠的四個特征
基于Daubechies(dbN)的飛行器音頻特征提取
基于改進TFIDF算法的郵件分類技術(shù)
產(chǎn)品評論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
Bagging RCSP腦電特征提取算法
面向文本分類的特征詞選取方法研究與改進
泸西县| 尉犁县| 太谷县| 新巴尔虎右旗| 元阳县| 柳江县| 奉贤区| 河北区| 宜宾市| 葫芦岛市| 石渠县| 高青县| 文山县| 漠河县| 麟游县| 凤山市| 清徐县| 桐乡市| 兴宁市| 贵定县| 隆德县| 油尖旺区| 略阳县| 嘉禾县| 西充县| 巴中市| 海丰县| 武城县| 明溪县| 尼勒克县| 临湘市| 玉田县| 弥渡县| 桐城市| 昌吉市| 广州市| 博湖县| 大化| 合作市| 邯郸县| 微博|