国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Python技術(shù)的電影《白蛇傳·情》豆瓣短評文本挖掘與可視化分析

2024-06-03 11:57:27藍(lán)梓鈺
文化創(chuàng)新比較研究 2024年10期
關(guān)鍵詞:文本挖掘白蛇傳可視化分析

藍(lán)梓鈺

摘要:該文采用Python爬蟲和數(shù)據(jù)分析相結(jié)合的方法,對電影《白蛇傳·情》的豆瓣短評進(jìn)行文本挖掘和可視化分析。通過詞頻分析、情感分析等方法,揭示了《白蛇傳·情》受到觀眾廣泛好評的主要原因:一是創(chuàng)新的表現(xiàn)形式,將傳統(tǒng)戲曲藝術(shù)與現(xiàn)代電影手法融合;二是精良的電影制作,在視聽效果和人物塑造上給觀眾留下深刻印象;三是優(yōu)秀的故事改編,在傳統(tǒng)故事的基礎(chǔ)上注入新的情感內(nèi)涵。該文對傳統(tǒng)戲曲電影的現(xiàn)代化改編具有一定的啟示意義,即傳統(tǒng)戲曲應(yīng)與現(xiàn)代技術(shù)融合創(chuàng)新,豐富表現(xiàn)形式;改編者需深度挖掘傳統(tǒng)戲曲的文化內(nèi)涵,以現(xiàn)代視角詮釋經(jīng)典故事。

關(guān)鍵詞:《白蛇傳·情》;豆瓣短評;可視化分析;Python;文本挖掘;戲曲電影

中圖分類號:J952? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼:A? ? ? ? ? ? ? ? ?文章編號:2096-4110(2024)04(a)-0052-05

Mining and Visualizing Douban Short Comments on the Movie White Snake with Python

LAN Ziyu

(South China University of Technology, Guangzhou Guangdong, 510006, China)

Abstract: This study employs Python crawlers and data analysis to conduct text mining and visualization on the short comments posted on Douban for the movie White Snake. Through methods such as word frequency and sentiment analysis, it reveals the main reasons for the wide acclaim the movie received: first, its innovative presentation that integrates traditional opera art with modern film techniques; second, its exquisite production that leaves a deep impression on the audience in terms of audiovisual effects and character portrayal; third, its excellent adaptation that infuses new emotional connotations into the traditional story. This research offers insights into the modernization of traditional opera films, suggesting that traditional opera should innovatively integrate with modern technology to enrich its presentation, and that adapters need to deeply explore the cultural connotations of traditional opera to interpret classic stories from a contemporary perspective.

Key words: White Snake; Douban short comments; Visual analysis; Python; Text mining; Opera film

中國傳統(tǒng)戲曲是中華文化的瑰寶,但近年來戲曲電影的發(fā)展面臨諸多困境。2021年,由珠江電影集團(tuán)等出品的粵劇電影《白蛇傳·情》打破了傳統(tǒng)戲曲電影票房不佳的魔咒,在多個電影節(jié)上斬獲獎項,并獲得國內(nèi)外觀眾的廣泛好評。該片以中國四大民間傳說之一的“白蛇傳”為藍(lán)本,以“情”為主線,融合現(xiàn)代思維對傳統(tǒng)故事進(jìn)行了改編,表達(dá)了人們對真善、美的向往和追求。

豆瓣是國內(nèi)最具影響力的電影評論平臺之一。截至2021年6月10日,《白蛇傳·情》在豆瓣上累計獲得24 042條評價,評分高達(dá)8.2分,位列2021年度國產(chǎn)電影評分榜首。豆瓣短評數(shù)量大、質(zhì)量高,能夠較好地反映大多數(shù)觀眾的觀影感受和評價傾向。因此,本文選取《白蛇傳·情》的豆瓣短評作為研究對象,運用Python爬蟲和數(shù)據(jù)分析技術(shù),從評分分布、評論數(shù)量、關(guān)鍵詞頻次、情感傾向等多個維度對影片評論進(jìn)行量化分析,以期揭示該片廣受好評的原因,并為我國戲曲電影的現(xiàn)代化改編提供啟示。

近年來,國內(nèi)學(xué)者開始利用Python等計算機(jī)技術(shù)對豆瓣影評數(shù)據(jù)進(jìn)行采集和分析[1-4],展示了新技術(shù)在影評研究中的應(yīng)用前景。同時,不少研究基于豆瓣影評文本,從不同角度探討了觀眾對影視作品的接受和解讀[5-8]。此外,一些學(xué)者從傳播學(xué)視角切入,關(guān)注豆瓣等平臺上的用戶互動行為及其影響[9-12]。除上述主流研究外,還有少數(shù)研究從藝術(shù)和美學(xué)角度討論了國產(chǎn)戲曲電影的創(chuàng)新表達(dá)[13-14]。

綜上所述,本文研究擬解決以下兩個問題:第一,《白蛇傳·情》豆瓣短評的分布特征如何?第二,《白蛇傳·情》受到觀眾歡迎的原因有哪些?對國產(chǎn)戲曲電影的改編有何啟示?

1 研究方法

本文采用詞頻分析法,通過統(tǒng)計關(guān)鍵詞在文本中的出現(xiàn)頻率,揭示文本的主題和熱點,這一方法在傳播學(xué)、情報學(xué)等領(lǐng)域得到廣泛應(yīng)用。本文以豆瓣短評為數(shù)據(jù)來源,通過數(shù)據(jù)采集、清洗、詞頻統(tǒng)計和情感分析等步驟,挖掘影評中蘊含的觀眾喜好信息和情感傾向。

1.1 數(shù)據(jù)獲取和處理

本文以電影《白蛇傳·情》在豆瓣平臺上的短評數(shù)據(jù)為研究對象。通過對影片評論頁面的分析,發(fā)現(xiàn)每個分頁包含20條評論。在此基礎(chǔ)上,利用Python爬蟲技術(shù),通過模擬瀏覽器請求和解析HTML頁面的方式,實現(xiàn)了短評數(shù)據(jù)的自動采集。爬蟲程序設(shè)置了25次翻頁,依次采集每條評論的用戶名、評論者主頁、評分、評論時間、評論內(nèi)容和點贊數(shù)等信息。受豆瓣反爬限制,在登錄狀態(tài)下最多可獲取500條短評數(shù)據(jù)。

為方便數(shù)據(jù)分析,本文首先對爬取的原始數(shù)據(jù)進(jìn)行清洗和預(yù)處理。主要步驟包括去除重復(fù)數(shù)據(jù)、統(tǒng)一數(shù)據(jù)格式。經(jīng)過處理,得到包含用戶名、評分、評論時間、評論內(nèi)容等字段的結(jié)構(gòu)化數(shù)據(jù)集。本文共采集到500條短評數(shù)據(jù)。經(jīng)過去重等預(yù)處理步驟,得到481條有效數(shù)據(jù)。其中,10條數(shù)據(jù)有文字評論但缺失評分,考慮到本文以文本分析為主,這部分?jǐn)?shù)據(jù)予以保留。

在文本數(shù)據(jù)處理方面,采用了jieba庫對評論內(nèi)容進(jìn)行中文分詞。同時,構(gòu)建了停用詞表,過濾掉文本中的無意義詞匯,如“的”“了”“是”等,以提高關(guān)鍵詞提取的準(zhǔn)確性。

1.2 分析方法

本文主要采用詞頻分析和情感分析兩種方法。

詞頻分析基于jieba分詞的結(jié)果,統(tǒng)計各詞匯在評論語料庫中的出現(xiàn)頻次,從而識別出評論中的高頻關(guān)鍵詞,揭示觀眾關(guān)注的熱點話題??梢暬矫?,使用pyecharts和wordcloud庫,生成詞頻統(tǒng)計表和詞云圖,直觀呈現(xiàn)高頻詞分布。

情感分析使用了snownlp庫。該庫基于樸素貝葉斯算法,對文本的情感傾向進(jìn)行極性判斷(積極/消極)和情感值計算(0—1,越接近1表示情感越積極)。通過對各條評論的情感值進(jìn)行統(tǒng)計分析,可以定量刻畫觀眾的整體情感傾向。

需要說明的是,由于豆瓣的反爬限制,本文采集到的481條評論數(shù)據(jù)僅占全部評論(12 030條)的一小部分。但考慮到數(shù)據(jù)采集的隨機(jī)性,這些樣本在一定程度上仍能反映總體情況,具有研究價值。

2 結(jié)果與分析

2.1 基本數(shù)據(jù)分析

為了對收集的數(shù)據(jù)進(jìn)行總體分析,首先導(dǎo)入所需的Python包,讀取了CSV格式的數(shù)據(jù)文件。利用pyecharts庫,生成了一個HTML格式的評分分布餅狀圖(見圖1)。

從圖1可以看出,在所有評論中,觀眾對《白蛇傳·情》的總體評價較高。約75.75%的用戶給出了4—5分的高分評價,而給出1—2分低分評價的用戶占比不足8.00%。這表明該電影獲得了大多數(shù)觀眾的認(rèn)可。

接下來,選取了comment_time列的數(shù)據(jù),使用pyecharts繪制了評論數(shù)量的折線走勢圖(見圖2)。

由圖2可知,《白蛇傳·情》最早的短評出現(xiàn)在2019年10月18日,當(dāng)時該片在平遙國際電影節(jié)首次露面,引發(fā)了一定的評論熱度。但在隨后的一段時間內(nèi),盡管該片在多個電影節(jié)上斬獲獎項,但豆瓣評論數(shù)量并未出現(xiàn)明顯波動,仍維持在較低水平。直到2021年5月20日電影正式公映前后,隨著影片宣傳的展開,評論數(shù)量才出現(xiàn)大幅增長。在上映期間,評論數(shù)量呈現(xiàn)明顯的波動,并在2021年5月31日達(dá)到峰值。6月以后,受排片量減少影響,評論數(shù)量出現(xiàn)大幅下降。不過,良好的口碑使得評論數(shù)量在后期的低位中出現(xiàn)了一定回升。

2.2 詞頻及詞云分析

為深入探究觀眾對《白蛇傳·情》的評價傾向,本文對豆瓣短評文本進(jìn)行了詞頻統(tǒng)計和詞云可視化分析。首先,利用Python的pandas庫讀取并清洗了短評文本數(shù)據(jù),剔除了非中文字符。然后,使用jieba庫對文本進(jìn)行分詞,在此基礎(chǔ)上,生成了短評內(nèi)容的詞云圖(見圖3)。

圖3可以直觀看出,“電影”“戲曲”“特效”“粵劇”等詞匯出現(xiàn)頻率較高。這表明,觀眾在評論中重點關(guān)注了該片的藝術(shù)形式、制作水平和故事內(nèi)容等方面。同時,詞云中還出現(xiàn)了“第一次看粵劇”“第一次看戲曲電影”等評論語句,反映出該片為許多非粵語區(qū)觀眾提供了接觸和了解粵劇藝術(shù)的新機(jī)會。

為進(jìn)一步量化分析關(guān)鍵詞的分布,對分詞后的評論文本進(jìn)行了詞頻統(tǒng)計,并提取了出現(xiàn)頻率最高的30個詞匯(見表1)。結(jié)果顯示,“電影”一詞在481條評論中出現(xiàn)了298次,提及率約為60.00%;“戲曲”出現(xiàn)199次,提及率達(dá)41.00%;“粵劇”“戲劇”“白蛇傳”“形式”等相關(guān)詞匯也高頻出現(xiàn)。這說明,觀眾普遍關(guān)注該片獨特的藝術(shù)形式,即以電影的表現(xiàn)手法呈現(xiàn)傳統(tǒng)戲曲故事。觀眾對該片的制作水平也給予了較高評價?!疤匦А币辉~以145次的出現(xiàn)頻率位列第三,提及率超過了主題詞“粵劇”,可見特效制作是該片的一大亮點,約30.00%的觀眾對此留下了深刻印象。值得注意的是,“美”字在所有評論中出現(xiàn)達(dá)161次,表明觀眾對影片呈現(xiàn)的東方美學(xué)風(fēng)格印象深刻。

此外,影片對原著故事和人物形象的塑造也受到觀眾的廣泛關(guān)注。“許仙”“法?!薄鞍咨摺薄靶∏唷钡戎饕巧拿志休^高的提及率。值得一提的是,“水漫金山”作為影片的核心情節(jié)和場景,以超過14.00%的提及率躋身高頻詞前十名,遠(yuǎn)超一般成語在口語中的出現(xiàn)概率。一方面,得益于影片在故事改編方面的用心;另一方面,歸功于特效制作對水漫金山場景的出色呈現(xiàn)。在影片長達(dá)6分鐘的篇幅中,通過大量特效打造出氣勢恢宏的水漫金山場面,給觀眾留下了深刻而持久的視覺印象。

2.3 最高點贊數(shù)的十條短評

為進(jìn)一步探究觀眾對《白蛇傳·情》的評價傾向,本文對豆瓣短評的點贊數(shù)進(jìn)行了統(tǒng)計和排序,篩選出了點贊數(shù)最高的10條評論,并對其文本內(nèi)容進(jìn)行了情感分析。

這10條高點贊評論的點贊數(shù)范圍為380—2 625,平均評分為4.5星(滿分5星)。其中,9條評論給出了4—5星的高分評價,1條評論為3星中評。運用snownlp庫對評論文本進(jìn)行情感傾向分析,得到的情感值均大于0.5,平均值為0.93,表明這些評論均傾向于表達(dá)正面情感。高贊評論的評分分布和情感傾向與整體短評數(shù)據(jù)的分析結(jié)果保持一致,進(jìn)一步印證了《白蛇傳·情》受到多數(shù)觀眾歡迎的結(jié)論。

對高點贊評論的文本內(nèi)容進(jìn)行詞頻統(tǒng)計,發(fā)現(xiàn)“驚喜”“支持”等正面情感詞的出現(xiàn)頻率較高。定性分析評論文本也發(fā)現(xiàn)了“好看”“驚艷”“鼓勵”等正面評價詞匯。這些高頻詞和關(guān)鍵詞體現(xiàn)了觀眾對該片的喜愛和支持態(tài)度。

從內(nèi)容上看,高贊評論涉及影片的多個方面,如藝術(shù)形式(“戲曲電影終于脫離舞臺的束縛”)、視覺呈現(xiàn)(“每一幀都好美”)、情感體驗(“哭成狗”)等。其中也出現(xiàn)了一些富有感染力的評價用語,如“驚艷”“好看”“震撼”等。這些評論以生動、具體的方式表達(dá)了觀眾的觀影感受,體現(xiàn)了影片的藝術(shù)魅力。

需要指出的是,由于snownlp訓(xùn)練語料主要來自購物評論,對影評文本的情感判斷可能存在偏差。此外,高點贊評論的樣本量相對較?。╪=10),其代表性有待進(jìn)一步驗證。

綜上所述,高點贊評論的情感傾向與整體短評數(shù)據(jù)的分析結(jié)果保持一致,均指向觀眾對《白蛇傳·情》這部電影的積極評價。高點贊評論所體現(xiàn)的觀眾共情,一方面印證了前文詞頻分析得出的研究結(jié)論,另一方面也為解釋該片廣獲好評的原因提供了有益線索。

3 討論與啟示

通過對《白蛇傳·情》豆瓣短評的文本挖掘和情感分析,本文發(fā)現(xiàn)該片廣受觀眾好評的原因主要有三:

其一,該片在表現(xiàn)形式上的創(chuàng)新。傳統(tǒng)戲曲與電影在藝術(shù)表現(xiàn)方式上存在較大差異,前者注重寫意,后者強(qiáng)調(diào)寫實。既有的戲曲電影改編往往難以兼顧二者,或過于注重戲曲表演而導(dǎo)致觀賞門檻高,或完全寫實化而失去了戲曲韻味。而《白蛇傳·情》通過采用4K全景聲等現(xiàn)代電影技術(shù),在保留戲曲寫意空間的同時,又增強(qiáng)了電影的視聽沖擊力,從而拉近了與當(dāng)代主流觀眾的審美距離。

其二,精良的電影制作。受訪者對該片的畫面質(zhì)量贊譽(yù)有加。影片采用水墨畫般的色調(diào),融入宋代工筆畫和杭州枯山水等傳統(tǒng)美學(xué)元素,再輔以精美的CG特效,營造出近似舞臺的意境,具電影的視覺張力。尤其是“水漫金山”一幕,以東方式的寫意特效再現(xiàn)洶涌波濤,配合氣勢恢宏的鼓樂,給觀眾帶來震撼的審美體驗。此外,演員們純熟的武戲表演,在呈現(xiàn)戲劇張力的同時,也兼顧了電影的節(jié)奏感,獲得了觀眾的高度認(rèn)可。

其三,精心的故事改編?!栋咨邆鳌肥橇鱾魃鯊V的民間故事,其劇本有著豐厚的文化底蘊。《白蛇傳·情》對原作進(jìn)行了情感維度的挖掘,塑造了既符合傳統(tǒng)人物形象,又富于人情味的銀幕形象。但部分受訪者也提出,影片對白素貞愛情觀的刻畫仍顯保守,難以引起當(dāng)代觀眾的情感共鳴。

綜合以上分析,《白蛇傳·情》的成功經(jīng)驗為我國戲曲電影的現(xiàn)代化改編提供了有益啟示:傳統(tǒng)戲曲要積極融合現(xiàn)代電影技術(shù),在繼承經(jīng)典的同時創(chuàng)新表現(xiàn)形式;要發(fā)揮電影的制作優(yōu)勢,在保留戲曲神韻的同時,提升視聽體驗;要立足傳統(tǒng)故事,以現(xiàn)代審美和情感經(jīng)驗重新詮釋角色,激發(fā)新時代觀眾的情感共鳴。唯有在傳承與創(chuàng)新中求得平衡,戲曲電影才能煥發(fā)新的生機(jī)與活力。

4 結(jié)束語

本文以電影《白蛇傳·情》為例,嘗試運用計算機(jī)技術(shù)對豆瓣短評進(jìn)行文本挖掘和可視化分析,以期從大數(shù)據(jù)角度揭示該電影獲得良好口碑的原因。研究結(jié)果表明,《白蛇傳·情》在藝術(shù)形式、制作、故事改編等方面均有突出表現(xiàn),由此獲得觀眾青睞。這為今后傳統(tǒng)戲曲電影的改編提供了有益啟示。

本文仍存在一些不足。首先,樣本量較小,代表性有待提高;其次,關(guān)鍵詞提取和情感分析等方法較為簡單,準(zhǔn)確性有待加強(qiáng)。未來可擴(kuò)大數(shù)據(jù)規(guī)模,優(yōu)化分析方法,引入更先進(jìn)的算法,以獲得更全面的結(jié)果。此外,觀眾的地域背景可能影響其評價傾向?;浾Z區(qū)觀眾對粵劇文化有更深的認(rèn)同,而非粵語區(qū)觀眾可能更看重影片的新奇性。未來研究可以爬取用戶地域信息,分析不同地區(qū)觀眾的評價差異,以及地域因素對排片量和評論數(shù)的影響。

參考文獻(xiàn)

[1] 蔡文樂,周晴晴,劉玉婷,等.基于Python爬蟲的豆瓣電影影評數(shù)據(jù)可視化分析[J].現(xiàn)代信息科技,2021,5(18):86-89,93.

[2] 張荑陽,毛紅霞.基于python的豆瓣電影數(shù)據(jù)采集與分析可視化[J].電子制作,2021(16):47-49.

[3] 高雨菲,毛紅霞.基于Python的豆瓣影視短評的數(shù)據(jù)采集與分析[J].現(xiàn)代信息科技,2020,4(24):10-12,16.

[4] 裴麗麗.基于Python對豆瓣電影數(shù)據(jù)爬蟲的設(shè)計與實現(xiàn)[J].電子技術(shù)與軟件工程,2019(13):176-177.

[5] 魏端端.合拍紀(jì)錄片《杜甫:中國最偉大的詩人》的中國接受:以豆瓣影評為例[J].對外傳播,2021(1):50-52,61.

[6] 陸敏.紀(jì)錄片藝術(shù)性的受眾解讀初探:基于張以慶紀(jì)錄片“豆瓣影評”的分析[J].現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報),2016,38(6):103-106.

[7] 龐林源,王歡.國產(chǎn)電影票房與網(wǎng)絡(luò)評分關(guān)系探討:基于票房數(shù)據(jù)和豆瓣電影評分的分析[J].北京電影學(xué)院學(xué)報,2020 (12):60-64.

[8] 姜霖,張麒麟.基于評論情感分析的個性化推薦策略研究:以豆瓣影評為例[J].情報理論與實踐,2017,40(8):99-104.

[9] 楊藝明.互動儀式視角下青年的抗疫精神闡釋:B站《在武漢》彈幕的情感分析[J].傳媒評論,2021(3):76-77.

[10]路雪珂.微博謠言多維情緒傳播與受眾互動行為關(guān)系研究[J].新聞知識,2021(1):10-20.

[11]路雪珂.基于文本挖掘方法的微博謠言傳播情緒框架研究[J].新聞傳播,2020(23):9-10.

[12]全貞花,王小芳.網(wǎng)絡(luò)口碑傳播對用戶觀影意愿的影響研究:以豆瓣評分為例[J].東南傳播,2020(4):55-59.

[13]劉影.戲曲電影《白蛇傳·情》:詩意影像、經(jīng)典重構(gòu)與青春傳承[J].當(dāng)代戲劇,2021(5):35-38.

[14]邵宣.當(dāng)代戲曲電影美學(xué)的“傳承”與“突破”:以粵劇電影《白蛇傳·情》為例[J].民族藝林,2021(3):53-60.

猜你喜歡
文本挖掘白蛇傳可視化分析
“宣白”CP《天乩之白蛇傳說》
京劇《白蛇傳》經(jīng)典性的內(nèi)在構(gòu)成
戲曲研究(2018年3期)2018-03-19 08:46:36
數(shù)據(jù)挖掘技術(shù)在電站設(shè)備故障分析中的應(yīng)用
我國職業(yè)教育師資研究熱點可視化分析
職教論壇(2016年26期)2017-01-06 19:04:59
聲波吹灰技術(shù)在SCR中的應(yīng)用研究
科技傳播(2016年19期)2016-12-27 16:18:28
基于LDA模型的95598熱點業(yè)務(wù)工單挖掘分析
可視化分析技術(shù)在網(wǎng)絡(luò)輿情研究中的應(yīng)用
國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢
從《遠(yuǎn)程教育》35年載文看遠(yuǎn)程教育研究趨勢
慧眼識璞玉,妙手煉渾金
琼结县| 彭山县| 平安县| 吉隆县| 平原县| 海兴县| 定结县| 铜鼓县| 静宁县| 濮阳县| 太谷县| 孙吴县| 洪雅县| 延津县| 施甸县| 高陵县| 宜兰县| 延安市| 峨眉山市| 商洛市| 泾阳县| 德钦县| 金门县| 屏东县| 永兴县| 青冈县| 金秀| 习水县| 阿拉善盟| 安化县| 五原县| 宜阳县| 荃湾区| 淄博市| 馆陶县| 明光市| 锦屏县| 华蓥市| 拉萨市| 秦安县| 交城县|