浦曉亮
【摘 要】隨著目前我國社會經(jīng)濟的快速發(fā)展,人們物質(zhì)生活在得到極大滿足的同時,對于精神生活的需求也愈發(fā)凸顯?;谶@一現(xiàn)狀,近年來國內(nèi)的影視市場得到了極大繁榮,尤其是受到互聯(lián)網(wǎng)技術(shù)的發(fā)展影響,影視作品也呈現(xiàn)出了許多新的特征。對此,就針對網(wǎng)絡(luò)視頻中的影視評論分析技術(shù)展開相關(guān)的研究工作意義重大。本文簡要介紹了影視評論的基本概念,從信息采集、數(shù)據(jù)預(yù)處理、評論分析等三個方面對網(wǎng)絡(luò)視頻中的影視評論分析技術(shù)展開了具體探討。
【關(guān)鍵詞】網(wǎng)絡(luò)視頻;影視評論;信息采集;數(shù)據(jù)處理
中圖分類號:G2 文獻標志碼:A 文章編號:1007-0125(2017)23-0067-01
隨著當前互聯(lián)網(wǎng)信息技術(shù)的快速發(fā)展,各種專業(yè)化的影視網(wǎng)站也有了長足的發(fā)展與進步,這些網(wǎng)站在為網(wǎng)民提供相關(guān)影視節(jié)目信息查詢工作的同時,也為廣大用戶提供了對影視節(jié)目進行評論的平臺。對此,有關(guān)影視節(jié)目的評論內(nèi)容近年來呈現(xiàn)出了指數(shù)級的增長趨勢,對于影視節(jié)目的評論已經(jīng)從專業(yè)的影評人員擴展到了廣大的網(wǎng)民群體。針對網(wǎng)絡(luò)環(huán)境中的影視節(jié)目評論內(nèi)容進行搜集、分析,能夠?qū)τ耙暪?jié)目的制作、發(fā)行,以及宣傳等工作提供重要的促進、推動作用。因此,影視節(jié)目評論分析現(xiàn)已成為互聯(lián)網(wǎng)評論分析研究的一個重要領(lǐng)域。
一、概述
評論即為評論者針對某項話題發(fā)表帶有鮮明個人情感色彩的觀點表達,評論的構(gòu)成主要包括了話題、創(chuàng)作者、觀點與情感等要素。評論的對象通常也就是所評論的話題,亦可將其稱作影視作品的某一項特征。以電影評論為例,其通常評論的特征主要就有電影作品當中所涉及到的各項元素以及相關(guān)的演職人員。電影構(gòu)成元素則包括了劇本、臺詞、布景、攝影、音樂等內(nèi)容,所牽涉到的工作人員則有編劇、演員、導(dǎo)演、制片人等。做出評論分析內(nèi)容即為主動發(fā)現(xiàn)評論內(nèi)所牽涉到的相關(guān)評論對象,以及評論人員做出的具有明顯傾向性與代表性的觀點表達。
二、信息采集
應(yīng)用人工維護方式針對影視節(jié)目信息開展持續(xù)性的追蹤及維護工作,往往有著較大的工作量。對于目前在互聯(lián)網(wǎng)上已經(jīng)公布出的共享性數(shù)字資源信息,針對影視節(jié)目基礎(chǔ)性信息內(nèi)容開展自主化采集與選取,是促成影視節(jié)目庫建設(shè)的重要方式之一。
對于影視節(jié)目數(shù)據(jù)信息庫的建設(shè),常規(guī)的做法是利用當前的互聯(lián)網(wǎng)視頻網(wǎng)站采集系統(tǒng),這一系統(tǒng)可以促成對各主要視頻網(wǎng)站信息的采集和數(shù)據(jù)調(diào)取,利用技術(shù)化手段改造處理后,完成對于相關(guān)影視節(jié)目信息的搜集工作。當前的主流視頻網(wǎng)站采集系統(tǒng)所獲取的目標對象基本都是以視頻形式為主,其中重點包括視頻內(nèi)容的標題、發(fā)布人員、發(fā)布時間以及相關(guān)的描述性信息等有關(guān)內(nèi)容。影視節(jié)目信息系統(tǒng)所需采集的數(shù)據(jù)內(nèi)容即相應(yīng)的影視節(jié)目信息,其中主要有影視節(jié)目名稱、演員、導(dǎo)演、播放量、每集時間等相關(guān)信息內(nèi)容。
三、數(shù)據(jù)預(yù)處理
這項技術(shù)內(nèi)容主要是對所采集的影視節(jié)目信息進行統(tǒng)一化的標準文本處理,其整體系統(tǒng)設(shè)計處理最終所要達到的目標對象即簡體中文評論信息,而要實現(xiàn)這一目標需要把搜集到的相關(guān)評論信息進行文字形式與分詞等文本轉(zhuǎn)換處理。因為一些評論內(nèi)容存在著繁簡字的映射關(guān)系,要想實現(xiàn)完全轉(zhuǎn)換過程較為復(fù)雜,在具體實施的過程當中,可先將繁體字處理成簡單的單個漢字予以映射,便能夠滿足要求。
在分詞處理時,則可選用ICTCLAS軟件進行處理。當前所采用的分詞系統(tǒng)較難達到對影視節(jié)目名稱等相關(guān)專有名詞的自動化檢出,但是分詞的精準性又會對最終的信息應(yīng)用產(chǎn)生較大的影響。對此,可將在信息采集過程當中所搜集到的演員或是導(dǎo)演等相關(guān)專有名稱詞匯加入到附加詞典內(nèi),由此系統(tǒng)便可僅選取專有名詞作為選取特征要素,將形容詞作為情感詞,在進行影視評論信息搜集時,僅需提取相關(guān)的名詞與形容詞來展開處理。
四、評論分析
由詞匯特征出發(fā)所創(chuàng)建出的影視節(jié)目評論分析系統(tǒng),應(yīng)當要先確定評論內(nèi)所包括的特征詞匯,即所評論的目標對象。因在數(shù)據(jù)預(yù)處理環(huán)節(jié)新加入了演員與導(dǎo)演名稱等相關(guān)專有名詞,此時再進行分詞之時,所得到的結(jié)果便可直接發(fā)現(xiàn)影視評論內(nèi)容中的有關(guān)專業(yè)詞匯,相關(guān)的詞匯也便能夠充當評論的候選特征要素。
此外,因漢語言分詞系統(tǒng)在針對評論文本開展分詞處理之時,會把沒有包含在詞典內(nèi)的命名實體或是詞組分隔開來,這樣以來,將會導(dǎo)致只依靠分詞系統(tǒng)所獲得的名詞無法對評論特征做出精準描述。對此,可采取基于頻繁項挖掘的特征提取手段來解決以上問題。
基于給定的窗口范圍當中和名詞共現(xiàn)程度超過特定閾值的字符串作為候選抽取特征,這一方法不但可以將具有頻繁性特征的評論抽取出來,而且還可以有效彌補因為分詞系統(tǒng)把復(fù)雜特征分隔為多項專業(yè)詞匯導(dǎo)致的特征抽取錯誤情形。
總而言之,在本次研究中,基于網(wǎng)絡(luò)視頻當中的影視評論分析技術(shù)展開了相關(guān)的探究工作,基于自動網(wǎng)頁抓取技術(shù)以及模板之上的信息抽取技術(shù),建立起影視資源信息庫,同時利用網(wǎng)絡(luò)技術(shù)來主動抓取相關(guān)的評論內(nèi)容。然后再通過之前所創(chuàng)建的影視專業(yè)詞匯與漢語言分詞技術(shù),對評論內(nèi)容實施分詞處理,借助于頻繁項分析方法,主動探究影視評論中的頻繁特征,作為備選標準,進一步綜合具有典型性的感情詞匯,獲取到影視作品中不同特征的情感傾向分析結(jié)果。
參考文獻:
[1]盧娟.網(wǎng)絡(luò)影視評論的現(xiàn)狀及生態(tài)構(gòu)建[J].電影文學,2017,(14).
[2]張亞偉.試論新時代下影視評論的現(xiàn)狀與建構(gòu)[J].劍南文學,2013,(10).
[3]吳飛.網(wǎng)絡(luò)影視評論功能研究[J].科學咨詢,2015,(41).
[4]趙悅婧.略談網(wǎng)絡(luò)影視評論的傳播與分化[J].中國科技投資,2017,(4).