国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多元線性回歸算法的電影票房影響因素研究
——以2023 年“五一”長(zhǎng)假電影票房為例

2023-10-10 11:57:38黃佳珺
傳播力研究 2023年26期
關(guān)鍵詞:電影票房五一長(zhǎng)假

◎黃佳珺

(吉林大學(xué),吉林 長(zhǎng)春 130015)

一、研究背景、文獻(xiàn)回顧及學(xué)術(shù)價(jià)值

(一)研究背景與意義

電影市場(chǎng)的蓬勃成長(zhǎng)是時(shí)代發(fā)展的必然趨勢(shì)。一方面,社會(huì)的進(jìn)步和技術(shù)的發(fā)展讓人們從繁重的、為生存需要所必須付出的必要?jiǎng)趧?dòng)中解脫出來,從事自己喜歡的、并不創(chuàng)造直接功利價(jià)值的娛樂活動(dòng)。另一方面,電影作為傳媒業(yè)的重要組成部分,兼具文化產(chǎn)業(yè)屬性和意識(shí)形態(tài)屬性,在生產(chǎn)優(yōu)質(zhì)的影片獲取票房收益的同時(shí)向觀眾傳達(dá)積極的價(jià)值觀,對(duì)社會(huì)情感代償滿足、維護(hù)社會(huì)穩(wěn)定有重要作用。票房數(shù)據(jù)等于電影的售價(jià)乘以銷售量,直接反映一部電影所帶來的收益,間接反映消費(fèi)者對(duì)該電影的市場(chǎng)需求,其高低成敗直接影響到了電影產(chǎn)業(yè)后續(xù)的發(fā)展與定位。因此,研究后新冠疫情時(shí)期的第一個(gè)電影上映檔期——2023 年“五一”長(zhǎng)假的電影票房及其影響因素,在市場(chǎng)供給方角度上能為電影業(yè)經(jīng)營(yíng)者提供策略指導(dǎo);在需求方角度上基于需求及影響因素的分析讓經(jīng)營(yíng)者投其所好,能有效滿足消費(fèi)者精神生活需要,提高消費(fèi)者從電影中得到的效用。

(二)文獻(xiàn)回顧

當(dāng)前,國(guó)內(nèi)關(guān)于國(guó)產(chǎn)電影票房影響因素的研究多數(shù)采用定量方法,在研究?jī)?nèi)容上各有側(cè)重。在大數(shù)據(jù)時(shí)代,相關(guān)研究基于網(wǎng)絡(luò)平臺(tái)共享的海量數(shù)據(jù)提出了眾多可能影響電影票房的因素并展開了詳盡的實(shí)證分析。沈建軍、吳春集(2021)發(fā)現(xiàn)電影票房與短視頻營(yíng)銷成正相關(guān)[1],并分析實(shí)證案例給出電影營(yíng)銷的策略建議。劉豐波、林映紅(2021)構(gòu)建多元回歸模型得出在線評(píng)分對(duì)電影票房的重要性[2]。于蘭婷(2021)運(yùn)用以回歸為主的分析方法探討了電影產(chǎn)業(yè)鏈中的各決策因素對(duì)電影票房的影響程度,同時(shí)為防止年代不同對(duì)因變量的影響還進(jìn)行了縱向比較,使結(jié)果更具普遍性和客觀性[3]。

回顧近年來的相關(guān)量化研究發(fā)現(xiàn),因樣本數(shù)據(jù)年份和類型等方面的差異,部分研究對(duì)于相同的研究?jī)?nèi)容的結(jié)果都略有不同。對(duì)此,相繼有學(xué)者提出,為增強(qiáng)研究的嚴(yán)謹(jǐn)性,需要縮小研究范圍,針對(duì)某一具體類型的電影展開其票房影響因素的研究,通過控制某些特征從而盡可能規(guī)避無法定量的因素對(duì)結(jié)果的影響,同時(shí)能給電影經(jīng)營(yíng)者提供更具體更具現(xiàn)實(shí)指導(dǎo)性的建議??诐渗Q(2020)針對(duì)刑偵題材電影這一特定內(nèi)容類型,構(gòu)建有序回歸分析模型,開展電影票房與營(yíng)銷的關(guān)系研究[4],通過細(xì)化研究?jī)?nèi)容突破了我國(guó)當(dāng)前關(guān)于電影票房影響因素的部分研究因樣本不同和類型豐富而造成研究結(jié)果存在差異的盲點(diǎn)。趙新星、郭哲滔(2020)則針對(duì)“春節(jié)檔”這一特定類型的國(guó)產(chǎn)電影,運(yùn)用偏最小二乘回歸模型實(shí)證分析宣傳次數(shù)、導(dǎo)演影響力等因素對(duì)該類影片票房的影響[5]。

總而言之,國(guó)內(nèi)當(dāng)前相關(guān)研究的優(yōu)勢(shì)體現(xiàn)在三方面。第一,基于平臺(tái)數(shù)據(jù)構(gòu)建回歸模型來實(shí)證分析影響電影票房的因素,研究結(jié)果具備客觀性。第二,提出了眾多可能影響電影票房的因素并展開了詳盡的分析,議題豐富、研究?jī)?nèi)容具備多樣性。第三,部分研究針對(duì)某一具體類型的電影展開票房研究,在前兩點(diǎn)優(yōu)勢(shì)基礎(chǔ)之上更兼具嚴(yán)謹(jǐn)性。

當(dāng)前相關(guān)研究也存在盲點(diǎn)。第一,多數(shù)研究雖然提出了眾多可能影響電影票房的因素并用實(shí)證定量分析,但自變量的提出缺少理論支撐,關(guān)于自變量的羅列缺少系統(tǒng)梳理。第二,2020 年開始的新冠疫情對(duì)電影市場(chǎng)產(chǎn)生了強(qiáng)烈的沖擊,而當(dāng)前研究所采用樣本都是疫情之前的電影票房數(shù)據(jù),無法對(duì)后疫情時(shí)期的電影市場(chǎng)復(fù)蘇有現(xiàn)實(shí)的指導(dǎo)意義。

(三)學(xué)術(shù)價(jià)值和研究創(chuàng)新點(diǎn)

基于研究現(xiàn)狀,筆者一方面借鑒國(guó)內(nèi)當(dāng)前研究的優(yōu)勢(shì),運(yùn)用多元線性回歸算法針對(duì)五一長(zhǎng)假這一具體類型的電影票房的影響因素開展研究,使結(jié)果兼具客觀性和嚴(yán)謹(jǐn)性,提出的策略建議更有現(xiàn)實(shí)指導(dǎo)意義。另一方面針對(duì)當(dāng)前的研究盲點(diǎn),在研究上作出了如下創(chuàng)新。第一,本文提出的自變量有理論支持。本文探究可能影響電影票房的因素時(shí)采用傳媒產(chǎn)品需求影響因素理論為基礎(chǔ)模型。一方面相比相關(guān)研究采用單純的量化分析或單純的質(zhì)化分析兼具理論支持和實(shí)證分析;另一方面相比以往對(duì)票房影響因素的孤立的研究,本文對(duì)自變量的提出更具系統(tǒng)性和客觀性。第二,本文研究后新冠疫情時(shí)期的第一個(gè)電影上映檔期——2023 年“五一”長(zhǎng)假的電影票房及其影響因素,對(duì)后疫情時(shí)期電影市場(chǎng)復(fù)蘇更具有現(xiàn)實(shí)指導(dǎo)意義。

二、研究概要設(shè)計(jì)

本研究以2023 年五一長(zhǎng)假電影每日票房及相關(guān)數(shù)據(jù)為數(shù)據(jù)集,選擇了需求影響因素模型為基礎(chǔ),運(yùn)用多元線性回歸機(jī)器學(xué)習(xí)算法構(gòu)建2023 年“五一”長(zhǎng)假電影單日票房影響因素模型,并分析影響票房因素得出各自變量影響程度的量化結(jié)果,得出結(jié)論并提出經(jīng)營(yíng)者提高票房收益的策略建議。

三、數(shù)據(jù)挖掘和數(shù)據(jù)預(yù)處理

(一)變量解釋

票房數(shù)據(jù)等于電影的售價(jià)乘以銷售量,間接反映消費(fèi)者的市場(chǎng)需求。因此,本文探究可能影響電影票房的因素時(shí)采用傳媒產(chǎn)品需求影響因素模型為基礎(chǔ)模型。相關(guān)定義指出,需求是在一定時(shí)期內(nèi),在既定的價(jià)格水平下,消費(fèi)者愿意并且能夠購買的商品量?!霸敢狻贝碇饔^傾向,“能夠購買”代表客觀購買力。因此,本文根據(jù)需求定義將自變量劃分為兩類,即主觀傾向和客觀購買力。再由傳媒產(chǎn)品需求影響因素模型對(duì)自變量作出更細(xì)致的界定。

1.因變量

本文以一部電影的單日票房數(shù)據(jù)為因變量,單位為萬元。需求是在一定時(shí)期內(nèi),在既定的價(jià)格下,消費(fèi)者愿意且能夠購買的商品數(shù)量。由于在一天之內(nèi)電影價(jià)格不發(fā)生變動(dòng),因此單日電影銷售額直接反映消費(fèi)者實(shí)時(shí)需求。且票房數(shù)據(jù)等于電影的售價(jià)乘以銷售量。因此,本研究的因變量即電影單日票房是消費(fèi)者需求的反映。

2.自變量

由于因變量是消費(fèi)者實(shí)時(shí)需求的反映,因此在考察其影響因素時(shí),本文基于影響傳媒產(chǎn)品需求的因素理論為基礎(chǔ)模型,并綜合現(xiàn)有相關(guān)研究成果,設(shè)定自變量是當(dāng)日電影價(jià)格、消費(fèi)者預(yù)期度、消費(fèi)者偏好度、影片題材。

因變量和自變量表述見下圖。

(二)對(duì)應(yīng)各變量的數(shù)據(jù)挖掘和數(shù)據(jù)預(yù)處理

1.因變量的數(shù)據(jù)來源

貓眼電影成立于2014 年,是中國(guó)一家提供電影信息、在線購票、在線觀影等服務(wù)的互聯(lián)網(wǎng)公司。本文從貓眼電影平臺(tái)上獲取2023 年“五一”長(zhǎng)假電影的每日票房。

2.自變量的數(shù)據(jù)預(yù)處理

(1)當(dāng)日電影價(jià)格。從貓眼平臺(tái)上獲取每日票房、每日?qǐng)龃?、每日?qǐng)鼍舜?、影片題材的原始數(shù)據(jù),整理成表。由于電影票房=售價(jià)×銷售量,運(yùn)用每日票房/(每日?qǐng)龃巍撩咳請(qǐng)鼍舜?公式可計(jì)算每部五一檔電影當(dāng)日的平均售價(jià)。

(2)吳發(fā)翔等指出,當(dāng)日消費(fèi)者預(yù)期度可綜合當(dāng)日電影的百度指數(shù)和當(dāng)日微博話題閱讀指數(shù)間接表示[6],經(jīng)歸一化和平均計(jì)算后結(jié)果值映射到[0,1]之間。其公式表述如下:

(3)豆瓣網(wǎng)是一個(gè)集結(jié)了大部分年輕人的社交平臺(tái)[7]。黑珍珍、孫琦通過對(duì)豆瓣網(wǎng)短評(píng)進(jìn)行文本情感分析得出結(jié)論[8],一部電影的評(píng)分與消費(fèi)者情感偏好度呈緊密的正相關(guān)關(guān)系。因此,消費(fèi)者偏好度可將豆瓣電影評(píng)分歸一化映射在[-1,1]之間表示,[-1,0)間的數(shù)值屬于消極情感、0 屬于中性、(0,1]屬于積極情感。其公式表述如下:

(4)影片類型。根據(jù)豆瓣網(wǎng)提供的影片類型劃分,本文將2023 年“五一檔”電影的歸為12 類,分別是:劇情、動(dòng)作、愛情、奇幻、動(dòng)畫、家庭、喜劇、災(zāi)難、冒險(xiǎn)、科幻、懸疑、犯罪。2023 年“五一”檔中一部電影可能涉及多個(gè)類型,因此調(diào)用python 環(huán)境中sklearn.feature_extraction.text 庫的CountVectorizer.transform 方法對(duì)影片類型變量進(jìn)行向量化處理,得到的向量化影片類型特征變量形式如下圖所示:

其中,一行代表一部電影某天的影片類型描述,每行都有12 列分別代表12 種類型,將對(duì)應(yīng)類型的元素賦值為1、不是則為0。

(三)數(shù)據(jù)挖掘結(jié)果

2023 年“五一”長(zhǎng)假共上映10 部電影,下表分別是“五一”期間每部電影每日票房及相關(guān)因素的數(shù)值結(jié)果。

表1 五一長(zhǎng)假電影當(dāng)日票房和用于計(jì)算當(dāng)日票價(jià)的數(shù)據(jù)

表2 電影當(dāng)日的百度指數(shù)和微博話題閱讀指數(shù)

表3 “五一”長(zhǎng)假影片評(píng)分

四、運(yùn)用多元線性回歸機(jī)器學(xué)習(xí)算法構(gòu)建模型

(一)基礎(chǔ)模型

對(duì)于2023 年“五一”長(zhǎng)假電影票房及影響因素的研究,采用傳媒產(chǎn)品需求影響因素模型為基礎(chǔ)模型。

(二)邏輯設(shè)計(jì)

基于基礎(chǔ)模型的2023 年“五一”長(zhǎng)假電影單日票房影響因素模型邏輯設(shè)計(jì)如下圖所示,其中各變量在本文第3 章中已被詳細(xì)解釋。

(三)2023 年五一長(zhǎng)假電影單日票房影響因素模型物理構(gòu)建

多元回歸是指因變量Y與多個(gè)自變量X1、X2......Xp有關(guān)[9]??赏ㄟ^調(diào)用python 環(huán)境中sklearn.linear_model 庫的多元回歸機(jī)器學(xué)習(xí)算法、擬合數(shù)據(jù),來得到因變量與多個(gè)自變量的等量關(guān)系,其一般形式為:

其中,X1、X2......Xp是p個(gè)可被量化的自變量,Y是因變量;a、b1......bp是多元(p元)線性回歸方程的回歸系數(shù),可反映相應(yīng)自變量對(duì)因變量的關(guān)系和影響程度。

筆者調(diào)用sklearn.linear_model 庫的多元回歸算法搭建回歸模型并擬合處理后的數(shù)據(jù):

由于單日票房單位遠(yuǎn)大于自變量單位,還要對(duì)因變量取10 的對(duì)數(shù)來讓模型標(biāo)準(zhǔn)化,以便回歸系數(shù)更好反映影響程度。

搭建成的多元線性回歸模型如下:

五、2023年五一長(zhǎng)假電影每日票房影響因素分析

筆者使用模型的coef_屬性查看2023 年五一長(zhǎng)假電影單日票房與影響因素的多元線性回歸結(jié)果(見下表)。

自變量特征 具體因素 回歸系數(shù)coef當(dāng)日電影價(jià)格 0.0009318443732782023當(dāng)日消費(fèi)者預(yù)期度 0.37235185460018966消費(fèi)者偏好度 -1.7887402565835517影片類型劇情 -0.026422022342088736動(dòng)作 0.7378383804389359愛情 -0.8726244638046137奇幻 -0.23725678694483884動(dòng)畫 0.2861692589662949家庭 1.1485297778886947喜劇 0.6599173892713924災(zāi)難 -1.2589825844032914冒險(xiǎn) 0.022490449679364664科幻 0.02249044967936461懸疑 -0.5026408562263485犯罪 -0.5026408562263486

其中,回歸系數(shù)coef 表示各自變量的影響程度,回歸系數(shù)為正數(shù)表示因變量與自變量成正相關(guān)線性關(guān)系,回歸系數(shù)為負(fù)數(shù)表示因變量與該因素成反相關(guān)線性關(guān)系,且回歸系數(shù)越大反映該因素對(duì)因變量的影響程度越大。

六、結(jié)論

第一,2023 年“五一”長(zhǎng)假電影單日票房與當(dāng)日電影價(jià)格呈極其輕微的正相關(guān)關(guān)系,電影票價(jià)對(duì)單日票房幾乎沒有影響。

第二,2023 年“五一”長(zhǎng)假電影單日票房與消費(fèi)者預(yù)期度呈正相關(guān)關(guān)系,消費(fèi)者預(yù)期越高,2023 年“五一”長(zhǎng)假電影單日票房越高。電影經(jīng)營(yíng)者為增加收益可適當(dāng)加強(qiáng)全媒體電影營(yíng)銷,提高觀眾的預(yù)期度。

第三,2023 年“五一”長(zhǎng)假電影單日票房與消費(fèi)者偏好度呈顯著的負(fù)相關(guān)關(guān)系,消費(fèi)者偏好度越高,2023年“五一”長(zhǎng)假電影單日票房反而越低。這反映了當(dāng)前國(guó)產(chǎn)電影“叫座不叫好”的現(xiàn)狀,電影經(jīng)營(yíng)者應(yīng)當(dāng)在追求經(jīng)濟(jì)效益的同時(shí)注意提高社會(huì)效益,應(yīng)當(dāng)注重作品質(zhì)量的提升來滿足受眾的精神需求,而非一味炒作營(yíng)銷,過度追求經(jīng)濟(jì)效益。

第四,探究2023 年“五一”電影單日票房與影片類型的相關(guān)度發(fā)現(xiàn),2023 年“五一”長(zhǎng)假電影單日票房與動(dòng)作、動(dòng)畫、家庭、喜劇、冒險(xiǎn)、科幻呈顯著的正相關(guān)關(guān)系,與劇情、愛情、奇幻、災(zāi)難、懸疑、犯罪呈負(fù)相關(guān)關(guān)系。且對(duì)票房正向影響程度由大到小的因素依次是:家庭>動(dòng)作>喜?。緞?dòng)畫>冒險(xiǎn)=科幻;對(duì)票房負(fù)向影響程度從大到小依次是:懸疑>犯罪>災(zāi)難>愛情>奇幻。

可見“五一”長(zhǎng)假消費(fèi)者傾向于選擇輕松娛樂的家庭喜劇,闔家?guī)Ш⒆涌磩?dòng)畫片或者冒險(xiǎn)動(dòng)作片,而回避懸疑犯罪或者災(zāi)難的情緒嚴(yán)肅類電影和愛情片。電影經(jīng)營(yíng)者如果想以后在“五一”檔上映電影獲得不錯(cuò)的票房,應(yīng)當(dāng)在生產(chǎn)影片時(shí)把類型定位放在家庭、動(dòng)作、喜劇、動(dòng)畫、冒險(xiǎn)、科幻上面,讓電影整體基調(diào)輕松歡快、富有刺激;減少情緒基調(diào)較為悲涼、嚴(yán)肅的電影。

七、結(jié)語

筆者以2023 年“五一”電影為研究對(duì)象,基于傳媒產(chǎn)品需求影響因素模型構(gòu)建因變量和自變量,運(yùn)用多元線性回歸算法擬合數(shù)據(jù)后,得到各自變量對(duì)2023 年“五一”電影單日票房的回歸系數(shù),經(jīng)歸納得出以下結(jié)論。

對(duì)2023 年“五一”電影單日票房正向影響程度從大到小的因素是:家庭、動(dòng)作、喜劇、消費(fèi)者預(yù)期度。對(duì)2023年“五一”電影單日票房負(fù)向影響程度從大到小的因素是:消費(fèi)者偏好度、災(zāi)難、愛情、懸疑、犯罪。因此,電影經(jīng)營(yíng)者在設(shè)計(jì)“五一”檔電影時(shí),首先,需把劇情內(nèi)容放在首位,在劇情設(shè)置時(shí)突出家庭、動(dòng)作、喜劇的元素;其次,加強(qiáng)影片上映前的全媒體渠道營(yíng)銷,拉高消費(fèi)者預(yù)期度;最后,減少生產(chǎn)劇情緊張?bào)@險(xiǎn)的影片和愛情電影,從而增加票房收入,獲取經(jīng)濟(jì)效益。同時(shí),電影經(jīng)營(yíng)者如果想在謀取經(jīng)濟(jì)效益的同時(shí)取得后續(xù)持久的口碑,需要在導(dǎo)演、拍攝、剪輯時(shí)注重作品質(zhì)量,給消費(fèi)者以良好的視聽體驗(yàn)。

猜你喜歡
電影票房五一長(zhǎng)假
新年新氣象,元旦來帶頭 2021年1月電影票房排行榜
打鐵還需自身硬 2020年10月電影票房排行榜
意料之中,整體表現(xiàn)平淡 2020年9月電影票房排行榜
暑期檔繼續(xù)“遇冷”2019年7月電影票房排行榜
長(zhǎng)假(外一首)
天津詩人(2017年2期)2017-11-29 01:24:28
長(zhǎng)假
分憂(2017年5期)2017-05-05 14:45:44
年度拼假攻略
分身記
祁门县| 淮滨县| 且末县| 桐梓县| 淅川县| 葫芦岛市| 恭城| 西华县| 谢通门县| 龙门县| 阿克陶县| 新乡市| 湄潭县| 吴堡县| 桃园县| 梨树县| 朝阳县| 永顺县| 澄迈县| 罗江县| 湟中县| 嘉义县| 宜宾县| 柘荣县| 江都市| 临夏市| 衡南县| 丰都县| 讷河市| 东乡| 罗山县| 闻喜县| 眉山市| 榆树市| 元谋县| 太谷县| 蒙山县| 恭城| 阜城县| 宁强县| 尉犁县|