常尚鵬
摘 要:直播營(yíng)銷(xiāo)以視頻傳播為媒介,以展現(xiàn)產(chǎn)品效果為核心,基于此達(dá)到更高效的產(chǎn)品銷(xiāo)售能力。后疫情時(shí)代基于互聯(lián)網(wǎng)的直播營(yíng)銷(xiāo)模式的出現(xiàn)不僅豐富了互聯(lián)網(wǎng)的內(nèi)容表現(xiàn)形式,還拓展了傳統(tǒng)的商業(yè)營(yíng)銷(xiāo)模式,推動(dòng)國(guó)民經(jīng)濟(jì)高質(zhì)量發(fā)展。文章以微博平臺(tái)關(guān)于直播營(yíng)銷(xiāo)熱議的內(nèi)容作為主要分析內(nèi)容,爬取了從2023年1月7日至1月11日的數(shù)據(jù),綜合利用知網(wǎng)停用詞詞庫(kù)對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,然后采用聚類(lèi)算法建立了基聚類(lèi)器,最后再對(duì)基聚類(lèi)器的數(shù)據(jù)進(jìn)行了綜合分析。實(shí)驗(yàn)結(jié)果表明,在后疫情時(shí)代,群眾有很多熱議焦點(diǎn)討論,這些討論也會(huì)隨著時(shí)間的推移影響著熱點(diǎn)話題和輿情的發(fā)展與演變。因此,準(zhǔn)確判斷網(wǎng)民對(duì)熱點(diǎn)話題的態(tài)度傾向,有助于相關(guān)部門(mén)進(jìn)行相應(yīng)的輿論引導(dǎo)。
關(guān)鍵詞:直播營(yíng)銷(xiāo);后疫情時(shí)代;熱議焦點(diǎn);
中圖分類(lèi)號(hào):F713.3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1005-6432(2023)18-0000-00
1 引言
微博作為中國(guó)熱門(mén)的網(wǎng)絡(luò)社交軟件及信息甲流平臺(tái),自創(chuàng)建以來(lái)積累了大量用戶,根據(jù)《2020微博用戶發(fā)展報(bào)告》顯示,在活躍用戶數(shù)方面,新浪網(wǎng)微博月活躍用戶5.11億,日活躍用戶2.24億[1]。隨著淘寶、京東、拼多多等以現(xiàn)場(chǎng)直播的方法進(jìn)行銷(xiāo)售的電商平臺(tái)日益興起,“直播營(yíng)銷(xiāo)”進(jìn)入了大眾視線。其中一位新疆的帶貨主播阿里木因?yàn)椤澳氵@背景太假了”這一話題沖上微博熱搜,其賬號(hào)“疆域阿力木”也徹底火出了圈,并且在一夜之間漲粉40余萬(wàn),其直播間中新疆特產(chǎn)的帶貨量也直線上升。由此可知,直播營(yíng)銷(xiāo)充分顯示了其打破地域空間限制的優(yōu)勢(shì),對(duì)各行各業(yè)在疫情后的復(fù)業(yè)復(fù)工起到了積極作用。除此之外在政策層面上“直播營(yíng)銷(xiāo)”完美契合扶貧政策,促進(jìn)了國(guó)家有針對(duì)性的扶貧戰(zhàn)略的實(shí)施,對(duì)電商發(fā)展有著重要的戰(zhàn)略支撐作用。
我國(guó)在線營(yíng)銷(xiāo)已成為繼廣告之后又一重要經(jīng)濟(jì)增長(zhǎng)點(diǎn)。近年來(lái),直播平臺(tái)呈現(xiàn)爆發(fā)式增長(zhǎng)態(tài)勢(shì),直播帶貨行業(yè)體量增速迅猛。疫情爆發(fā)后的隔離居家舉措,促進(jìn)直播行業(yè)成為了給人民群眾帶來(lái)生活文娛的主要平臺(tái)與工具,不論是政府官方信息的宣發(fā)或是粉絲線上的直播帶貨活動(dòng),都使得直播行業(yè)受眾群體急劇增長(zhǎng),以電商直播為代表的“直播+”行業(yè)也迎來(lái)了爆發(fā)。2022年12月以來(lái),國(guó)家疫情政策進(jìn)一步調(diào)整,將于2023年1月8日將新型冠狀病毒感染從“乙類(lèi)甲管”調(diào)整為“乙類(lèi)乙管”,這是自2020年1月20日我國(guó)開(kāi)始實(shí)施嚴(yán)格的流行癥甲類(lèi)防控措施后,疫情防控政策的又一次重大調(diào)整,后疫情時(shí)代開(kāi)始到來(lái)[2]。在后疫情時(shí)期,電商與直播趨勢(shì)不減,直播-體育,直播-文化的服務(wù)方式也日益被催生發(fā)展,而5G時(shí)代也將以更高的數(shù)據(jù)傳輸速率,催生出更多的直播服務(wù)方式。
綜上所述,研究后疫情時(shí)代網(wǎng)民對(duì)“直播營(yíng)銷(xiāo)”熱議焦點(diǎn)是十分必要的。文章采用機(jī)器學(xué)習(xí)方法對(duì)微博評(píng)論內(nèi)容進(jìn)行數(shù)據(jù)分析,形成數(shù)據(jù)化、語(yǔ)義化的特征詞,同時(shí)生成詞向量矩陣,并對(duì)擁有共同特征的群體進(jìn)行聚類(lèi)劃分,不僅了解網(wǎng)民對(duì)熱點(diǎn)話題的態(tài)度傾向,而且緊密跟蹤、精準(zhǔn)分析不同類(lèi)別網(wǎng)民的情感特征,從而進(jìn)行相應(yīng)的輿論引導(dǎo)。分析熱點(diǎn)話題的演化趨勢(shì)對(duì)研究相似事件有很強(qiáng)的借鑒意義,比如在同類(lèi)事件發(fā)生時(shí),可以快速預(yù)測(cè)話題的情感發(fā)展趨勢(shì)。
2 文獻(xiàn)綜述
當(dāng)前,學(xué)術(shù)界較多學(xué)者以電子商務(wù)視頻推廣方式對(duì)網(wǎng)民的熱議焦點(diǎn)進(jìn)行了研究。在視頻營(yíng)銷(xiāo)概念方面,許一婷、林穎等(2021)[3]對(duì)網(wǎng)絡(luò)直播銷(xiāo)售推動(dòng)網(wǎng)民消費(fèi)的內(nèi)在機(jī)制展開(kāi)分析,認(rèn)為網(wǎng)絡(luò)直播銷(xiāo)售可有效地引導(dǎo)消費(fèi)者注意力,進(jìn)而推動(dòng)消費(fèi)。陶安等(2021)[4]則通過(guò)雙渠道視角實(shí)證剖析了直播電子商務(wù)用戶行為的形成機(jī)理,認(rèn)為場(chǎng)景氛圍、主播專業(yè)技術(shù)以及消費(fèi)者信任感知對(duì)用戶的信賴感和消費(fèi)都有明顯積極作用。這些專家還針對(duì)感知價(jià)值在電子商務(wù)直播活動(dòng)與顧客購(gòu)物意愿之間存在何種關(guān)系展開(kāi)討論。閆秀霞等人(2021)[5]就直播活動(dòng)中帶貨對(duì)顧客購(gòu)物行為產(chǎn)生的作用進(jìn)行研究,認(rèn)為顧客的購(gòu)物行為主要受直播特性的影響,個(gè)性化服務(wù)是關(guān)鍵因素,而感知價(jià)值則在二者之間具有了橋梁功能。賈曉峰(2019)[6]通過(guò)實(shí)證研究,發(fā)現(xiàn)主播社會(huì)的存在與其他買(mǎi)家社會(huì)存在對(duì)顧客購(gòu)物意愿具有間接正向作用,且對(duì)娛樂(lè)價(jià)值、功利價(jià)值以及融入意愿具有部分重要意義。
3 研究模型與框架
該方法主要包含了兩個(gè)方面,首先利用中文分詞第三方數(shù)據(jù)庫(kù)對(duì)微博采集的信息加以預(yù)處理;然后將和方法結(jié)合,構(gòu)建詞向量,統(tǒng)計(jì)每個(gè)詞語(yǔ)的權(quán)值,將文本轉(zhuǎn)為詞頻矩陣[7],獲取特征詞和向量矩陣;最后利用機(jī)器學(xué)習(xí)聚類(lèi)算法獲得聚類(lèi)結(jié)果。具體用到的模型如下所示。
3.1
類(lèi)主要統(tǒng)計(jì)每一段文本中每個(gè)單詞出現(xiàn)的頻率[8],然后把文本中的詞轉(zhuǎn)化為的矩陣,每一行表示一段文本的詞頻統(tǒng)計(jì)結(jié)果。與詞袋模型類(lèi)似,其基本原理是將所有單詞在不考慮語(yǔ)義和單詞出現(xiàn)的順序的情況下先將文本中每個(gè)出現(xiàn)過(guò)的詞匯單獨(dú)視為一列特征裝進(jìn)一個(gè)袋子里,構(gòu)成一個(gè)詞匯表[8],并且認(rèn)為每個(gè)單詞都是獨(dú)立的部分。
如果只想要特定的詞匯,而忽略其他的詞匯,則可以在()指定詞匯,產(chǎn)生的結(jié)果是少了該詞的頻率和的數(shù)值。
3.2
是一種統(tǒng)計(jì)方法,用來(lái)評(píng)估某個(gè)字詞對(duì)某種文字語(yǔ)言集或文章語(yǔ)句庫(kù)中的另一類(lèi)文章的重要性水平[9]。字詞的重要性將隨著其在數(shù)據(jù)庫(kù)中出現(xiàn)的頻率呈反比例上升,也將會(huì)隨著其在數(shù)據(jù)庫(kù)中出現(xiàn)的次數(shù)呈反相關(guān)減少。加權(quán)的各種方式也作為對(duì)文章和用戶之間檢索結(jié)果的相關(guān)性水平的衡量或評(píng)估。的主要觀點(diǎn)是:假設(shè)某個(gè)單詞或者短語(yǔ)在某個(gè)篇章中出現(xiàn)的頻次高,而且在其他篇章中也極少出現(xiàn)[10],即為該單詞或短語(yǔ)具備了很高的級(jí)別劃分功能,因此可以用來(lái)排序。實(shí)際上是:。
3.3? 聚類(lèi)算法
算法是聚類(lèi)算法的一種代表形式,在實(shí)際聚類(lèi)算法中十分普遍。一般情況下,算法首先對(duì)原型進(jìn)行初始化,進(jìn)而再對(duì)原型進(jìn)行迭代優(yōu)化計(jì)算。在計(jì)算中,簇的數(shù)量通常用表示,是一個(gè)超參數(shù),需要人為輸入來(lái)確定。的核心工作便是按照一個(gè)已經(jīng)確定了的,尋找出個(gè)最優(yōu)的質(zhì)心,并把距離這個(gè)質(zhì)心最近的數(shù)據(jù)分別配置到由這個(gè)質(zhì)心代表的簇中去[11]。
給定樣本集,算法針對(duì)聚類(lèi)所得簇劃分最小化平方誤差
其中是簇的均值向量。E值在一定程度上刻畫(huà)了簇內(nèi)樣本圍繞簇均值向量的緊密程度,其值越小則簇內(nèi)樣本相似度越高。
3.4? 肘部法則
肘部法則對(duì)于算法的值確定起到指導(dǎo)作用。
簡(jiǎn)要介紹一下肘部法則:軸為(誤差平方和),軸為的取值。隨著的增加,會(huì)隨之降低,當(dāng)下降幅度明顯趨于平緩時(shí)[12],取該值為值。
算法將最小樣本的質(zhì)點(diǎn)間距平方誤差作為目標(biāo)函數(shù),亦即各個(gè)簇的質(zhì)點(diǎn)和簇內(nèi)樣本點(diǎn)之間的平方間距誤差之和稱為畸變程度。對(duì)于每一個(gè)簇而言,它的畸變程度越低,就意味著簇內(nèi)成員更密集;畸變程度越高,就意味著簇內(nèi)組織結(jié)構(gòu)越疏松。雖然畸變程度通常都會(huì)隨類(lèi)別的增加而降低,但是針對(duì)具有一些區(qū)分度的資料來(lái)說(shuō)[13],當(dāng)超過(guò)某個(gè)臨界點(diǎn)時(shí)畸變程度就會(huì)獲得很大提高[14],隨后慢慢減少,而這些臨界點(diǎn)也可考慮用作聚集性能比較好的起點(diǎn)。
網(wǎng)民熱議焦點(diǎn)分析的研究框架主要包括數(shù)據(jù)采集與預(yù)處理、獲取熱議焦點(diǎn)特征詞與向量矩陣、聚類(lèi)算法實(shí)現(xiàn)、熱議焦點(diǎn)主題聚類(lèi)、結(jié)果分析5個(gè)部分。
4? 實(shí)驗(yàn)分析
4.1? 數(shù)據(jù)預(yù)處理
文本數(shù)據(jù)預(yù)處理通常都要進(jìn)行分詞方法,分詞之后就會(huì)進(jìn)行雙向量化的方法。在啟動(dòng)以前就必須要完成對(duì)中文文本的預(yù)處理過(guò)程,包含了文字清除、分詞并且去掉停用詞等的步驟。文字清除就是過(guò)濾掉所有中文文本中的無(wú)用文字。停用詞是指文本中沒(méi)有太大的實(shí)際意義但存在數(shù)量較多的功能詞。文章利用知網(wǎng)自然語(yǔ)言停用詞表作為停用詞庫(kù),將微博文本與停用詞庫(kù)中的詞一一對(duì)應(yīng),刪除文本中與詞庫(kù)相匹配的詞。
分詞也影響著熱議焦點(diǎn)分析的結(jié)果,本文實(shí)驗(yàn)中采用進(jìn)行分詞。分詞是一個(gè)基于統(tǒng)計(jì)方法的分詞模式,庫(kù)的分詞原理是:首先通過(guò)對(duì)前綴字典中的詞圖掃描方法研究,得到句子中漢字所有可能成詞情況的全向無(wú)環(huán)圖,之后再利用動(dòng)態(tài)分析尋找最大概率路徑,進(jìn)而找到基于詞頻的最佳切分組合,而針對(duì)未注冊(cè)詞,則選擇基于漢字成詞方法的模式[15],最后再利用方法把關(guān)聯(lián)性大的漢字組合成詞組,實(shí)現(xiàn)分詞方法。
4.2? 獲取特征詞與向量矩陣
文本分析數(shù)據(jù)通常為以詞為單元的信息。利用文本模型將文字表示成矢量,就能夠把文本處理過(guò)程簡(jiǎn)化為在矢量空間中的矢量操作了。將文字轉(zhuǎn)換成矢量空間后,文本的所有詞匯都對(duì)應(yīng)著矢量的各個(gè)屬性項(xiàng)維度,所以各個(gè)文本中的詞匯所對(duì)應(yīng)的維度構(gòu)成了一個(gè)空間結(jié)構(gòu),而特征權(quán)值項(xiàng)就是指所有詞匯的每一維的取值。此外,由于文本中作為特征項(xiàng)的詞沒(méi)有重復(fù),即因特征項(xiàng)互異,對(duì)文本的內(nèi)部結(jié)構(gòu)也無(wú)需考慮,所以特征項(xiàng)沒(méi)有先后順序。
計(jì)算機(jī)無(wú)法直接辨別中文文本,需將它轉(zhuǎn)化為機(jī)器可識(shí)別的結(jié)構(gòu)化形態(tài),詞向量訓(xùn)練就是以向量描述中文文本的分詞結(jié)果。用高維向量表示詞,并將相似意義的詞置于相鄰的地方,而且所使用的都是實(shí)值矢量(不局限于整數(shù))。
4.3? 聚類(lèi)算法實(shí)現(xiàn)
聚類(lèi)算法通常采用歐氏距離作為衡量數(shù)據(jù)間相似性的指標(biāo),相似性越大,距離越小。其核心思想是隨機(jī)設(shè)置個(gè)初始聚類(lèi)中心,依據(jù)每個(gè)數(shù)據(jù)對(duì)象與聚類(lèi)中心之間的相似程度,不斷地更新聚類(lèi)結(jié)果,直至收斂。誤差平方和是衡量聚類(lèi)算法中聚類(lèi)劃分結(jié)果的精確度指標(biāo)[16],計(jì)算公式為:
其中:為樣本點(diǎn),為第個(gè)聚類(lèi)中心,為樣本點(diǎn)到類(lèi)的歐氏距離。誤差平方和越小,表明精確度越高,聚類(lèi)效果越好[16]。根據(jù)這一評(píng)價(jià)指標(biāo),本文首先構(gòu)造了從循環(huán)的聚類(lèi)器,同時(shí)估計(jì)特征詞在該類(lèi)文本中的擬合權(quán)重,計(jì)算出,同時(shí)繪制出以為軸,為軸的聚類(lèi)曲線。如圖2所示,曲線有3個(gè)拐點(diǎn),分別為時(shí)。當(dāng)小于拐點(diǎn)值的時(shí)候,曲線下降較快;越過(guò)拐點(diǎn)值后,下降趨于平緩。結(jié)合聚類(lèi)算法的應(yīng)用場(chǎng)景,聚類(lèi)結(jié)果應(yīng)與曲線波動(dòng)率呈正相關(guān)。
4.4? 獲取聚類(lèi)結(jié)果
執(zhí)行結(jié)果如上圖所示。文章依據(jù)肘部法則,發(fā)現(xiàn)曲線在處下降幅度較大,可以視為“肘部”。所以指定參數(shù)為10,創(chuàng)建分類(lèi)器對(duì)象,用訓(xùn)練器數(shù)據(jù)weight擬合分類(lèi)器模型。
5 結(jié)果分析
根據(jù)上面得出的結(jié)果可以看出,隨著時(shí)間的推移,人們對(duì)于熱點(diǎn)話題的討論會(huì)出現(xiàn)明顯的起伏變化。結(jié)果較大的類(lèi)別,其對(duì)應(yīng)的特征詞大多都是當(dāng)下熱度最高的,比如“直播帶貨”“品牌營(yíng)銷(xiāo)”“互聯(lián)網(wǎng)經(jīng)濟(jì)”等等??梢钥闯?,網(wǎng)民熱議的焦點(diǎn)影響著熱點(diǎn)話題的發(fā)展和演變??缇畴娚唐脚_(tái)正作為全球電子消費(fèi)市場(chǎng)的主要商業(yè)活動(dòng)途徑,同時(shí)互聯(lián)網(wǎng)直播媒體也越來(lái)越被關(guān)注,作為企業(yè)品牌推廣宣傳的重要陣腳。直播營(yíng)銷(xiāo)的主要表現(xiàn)形式是直播,核心內(nèi)容仍然是營(yíng)銷(xiāo),直播內(nèi)容質(zhì)量的高低往往決定著直播營(yíng)銷(xiāo)的成功與否。品牌應(yīng)堅(jiān)持輸出優(yōu)質(zhì)內(nèi)容,創(chuàng)新直播形式,策劃創(chuàng)新直播流程和直播環(huán)節(jié),提高內(nèi)容質(zhì)量,積極探索新的營(yíng)銷(xiāo)策略,開(kāi)發(fā)多元化和有深度的產(chǎn)品。品牌直播營(yíng)銷(xiāo)內(nèi)容的策劃要遵循平臺(tái)規(guī)則和國(guó)家政策,避免出現(xiàn)違禁詞和有爭(zhēng)議的產(chǎn)品,做到科學(xué)綠色直播。同時(shí),要充分了解目標(biāo)銷(xiāo)售國(guó)家或地區(qū)的文化和最新流行趨勢(shì),打造相應(yīng)的直播內(nèi)容。
6 結(jié)論
微博熱門(mén)話題表示了網(wǎng)民們對(duì)現(xiàn)實(shí)生活問(wèn)題的看法,通過(guò)識(shí)別微博熱門(mén)話題可以便于網(wǎng)絡(luò)輿情監(jiān)控。對(duì)個(gè)人而言,為網(wǎng)絡(luò)熱點(diǎn)話題的有效監(jiān)管提供了科學(xué)的分析研究方法和思路;對(duì)于國(guó)家,監(jiān)管部門(mén)可以準(zhǔn)確把握互聯(lián)網(wǎng)變化趨勢(shì),正確引導(dǎo)網(wǎng)民態(tài)度傾向,實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)、監(jiān)控、引導(dǎo)微博輿情的目標(biāo)。同時(shí),通過(guò)跨境電商模式進(jìn)行直播營(yíng)銷(xiāo),我國(guó)的許多品牌開(kāi)始走出中國(guó)、走向世界。目前,國(guó)內(nèi)外各大跨境電商平臺(tái)紛紛大力支持和發(fā)展直播營(yíng)銷(xiāo)業(yè)務(wù),我國(guó)也將借此契機(jī),創(chuàng)新跨境電商直播營(yíng)銷(xiāo)新模式,不斷擴(kuò)大影響范圍。
參考文獻(xiàn):
[1]郭越. 融合情感的微博熱點(diǎn)話題發(fā)現(xiàn)與演化分析[D].大連:大連理工大學(xué),2021.
[2]陳芳,董瑞豐.新冠疫情防控近三年后為何回歸乙類(lèi)管理[N].新華每日電訊,2022-12-27(003).
[3]許一婷,林穎.網(wǎng)絡(luò)直播營(yíng)銷(xiāo)驅(qū)動(dòng)消費(fèi)行為的內(nèi)在機(jī)理——沉浸傳播、身體媒介化與情感注入新視點(diǎn)[J].福建論壇(人文社會(huì)科學(xué)版),2021(12):111-117.
[4]陶安,王江濤,王京安.直播電商消費(fèi)者消費(fèi)行為產(chǎn)生機(jī)制研究——基于雙渠道影響視角[J].企業(yè)經(jīng)濟(jì),2021,40(11):64-71.
[5]閆秀霞,董友衡,張萌萌,喬靜.直播帶貨對(duì)消費(fèi)者購(gòu)買(mǎi)行為的影響研究——以感知價(jià)值為中介[J].價(jià)格理論與實(shí)踐,2021(6):137-140.
[6]賈曉鋒.電商直播平臺(tái)消費(fèi)者購(gòu)買(mǎi)及融入意愿研究[D].北京:北京郵電大學(xué),2019.
[7]彭爭(zhēng),唐東明.基于文本分類(lèi)的農(nóng)業(yè)種植信息集成推薦方法研究[J].西南民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,44(1):69-74.
[8]黃琨,李建敦,何超,等.商品虛假評(píng)論的檢測(cè)及可視化研究[J].福建電腦,2021,37(9):15-18.
[9]李楚.基于TF-IDF算法的文本量化方法及作者識(shí)別應(yīng)用[J].現(xiàn)代信息科技,2022,6(19).
[10]王心儀,程劍鋒,劉育君.基于TF-IDF加權(quán)樸素貝葉斯算法的ATP車(chē)載設(shè)備測(cè)試案例分類(lèi)研究[J].鐵路計(jì)算機(jī)應(yīng)用,2022,31(12).
[11]孫穎,張毅,丁衛(wèi)平,等.基于近似骨架和混合蛙跳算法的方法及其在眼底病歷圖像中的應(yīng)用[J].南通大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,19(2):36-42.
[12]李賀,谷瑩,劉嘉宇.數(shù)據(jù)驅(qū)動(dòng)下基于語(yǔ)義相似性的產(chǎn)品需求識(shí)別研究[J].情報(bào)理論與實(shí)踐,2022,45(5):99-106.
[13]張娟.基于聚類(lèi)算法的5G終端客戶價(jià)值分析[J].電信快報(bào),2020(9):29-33.
[14]蔡軍,謝航,謝濤,等.基于改進(jìn)K-Means++分時(shí)電量聚類(lèi)與行業(yè)用電行為分析[J].科學(xué)技術(shù)與工程,2021,21(27).
[15]劉為懷,才華,何東杰.一種基于中文分詞和數(shù)據(jù)聚合的餐飲行為特征挖掘方法[J].軟件產(chǎn)業(yè)與工程,2015(4).
[16]王惠惠,董永權(quán),和文斌,等.基于聚類(lèi)集成的學(xué)生群體畫(huà)像構(gòu)建[J].江蘇師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,40(3):46-50.