国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

運(yùn)用社交媒體推動(dòng)電力行業(yè)企業(yè)文化建設(shè)的策略及建議
——基于LDA模型和TF-IDF算法的微博主題聚類(lèi)研究

2023-02-09 08:46:59潘亞平高育棟
企業(yè)改革與管理 2023年23期
關(guān)鍵詞:特征詞文檔維度

潘亞平 王 瑋 高育棟

(國(guó)網(wǎng)甘肅省電力公司,甘肅 蘭州 730000)

一、研究背景

企業(yè)文化是企業(yè)在長(zhǎng)期發(fā)展過(guò)程中形成的,能決定企業(yè)生存和發(fā)展的軟實(shí)力。它是一種多元、共融的文化,最終被轉(zhuǎn)化為精神信念,是企業(yè)員工精神素養(yǎng)的重要來(lái)源。良好的企業(yè)文化建設(shè)是推動(dòng)企業(yè)管理升級(jí)和企業(yè)生產(chǎn)發(fā)展的有效措施。在中國(guó)企業(yè)改革創(chuàng)新發(fā)展的新形勢(shì)下,企業(yè)應(yīng)著力將其文化內(nèi)化為企業(yè)員工尤其是青年職工的精神素養(yǎng)。

互聯(lián)網(wǎng)環(huán)境下,運(yùn)用社交媒體傳播企業(yè)文化成為企業(yè)戰(zhàn)略管理的共識(shí)。當(dāng)前,面對(duì)內(nèi)外部環(huán)境變化,企業(yè)文化是推動(dòng)企業(yè)轉(zhuǎn)型升級(jí)的核心內(nèi)容之一。國(guó)家電網(wǎng)甘肅省電力公司(以下簡(jiǎn)稱“國(guó)網(wǎng)甘肅公司”)是國(guó)家電網(wǎng)有限公司的全資子公司,本研究以“國(guó)網(wǎng)甘肅省電力公司微博”為研究對(duì)象,探討新媒體環(huán)境下企業(yè)如何利用社交媒體深耕企業(yè)文化建設(shè)。

二、研究設(shè)計(jì)

對(duì)內(nèi)溝通和對(duì)外宣傳是企業(yè)文化和企業(yè)精神素養(yǎng)的“播種機(jī)”和“放大器”。對(duì)內(nèi),通過(guò)媒體文化宣傳、社交活動(dòng)等統(tǒng)一企業(yè)員工思想,形成合力;對(duì)外,發(fā)揮媒體傳播宣傳作用、開(kāi)展文化交流活動(dòng)、擴(kuò)大品牌影響力、加強(qiáng)員工素質(zhì)、樹(shù)立企業(yè)形象。因此,企業(yè)的社交媒體賬號(hào)承擔(dān)著培育企業(yè)文化和企業(yè)精神素養(yǎng)的重任。與傳統(tǒng)調(diào)研或開(kāi)座談會(huì)的研究方法相比,使用文本分析或主題模型更容易從大規(guī)模非結(jié)構(gòu)化文本中發(fā)現(xiàn)企業(yè)的文化優(yōu)勢(shì),能全面挖掘反映企業(yè)文化的各個(gè)維度。如果僅依靠人工內(nèi)容編碼,研究的穩(wěn)健性容易受個(gè)人主觀判斷影響,分類(lèi)結(jié)果可重復(fù)性較差。而文本主題模型依賴于機(jī)器學(xué)習(xí)的范式,可以使企業(yè)文化和企業(yè)精神素養(yǎng)的發(fā)現(xiàn)更具客觀性和一致性。此外,使用主題模型進(jìn)行研究還有以下優(yōu)勢(shì):

第一,主題模型可以發(fā)現(xiàn)隱藏的主題信息。企業(yè)文化和企業(yè)精神素養(yǎng)是一個(gè)多維的、包含隱性知識(shí)的系統(tǒng)結(jié)構(gòu)。直接通過(guò)人工識(shí)別文本中的文化維度非常困難。但主題模型通過(guò)詞頻統(tǒng)計(jì)與貝葉斯推理,可以從大量企業(yè)微博文本中發(fā)現(xiàn)潛在的主題信息,無(wú)需人工標(biāo)注和監(jiān)督。這使得我們可以充分利用數(shù)據(jù)本身包含的信息自動(dòng)發(fā)現(xiàn)文本集合中的主題結(jié)構(gòu),揭示企業(yè)文化和精神素養(yǎng)的多維組成。

第二,主題模型可以提取文檔—主題分布。單個(gè)企業(yè)微博文本中可能同時(shí)包含多個(gè)企業(yè)文化維度的信息。主題模型可以評(píng)估每個(gè)主題在給定文本中的生成概率,將文本對(duì)每個(gè)主題的支持度作為權(quán)重,進(jìn)而可以定量分析不同企業(yè)文化主題的融合情況,這為下一步解讀企業(yè)文化的內(nèi)涵提供了量化支撐。

第三,主題模型可以獲取主題詞分布。主題模型不僅可以發(fā)現(xiàn)主題,還可以輸出每個(gè)主題的關(guān)鍵詞分布,這些詞匯可以直觀地反映主題的語(yǔ)義內(nèi)容。研究可以根據(jù)主題詞分布來(lái)描述主題,并與企業(yè)文化和精神素養(yǎng)的某一內(nèi)在維度或要素建立關(guān)聯(lián)。

三、研究方法

(一)主題提取

主題提取又稱特征提取,是獲取文本有價(jià)值信息最有效的方式之一。它著眼于關(guān)鍵詞的出現(xiàn)頻率,傾向于直接從文檔中獲取關(guān)鍵詞,借助詞頻-逆文檔頻率(TF-IDF)算法獲得高權(quán)重詞,并將其列為特征選項(xiàng)。景麗萍(Li-Ping Jing)等采用TF-IDF作為特征選取方法,為文本數(shù)據(jù)建立向量空間模型[1]。張韋引入WordNet本體庫(kù)在Web文本間進(jìn)行語(yǔ)義相似度計(jì)算,利用文本之間的相似度進(jìn)行主題的語(yǔ)義級(jí)別合并,對(duì)文本進(jìn)行聚類(lèi)后再在各個(gè)主題內(nèi)部使用改進(jìn)的TF-IDF算法提取主題關(guān)鍵詞,在Web主題提取研究上取得了良好的效果[2]。

從文本語(yǔ)料中發(fā)現(xiàn)隱藏在詞匯下的潛在語(yǔ)義,最經(jīng)典的就是LDA(Latent Dirichlet Allocation,隱含狄利克雷分布)主題模型,這一模型能夠較好地對(duì)包含多主題的文本進(jìn)行分類(lèi)提取[3]。LDA主題模型集合了機(jī)器學(xué)習(xí)的優(yōu)點(diǎn),可以迅速?gòu)拇罅课谋局型诰虺鲭[含主題信息。因此,研究人員多采用LDA模型結(jié)合TF-IDF算法作為主題提取的常規(guī)方法。

(二)研究對(duì)象與數(shù)據(jù)獲取

本研究以微博賬號(hào)“國(guó)網(wǎng)甘肅電力”為研究對(duì)象。截至2022年9月,該賬號(hào)共發(fā)布微博3096條(包括文章、轉(zhuǎn)發(fā)評(píng)論、視頻),使用Python爬蟲(chóng)技術(shù)抓取全部微博,經(jīng)清洗篩選后獲得2718條有效微博文本,以csv的文件格式保存。

(三)TF-IDF特征提取

TF-IDF即“詞頻-逆文檔頻率”的英文簡(jiǎn)寫(xiě),結(jié)合了詞頻計(jì)算公式和逆文檔頻率的計(jì)算公式。TF-IDF算法的公式為:

用TF-IDF算法從微博文本中提取關(guān)鍵詞。首先,利用Python中的jieba分詞庫(kù)進(jìn)行文本清洗;然后,通過(guò)其內(nèi)置的TF-IDF算法對(duì)文本進(jìn)行處理,可以獲得語(yǔ)料的關(guān)鍵詞。通過(guò)設(shè)置主題數(shù)量參數(shù)topK=10,獲取每篇文本語(yǔ)料權(quán)重得分前10位的關(guān)鍵詞。

(四)LDA主題建模

LDA主題模型利用三層貝葉斯概率模型識(shí)別大規(guī)模文檔中潛藏的主題信息。它基于如下假設(shè):文檔集合中存在K個(gè)主題且主題之間相互獨(dú)立;每個(gè)文檔由K個(gè)主題隨機(jī)混合組成,且主題參數(shù)服從狄利克雷分布;每個(gè)主題是特征詞上的多項(xiàng)分布,該多項(xiàng)分布的參數(shù)服從狄利克雷分布。

1.主題聚類(lèi)。LDA的模型計(jì)算結(jié)果可以得到文檔-主題和主題-詞語(yǔ)2個(gè)概率分布。文檔-主題概率分布獲得每個(gè)主題下的文檔支持權(quán)重,權(quán)重越大表示該文檔與主題的關(guān)聯(lián)度越大;主題-詞語(yǔ)概率分布由一系列特征詞及其在該主題中出現(xiàn)的概率值表示,反映主題的內(nèi)部結(jié)構(gòu),特征詞概率值越大,對(duì)該主題的貢獻(xiàn)度越高[4]。

2.參數(shù)選擇。LDA主題模型算法的起始步驟是設(shè)定參數(shù),包括狄利克雷先驗(yàn)α、β參數(shù)和主題數(shù)K。本研究中,α和β分別設(shè)置為0.1和0.01[5]。由于主題的數(shù)量可以顯著影響估計(jì)的文檔主題,因此最佳主題數(shù)量(K)的選擇尤為重要。當(dāng)主題相似性中的余弦相似度跟隨主題數(shù)量增加呈下降趨勢(shì)時(shí),可能存在過(guò)度聚類(lèi)問(wèn)題[6]。為減少此問(wèn)題,我們引入困惑度(Perplexity)度量作為判斷最優(yōu)主題數(shù)的指標(biāo)。布雷(D.M.Blei)最先采用困惑度確定最佳主題數(shù)目K。其計(jì)算方法為:

3.主題挖掘結(jié)果。利用Python的gensim庫(kù)實(shí)現(xiàn)LDA主題模型的構(gòu)建,gensim庫(kù)可以從原始的非結(jié)構(gòu)化文本中無(wú)監(jiān)督地學(xué)習(xí)到文本的主題向量表達(dá),支持包括TF-IDF、LDA在內(nèi)的多種模型。同時(shí),依據(jù)主題困惑度評(píng)價(jià)標(biāo)準(zhǔn),人工設(shè)置主題數(shù)目從1到15的遍歷。一方面,要使主題一致性盡可能高,以取得模型訓(xùn)練效果;另一方面,也需要控制主題數(shù)量相對(duì)較少,以便后續(xù)對(duì)主題進(jìn)行概括與解釋,最終確定主題聚類(lèi)數(shù)目為7。通過(guò)LDA主題分類(lèi)得到“國(guó)網(wǎng)甘肅電力”微博賬號(hào)文本內(nèi)容的7個(gè)主題以及每個(gè)主題的詞項(xiàng)分布,整理每個(gè)主題下排名前30的高概率特征詞,并進(jìn)行場(chǎng)景描述,總結(jié)歸納出最符合當(dāng)前主題下高概率特征詞的主題標(biāo)識(shí)。

四、研究結(jié)果

本研究基于LDA模型的主題聚類(lèi)結(jié)果,根據(jù)每個(gè)主題的詞項(xiàng)分布,將7個(gè)主題劃分為精神素養(yǎng)、行為責(zé)任、物質(zhì)設(shè)施和制度管理4個(gè)維度,以觀察、分析企業(yè)文化融合現(xiàn)狀。

(一)精神素養(yǎng)維度

企業(yè)精神主要表現(xiàn)為企業(yè)經(jīng)營(yíng)管理中所堅(jiān)持的精神,它對(duì)企業(yè)員工的行為具有規(guī)范和促進(jìn)作用,在提高企業(yè)競(jìng)爭(zhēng)力方面也有非常顯著的影響。Topic6的高概率特征詞為“甘電小科普”“火災(zāi)”“消防”“短路”等,所以將該主題標(biāo)識(shí)類(lèi)別定義為“火災(zāi)消防”。Topic7的高概率特征詞為“用電”“安全”“視頻”“生活”等,所以將該主題標(biāo)識(shí)類(lèi)別定義為“用電安全”。這兩類(lèi)主題的微博文本內(nèi)容占比分別為10.6%和8.2%。

(二)行為責(zé)任維度

企業(yè)文化中的行為責(zé)任指企業(yè)的生產(chǎn)經(jīng)營(yíng)活動(dòng)和企業(yè)員工在日常工作中表現(xiàn)出來(lái)的行動(dòng)力,包括企業(yè)責(zé)任、企業(yè)風(fēng)格和企業(yè)影響等諸多內(nèi)容。Topic1的高概率特征詞為“供電”“線路”“隱患”“排查”“故障”等,所以將該主題標(biāo)識(shí)類(lèi)別定義為“安全排查”。Topic2的高概率特征詞為“工作”“服務(wù)”“活動(dòng)”“檢修”等,所以將該主題標(biāo)識(shí)類(lèi)別定義為“工作服務(wù)”。這兩類(lèi)主題的微博文本內(nèi)容占總文本的比重最大,分別為22.4%和22.1%。2022年,國(guó)網(wǎng)甘肅公司與新華社、央視等中央媒體聯(lián)合完成國(guó)家“應(yīng)急使命·2022”高原高寒地區(qū)抗震救災(zāi)實(shí)戰(zhàn)化演習(xí)主題宣傳。

(三)物質(zhì)設(shè)施維度

物質(zhì)文化是企業(yè)文化融合的重要組成部分,包括企業(yè)的硬件基礎(chǔ)設(shè)施(例如廠房、辦公場(chǎng)所等),以及企業(yè)員工的工資福利、工作舒適度。Topic3的高概率特征詞為“電網(wǎng)”“工程”“扶貧”“新能源”等,所以將該主題標(biāo)識(shí)類(lèi)別定義為“工程建設(shè)”。Topic4的高概率特征詞為“發(fā)展”“能源”“電力”等,所以將該主題標(biāo)識(shí)類(lèi)別定義為“新能源發(fā)展”。這兩類(lèi)主題的微博文本內(nèi)容占比分別為14.7%和11.3%。這些內(nèi)容反映了“國(guó)網(wǎng)甘肅電力”聚焦電力保供、能源轉(zhuǎn)型、“一體四翼”發(fā)展布局建設(shè)等工作成果。

(四)制度管理維度

企業(yè)內(nèi)外部需要遵守的制度管理策略和組織架構(gòu)構(gòu)成企業(yè)文化軟實(shí)力不可或缺的制度維度。Topic5的高概率特征詞為“視頻”“新聞”“國(guó)家電網(wǎng)”“人民日?qǐng)?bào)”“世界”等,所以將該主題標(biāo)識(shí)類(lèi)別定義為“時(shí)事新聞”。該類(lèi)主題的微博文本內(nèi)容占總文本的比重為10.7%,其內(nèi)容多貼近生活、貼近群眾。標(biāo)志著企業(yè)能深刻把握社交媒體傳播規(guī)律,圍繞公司中心工作精心策劃宣傳主題,將官方微博賬號(hào)從原有以引導(dǎo)為主的信息傳導(dǎo)媒介拓展成一個(gè)功能全面、效能強(qiáng)大的綜合服務(wù)平臺(tái)。通過(guò)此類(lèi)主題報(bào)道,為企業(yè)中心工作的高效開(kāi)展和重大項(xiàng)目的順利推進(jìn)營(yíng)造有利的輿論場(chǎng),為公司和電網(wǎng)科學(xué)發(fā)展發(fā)揮制度文化“服務(wù)、保障和支撐”作用起到良好的作用。

五、策略及建議

面對(duì)海量信息和碎片化傳播的社交媒體平臺(tái),國(guó)網(wǎng)甘肅公司官方微博新聞宣傳的形式和手段日漸豐富,但企業(yè)文化融合體系仍需完善。首先,要積極促進(jìn)企業(yè)文化與企業(yè)精神素養(yǎng)的有效融合。企業(yè)要站在為黨育人、為國(guó)育才的戰(zhàn)略高度,關(guān)心青年成長(zhǎng)、支持青年發(fā)展,將青年精神素養(yǎng)提升工作作為企業(yè)建設(shè)的重要任務(wù)。企業(yè)戰(zhàn)略管理策略要堅(jiān)持黨建帶團(tuán)建,切實(shí)發(fā)揮主體作用,動(dòng)員企業(yè)青年廣泛參與。其次,要有效發(fā)揮企業(yè)文化在企業(yè)管理中的指導(dǎo)作用,大力構(gòu)建企業(yè)文化的融合機(jī)制,在企業(yè)文化和企業(yè)管理之間建立較強(qiáng)的交互性和融合性機(jī)制,使企業(yè)文化與企業(yè)戰(zhàn)略管理有效結(jié)合。進(jìn)一步加強(qiáng)員工的教育培訓(xùn),尤其要培養(yǎng)青年員工的精神素養(yǎng),包括文化意識(shí)、文化素養(yǎng)和文化自信等,發(fā)揮企業(yè)文化在戰(zhàn)略管理策略、員工自我文化認(rèn)同等方面的積極作用。在此基礎(chǔ)上,對(duì)日常的企業(yè)文化建設(shè)進(jìn)行有效的管理,比如可以把企業(yè)文化建設(shè)納入企業(yè)績(jī)效考核,加強(qiáng)管理層和員工對(duì)企業(yè)文化建設(shè)的重視程度,切實(shí)做到知行合一。再次,企業(yè)要積極廣泛地開(kāi)展宣傳,用好新媒體平臺(tái),將開(kāi)展青年精神素養(yǎng)提升工作的重大意義、工作要求,及時(shí)、準(zhǔn)確、全面、有效地傳遞給廣大青年。還必須注重企業(yè)文化融合的科學(xué)性,把握社會(huì)主義思想時(shí)代性,彰顯企業(yè)精神文化特色,體現(xiàn)企業(yè)管理文化協(xié)調(diào),保持企業(yè)文化形象穩(wěn)定。

猜你喜歡
特征詞文檔維度
有人一聲不吭向你扔了個(gè)文檔
淺論詩(shī)中“史”識(shí)的四個(gè)維度
基于改進(jìn)TFIDF算法的郵件分類(lèi)技術(shù)
產(chǎn)品評(píng)論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
基于RI碼計(jì)算的Word復(fù)制文檔鑒別
光的維度
燈與照明(2016年4期)2016-06-05 09:01:45
“五個(gè)維度”解有機(jī)化學(xué)推斷題
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
面向文本分類(lèi)的特征詞選取方法研究與改進(jìn)
人生三維度
吐魯番(2014年2期)2014-02-28 16:54:43
玛曲县| 康马县| 罗城| 平江县| 汨罗市| 岳西县| 安陆市| 祁阳县| 兖州市| 涿鹿县| 利川市| 乡宁县| 平利县| 沙河市| 弋阳县| 关岭| 睢宁县| 微山县| 寿光市| 汶川县| 麻阳| 略阳县| 雅安市| 衡山县| 双鸭山市| 大丰市| 梁平县| 沁阳市| 乐都县| 乐山市| 获嘉县| SHOW| 凤山市| 霍山县| 自治县| 河津市| 舞阳县| 开平市| 邛崃市| 安义县| 临安市|