徐克哲,況思睿,張 蘭
(吉林財(cái)經(jīng)大學(xué) 會計(jì)學(xué)院,長春 130117)
習(xí)近平總書記在黨的二十大報(bào)告中指出“加快發(fā)展數(shù)字經(jīng)濟(jì),促進(jìn)數(shù)字經(jīng)濟(jì)和實(shí)體經(jīng)濟(jì)深度融合”。大數(shù)據(jù)、云計(jì)算、人工智能、區(qū)塊鏈等新一代數(shù)字技術(shù)是當(dāng)代創(chuàng)新最活躍、應(yīng)用最廣泛、帶動(dòng)力最強(qiáng)的科技領(lǐng)域。在數(shù)字經(jīng)濟(jì)時(shí)代,明確數(shù)字經(jīng)濟(jì)驅(qū)動(dòng)企業(yè)商業(yè)模式創(chuàng)新的程度,對企業(yè)的數(shù)字化轉(zhuǎn)型升級與提升中國經(jīng)濟(jì)高質(zhì)量發(fā)展具有重要的現(xiàn)實(shí)意義。
G公司是一家多元化、科技型的全球工業(yè)集團(tuán),它是中國家用空調(diào)、家電和暖通空調(diào)設(shè)備制造商之一。本文以G公司為例,通過商業(yè)模式創(chuàng)新的視角,構(gòu)建了數(shù)字化詞典。然后,利用2011—2022年G公司的年度報(bào)表作為研究樣本,采用基于Python和LDA(Latent Dirichlet Allocation)主題模型的文本分析方法,構(gòu)建數(shù)字化轉(zhuǎn)型指標(biāo)。通過對G公司的數(shù)字化轉(zhuǎn)型程度進(jìn)行定量刻畫,為企業(yè)數(shù)字化轉(zhuǎn)型的相關(guān)研究提供測量工具和參考。
企業(yè)數(shù)字化轉(zhuǎn)型是指企業(yè)將數(shù)字技術(shù)與商業(yè)模式創(chuàng)新相結(jié)合,通過應(yīng)用數(shù)字技術(shù),重新設(shè)計(jì)、創(chuàng)新和優(yōu)化商業(yè)模式,以實(shí)現(xiàn)企業(yè)戰(zhàn)略目標(biāo)和經(jīng)濟(jì)效益的變革過程。
商業(yè)模式創(chuàng)新是指企業(yè)通過重新設(shè)計(jì)、創(chuàng)新和優(yōu)化商業(yè)模式,以實(shí)現(xiàn)業(yè)務(wù)增長、降低成本、創(chuàng)造新的價(jià)值和開發(fā)新的市場機(jī)會的過程[1]。商業(yè)模式創(chuàng)新是企業(yè)數(shù)字化轉(zhuǎn)型的核心內(nèi)容之一,數(shù)字技術(shù)的應(yīng)用可以幫助企業(yè)重新思考、調(diào)整和創(chuàng)新商業(yè)模式,以適應(yīng)市場的需求和變化。
在數(shù)字化時(shí)代,企業(yè)可以利用數(shù)字技術(shù)創(chuàng)新商業(yè)模式,同時(shí),數(shù)字技術(shù)在產(chǎn)品與業(yè)務(wù)[2]、商業(yè)模式和創(chuàng)新[3]、組織結(jié)構(gòu)[4]、企業(yè)戰(zhàn)略[5]、生產(chǎn)方式[6]等方面深度融合,對企業(yè)的經(jīng)營管理產(chǎn)生了根本性的影響。
企業(yè)在數(shù)字化轉(zhuǎn)型中,可以根據(jù)企業(yè)的發(fā)展戰(zhàn)略和實(shí)際的數(shù)字化程度,采取不同的商業(yè)模式創(chuàng)新策略。例如,可以通過數(shù)字技術(shù)改善現(xiàn)有業(yè)務(wù)模式,利用人工智能技術(shù)提高客戶服務(wù)水平[7];企業(yè)也可以探索新的數(shù)字化商業(yè)模式,例如平臺經(jīng)濟(jì)和共享經(jīng)濟(jì)等,通過將消費(fèi)者和供應(yīng)商連接起來,創(chuàng)造更高的價(jià)值和效率[8];企業(yè)還可以采用數(shù)字化技術(shù)改變商業(yè)模式的競爭規(guī)則,例如利用數(shù)據(jù)分析來預(yù)測市場需求和趨勢,提前占領(lǐng)市場[9]。在中國的數(shù)字化轉(zhuǎn)型中,許多企業(yè)已經(jīng)開始關(guān)注商業(yè)模式創(chuàng)新。例如,電商平臺阿里巴巴和小米科技。
數(shù)字化轉(zhuǎn)型程度的測量方法主要分為兩大類:主觀評估和客觀評估。
1.主觀評估。主觀評估是通過對企業(yè)內(nèi)部管理層、員工和外部專家的問卷調(diào)查和訪談等方式,對企業(yè)數(shù)字化轉(zhuǎn)型程度進(jìn)行主觀評估,主觀評估常用量表法。
量表法是通過設(shè)計(jì)適當(dāng)?shù)膯柧碚{(diào)查和量表來收集企業(yè)數(shù)字化轉(zhuǎn)型相關(guān)數(shù)據(jù),進(jìn)而對企業(yè)數(shù)字化轉(zhuǎn)型程度進(jìn)行測量和評估的方法。量表法可以用來衡量企業(yè)數(shù)字化轉(zhuǎn)型的整體情況和企業(yè)不同方面的數(shù)字化程度,例如數(shù)字技術(shù)應(yīng)用程度、數(shù)字化組織建設(shè)程度等。主觀評估可以反映企業(yè)數(shù)字化轉(zhuǎn)型的整體情況和管理層、員工以及專家對企業(yè)數(shù)字化轉(zhuǎn)型的態(tài)度和看法,但存在主觀性和無可比性等問題。
2.客觀評估??陀^評估是通過采集和分析企業(yè)的實(shí)際數(shù)據(jù)和指標(biāo),對企業(yè)數(shù)字化轉(zhuǎn)型程度進(jìn)行客觀評估,包括指標(biāo)法和文本分析法。
指標(biāo)法是通過確定適當(dāng)?shù)目陀^指標(biāo)來衡量企業(yè)數(shù)字化轉(zhuǎn)型程度的方法。指標(biāo)法可以用來衡量數(shù)字技術(shù)應(yīng)用程度、數(shù)字化資產(chǎn)和數(shù)字化能力的建設(shè)等方面的指標(biāo)。指標(biāo)法的優(yōu)點(diǎn)在于可以提供客觀可比的數(shù)據(jù),并且可以對不同企業(yè)進(jìn)行橫向和縱向的比較。但指標(biāo)法的指標(biāo)選擇非常精準(zhǔn),不能全面反映企業(yè)數(shù)字化轉(zhuǎn)型的情況。
文本分析法是一種應(yīng)用大數(shù)據(jù)分析技術(shù)的方法,它通過分析企業(yè)文本信息(如企業(yè)網(wǎng)站、年報(bào)等)來評估企業(yè)數(shù)字化轉(zhuǎn)型程度的方法。文本分析法可以用來分析企業(yè)數(shù)字化戰(zhàn)略、數(shù)字技術(shù)應(yīng)用、數(shù)字化組織建設(shè)等方面的信息。文本分析法的優(yōu)點(diǎn)在于可以直接從企業(yè)官方信息中獲取數(shù)據(jù),并且可以對企業(yè)的數(shù)字化戰(zhàn)略和規(guī)劃進(jìn)行分析。但是,文本分析法需要一定的文本分析技能和時(shí)間成本,同時(shí)無法獲得實(shí)時(shí)數(shù)據(jù)。
文本分析法中常應(yīng)用大數(shù)據(jù)分析技術(shù)或模型,LDA(Latent Dirichlet Allocation)主題模型就是一種應(yīng)用文本分析法中發(fā)現(xiàn)文本主題的概率生成模型。由于LDA具有自動(dòng)發(fā)現(xiàn)潛在主題、可解釋性強(qiáng)、適用范圍廣、降維能力好等優(yōu)勢,被廣泛地應(yīng)用于文本分類、信息檢索、推薦系統(tǒng)等領(lǐng)域中。目前已有少部分學(xué)者將這種模型應(yīng)用于企業(yè)數(shù)字化轉(zhuǎn)型的文本分析測量中。如李文軍等[10]應(yīng)用基于LDA的文本分析法,構(gòu)建數(shù)字創(chuàng)意產(chǎn)業(yè)的創(chuàng)新綜合指數(shù)。王燦友等[11]采取政策工具與LDA方法對省級數(shù)字政府建設(shè)政策文本進(jìn)行了分析。本文使用基于LDA主題模型的文本分析方法,來刻畫企業(yè)在商業(yè)模式創(chuàng)新視角下的數(shù)字化程度,并因此對企業(yè)數(shù)字化特征進(jìn)行分析。
借鑒韓國高等[2]和靳毓等[13]的研究,企業(yè)數(shù)字化水平可以根據(jù)企業(yè)年報(bào)中數(shù)字化相關(guān)詞匯出現(xiàn)的詞頻來綜合衡量。本文在企業(yè)數(shù)字化文獻(xiàn)的基礎(chǔ)上,以G公司為研究實(shí)例,選取巨潮資訊網(wǎng)官方網(wǎng)站(http://www.cninfo.com.cn/)的2011-2022年度報(bào)告作為研究數(shù)據(jù)。將計(jì)算機(jī)自動(dòng)分析方法和人工篩選結(jié)合起來,挖掘出能夠更貼切地反映G公司數(shù)字化特征和轉(zhuǎn)型程度的信息。
在提取年度報(bào)告的文本內(nèi)容后,進(jìn)行相應(yīng)的文本預(yù)處理。預(yù)處理工作包括去除與研究無關(guān)的空格、數(shù)字、詞語(比如人名和省份)等,以及去除停用詞處理,以此作為后續(xù)數(shù)字化詞典構(gòu)建、數(shù)字化特征詞詞頻統(tǒng)計(jì)的依據(jù)。
1.數(shù)字化詞典構(gòu)建和詞頻分析
借鑒付劍茹等[13]度量企業(yè)數(shù)字化發(fā)展水平的方法,選擇人工智能(Artificial Intelligence)、區(qū)塊鏈(Block Chain)、云計(jì)算(Cloud Computing)、大數(shù)據(jù)(Big Data)和商業(yè)模式創(chuàng)新(Business Model Innovation,BMI)5個(gè)方面的數(shù)字技術(shù)和數(shù)字技術(shù)應(yīng)用,構(gòu)建數(shù)字化詞典。以《數(shù)字中國建設(shè)發(fā)展報(bào)告2021》《工業(yè)互聯(lián)網(wǎng)創(chuàng)新發(fā)展試點(diǎn)示范工作方案(2021—2023年)》和《政府工作報(bào)告》等近幾年的國內(nèi)經(jīng)濟(jì)相關(guān)政策文件和政府報(bào)告為依據(jù),并在G公司的年度報(bào)告文本基礎(chǔ)上,明確G公司的相關(guān)數(shù)字化信息表達(dá)和特征,人工篩選并確定數(shù)字化詞典。經(jīng)Python分詞處理及人工識別,最終篩選得到188個(gè)頻率大于等于3次的G公司數(shù)字化相關(guān)詞匯,這些詞匯構(gòu)成了本文的數(shù)字化詞典。
本文把上述數(shù)字化詞典中的188個(gè)詞匯擴(kuò)充到Python軟件包的“結(jié)巴”中文詞庫中,然后基于機(jī)器學(xué)習(xí)的方法進(jìn)行文本分析,統(tǒng)計(jì)得到數(shù)字化詞典的每個(gè)詞分別在年報(bào)中出現(xiàn)的頻率,并做出詞云圖。
圖1的G公司數(shù)字化高頻詞的詞云圖顯示,關(guān)鍵詞“大數(shù)據(jù)”發(fā)生的頻率明顯要超出其他關(guān)鍵詞,它是目前G公司數(shù)字化轉(zhuǎn)型中最主要考慮的元素,其次是“智能化”“智能家居”“智能制造”“機(jī)器人”等關(guān)鍵詞。
圖1 G公司數(shù)字化高頻詞的詞云圖
對2011—2022年G公司數(shù)字化的分年度統(tǒng)計(jì)顯示,在微觀層面上,G公司年報(bào)披露的數(shù)字化相關(guān)詞匯的頻數(shù)和數(shù)字化的總權(quán)重呈現(xiàn)逐年增長趨勢,數(shù)字化詞的頻次從2011年的0,2012年的1,增長到2021年的182,2022年的167。在宏觀層面上,根據(jù)G公司2021年的財(cái)報(bào),其數(shù)字經(jīng)濟(jì)規(guī)模達(dá)到了約131億元人民幣,占公司營收的比重約為23.4%,這表明2021年數(shù)字化轉(zhuǎn)型已經(jīng)成為G公司業(yè)務(wù)的重要組成部分。但2022年由于新型冠狀病毒感染以及全球市場環(huán)境不佳,G公司銷售市場規(guī)模明顯下滑,其智能裝備等數(shù)字化投入都比2021年有所下降。相比之下,2011年時(shí),G公司數(shù)字經(jīng)濟(jì)規(guī)模相對較小,當(dāng)時(shí)公司數(shù)字化轉(zhuǎn)型仍處于起步階段,數(shù)字經(jīng)濟(jì)規(guī)模僅為約30億元人民幣。可以看出,除2022年有所下降外,G公司在數(shù)字化轉(zhuǎn)型方面經(jīng)歷了長期的積累和發(fā)展,數(shù)字經(jīng)濟(jì)規(guī)模也在不斷增長。宏觀層面也在一定程度上支持了本文基于數(shù)字化詞典的數(shù)字化詞詞頻分析的微觀合理性。
2.數(shù)字化轉(zhuǎn)型程度測量的指標(biāo)體系
本文在獲得數(shù)字化詞典后,將進(jìn)行LDA主題分析,并對數(shù)字化主題詞賦予更高的權(quán)重。具體來說,這些數(shù)字化主題的詞權(quán)重會是其他一般性數(shù)字化詞權(quán)重的5倍,而其他數(shù)字化詞權(quán)重則設(shè)為1。通過這種方式,形成一個(gè)數(shù)字化總指數(shù)的變量,用以描述該企業(yè)在數(shù)字化方面的發(fā)展情況。這種做法有助于更準(zhǔn)確地反映企業(yè)的數(shù)字化進(jìn)程,并提供參考依據(jù),幫助企業(yè)制定更好的數(shù)字化策略和計(jì)劃。
在前期數(shù)字化詞典構(gòu)建和詞頻分析的基礎(chǔ)上,對G公司年報(bào)進(jìn)行LDA主題分析,并確定最佳主題數(shù),最終實(shí)現(xiàn)主題分布可視化。
首先,確定最佳主題數(shù)。最佳主題數(shù)的確定是LDA模型的重點(diǎn)與難點(diǎn)。本文采用主題一致性(coherence)來評價(jià)模型并選擇最佳主題數(shù),一致性得分越高說明LDA模型效果越好。如圖2所示,當(dāng)主題數(shù)=4時(shí),主題一致性得分達(dá)到最高。
圖2 不同主題數(shù)的主題一致性得分
其次,實(shí)現(xiàn)主題分布可視化。將LDA模型的兩個(gè)超參數(shù)設(shè)置為α=0.1,β=0.02,迭代次數(shù)passes=5000,主題分布可視化如圖3所示。主題及其關(guān)鍵主題詞分布如表1,表1中展示了每個(gè)主題的累計(jì)隸屬概率,以及主題內(nèi)高頻的關(guān)鍵主題詞(TOP 8)。
表1 主題及其關(guān)鍵主題詞分布
圖3 LDA模型的主題分布可視化(主題數(shù)=4)
從表1的主題及其關(guān)鍵主題詞分布,可以清晰地了解到現(xiàn)階段G公司的數(shù)字化轉(zhuǎn)型主要圍繞哪些數(shù)字技術(shù)和商業(yè)模式進(jìn)行展開。如表1,Topic3和Topic2是G公司第一和第二關(guān)注的數(shù)字化主題,表現(xiàn)為G公司在數(shù)字化轉(zhuǎn)型建設(shè)中強(qiáng)調(diào)和發(fā)展的方向,且這兩個(gè)主題都包括了“大數(shù)據(jù)”“智能化”“智能家居”“智能制造”“機(jī)器人”等詞,這些詞語都與新型智能制造和人工智能技術(shù)密切相關(guān),這說明G公司重點(diǎn)關(guān)注的是新興的智能制造和人工智能技術(shù)。這與中國政府近年來提出的“中國制造2025”政策密切相關(guān),該政策旨在推動(dòng)中國制造業(yè)向更高質(zhì)量、更高技術(shù)的方向發(fā)展,特別是加強(qiáng)智能制造和信息技術(shù)在制造業(yè)中的應(yīng)用,從而提高中國制造業(yè)的核心競爭力。因此,G公司重點(diǎn)關(guān)注智能化、智能家居、智能制造、機(jī)器人等領(lǐng)域,符合中國政府推動(dòng)制造業(yè)轉(zhuǎn)型升級的政策導(dǎo)向。
1.G公司數(shù)字化程度指標(biāo)的構(gòu)建
在構(gòu)建G公司數(shù)字化程度指標(biāo)時(shí),考慮到每年年報(bào)的文本長度存在差異。因此,在提取每年年報(bào)中各個(gè)關(guān)鍵詞的出現(xiàn)頻率和權(quán)重后,數(shù)字化相關(guān)詞匯的頻數(shù)乘以權(quán)重的總和再除以年報(bào)內(nèi)語段長度(即詞匯總數(shù)),從而得到微觀數(shù)字化程度指標(biāo)(Digital)。為了方便表述,本文將該指標(biāo)乘以100。Digital指標(biāo)的數(shù)值越大,說明該年度G公司的數(shù)字化程度越高。這種方法有助于消除年度報(bào)告文本長度的影響,更準(zhǔn)確地評估G公司在數(shù)字化方面的發(fā)展水平。
2.數(shù)字化特征分析
通過分析G公司年報(bào)文本中的數(shù)字化關(guān)鍵詞詞頻,并進(jìn)行統(tǒng)計(jì)測算,本文得到了G公司數(shù)字化指數(shù)的數(shù)值,具體見表2。同時(shí),對應(yīng)表2繪制相應(yīng)的直線折線圖,如圖4所示。
表2 2011—2022年G公司數(shù)字化總指數(shù)及數(shù)字化結(jié)構(gòu)
圖4 2011—2022年G公司數(shù)字化指數(shù)及分項(xiàng)指數(shù)發(fā)展趨勢
在圖4中,實(shí)線代表著G公司數(shù)字化總指數(shù)的時(shí)間發(fā)展趨勢。數(shù)字化總指數(shù)從2011年的0,2012年的0.254到2021年的26.517,指數(shù)值增長了約104倍,上升幅度較大,且呈現(xiàn)逐年遞增之勢,但在2022年卻出現(xiàn)了下降的現(xiàn)象。表明G公司在近11年中,數(shù)字化程度呈現(xiàn)出逐年遞增的發(fā)展趨勢,其中2013年、2017年和2019年的數(shù)字化轉(zhuǎn)型提升明顯。這種趨勢的持續(xù)發(fā)展,將為G公司未來的數(shù)字化戰(zhàn)略規(guī)劃提供有力支撐,也預(yù)示G公司在數(shù)字化方面的發(fā)展具有較大的上升空間。2022年的下降也說明,全球經(jīng)濟(jì)環(huán)境和新型冠狀病毒感染對國內(nèi)企業(yè)銷售和數(shù)字化發(fā)展都會有所影響。據(jù)《2022年中國家電行業(yè)年度報(bào)告》,2022年家電行業(yè)中國銷售規(guī)模為7307.2億元,同比2021年下滑9.5%。
根據(jù)圖4中分項(xiàng)指數(shù)的發(fā)展趨勢線表明,G公司在人工智能技術(shù)應(yīng)用方面表現(xiàn)突出,指數(shù)2021年增長到了近73倍,2022年增長到67倍,其次是商業(yè)模式創(chuàng)新應(yīng)用。但是,區(qū)塊鏈技術(shù)的應(yīng)用進(jìn)展緩慢,指數(shù)值增長不大,指數(shù)由2012年的0.028上升到2021年的2.946,2022年的2.647,表明G公司的區(qū)塊鏈技術(shù)應(yīng)用還停留在初級階段。通過G公司的數(shù)字化指數(shù)及分項(xiàng)指數(shù)的發(fā)展,可以看出G公司已逐漸進(jìn)入數(shù)字化轉(zhuǎn)型之路,以人工智能數(shù)字技術(shù)為支撐,以重塑商業(yè)模式創(chuàng)新為核心,取得了一定的成就。但是,還存在系統(tǒng)性成長滯后、全面轉(zhuǎn)型水平不高、整體生態(tài)質(zhì)量有待提高等問題。
本文首先,基于人工智能、區(qū)塊鏈、云計(jì)算、大數(shù)據(jù)和商業(yè)模式創(chuàng)新的維度,探討企業(yè)數(shù)字化技術(shù)和應(yīng)用的程度,結(jié)合近幾年國內(nèi)經(jīng)濟(jì)相關(guān)政策文件和政府報(bào)告來篩選G公司數(shù)字化的高頻特征詞,構(gòu)建數(shù)字化詞典。其次,使用G公司2011—2022年的年度報(bào)告數(shù)據(jù),分析G公司數(shù)字化轉(zhuǎn)型的趨勢和特征。通過LDA文本分析并查看G公司數(shù)字化主題關(guān)鍵詞和高頻關(guān)鍵詞,從數(shù)字技術(shù)和數(shù)字技術(shù)應(yīng)用兩方面共同構(gòu)建G公司數(shù)字化轉(zhuǎn)型的綜合測評指數(shù)。
本文得出G公司已逐漸進(jìn)入數(shù)字化轉(zhuǎn)型之路的結(jié)論。但是,還存在系統(tǒng)性成長滯后、全面轉(zhuǎn)型水平不高、整體生態(tài)質(zhì)量有待提高等問題。未來G公司數(shù)字化轉(zhuǎn)型還需要關(guān)注以下幾個(gè)方向,來推動(dòng)數(shù)字化轉(zhuǎn)型的全面深入發(fā)展。如加強(qiáng)數(shù)字技術(shù)的應(yīng)用和推廣,提高數(shù)字化運(yùn)營水平和效益;建設(shè)數(shù)字化生態(tài)系統(tǒng);建立數(shù)字化人才隊(duì)伍,提高數(shù)字技術(shù)和管理能力;探索新的商業(yè)模式和創(chuàng)新應(yīng)用場景等。
景德鎮(zhèn)學(xué)院學(xué)報(bào)2023年3期