国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SVM 主動學(xué)習(xí)的制革企業(yè)財務(wù)管理數(shù)據(jù)分類方法

2024-01-03 13:46高溪王良浩
皮革與化工 2023年6期
關(guān)鍵詞:制革分類樣本

高溪,王良浩

(1.中國農(nóng)業(yè)大學(xué)煙臺研究院,山東 煙臺 264000;2.廣西職業(yè)技術(shù)學(xué)院,廣西 南寧 530001)

1 引言

財務(wù)管理是企業(yè)管理中至關(guān)重要的一項任務(wù),對制革企業(yè)而言也不例外。隨著信息技術(shù)的快速發(fā)展和應(yīng)用,制革企業(yè)財務(wù)管理的數(shù)據(jù)處理和分類變得越來越關(guān)鍵。在現(xiàn)代經(jīng)濟(jì)環(huán)境下,制革企業(yè)面臨著諸多挑戰(zhàn)和機(jī)遇。合理的財務(wù)管理和決策對于企業(yè)的財務(wù)健康和穩(wěn)定發(fā)展至關(guān)重要。然而,由于制革企業(yè)的特殊性,其財務(wù)管理數(shù)據(jù)的分類問題需要額外的關(guān)注和研究。在過去,許多制革企業(yè)僅僅采用傳統(tǒng)的財務(wù)分類方法,無法滿足企業(yè)發(fā)展和管理的需求。同時,財務(wù)管理數(shù)據(jù)分類方法也可以幫助企業(yè)進(jìn)行風(fēng)險評估和預(yù)測,及時識別潛在的經(jīng)營風(fēng)險并采取相應(yīng)的措施。因此,探討制革企業(yè)財務(wù)管理數(shù)據(jù)的分類具有重要意義[1,2]。

當(dāng)前針對該問題的研究已經(jīng)取得的一定的進(jìn)展,例如文獻(xiàn)[3]提出基于聚類算法的醫(yī)療財務(wù)大數(shù)據(jù)分類方法。采用PNCC 模型對數(shù)據(jù)進(jìn)行降噪,從而消除了數(shù)據(jù)中的噪聲對分類效果的影響;對財務(wù)管理數(shù)據(jù)進(jìn)行自適應(yīng)鄰域選擇,對其進(jìn)行降維處理,建立QS-KFCM的聚類算法,實現(xiàn)對海量財務(wù)管理數(shù)據(jù)的精確分類。文獻(xiàn)[4]提出基于融合馬田體系的財務(wù)非均衡數(shù)據(jù)分類方法,該方法將馬田體系和AdaBoost 算法相結(jié)合,根據(jù)前一基分類器的預(yù)測結(jié)果,對財務(wù)非均衡數(shù)據(jù)分類方法進(jìn)行調(diào)整,從而得到相關(guān)的分類結(jié)果。文獻(xiàn)[5]提出基于RPA 技術(shù)的財務(wù)數(shù)據(jù)分類方法。該方法結(jié)合多源數(shù)據(jù)構(gòu)建了一種性能較優(yōu)的財務(wù)機(jī)器人管理的數(shù)據(jù)交互模型。該模型利用RPA 技術(shù),能夠自動與稅務(wù)、銀行等外部相關(guān)系統(tǒng)進(jìn)行接口對接,并實現(xiàn)財務(wù)機(jī)器人業(yè)務(wù)數(shù)據(jù)的自動分類處理。

然而,制革企業(yè)的財務(wù)管理數(shù)據(jù)可能涉及多個方面,如財務(wù)會計、成本管理、預(yù)算、資金管理/經(jīng)營指標(biāo)數(shù)據(jù)等,而每個方面都有自己的特點和指標(biāo)體系。由于制革企業(yè)的特殊性,傳統(tǒng)的財務(wù)管理數(shù)據(jù)分類方法往往難以滿足其需求。此外,制革企業(yè)的財務(wù)管理數(shù)據(jù)可能存在不平衡性和非線性關(guān)系,使得難以標(biāo)注代表性的樣本,使得傳統(tǒng)分類方法在應(yīng)對這些數(shù)據(jù)時效果不佳。因此,本文引入SVM主動學(xué)習(xí)方法,設(shè)計一種新的制革企業(yè)財務(wù)管理數(shù)據(jù)分類方法。SVM主動學(xué)習(xí)是一種機(jī)器學(xué)習(xí)算法,它結(jié)合了SVM和主動學(xué)習(xí)的思想。在制革企業(yè)財務(wù)管理數(shù)據(jù)的分類問題上,SVM主動學(xué)習(xí)通過主動選擇最具代表性的樣本進(jìn)行標(biāo)注,從而最大程度地減少標(biāo)注過程中的工作量,提高數(shù)據(jù)屬性標(biāo)注的效率,能夠提高分類準(zhǔn)確性和適應(yīng)性。

2 制革企業(yè)財務(wù)管理數(shù)據(jù)分類方法

2.1 制革企業(yè)財務(wù)管理數(shù)據(jù)降維處理

由于市場規(guī)律和宏觀經(jīng)濟(jì)因素的影響,制革行業(yè)普遍具有周期性波動。需求、價格和盈利水平在不同的周期中可能表現(xiàn)出不同的趨勢,這對財務(wù)管理數(shù)據(jù)產(chǎn)生直接影響。為了解決這個問題,在對制革企業(yè)財務(wù)管理數(shù)據(jù)進(jìn)行分類之前,需要進(jìn)行樣本處理和向量化。針對這一需求,制革企業(yè)財務(wù)管理數(shù)據(jù)分類過程先對原始數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)化或歸一化處理,將各個財務(wù)指標(biāo)歸一到相同的尺度范圍內(nèi),以便在分類過程中更有效地比較它們的相對大小和趨勢?;赟VM 主動學(xué)習(xí)的制革企業(yè)財務(wù)管理數(shù)據(jù)分類方法的創(chuàng)新之處在于,在考慮周期性波動的情況下,能夠更準(zhǔn)確地捕捉到財務(wù)管理數(shù)據(jù)的潛在特征和趨勢。通過將數(shù)據(jù)轉(zhuǎn)換為向量模式并對其進(jìn)行標(biāo)準(zhǔn)化處理,可以更好地對不同周期的數(shù)據(jù)進(jìn)行比較和分類,從而提高分類結(jié)果的準(zhǔn)確性和魯棒性。這種方法對于制革企業(yè)財務(wù)管理數(shù)據(jù)的分類與分析具有重要意義。

結(jié)合向量空間模型,將制革企業(yè)財務(wù)管理數(shù)據(jù)特征項的權(quán)重用{W1,W2,…,Wm}表示,其中Wi代表第i 個特征項的權(quán)重。計算制革企業(yè)財務(wù)管理數(shù)據(jù)的整體權(quán)重值:

通過上述的處理和計算,將制革企業(yè)財務(wù)管理數(shù)據(jù)庫表示為規(guī)格為m ×n 的資源矩陣,則有:

上式中,αij為制革企業(yè)整體財務(wù)管理數(shù)據(jù)量,m 代表資源庫中含有的不同財務(wù)管理數(shù)據(jù)類型[6,7]。

制革企業(yè)的經(jīng)營涉及多個環(huán)節(jié),這就意味著財務(wù)管理數(shù)據(jù)反映了企業(yè)在不同方面的特點,如資產(chǎn)負(fù)債結(jié)構(gòu)和融資狀況,同時也體現(xiàn)了各項成本的變化和占比情況。然而,由于制革企業(yè)的復(fù)雜性,財務(wù)管理數(shù)據(jù)往往處于高維向量空間中,其中特征維數(shù)可能高達(dá)幾十萬。在高維向量空間中進(jìn)行財務(wù)管理數(shù)據(jù)的分類和處理具有一定的困難。為了有效解決這一問題,需要對財務(wù)管理數(shù)據(jù)進(jìn)行降維處理,將特征維數(shù)壓縮至適當(dāng)?shù)拇笮?,以匹配?xùn)練樣本數(shù)量。通過降維,可以有效去除財務(wù)管理數(shù)據(jù)中的噪聲,并提升分類效率和準(zhǔn)確度。通過降維處理,將制革企業(yè)的財務(wù)管理數(shù)據(jù)轉(zhuǎn)化為更加緊湊的表示形式,可以減少不必要的冗余信息,同時保留重要特征,這有助于提高財務(wù)管理數(shù)據(jù)分類的質(zhì)量。通過合理的降維方法,能夠在保持?jǐn)?shù)據(jù)的完整性和準(zhǔn)確性的同時,顯著降低計算復(fù)雜度,提升財務(wù)管理數(shù)據(jù)分類過程的可行性和可靠性。

通過互特征選擇方法計算不同制革企業(yè)財務(wù)管理數(shù)據(jù)的信息量對應(yīng)的比重值[8],具體的計算式為:

2.2 基于SVM 主動學(xué)習(xí)機(jī)的數(shù)據(jù)分類

以降維后的制革企業(yè)財務(wù)管理數(shù)據(jù)為基礎(chǔ),SVM 將制革企業(yè)財務(wù)管理數(shù)據(jù)U 中的樣本數(shù)據(jù)x映射到特征空間中[10],此時的特征空間可表示為:

上式中,z 為特征空間,φ(x)為映射量。在特征空間維度較高的條件下,考慮數(shù)據(jù)的線性可分性,促使權(quán)向量w 和b 需要滿足以下的約束條件:

上式中,w 為權(quán)向量,b 為偏置項,訓(xùn)練樣本集代表w 和φ(x)的點積,通過SVM組建超平面(+b):

引入松弛因子ζi≥0,則有:

為了簡化操作流程,最優(yōu)分類面問題可用公式(8)表達(dá),其中在約束條件下函數(shù)最小值,即:

上式中,Cp代表懲罰參數(shù)。

由于特征空間的維數(shù)十分高,w 和φ(x)的取值不精準(zhǔn),引入核函數(shù)K (x,x'):

通過徑向基函數(shù)將線性不可分問題改為線性可分問題,該函數(shù)用以下公式表示:

式中,y 為財務(wù)數(shù)據(jù)維數(shù)。

現(xiàn)階段SVM訓(xùn)練算法的速度并不理想,主要是受到目標(biāo)函數(shù)對應(yīng)矩陣維數(shù)的影響,致使問題的求解速度下降和維度增加[11,12]。為了有效解決上述問題,將主動學(xué)習(xí)加入到SVM[13]中,主動學(xué)習(xí)[14,15]可以通過選擇具有較高不確定性或邊界樣本的方式進(jìn)行主動查詢,只需標(biāo)注這些樣本,即可獲得信息豐富、高價值的訓(xùn)練數(shù)據(jù),從而降低了標(biāo)注成本。通過選擇具有最大信息收益的樣本進(jìn)行查詢,將這些樣本添加到訓(xùn)練集中進(jìn)行模型訓(xùn)練,可以提高模型的性能和魯棒性。由于主動學(xué)習(xí)能夠針對目標(biāo)任務(wù)聚焦于關(guān)鍵樣本,使得模型對關(guān)鍵樣本的分類準(zhǔn)確性更高,從而提高了整體分類效果。具體操作步驟為:

在特征空間中搭建SVM 主動學(xué)習(xí)機(jī),SVM 主動學(xué)習(xí)機(jī)由兩個部分組成(f,q),f 代表獨立的分類器;q 代表查詢函數(shù)。SVM主動學(xué)習(xí)機(jī)主要是通過查詢函數(shù)確定最終的查詢策略,同時在未進(jìn)行標(biāo)注的候選集U 中選取下一個需要進(jìn)行標(biāo)注的樣本,結(jié)合決策概率進(jìn)行數(shù)據(jù)分別,以保證后續(xù)的數(shù)據(jù)分類質(zhì)量與效率。

制革企業(yè)運營面臨多種風(fēng)險和不確定性會導(dǎo)致財務(wù)管理數(shù)據(jù)的波動和變化,因此在對制革企業(yè)財務(wù)管理數(shù)據(jù)分類的過程中,分類間隔中生成的樣本會影響分類器的構(gòu)建,為了確保分類結(jié)果的準(zhǔn)確性,在每次進(jìn)行分類面選擇時,選擇距離分類器距離最近的樣本為最新的樣本。但是在整個操作的過程中,仍然會對分類器的性能產(chǎn)生影響,為此需要利用SVM 主動學(xué)習(xí)機(jī)對于制革企業(yè)財務(wù)管理數(shù)據(jù)進(jìn)行標(biāo)注,具體操作步驟如下:

(1)從候選集U 中選擇i 個代表性樣本,按照不同的類型進(jìn)行標(biāo)記,建立一個初始的訓(xùn)練樣本集T。

(2)通過T 建立分類器f 。

(4)從樣本集U 中選擇出最接近于分類器邊緣的、未標(biāo)記的樣本(x,)。

(5)將不同的制革企業(yè)財務(wù)管理數(shù)據(jù)進(jìn)行標(biāo)注后,直接放置到訓(xùn)練樣本集T 中。

(6)假設(shè)檢測精度達(dá)到設(shè)定的范圍內(nèi),則停止計算;反之,則返回步驟(2),重復(fù)上述操作,完成數(shù)據(jù)屬性標(biāo)注,得到標(biāo)注后的數(shù)據(jù)樣本集L0。

基于SVM 主動學(xué)習(xí)機(jī)的制革企業(yè)財務(wù)管理數(shù)據(jù)分類流程如下:

步驟1:初始化帶類別標(biāo)注樣本集L0,L0=L;未帶類別標(biāo)注候選樣本U0,U0=U 。

步驟2:進(jìn)行第i 次采樣學(xué)習(xí),在樣本集L0基礎(chǔ)上尋找最優(yōu)分類超平面fi,計算該樣本集數(shù)據(jù)屬于這一樣本集的最大決策概率值,該值的計算公式如下:

式中,p 為初始候選樣本量,q 為最終標(biāo)注樣本量。

步驟3:針對每一個候選樣本Ui∈U,假設(shè)P(b)代表第二大的決策概率值,得到制革企業(yè)財務(wù)管理數(shù)據(jù)分類的初步?jīng)Q策函數(shù),該函數(shù)用以下公式表示:

上式中,k 代表Kappa 系數(shù),δ(Ci)代表訓(xùn)練樣本中屬于類別Ci的樣本概率,其計算公式如下:

上式中,A(Ci)代表訓(xùn)練樣本中屬于類別Ci的樣本總數(shù)。

結(jié)合上述分析,制革企業(yè)財務(wù)管理數(shù)據(jù)分類結(jié)果如下:

3 仿真實驗

為了驗證所提基于SVM 主動學(xué)習(xí)的制革企業(yè)財務(wù)管理數(shù)據(jù)分類方法的綜合有效性,在MATLAB R2016a 軟件中進(jìn)行測試,實驗環(huán)境設(shè)置如表1 所示。

表1 實驗環(huán)境設(shè)置

選用山東省中小型制革企業(yè)作為研究對象,采集該研究對象2020-2022 年的所有數(shù)據(jù)。由于所采集到的制革企業(yè)的所有數(shù)據(jù)包含非財務(wù)數(shù)據(jù),這類數(shù)據(jù)屬于冗余數(shù)據(jù),因此需要對其進(jìn)行篩選與去除處理,具體過程如下:

(1)確定非財務(wù)數(shù)據(jù)范圍:非財務(wù)數(shù)據(jù)涉及到公司員工信息、市場銷售數(shù)據(jù)、供應(yīng)鏈數(shù)據(jù)等與財務(wù)管理無關(guān)的信息。

(2)數(shù)據(jù)集初步篩選:根據(jù)確定的非財務(wù)數(shù)據(jù)范圍,對整個數(shù)據(jù)集進(jìn)行初步篩選,并通過查看數(shù)據(jù)字段、列名、描述或文檔來確定包含或排除某些數(shù)據(jù)。

(3)人工查找與刪除:基于對數(shù)據(jù)的了解、特定關(guān)鍵詞或指標(biāo)的搜索來確定哪些數(shù)據(jù)是非財務(wù)數(shù)據(jù),并通過人工方式將其從數(shù)據(jù)集中刪除。

隨后,在實驗過程中從篩選得到的財務(wù)管理數(shù)據(jù)集中選取相關(guān)共計3000 條數(shù)據(jù),其中包含現(xiàn)金流數(shù)據(jù)、投資數(shù)據(jù)、籌資數(shù)據(jù)、財務(wù)會計數(shù)據(jù)、成本管理數(shù)據(jù)、預(yù)算數(shù)據(jù)、資金管理數(shù)據(jù)、經(jīng)營指標(biāo)數(shù)據(jù)、稅務(wù)數(shù)據(jù)、經(jīng)營報表數(shù)據(jù)。通過對上述數(shù)據(jù)進(jìn)行降維處理,去除數(shù)據(jù)中的冗余特征,再進(jìn)行實驗數(shù)據(jù)的選取。具體實驗數(shù)據(jù)類型如表2 所示。

表2 實驗所用數(shù)據(jù)類型

實驗過程如下:

對財務(wù)管理數(shù)據(jù)進(jìn)行清洗、去除異常值、處理缺失數(shù)據(jù)等操作,確保數(shù)據(jù)的質(zhì)量和一致性。將文獻(xiàn)[3]方法和文獻(xiàn)[4] 方法以及所提方法作為實驗對比方法,通過對比不同實驗指標(biāo)來對于不同方法的實際應(yīng)用效果進(jìn)行了深入驗證。

實驗指標(biāo)1:將所有實驗數(shù)據(jù)以打亂的形式使其分散在樣本空間中,利用不同方法對于其進(jìn)行分類,哪種方法夠?qū)⑾嗤瑢傩缘臄?shù)據(jù)分為一類,則說明該方法的分類效果好。

實驗指標(biāo)2:在制革企業(yè)財務(wù)管理數(shù)據(jù)分類的過程中,容錯率是指分類方法對錯誤分類或誤差的容忍程度。它衡量了在分類過程中允許的錯誤預(yù)測的比例。較高的容錯率意味著模型對于錯誤分類或誤差的容忍性較高,可能會導(dǎo)致更多的誤報或漏報。

實驗指標(biāo)3:Kappa 系數(shù)考慮了不同方法的分類準(zhǔn)確率與預(yù)期準(zhǔn)確率之間的一致性,用于評估方法與隨機(jī)分類之間的差異,其取值范圍為[0,1]。

文獻(xiàn)[3]方法和文獻(xiàn)[4]方法以及所提方法的制革企業(yè)財務(wù)管理數(shù)據(jù)分類效果如圖1 所示。

圖1 制革企業(yè)財務(wù)管理數(shù)據(jù)分類效果

分析圖1 中的結(jié)果可知,利用文獻(xiàn)[3]方法對于制革企業(yè)財務(wù)管理數(shù)據(jù)分類后,部分?jǐn)?shù)據(jù)被歸為一類,但是有更多的數(shù)據(jù)依然并未歸類,因此這種方法的分類效果比較差。利用文獻(xiàn)[4]方法對于制革企業(yè)財務(wù)管理數(shù)據(jù)分類后,雖然能夠?qū)?shù)據(jù)分為8 個類別,但是分類結(jié)果中存在較多的漏分和錯分情況,所以這種方法的分類效果依舊不佳。而與這兩種方法相比,所提方法能夠?qū)⑺袠颖緮?shù)據(jù)精準(zhǔn)分為7 類,存在漏分情況,但是不嚴(yán)重,說明這種方法的分類效果好。

文獻(xiàn)[3]和文獻(xiàn)[4]方法以及所提方法的制革企業(yè)財務(wù)管理數(shù)據(jù)分類容錯率對比結(jié)果如圖2 所示。

圖2 制革企業(yè)財務(wù)管理數(shù)據(jù)分類容錯率

分析圖2 中的實驗數(shù)據(jù)可知,制革企業(yè)財務(wù)管理數(shù)據(jù)分類容錯率隨著實驗次數(shù)的增加具有顯著的波動變化趨勢。其中,文獻(xiàn)[3]方法的制革企業(yè)財務(wù)管理數(shù)據(jù)分類容錯率最大值為36.7%,最小值為14.6%;文獻(xiàn)[4]方法的制革企業(yè)財務(wù)管理數(shù)據(jù)分類容錯率最大值為37.2%,最小值為18.1%;所提方法的制革企業(yè)財務(wù)管理數(shù)據(jù)分類容錯率最大值為6.8%,最小值為2.8%;綜合來看,所提方法的制革企業(yè)財務(wù)管理數(shù)據(jù)分類容錯率曲線始終位于實驗對比方法之下,且變化較為穩(wěn)定,說明該方法的容錯率較低,能降低數(shù)據(jù)錯誤分類發(fā)生的概率。

文獻(xiàn)[3]方法和文獻(xiàn)[4]方法以及所提方法的制革企業(yè)財務(wù)管理數(shù)據(jù)分類Kappa 系數(shù)對比結(jié)果如表3 所示。

表3 Kappa 系數(shù)對比結(jié)果

分析表3 中的結(jié)果可知,所提方法的Kappa 系數(shù)均值為0.92,文獻(xiàn)[3]方法的Kappa 系數(shù)均值為0.76,文獻(xiàn)[4]方法的Kappa 系數(shù)均值為0.61。經(jīng)過對比可得,所提方法的Kappa 系數(shù)更接近與1,說明該方法的分類結(jié)果與真實結(jié)果之間一致性更高,具有較高的預(yù)測精度。

綜合分析上述各項測試指標(biāo)可知,所提方法的分類效果、容錯率和Kappa 系數(shù)均高于另外兩種方法,最為主要的原因是:在實際操作的過程中,所提方法加入了主動學(xué)習(xí)算法對制革企業(yè)財務(wù)管理數(shù)據(jù)進(jìn)行分類,促使整個方法的各項性能均得到有效提升,同時具有較強的魯棒性。

4 結(jié)束語

財務(wù)信息是企業(yè)運營和決策的重要基礎(chǔ),通過對財務(wù)數(shù)據(jù)的分類和分析,可以幫助管理者更好地進(jìn)行戰(zhàn)略規(guī)劃、風(fēng)險控制和決策制定,因此提出了一種基于SVM 主動學(xué)習(xí)的制革企業(yè)財務(wù)管理數(shù)據(jù)分類方法,以期為制革企業(yè)面臨的復(fù)雜市場環(huán)境和周期性波動所帶來的挑戰(zhàn)提供了一種創(chuàng)新的解決方案。仿真實驗結(jié)果表明,所提方法能夠有效提升方法的分類效果,降低容錯率,提升預(yù)測精度,分類效果達(dá)到了相關(guān)預(yù)期。該方法能夠給制革企業(yè)提供了一種精確、高效的解決方案,可以幫助企業(yè)更好地理解和分析財務(wù)管理數(shù)據(jù),從而做出更為準(zhǔn)確的業(yè)務(wù)決策。

猜你喜歡
制革分類樣本
制革工業(yè)水污染全過程防治技術(shù)組合方案研究
分類算一算
用樣本估計總體復(fù)習(xí)點撥
分類討論求坐標(biāo)
推動醫(yī)改的“直銷樣本”
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
隨機(jī)微分方程的樣本Lyapunov二次型估計
制革下腳料酶解物對番茄生長的影響
村企共贏的樣本
禹州市| 恩施市| 洛扎县| 镇赉县| 彭州市| 临泉县| 西和县| 敦化市| 托克逊县| 苍山县| 长沙县| 封开县| 合水县| 太原市| 河北区| 明星| 永靖县| 永仁县| 修文县| 兴海县| 惠水县| 兴仁县| 郯城县| 榆林市| 璧山县| 兴国县| 日土县| 武隆县| 洮南市| 长沙县| 青铜峡市| 嘉禾县| 灌南县| 陆良县| 西乌| 东阳市| 益阳市| 邵阳市| 南雄市| 宜春市| 盘锦市|