戴強(qiáng)
摘? 要:本文以企業(yè)信息化的軟硬件保障水平、信息化組織水平、信息技術(shù)應(yīng)用與盈利水平、信息化能力水平四個(gè)角度建立中小企業(yè)信息化評(píng)價(jià)體系,應(yīng)用粗集的屬性約簡(jiǎn)理論對(duì)指標(biāo)進(jìn)行約簡(jiǎn),同時(shí)構(gòu)建了一個(gè)二階分段光滑函數(shù)支持向量機(jī)模型,利用光滑支持向量機(jī)對(duì)企業(yè)的信息化水平進(jìn)行了評(píng)價(jià),最后,通過具體實(shí)例進(jìn)行實(shí)證分析,以證明方法的有效性。
關(guān)鍵詞:企業(yè)信息化;光滑支持向量機(jī);屬性約簡(jiǎn)
中圖分類號(hào):TP301? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
Abstract: In this research, the information evaluation system for SMEs is established from the four perspectives of enterprise informationization: software and hardware security level, information organization level, information technology application and profit level, and the informationization level. Through applying the attribute reduction theory of rough set to the index and meanwhile constructing the second-order piecewise smooth function support vector machine model, the informationization level of the enterprises is evaluated with the smooth support vector machine. Finally, the method is proved to be effective through the empirical analysis of the real cases.
Keywords: enterprise informationization; smooth support vector machine; attribute reduction
1? ?引言(Introduction)
隨著大數(shù)據(jù)、邊緣計(jì)算、物聯(lián)網(wǎng)、區(qū)塊鏈等技術(shù)的快速發(fā)展,企業(yè)的信息化數(shù)據(jù)呈幾何趨勢(shì)增長(zhǎng),根據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心預(yù)測(cè),2020年全球企業(yè)信息化的數(shù)據(jù)量將達(dá)到35ZB[1]。2016年大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)4月27日到28日舉行[2],在工業(yè)和信息化部的指導(dǎo)下,中國信息通信研究院和數(shù)據(jù)中心聯(lián)盟面向企業(yè)和政府部門征集大數(shù)據(jù)在政府及相關(guān)部門應(yīng)用的優(yōu)秀技術(shù)成果和案例,形成政府大數(shù)據(jù)應(yīng)用領(lǐng)域的優(yōu)秀案例匯編。總之,在大數(shù)據(jù)時(shí)代背景下,中小企業(yè)信息化水平影響著中小企業(yè)的健康發(fā)展,然而企業(yè)的信息化建設(shè)需要投入大量的前期成本,信息化投入的成本能否給中小企業(yè)帶來效益還是未知[3],因此對(duì)中小企業(yè)信息化水平進(jìn)行有效地評(píng)估顯得尤為重要。
支持向量機(jī)(Support Vector Machine,SVM)是人工智能算法一個(gè)較新的研究成果[4-7],其應(yīng)用的領(lǐng)域越來越廣泛,SVM的優(yōu)點(diǎn)是在處理小樣本數(shù)據(jù)時(shí)克服了神經(jīng)網(wǎng)絡(luò)的過擬合、易入局部極小的問題[8-10]。然而SVM在數(shù)據(jù)輸入訓(xùn)練時(shí),其分類和預(yù)測(cè)的光滑性略顯不足,同時(shí)其不能智能的確定輸入的訓(xùn)練數(shù)據(jù)的冗余性,這樣就增加了計(jì)算運(yùn)行的復(fù)雜度,而粗糙集的屬性約簡(jiǎn)可以有效地降低輸入數(shù)據(jù)中的噪聲[11],降低輸入數(shù)據(jù)的冗余性。因此,構(gòu)造一個(gè)二階分段光滑函數(shù),增強(qiáng)支持向量機(jī)的非凸分類和預(yù)測(cè)性能,將光滑支持向量機(jī)智能算法與粗糙集屬性約簡(jiǎn)聯(lián)合是互補(bǔ)的,將屬性約簡(jiǎn)后的訓(xùn)練指標(biāo)數(shù)據(jù)輸入到光滑支持向量機(jī)中進(jìn)行訓(xùn)練學(xué)習(xí),然后對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè)或評(píng)價(jià),這樣在消除冗余信息減少光滑支持向量機(jī)的學(xué)習(xí)與預(yù)測(cè)復(fù)雜度的同時(shí),提高了光滑支持向量機(jī)的精度。因此,本文應(yīng)用屬性約簡(jiǎn)—光滑支持向量機(jī)算法對(duì)中小企業(yè)信息化水平評(píng)價(jià)進(jìn)行了研究。
2? 屬性約簡(jiǎn)—光滑支持向量機(jī)模型構(gòu)建 (Attribute reduction-construction of smooth support vector machine model)
2.1? ?模型構(gòu)建描述
本文的屬性約簡(jiǎn)—光滑支持向量機(jī)聯(lián)合評(píng)價(jià)模型主要是應(yīng)用在中小企業(yè)信息化水平評(píng)價(jià)上,因此構(gòu)建模型的基本思路是:第一步應(yīng)用粗糙集的屬性約簡(jiǎn)剔除光滑支持向量機(jī)輸入的指標(biāo)數(shù)據(jù)進(jìn)行有效地去噪處理,將約簡(jiǎn)得到的核心屬性指標(biāo)數(shù)據(jù)分為訓(xùn)練樣本和預(yù)測(cè)樣本送進(jìn)光滑支持向量機(jī)進(jìn)行學(xué)習(xí)與預(yù)測(cè),進(jìn)而進(jìn)行有效地評(píng)價(jià)。
4? ?結(jié)論 (Conclusion)
本文依據(jù)中小企業(yè)的信息化指標(biāo)體系,設(shè)計(jì)了一種基于屬性約簡(jiǎn)—光滑支持向量機(jī)的評(píng)價(jià)模型,通過實(shí)例分析,本文算法對(duì)中小企業(yè)的信息化評(píng)價(jià)是客觀有效地,與比BP神經(jīng)網(wǎng)的評(píng)價(jià)效果相比,本文算法更加準(zhǔn)確和簡(jiǎn)便。因此在信息化飛速發(fā)展的背景下,本文的研究方法在理論和實(shí)際應(yīng)用中都具有重要的意義。
參考文獻(xiàn)(References)
[1] 馬立川,裴慶祺,冷昊,等.大數(shù)據(jù)安全研究概述[J].無線電通信技術(shù),2015,41(1):01-07.
[2] 數(shù)博會(huì)組委會(huì).2016中國大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)暨中國電子商務(wù)創(chuàng)新發(fā)展峰會(huì)[J].中國信息安全,2016(5):4.
[3] 李國杰,程學(xué)旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域—大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國科學(xué)院院刊,2012,27(6):647-657.
[4] Saunders C, Stitson M O, Weston J, et al. Support vector machine[J]. 2002, 1(4): 1-28.
[5] Lin K C, Chien H Y. CSO-based feature selection and parameter optimization for support vector machine[C]. Pervasive Computing. DOI:10.1109/JCPC.2009.5420080.
[6] Shalev Shwartz S, Singer Y, Srebro N, et al. Pegasos: primal estimated sub-gradient solver for SVM[J]. Mathematical Programming, 2011, 127(1): 3-30.
[7] Shom Prasad Das, Sudarsan Pa dhy. A novel hybrid model using teaching learning based optimization and a support vector machine for commodity futures index forecasting[J]. International Journal of Machine Learning & Cybernetics, 2018, 9(1): 97-111.
[8] Yang Z, Lin H Y. A protein-protein interaction extractor for biomedical literature using SVM and rich feature sets [J]. Journal of Biomedical Informatics, 2010, 43(1): 88-96.
[9] Biswajeet Pradhan. A comparative study on the predictive ability of the decision tree, support vector machine and neuro fuzzy models in landslide susceptibility mapping using GIS [J]. Computers & Geosciences, 2012, 51(2): 350-365.
[10] Qian H, Mao Y, Xiang W, et al. Recognition of human activities using SVM multiclass classifier[J]. Pattern Recognition Letters, 2010, 31(2): 100-111.
[11] 謝宏,程浩忠,牛東曉,等.基于信息熵的粗糙集連續(xù)屬性離散化算法[J]. 計(jì)算機(jī)學(xué)報(bào),2005,28(9):1570-1574.
[12] Dun Liu, Tianrui Li, Junbo Zhang. A rough set based incremental approach for learning knowledge in dynamic incomplete information systems[J]. International Journal of Approximate Reasoning, 2014, 55(9): 1764-1786.
[13] Siyuan Jing. A hybrid genetic algorithm for feature subset selection in rough set theory[J]. Soft Computing, 2013, 18(7): 1373-1382.
[14] Richard Jensen, Andrew Tuson. Finding rough and fuzzy rough set reducts with SAT[J]. Information Sciences, 2014, 255: 100-120.
[15] Phophalia A, Rajwade A, Mitra S K. Rough set based image denoising for brain MR images[J]. signal processing, 2014, 103(10): 24-35.
[16] Burges C. A tutorial on support vector machines for pattern recognition[J]. Data Mining and Knowledge Discovery, 1998, 2(2): 121-167.
[17] Lee Y J, Hsieh W F, Huang C M. A smooth support vector machine for epsilon insensitive regression [J]. IEEE Transactions on Knowledge & Data Engineering, 2005, 17(5): 678-685.
[18] 袁玉波,嚴(yán)杰,徐成賢,等.多項(xiàng)式光滑的支撐向量機(jī)[J].計(jì)算機(jī)學(xué)報(bào),2005,28(1):9-17.
[19] Wu Q. A new class of piecewise smooth support vector regressions[J]. Journal of Information Science Engineering,? 2015, 31(5): 1813-1828.
[20] Qing Wu, Bo Li, Wa Wang, et al. Face recognition method based on multi-class classification of smooth support vector machine[J]. Journal of Computer Applications, 2015, 19(5): 688-696.
[21] 肖素梅,殷國富,汪永超,等.企業(yè)信息化水平評(píng)價(jià)指標(biāo)與評(píng)價(jià)方法研究[J]. 計(jì)算機(jī)集成制造系統(tǒng),2005(08):106-114.
[22] 何永琴,王燕嘉,毛文靜,等.中小企業(yè)信息化水平調(diào)查研究[J].內(nèi)蒙古財(cái)經(jīng)大學(xué)學(xué)報(bào),2015(2):60-67.
[23] 李鵬飛.制造企業(yè)信息化水平的評(píng)價(jià)研究[D].青島:中國海洋大學(xué),2013.
[24] 李鋼,田麗娜,齊二石,等.基于BP神經(jīng)網(wǎng)絡(luò)和遺傳算法的企業(yè)信息化評(píng)價(jià)研究[J].科技進(jìn)步與對(duì)策,2018,25(5):129-132.
作者簡(jiǎn)介:
戴? ?強(qiáng)(1972-),男,本科,工程師.研究領(lǐng)域:人工智能,信息化評(píng)估.