賓揚帆
(湖南環(huán)境生物職業(yè)技術(shù)學(xué)院,湖南 衡陽 421005)
創(chuàng)新創(chuàng)業(yè)是當(dāng)今社會的主旋律,但在過程中存在激烈的競爭,需要面對若干不確定因素,導(dǎo)致創(chuàng)新創(chuàng)業(yè)的成功率偏低。高校作為人才培養(yǎng)的基地,有責(zé)任在創(chuàng)新創(chuàng)業(yè)中給予專業(yè)的指導(dǎo)和建設(shè)性的路徑建議?,F(xiàn)實中,由于信息不對等、不及時等原因,高校的創(chuàng)業(yè)路徑指導(dǎo)存在滯后和盲目的問題。為了從技術(shù)層面解決這一問題,應(yīng)用大數(shù)據(jù)分析的思維,將影響創(chuàng)新創(chuàng)業(yè)的因素以數(shù)值化的形式表示,并將其影響效果和相互關(guān)聯(lián)關(guān)系在模型中進(jìn)行詮釋,所得到的結(jié)果是兼顧了歷史、同行、背景、產(chǎn)業(yè)相關(guān)方等豐富數(shù)據(jù)的融合體現(xiàn),會對創(chuàng)新創(chuàng)業(yè)的方向和路徑起到指引作用,避免了盲目跟從所帶來的風(fēng)險。同時,通過數(shù)據(jù)融合分析的全面性特點,可以在紛繁復(fù)雜的市場關(guān)系中,找到適合創(chuàng)業(yè)者專業(yè)方向的路徑,助力創(chuàng)業(yè)成功。在大數(shù)據(jù)處理技術(shù)領(lǐng)域,“融合”已經(jīng)是一種重要的理念,可以將紛繁復(fù)雜的多元信息進(jìn)行歸一化處理,建立可相互影響的信息處理模型,以實現(xiàn)復(fù)雜問題的簡單化描述。多源信息的融合有助于挖掘數(shù)據(jù)的潛力,提高分析的效率;多源數(shù)據(jù)的相互驗證,可以減少錯誤和疏忽,防止決策失誤。
制約創(chuàng)新創(chuàng)業(yè)成功的因素很多,但是在某一確定行業(yè)領(lǐng)域,單一影響因素的作用效果卻是可以預(yù)先評估的。因此需要在很多因素的海量信息中,提取出對創(chuàng)新創(chuàng)業(yè)的結(jié)果影響最直接、作用最突出的一項或幾項數(shù)據(jù)信息,作為評價該創(chuàng)業(yè)創(chuàng)新路徑成功概率的核心要素。
數(shù)據(jù)篩選規(guī)則針對的是某一確定行業(yè)的相關(guān)單位經(jīng)營業(yè)績、發(fā)展速度、產(chǎn)業(yè)規(guī)模、用工層次、營收額度、納稅信息等龐雜的數(shù)據(jù)信息,采用關(guān)鍵詞過濾的監(jiān)控方式和特定類型數(shù)據(jù)的對比鑒別,收集到關(guān)聯(lián)度高的價值數(shù)據(jù),實現(xiàn)數(shù)據(jù)挖掘。設(shè)計的具體流程為:SDFR(Service discovery for multi-robot systems,多自動處理系統(tǒng)的服務(wù)發(fā)現(xiàn))通過網(wǎng)絡(luò)層傳輸?shù)綉?yīng)用層的整體數(shù)據(jù)特性,對數(shù)據(jù)的特征、總量等關(guān)鍵信息進(jìn)行統(tǒng)計類型的描述。SDFR系統(tǒng)具有良好的可擴(kuò)充能力,能夠根據(jù)行為的特征,實現(xiàn)對各種關(guān)鍵詞的處理,包括采樣輸出、原始報文和源資料輸出等。借助SDFR系統(tǒng)核心引擎,以信息融合技術(shù)為基礎(chǔ)的大學(xué)創(chuàng)新創(chuàng)業(yè)路徑規(guī)則體系主要由規(guī)則頭部、規(guī)則本體和規(guī)則行為三大類組成。規(guī)則主體定義特征匹配、計算規(guī)則,以提高規(guī)則的易讀度。在SDFR系統(tǒng)的搜索引擎發(fā)現(xiàn)關(guān)鍵詞后,認(rèn)為該段信息具有價值,則開啟擴(kuò)展搜索,對該信息段的關(guān)聯(lián)信息和上下游信息進(jìn)行加強(qiáng)檢索。過程引擎是多維數(shù)據(jù)融合過濾過程的核心,可以將SDFR轉(zhuǎn)化為一組過濾法則,根據(jù)需求啟動對應(yīng)的數(shù)據(jù)處理,最終實現(xiàn)一個完整的過濾過程。整個處理流程由規(guī)則預(yù)處理、規(guī)則匹配和規(guī)則發(fā)現(xiàn)標(biāo)識3個環(huán)節(jié)組成。該文對所選擇的測值資料采用平均權(quán)重法進(jìn)行分析,其核心是一種特殊的最小二乘估算,如公式(1)所示。
參數(shù)的最小二乘估計如公式(2)所示。
圖1 信息數(shù)據(jù)融合示意圖
式中:觀測矢量∈R,觀測矩陣∈R,未知參數(shù)矢量∈R,∈R為相同分布高斯白噪聲。當(dāng)觀測矩陣=[1,1,...,1]∈R,化簡為式(3)。
對矩陣進(jìn)行分析,發(fā)現(xiàn)該算法與平均法基本一致,驗證了模型的正確性。通過相似的計算程序可以把這種方法稱為最小無偏化計算。該文應(yīng)用了一種基于最小二乘的最大值估計法,即最大偏差二乘法可以對下限進(jìn)行最大程度的估算。在該條件下,算法的最大值會受到限制,應(yīng)用基于數(shù)據(jù)融合的線性偏差估算方法,可以有效地改善篩選的可靠性.
對規(guī)則進(jìn)行分析,進(jìn)行優(yōu)化匹配。利用SDFR語法分析和詞法分析,規(guī)范了搜索結(jié)果的匹配性;從多維的數(shù)據(jù)集中,提取各個規(guī)則下的不同維度數(shù)據(jù),按照不同的維度劃分,構(gòu)建起一個多維的規(guī)則,并以此為基礎(chǔ)構(gòu)建了多維數(shù)據(jù)模型,以實現(xiàn)基于Bitmap數(shù)據(jù)下標(biāo)的快速查找。當(dāng)Bitmap發(fā)現(xiàn)滿足條件的矢量結(jié)果,建立鏈接,并設(shè)定標(biāo)志位bit為1,代表相應(yīng)的常點數(shù);如果bit為0,則代表在匹配處理中匹配結(jié)果發(fā)生了變化?;跀?shù)據(jù)包、報文和深度報文的多維度特征比對,采用基于數(shù)據(jù)流的規(guī)則匹配。網(wǎng)絡(luò)信息的特征包括自定義標(biāo)題、五元組和載體的信息特征和相位特征,包括會話創(chuàng)建、會話重組和會話超時。在對話流程建立的過程中,可以對五個元素組進(jìn)行分析,判斷自定義特征。然后進(jìn)行五個元素相應(yīng)維度的對應(yīng)匹配,并刷新對應(yīng)的結(jié)果矢量;對重新組合的過程不必進(jìn)行任何的匹配;在保證精確度的前提下,對多個層次進(jìn)行多維的匹配,提高數(shù)據(jù)處理的正確性。引入線性模型的典型形式,為式(4)。
未知矢量的最小二乘估計為式(5)。
式中:Λ={λ},為特征根,為線性變換。α和x之間的關(guān)系如式(6)所示。
式中:是對應(yīng)特征根的標(biāo)準(zhǔn)化正交特征向量,通過對多個單維度Bitmap的結(jié)果矢量進(jìn)行對比和操作,并從該結(jié)果矢量的中間點找到相應(yīng)的規(guī)則ID,從而得到該規(guī)則的真實ID。規(guī)則矩陣是以多個單一維度的法則矢量為基礎(chǔ),以發(fā)現(xiàn)的結(jié)果為參數(shù),儲存該規(guī)則的集合。該算法采用了基于2個方向的矩陣模型實現(xiàn)對網(wǎng)絡(luò)數(shù)據(jù)的相似性模擬,并將其劃分成行和列兩種類型變化。
以數(shù)據(jù)整合為基礎(chǔ)的大學(xué)創(chuàng)新創(chuàng)業(yè)路徑引導(dǎo)信息的整合,要求在對創(chuàng)業(yè)成功性進(jìn)行判定時,通過對確定行業(yè)各種特征指數(shù)的分析,結(jié)合輸入的確定信息,進(jìn)行全面剖析,得出對創(chuàng)業(yè)成功率的最后判定。通過對各個目標(biāo)的不同特性描述,對這些信息進(jìn)行分析和加工,根據(jù)一定的規(guī)律對冗余和互補(bǔ)信息進(jìn)行綜合,并對其進(jìn)行選擇和判定,從而得出一個正確的決策結(jié)果。
創(chuàng)業(yè)融合路徑指導(dǎo)利用冗余度的方法對目標(biāo)進(jìn)行分析,并利用補(bǔ)充的數(shù)據(jù)增強(qiáng)了系統(tǒng)的穩(wěn)定性。對這些數(shù)據(jù),系統(tǒng)并沒有進(jìn)行簡單的分析和整合,而是按照數(shù)據(jù)中的時空特性,按照數(shù)據(jù)的等級進(jìn)行分類,以此實現(xiàn)在一個層面對數(shù)據(jù)進(jìn)行分析,也可以從多個層面進(jìn)行融合。分類過程分為數(shù)據(jù)層、特征層和決策層3個層級。該文根據(jù)以上原理,對有偏差量的可靠度進(jìn)行了量化表達(dá),在較大程度上反映了被測參量的真實值。在該情況下未知數(shù)矢量的每個元素α的有偏樣本方差為式(7)。
因為α 滿足正態(tài)分布,所以高校大學(xué)生對創(chuàng)新創(chuàng)業(yè)的路徑指導(dǎo)α的概率密度函數(shù)為式(8)。
在對數(shù)據(jù)進(jìn)行分析和合并之前,通過對傳感器的測量結(jié)果進(jìn)行預(yù)處理,以消除噪聲的影響,從而獲得準(zhǔn)確的數(shù)據(jù)。數(shù)據(jù)的特征抽取是在經(jīng)過預(yù)處理后,按照特定的準(zhǔn)則選擇出相應(yīng)的特征,從而獲得最終的融合結(jié)果。最后通過數(shù)據(jù)的融合運算,針對特定的應(yīng)用需求進(jìn)行選擇和運用
[10]。
通過對各信息進(jìn)行有效的數(shù)據(jù)層次融合,完成對目標(biāo)的最終判斷,從而改善整個創(chuàng)業(yè)路徑的綜合效能。由于數(shù)據(jù)具有多種特性,因此可以按照不同的應(yīng)用需求和數(shù)據(jù)特性對其進(jìn)行多層次、多階段的分析,從而進(jìn)行分級。因為在提取原始數(shù)據(jù)和資料時,必須先概括與原資料完全一致的特征信息,否則無法將2種類型的資料進(jìn)行合并。概括過程不需要預(yù)先進(jìn)行任何的處理步驟,即可將數(shù)據(jù)的全部信息保留下來,從而實現(xiàn)數(shù)據(jù)的融合。利用相關(guān)對象的特征矢量進(jìn)行目標(biāo)環(huán)境的辨識,使用神經(jīng)網(wǎng)絡(luò)算法,決策級集成了各個感知系統(tǒng)的決策信息,從而提高了性能。在決策層面上,各個感知節(jié)點分別接收到各自的數(shù)據(jù),并對各個獨立的個體進(jìn)行分析判斷,在圖2中顯示了特征級的數(shù)據(jù)融合層次構(gòu)造圖。
圖2 數(shù)據(jù)融合層次圖
針對高校的創(chuàng)新創(chuàng)業(yè)背景下,在進(jìn)行融合的過程中,要從融合方案、資金預(yù)算、檢測參數(shù)以及系統(tǒng)性能等方面進(jìn)行考量,融合效果與融合層次、融合程度和計算能力都息息相關(guān)。所得到的最終決策,綜合了制約創(chuàng)業(yè)成功的影響因素,在多重決策的前提下,實現(xiàn)了相互關(guān)聯(lián),剔除重復(fù)影響因素,加重了關(guān)鍵影響因素,形成綜合化決策結(jié)果。
為了更好地理解大學(xué)生創(chuàng)新創(chuàng)業(yè)的意識趨向,該文從基本情況、創(chuàng)新計劃、創(chuàng)業(yè)方向和創(chuàng)業(yè)預(yù)備四個方面入手,將研究對象涵蓋到全體應(yīng)屆畢業(yè)生。大學(xué)生創(chuàng)業(yè)目標(biāo)不夠明確,但在創(chuàng)業(yè)者看來,創(chuàng)業(yè)最大的問題在于缺少經(jīng)驗、缺少人脈、缺少社會資源、缺少創(chuàng)業(yè)精神等。研究結(jié)果表明,目前高校學(xué)生創(chuàng)新創(chuàng)業(yè)存在突出問題變現(xiàn)在:高校創(chuàng)新創(chuàng)業(yè)課程開設(shè)不足、創(chuàng)業(yè)政策和理念認(rèn)識不足;在應(yīng)試教育體系中,營銷意識、理財技能和交流技能基本欠缺;項目選擇盲目,好高騖遠(yuǎn),創(chuàng)業(yè)技能不足且急于求成;社會資源相對貧乏、人脈積累不足;經(jīng)營管理經(jīng)驗不足,處于“摸著石頭過河”的盲動狀態(tài);國家和社會層面在政策傾斜、資金支持等多個方面相對欠缺;對現(xiàn)有社會資源、平臺無法合理利用等可能遇到的問題或潛在風(fēng)險。將以上直接或潛在影響因素作為輸入數(shù)據(jù),進(jìn)行數(shù)據(jù)信息的融合計算,驗證高校創(chuàng)新創(chuàng)業(yè)路徑指導(dǎo)的作用與正確性。
為更好地對比研究大學(xué)創(chuàng)新創(chuàng)業(yè)過程中的有偏差和無偏差的測量結(jié)果的可信度,結(jié)合一個統(tǒng)一的基礎(chǔ)標(biāo)準(zhǔn),在非偏差的對稱范圍中,對有偏差的可靠度進(jìn)行量化表達(dá),數(shù)據(jù)融合的過程如圖3所示。
圖3 數(shù)據(jù)融合過程
由于測量的可靠性和誤差都是在(+∞,+∞)的范圍之內(nèi),因此,量化表達(dá)的可靠性必須在一個特定的數(shù)值區(qū)間中進(jìn)行量化評估。例如假定在一個限制條件下,測量的數(shù)值在(+∞,+∞)的區(qū)間中均可以達(dá)到,所以任何一個測量的數(shù)值都是絕對可靠的,明顯不適合于實際情況。在測量的過程中,要力求一個盡可能小的變化范圍和一個可接受的誤差區(qū)間,測量的可靠性必須是高可信度。因此,不能僅依靠一個方差或一個誤差來度量,而是要把誤差和方差結(jié)合起來??煽啃灾笖?shù)不僅要量化,而且還要給出上限,二者缺一不可,如果只量化可靠性而不給出上限條件,就不可能準(zhǔn)確地判斷其可靠性。將基本情況、創(chuàng)新計劃、創(chuàng)業(yè)方向、創(chuàng)業(yè)準(zhǔn)備四個維度的不同情況數(shù)據(jù)代入模型中計算,融合判定結(jié)果對例如圖4所示。
從圖4可以看出,創(chuàng)業(yè)目標(biāo)明確的創(chuàng)業(yè)大學(xué)生越來越多,該模型可以在不確定的情況下,將數(shù)據(jù)的統(tǒng)計結(jié)果與最小二乘法進(jìn)行比較,制定一種新的路徑指導(dǎo)策略。采用該方法能夠提高指導(dǎo)的可靠性,為創(chuàng)業(yè)學(xué)生提供有針對性的建議,使高校學(xué)生創(chuàng)新創(chuàng)業(yè)的內(nèi)容明確,提高創(chuàng)業(yè)成功率。
圖4 高校大學(xué)生創(chuàng)新創(chuàng)業(yè)指導(dǎo)后變化圖
當(dāng)前,我國高校學(xué)生在創(chuàng)業(yè)的過程中,對創(chuàng)業(yè)的性質(zhì)、創(chuàng)業(yè)目標(biāo)的選擇、創(chuàng)業(yè)方向的選擇、素質(zhì)的培養(yǎng)、可能遇到的問題以及失敗后的對策等都存在較大的誤區(qū),亟需給予專業(yè)性的指導(dǎo)。在數(shù)據(jù)融合技術(shù)的基礎(chǔ)上,利用數(shù)據(jù)分析技術(shù),將實測數(shù)據(jù)的平均值或權(quán)重平均與最小二乘法進(jìn)行了等值,并根據(jù)有偏差估算的方差和結(jié)果調(diào)整測量準(zhǔn)確率,并給出了一種具有偏差的數(shù)據(jù)融合算法,可以全面的處理制約學(xué)生創(chuàng)新創(chuàng)業(yè)的影響因素,形成綜合化的指導(dǎo)意見,供學(xué)生參考。通過這種數(shù)學(xué)化的創(chuàng)新創(chuàng)業(yè)路徑指導(dǎo)模型,在總結(jié)前人經(jīng)驗的基礎(chǔ)上規(guī)避創(chuàng)新創(chuàng)業(yè)風(fēng)險,為學(xué)生提供一種融合多方數(shù)據(jù)信息的指導(dǎo)意見,助力創(chuàng)新創(chuàng)業(yè)成功。由于時間的問題,制約創(chuàng)新創(chuàng)業(yè)的影響因素信息等基礎(chǔ)數(shù)據(jù)庫構(gòu)建的還不完善,導(dǎo)致計算過程存在較大的偏差,需要在今后的研究中不斷補(bǔ)充豐富,在迭代提升中提高路徑指導(dǎo)的準(zhǔn)確性。