(大同大學(xué)渾源師范分校 山西 渾源 037400)
在人們的生產(chǎn)生活中,概率學(xué)知識在方方面面中得到了廣泛的應(yīng)用,它是我們對世界進行更深刻認識的重要工具,通過概率學(xué)與數(shù)理統(tǒng)計工具的應(yīng)用,能夠使人們對各種復(fù)雜的問題及數(shù)據(jù)進行冷靜科學(xué)的分析,從而使人們的生活質(zhì)量得到顯著提高,并且能夠根據(jù)已有的數(shù)據(jù)對事物的演變規(guī)律及發(fā)展趨勢進行準確預(yù)測。正是因為這些優(yōu)勢,使概率論與數(shù)理統(tǒng)計成為許多復(fù)雜問題的指引。如今,人們對大數(shù)據(jù)的分析需求越來越迫切,這也使人們急需一種能夠適用于大數(shù)據(jù)分析的有效方法來解決實際生產(chǎn)生活中的復(fù)雜問題。鑒于此,以下便對概率論與數(shù)理統(tǒng)計在大數(shù)據(jù)分析中的相關(guān)應(yīng)用策略進行探討,希望能為人們在生產(chǎn)生活中的大數(shù)據(jù)分析提供相應(yīng)的參考建議。
在高等數(shù)學(xué)中,概率論與數(shù)理統(tǒng)計方法一種具備鮮明特征的分析,其在研究對象上具有非常獨特的思維特征,并且它和其他學(xué)科特別是經(jīng)濟學(xué)科存在著非常緊密的聯(lián)系。概率論與數(shù)理統(tǒng)計的內(nèi)容非常豐富,這也使其成為數(shù)學(xué)學(xué)科中的重要組成部分?,F(xiàn)階段,概率論與數(shù)理統(tǒng)計方法在各個領(lǐng)域中都得到了非常廣泛的應(yīng)用。從當前來看,概率論與數(shù)理統(tǒng)計可以看作是一種較為獨立的學(xué)科,它在人們的生產(chǎn)生活當中發(fā)揮著巨大的作用,不論是在工業(yè)領(lǐng)域還是在其他領(lǐng)域,概率論與數(shù)理統(tǒng)計方法對信息技術(shù)的要求都非常嚴格,利用概率論與數(shù)理統(tǒng)計方法在大數(shù)據(jù)分析中具有著無可比擬的優(yōu)勢。同時,其又不屬于獨立學(xué)科,這是因為它和其他學(xué)科存在著緊密的內(nèi)在聯(lián)系,具有相互滲透的作用,正是因為概率論與數(shù)理統(tǒng)計的涵蓋范圍與應(yīng)用范圍非常廣泛,這也使人們難以對其進行逐一解釋。因此,本文只對概率與數(shù)理統(tǒng)計在其中幾個方面中的應(yīng)用策略進行了探討,以此明確概率論與數(shù)理統(tǒng)計在大數(shù)據(jù)中的具體應(yīng)用及作用。
大數(shù)據(jù)時代的來臨,使人們能夠利用概率論與數(shù)理統(tǒng)計來對大數(shù)據(jù)進行分析,這也使其和大數(shù)據(jù)分析具備著密切的聯(lián)系,其聯(lián)系主要集中在以下四個方面,首先,概率論與數(shù)理統(tǒng)計和大數(shù)據(jù)分析的研究目標是相同的,都是為了對數(shù)據(jù)結(jié)構(gòu)進行探索與明確,以此找出大數(shù)據(jù)的內(nèi)部聯(lián)系與規(guī)律。其次,大數(shù)據(jù)的不斷發(fā)展,使大數(shù)據(jù)分析為統(tǒng)計學(xué)開拓出了一個新的應(yīng)用空間,這也為概率論與數(shù)理統(tǒng)計的研究提供了一個全新的課題,通過對大數(shù)據(jù)的分析,能夠極大程度的推動概率論與數(shù)理統(tǒng)計的發(fā)展。再次,大數(shù)據(jù)分析并不屬于統(tǒng)計學(xué)中的一種分支,大數(shù)據(jù)分析還能夠廣泛應(yīng)用于其他領(lǐng)域當中,能夠為其他領(lǐng)域提供新的思想、工具與方法,例如利用大數(shù)據(jù)分析可以使機器進行學(xué)習(xí),并能夠?qū)崿F(xiàn)數(shù)據(jù)存儲等。最后,概率論與數(shù)理統(tǒng)計是DM中一種應(yīng)用非常廣泛而又較為成熟的解決問題方法與技術(shù),其在DM中占據(jù)著極為重要的地位。
概率論與數(shù)理統(tǒng)計在大數(shù)據(jù)分析中的常用方法主要有兩種,一種是層次分析法,另一種是蒙特卡羅法,所謂層次分析法是指當人們對某些不確定因素的演變規(guī)律及發(fā)展趨勢進行研究時,必須要對這些因素的影響作用及相互聯(lián)系進行綜合考慮,由于評價指標中的這些不確定性因素是可以按照層次進行劃分的,同時,在各個層次中的不確定性因素內(nèi)還包含著若干要素,這就使整個復(fù)雜問題的結(jié)構(gòu)看上去是一種多級遞階結(jié)構(gòu),在對這類問題進行解決時,就可以采用層次分析法來對這些層次中的不確定性因素對于整個問題的相對重要度進行判斷,而這便產(chǎn)生了概率。在應(yīng)用層次分析法時,應(yīng)通過四個步驟來建立數(shù)學(xué)模型,第一個步驟是先對問題中的各個因素進行明確,然后對這些因素進行層次劃分,使整個問題的結(jié)構(gòu)屬于一種遞階層次結(jié)構(gòu),然后以上一級的要素作為準則來對下一級的要素實施兩兩對比,并按照評定尺度來對下一級要素對于上一級要素的重要程度進行確定,并構(gòu)建出相應(yīng)的判斷矩陣,然后對問題中的各個要素的相對重要度進行計算,同時計算出該問題的綜合重要度,進而給決策者帶來可靠的決策支持保證。蒙特卡羅法則是在概率論與數(shù)理統(tǒng)計的基礎(chǔ)上對問題中的不確定性因素進行反復(fù)隨機的抽樣,以此模擬出該不確定性因素的自身變化給問題帶來的影響程度,并對問題中的所有不確定因素給問題帶來的影響進行計算分析,進而獲得科學(xué)的分析結(jié)果。蒙特卡羅法能夠?qū)栴}的實際過程進行真實模擬,這也使其在對實際問題的解決上具有十分顯著的效果。蒙特卡羅法的數(shù)學(xué)表達式是Z=k(x1,x2,x3,...,xn),在該數(shù)學(xué)表達式中,xi(i=1,2,3,...,n)代表該復(fù)雜問題中存在n個互相獨立的隨機變量,例如在對問題產(chǎn)生影響的所有不確定性因素中,這些不確定性因素便是變量且呈概率分布特征,n個變量的函數(shù)則是Z,而這也正是需要求解的目標。
在大數(shù)據(jù)時代,數(shù)據(jù)對于經(jīng)濟的作用是不言而喻的,而在各種類型的數(shù)據(jù)當中,經(jīng)濟數(shù)據(jù)是最為常見的類型,對這些經(jīng)濟數(shù)據(jù)的分析對于推動社會經(jīng)濟發(fā)展具有著十分重要的意義。由于經(jīng)濟數(shù)據(jù)在互聯(lián)網(wǎng)中是以低密度形式存在的,這也給人們對經(jīng)濟數(shù)據(jù)的分析帶來較大的難度。而利用概率論與數(shù)理統(tǒng)計來對經(jīng)濟數(shù)據(jù)進行分析,則不失為一種簡單而有效的方法。例如,利用正態(tài)概率分布方法來對經(jīng)濟數(shù)據(jù)分析,該方法能夠?qū)B續(xù)性隨機變量的概率進行預(yù)測與描述,而這種概率方法也被普遍應(yīng)用到經(jīng)濟金融管理領(lǐng)域當中。利用該方法能夠使人們能過概率論與數(shù)理統(tǒng)計來對概率的所有相關(guān)信息進行快速而又高效的分析,并按照分析結(jié)果來對市場經(jīng)濟狀況進行實時掌握,使人們能夠了解市場經(jīng)濟規(guī)律,并從中分析出更多的經(jīng)濟信息,通過這些信息的幫助來對后續(xù)的決策與計劃進行靈活的制定與調(diào)整。經(jīng)濟市場是變幻莫測的,但在變化上卻不會過于離譜,而對經(jīng)濟數(shù)據(jù)的分析除了要對經(jīng)濟市場的變化規(guī)律及發(fā)展趨勢進行預(yù)測,還要考慮經(jīng)濟市場中的風(fēng)險性,風(fēng)險的存在是利益的獲取并不總是一成不變的,但通過對經(jīng)濟數(shù)據(jù)的分析能夠找出相應(yīng)的應(yīng)對措施來避免這些問題。對于經(jīng)濟風(fēng)險來說,要想避免經(jīng)濟風(fēng)險的產(chǎn)生,利用概率論與數(shù)理統(tǒng)計能夠有效降低經(jīng)濟風(fēng)險的發(fā)生概率,而這也是人們最常采用的應(yīng)對方法。以股票投資為例,利用概率論與數(shù)理統(tǒng)計方法來對經(jīng)濟數(shù)據(jù)進行分析,可以顯而易見的看出投資股票的數(shù)量越多,則利潤的產(chǎn)生概率要比投資股票數(shù)量少的要高的多,而這正是通過概率論與數(shù)理統(tǒng)計方法得到的,因此,在投資決策中,更多的投資者往往會將資金分散到更多的股票當中來降低風(fēng)險,而這就使投資者的利潤獲得概率大大提高,由此可見,概率論與數(shù)理統(tǒng)計在經(jīng)濟數(shù)據(jù)分析中具有顯著的作用。
在大數(shù)據(jù)環(huán)境中,商業(yè)數(shù)據(jù)對于企業(yè)的重要性是不言而喻的,商業(yè)數(shù)據(jù)與經(jīng)濟數(shù)據(jù)存在一定的聯(lián)系,商業(yè)數(shù)據(jù)屬于經(jīng)濟數(shù)據(jù)的一種,但經(jīng)濟數(shù)據(jù)卻不一定是商業(yè)數(shù)據(jù)。企業(yè)在對商業(yè)數(shù)據(jù)進行分析時,概率論與數(shù)理統(tǒng)計是最為常用的一種方法。以商業(yè)數(shù)據(jù)中的大客戶流失概率為例來對概率論與數(shù)理統(tǒng)計在商業(yè)數(shù)據(jù)中的應(yīng)用策略進行探討。首先需要建立研究模型,在模型建立時需要確保滿足以下條件,其一是大客戶的基本屬性應(yīng)當是相近的,并且流失數(shù)據(jù)能夠滿足相同的流失函數(shù)f0(t)。其二是流失數(shù)據(jù)的分布條件均來自于流失函數(shù)指數(shù)項,然后找出哪些因素給大客戶的流失概率造成較大影響,對數(shù)h0(t)據(jù)進行歸類并設(shè)定特定時段,然后對特定情況中的大客戶流失情況進行匯總,并獲得流失情況走勢圖,然后計算出走勢圖的標準函數(shù),即,進而獲得某個確定客戶在某一時間中的流失概率與所在流失函數(shù)中的位置,客戶在[0,T]時期內(nèi)的流失概率為p=維回歸參數(shù)的向量為c,p維協(xié)變量向量為,并將該協(xié)變量當作一種影響因素進行定義,進而完成研究模型的構(gòu)建。其次,在研究模型建立后,便要選擇參數(shù)與協(xié)變量,然后通過最大偏似然函數(shù)對這些選擇的回歸參數(shù)進行計算。由于計算過程中對于大客戶流失的影響因素有多個,如果將所有因素全部定義成協(xié)變量,則會使模型維數(shù)更多,進而使參數(shù)估計難度大大提升,這也使參數(shù)的估計正確率無法得到保證。因此,需要對這些因素進行選擇性使用,為了對協(xié)變量的數(shù)量進行確定,應(yīng)按照數(shù)理統(tǒng)計結(jié)果進行篩選,這樣才能避免錯誤的產(chǎn)生。
綜上所述,概率論與數(shù)理統(tǒng)計在大數(shù)據(jù)分析中的作用是非常明顯的,現(xiàn)如今,概率論與數(shù)理統(tǒng)計在大數(shù)據(jù)分析中已經(jīng)不再是一種輔助分析工具,更是一個簡單而又高效的分析方法。通過概率論與數(shù)理統(tǒng)計的應(yīng)用,對于大數(shù)據(jù)中各類數(shù)據(jù)的過程、趨勢、效果等都已經(jīng)成為人們進行數(shù)據(jù)分析時的分析對象。面對大數(shù)據(jù)的高速增長趨勢,應(yīng)用概率論與數(shù)理統(tǒng)計來進行大數(shù)據(jù)分析,將更有助于推動人們生產(chǎn)生活的發(fā)展,促進我國經(jīng)濟的快速增長。