劉文昊
摘要:數(shù)學(xué)結(jié)構(gòu)作為客觀世界數(shù)量關(guān)系與空間形式的反映是有規(guī)律的。概率模型構(gòu)造法為證明解題提供了新的途徑。概率的研究起源于實際生活問題,目前廣泛應(yīng)用于各領(lǐng)域。概率論的發(fā)展凝結(jié)了數(shù)學(xué)家的心血。概率論在數(shù)學(xué)模型建立中有著重要的地位。
關(guān)鍵詞:概率預(yù)測;網(wǎng)絡(luò)數(shù)學(xué)模型
一、預(yù)測模型的建立
交叉概率預(yù)測就是依據(jù)某些事件間的相互影響進行分析,當(dāng)某一事發(fā)生時其他事件受影響發(fā)生變化的方法。事件間相互影響關(guān)系常用矩陣形式表達,各事件變化程度用概率值描述。因此此法稱為交叉影響概率法。
移動平均法是一種簡單的適應(yīng)模型,算術(shù)平均不能反映數(shù)據(jù)的變化趨勢,原始數(shù)據(jù)可能是零散的。移動平均法克服了上述弱點。以N=5為例:
移動平均法重要的是移動周期N的選擇,N為數(shù)據(jù)點數(shù)。
移動平均修勻后方差隨N加大減少,N越大,對原始數(shù)據(jù)修勻力越強。
二、概率生成模型的網(wǎng)絡(luò)數(shù)據(jù)分類
本節(jié)描述網(wǎng)絡(luò)數(shù)據(jù)分類方法,探討網(wǎng)絡(luò)的概率生成模型,將未知類別節(jié)點的類別作為模型潛在變量,將網(wǎng)絡(luò)視為模型觀察變量,通過求解模型計算潛在變量取值,得到未知類別節(jié)點類別。
1.類別傳播分布
網(wǎng)絡(luò)概率生成模型是描述網(wǎng)絡(luò)生成的概率模型。網(wǎng)絡(luò)由節(jié)點間的邊組成,網(wǎng)絡(luò)概率生成模型需描述網(wǎng)絡(luò)中邊的生成過程,因此建立網(wǎng)絡(luò)模型生成關(guān)鍵是給出2點間邊的概率。
同質(zhì)性程度高的網(wǎng)絡(luò)中,大多相連節(jié)點類別相同。類別相同點間有邊的概率較大,可用2節(jié)點描述邊的概率。低同質(zhì)性網(wǎng)絡(luò)大多相連節(jié)點類別不同,2點間有邊概率不因類別相同增大。本文考慮2節(jié)點相鄰結(jié)論對2節(jié)點間有邊概率的影響。若點Vi鄰節(jié)點屬Lc,點Vi有與類別Lc節(jié)點相連的趨勢。Vi鄰點中,屬類別Lc的點越多趨勢越強,本文用點Vi鄰點類別與點Vj描繪點Vi與點Vj有邊概率。點Vj類別是Lc,點Vi鄰點屬類別Lc點越多。點Vi與點Vj概率越大。
設(shè)有K各類別,點Vi有Ni鄰點,Ni鄰點有Nic各點的類別是Lc,點Vi鄰點屬類別Lc比為Nic/Ni記θic,向量為點Vi 的類別傳播分布。記θi。
一點類別分布由點鄰點類別決定,點類別傳播分布表現(xiàn)點鄰點屬各類別的概率。點Vi類別傳播分布中類別Lc對應(yīng)分量θic大,說明Vi鄰點屬類別Lc概率大。如點Vj連類別是Lc,θic越大,點Vi與點Vj相連概率越大。本文就點Vi類別傳播分布與點Vj類別描述點Vi與點Vj間有邊的概率。點Vi與點Vj 間有邊概率為點Vi類別傳播分布在點Vj 類別的分量。
2.基于類別傳播分布網(wǎng)絡(luò)概率生成模型
網(wǎng)絡(luò)數(shù)據(jù)用無向圖G=
網(wǎng)絡(luò)概率生成模型是描述網(wǎng)絡(luò)生成過程的概率模型,網(wǎng)絡(luò)由點間邊組成,可將邊作模型觀察變量。通過描述網(wǎng)絡(luò)中邊的生成描述網(wǎng)絡(luò)生成。本文概率生成模型將類別傳播分布作模型參數(shù)。用類別傳播分布描述邊產(chǎn)生概率。點Vi與點Vj間邊概率為Vi的類別傳播分布在類別Lyj上的分量θiyj,2點間有邊概率依賴其中一點類別。網(wǎng)絡(luò)中存在部分未知類型的點。本文模型中將未知類別點類別作潛在變量。產(chǎn)生邊前通過均勻分布抽取潛在變量取值。得到未知類別點類別。利用類別分布描述邊生產(chǎn)概率。
在有N點與K點類別網(wǎng)中,從a為參數(shù)產(chǎn)生每點類別傳播分布。對每未知類別點從[0,K-1]上均勻分布中產(chǎn)生整數(shù),將其作該點類別索引。對點Vi與點Vj間邊,從伯努利分布中產(chǎn)生。參數(shù)為點Vi的類別傳播分布在類別Lyj上的分量θiyj
網(wǎng)絡(luò)生成過程
y表示未知類別點類別索引組成的集合。聯(lián)合概率分布為未知類別點是潛在變量,類別傳播分布是參數(shù),網(wǎng)絡(luò)中邊是觀察變量,模型求解即通過觀察變量計算潛在變量與參數(shù)取值。
用吉布斯采樣方法需得到潛在變量后驗概率,本文模型后驗概率為其中y-u表示除點Vu外所有點類別索引。
結(jié)論:本文提出給予概率生成模型網(wǎng)絡(luò)數(shù)據(jù)分類方法,提出傳播分布概念,用以表現(xiàn)節(jié)點相鄰點屬各類別概率,用類別傳播分布提出描述網(wǎng)絡(luò)生成過程的概率生成模型。通過求解模型得出未知類別點的類別。
參考文獻:
[1]鄭煒,張科,汪芳等.概率預(yù)測的網(wǎng)絡(luò)數(shù)學(xué)模型及其應(yīng)用[J].計算機工程與應(yīng)用,2014.45(18):59-61,69.