胡俊紅
【摘要】隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)據(jù)庫技術(shù)的發(fā)展也隨之提高,而海量的數(shù)據(jù)系統(tǒng)使得大數(shù)據(jù)分類與處理顯得尤為重要,而現(xiàn)有的數(shù)據(jù)統(tǒng)計(jì)分類方法存在一些缺陷,準(zhǔn)確度以及效率都達(dá)不到要求,本文簡(jiǎn)要探討基于概率統(tǒng)計(jì)下的大數(shù)據(jù)分類方法,希望可以對(duì)讀者有一定的幫助.
【關(guān)鍵詞】概率統(tǒng)計(jì);大數(shù)據(jù)分類方法;微分方程;二項(xiàng)-泊松模型
大數(shù)據(jù)分類方法目前主要應(yīng)用于故障診斷、情報(bào)檢索以及識(shí)別信息等領(lǐng)域,而基于概率統(tǒng)計(jì)下的大數(shù)據(jù)分析主要是運(yùn)用泊松模型以及概率密度估計(jì)和泊松微分方程等進(jìn)行分析數(shù)據(jù),通過特征值的計(jì)算,從而對(duì)大數(shù)據(jù)進(jìn)行準(zhǔn)確直接的分類,本文簡(jiǎn)要從大數(shù)據(jù)分類泊松模型進(jìn)行簡(jiǎn)要敘述.
一、大數(shù)據(jù)分析二項(xiàng)-泊松模型
(一)二項(xiàng)-泊松模型概念及計(jì)算思路
進(jìn)而通過柯西收斂性條件,求證大數(shù)據(jù)收斂性成立.
通過本文的介紹,可以看出基于概率統(tǒng)計(jì)下的大數(shù)據(jù)分類是一個(gè)較為復(fù)雜的過程,主要運(yùn)用到二項(xiàng)-泊松模型以及各類微分方程以及行列式的計(jì)算統(tǒng)計(jì)方法,而模型的建立只是數(shù)據(jù)處理的步驟之一,概率統(tǒng)計(jì)下的大數(shù)據(jù)分類將是一件具有挑戰(zhàn)性的事情,相信在不久的未來,大數(shù)據(jù)分類將會(huì)更加便利、準(zhǔn)確,為數(shù)據(jù)分析和人類發(fā)展做出一份貢獻(xiàn).
【參考文獻(xiàn)】
[1]劉俊,劉瑜,何友,等.雜波環(huán)境下基于全鄰模糊聚類的聯(lián)合概率數(shù)據(jù)互聯(lián)算法[J].電子與信息學(xué)報(bào),2016(7):1432-1438.
[2]于化龍,顧國(guó)昌,趙靖,等.基于微陣列數(shù)據(jù)的癌癥分類問題研究進(jìn)展[J].計(jì)算機(jī)科學(xué),2010(1):116-122.