国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)背景下非概率抽樣的統(tǒng)計推斷問題研究

2017-07-21 20:05胡俊紅
數(shù)學學習與研究 2017年13期
關(guān)鍵詞:大數(shù)據(jù)探究信息

胡俊紅

【摘要】本文從大數(shù)據(jù)時代下分析數(shù)據(jù)的有效性這一前提出發(fā),介紹有關(guān)非概率抽樣統(tǒng)計的相關(guān)知識;并且就現(xiàn)有的非概率抽樣方法結(jié)合互聯(lián)網(wǎng)發(fā)展的趨勢,提出對大數(shù)據(jù)背景下非概率抽樣的統(tǒng)計方法的建議.

【關(guān)鍵詞】大數(shù)據(jù);非概率抽樣;信息;探究

現(xiàn)在的社會已經(jīng)步入了大數(shù)據(jù)時代,但是就其現(xiàn)狀而言,大數(shù)據(jù)還不能完全與總體相提并論,且由于其具有的大量性、非結(jié)構(gòu)化和來源復雜等特點,還會受到計算能力和存儲能力的限制,使得傳統(tǒng)的數(shù)據(jù)抽樣判斷理論運用到非概率樣本上的難度較大.而且隨著計算機網(wǎng)絡的發(fā)展,網(wǎng)絡調(diào)查也已經(jīng)成為現(xiàn)代化數(shù)據(jù)搜集的一個重要組成部分;更重要的一點是,近年來,對于大數(shù)據(jù)背景下非概率抽樣的統(tǒng)計的討論越來越激烈.于是,合理有效地利用非概率抽樣的統(tǒng)計推斷問題已經(jīng)成為信息時代發(fā)展的大環(huán)境下人們普遍關(guān)注的一個重點,也是對于相關(guān)工作人員來說的一個巨大的挑戰(zhàn).

一、現(xiàn)有非概率抽樣方法簡介

(一)時間地點抽樣

顧名思義,時間地點抽樣就是指在特定的時間和空間內(nèi)對目標群體進行的一種抽樣活動.正如它的名稱一樣,時間地點抽樣具有如下特點:首先,它主要是在無法獲取抽樣框的情況下進行使用,以便能夠達到最好的效果;其次,它的運用也主要是通過構(gòu)造抽樣框?qū)r間和空間運用到改抽樣框中進行的.當然,時間地點抽樣也同樣具有一定的缺陷,比如,雖然時間地點抽樣將具體的抽樣數(shù)據(jù)劃分為很小的業(yè)務單元,但是在實際執(zhí)行中對于合理的通過抽樣數(shù)據(jù)來推斷總體的情況仍然具有較大的難度,而且其變差的存在則是難以避免的.它的具體工作流程是先利用現(xiàn)有的數(shù)據(jù)來粉刺總體的大致情況,然后,再根據(jù)所具有的時空單元目錄來完成具體的抽樣過程.

(二)滾雪球抽樣

滾雪球抽樣的實際操作流程其實就是如其名稱一樣:首先,選擇認為合適的目標對象作為抽樣單元,然后,再依次選擇符合條件的個體參與到抽樣活動中,隨著該工作流程的逐漸深入,參與到抽樣的閹割版單元越來越多,最終就會像是堆積成為一個大雪球一樣,使得參與抽樣的個體數(shù)量充足,也使得抽樣所得出的結(jié)果就有很好的說服力,更加具有信服力.

(三)目標抽樣

目標抽樣是一種較為簡便的抽樣方法.其工作流程就是通過多種不相關(guān)的延伸方法在總體范圍中獲得出樣的單元.由于該抽樣方法實現(xiàn)會大致對抽樣單元的范圍進行劃分,導致該方法顯得不具備隨機性,使得該抽樣結(jié)果的合理性不具有說服力,不利于更好地通過樣本來推測總體.但是就其工作流程上來說,目標抽樣和事件地點抽樣難度較低,在總體數(shù)據(jù)量較大的情況下,使用該類抽樣方法會大量地節(jié)省人力物力.

二、具體方法的討論

雖然有關(guān)非概率抽樣統(tǒng)計推斷問題的方式有很多種,但是本文主要是以匹配樣本的選擇思路為例,對具體的方法進行探討.例如,在對大規(guī)模的人群進行調(diào)查訪問時,最開始需要做的就是選取合適的抽樣單元,其選擇要求就是需要符合樣本單元選擇的隨機性;特別的是,當存在輔助變量為已知時,此時需要注意的就是在樣本的選取時要更加注重各數(shù)據(jù)之間的對稱關(guān)系.

為了更好地了解匹配樣本,還需要對其特點進行分析.在保證匹配樣本有效性時,還需要事先假定三個前提條件:首先,要假定其具備平穩(wěn)性,指的是對于給定的數(shù)據(jù)之間能夠形成一段平穩(wěn)的三維函數(shù),其間波動起伏不大且沒有明顯的端點;其次,還要假設樣本的匹配是可以被忽視的,指的是在檢測匹配量相同的網(wǎng)絡訪問時,不對固定網(wǎng)絡成員與非固定網(wǎng)絡成員的區(qū)別格外加以探究,在一定程度上對樣本匹配之間的差異進行忽視;最后,假定樣本的匹配變量之間會存在共同的依靠,指的是雖然樣本在起分布上會有重疊的現(xiàn)象,但是在一定程度上排除了出現(xiàn)不能匹配的情況.

三、大數(shù)據(jù)下使用非率抽樣方法的建議

(一)改進目標抽樣方法

要充分認識目標抽樣的優(yōu)劣,合理地使用目標抽樣方法,使得效果最優(yōu).比如,在互聯(lián)網(wǎng)的環(huán)境下,當遇到目標數(shù)據(jù)的密度大且易于識別時,要在開始工作之前對目標抽樣所涉及的數(shù)據(jù)范圍進行篩查,選擇最優(yōu)的目標范圍;并且還需要衡量選取目標的合理性,適當改進目標抽樣的基礎.

(二)充分運用已有信息

在進行時間地點抽樣時,由于需要事先建立抽樣單元框.為了提高非概率抽樣的準確性和效率,需要在工作最初發(fā)現(xiàn)有關(guān)的信息,并且充分合理地運用該類信息,注重觀察各類數(shù)據(jù)之間的關(guān)系情況,用不同的樣本單元來劃分目標群體,減少抽樣帶來的誤差.

(三)充分利用科學技術(shù)

在日常工作中學會合理有效地運用已有的現(xiàn)代化信息技術(shù),發(fā)掘出這些技術(shù)平臺所隱藏的大量的有用的信息,來減輕工作的難度并且提高工作的效益.

四、結(jié)束語

大數(shù)據(jù)時代的發(fā)展是科學技術(shù)發(fā)展的反應,是一個不可逆的過程.非概率抽樣的方法種類較多,但是大數(shù)據(jù)下更加強調(diào)的是使得非概率樣本與概率樣本相接近.本文從介紹大數(shù)據(jù)下非概率抽樣的研究意義開始,通過對幾種非概率抽樣方法的介紹和分析其優(yōu)劣來引出大數(shù)據(jù)下非概率抽樣的思考,希望借此能夠?qū)τ诜且?guī)律的抽樣的發(fā)展引起一些共鳴.

猜你喜歡
大數(shù)據(jù)探究信息
一道探究題的解法及應用
一道IMO預選題的探究
探究式學習在國外
一道IMO預選題的探究及思考
基于大數(shù)據(jù)背景下的智慧城市建設研究
健康信息
健康信息(九則)
共和县| 洞口县| 沈阳市| 东安县| 宁远县| 楚雄市| 拜城县| 准格尔旗| 铅山县| 新余市| 富裕县| 万年县| 霞浦县| 泰和县| 三河市| 彝良县| 仙桃市| 阿克| 乐至县| 贵溪市| 故城县| 南召县| 云龙县| 盐山县| 岱山县| 焦作市| 贺兰县| 饶阳县| 扬中市| 泽库县| 定陶县| 长岭县| 汝阳县| 广元市| 鄂伦春自治旗| 汉中市| 峡江县| 中牟县| 神池县| 呼图壁县| 南华县|