顏晨芳 易艷春 謝愛(ài)群 李貝涵 尹 納
(衡陽(yáng)師范學(xué)院南岳學(xué)院,湖南 衡陽(yáng) 421002)
信息技術(shù)飛速進(jìn)步中,大數(shù)據(jù)技術(shù)已成為推動(dòng)社會(huì)發(fā)展的重要因素,通過(guò)其獲取信息的方式越來(lái)越多,速度也越來(lái)越快,人們對(duì)大數(shù)據(jù)的依賴在不斷地增加,思維方式也隨之在不斷地發(fā)生變化。在大數(shù)據(jù)時(shí)代背景下,抽樣調(diào)查作為政府統(tǒng)計(jì)工作中一種重要的調(diào)查方式,雖逐漸顯現(xiàn)出了不足之處,但其在統(tǒng)計(jì)工作中依舊起著非常重要的作用,有著無(wú)可替代的地位。
抽樣調(diào)查是在19世紀(jì)從概率論中逐漸發(fā)展起來(lái)的一項(xiàng)統(tǒng)計(jì)調(diào)查技術(shù),在我國(guó)經(jīng)歷了漫長(zhǎng)的發(fā)展變化歷程。20世紀(jì),我國(guó)明確要求調(diào)查體系要以抽樣調(diào)查為主體。政府統(tǒng)計(jì)離不開(kāi)抽樣調(diào)查,抽樣調(diào)查方法在政府統(tǒng)計(jì)工作中已普遍得到運(yùn)用。從目前狀況來(lái)看,抽樣調(diào)查方法在政府統(tǒng)計(jì)中的地位,已經(jīng)是政府統(tǒng)計(jì)的重要支撐。抽樣調(diào)查在政府統(tǒng)計(jì)工作中是一種非常重要的統(tǒng)計(jì)方法,是當(dāng)前統(tǒng)計(jì)調(diào)查信息獲取的最佳方式。
1.1.1 抽樣調(diào)查的概念
抽樣調(diào)查方法是一種非全面調(diào)查方法,指通過(guò)從要調(diào)查研究對(duì)象的總體中隨機(jī)選取一部分作為樣本,然后根據(jù)所選取的這些樣本開(kāi)展調(diào)查分析,并把調(diào)查所得到的信息進(jìn)行統(tǒng)計(jì)分析,進(jìn)而對(duì)總體情況進(jìn)行估計(jì)和推斷的一種調(diào)查方式,其基本原理為概率論。實(shí)施抽樣調(diào)查的大致過(guò)程包括確定調(diào)查總體、抽樣框的確定和個(gè)體編號(hào)、選擇調(diào)查樣本、調(diào)查實(shí)施、測(cè)算結(jié)果、分析統(tǒng)計(jì)數(shù)據(jù)以及結(jié)果公布。此外,抽樣調(diào)查可以按樣本抽取的隨機(jī)性分類,分為概率抽樣和非概率抽樣兩類。其中,概率抽樣中樣本的個(gè)體被抽取的概率是相等的,而非概率抽樣中樣本的個(gè)體被抽取的概率是不等的。
1.1.2 抽樣調(diào)查的優(yōu)勢(shì)
抽樣調(diào)查有著嚴(yán)密的理論依據(jù),其在世界各國(guó)的廣泛應(yīng)用充分說(shuō)明了其特殊的應(yīng)用價(jià)值,經(jīng)過(guò)100多年的發(fā)展,其科學(xué)性已得到證明。我國(guó)在1994年2月的全國(guó)統(tǒng)計(jì)工作會(huì)議中決定采用抽樣調(diào)查方法和全面調(diào)查方法相結(jié)合的方式??芍谧畛鯐r(shí),抽樣調(diào)查方法是作為政府統(tǒng)計(jì)調(diào)查方法被提出來(lái)的,且與全面調(diào)查相比,抽樣調(diào)查能以最小的成本、最小的數(shù)據(jù)來(lái)獲取所需的信息,有著經(jīng)濟(jì)性、時(shí)效性、靈活性等特點(diǎn),能更節(jié)省人力、物力、財(cái)力和時(shí)間,且若組織得好,其效果完全可以達(dá)到與全面調(diào)查效果一致。在運(yùn)用過(guò)程中,抽樣調(diào)查的優(yōu)勢(shì)得到了充分的肯定,因此其在各種數(shù)據(jù)調(diào)查中被廣泛應(yīng)用。
隨著數(shù)字生活空間的普及,大數(shù)據(jù)相關(guān)信息正呈現(xiàn)爆發(fā)式增長(zhǎng),大數(shù)據(jù)已經(jīng)成為重要的生產(chǎn)因素。其通過(guò)采集大量的相關(guān)行為數(shù)據(jù),幫助人們找到并了解目標(biāo)信息,并以此對(duì)該目標(biāo)的內(nèi)容、形式、特點(diǎn)等進(jìn)行研究與分析,以達(dá)到所需目的。
1.2.1 大數(shù)據(jù)的概念
“大數(shù)據(jù)”一詞最早于2008年8月由維克托·邁爾-舍恩伯格和肯尼斯·庫(kù)克耶在《大數(shù)據(jù)時(shí)代》一書(shū)中共同提出。大數(shù)據(jù)指廣泛的信息資源和數(shù)據(jù)資料。大數(shù)據(jù)分析指所涉及的數(shù)據(jù)資料程度廣泛,研究時(shí)直接采用所有數(shù)據(jù)進(jìn)行統(tǒng)一分析的方法,而不是分類別進(jìn)行分析。大數(shù)據(jù)的一大核心就是預(yù)測(cè),例如銀行信用貸會(huì)根據(jù)客戶以前的消費(fèi)習(xí)慣、收入能力去評(píng)估其能獲得多少金額的貸款。這些預(yù)測(cè)之所以可行,就是因?yàn)樗鼈兘⒃诖罅繑?shù)據(jù)的基礎(chǔ)之上,數(shù)據(jù)越多,預(yù)測(cè)越準(zhǔn)確[1]。
1.2.2 大數(shù)據(jù)的特征
在當(dāng)今信息技術(shù)飛速發(fā)展的時(shí)代,大數(shù)據(jù)得到了普遍的應(yīng)用。大數(shù)據(jù)具有數(shù)據(jù)規(guī)模大、數(shù)據(jù)類型多樣、數(shù)據(jù)處理速度快、數(shù)據(jù)價(jià)值密度低的特點(diǎn)。
(1)數(shù)據(jù)規(guī)模大
隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)呈爆炸式增長(zhǎng),數(shù)據(jù)存儲(chǔ)單位從GB到TB,而大數(shù)據(jù)最小的單位是PB(1 PB=1 000 TB),甚至有大企業(yè)的數(shù)據(jù)已經(jīng)達(dá)到了EB級(jí)別(1 EB=100萬(wàn)TB),而人們平時(shí)常見(jiàn)的單位為KB、MB。由此可見(jiàn)大數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)和計(jì)算規(guī)模之大。
(2)數(shù)據(jù)類型多樣
數(shù)據(jù)多樣化指的是大數(shù)據(jù)處理的數(shù)據(jù)格式多樣。數(shù)據(jù)可分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。傳統(tǒng)技術(shù)處理的都是結(jié)構(gòu)化數(shù)據(jù),即二維表格模型。一串?dāng)?shù)據(jù)粘貼到Excel表格當(dāng)中,形成明確的行和列,這樣的數(shù)據(jù)就屬于二維表格模型。而人們?nèi)粘I钪挟a(chǎn)生的各種圖片、視頻、音頻、地理位置信息等,沒(méi)有明確的行和列,相當(dāng)于TXT文件,這些數(shù)據(jù)的載體就是非結(jié)構(gòu)化數(shù)據(jù)。當(dāng)今時(shí)代數(shù)據(jù)的來(lái)源十分廣泛,并且類型繁多,這就要求對(duì)數(shù)據(jù)的處理能力要達(dá)到新的高度。
(3)數(shù)據(jù)處理速度快
處理速度快、時(shí)效性高的特點(diǎn)是大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)庫(kù)最顯著的區(qū)別。現(xiàn)如今,數(shù)據(jù)的產(chǎn)生十分迅速,每時(shí)每刻都在產(chǎn)生著大量的數(shù)據(jù)信息,這使得大數(shù)據(jù)需要及時(shí)處理大量的信息,從中選取有用信息,實(shí)時(shí)分析。例如2018年天貓“雙十一”在2分05秒內(nèi)交易額超過(guò)100億元,數(shù)據(jù)源源不斷地產(chǎn)生,大數(shù)據(jù)能基于當(dāng)前產(chǎn)生的實(shí)時(shí)銷(xiāo)售紀(jì)錄進(jìn)行計(jì)算和分析。
(4)數(shù)據(jù)價(jià)值密度低
互聯(lián)網(wǎng)的廣泛應(yīng)用,使得信息數(shù)據(jù)無(wú)處不在,雖然產(chǎn)生的信息基數(shù)大,但其中真正可供利用的信息并不多,即價(jià)值密度與數(shù)據(jù)規(guī)模成反比。無(wú)用信息占比大導(dǎo)致信息可用率低,即價(jià)值密度低。如何提高數(shù)據(jù)價(jià)值密度,讓程序自動(dòng)提取有價(jià)值的信息,是目前大數(shù)據(jù)時(shí)代值得研究的問(wèn)題[2]。
隨著大數(shù)據(jù)時(shí)代的到來(lái),傳統(tǒng)抽樣調(diào)查方法的地位隱隱受到了撼動(dòng),同時(shí)抽樣調(diào)查方法也面臨著新的挑戰(zhàn)和機(jī)遇。為了得到更好的統(tǒng)計(jì)數(shù)據(jù)和更科學(xué)的結(jié)論,可以“取其精華,去其糟粕”,結(jié)合大數(shù)據(jù)和傳統(tǒng)抽樣調(diào)查方法的優(yōu)點(diǎn),使它們相互融合和創(chuàng)新,以鞏固抽樣調(diào)查在政府統(tǒng)計(jì)中的地位,從而推動(dòng)我國(guó)政府統(tǒng)計(jì)工作的發(fā)展進(jìn)步。
1.3.1 大數(shù)據(jù)為抽樣調(diào)查提供了更多的數(shù)據(jù)收集途徑
大數(shù)據(jù)時(shí)代數(shù)據(jù)的收集不再局限于傳統(tǒng)的模式,而是增加了更多的數(shù)據(jù)收集途徑,比如對(duì)于一些傳統(tǒng)模式中無(wú)法提取的數(shù)據(jù),運(yùn)用大數(shù)據(jù)技術(shù)能更好地對(duì)數(shù)據(jù)進(jìn)行提取。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)采集可以依靠互聯(lián)網(wǎng)、手機(jī)和數(shù)字化行政商業(yè)記錄等多種途徑更好地獲取想要的數(shù)據(jù)信息,現(xiàn)場(chǎng)數(shù)據(jù)采集的調(diào)查模式也可能會(huì)逐漸被超市收銀系統(tǒng)、銀行轉(zhuǎn)賬支付記錄、在線支付賬戶等多種途徑所代替。大數(shù)據(jù)為抽樣調(diào)查的數(shù)據(jù)收集提供了極大的便利,節(jié)省了大量的人力、物力和財(cái)力,同時(shí)也極大程度地節(jié)省了時(shí)間。
1.3.2 大數(shù)據(jù)為抽樣框及時(shí)更新和維護(hù)提供了方便的條件
在傳統(tǒng)條件的限制下,抽樣調(diào)查方法面臨的最大困擾就是抽樣框架不夠完善。傳統(tǒng)的抽樣框更新和維護(hù)需要的成本高、時(shí)效性差,且存在較多缺點(diǎn),而在大數(shù)據(jù)時(shí)代下,可運(yùn)用大數(shù)據(jù)技術(shù)對(duì)信息的實(shí)時(shí)變化進(jìn)行有效收集和整理,從而對(duì)抽樣調(diào)查中的抽樣框進(jìn)行更新和維護(hù)。這種將一些數(shù)據(jù)轉(zhuǎn)化為有效數(shù)據(jù)信息的方法,不僅能降低抽樣框更新和維護(hù)的成本,而且還提高了抽樣調(diào)查的時(shí)效性。
1.3.3 抽樣調(diào)查可作為彌補(bǔ)大數(shù)據(jù)無(wú)法進(jìn)行因果推斷的有效方法
大數(shù)據(jù)重視相關(guān)性而忽略了因果關(guān)系,并且其自身無(wú)法推斷出哪一種相關(guān)性是有意義的,哪些是無(wú)意義的,大數(shù)據(jù)所擁有的大量數(shù)據(jù)會(huì)使聚類過(guò)程變得困難,而抽樣調(diào)查方法可以極大地彌補(bǔ)大數(shù)據(jù)的不足。抽樣調(diào)查可作為挖掘和探測(cè)數(shù)據(jù)因果關(guān)系的工具,從雜亂無(wú)章的大數(shù)據(jù)中探尋數(shù)據(jù)間的規(guī)律和關(guān)系,然后選擇具有代表性的樣本對(duì)大數(shù)據(jù)進(jìn)行深層次的分析。
1.3.4 抽樣調(diào)查可以作為大數(shù)據(jù)分析比較和驗(yàn)證的基礎(chǔ)
大數(shù)據(jù)的結(jié)果是從大量且混亂的信息中獲得的,抽樣調(diào)查可以用作比較和驗(yàn)證大數(shù)據(jù)分析結(jié)果是否可靠的工具。抽樣調(diào)查在研究數(shù)據(jù)質(zhì)量、判斷數(shù)據(jù)結(jié)果可靠性、探索數(shù)據(jù)關(guān)系等方面效果顯著。抽樣調(diào)查可以有效驗(yàn)證大數(shù)據(jù)推理結(jié)論的可靠性,從而及時(shí)發(fā)現(xiàn)問(wèn)題、分析問(wèn)題和解決問(wèn)題,以避免大數(shù)據(jù)中出現(xiàn)錯(cuò)誤推斷結(jié)論造成的不利影響[3]。
早在1994年,我國(guó)明確要求建立以抽樣調(diào)查為主體的新型統(tǒng)計(jì)調(diào)查體系,提出抽樣調(diào)查與綜合調(diào)查相結(jié)合的調(diào)查方法。之后我國(guó)又有相關(guān)法律法規(guī)規(guī)定,統(tǒng)計(jì)調(diào)查應(yīng)以定期普查為基礎(chǔ),以定期抽樣調(diào)查為主體,結(jié)合相關(guān)統(tǒng)計(jì)報(bào)告、數(shù)據(jù)分析等次要方式來(lái)收集和整合常規(guī)統(tǒng)計(jì)數(shù)據(jù)。隨著我國(guó)經(jīng)濟(jì)的快速發(fā)展和科技的改革開(kāi)放,抽樣調(diào)查在更多領(lǐng)域得到廣泛應(yīng)用,在我國(guó)法律形式和應(yīng)用層面上,其地位得到了充分的肯定。抽樣調(diào)查在政府統(tǒng)計(jì)工作中的地位體現(xiàn)在以下幾個(gè)方面:(1)抽樣調(diào)查方法將是未來(lái)一段時(shí)間內(nèi)我國(guó)政府統(tǒng)計(jì)工作中的主要調(diào)查方法;(2)抽樣調(diào)查方法將全面滲透到各個(gè)信息計(jì)算領(lǐng)域和生產(chǎn)環(huán)節(jié);(3)抽樣調(diào)查方法將得到政府、企業(yè)、個(gè)人等統(tǒng)計(jì)系統(tǒng)的廣泛推廣;(4)在每次統(tǒng)計(jì)工作中都將以抽樣調(diào)查方法與其他不同調(diào)查方法相結(jié)合的方式進(jìn)行[4-5]。
在統(tǒng)計(jì)工作中,有著多種調(diào)查方法,但現(xiàn)階段,統(tǒng)計(jì)工作受到多種因素的影響和制約。面對(duì)這種情形,抽樣調(diào)查就成為主體的調(diào)查方式。同時(shí)由于其應(yīng)用范圍廣泛,在一定層面上,恰好說(shuō)明了它的主體地位的必然性。
2.2.1 客觀條件的限制因素
在當(dāng)前市場(chǎng)經(jīng)濟(jì)背景和大數(shù)據(jù)時(shí)代下,想要開(kāi)展各種統(tǒng)計(jì)工作的目的和條件受到的限制非常大,因此只能將抽樣調(diào)查方法作為主要方法。抽樣調(diào)查方法在一定程度上大大避免了人力、物力和財(cái)力的浪費(fèi),并且提高了調(diào)查信息的時(shí)效性,抽樣調(diào)查方法適用范圍廣,可用于各個(gè)領(lǐng)域和各種情況的調(diào)查,因此抽樣調(diào)查自然成為首選的調(diào)查方法。
2.2.2 抽樣調(diào)查因果推斷的無(wú)可替代性
大數(shù)據(jù)更重視相關(guān)關(guān)系而忽視了因果關(guān)系?!洞髷?shù)據(jù)時(shí)代》這本書(shū)的觀點(diǎn)指出,數(shù)據(jù)關(guān)系是一種相關(guān)關(guān)系而不是因果關(guān)系,它知道是什么,不需要知道為什么,得出的結(jié)論往往存在一定的問(wèn)題。此外,大數(shù)據(jù)所擁有的大量數(shù)據(jù)會(huì)使聚類過(guò)程變得困難,而抽樣調(diào)查方法可以彌補(bǔ)大數(shù)據(jù)的不足,是進(jìn)行數(shù)據(jù)間因果關(guān)系分析的有效方法,因此抽樣調(diào)查方法的因果推斷能力是其他方法無(wú)法替代的。
抽樣調(diào)查被廣泛應(yīng)用于政府在農(nóng)業(yè)、工業(yè)、生物、金融、物理、教育等多個(gè)領(lǐng)域的統(tǒng)計(jì)工作,究其原因,主要在于抽樣調(diào)查具有明顯的實(shí)用性、科學(xué)性和經(jīng)濟(jì)性等,在政府統(tǒng)計(jì)工作中起著非常重要的作用。
在大數(shù)據(jù)時(shí)代,政府統(tǒng)計(jì)部門(mén)可以快速、高效地獲取數(shù)據(jù),減少統(tǒng)計(jì)工作中抽樣調(diào)查的數(shù)據(jù)獲取和處理時(shí)間。政府統(tǒng)計(jì)工作中抽樣調(diào)查所要調(diào)查的個(gè)體單位只占總體單位的一小部分,所有獲得的資料和數(shù)據(jù)等都可以進(jìn)行快速匯總和分析,同時(shí)也方便政府調(diào)查統(tǒng)計(jì)人員按時(shí)、快速地獲取調(diào)查結(jié)果。特別是在某些緊急時(shí)刻,需要有關(guān)數(shù)據(jù)信息時(shí),抽樣調(diào)查可以快速獲取,此時(shí)抽樣調(diào)查顯得尤為重要,這也正是抽樣調(diào)查的高效性和重要性的體現(xiàn)。
政府統(tǒng)計(jì)中的全面調(diào)查往往要對(duì)調(diào)查對(duì)象中的所有個(gè)體進(jìn)行調(diào)查,耗費(fèi)的物力、人力和財(cái)力非常大,抽樣調(diào)查則往往省去了全面調(diào)查中對(duì)個(gè)體逐一進(jìn)行分析和計(jì)算的煩瑣環(huán)節(jié)。因此,抽樣調(diào)查相對(duì)于全面調(diào)查更節(jié)省物力、人力和財(cái)力,更進(jìn)一步提升了數(shù)據(jù)處理的效率,能夠節(jié)省出更多的時(shí)間。
政府統(tǒng)計(jì)部門(mén)進(jìn)行抽樣調(diào)查時(shí),在抽樣調(diào)查的樣本數(shù)較少的情況下,參與調(diào)查總結(jié)的工作人員也就較少,而這一部分人員均受過(guò)高度嚴(yán)格的訓(xùn)練,因而出現(xiàn)登記操作失誤的可能性也就較小。在大數(shù)據(jù)時(shí)代下,數(shù)據(jù)經(jīng)過(guò)層層記錄,并且能毫無(wú)保留地呈現(xiàn),因此可有效提高調(diào)查的質(zhì)量和效果。例如,在調(diào)查消費(fèi)者的滿意度時(shí),需要對(duì)所有消費(fèi)者逐一了解、登記,在這一過(guò)程中,不僅會(huì)消耗大量人力、物力、財(cái)力,還有可能會(huì)使本來(lái)滿意的消費(fèi)者產(chǎn)生煩躁心情反而轉(zhuǎn)變?yōu)椴粷M意的情況出現(xiàn),這樣的情況會(huì)對(duì)調(diào)查數(shù)據(jù)的真實(shí)性造成一定的影響。而若采用抽樣調(diào)查方法,將調(diào)查問(wèn)卷放置在醒目的位置,由部分感興趣有意向填的顧客自愿進(jìn)行問(wèn)卷的填寫(xiě),這不僅能節(jié)省時(shí)間,而且更能保證數(shù)據(jù)的準(zhǔn)確性,以達(dá)到更好的改進(jìn)目的,最終提高消費(fèi)者的滿意度[6]。
由于抽樣調(diào)查具有實(shí)驗(yàn)無(wú)破壞性的特點(diǎn),所以在政府的日常統(tǒng)計(jì)工作中,測(cè)量或試驗(yàn)?zāi)承┦录r(shí),對(duì)其調(diào)查對(duì)象本身具有巨大的破壞性的情況下,往往采用抽樣調(diào)查的方法以減少對(duì)樣本的破壞。例如,政府進(jìn)行森林資源調(diào)查時(shí),需要調(diào)查的因素非常多,且數(shù)據(jù)量龐大,然而在實(shí)際調(diào)查中,由于某些樣本所處的地理位置復(fù)雜,政府調(diào)查人員不能或者難以進(jìn)入,導(dǎo)致收集到的數(shù)據(jù)不夠全面、完整。不僅如此,在收集某些森林資源時(shí),還可能對(duì)生態(tài)平衡造成不可逆的傷害和影響。因此在這種情況下,一般采取抽樣調(diào)查方法進(jìn)行數(shù)據(jù)的收集和分析。
在政府統(tǒng)計(jì)工作的某些事件的調(diào)查中,由于調(diào)查對(duì)象或者調(diào)查因素的限制,必須通過(guò)受過(guò)高度嚴(yán)格訓(xùn)練的工作人員或者專用的設(shè)備來(lái)獲取所需的數(shù)據(jù),而這種受過(guò)高度嚴(yán)格訓(xùn)練的人才或者專用的設(shè)備在數(shù)量上是有限的,因而基于抽樣調(diào)查具有難度小的特點(diǎn),一般采用抽樣調(diào)查方法,能夠大大縮減人才和設(shè)備的消耗。
大數(shù)據(jù)時(shí)代對(duì)各行各業(yè)的人員都提出了更高要求的職業(yè)素質(zhì),特別是統(tǒng)計(jì)人員。很多政府統(tǒng)計(jì)人員不是統(tǒng)計(jì)相關(guān)專業(yè)畢業(yè)的,甚至有些人不懂統(tǒng)計(jì)知識(shí),也不懂計(jì)算機(jī)軟件,因此必須加強(qiáng)對(duì)統(tǒng)計(jì)人員的培訓(xùn),提高其統(tǒng)計(jì)軟件應(yīng)用能力,使其掌握對(duì)大數(shù)據(jù)進(jìn)行搜集、篩選、整理和分析的方法,經(jīng)常性進(jìn)行統(tǒng)計(jì)大數(shù)據(jù)專項(xiàng)培訓(xùn)。同時(shí),政府統(tǒng)計(jì)部門(mén)還要大力引進(jìn)更多的大數(shù)據(jù)發(fā)掘、整理、加工和分析人才。當(dāng)下,青年干部在這方面相對(duì)于年長(zhǎng)的干部來(lái)講,有著更強(qiáng)大的能力和技巧,對(duì)計(jì)算機(jī)的操作也更加熟練,可以利用其優(yōu)勢(shì)所在,由青年一代對(duì)這方面進(jìn)行技術(shù)的指導(dǎo)與主導(dǎo),形成由青年一代帶領(lǐng)突破現(xiàn)代技術(shù)應(yīng)用,上級(jí)領(lǐng)導(dǎo)來(lái)把控的一種陣型[7]。
在大數(shù)據(jù)時(shí)代,很多的數(shù)據(jù)可以利用現(xiàn)代計(jì)算機(jī)技術(shù),通過(guò)支付記錄、通信記錄、行程記錄、行政記錄等多種渠道獲取,并可以利用統(tǒng)計(jì)學(xué)的相關(guān)知識(shí),對(duì)數(shù)據(jù)進(jìn)行分析和處理。這樣大大地增加了數(shù)據(jù)信息獲取和收集的渠道,改變了政府統(tǒng)計(jì)部門(mén)的工作形式,從而降低數(shù)據(jù)調(diào)查過(guò)程中的成本,并提高調(diào)查工作的效率和質(zhì)量,還可以避免人為的誤差和影響,同時(shí)提高調(diào)查數(shù)據(jù)的可信度。相對(duì)于傳統(tǒng)的政府統(tǒng)計(jì)調(diào)查數(shù)據(jù)獲取方式,大數(shù)據(jù)的操作更簡(jiǎn)單和便捷,數(shù)據(jù)獲取也更方便且準(zhǔn)確。目前大數(shù)據(jù)技術(shù)被廣泛應(yīng)用,政府統(tǒng)計(jì)部門(mén)的工作人員應(yīng)調(diào)整工作方式和方法,改變數(shù)據(jù)收集的方式,將大數(shù)據(jù)技術(shù)融入政府統(tǒng)計(jì)工作,為數(shù)據(jù)的收集提供更多的渠道,幫助統(tǒng)計(jì)工作人員進(jìn)行數(shù)據(jù)的采集。
現(xiàn)有的SPSS、SAS、STATA等統(tǒng)計(jì)軟件,主要是用來(lái)提升數(shù)據(jù)處理效率的,但若要結(jié)合大數(shù)據(jù)技術(shù)進(jìn)行應(yīng)用,其在技術(shù)方面還有所不足,比如在存儲(chǔ)和傳輸方面,還需要進(jìn)一步提升,且又因?yàn)檫@些軟件的操作都比較復(fù)雜,要想在基層進(jìn)行推廣和使用是比較困難的。就當(dāng)前情況來(lái)說(shuō),如果能在這些統(tǒng)計(jì)軟件的基礎(chǔ)上,簡(jiǎn)化操作步驟,并增強(qiáng)對(duì)數(shù)據(jù)的存儲(chǔ)和傳輸功能,開(kāi)發(fā)出一種功能更全面的統(tǒng)計(jì)軟件,這樣,這個(gè)統(tǒng)計(jì)軟件可以說(shuō)是一個(gè)數(shù)據(jù)的存儲(chǔ)和處理中心,也就是所謂的數(shù)據(jù)中心,能夠達(dá)到大數(shù)據(jù)在統(tǒng)計(jì)工作的統(tǒng)計(jì)軟件中運(yùn)用的目的,從而提高數(shù)據(jù)統(tǒng)計(jì)、傳輸、分析和處理的效率[8]。
抽樣調(diào)查的科學(xué)性強(qiáng),能減少對(duì)樣本的破壞,并且其應(yīng)用范圍廣,適用于各個(gè)領(lǐng)域和各種問(wèn)題的調(diào)查,同時(shí)還可作為彌補(bǔ)大數(shù)據(jù)無(wú)法進(jìn)行因果推斷的有效手段,因此抽樣調(diào)查成為我國(guó)政府統(tǒng)計(jì)調(diào)查工作中的首選調(diào)查方法,并在我國(guó)政府統(tǒng)計(jì)中依舊起著非常重要的作用,有著無(wú)可代替的地位。在當(dāng)今的大數(shù)據(jù)時(shí)代下,要努力抓住調(diào)查工作發(fā)展的機(jī)遇,通過(guò)與現(xiàn)代技術(shù)的有效結(jié)合,使抽樣調(diào)查方法的效率更高、數(shù)據(jù)更準(zhǔn)確、成本更低,為我國(guó)政府統(tǒng)計(jì)工作的進(jìn)步提供更多的可能和更有力的支持。