呂洋洋,王福林,李志遠(yuǎn),趙逸翔
(東北農(nóng)業(yè)大學(xué) 工程學(xué)院,哈爾濱 150030)
我國作為農(nóng)業(yè)人口大國,農(nóng)村人口占全國人口的比例高達(dá)2/3。自實(shí)施農(nóng)村土地經(jīng)營制度及實(shí)現(xiàn)大面積農(nóng)業(yè)機(jī)械化以來,涌現(xiàn)出了數(shù)以億計(jì)的農(nóng)村剩余勞動(dòng)力。農(nóng)村剩余勞動(dòng)力是指超過農(nóng)村產(chǎn)業(yè)需求的一部分勞動(dòng)力,是一個(gè)相對和動(dòng)態(tài)的概念。農(nóng)村剩余勞動(dòng)力的多少會隨著耕地面積、機(jī)械化程度、種植結(jié)構(gòu)等條件的變化而變化。它的存在及其在全國的大量無序流動(dòng)將帶來許多經(jīng)濟(jì)和社會問題。為了從根本上解決“三農(nóng)”問題,首先必須要科學(xué)估算農(nóng)村剩余勞動(dòng)力數(shù)量。近年來,學(xué)者們對農(nóng)村剩余量的估算做了大量的研究,其使用的方法和結(jié)果不盡相同,但大多數(shù)學(xué)者都沒有考慮機(jī)械化程度對農(nóng)村剩余勞動(dòng)力數(shù)量的影響[1-3]。
在農(nóng)業(yè)生產(chǎn)過程當(dāng)中,農(nóng)業(yè)機(jī)械發(fā)揮著無人不曉的作用,如提高農(nóng)業(yè)抵抗自然災(zāi)害的能力、改善生產(chǎn)條件、減弱農(nóng)業(yè)勞動(dòng)強(qiáng)度及提高勞動(dòng)生產(chǎn)率[4]。農(nóng)業(yè)機(jī)械與農(nóng)業(yè)勞動(dòng)力之間存在明顯的替代現(xiàn)象,農(nóng)業(yè)機(jī)械化水平的不斷提高,將加速中國農(nóng)業(yè)剩余勞動(dòng)力的產(chǎn)生[5]。本文推導(dǎo)建立了勞均可承擔(dān)耕地面積與農(nóng)業(yè)機(jī)械化程度的模型,并在此基礎(chǔ)上給出了模型中參數(shù)的獲取和處理方法。以黑龍江省紅星隆分局八五四農(nóng)場為研究對象,調(diào)查了該農(nóng)場10 100個(gè)勞動(dòng)力在農(nóng)業(yè)機(jī)械化程度是0和100%時(shí)可承擔(dān)的耕地面積大小,最后利用準(zhǔn)確的數(shù)據(jù)及研究模型得出寶清縣在不同農(nóng)業(yè)機(jī)械化程度下農(nóng)民種植水田可承擔(dān)的勞均耕地面積。
由農(nóng)業(yè)機(jī)械化程度的定義[6]可知,設(shè)S為耕地面積,s1為機(jī)械化的作業(yè)面積,x為機(jī)械化程度,則
(1)
s1=s·x
(2)
所以,人畜力完成的作業(yè)面積s2為
s2=s-s1=s(1-x)
(3)
則
s=s1+s2=s·x+s·(1-x)
(4)
如果L(x)代表農(nóng)業(yè)機(jī)械化程度是x時(shí)所需勞動(dòng)力數(shù)量,則每公頃耕地面積在農(nóng)業(yè)機(jī)械化程度100%時(shí)所需的勞動(dòng)力數(shù)量為m,在機(jī)械化程度0時(shí)所需的勞動(dòng)力數(shù)量為n,則
L(x)=m·s1+n·s2=m·s·x+n·s·(1-x)
(5)
令l(x)為勞均可負(fù)擔(dān)耕地面積,則
(6)
將公式(5)代入公式(6)得
(7)
在農(nóng)業(yè)機(jī)械化程度100%時(shí),每個(gè)勞動(dòng)力的耕地面積為
(8)
農(nóng)業(yè)機(jī)械化程度0時(shí),每個(gè)勞動(dòng)力的耕地面積為
(9)
將公式(8)和公式(9)代入公式(7)得
(10)
公式(10)是平均各勞動(dòng)力的耕地面積l(x)與農(nóng)業(yè)機(jī)械化程度x之間關(guān)系的模型。在該模型中,有兩個(gè)參數(shù)l(100%)和l(0)。
模型中有兩個(gè)參數(shù):農(nóng)業(yè)機(jī)械化程度100%時(shí)的平均各勞動(dòng)力可負(fù)擔(dān)耕地面積l(100%)和機(jī)械化程度0時(shí)平均各勞動(dòng)力可負(fù)擔(dān)耕地面積l(0)。
對于l(100%)和l(0)這兩個(gè)參數(shù),雖然不能在統(tǒng)計(jì)資料中通過查詢得到,但可通過深入生產(chǎn)實(shí)際進(jìn)行走訪調(diào)研的方式來獲得。有兩種具體的方法來確定:一是通過對農(nóng)村的走訪調(diào)研直接確定l(100%)和l(0)的值;二是調(diào)查當(dāng)前機(jī)械化水平下勞動(dòng)力所能承擔(dān)的耕地面積,然后對機(jī)械化程度和各勞動(dòng)力所能承擔(dān)的耕地面積這兩組數(shù)據(jù)進(jìn)行回歸分析,通過建立的回歸模型求出上述兩個(gè)參數(shù)的值。需要指出的是:不管采取哪一種獲取辦法,調(diào)研樣本一定要足夠多,起碼應(yīng)不小于50個(gè),而且要對樣本進(jìn)行統(tǒng)計(jì)檢驗(yàn)。如果檢驗(yàn)結(jié)果不通過,則需要增加樣本的數(shù)量,直到可以通過統(tǒng)計(jì)檢驗(yàn)為止。此外,在走訪調(diào)研中需要注意的是:首先在走訪調(diào)研之前,要將調(diào)查表格設(shè)計(jì)完全;其次,要明確指出勞動(dòng)力可承擔(dān)的耕地面積是在耕作最忙碌的時(shí)刻確定的,即投入的勞動(dòng)力數(shù)目是最多的時(shí)候確定的;最后,如果避免不了必要的季節(jié)性雇工,那么雇傭的勞動(dòng)力數(shù)量應(yīng)該加入到勞動(dòng)力的需求數(shù)量之中。
數(shù)據(jù)測量常因干擾數(shù)據(jù)的存在使正常數(shù)據(jù)發(fā)生偏離,進(jìn)而會給后續(xù)的分析帶來很多麻煩甚至嚴(yán)重后果。為了提高數(shù)據(jù)的可靠性,不能從主觀上剔除異常數(shù)據(jù),需要進(jìn)行統(tǒng)計(jì)檢驗(yàn),根據(jù)統(tǒng)計(jì)規(guī)律判斷是否有異常數(shù)據(jù)。如果有異常數(shù)據(jù),則應(yīng)從中刪除[7]。
分布檢驗(yàn)的常用方法是χ2檢驗(yàn)[10],其基本思路是:將隨機(jī)測試的所有結(jié)果Ω劃分為k個(gè)互不兼容事件A1,A2,…Ai,…,Ak(A1∪A2∪…∪Ai∪…∪Ak=Ω),Ai∩Aj=?,i≠j,i,j=1,2,…,k。于是,在假設(shè)H0下,可以計(jì)算pi=P(Ai),i,j=1,2,…,k。顯然,在n次試驗(yàn)中,事件Ai的頻率ni/n和pi是不同的。若假設(shè)H0成立,則差異一般不顯著;若H0不成立,則這種差異就顯著。
基于這種想法,采用皮爾遜統(tǒng)計(jì)量,即
(11)
式(11)作為衡量檢驗(yàn)假設(shè)H0與實(shí)際吻合程度的尺度。
假設(shè)總體X的理論分布是函數(shù)F(x),x1,x2,…,xn是來自F(x)的樣本,F(xiàn)0(x)是預(yù)先給定的一個(gè)分布函數(shù),則
H0:F(x)=F0(x),H1:F(x)≠F0(x)
(12)
χ2檢驗(yàn)法的具體操作步驟如下:
1)樣本數(shù)值分為k個(gè)互不相交的區(qū)間(a0,a1],(a1,a2],…,(ai-1,ai],…,(ak-1,ak]。其中,-∞ 2)計(jì)算樣本中落入每一區(qū)間(ai-1,ai](i=1,2,…,k)中的數(shù)量ni,ni稱為實(shí)測頻數(shù)。 3)求理論分布下落在(ai-1,ai]內(nèi)的概率,當(dāng)假設(shè)H0為真時(shí),X落在(ai-1,ai]內(nèi)的概率為pi=P(ai-1 “且要異論相攪”,“事為之防,曲為之制”,乃是宋代統(tǒng)治者鞏固其集權(quán)統(tǒng)治的“家法”,后世即便具有改革要求的君主也都不能不遵守此一“家法”,其負(fù)面影響不可避免: 4)做統(tǒng)計(jì)量,即 (13) 根據(jù)皮爾遜定理知χ2~χ2(k-r-1),r是F0(x)中被估計(jì)參數(shù)的個(gè)數(shù)。 6)由樣本數(shù)據(jù)計(jì)算出統(tǒng)計(jì)量χ2的值。 χ2檢驗(yàn)法是在n趨向于無窮大時(shí)推導(dǎo)出來的,所以在實(shí)際應(yīng)用過程中要保證n一定要足夠大及npi不能過小這兩個(gè)基本條件。正常情況下,樣本容量要滿足n≥50,?npi≥5的要求,最好達(dá)到npi≥10的要求。如果滿足不了上述要求,就應(yīng)當(dāng)適當(dāng)?shù)睾喜^(qū)間以達(dá)到要求。 計(jì)量測量不但對數(shù)據(jù)的精確性有很高的要求,且在得到大量數(shù)據(jù)后還需要有效地剔除其中的異常數(shù)據(jù),從而保證得到有效性的數(shù)據(jù)。 假定各勞動(dòng)力承擔(dān)的耕地面積抽樣數(shù)據(jù)經(jīng)過檢驗(yàn)后服從正態(tài)分布,則記為X~N(μ,σ2),μ表示每個(gè)勞動(dòng)力耕地面積的數(shù)學(xué)期望,σ2表示每個(gè)勞動(dòng)力承擔(dān)耕地面積的方差。因此,根據(jù)數(shù)理統(tǒng)計(jì)學(xué)原理,隨機(jī)變量X的概率密度為 (14) 其中,μ、σ(σ>0)是兩個(gè)常數(shù),稱X為服從參數(shù)是μ和σ的正態(tài)分布,記作X~N(μ,σ2)。它的分布函數(shù)為 (15) 當(dāng)μ=0、σ=1時(shí),則X服從標(biāo)準(zhǔn)正態(tài)分布。用φ(x)和Φ(x)分別表示其概率密度和分布函數(shù),即 (16) (17) (18) (19) 依照上述原則,樣本中任意一個(gè)觀測數(shù)據(jù)與該樣本的期望值μ的差值的絕對值小于3σ的概率可以表示為 (20) 目前,世界上許多國家對質(zhì)量控制的標(biāo)準(zhǔn)各有不同,但大多數(shù)是以μ+3σ為界。即當(dāng)樣本的觀測值在區(qū)間[μ±3σ]范圍內(nèi),可認(rèn)為該觀測值正常;若樣本的觀測值不在這個(gè)區(qū)間范圍內(nèi),則可以認(rèn)為該觀測值異常,應(yīng)予以剔除。該異常值的剔除方法叫作3σ原則。本文按照上述異常數(shù)據(jù)的剔除方法,剔除了實(shí)例中的每個(gè)勞動(dòng)力可負(fù)擔(dān)的耕地面積中的異常數(shù)據(jù)。 (21) (22) (23) (24) 通過對黑龍江省紅星隆分局八五四農(nóng)場10個(gè)生產(chǎn)隊(duì)100個(gè)勞動(dòng)力的調(diào)研,按從小到大排序,得到農(nóng)業(yè)機(jī)械化程度為0時(shí)各勞動(dòng)力耕地面積的大小如表1所示,農(nóng)業(yè)機(jī)械化程度為100%時(shí)各勞動(dòng)力耕地面積的大小如表2所示。 利用表1中的數(shù)據(jù)可計(jì)算出農(nóng)業(yè)機(jī)械化程度為0時(shí)每個(gè)勞動(dòng)力耕地面積的平均值和標(biāo)準(zhǔn)差為 (25) σ(0)≈0.2402 (26) 表1 當(dāng)機(jī)械化程度為0時(shí)各勞動(dòng)力負(fù)擔(dān)耕地面積的調(diào)查表 表2 當(dāng)機(jī)械化程度為100%時(shí)各勞動(dòng)力可負(fù)擔(dān)耕地面積的調(diào)查表 續(xù)表2 利用表2中的數(shù)據(jù)可計(jì)算出機(jī)械化程度為100%時(shí)每個(gè)勞動(dòng)力可承擔(dān)耕地面積的平均數(shù)和標(biāo)準(zhǔn)差為 (27) σ(100%)≈0.8592 (28) 假定每個(gè)勞動(dòng)力可負(fù)擔(dān)耕地面積的數(shù)值服從正態(tài)分布,由于正態(tài)分布函數(shù)的定義域是(-∞,+∞),所以將表1中的100個(gè)數(shù)據(jù)被劃分為7個(gè)區(qū)間:第1個(gè)區(qū)間是(-∞,1.12],最后1個(gè)區(qū)間是(1.72,+∞),其余5個(gè)區(qū)間按組距0.12進(jìn)行劃分。將表2中的100個(gè)樣本數(shù)據(jù)也劃分為7個(gè)區(qū)間:第1個(gè)區(qū)間是(-∞,4.11],最后1個(gè)區(qū)間是(5.81,+∞),其余5個(gè)區(qū)間按組距0.34劃分。 當(dāng)假設(shè)H0成立時(shí),表1樣本數(shù)據(jù)ξ落在各區(qū)間的概率估值為 pi(0)=P(0){ai-1(0)<ξ(0)≤ai(0)} (29) 當(dāng)假設(shè)H0成立時(shí),表2樣本數(shù)據(jù)ξ落在各區(qū)間的概率估值為 pi(100%) =P(100%){ai-1(100%)<ξ(100%)≤ai(100%)} (30) 當(dāng)i=1,2,…,k時(shí),可分別計(jì)算出pi(0)和pi(100%)的值,其結(jié)果如表3和表4所示。當(dāng)機(jī)械化程度為0時(shí),其χ2值為 (31) 其自由度是K-r-1=7-2-1=4,如果取α=0.05,通過查詢χ2分布表得 (32) 表3 機(jī)械化程度為0時(shí)各勞動(dòng)力負(fù)擔(dān)耕地面積的χ2檢驗(yàn)計(jì)算表 續(xù)表3 μ(0)±3σ(0)=1.4686±3×0.2402 =[0.7480,2.1892] (33) 所以,表1中的2.19、2.19和2.31這3個(gè)數(shù)據(jù)為異常數(shù)據(jù),應(yīng)予以剔除。剔除后,機(jī)械化為0時(shí)勞均可負(fù)擔(dān)耕地面積為 =1.4451≈1.45hm2 (34) 表4 機(jī)械化程度為100%時(shí)各勞動(dòng)力負(fù)擔(dān)耕地面積的χ2檢驗(yàn)計(jì)算表 同理,χ2=3.306 8<9.488,所以接受H0。即當(dāng)機(jī)械化程度為100%時(shí),每個(gè)勞動(dòng)力可負(fù)擔(dān)的耕地面積也符合正態(tài)分布,則 μ(100%)±3σ(100%)=5.0012±3×0.8592 =[2.4236,7.5788] (35) 所以,表2中的7.59和7.91這兩個(gè)數(shù)據(jù)為異常數(shù)據(jù),應(yīng)予以剔除。剔除后,機(jī)械化為100%時(shí)勞均可負(fù)擔(dān)耕地面積為 (36) 將l(0)=1.45hm2和l(100%)=4.95hm2代入上述公式(10),經(jīng)整理得 (37) 用式(37)可計(jì)算不同農(nóng)業(yè)機(jī)械化程度下平均各勞動(dòng)力可負(fù)擔(dān)耕地面積的大小,結(jié)果如表5所示。 表5 不同機(jī)械化程度下平均各勞動(dòng)力可負(fù)擔(dān)耕地面積 1)建立了平均各勞動(dòng)力可負(fù)擔(dān)耕地面積與農(nóng)業(yè)機(jī)械化程度之間的關(guān)系模型。 2)給出了獲取、檢驗(yàn)?zāi)P蛥?shù)的方法及異常數(shù)據(jù)剔除、整理的方法,并經(jīng)分布檢驗(yàn)得出每個(gè)勞動(dòng)力可承擔(dān)的耕地面積大小在種植業(yè)機(jī)械化程度為0和100%時(shí)均符合正態(tài)分布。 3)通過剔除調(diào)研數(shù)據(jù)中的異常數(shù)據(jù),分別整理出機(jī)械程度為0和100%時(shí)人均耕地面積為1.45hm2和4.95hm2。 4)根據(jù)模型,計(jì)算給出了黑龍江省紅星隆分局八五四農(nóng)場的勞動(dòng)力在不同機(jī)械化程度下的勞均可負(fù)擔(dān)耕地面積。4 異常數(shù)據(jù)的剔除方法
5 數(shù)據(jù)整理方法
6 實(shí)例計(jì)算
7 結(jié)論