国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的貧困戶(hù)識(shí)別指標(biāo)體系模型研究

2019-10-08 07:21:00徐姝婧陸一嘯徐嘉瑞
關(guān)鍵詞:標(biāo)度名義標(biāo)簽

徐姝婧,陸一嘯,徐嘉瑞

(上海立信會(huì)計(jì)金融學(xué)院,上海201209)

一、引言

2018年2月12日,習(xí)近平總書(shū)記在打好精準(zhǔn)脫貧攻堅(jiān)戰(zhàn)座談會(huì)上指出,打好精準(zhǔn)脫貧攻堅(jiān)戰(zhàn)是黨的十九大報(bào)告提出的三大攻堅(jiān)戰(zhàn)之一,對(duì)如期全面建成小康社會(huì),實(shí)現(xiàn)第一個(gè)百年奮斗目標(biāo)具有十分重要的意義。

近年來(lái),國(guó)家高度重視精準(zhǔn)扶貧工作,出臺(tái)了一系列相關(guān)政策以探求新形勢(shì)下貧困村脫貧致富的方法,但我國(guó)現(xiàn)階段仍缺乏科學(xué)、健全的貧困戶(hù)人口識(shí)別模型。 精準(zhǔn)扶貧在貧困對(duì)象精準(zhǔn)識(shí)別等方面仍存在問(wèn)題。 因此,貧困戶(hù)精準(zhǔn)識(shí)別模型的確立迫在眉睫。 在經(jīng)濟(jì)效應(yīng)上,精準(zhǔn)識(shí)別模型的確立可確保真貧困戶(hù)的精準(zhǔn)識(shí)別,有效避免人工識(shí)別不精準(zhǔn)及人為造假的情況,避免扶貧資源的浪費(fèi)。 在社會(huì)效應(yīng)上,精準(zhǔn)識(shí)別模型可以節(jié)省人力資源,提高政府扶貧工作的效率。 為此,如何建立合理的貧困識(shí)別技術(shù),構(gòu)建創(chuàng)新的貧困戶(hù)精準(zhǔn)識(shí)別辦法,值得進(jìn)一步思考和探索。

本文基于機(jī)器學(xué)習(xí)技術(shù)建立的貧困戶(hù)識(shí)別新指標(biāo),能更精確地量化家庭貧困情況,準(zhǔn)確定位真實(shí)貧困戶(hù),從而促進(jìn)我國(guó)精準(zhǔn)扶貧政策的進(jìn)一步落實(shí),推動(dòng)全面小康社會(huì)的建成。

二、國(guó)內(nèi)外研究現(xiàn)狀

(一)精準(zhǔn)扶貧政策與貧困戶(hù)精準(zhǔn)識(shí)別指標(biāo)

黨的十九大報(bào)告提出精準(zhǔn)扶貧攻堅(jiān)戰(zhàn)前后,國(guó)內(nèi)有諸多學(xué)者團(tuán)隊(duì)對(duì)精準(zhǔn)扶貧領(lǐng)域進(jìn)行研究。 周曉露和胡萌萌(2018)研究發(fā)現(xiàn)農(nóng)村貧困人口的精準(zhǔn)扶貧“瞄準(zhǔn)偏差”現(xiàn)象一直未能解決,政策落實(shí)中應(yīng)考慮復(fù)雜多樣的鄉(xiāng)土人情。 劉斐麗(2018)以“地方性知識(shí)”影響瞄準(zhǔn)偏差的角度,肯定了國(guó)家精準(zhǔn)識(shí)別政策需要與地方性知識(shí)相溝通的事實(shí),同時(shí)進(jìn)一步從精準(zhǔn)識(shí)別執(zhí)行偏差上,分析其對(duì)精準(zhǔn)扶貧政策實(shí)施成效的影響,指出執(zhí)行偏差主要由三種原因造成——政策精細(xì)化實(shí)施中過(guò)于教條、基層執(zhí)行者忽視了如動(dòng)態(tài)化管理和群眾公認(rèn)原則的彈性指標(biāo)、“一刀切”的僵化執(zhí)行政策。 歐陽(yáng)勝(2018)以武陵山區(qū)為例,從扶貧瞄準(zhǔn)對(duì)象識(shí)別機(jī)制的五個(gè)方面進(jìn)一步完善瞄準(zhǔn)機(jī)制的理論研究,點(diǎn)明扶貧瞄準(zhǔn)機(jī)制建設(shè)中的關(guān)鍵環(huán)節(jié)。 王斌(2018)利用多維測(cè)度方法,評(píng)估延安市甘泉縣抽樣調(diào)研的貧困戶(hù)家庭的脫貧指數(shù),研究貧困戶(hù)各脫貧指標(biāo)對(duì)脫貧指數(shù)的貢獻(xiàn)額和貢獻(xiàn)率。 馬志雄等(2018)在貧困人口識(shí)別指標(biāo)選取上,強(qiáng)調(diào)要重視家庭發(fā)展能力考核指標(biāo)的構(gòu)建,以貧困戶(hù)自身的脫貧認(rèn)同作為真脫貧標(biāo)準(zhǔn)。 陸模興等(2018)從理論研究轉(zhuǎn)向模型實(shí)踐,在前期基礎(chǔ)上否定了用單一收入維度作為貧困衡量指標(biāo),基于Alkire-Foster 多維貧困測(cè)度模型選取六個(gè)維度、十二項(xiàng)貧困指標(biāo),考察各維度貧困對(duì)總體多維貧困的貢獻(xiàn)度。 韓瑩(2018)繼續(xù)以多維貧困為基礎(chǔ),利用主成分分析法對(duì)綿陽(yáng)市數(shù)據(jù)進(jìn)行分析,建立多維貧困識(shí)別體系。

(二)精準(zhǔn)扶貧領(lǐng)域的人工智能應(yīng)用研究

傳統(tǒng)扶貧依托于執(zhí)行部門(mén)的執(zhí)行效率與政府撥款,扶貧聚集在教育、基礎(chǔ)設(shè)施等公共部分,但在貧困信息的更新迭代與貧困人口的精準(zhǔn)識(shí)別上,受到地理環(huán)境、人力物力資源的較大限制。 而人工智能技術(shù)正處于跨越式發(fā)展的嶄新階段,其便利的信息整合效率、資源的可視性、低成本均為精準(zhǔn)扶貧進(jìn)程帶來(lái)不可估量的現(xiàn)實(shí)意義。

Jean et al.(2015)研究認(rèn)為夜間燈光亮度與經(jīng)濟(jì)發(fā)展存在緊密的內(nèi)部關(guān)聯(lián),綜合卷積神級(jí)網(wǎng)絡(luò)與遙感數(shù)據(jù)實(shí)現(xiàn)超過(guò)90%的貧困戶(hù)瞄準(zhǔn)準(zhǔn)確度。 彭飛霞(2016)從教育脫貧角度出發(fā),認(rèn)為人工智能獨(dú)具的智能型、反饋性、精準(zhǔn)性、有效性四大特征,對(duì)貧困生的精準(zhǔn)定位與幫扶意義巨大。 尚紋玉(2018)分析了扶貧道路上存在的遺漏率、錯(cuò)配率高的兩個(gè)問(wèn)題,認(rèn)為人工智能的應(yīng)用可提高扶貧的精準(zhǔn)性。 陸倩倩(2018)分析當(dāng)前人工智能與精準(zhǔn)扶貧的結(jié)合現(xiàn)狀,發(fā)現(xiàn)人工智能基本作用于扶貧的支援方,人工智能對(duì)于扶貧工作的有效應(yīng)用仍待進(jìn)一步深入。

(三)評(píng)述

通過(guò)對(duì)扶貧理論與扶貧政策的梳理可以發(fā)現(xiàn),國(guó)內(nèi)外均高度重視國(guó)家扶貧的進(jìn)展,積極推進(jìn)精準(zhǔn)扶貧政策的實(shí)施。 國(guó)內(nèi)一些學(xué)者分析了目前貧困人口識(shí)別方法存在的問(wèn)題,從精準(zhǔn)識(shí)別執(zhí)行偏差上探究貧困人口瞄準(zhǔn)偏離實(shí)際的原因;另一些學(xué)者認(rèn)為精準(zhǔn)扶貧的核心機(jī)制是瞄準(zhǔn)識(shí)別機(jī)制,從扶貧瞄準(zhǔn)對(duì)象識(shí)別機(jī)制的五個(gè)方面,進(jìn)一步完善瞄準(zhǔn)機(jī)制的理論研究,揭示了扶貧瞄準(zhǔn)機(jī)制建設(shè)中的關(guān)鍵環(huán)節(jié)。 國(guó)外學(xué)者對(duì)于精準(zhǔn)扶貧研究較少,但已將人工智能應(yīng)用于扶貧環(huán)節(jié),研究偏向扶貧模式與扶貧理論。 但從總的來(lái)看,盡管?chē)?guó)外對(duì)于扶貧的內(nèi)涵及理論研究較為全面,但未將社會(huì)計(jì)算、人工智能深入應(yīng)用于精準(zhǔn)扶貧。 因此,如果要將精準(zhǔn)扶貧落到實(shí)處,整合我國(guó)實(shí)際情況來(lái)制定相應(yīng)的精準(zhǔn)識(shí)別模型,應(yīng)用機(jī)器學(xué)習(xí)的方法,是精準(zhǔn)扶貧研究勢(shì)在必行的新嘗試。

三、多層前饋神經(jīng)網(wǎng)絡(luò)

圖1 多層前饋神經(jīng)網(wǎng)絡(luò)模型

多層前饋神經(jīng)網(wǎng)絡(luò)是由輸入層、隱藏層和輸出層組成的全連接神經(jīng)網(wǎng)絡(luò),每一層都由多個(gè)神經(jīng)元組成,神經(jīng)元和上一層的神經(jīng)元全連接,但是同層的神經(jīng)元和神經(jīng)元之間沒(méi)有連接。 每一層的輸出會(huì)作為下一層的輸入,為考慮模型的非線性擬合能力通常還會(huì)在隱藏層之間加入激活函數(shù)。 在機(jī)器學(xué)習(xí)中需要綜合多種指標(biāo)進(jìn)行判斷,最終的結(jié)果為是或否。 在統(tǒng)計(jì)學(xué)中,邏輯回歸被用于根據(jù)一些歷史數(shù)據(jù)預(yù)測(cè)變量的各種結(jié)果對(duì)應(yīng)的概率,Logistic Regression(邏輯回歸)是最常用的分類(lèi)算法。但是由于一般的邏輯回歸有一定的局限性,通常需要通過(guò)增加組合項(xiàng)或高斯項(xiàng)來(lái)提高其分類(lèi)性能,而增加組合項(xiàng)、高斯項(xiàng)就會(huì)增加工作量,為解決該問(wèn)題,我們采用了神經(jīng)網(wǎng)絡(luò)。

多層前饋神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程就是將輸入的向量沿著神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的方向逐層的正向傳播至輸出層,然后將實(shí)際輸出與期望輸出對(duì)比,測(cè)算誤差值,然后進(jìn)行反向傳播。在反向傳播過(guò)程中對(duì)各神經(jīng)元的權(quán)重和偏置項(xiàng)進(jìn)行更新(見(jiàn)圖1)。多次循環(huán)整個(gè)過(guò)程,直到滿(mǎn)足人為設(shè)置的最大迭代次數(shù)或者在驗(yàn)證集的準(zhǔn)確度達(dá)到最高。

四、基于調(diào)研數(shù)據(jù)的精準(zhǔn)識(shí)別指標(biāo)體系構(gòu)建

(一)實(shí)地調(diào)研獲取數(shù)據(jù)

本次調(diào)研通過(guò)實(shí)地走訪與深度訪談探究廣西玉林的扶貧現(xiàn)狀,進(jìn)一步了解貧困戶(hù)信息。 本次問(wèn)卷調(diào)研以發(fā)放紙質(zhì)問(wèn)卷為主要手段,在廣西玉林各村委會(huì)的大力支持下,共回收1603 份有效紙質(zhì)問(wèn)卷,涵蓋被調(diào)研對(duì)象個(gè)人基本信息、家庭情況、享受的幫扶政策、對(duì)精準(zhǔn)扶貧的理解與建議四個(gè)方面。

問(wèn)卷設(shè)計(jì)階段,綜合國(guó)家當(dāng)前貧困人口識(shí)別標(biāo)準(zhǔn)與現(xiàn)有精準(zhǔn)扶貧政策,針對(duì)廣西固有扶貧傳統(tǒng)與特定貧困現(xiàn)狀設(shè)計(jì)問(wèn)卷。 問(wèn)卷發(fā)放階段,各村支書(shū)協(xié)助走訪每戶(hù)村民發(fā)放問(wèn)卷。 問(wèn)卷填寫(xiě)回收階段,每份問(wèn)卷加蓋村委會(huì)公章,確保填寫(xiě)對(duì)象落實(shí)到戶(hù)、個(gè)人信息真實(shí)有效。 問(wèn)卷處理階段及分析階段,區(qū)別于傳統(tǒng)的定性分析,運(yùn)用SPSS 軟件定量分析問(wèn)卷數(shù)據(jù)內(nèi)在聯(lián)系。

(二)數(shù)據(jù)清洗

由于被調(diào)查者問(wèn)卷填寫(xiě)不規(guī)范、對(duì)自身信息不確定、不愿公開(kāi)個(gè)人信息等原因,導(dǎo)致調(diào)研數(shù)據(jù)庫(kù)中存在一定數(shù)量的缺失值。 為提高數(shù)據(jù)的可用性,方便進(jìn)一步分析問(wèn)卷數(shù)據(jù),本節(jié)進(jìn)行了缺失值的研究與處理。 被調(diào)研者的個(gè)人信息、家庭信息與其貧困補(bǔ)助額度,數(shù)據(jù)集的字段名與數(shù)據(jù)類(lèi)型如表1所示。

表1 數(shù)據(jù)集內(nèi)容與預(yù)處理方式

images/BZ_113_339_480_399_540.png@3 名義 新標(biāo)簽 性別@4a 標(biāo)度 0年教育支出@4b 標(biāo)度 0年飲食支出@4c 標(biāo)度 0年醫(yī)療支出@4d 標(biāo)度 0年娛樂(lè)支出@4e 標(biāo)度 0年還貸支出@6 標(biāo)度 平均 家庭人口@7 標(biāo)度 平均年齡@8 有序 眾數(shù) 受教育程度@9 名義 新標(biāo)簽 工作狀況@10a 標(biāo)度 0 耕地面積@10b 標(biāo)度 0 魚(yú)塘面積@10c 標(biāo)度 0 山林面積@10d 標(biāo)度 0 果園面積@10e 標(biāo)度 0 其他土地面積@11 有序 眾數(shù) 生活水源@12 標(biāo)度 平均 家庭年收入@13 有序 眾數(shù) 住房材質(zhì)@14 標(biāo)度 平均 住宅面積@15 有序 眾數(shù) 社區(qū)交通條件@16 有序 眾數(shù) 健康狀況@17 有序 眾數(shù) 家庭能源@18a 名義 新標(biāo)簽 電器-無(wú)冰箱@18b 名義 新標(biāo)簽 電器-無(wú)彩電@18c 名義 新標(biāo)簽 電器-無(wú)洗衣機(jī)@18d 名義 新標(biāo)簽 電器-無(wú)熱水器@18e 名義 新標(biāo)簽 電器-無(wú)空調(diào)@18f 名義 新標(biāo)簽 電器-無(wú)智能手機(jī)@18g 名義 新標(biāo)簽 電器-無(wú)計(jì)算機(jī)@18h 名義 新標(biāo)簽 車(chē)輛-無(wú)電動(dòng)& 摩托車(chē)@18i 名義 新標(biāo)簽 車(chē)輛-無(wú)小轎車(chē)@18j 名義 新標(biāo)簽 車(chē)輛-無(wú)貨車(chē)@18k 名義 新標(biāo)簽 電器& 車(chē)輛-全部擁有@19a 名義 新標(biāo)簽 收入來(lái)源-農(nóng)業(yè)生產(chǎn)@19b 名義 新標(biāo)簽 收入來(lái)源-經(jīng)商@19c 名義 新標(biāo)簽 收入來(lái)源-工資提成@19d 名義 新標(biāo)簽 收入來(lái)源-臨時(shí)勞動(dòng)@19e 名義 新標(biāo)簽 收入來(lái)源-社會(huì)福利@19f 名義 新標(biāo)簽 收入來(lái)源-親友援助@19g 名義 新標(biāo)簽 收入來(lái)源-其他

images/BZ_114_351_531_367_561.png@21a 名義 新標(biāo)簽 社保-無(wú)保障@21b 名義 新標(biāo)簽 社保-五險(xiǎn)一金@21c 名義 新標(biāo)簽 社保-低保@21d 名義 新標(biāo)簽 社保-新農(nóng)養(yǎng)老@21e 名義 新標(biāo)簽 社保-新農(nóng)合作醫(yī)療@21f 名義 新標(biāo)簽 社保-農(nóng)村五保@21g 名義 新標(biāo)簽 社保-農(nóng)村醫(yī)療救助@21h 名義 新標(biāo)簽 社保-其他@26 標(biāo)度 0 扶貧補(bǔ)貼金額

根據(jù)表1中所列的缺失值填充規(guī)則,將數(shù)據(jù)集中的缺失值補(bǔ)充完整。 將名義字段通過(guò)數(shù)值化字典換成整數(shù)值標(biāo)簽,以便神經(jīng)網(wǎng)絡(luò)模型能更好地完成分類(lèi)任務(wù)。 玉林市數(shù)據(jù)集的文本轉(zhuǎn)換字典如表2所示。

表2 玉林市數(shù)據(jù)集文本轉(zhuǎn)換字典

對(duì)調(diào)研過(guò)程中產(chǎn)生的偶然誤差采用人工修正,對(duì)明顯錯(cuò)誤值糾正,例如誤把收入“元”當(dāng)作“萬(wàn)元”等。如果錯(cuò)誤較難改正,按缺失值處理。然后對(duì)被填寫(xiě)了多個(gè)值的單選題,根據(jù)實(shí)際情況刪去。對(duì)標(biāo)度字段范圍超過(guò)μ±3σ 的值,人工核驗(yàn)該問(wèn)卷答案,其中μ 為均值,σ 為標(biāo)準(zhǔn)差。

(二)數(shù)據(jù)分析

1.基于因子分析的指標(biāo)提取

通過(guò)因子分析的方法,確定貧困認(rèn)定指標(biāo),將問(wèn)卷信息以一組指標(biāo)來(lái)概括,形成具有當(dāng)?shù)靥厣呢毨?hù)精準(zhǔn)識(shí)別認(rèn)定指標(biāo)。

為兼顧指標(biāo)的簡(jiǎn)潔性與全面性,對(duì)因子分析中得到的每個(gè)因子,取原始特征值作出碎石圖。 圖中橫軸是顯著性從強(qiáng)到弱的因子,縱軸是因子的原始特征值,值越大的因子在描繪數(shù)據(jù)特征中貢獻(xiàn)度越大。 曲線下降速度顯著減緩的地方,就是貢獻(xiàn)度較大的因子與其他因子的分界,取該截?cái)帱c(diǎn)之前的因子為主成分。 玉林市數(shù)據(jù)的因子分析碎石圖如圖2所示。

圖2 玉林市數(shù)據(jù)碎石圖

綜合數(shù)據(jù)分析,將貧困戶(hù)精準(zhǔn)識(shí)別的指標(biāo)數(shù)定為6 個(gè)。 經(jīng)檢驗(yàn),前6 個(gè)因子的公因子特征值均大于1,而第7 個(gè)之后的因子特征值小于1,說(shuō)明前6 個(gè)因子的影響是顯著的。 接著對(duì)數(shù)據(jù)作因子分析,取前6 個(gè)主要的因子,定義貧困戶(hù)精準(zhǔn)識(shí)別指標(biāo)。

因子分析將原來(lái)51 項(xiàng)屬性變換為6 項(xiàng)主要指標(biāo),由于貧困補(bǔ)助額度是外生的因變量,而數(shù)據(jù)已依據(jù)玉林市屬性處理,因此這2 項(xiàng)屬性未參與指標(biāo)提取。 通過(guò)因子最大方差得分可知,提取的6 項(xiàng)指標(biāo)通過(guò)原來(lái)數(shù)據(jù)12%的信息量概括了30%的數(shù)據(jù)特征。 雖然各種變量包含的信息密度不同,但這6 項(xiàng)指標(biāo)實(shí)際上已包括了識(shí)別貧困戶(hù)所需的大部分信息。 作出成分矩陣,計(jì)算每項(xiàng)指標(biāo)中具體包含原來(lái)各項(xiàng)屬性的比例。 玉林市數(shù)據(jù)的成分矩陣如表3所示。

表3 玉林市數(shù)據(jù)成分矩陣

基于以上成分矩陣,根據(jù)信息密度的不同,分名義、有序、標(biāo)度三種字段,分別選擇在每個(gè)指標(biāo)中絕對(duì)值占有成分較大的屬性,綜合定義每個(gè)貧困戶(hù)精準(zhǔn)識(shí)別指標(biāo)。指標(biāo)的定義過(guò)程分別如表4所示。

2.改進(jìn)Lasso 回歸的指標(biāo)權(quán)重計(jì)算

通過(guò)之前的因子分析,得出各項(xiàng)貧困認(rèn)定指標(biāo)的公因子得分,而指標(biāo)的重要性與公因子得分成正比,各指標(biāo)的相對(duì)重要性如表5所示。

表5 貧困戶(hù)精準(zhǔn)識(shí)別指標(biāo)相對(duì)重要性

各地對(duì)貧困程度的量化評(píng)定通常使用線性回歸模型,得到形如(1)式的表達(dá)式:

從調(diào)研所得的信息中提取綜合指標(biāo),而非簡(jiǎn)單篩選指標(biāo)時(shí),必須對(duì)其取值作標(biāo)準(zhǔn)化。此時(shí)X~N(0,1),而b 為人均貧困補(bǔ)助額度。為防止某些指標(biāo)在貧困補(bǔ)助認(rèn)定中是無(wú)效的,使用Lasso 回歸搜尋目標(biāo)函數(shù)JL(w)的最小值。

使用創(chuàng)新方法完成α 的自適應(yīng)。建立Lasso 回歸模型,在給定α 時(shí)將使目標(biāo)函數(shù)取得最小值的記作最優(yōu)解y*,即:

接著定義回歸損失:

整理公式(2)、公式(3)和公式(4),建立優(yōu)化函數(shù):

使用Nelder-Mead 算法搜索函數(shù)f 的最小值,初始解α=0,經(jīng)過(guò)迭代使L 收斂時(shí)α 即為最優(yōu)的參數(shù)。 本算法的實(shí)際意義是,在不增加人為干預(yù)的情況下,通過(guò)調(diào)整對(duì)貧困認(rèn)定指標(biāo)的依賴(lài)程度,找到模型在符合當(dāng)?shù)貙?shí)際的程度與普適性之間的平衡,使得模型面對(duì)新數(shù)據(jù)時(shí)的相對(duì)剩余最小,實(shí)現(xiàn)模型遷移。

在玉林市數(shù)據(jù)中,經(jīng)過(guò)迭代α*=0,L*=84%,貧困補(bǔ)助額度y 與各指標(biāo)V1~V6的關(guān)系是:

由以上分析可知,各指標(biāo)沒(méi)有出現(xiàn)稀疏性,證明指標(biāo)的選擇科學(xué)。 而解的相對(duì)剩余非常大,說(shuō)明貧困補(bǔ)助額度不能被各指標(biāo)線性表示。這是由于貧困戶(hù)的經(jīng)濟(jì)條件和社會(huì)環(huán)境,會(huì)通過(guò)一些復(fù)雜和隱藏的過(guò)程,體現(xiàn)在貧困程度上。 由于上述Lasso 模型只能發(fā)現(xiàn)線性關(guān)系,故通過(guò)討論神經(jīng)網(wǎng)絡(luò)模型,發(fā)現(xiàn)在貧困戶(hù)精準(zhǔn)識(shí)別指標(biāo)體系,探究被調(diào)研者的數(shù)據(jù)與貧困補(bǔ)助額度之間的隱含關(guān)系。

五、模型實(shí)現(xiàn)效果

將被調(diào)研的人分為兩類(lèi):第一類(lèi)是獲得精準(zhǔn)扶貧補(bǔ)助的貧困戶(hù);第二類(lèi)是未獲得精準(zhǔn)扶貧補(bǔ)助的非貧困戶(hù),通過(guò)神經(jīng)網(wǎng)絡(luò)作二分類(lèi)預(yù)測(cè)。 以玉林市調(diào)研所得數(shù)據(jù)為例,通過(guò)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)被調(diào)研者是否貧困。 數(shù)據(jù)的自變量是被調(diào)研者關(guān)于6項(xiàng)貧困戶(hù)精準(zhǔn)識(shí)別指標(biāo)的表現(xiàn),因變量則為一個(gè)是否貧困的標(biāo)簽,神經(jīng)網(wǎng)絡(luò)參數(shù)如表6所示。

表6 貧困與否預(yù)測(cè)神經(jīng)網(wǎng)絡(luò)參數(shù)

對(duì)玉林市被調(diào)研者的603 條數(shù)據(jù)進(jìn)行處理,把數(shù)據(jù)隨機(jī)分為數(shù)量相當(dāng)?shù)?0 組,取其中9 組建立和優(yōu)化模型,剩余1 組為驗(yàn)證集,以驗(yàn)證模型在新數(shù)據(jù)上的表現(xiàn)。 選擇不同的驗(yàn)證集重復(fù)以上實(shí)驗(yàn)5 次,預(yù)訓(xùn)練后在驗(yàn)證集上得到的相對(duì)剩余如表7所示。

表7 貧困與否預(yù)測(cè)分組輪替實(shí)驗(yàn)相對(duì)剩余

若模型在驗(yàn)證集上的相對(duì)剩余較高,則可能由兩種情況導(dǎo)致:一是模型缺陷,二是數(shù)據(jù)質(zhì)量較差。 當(dāng)模型有缺陷時(shí),該模型在不同驗(yàn)證集上的相對(duì)剩余差距較大,而當(dāng)數(shù)據(jù)質(zhì)量較差時(shí),該模型在不同驗(yàn)證集上的相對(duì)剩余是穩(wěn)定的。 由表7可知,模型在不同的數(shù)據(jù)集上表現(xiàn)是穩(wěn)定的,最優(yōu)達(dá)到了20%的剩余,并且每次實(shí)驗(yàn)的剩余均小于30%,因此導(dǎo)致本模型相對(duì)剩余較高的原因更可能是數(shù)據(jù)質(zhì)量較差而非模型缺陷。

驗(yàn)證結(jié)果表明,貧困戶(hù)的認(rèn)定與從其數(shù)據(jù)中挖掘出的規(guī)律,存在一定的不統(tǒng)一性。 這可能由于政策實(shí)施時(shí)信息采集誤差、操作錯(cuò)誤,及政策制定未根據(jù)當(dāng)?shù)貙?shí)際情況變化及時(shí)調(diào)整所致。 通過(guò)本模型,扶貧機(jī)構(gòu)只需采集一些被調(diào)研者的經(jīng)濟(jì)數(shù)據(jù)優(yōu)化模型,模型便可更貼近當(dāng)?shù)貙?shí)際情況,即通過(guò)當(dāng)?shù)卣w居民信息預(yù)測(cè)其貧困情況。

六、結(jié)論

本文基于神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)居民貧困情況的預(yù)測(cè)。 該模型可大幅降低扶貧機(jī)構(gòu)識(shí)別貧困戶(hù)的工作量,提供相較于人工審核,更為科學(xué)、透明、高效的方法。

按本次調(diào)研提出的方法,扶貧機(jī)構(gòu)需要收集當(dāng)?shù)夭糠志用竦膫€(gè)人經(jīng)濟(jì)信息,運(yùn)用此模型建立針對(duì)當(dāng)?shù)厍闆r的貧困戶(hù)精準(zhǔn)識(shí)別新指標(biāo)體系,并僅需當(dāng)?shù)匾徊糠謹(jǐn)?shù)據(jù),便可得出此地主要的貧困情況。 完成以上分析后,貧困戶(hù)精準(zhǔn)識(shí)別模型能繼續(xù)自動(dòng)地預(yù)測(cè)其余居民的貧困情況,從而實(shí)現(xiàn)機(jī)器與人工協(xié)同識(shí)別貧困戶(hù),大幅減少扶貧機(jī)構(gòu)在貧困戶(hù)精準(zhǔn)識(shí)別工作中的人力物力投入,降低貧困戶(hù)認(rèn)定成本。

猜你喜歡
標(biāo)度名義標(biāo)簽
層次分析法中兩種標(biāo)度的對(duì)比分析
逆行,以生命的名義
以二胎的名義,享受生活
好日子(2018年9期)2018-10-12 09:57:18
無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
車(chē)迷(2018年11期)2018-08-30 03:20:32
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
海峽姐妹(2018年3期)2018-05-09 08:21:02
標(biāo)簽化傷害了誰(shuí)
加權(quán)無(wú)標(biāo)度網(wǎng)絡(luò)上SIRS 類(lèi)傳播模型研究
基于多進(jìn)制查詢(xún)樹(shù)的多標(biāo)簽識(shí)別方法
以創(chuàng)新的名義宣誓發(fā)展
創(chuàng)新孵化網(wǎng)絡(luò)演化無(wú)標(biāo)度特征仿真分析
克拉玛依市| 慈溪市| 黎川县| 和龙市| 多伦县| 礼泉县| 江津市| 都匀市| 龙江县| 萨嘎县| 乌审旗| 和平县| 高台县| 洮南市| 仪征市| 凤山县| 岗巴县| 昆明市| 贡嘎县| 六枝特区| 微博| 手游| 南木林县| 清水县| 城固县| 日喀则市| 酒泉市| 桂东县| 吉林市| 密云县| 隆昌县| 方山县| 武城县| 温宿县| 抚顺市| 大邑县| 红桥区| 灌云县| 泗洪县| 洞头县| 大厂|