王雅楠 高傳勝 劉競龍
(1 南京大學(xué)政府管理學(xué)院,江蘇 南京,210023;2 加泰羅尼亞理工大學(xué)信號理論與通信學(xué)院,西班牙 巴塞羅那,08028)
近年來,我國人口出生率和總和生育率持續(xù)走低。國家統(tǒng)計(jì)局的數(shù)據(jù)顯示,中國的人口出生率連續(xù)5年下跌,由2016年的13.57‰降至2021年的7.52‰。結(jié)合第七次全國人口普查數(shù)據(jù),2020年中國的總和生育率僅為1.3[1]。這意味著,中國已經(jīng)進(jìn)入人口出生率低于11‰、總和生育率低于1.5的“超少子化”階段[2]。與此同時,中國人口老齡化程度持續(xù)深化,到2021年65歲及以上人口占總?cè)丝诘谋戎匾堰_(dá)到14.2%[3]。為了應(yīng)對人口老齡化和超少子化疊加的雙重壓力,我國進(jìn)一步放開生育政策,在2021年正式實(shí)施一對夫妻可以生育三個子女的政策(簡稱“三孩政策”)及相關(guān)配套支持措施[4]。
國際上生育率水平較低的國家和地區(qū)大多通過提供時間支持(帶薪產(chǎn)假、育兒假等)、經(jīng)濟(jì)支持(兒童津貼、稅收減免等)、服務(wù)支持與就業(yè)支持(累積休假制度、彈性工作時間等)等方面的政策措施,為家庭提供綜合性、多樣化的育兒支持。雖然各國的家庭政策在支持力度與具體方式上有所差異,但均較為重視促進(jìn)托育服務(wù)有效供給[5]。已有研究表明,托育服務(wù)有效供給更能對生育產(chǎn)生積極影響,其中包括提高生育率、降低女性的初育年齡等[6][7]。正因如此,發(fā)展托育服務(wù)也成為促進(jìn)我國人口長期均衡發(fā)展的重要舉措。2019年以來,國家陸續(xù)出臺了多項(xiàng)促進(jìn)嬰幼兒照護(hù)服務(wù)、托育服務(wù)發(fā)展的相關(guān)政策,例如,國務(wù)院辦公廳于2019年發(fā)布的《關(guān)于促進(jìn)3歲以下嬰幼兒照護(hù)服務(wù)發(fā)展的指導(dǎo)意見》、于2020年發(fā)布的《關(guān)于促進(jìn)養(yǎng)老托育服務(wù)健康發(fā)展的意見》,國家發(fā)展和改革委員會、國家衛(wèi)生健康委員會于2019年發(fā)布的《支持社會力量發(fā)展普惠托育服務(wù)專項(xiàng)行動實(shí)施方案(試行)》、國家發(fā)展和改革委員會于2021年發(fā)布的《“十四五”積極應(yīng)對人口老齡化工程和托育建設(shè)實(shí)施方案》,以及2021年發(fā)布的《中共中央 國務(wù)院關(guān)于優(yōu)化生育政策促進(jìn)人口長期均衡發(fā)展的決定》。由此可見,在新發(fā)展階段和新的人口形勢下,托育服務(wù)供給側(cè)結(jié)構(gòu)性改革已經(jīng)得到了黨和政府的高度重視。
推進(jìn)托育服務(wù)供給側(cè)結(jié)構(gòu)性改革,不僅要求擴(kuò)大托育服務(wù)的供給規(guī)模、保證供給質(zhì)量,還要求增強(qiáng)供給結(jié)構(gòu)對需求變化的適應(yīng)性與靈活性。受到家庭收入水平、父母受教育程度、隔代照顧、對托育服務(wù)的認(rèn)可程度等多方面因素的影響,托育需求呈多樣化、復(fù)雜性的特征,這要求管理者在改革之初盡量規(guī)避服務(wù)供給過程中因需求識別缺位、錯位而陷入供給困境。質(zhì)言之,在提供托育服務(wù)時必須要考慮需求側(cè),研究家庭的托育需求是推進(jìn)托育服務(wù)供給側(cè)結(jié)構(gòu)性改革的邏輯起點(diǎn)。那么,如何精準(zhǔn)把握托育需求水平?托育需求又受到哪些因素影響?政府又該如何有效回應(yīng)托育需求?本文將對這些問題展開探討?!吨腥A人民共和國國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》(以下簡稱“十四五”規(guī)劃)在第四十五章“實(shí)施積極應(yīng)對人口老齡化國家戰(zhàn)略”中,明確指出要“健全支持嬰幼兒照護(hù)服務(wù)和早期發(fā)展的政策體系”[8]。這意味著,“十四五”時期不僅是全面建成小康社會和開啟全面建設(shè)社會主義現(xiàn)代化國家新征程的歷史交匯期,還是托育服務(wù)事業(yè)規(guī)范發(fā)展的關(guān)鍵期。面對新形勢、新使命,精準(zhǔn)把握家庭的托育需求,對于推動我國托育服務(wù)有效供給具有重要的現(xiàn)實(shí)意義。
國內(nèi)外已有文獻(xiàn)主要從以下幾個維度研究托育需求:其一,側(cè)重于探討家庭背景對托育需求的影響,即主要考察父母的年齡、受教育程度、工作類型以及家庭收入水平等因素與托育需求之間的關(guān)系。多項(xiàng)研究表明,家庭收入水平越高或者父母受教育年限越長,越傾向于通過托育服務(wù)對子女進(jìn)行投資[9-12]。進(jìn)一步地,國內(nèi)學(xué)者在單獨(dú)考察父母的社會經(jīng)濟(jì)特征時發(fā)現(xiàn),父親的收入水平和受教育程度以及母親的年齡和收入水平,均與托育需求呈正相關(guān),而母親受教育程度越高,越傾向于選擇家庭照顧[13]。也有研究重點(diǎn)考察了工作類型對托育需求的影響,結(jié)果顯示,雙職工家庭更偏好讓子女入托,尤其是當(dāng)母親從事全職工作時,托育需求顯著提高[14-15]。其二,側(cè)重于考察托育服務(wù)屬性與托育需求之間的關(guān)系。國外學(xué)者主要從托育服務(wù)的可獲得性(Availability)、可及性(Accessibility)、可負(fù)擔(dān)性(Affordability)以及質(zhì)量(Quality)四個維度出發(fā),探討托育服務(wù)的價格、質(zhì)量以及托育機(jī)構(gòu)的地理位置等因素對托育需求的影響[16]。近年來,國內(nèi)學(xué)術(shù)界也逐漸關(guān)注家庭對托育服務(wù)的需求偏好,如基于選擇實(shí)驗(yàn)法(Choice Experiment)的兩項(xiàng)研究表明,家庭的托育需求呈現(xiàn)出“安全為重,保教融合,普惠可及”的偏好特征[17],此外,家長更青睞公辦機(jī)構(gòu)、有早教師資以及送托距離合適的機(jī)構(gòu)[18]。其三,側(cè)重考察社會支持網(wǎng)絡(luò)對托育需求的影響。一方面,在預(yù)期壽命提高、生育率降低的影響下,隔代照顧在一定程度上緩解了年輕父母的育兒壓力,降低了家庭的托育需求[19-20]。另一方面,社區(qū)支持也會影響托育需求,如社區(qū)對家庭育兒的物質(zhì)環(huán)境支持、教育支持、娛樂設(shè)施支持程度越高,家庭托育需求越低[21]。
綜合而言,國內(nèi)學(xué)界對托育服務(wù)的研究尚處在起步階段,對于微觀層面的托育需求關(guān)注不多,缺乏對托育服務(wù)供給側(cè)結(jié)構(gòu)性改革的經(jīng)驗(yàn)證據(jù)。首先,現(xiàn)有對托育需求的少量定量研究均建立在傳統(tǒng)計(jì)量模型的基礎(chǔ)上。然而,一方面,傳統(tǒng)計(jì)量模型在納入多項(xiàng)解釋變量時,擬合精度會顯著下降,一定程度上制約了變量的選取。這類研究多從單一維度出發(fā),僅關(guān)注家庭背景或者托育服務(wù)屬性對托育需求的影響,缺乏對影響因素的歸納梳理與系統(tǒng)把握。也有學(xué)者嘗試將父母特征、嬰幼兒結(jié)構(gòu)、社區(qū)特征等多方面的影響因素納入Logit回歸模型中,但擬合優(yōu)度僅接近50%,模型的可解釋力一般[22]。另一方面,既有對于托育需求的量化研究,存在的核心問題仍然是用簡單的線性關(guān)系來應(yīng)對復(fù)雜的需求變化,難以深入地考察解釋變量之間、解釋變量與被解釋變量之間復(fù)雜的關(guān)系。其次,現(xiàn)有相關(guān)文獻(xiàn)多以大城市為研究區(qū)域來測度家庭的托育需求水平與影響因素,相關(guān)結(jié)論無法直接被推廣到普通地級市中。托育需求水平(每千人口所需的托位數(shù))不僅受到家庭收入水平、父母受教育程度等微觀因素的影響,還與地區(qū)經(jīng)濟(jì)發(fā)展水平、城市規(guī)模、人口結(jié)構(gòu)、人口出生率等宏觀因素密切相關(guān)[23-25]。由于大城市與普通地級市在城市規(guī)模、經(jīng)濟(jì)發(fā)展水平等方面存在顯著差距,托育需求必然也存在差異,而相關(guān)研究缺乏對普通地級市托育需求的關(guān)注。
基于此,本研究著眼于測度普通地級市的一般托育需求水平,將最新的自動機(jī)器學(xué)習(xí)算法(AutoGluon)引入到托育需求的影響因素分析中。與以往文獻(xiàn)相比,本研究的邊際貢獻(xiàn)在于:首先,將AutoGluon從計(jì)算機(jī)領(lǐng)域引入到托育需求的研究中,拓展了傳統(tǒng)議題的研究方法,為機(jī)器學(xué)習(xí)方法在公共管理領(lǐng)域的應(yīng)用提供了實(shí)踐案例。其次,借助機(jī)器學(xué)習(xí)算法,通過盡可能多地引入特征值(解釋變量),避免了傳統(tǒng)計(jì)量模型處理復(fù)雜變量導(dǎo)致的精度下降問題以及遺漏變量導(dǎo)致的內(nèi)生性問題。最后,從傳統(tǒng)實(shí)證的有監(jiān)督學(xué)習(xí)轉(zhuǎn)換到機(jī)器學(xué)習(xí)的無監(jiān)督學(xué)習(xí),突破了傳統(tǒng)計(jì)量模型無法準(zhǔn)確描述復(fù)雜社會系統(tǒng)動態(tài)變化的瓶頸,準(zhǔn)確測度了主要影響因素與托育需求的非線性關(guān)系,有助于地方政府更精準(zhǔn)地把握家庭的托育需求,進(jìn)而推動托育服務(wù)有效供給。
在分析社會問題時,根據(jù)研究問題和目的的不同,往往需要選擇不同的研究方法。本研究關(guān)注的是托育需求水平及其影響因素,屬于分類研究,傳統(tǒng)的計(jì)量模型與隨機(jī)森林模型(Random Forest)、神經(jīng)網(wǎng)絡(luò)、XGBoost、LightGBM等機(jī)器學(xué)習(xí)算法均可以用于解決此類問題。本研究選取AutoGluon作為研究技術(shù),原因有兩點(diǎn):一方面,相較于傳統(tǒng)計(jì)量模型,機(jī)器學(xué)習(xí)算法允許特征值數(shù)量大于觀測值數(shù)量,通過盡可能多地引入特征值,更好地解決遺漏變量導(dǎo)致的估計(jì)偏誤,并獲取預(yù)測精度更高的模型;另一方面,相較于其他機(jī)器學(xué)習(xí)算法,AutoGluon通過一定的策略建立了方法集成,不僅能夠得到擬合效果更好、精度更高的預(yù)測模型,而且無須反復(fù)調(diào)整參數(shù),降低了非專業(yè)人士的使用難度,有利于推動機(jī)器學(xué)習(xí)在各個學(xué)科中的運(yùn)用[26]。
具體來看,AutoGluon主要有三大運(yùn)算策略。一是多模型組合(Multi-Layer Stack Ensembing)。AutoGluon不僅嵌套了隨機(jī)森林模型(Random Forest)、深度神經(jīng)網(wǎng)絡(luò)(Deep Neutral Networks)、LightGBM等主流的機(jī)器學(xué)習(xí)算法,還納入了YOLOV、BERT等深度學(xué)習(xí)算法。在融合多種算法的基礎(chǔ)上,AutoGluon建立了自己的運(yùn)算策略,并進(jìn)一步實(shí)現(xiàn)了自動超參數(shù)調(diào)整、模型選擇、架構(gòu)搜索等優(yōu)化功能。二是k-折交叉驗(yàn)證(Repeated k-fold Bagging)。k-折交叉驗(yàn)證可以確保嵌入的子模型都能調(diào)用完整的數(shù)據(jù)集,并且能夠?qū)λ凶幽P偷挠?xùn)練結(jié)果進(jìn)行重新計(jì)算,實(shí)現(xiàn)再擬合。三是改進(jìn)的神經(jīng)網(wǎng)絡(luò)架構(gòu)。神經(jīng)網(wǎng)絡(luò)是AutoGluon的基礎(chǔ),也是其最主要的應(yīng)用方式。然而,單一的神經(jīng)網(wǎng)絡(luò)有可能出現(xiàn)過度擬合、欠擬合等問題,導(dǎo)致精度降低[27]。為此,AutoGluon采用了改進(jìn)的神經(jīng)網(wǎng)絡(luò)架構(gòu),并在訓(xùn)練過程中增加了Dropout和BatchNorm等測量,從而提高了模型的泛化性。
本研究選取江蘇省徐州市作為主要的實(shí)驗(yàn)區(qū)域,測度家庭的托育需求水平與影響因素。從微觀層面來看,已有研究表明,家庭收入水平、父母受教育程度等是影響托育需求的關(guān)鍵因素。從宏觀層面來看,城市的人口出生率、城市規(guī)模、經(jīng)濟(jì)發(fā)展水平等也會顯著影響整體的托育需求水平(每千人口所需的托位數(shù))。因而,本文從人口出生率、城市規(guī)模、經(jīng)濟(jì)發(fā)展水平、平均受教育年限等多個方面綜合衡量徐州市的代表性。其中,人口出生率的數(shù)據(jù)來源于《徐州統(tǒng)計(jì)年鑒2021》[28]《中國統(tǒng)計(jì)年鑒2021》[29],城市規(guī)模的數(shù)據(jù)來源于《中國城市建設(shè)統(tǒng)計(jì)年鑒2020》[30],人均GDP、居民可支配收入、平均受教育年限的數(shù)據(jù)來源于《江蘇統(tǒng)計(jì)年鑒2021》[31]《中國統(tǒng)計(jì)年鑒2021》[32]。從人口出生率來看, 2020年全國人口出生率為8.52‰,徐州市人口出生率為7.10‰,在全國范圍內(nèi)處于中低水平。從城市規(guī)模來看,2019年徐州市城區(qū)常住人口數(shù)量為196.57萬人,在297個城市中(4個直轄市和293個地級市)位列第35,屬于Ⅱ型大城市(1)分類標(biāo)準(zhǔn)見《國務(wù)院關(guān)于調(diào)整城市規(guī)模劃分標(biāo)準(zhǔn)的通知》(國發(fā)〔2014〕51號),以城區(qū)常住人口為統(tǒng)計(jì)口徑,可以將城市劃分為五類七檔:城區(qū)常住人口超過1000萬的城市為超大城市;城區(qū)常住人口為500以上1000萬以下的城市為特大城市;城區(qū)常住人口為100萬以上500萬以下的城市為大城市,其中,300萬以上500萬以下的城市為Ⅰ型大城市,100萬以上300萬以下的城市為Ⅱ型大城市;城區(qū)常住人口為50萬以上100萬以下的城市為中等城市;城市常住人口50萬以下的城市為小城市,其中,20萬以上50萬以下的城市為Ⅰ型小城市,20萬以下的城市為Ⅱ型小城市。。從經(jīng)濟(jì)發(fā)展水平來看,2020年徐州市人均GDP為80673元,比同年全國人均GDP 高出12.04%,處于中等偏上水平。進(jìn)一步地,從居民人均可支配收入來看,2020年徐州居民人均可支配收入為29376元,比同年全國居民人均可支配收入低8.73%,處于中等偏下水平。從平均受教育年限來看,2020年徐州常住人口中15歲及以上人口的平均受教育年限為9.68年,略低于同年全國平均水平9.91年,人力資本存量處于中等偏下水平。
一方面,在人口出生率、城市規(guī)模、經(jīng)濟(jì)發(fā)展水平等因素的作用下,徐州市的客觀托育需求總量(每千人口所需的托位數(shù))應(yīng)在全國范圍內(nèi)處于中等偏上水平。另一方面,在居民人均可支配收入與平均受教育年限的影響下,該市居民對托育服務(wù)的可負(fù)擔(dān)水平與接納程度在全國范圍內(nèi)處于中等偏低水平。綜合而言,在上述因素的綜合作用下,徐州市反映了我國城市托育需求的中等水平。因而,本研究選取徐州市為實(shí)驗(yàn)區(qū)域,旨在刻畫當(dāng)前普通地級市的一般托育需求水平與影響因素,為與徐州在城市規(guī)模、經(jīng)濟(jì)發(fā)展水平等方面特征相似的同類地級市提供有價值的政策建議。
本研究所使用的數(shù)據(jù)來自課題組于2021年9月在江蘇省徐州市進(jìn)行的多階段隨機(jī)抽樣調(diào)查。調(diào)查對象設(shè)定為年齡在20~49歲的已婚女性或男性。為有效篩選出調(diào)查對象,課題組聯(lián)系每個區(qū)的托育園、幼兒園配合調(diào)研,最終發(fā)放問卷1800份,回收有效問卷1601份,回收率為89.44%。其中,各區(qū)所下發(fā)的問卷數(shù)量,主要是依據(jù)《徐州市第七次全國人口普查公報(bào)》公布的各區(qū)0~14歲兒童占總?cè)丝诘谋戎剡M(jìn)行測算確定[33],最終在銅山區(qū)、泉山區(qū)、賈汪區(qū)、云龍區(qū)、經(jīng)濟(jì)技術(shù)開發(fā)區(qū)與鼓樓區(qū)下發(fā)的問卷數(shù)量依次為684份、252份、252份、234份、216份、162份。調(diào)查內(nèi)容主要包括四個部分:第一部分是受訪者個人及家庭背景,主要包括受訪者及其配偶的年齡、受教育程度、收入水平、工作類型,以及嬰幼兒的年齡、數(shù)量;第二部分是家庭的育兒現(xiàn)狀與潛在托育需求,主要包括3歲以下嬰幼兒的主要照料者、照料強(qiáng)度、養(yǎng)育模式、對科學(xué)育兒知識的了解程度等;第三部分是社會支持網(wǎng)絡(luò),既包括社區(qū)育兒支持,如娛樂設(shè)施、衛(wèi)生保健、父母講座等,又包括隔代照顧,如祖輩的年齡、受教育程度等;第四部分是選擇偏好,主要考察家庭成員對托育服務(wù)的態(tài)度,如對托育服務(wù)平衡工作與生活功能的認(rèn)可程度、對托育服務(wù)促進(jìn)早期人力資本積累功能的認(rèn)可程度等。
具體的數(shù)據(jù)處理與實(shí)驗(yàn)流程如下。首先,對調(diào)研信息進(jìn)行預(yù)處理,即進(jìn)行數(shù)據(jù)清理和數(shù)據(jù)編碼。其中,數(shù)據(jù)清理主要是為了減少模型訓(xùn)練中的噪聲與異常值,具體地,借助Python庫的熱力圖來觀察各個特征值與目標(biāo)值之間的相關(guān)性,去除與目標(biāo)值相關(guān)性特別低的特征值。數(shù)據(jù)編碼的主要目的是將文字語言轉(zhuǎn)化為機(jī)器可以識別的語言,本文中,除了職業(yè)類型編碼為分類變量外,其余特征值的編碼均為數(shù)值型,空值則用NaN替代。其次,進(jìn)行模型訓(xùn)練。為確保模型的有效性、提高預(yù)測精度,AutoGluon在訓(xùn)練過程中增加了Stack次數(shù)、k-折交叉驗(yàn)證的n和k、訓(xùn)練時間等參數(shù),并確保參數(shù)的隨機(jī)迭代。每次訓(xùn)練完成后均會進(jìn)行精度判斷,若滿足閾值則輸出模型,不滿足閾值則繼續(xù)迭代。最后,模型應(yīng)用,即解譯模型。主要是借助訓(xùn)練后的模型,分析不同特征值對托育需求的影響程度(特征值重要性排序)、單一特征值與托育需求的關(guān)系、多特征值與托育需求之間的關(guān)系,進(jìn)而測度地區(qū)總體的托育需求水平(每千人口所需的托位數(shù)),從而更精確地把握家庭的托育需求,并為政策制定者支持托育服務(wù)發(fā)展提供重要的決策依據(jù)。
1.特征值重要性的評價結(jié)果
根據(jù)機(jī)器學(xué)習(xí)迭代結(jié)果,最終保留24個特征值參與模型訓(xùn)練,編碼方法與編碼結(jié)果見表1。其中,目標(biāo)值(target)為問卷中“若(再)生育,您打算由誰來照顧3歲以下嬰幼兒”,0記為家庭照顧,1記為托兒所,其余23個特征值為年齡(age)、母親受教育程度(m-edu)、母親月收入水平(m-income)、父親月收入水平(f-income)等。由于母親的工作類型為分類變量,無法用單一特征值進(jìn)行表示,因而,本研究將母親的工作類型進(jìn)行逐一編碼。表1展示了主要特征值的重要性排序,重要性程度越高,對被解釋變量的解釋力越強(qiáng)。由表1可知,母親的年齡是影響托育需求的最重要特征,母親收入水平次之,再次為對托育服務(wù)促進(jìn)早期人力資本積累功能的認(rèn)可度、父親受教育程度、對托育服務(wù)平衡工作與生活功能的認(rèn)可度等,下文會著重分析幾個重要的單一特征值與多特征值對家庭托育需求的影響。
表1 特征值的編碼方法與重要性排序
(續(xù)表1)
值得注意的是,雖然母親的工作類型的重要性程度總體不高,如特征值m-job_gtjy的重要性僅排在第16位,但不同工作類型對托育需求的影響程度卻顯著不同。其中,當(dāng)母親從事個體經(jīng)營工作或中斷就業(yè)時,對托育需求的解釋力更強(qiáng);而當(dāng)母親就職于政府部門、企事業(yè)單位或者從未就業(yè)時,幾乎不會對托育需求產(chǎn)生影響??赡艿慕忉屖牵瑥氖聜€體經(jīng)營工作的母親無法享受法定產(chǎn)假與哺乳假,且因生育選擇中斷就業(yè)可能會給母親帶來較高的機(jī)會成本,在此情形下,這類母親群體對托育服務(wù)的需求更為強(qiáng)烈。而就職于政府部門、企事業(yè)單位的母親,可以享受法定的職工產(chǎn)假和哺乳假,這在一定程度上削弱了家庭對托育服務(wù)的需求。具體地,從國家層面來看,2012年出臺的《女職業(yè)勞動保護(hù)特別規(guī)定》將原有的90天女性職工產(chǎn)假調(diào)整為98天,出現(xiàn)難產(chǎn)情況、生育多胞胎等情形,還可(每胎)增加15天產(chǎn)假[34]。此外,2008年,原人事部發(fā)布的《機(jī)關(guān)事業(yè)單位工作人員帶薪年休假實(shí)施辦法》[35]與人力資源和社會保障部發(fā)布的《企業(yè)職工帶薪年休假實(shí)施辦法》均明確規(guī)定[36],產(chǎn)假不計(jì)入帶薪年休假。職工可依據(jù)工作年限享受的5~15天帶薪年休假,并將其與上述生育類假期合并使用。這些政策增加了職工生育類休假時間,為職工家庭照顧嬰幼兒提供了較為寬裕的時間支持保障,卻也將從事個體經(jīng)營工作以及未就業(yè)的母親排斥在這種福利體系之外??梢哉f,這種現(xiàn)象本質(zhì)上是職業(yè)不平等在兒童照顧問題上的凸顯。即使是最新設(shè)立的“3歲以下嬰幼兒照護(hù)個人所得稅專項(xiàng)附加扣除”也是選擇性的[37]:高稅收的個體(家庭)會從中獲益更多,而低稅收個體(家庭)甚至無須納稅的個體(家庭)則很難受益。這進(jìn)一步地支持了,提供普遍性的托育服務(wù)、擴(kuò)大家庭政策受益群體的必要性。
2.模型精度評價:模型的有效性
本研究以隨機(jī)抽樣的方式,將所有的數(shù)據(jù)集劃分為訓(xùn)練集與測試集來驗(yàn)證模型的有效性。其中,訓(xùn)練集主要用來學(xué)習(xí)規(guī)律,測試集用來檢驗(yàn)訓(xùn)練模型的有效性。在對模型預(yù)測精度的評價方面,不同學(xué)者選取的評價指標(biāo)存在差異,主要指標(biāo)有Accuracy、Recall、Precision、F1、MSE、RMSE等。由于本文關(guān)注的是二分類問題,因而選取常用的二分類評價指標(biāo)體系,即Accuracy、Recall、Precision與 F1,它們是以正例和負(fù)例的四種組合為基礎(chǔ)的評價指標(biāo)體系,具體組合情況見表2。一是實(shí)際值與預(yù)測值均為正例(TP),即用戶問卷填寫
表2 正例與負(fù)例的四種組合形式
的實(shí)際值(target)為1且模型訓(xùn)練的預(yù)測值(target’)也為1;二是實(shí)際值為正例而預(yù)測值為負(fù)例(TN),即實(shí)際值(target)為1,預(yù)測值(target’)為0;三是實(shí)際值與預(yù)測值均為負(fù)例(FN),即實(shí)際值(target)為0且預(yù)測值(target’)也為0;四是實(shí)際值為負(fù)例而預(yù)測值為正例(FP),即實(shí)際值(target)為0,預(yù)測值(target’)為1。
由表3可知,訓(xùn)練后的模型總精度(Accuracy)為97.19%,意味著模型訓(xùn)練結(jié)果有效且總體精度較高。由于本文的研究問題是家庭的托育需求,需要進(jìn)一步關(guān)注實(shí)際值(target)為1的預(yù)測精度。實(shí)際值(target)為1的預(yù)測精度越高,模型越能夠精準(zhǔn)地反映出家庭的托育需求水平。Recall、Precision與 F1是考察實(shí)際值(target)為1的預(yù)測精度的關(guān)鍵指標(biāo):Recall表示實(shí)際值(target)為1被正確預(yù)測的比重,經(jīng)過模型擬合,預(yù)測值(target’)為1占實(shí)際值(target)為1的比率為85.45%;Precision表示所有實(shí)際值(target)為1占預(yù)測值(target’)為1的比率為97.92%;F1是Recall與Precision的調(diào)和平均數(shù),具體的值為91.26%?;诖耍瑢柧碚{(diào)查的托育需求結(jié)果進(jìn)行修正,修正后的托育需求水平為12.44%(2)托育需求水平為預(yù)測值(target’)為1的樣本占總樣本的比率。。
表3 訓(xùn)練后的模型精度
為進(jìn)一步檢驗(yàn)?zāi)P偷挠行?,本文選取較為常見的隨機(jī)森林模型(Random Forest)、LightGBM、CatBoost、XGBoost與深度神經(jīng)網(wǎng)絡(luò)(Deep Neutral Networks)5個機(jī)器學(xué)習(xí)算法再次進(jìn)行模型訓(xùn)練,得出的精度評價結(jié)果見表4。首先,從總精度(Accuracy)來看,Deep Neutral Networks、Random Forest、CatBoost、XGBoost與LightGBM算法的精度依次為95.00%、94.06%、86.88%、86.56%、84.38%,均低于AutoGluon的訓(xùn)練結(jié)果。其次,由于本研究更關(guān)注實(shí)際值(target)為1的評價精度,所以需進(jìn)一步考察Recall、Precision、F1的評價結(jié)果。不難看出,除Precision的評價精度外,CatBoost、XGBoost與LightGBM算法的Recall與F1的評價精度均較低,模型的可解釋力很弱。雖然隨機(jī)森林模型與深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練精度得到了很大的改進(jìn),處在可接受范圍內(nèi),但仍低于AutoGluon的訓(xùn)練精度。由此可知,AutoGluon的預(yù)測精度顯著高于其他幾個算法、模型解釋力更強(qiáng)。
表4 不同機(jī)器學(xué)習(xí)算法的精度評價結(jié)果 單位:%
母親的年齡、月收入水平、對托育服務(wù)促進(jìn)早期人力資本積累功能的認(rèn)可度、父親受教育程度與對托育服務(wù)平衡工作與生活功能的認(rèn)可度,是托育需求最重要的5個影響因素。為進(jìn)一步考察這5個特征值與托育需求之間的復(fù)雜關(guān)系,本研究引入部分依賴圖(Partial Dependence Plot,PDP)與SHAP值,分別可視化機(jī)器學(xué)習(xí)算法學(xué)習(xí)到的規(guī)律,以確保分析結(jié)果的準(zhǔn)確性。部分依賴圖(PDP)展示的是目標(biāo)函數(shù)和一組特征值之間的依賴關(guān)系,可以考察特征值與目標(biāo)值之間的線性與非線性關(guān)系[38]。SHAP值屬于模型事后解釋的方法,主要用來展示計(jì)算特征值對模型輸出的邊際貢獻(xiàn),側(cè)重于考察異質(zhì)效應(yīng)[39],其核心思想源于諾貝爾經(jīng)濟(jì)學(xué)獎獲得者羅伊德·沙普利(Lloyd S.Shapley)在合作博弈論中提到的Shapley值及其相關(guān)的擴(kuò)展[40]。由于母親月收入水平與受教育程度是衡量母親社會經(jīng)濟(jì)地位最重要的指標(biāo)[41],本文將不再單獨(dú)討論這兩個因素對目標(biāo)值的影響,而是考察兩個特征值在任意組合上的結(jié)果對托育需求的影響。此外,考慮到父親受教育程度與母親受教育程度對托育需求的影響具有高度相似性,為節(jié)省篇幅,這里不再單獨(dú)討論父親受教育程度對托育需求的影響。
1.母親的年齡與托育需求
圖1展示的是母親的年齡與托育需求之間的關(guān)系。從趨勢上看,隨著母親年齡的增長,家庭的托育需求水平呈現(xiàn)先降低后提高的趨勢。具體地,由圖1(a)可知:當(dāng)母親年齡小于32歲時,年齡對托育需求的邊際貢獻(xiàn)為負(fù)(SHAP值<0),年齡與托育需求負(fù)相關(guān);當(dāng)母親年齡在33~46歲時,年齡對托育需求的邊際貢獻(xiàn)值為正(SHAP值>0),且上升趨勢明顯,年齡與托育需求正相關(guān)。結(jié)合圖1(b)進(jìn)行檢驗(yàn),折線表示總體趨勢,陰影部分為95%的置信區(qū)間:當(dāng)母親年齡在20~29歲時,隨著母親年齡的增加,家庭的托育需求逐漸下降;當(dāng)母親年齡在29~32歲時,雖然托育需求逐漸上升,但是托育意愿仍呈抑制狀態(tài)(PDP值<0);而當(dāng)母親的年齡大于32歲時,托育需求顯著提高,家庭展現(xiàn)出十分旺盛的托育需求(PDP值>0)。PDP與SHAP值的可視化結(jié)果基本一致,驗(yàn)證了母親年齡對托育需求的復(fù)雜影響。進(jìn)一步地,本文嘗試解釋母親年齡對托育需求產(chǎn)生上述復(fù)雜影響的原因。2017年全國生育狀況抽樣調(diào)查顯示,2017年我國平均初育年齡上升至27.3歲,較2006年推遲了3歲[42]。依照此趨勢,我國現(xiàn)階段平均初育年齡應(yīng)約為29歲。由此,基本可以推斷,一孩家庭的托育需求相對較低。從情感出發(fā),母親更傾向于選擇自己照顧第一個孩子,并且一孩家庭也更有可能從親屬網(wǎng)絡(luò)獲取育兒支持。隨著母親年齡的增長,母親可能會面臨“上有老,下有小”的雙重照顧壓力,在這種情況下,托育需求顯著提高。
圖1 母親年齡對托育需求的影響
2.對托育服務(wù)功能的認(rèn)可度與托育需求
從人力資本視角出發(fā),托育服務(wù)被視為對早期人力資本的投資,即促進(jìn)早期人力資本積累是托育服務(wù)的主要功能之一。如圖2(a)所示,當(dāng)家庭對托育服務(wù)促進(jìn)早期人力資本積累功能的認(rèn)可度為“非常不認(rèn)可=1”“不太認(rèn)可=2”時,該特征值對托育需求的邊際貢獻(xiàn)為負(fù)(SHAP值<0),此時,家庭的托育需求是極低的。而家庭對托育服務(wù)促進(jìn)早期人力資本積累功能的認(rèn)可度達(dá)到“認(rèn)可=4”“非常認(rèn)可=5”時,托育需求顯著提高(SHAP值>0)。結(jié)合圖2(b)進(jìn)行檢驗(yàn),不難發(fā)現(xiàn),家庭對托育服務(wù)的認(rèn)可度由2向3轉(zhuǎn)變時,托育需求逐漸提高。當(dāng)對托育服務(wù)的認(rèn)可度由3向4轉(zhuǎn)變時,家庭的托育需求陡增,并且增幅遠(yuǎn)高于由4向5的轉(zhuǎn)變階段。由此可知,家庭對托育服務(wù)促進(jìn)早期人力資本積累功能的認(rèn)可度,一旦從“消極”轉(zhuǎn)為“積極”時,家庭的托育需求就會顯著提高。
圖2 對托育服務(wù)促進(jìn)早期人力資本積累功能的認(rèn)可度與托育需求
托育服務(wù)的另一個重要功能是幫助女性平衡“工作—家庭”關(guān)系,根據(jù)上文基于全樣本得出的重要性排序結(jié)果可知,家庭對托育服務(wù)平衡工作與生活功能的認(rèn)可度也是影響目標(biāo)值的重要因素。圖3展示了這一特征值與托育需求之間復(fù)雜的非線性關(guān)系。由圖3(a)可知,只有當(dāng)家庭對托育服務(wù)平衡工作與生活功能的認(rèn)可度達(dá)到“非常認(rèn)可=5”時,特征值對托育需求的邊際貢獻(xiàn)才為正(SHAP值>0)。進(jìn)一步地,結(jié)合圖3(b)檢驗(yàn),家庭對托育服務(wù)的需求從“抑制狀態(tài)”(PDP值<0)轉(zhuǎn)變?yōu)椤胺e極尋求”(PDP值>0),發(fā)生在由4向5的轉(zhuǎn)變過程,即只有當(dāng)家庭完全認(rèn)可托育服務(wù)能夠發(fā)揮平衡工作與生活的功能時,家庭的托育需求水平才會顯著提高。
圖3 對托育服務(wù)平衡工作與生活功能的認(rèn)可度與托育需求
構(gòu)建以母親受教育程度與月收入水平為雙變量交互的PDP,不僅可以幫助我們分析母親社會經(jīng)濟(jì)地位對托育需求的影響,還可以借助它理解這兩個特征值的相互依賴關(guān)系。圖4為雙變量交互的PDP結(jié)果:從整體上看,隨著母親社會經(jīng)濟(jì)地位的提高,托育需求顯著提高。進(jìn)一步地,分析兩個特征的部分依賴關(guān)系。第一,當(dāng)母親月收入水平取值小于3(低于5000元/月)且受教育程度取值小于3(低于大專/本科)時,托育需求水平相對較低(PDP值<0.144)。一方面,母親受教育程度不高,對早期人力資本投資的意識可能不強(qiáng)。另一方面,母親月收入水平相對較低,難以負(fù)擔(dān)托育費(fèi)用,且即使母親因養(yǎng)育子女而中斷就業(yè),在職業(yè)領(lǐng)域遭受到的收入懲罰也相對較低。第二,母親受教育程度較高且月收入水平較低時,家庭對托育服務(wù)的需求被抑制。當(dāng)母親受教育程度取值大于3且母親月收入水平取值小于3時,家庭的托育需求會有所提高(0.144 圖4 雙變量交互對托育需求的影響 對上述結(jié)果可能的解釋是,從新家庭經(jīng)濟(jì)學(xué)出發(fā),女性在職業(yè)角色和照顧者角色之間存在普遍的不兼容性,這種不兼容性導(dǎo)致了養(yǎng)育幼兒的機(jī)會成本產(chǎn)生,即照顧幼兒會使女性減少工作、職業(yè)發(fā)展受影響甚至中斷就業(yè),進(jìn)而導(dǎo)致女性收入減少。已有研究顯示,在我國,生育二孩的女性,其就業(yè)概率約下降9.3%[43],且每多生一個孩子,女性的小時工資率降幅約為13%[44]。因此,母親的收入水平越高,因照顧子女產(chǎn)生的機(jī)會成本也越高。當(dāng)母親為照顧幼兒所放棄的潛在工作時間帶來的經(jīng)濟(jì)收益高于不放棄這份工作去購買專業(yè)化服務(wù)所需的照顧費(fèi)用時,托育需求隨之提高。換而言之,當(dāng)母親的收入水平較高時,更有能力通過購買專業(yè)化的托育服務(wù)將照顧幼兒的“機(jī)會成本”轉(zhuǎn)化為向市場支付的“直接成本”,即母親因照顧幼兒產(chǎn)生的機(jī)會成本是影響家庭托育需求的關(guān)鍵因素之一。 重要性在前十位的特征值依次為:母親年齡與月收入水平、對托育服務(wù)促進(jìn)早期人力資本積累功能的認(rèn)可度、父親受教育水平、對托育服務(wù)平衡工作與生活功能的認(rèn)可度、隔代照顧、家庭對科學(xué)育兒知識的了解程度、父親月收入水平、母親受教育程度及孩子數(shù)量。對特征值進(jìn)行合并,可知,母親的年齡與機(jī)會成本(母親月收入水平)、家庭對托育服務(wù)功能的認(rèn)可度(對托育服務(wù)促進(jìn)早期人力資本積累功能的認(rèn)可度、對托育服務(wù)平衡工作與生活功能的認(rèn)可度)、隔代照顧、孩子的數(shù)量是托育需求的重要影響因素。 據(jù)此,本文嘗試構(gòu)建嬰幼兒照顧方式的決策過程。如圖5所示,嬰幼兒照顧方式的決策邏輯,應(yīng)是一個復(fù)雜的“階梯式”進(jìn)程。即存在不同層級的決策階段,每一個決策階段的互動主體相對平等。 首先,在決策的第一層級中,母親的機(jī)會成本是關(guān)鍵因素。當(dāng)母親的機(jī)會成本處于較低水平時,母親基本能夠承擔(dān)照顧職責(zé)(此時也可能存在隔代照顧);而當(dāng)母親的機(jī)會成本較高時,則會尋求隔代照顧或者托育服務(wù)。 其次,進(jìn)入到?jīng)Q策的第二層級,即多方照顧主體的互動。中青年父母選擇照顧主體時,衡量的是人力資本投資、安全、成本、信任度等問題,這類考量體現(xiàn)在他們與兩類替代性照顧主體的互動過程中。一是體現(xiàn)在中青年父母與祖輩之間的互動中。隔代照顧受到多種因素的影響,如代際關(guān)系、祖輩的健康、受教育水平、價值觀念等,基本上可以從動機(jī)(照顧的意愿)與能力(提供照顧的可行性)兩個維度歸納。并且,由于代際關(guān)系的復(fù)雜性,學(xué)者從代際交換論、文化形塑論與團(tuán)結(jié)論等不同角度去理論隔代照顧的形成,從而祖輩既是“代際剝削的受害者”、又是“尋求團(tuán)結(jié)的主動者”[45]。研究并不關(guān)注祖輩在代際關(guān)系中的位置,而是將協(xié)商機(jī)制引入到?jīng)Q策中,并認(rèn)為隔代照顧是否執(zhí)行是兩代人在分別評估祖輩動機(jī)與能力兩個維度的特征后,在情感之上反復(fù)溝通和權(quán)衡利弊的結(jié)果。二是體現(xiàn)在中青年父母與托育服務(wù)供給者之間的互動中。雙方之間的互動過程表現(xiàn)為“買方”與“賣方”之間的提出訴求與回應(yīng)訴求:“買方”向“賣方”表達(dá)托育需求,并衡量與考察購買服務(wù)的成本、服務(wù)的安全與質(zhì)量等;“賣方”通過對設(shè)備、環(huán)境、師資隊(duì)伍等的建設(shè)與宣傳來回應(yīng)“買方”的需求。三是不排除有些家庭存在“強(qiáng)勢”祖輩的情況。擁有足夠資源(尤其是經(jīng)濟(jì)資源)的祖輩在一定程度上能夠替代父母親做決策,可能會出現(xiàn)托育服務(wù)供給者與祖輩之間的直接互動。若祖輩對托育持強(qiáng)烈反對、不信任等態(tài)度,雙方也可能會出現(xiàn)互動。 最后,進(jìn)入到第三層級,即決策輸出。 注:“+”代表母親的機(jī)會成本高,祖輩提供隔代照顧的動機(jī)強(qiáng)度、能力水平高;“-”代表母親的機(jī)會成本低,祖輩提供隔代照顧的動機(jī)強(qiáng)度、能力水平低。圖5 嬰幼兒照顧方式的決策過程 為測度家庭的托育需求水平并綜合考察托育需求的影響因素,本文基于機(jī)器學(xué)習(xí)算法(AutoGluon)對徐州市1601個家庭的調(diào)查數(shù)據(jù)進(jìn)行了實(shí)證檢驗(yàn),得出訓(xùn)練后的模型總精度(Accuracy)為97.19%,證明模型訓(xùn)練結(jié)果有效。研究結(jié)果顯示:第一,修正后的托育需求水平為12.44%,每千人口所需的托位數(shù)約為4.8個(3)根據(jù)徐州市統(tǒng)計(jì)局?jǐn)?shù)據(jù),2018—2020年該市出生人口數(shù)分別為139514人、106644人、106644人,由此可知,該市3歲以下嬰幼兒數(shù)應(yīng)為352689人,則入托人數(shù)應(yīng)43875人(352689×12.44%=43875)。進(jìn)一步地,徐州市常住人口數(shù)為9083900人,則入托人數(shù)占總?cè)藬?shù)的比例為0.48%(43875/9083900=0.48%),即每千人口所需的托位數(shù)為4.8個。。結(jié)合“十四五”規(guī)劃中“2025年每千人口擁有3歲以下嬰幼兒托位數(shù)4.5個”的預(yù)期性指標(biāo)[46],基本可推斷,當(dāng)前我國普通地級市的一般托育需求水平較高,但服務(wù)供給總量嚴(yán)重不足。第二,家庭特征顯著影響托育需求,其中母親的年齡、月收入水平是影響托育需求的關(guān)鍵因素,父親受教育程度、隔代照顧次之。第三,家庭對托育服務(wù)的認(rèn)可度也顯著影響托育需求,托育服務(wù)越能夠發(fā)揮促進(jìn)早期人力資本積累、平衡工作與生活的功能,家庭的托育需求越高。第四,根據(jù)托育需求影響因素(特征值)的重要性排序,還可以構(gòu)建以母親的機(jī)會成本為邏輯起點(diǎn)的嬰幼兒照顧方式?jīng)Q策過程模型。其中,母親的機(jī)會成本(邏輯起點(diǎn))為決策的第一層級,多方照顧主體(中青年父母、祖輩與托育機(jī)構(gòu))相對平等地互動為決策的第二層級,決策輸出為第三層級。 第一,政策制訂應(yīng)在精準(zhǔn)、動態(tài)把握需求的基礎(chǔ)上,著力增強(qiáng)托育服務(wù)有效供給。每千人口4.8個托位數(shù)的需求已然較高,而由模型訓(xùn)練得出的托育需求水平建立在當(dāng)下社會經(jīng)濟(jì)發(fā)展水平與托育服務(wù)發(fā)展水平之上,很難判定未來的托育需求是平穩(wěn)地“線性增長”還是會出現(xiàn)“指數(shù)級變化”。原因有兩方面:一方面,隨著我國托育服務(wù)事業(yè)的穩(wěn)步發(fā)展,家庭可能會逐步提高對托育服務(wù)的認(rèn)可度、信任度和可負(fù)擔(dān)能力;另一方面,隨著家庭政策支持體系的不斷完善,家庭照顧負(fù)擔(dān)和養(yǎng)育子女成本會逐步降低,進(jìn)而會生育率產(chǎn)生積極影響,客觀上這也會提升托育需求。并且,每千人口4.8個托位數(shù)在一定程度上僅能代表當(dāng)前我國普通地級市的一般托育需求水平,超大城市與大城市的需求水平應(yīng)該顯著高于該指標(biāo)。因此,地方政府在統(tǒng)籌規(guī)劃托育服務(wù)供給時,需警惕“唯指標(biāo)論”,應(yīng)通過階段性地調(diào)查及時掌握當(dāng)?shù)氐募彝バ枨螅源舜俪赏杏?wù)的供需匹配。 第二,既應(yīng)明確政府責(zé)任,又應(yīng)充分調(diào)動社會力量參與服務(wù)供給,以提高托育服務(wù)的供給總量。發(fā)展托育服務(wù),不僅是促進(jìn)我國人口長期均衡發(fā)展的重要舉措,也與改善家庭福利、促進(jìn)早期人力資本積累、平衡工作與生活的關(guān)系等多元目標(biāo)相關(guān)。由于現(xiàn)代社會中“兒童”更多地具備了公共產(chǎn)品的屬性,以及投資于兒童具有正外部效應(yīng),因而政府投資托育服務(wù)也具有合理性和必要性。但從政府財(cái)政能力來看,完全由政府為我國近4000萬3歲以下嬰幼兒提供普惠性托育服務(wù)幾乎是不可能實(shí)現(xiàn)的。以2020年學(xué)前教育生均經(jīng)費(fèi)12954元(占國家財(cái)政教育經(jīng)費(fèi)7.9%)來預(yù)估[47],政府至少需投入5181.6億元,若以義務(wù)教育階段生均教育經(jīng)費(fèi)支出來計(jì)算,則該投入需擴(kuò)大近6倍。鑒于我國公共托育資源投入不足的客觀現(xiàn)實(shí),必須在適度擴(kuò)大供給財(cái)政投入的同時,完善土地、財(cái)稅、金融等支持政策。一方面,可以通過公辦民營、公助民營等方式提高公共托育服務(wù)供給總量,為確實(shí)有照顧困難與經(jīng)濟(jì)困難的家庭提供福利性托育服務(wù)。另一方面,也可以通過財(cái)政補(bǔ)貼、稅收減免等一系列措施,充分調(diào)動企事業(yè)單位、社會組織、社會成員參與托育服務(wù)供給的積極性。 第三,強(qiáng)化人才隊(duì)伍建設(shè),并引入激勵機(jī)制,以提高托育服務(wù)供給質(zhì)量。在提高托育服務(wù)供給總量的同時,還要關(guān)注托育服務(wù)的高質(zhì)量發(fā)展,使托育服務(wù)能夠很好地適應(yīng)公眾日益增長的多層次、多樣化的需求。當(dāng)前,托育服務(wù)從業(yè)者的收入水平與社會地位仍然較低,松散的雇傭關(guān)系導(dǎo)致了從業(yè)者的社會保障和職業(yè)福利碎片化,不利于托育人才的培養(yǎng)、選拔與留任。為此,一方面,可以考慮將嬰幼兒照護(hù)服務(wù)相關(guān)專業(yè)設(shè)置為緊急學(xué)科開展定向師范生培養(yǎng),并通過發(fā)放艱苦補(bǔ)助金(hardship allowance)或延長學(xué)生的無息還貸期限,吸納更多的人才選擇相關(guān)專業(yè)[48]。另一方面,借鑒國外的“快車項(xiàng)目”(fast-track programs)[49],引入競爭機(jī)制,由政府來招聘和保留最有能力的畢業(yè)生,縮小托育專職教師與其他教育階段老師(幼兒園、小學(xué)等)的薪資差距,并為其提供額外的培訓(xùn)、職業(yè)支持等。(三)嬰幼兒照顧方式的決策邏輯
六、研究結(jié)論與政策建議
(一)主要結(jié)論
(二)政策建議