国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

農(nóng)民工為什么沉默?

2017-06-07 00:00劉林平畢先進(jìn)劉昱君
社會科學(xué) 2017年4期
關(guān)鍵詞:問卷調(diào)查農(nóng)民工

劉林平 畢先進(jìn) 劉昱君

摘 要:缺失值(項(xiàng)目無回答)現(xiàn)象是問卷調(diào)查中的“元問題”,不只涉及問卷設(shè)計(jì)、數(shù)據(jù)收集方式、訪員素質(zhì)等因素,還有更為深刻的社會原因。通過分析2010年珠三角和長三角19城市進(jìn)行的一次大型問卷調(diào)查所得數(shù)據(jù),我們發(fā)現(xiàn),與西方研究者認(rèn)為經(jīng)濟(jì)社會地位較低的被訪者具有較高的項(xiàng)目無回答率相反,在農(nóng)民工群體中,顯得更為弱勢的女性、有宗教信仰者、藍(lán)領(lǐng)、精神健康狀態(tài)不佳人群和朋友數(shù)量較少者更能配合問卷調(diào)查。但遭受過權(quán)益侵害的人則可能保持沉默,有較高的缺失值。問卷調(diào)查不是簡單的信息收集過程,還是涉及被訪者回答能力、態(tài)度的社會互動過程。問卷回答者的沉默是社會生活中沉默的自然表現(xiàn),具有深刻的涵義。如果將問卷調(diào)查看作一種社會關(guān)懷的形式,我們認(rèn)為,農(nóng)民工群體中弱勢但不對社會絕望的人,更希望社會了解他們,更需要關(guān)懷。

關(guān)鍵詞:缺失值;項(xiàng)目無回答;農(nóng)民工;問卷調(diào)查

中圖分類號: C912 文獻(xiàn)標(biāo)識碼:A 文章編號:0257-5833(2017)04-0064-13

作者簡介:劉林平,南京大學(xué)社會學(xué)院教授、博士生導(dǎo)師;畢先進(jìn),泰山學(xué)院管理學(xué)院講師,博士;劉昱君,香港大學(xué)社會工作與社會行政學(xué)系博士候選人(江蘇 南京 210023)

2016年美國大選以共和黨候選人唐納德·特朗普的獲勝告終,這使得世界范圍里的社會公眾大為震驚,因?yàn)榇饲暗拇蠖鄶?shù)民意調(diào)查預(yù)測的結(jié)果與之恰恰相反。這些科學(xué)的民意調(diào)查為何失靈呢?根據(jù)分析,其中一個原因是特朗普的支持者在民意調(diào)查時保持了沉默,造成了缺失值,從而形成了系統(tǒng)性偏差。由此可見,在社會科學(xué)研究尤其是定量研究中被不少研究者忽視的缺失值問題,其實(shí)非常重要,它既是一個技術(shù)性問題,也可能是一個社會性問題,在特殊條件下,它甚至可能成為一個非常重要的社會問題。

問卷質(zhì)量對于問卷調(diào)查的成功與否至關(guān)重要。評估問卷質(zhì)量的一個重要指標(biāo)是問卷中缺失值的多少。缺失值又被稱作項(xiàng)目無回答(item nonresponse),即“調(diào)查中的部分問題被拒答或無回答,而不能編碼。通常,這種類型的缺失數(shù)據(jù)使得調(diào)查中的總體回答率相對降低”。1缺失值使得問卷收集的信息量減少或受損,過多的缺失值,尤其是在關(guān)鍵變量上的缺失使得問卷的一些變量無效或作廢。在數(shù)據(jù)的缺失不是隨機(jī)缺失(missing at random, MAR)的條件下,這樣的數(shù)據(jù)用作估計(jì)時就會產(chǎn)生選擇性偏誤(selectivity bias)。因而,對問卷缺失值進(jìn)行研究非常有必要。

對缺失值問題進(jìn)行的研究有兩種取向:統(tǒng)計(jì)學(xué)取向和社會學(xué)取向。前者往往將問卷缺失值的產(chǎn)生歸之于問卷設(shè)計(jì)、數(shù)據(jù)收集方式、訪問員素質(zhì)和工作責(zé)任心等因素,認(rèn)為缺失值的出現(xiàn)是一種“錯誤”或“缺陷”,質(zhì)量好的問卷應(yīng)該將缺失值降至最低,甚至沒有。統(tǒng)計(jì)學(xué)還將怎樣對缺失值進(jìn)行修補(bǔ)作為其工作重點(diǎn)1。從社會學(xué)的視角來看,問卷缺失值的產(chǎn)生就不僅僅是技術(shù)失誤問題,而是有更深刻的社會原因,缺失值可能體現(xiàn)了社會結(jié)構(gòu)、社會條件和社會生活的某些特征。如有的研究指出:對弱勢群體的調(diào)查可能會導(dǎo)致更高的缺失值。本文重點(diǎn)從社會學(xué)取向來研究缺失值,從農(nóng)民工自身的社會特征,以及調(diào)查員和農(nóng)民工的互動來探討缺失值產(chǎn)生的社會原因。對農(nóng)民工來說,是什么使得他們面對問卷調(diào)查時不愿說、不能說、不會說、不知道怎么說,從而形成缺失值,是需要我們?nèi)ヌ接懙摹?/p>

一、文獻(xiàn)回顧

在問卷調(diào)查中,被調(diào)查者無回答的情況可以分為兩種:單位無回答(unit nonresponse)和項(xiàng)目無回答。單位無回答是指,接受調(diào)查的一個完整的分析單位的數(shù)據(jù)對于統(tǒng)計(jì)分析來說是不可用的。出現(xiàn)這種情況的原因可能是,一個單位不能被聯(lián)系到,或者其拒絕合作。所謂“單位”指的是應(yīng)用于抽樣、數(shù)據(jù)采集或分析的單位2。項(xiàng)目無回答則是特定項(xiàng)目(如某些問題或變量)的數(shù)據(jù)不可用于分析,但整個單位還是可以的?!安豢捎谩边@個詞是對目標(biāo)而言的,答案是否算作缺失取決于研究的特定目標(biāo)。例如,“不知道”對于選舉投票的傾向來說是有意義的回答,但對于收入來說并沒有報(bào)告的意義,因而被算作缺失。所以,一般而言,項(xiàng)目無回答在調(diào)查或問卷中對于獲得信息來說是失敗的,即數(shù)據(jù)缺失3。

項(xiàng)目無回答有四種潛在的來源:問卷、數(shù)據(jù)收集方式、被訪者和訪問員。這四種來源之間也相互作用4。問卷本身的設(shè)計(jì)、布局5,以及問卷設(shè)定的回答項(xiàng)“不知道”的內(nèi)涵6等會導(dǎo)致項(xiàng)目無回答的產(chǎn)生。就問卷題目類型來說,涉及個人或敏感問題、需要回憶的問題,或?qū)τ诓恢赖膯栴},項(xiàng)目無回答率較高7。Donald發(fā)現(xiàn),在郵寄調(diào)查中,被調(diào)查者對目前行為的問題比態(tài)度問題的項(xiàng)目無回答率低8。Ferber在消費(fèi)者調(diào)查中發(fā)現(xiàn),在需要思考或努力回憶的問題中,項(xiàng)目無回答率較高9。Craig和McCann在對郵寄式問卷的研究發(fā)現(xiàn),一般來說,問卷中3-8%的項(xiàng)目被留空?!绊?xiàng)目無回答”現(xiàn)象與問卷長度無關(guān)。與其他類型的問題相比,AIO (activity-interest-opinion,即行為-興趣-意見)式問題的回答遺漏情況更少10。Messmer和Seymour發(fā)現(xiàn),分支型問題無回答率顯著高于其它問題11。Emil Kupek對1990年至1991年進(jìn)行的英國國民性態(tài)度和生活方式的調(diào)查研究發(fā)現(xiàn),對于大多數(shù)被調(diào)查者而言,關(guān)鍵的困難是回憶的準(zhǔn)確性而不是性問題的敏感性。對于少數(shù)(5%)被調(diào)查者而言,話題的敏感性對項(xiàng)目不回應(yīng)才有很大影響1。

搜集數(shù)據(jù)的方式同樣也很重要。三種主要的資料收集方式——自填式問卷、面對面訪問和電話訪問——都有其優(yōu)點(diǎn)和缺點(diǎn)。一般來說,自填式問卷適合于那些更有經(jīng)驗(yàn)和被人信任的被調(diào)查者,用以更加誠實(shí)地回答敏感性問題。當(dāng)題目敏感并看起來有威脅性時,使用自填式問卷會減少大量的缺失值2。計(jì)算機(jī)輔助的面訪問卷和自填問卷比紙筆問卷的項(xiàng)目無回答更少3。有研究認(rèn)為,電話調(diào)查比訪問調(diào)查更容易出現(xiàn)項(xiàng)目缺失數(shù)據(jù)4。但Rogers的研究結(jié)果表明,打電話與親自面訪獲得的數(shù)據(jù)質(zhì)量差不多。區(qū)別在于,面訪比電話訪問使被調(diào)查者更容易給出符合社會期望的答案,電話獲得的投票數(shù)據(jù)更加準(zhǔn)確,面訪獲得收入數(shù)據(jù)更加成功5。不過,面對面和電話訪問都比郵件訪問可能有更少的項(xiàng)目無回答6。

就調(diào)查員來說,訓(xùn)練有素和受嚴(yán)格監(jiān)督的調(diào)查員所得數(shù)據(jù)缺失值更少7。女訪問員比男訪問員能得到更高的回答率,可能因?yàn)榕暂^不易引起被訪者的懷疑,對部分被訪對象(如老人)來說,女性的威脅性也小。盡管許多人贊同這一說法,但仍然缺乏有力的證據(jù)表明回答率與訪員性別的關(guān)系8。Riphahn和 Serfling認(rèn)為,如果調(diào)查員為女性而被訪者也是女性的話,則項(xiàng)目無回答率較高。被訪者和調(diào)查員具有相同的職業(yè)地位或教育水平對項(xiàng)目無回答結(jié)果并沒有顯著影響9。Rogers發(fā)現(xiàn),那些不受個人情感影響的、“冷酷的”(以任務(wù)為導(dǎo)向)訪問員與那些容易受個人情感影響的、“熱情的”(以人為導(dǎo)向)訪問員相比,前者的項(xiàng)目無回答率更低。在面對面調(diào)查中,訪問員這種差異的影響比電話調(diào)查要大。此外,項(xiàng)目無回答還受調(diào)查員對調(diào)查問題態(tài)度的影響10。Sudman等人發(fā)現(xiàn),訪問員對于整個訪問偏差大概要承擔(dān)7%的責(zé)任,調(diào)查員認(rèn)為某個問題很難回答,可能就會出現(xiàn)較高的項(xiàng)目無回答率,而調(diào)查時充滿信心,無回答率就相對較低11。Bailar等指出,如果調(diào)查員認(rèn)為該問題是不恰當(dāng)?shù)拿舾行詥栴}(例如收入問題),在他的調(diào)查對象中,這個問題會有較高的項(xiàng)目無回答。他們提出,對調(diào)查員的偏見和誤差可以以無回應(yīng)率和非精確率作為衡量指標(biāo)12。

就被訪者來說,F(xiàn)erber在消費(fèi)者調(diào)查中研究了被調(diào)查者的特征對項(xiàng)目無回答的影響。他發(fā)現(xiàn)被調(diào)查者的社會經(jīng)濟(jì)特征(年齡、性別、職業(yè)和教育程度)是與項(xiàng)目無回答相關(guān)的重要因素。女性、年齡較大者、受教育程度和職業(yè)等級較低者的項(xiàng)目不回應(yīng)率較高1。Francis 和Busch認(rèn)為,“不知道”和“無意見”的回答都不是隨機(jī)現(xiàn)象。女性、非白人、低教育程度者、低收入者、具有低政治效能感的非參與回答者會有較高數(shù)量的“不知道”反應(yīng)2。Craig和McCann的研究指出,被訪者的年齡和教育程度是影響回答率的重要因素,而收入和職業(yè)對項(xiàng)目無回答沒有影響3。Messmer和Seymour發(fā)現(xiàn),年紀(jì)偏大的被訪者確實(shí)更容易出現(xiàn)漏答的情況,而教育和性別對無回答出現(xiàn)的概率沒有顯著影響4。但是,很多研究者認(rèn)為,年長者和教育程度較低者有較高的缺失值5。Colsher 和 Wallace研究了65歲及以上的成年人對問卷調(diào)查中的項(xiàng)目無回答問題后指出,面對面的問卷調(diào)查中被訪者的無反應(yīng)率隨項(xiàng)目的主題變化而變化,“不知道”的反應(yīng)比被拒絕的要常見得多,并且隨著被調(diào)查者年齡增加而增加,女性往往比男性更為常見,而且常常與較差的生理、認(rèn)知、心理功能相關(guān)。6John Chesnut對人口普查問卷缺失值的分析表明,被訪者是少數(shù)族裔、有租客的家庭,或是人口較多的大家庭使項(xiàng)目回答率降低,被訪者是一般家庭成員還是家庭主要成員也有較大影響7。Leigh 和 Martin認(rèn)為,在電話調(diào)查中,有經(jīng)驗(yàn)的、參與過調(diào)查的被訪者比沒有什么經(jīng)驗(yàn)、沒參與過調(diào)查的被訪者項(xiàng)目無回答率更低8。

西方研究者對項(xiàng)目無回答問題進(jìn)行了深入和細(xì)致的分析,一些結(jié)論比較明確和穩(wěn)定,但并沒有較為統(tǒng)一的標(biāo)準(zhǔn)答案,說明了該問題的復(fù)雜性。這可能是由于研究的問卷和調(diào)查方式各不相同,而這些因素又相互影響,所以形成錯綜復(fù)雜的結(jié)果。需要特別指出的是:很多研究者認(rèn)為,較低經(jīng)濟(jì)、社會地位的被訪者(如少數(shù)族裔、低收入者、低教育程度者、職業(yè)等級較低者等)具有較高的項(xiàng)目無回答。 問卷調(diào)查的過程并不只是一個簡單的信息收集,也是被調(diào)查者解除戒備、建立信任、回答問題的社會互動過程,不同的社會和文化可能有不同的社會互動過程。因而,中國問卷調(diào)查中缺失值的產(chǎn)生可能有不同于西方的影響變量和發(fā)生機(jī)制。

國內(nèi)學(xué)術(shù)界對問卷調(diào)查的無回答問題也有研究。統(tǒng)計(jì)學(xué)的研究者較多采用數(shù)理方法討論無回答所引起的誤差和補(bǔ)救方法,基本不涉及引起無回答現(xiàn)象的社會因素9。社會學(xué)的研究者較多討論問卷的回收率,從而間接涉及到單位無回答問題1,但這種討論并非直接研究單位無回答問題,而且討論也主要基于一般經(jīng)驗(yàn)而缺少細(xì)致、扎實(shí)的實(shí)證材料和統(tǒng)計(jì)模型分析。

孫妍等人研究跟蹤調(diào)查中的拒訪行為,他們分析了導(dǎo)致拒訪的受訪家戶和主事者的社會經(jīng)濟(jì)特征、參訪經(jīng)歷等影響因素,其研究比一般性討論問卷的回收率更為深入和細(xì)致2。

嚴(yán)潔用序列變量邏輯斯蒂回歸和穩(wěn)健回歸研究了受訪者特征和問卷題目信度對項(xiàng)目無回答的影響。她的研究發(fā)現(xiàn):首先,中國公眾對問卷題目無回答的根本影響因素是受訪者的回答能力,這主要表現(xiàn)為教育程度和年齡,無回答的發(fā)生比率隨著教育年限增加而降低,老年人相對于年齡較輕者更不愿意回答問題;第二,受訪者的城鄉(xiāng)和地域?qū)傩詫o回答也有顯著影響,農(nóng)業(yè)戶口比非農(nóng)業(yè)戶口,西部省份比東、中部省份的受訪者有更高的無回答率;第三,測量指標(biāo)的信度水平對無回答也有顯著影響3。但是,這篇文章對相關(guān)變量的處理情況交代不夠細(xì)致,使得我們對其模型及其結(jié)果難以評判。此外,嚴(yán)潔的研究完全忽視了調(diào)查員因素。當(dāng)然,這可能與她不是這些問卷的設(shè)計(jì)、組織和調(diào)查執(zhí)行者因而缺乏資料有關(guān)。

的確,國內(nèi)研究者對項(xiàng)目無回答問題少有研究,以至于嚴(yán)潔說:“迄今為止還幾乎沒有專門針對中國社會科學(xué)抽樣調(diào)查中的項(xiàng)目無回答的成因所做的實(shí)證研究?!钡?,其實(shí)在此之前,陳膺強(qiáng)、王建平和張立娟就對此進(jìn)行過研究。

陳膺強(qiáng)分析了1995年香港社會指標(biāo)調(diào)查(問卷E)的資料,發(fā)現(xiàn)部分問題的無回應(yīng)(包括拒絕作答或表示不知道者)接近20%甚或達(dá)到30%以上。就問卷問題而言,被調(diào)查者較少關(guān)注、想及或涉及隱私的問題無回應(yīng)率較高。女性、年齡較大或教育程度較低的被訪者有較高的無回應(yīng)率4。但是,陳膺強(qiáng)的結(jié)論主要建立在描述統(tǒng)計(jì)的基礎(chǔ)上,并沒有建立模型進(jìn)行深入分析。

王建平、張立娟將影響調(diào)查數(shù)據(jù)質(zhì)量的因素概括為四:問卷設(shè)計(jì)、調(diào)查員、被訪者自身特征和調(diào)查場景。他們使用“全國綜合社會調(diào)查”(2003年城市部分)的問卷為資料,以被訪者特征做為第一層次、調(diào)查員特征作為第二層次構(gòu)建了一個多層次泊松回歸模型,結(jié)果發(fā)現(xiàn):在被訪者層次,女性比男性、已婚者比單身者、在職工作者比離退休等未工作者,前者答題缺失值顯著少于后者;年齡越大答題缺失值越多,收入和受教育程度越高者缺失值越少;居住在單位社區(qū)、高級住宅區(qū)或普通商品房小區(qū)者比之老城區(qū)、移民社區(qū)、集鎮(zhèn)社區(qū)和農(nóng)村社區(qū)者缺失值更少;調(diào)查員上午12點(diǎn)以前入戶比晚上6點(diǎn)以后入戶缺失值少;在調(diào)查員層次,性別和調(diào)查員與被訪者年齡與性別的交互項(xiàng)都不顯著,從常數(shù)項(xiàng)和隨機(jī)效應(yīng)來看,調(diào)查員對于問卷質(zhì)量的影響是顯著的,但上述調(diào)查員變量卻不顯著,這主要是調(diào)查員信息太少所致5。

王建平和張立娟的研究思路非常清晰,所得結(jié)論也很有啟發(fā)性。但是他們的工作可能具有的問題或缺陷是:其一,他們對缺失值的統(tǒng)計(jì)并不是問卷的全部題器,而只挑選了165個普適題器,僅占問卷全部747個變量的22.1%。而以往研究告訴我們,缺失值更多地發(fā)生在后續(xù)(或分支)題上6,對后續(xù)題或其他沒有進(jìn)入統(tǒng)計(jì)的題器的忽視一定會帶來偏差;其二,在自變量上,一些重要變量可能遺漏,從而產(chǎn)生遺漏變量偏差。我們認(rèn)為,缺失值的多少,并不只是被訪者回答能力的問題,也是一個態(tài)度問題,這顯然和被訪者的社會經(jīng)濟(jì)地位相關(guān),也和他們的生活遭遇相關(guān);其三,他們模型中調(diào)查員的變量都不顯著,就如他們自己所說,顯然是缺乏調(diào)查員的基本資料所致。

二、抽樣與問卷

2010年7-8月,我們對珠三角和長三角19個城市1的外來工(農(nóng)民工)進(jìn)行了較大規(guī)模的問卷調(diào)查。本次調(diào)查對象是兩區(qū)域跨地域(縣、市、區(qū))流動的、大專學(xué)歷及以下的外來務(wù)工人員,共發(fā)放問卷4254份,回收有效問卷4152份,有效回收率為97.6%。

對于外來農(nóng)民工調(diào)查進(jìn)行抽樣的困難在于缺乏一個總體的抽樣框。這也是幾乎所有流動人口或邊緣人群的抽樣調(diào)查中曾經(jīng)遇到的問題2。為此,我們以城市外來人口的相對比例作為樣本分配根據(jù),將各省市政府部門公布的有關(guān)統(tǒng)計(jì)數(shù)據(jù)中性別、產(chǎn)業(yè)、地區(qū)分布作為參數(shù)進(jìn)行配額。具體而言,根據(jù)以上統(tǒng)計(jì)數(shù)據(jù),計(jì)算出19個城市的外來人口總數(shù),然后按照各城市占總體的比例分配樣本,再進(jìn)行微調(diào)——將低于100樣本的城市調(diào)至100,最終確定各城市樣本配額;在城市內(nèi)部,我們根據(jù)性別、產(chǎn)業(yè)和地區(qū)外來工的分布,進(jìn)一步制訂了配額表,每個城市的分配方法是一致的;而在企業(yè)樣本的數(shù)額分配上,我們規(guī)定:企業(yè)規(guī)模在30人以下的,只做一份;企業(yè)規(guī)模在30-299人之間的可做3份;規(guī)模在300人以上的,則可做5份,多份問卷須選擇不同性別、工種、年齡或來源地的外來工。

本次調(diào)查的訪問員由廣東、上海、江蘇和浙江的在讀本科生和研究生組成。在調(diào)查之前,對調(diào)查員進(jìn)行培訓(xùn),并組成調(diào)查小組,每一小組有一名督導(dǎo)員專職指導(dǎo)調(diào)查活動,檢查問卷質(zhì)量。調(diào)查根據(jù)配額信息與便利原則選擇被訪者,由調(diào)查員與被訪者一對一進(jìn)行面訪。在面訪過程中,要求調(diào)查員嚴(yán)格按照問卷的題目順序提問。在調(diào)查執(zhí)行過程中,課題組與各地訪問員之間每天匯總樣本信息,隨時調(diào)整,使之符合配額分布。

總之,這樣的抽樣方式是一種大樣本、多地點(diǎn)、多機(jī)構(gòu)合作的非概率抽樣方式。相關(guān)研究表明,只要樣本足夠大,并且根據(jù)已知的抽樣定額分配樣本,非概率抽樣也可以大大減少誤差3。而我們的抽樣方式有助于克服抽樣時的地理集中(geographic concentration)和隱藏的選擇偏見(hidden selection bias),從而可以提高樣本的代表性和推論統(tǒng)計(jì)的可靠性4。因此,我們的數(shù)據(jù)盡管并非是一個嚴(yán)格意義上的隨機(jī)樣本,但仍然具有相當(dāng)?shù)拇硇?。?dāng)然,它也不可避免地包含了非隨機(jī)抽樣的局限性。

由于問卷缺失值問題(項(xiàng)目無回答)屬于非抽樣誤差5,現(xiàn)有文獻(xiàn)基本無人提及由項(xiàng)目無回答所引起的誤差與抽樣有關(guān),因而,我們對本次調(diào)查的抽樣過程不做詳細(xì)介紹,相關(guān)情況參見我們已經(jīng)發(fā)表的論文6。

此外,本次調(diào)查所用問卷包含的全部變量為687個,調(diào)查平均耗時58.96分鐘。我們以此次問卷收集的數(shù)據(jù)為資料,對缺失值問題進(jìn)行研究。

三、缺失狀況

在我們的問卷中,缺失值分為兩類:其一,是對某一問題完全無反應(yīng)或沒有回答;其二,是回答“不知道”、“不清楚”。對于“不知道”、“不清楚”的回答,我們的處理原則是:如果問題涉及知識或態(tài)度,這樣的回答就是有效的。比如,問卷中詢問了對《勞動法》、《勞動合同法》的了解程度,如果回答“完全不知道”,也是有效的回答,不算作缺失值。如果問題是對自身最基本情況的了解,比如宗教信仰,回答“不清楚”的,就算作缺失值。

問卷缺失的情況可以分為兩種:其一,以變量為單位的缺失,也就是指每一個變量的缺失情況,在本次調(diào)查的4152份有效問卷中,有些變量是沒有缺失的,比如年齡、性別,有一些則有缺失;其二,以問卷為單位的缺失,指的是一份問卷共有多少個缺失值。這里的問卷缺失,不是前文所述的單位無回答,即并不是整份問卷的缺失,而是已經(jīng)回收的有效問卷中,以一份問卷為單位來計(jì)算的項(xiàng)目無回答。

(一)變量缺失

在全部687個變量中,完全沒有缺失的變量有43個(6.26%),缺失值超過30個的變量有161個(23.44%),超過100個的有54個(7.86%)。全部變量的缺失值的平均值為31.63(標(biāo)準(zhǔn)差71.10),眾數(shù)為2,中位數(shù)為9,最大值為628。

在我們問卷的問題中,有一些題是全部回答者都要回答的,可以稱之為必答題(238個);有一些題有選擇性,即跳答題(449個)。根據(jù)研究的需要,我們將這些題型分為三類進(jìn)行比較。由于跳答題的基數(shù)較難確定,我們只比較必答題。結(jié)果見表1:

表1 三類題型缺失值的比較

[題型(題量) 平均值 標(biāo)準(zhǔn)差 眾數(shù) 中位數(shù) 最小值 最大值 均值差 第一組 目前狀況(173) 35.27 65.96 2 13 0 487 -32.71** 回憶問題(65) 67.98 127.05 2 11 0 628 第二組 行為或事實(shí)(175) 47.34 97.49 2 14 0 628 11.83 態(tài)度(63) 35.51 52.63 2 11 0 279 第三組 自身情況或態(tài)度(159) 48.59 97.27 2 11 0 628 -86.63** 家庭或其他成員(9) 135.22 153.16 - 14 0 312 涉及朋友(3) 17.33 6.35 21 21 10 21 13.94 涉及企業(yè)(52) 20.60 17.29 4、11 15 2 77 涉及社區(qū)(6) 34.67 56.92 0 18 0 149 涉及社會(11) 23.55 25.69 9、11 11 5 82 ]

注:均值差采用T檢驗(yàn),*** p<0.01, ** p<0.05。第三組均值差依次為“自身情況或態(tài)度”與“家庭或其他成員”之差、“自身情況或態(tài)度”與其他組加總之差。

從表1可見,回憶型問題的缺失值顯著高于關(guān)于目前狀況的問題,而行為或事實(shí)的問題與態(tài)度問題并無顯著性差異。在第三組中,我們按照費(fèi)孝通差序格局的說法1,將問卷問題分為從自己到社會的六個等級,顯然,涉及家庭情況的問題缺失值最高。進(jìn)一步的交互分析則表明,對家庭情況的缺失值集中在未婚和26歲及以下者。

在241個必答變量(或問題)中,有29個變量的缺失值超過100個,相關(guān)情況見表2:

表2 超過100個的缺失值題型情況

[題型 題量 平均缺失值 平均缺失值差 第一組 目前狀況 16 196.94 -88.21* 回憶問題 13 285.15 第二組 行為或事實(shí) 20 277.70 132.81** 態(tài)度 9 144.89 第三組 自身情況或態(tài)度 24 203.21 -36.39 家庭或其他成員 4 296 涉及朋友 0 - 涉及企業(yè) 0 - 涉及社區(qū) 1 149 涉及社會 0 - ]

注:均值差采用T檢驗(yàn),** p<0.05,*p<0.1;第三組平均缺失值差為自身情況或態(tài)度與其他組加總之差。

在表2中,目前狀況與回憶型問題的缺失值還是存在顯著差異,行為或事實(shí)的問題與態(tài)度問題也有顯著差異,而第三組分類則無顯著差異。

由此,我們的結(jié)論是:在農(nóng)民工問卷調(diào)查中,回憶型問題的缺失值與不需要回憶的問題(目前狀況)有顯著不同,回憶型問題缺失值更高。一般來看,行為或事實(shí)的問題與態(tài)度問題并無顯著性差異,但在超過100個缺失值的問題中,行為或事實(shí)問題的缺失值顯著高于態(tài)度問題。這一結(jié)論與Donald1的發(fā)現(xiàn)恰好相反。不過,他研究的是郵寄式問卷,而我們的問卷是面對面的訪問;農(nóng)民工中的未婚者和26歲以下者對家庭情況不太了解,在從自身到社會的分組中,缺失值最高。

(二)問卷缺失

表3描述了以整份問卷為單位的缺失情況:

表3 問卷缺失的一般情況

[ 平均值 標(biāo)準(zhǔn)差 眾數(shù) 中位數(shù) 最小值 最大值 缺失

數(shù)量 空缺 4.94 5.54 1 3 0 53 不知道或不清楚 0.41 0.80 0 0 0 8 總計(jì) 5.35 5.64 1 4 0 53 缺失

比例(%) 空缺 1.54 1.71 0 1.00 0 15.27 不知道或不清楚 0.13 0.26 0 0 0 2.52 總計(jì) 1.67 1.75 0 1.19 0 15.27 ]

從上表中可以看出,在4152份問卷中,缺失值最多的有53個,占全部應(yīng)答題量的15.27%;平均每份問卷有缺失值5.35個,平均缺失比例為1.67%。

在全部問卷中,沒有缺失值的問卷有440份,占10.6%,有缺失值的問卷為3712份,占89.4%。隨著缺失值數(shù)量的增加,問卷數(shù)量減少,形成一個明顯的偏態(tài)分布,其中缺失值在1-5個之間的約占55%,6-10個缺失值的問卷約占21%,10個以上缺失值的問卷約占13%。

四、影響因素

為了分析導(dǎo)致缺失值的影響因素,我們以被訪者和調(diào)查員的主要特征為自變量,建立多層的Poisson回歸模型。模型自變量的基本情況見下表:

表4 模型自變量描述(N=3761)

[變量 均值(標(biāo)準(zhǔn)差) 百分比 變量 均值(標(biāo)準(zhǔn)差) 百分比 被訪者特征 權(quán)益侵害情況 性別 無 94.20 男性 54.19 有 5.80 女性 45.81 朋友數(shù)量(位) 6.23(7.82) 年齡 30.45(9.50) 月均收入(元) 1995.65(1144.40) 受教育程度 地區(qū) 初中及以下 59.32 珠三角 48.74 高中 17.02 長三角 51.26 中專、技校 12.71 性別比對 大專及以上 10.95 同性訪問 52.01 有無配偶 異性訪問 47.99 無配偶 41.66 精神健康狀況 有配偶 58.34 低危人群 66.45 宗教信仰 中危人群 19.06 無宗教信仰 83.44 高危人群 14.49 有宗教信仰 16.56 調(diào)查員層次 職業(yè) 性別 藍(lán)領(lǐng)工人 88.70 男性 35.39 白領(lǐng)工人 11.30 女性 64.61 居住類型 專業(yè) 無私人空間 39.64 理工醫(yī)學(xué)類 9.28 有私人空間 60.36 社會學(xué)類 58.04 問卷時間(分鐘) 58.93(27.97) 其他文科 32.68 所做問卷份數(shù) 17.23(9.98) ]

在表4的自變量中,我們在被訪者層次加入了“宗教信仰”、“權(quán)益侵害”、“朋友數(shù)量”和“精神健康”等變量。被訪者接受訪問、提供答案的過程,是一個社會性的互動過程:被訪者提供答案是否完全,既涉及被訪者的能力,更涉及他們的態(tài)度。人們有宗教信仰可能促使他們更為誠實(shí)、坦率和耐心地回答問題。朋友數(shù)量的多少,表現(xiàn)出人們交往圈子的大小,朋友數(shù)量越多的人,應(yīng)該更具有開放性,更能坦率地回答問題,但也可能不太耐心和細(xì)致;反過來說,朋友較少者社會關(guān)系較為缺乏,可能更需要關(guān)懷。農(nóng)民工是一個特殊的群體,他們在工作和生活中較易遭受權(quán)益侵害,權(quán)益侵害對他們接受訪問、回答問題究竟有什么樣的影響呢:是使他們沉默寡言,還是令他們更有傾訴的欲望?這是需要檢驗(yàn)的假設(shè)。2010年上半年,深圳“富士康17起自殺事件”爆發(fā)之后,我們在問卷調(diào)查中加入了對農(nóng)民工進(jìn)行精神健康測量的量表,根據(jù)量表結(jié)果,將農(nóng)民工的精神健康狀態(tài)分為低危、中危和高危人群1。接受問卷調(diào)查當(dāng)然也是一個心理反應(yīng)過程,那么,農(nóng)民工的精神健康狀態(tài)對問卷調(diào)查質(zhì)量有什么樣的影響呢?這也是我們想考察的問題。

在調(diào)查員層次,我們將調(diào)查員的專業(yè)加入,不同的專業(yè)受到不同的訓(xùn)練,學(xué)風(fēng)和要求也可能不一樣,應(yīng)該是評估調(diào)查員的重要變量。模型結(jié)果見表5:

表5 兩層泊松回歸模型結(jié)果

[變量 系數(shù) 標(biāo)準(zhǔn)誤 被訪者特征(第一層次) 性別(以男性為參照) -0.042** 0.017 年齡 0.013*** 0.001 受教育程度(以初中及以下為參照) 高中 -0.092*** 0.022 中專、技校 0.091** 0.025 大專及以上 -0.044 0.029 有無配偶(以無為參照) -0.075*** 0.022 宗教信仰(以無信仰為參照) -0.082*** 0.022 職業(yè)(以藍(lán)領(lǐng)為參照) 0.051** 0.026 居住類型(以無私人空間為參照) -0.010 0.017 問卷花費(fèi)時間/15 -0.003 0.004 有無受到權(quán)益侵害(以無為參照) 0.126*** 0.032 朋友數(shù)量/10 0.048*** 0.010 月均收入/1000 -0.010 0.008 地區(qū)(以珠三角為參照) 0.142 0.088 性別比對(以同性訪問為參照) 0.013 0.016 精神健康狀況(以低危人群為參照) 中危人群 -0.083*** 0.021 高危人群 -0.113*** 0.025 調(diào)查員層次(第二層次) 性別(以男性為參照) -0.107 0.069 專業(yè)(以理工醫(yī)學(xué)類為參照) 社會學(xué)、社會工作 0.283** 0.121 其他文科 0.229* 0.119 所做問卷數(shù)/5 -0.052** 0.021 常數(shù)項(xiàng) 1.262*** 0.124 Inalpha -1.185*** 0.084 第一層次樣本數(shù) 3761 第二層次樣本數(shù) 305 ]

注:*** p<0.01, ** p<0.05,* p<0.1。

通過對表5回歸結(jié)果的分析,我們發(fā)現(xiàn):

1.被訪者的性別、年齡、婚姻狀況(或有無配偶)對問卷缺失值有顯著影響:女性比男性有更少的缺失值;年齡越大,缺失值越多;有配偶者比無配偶者缺失值更少。這三個變量的作用與王建平、張立娟的回歸結(jié)果基本一致,只是系數(shù)大小有差異。這個結(jié)果中關(guān)于年齡的影響與Ferber、Francis等人的研究結(jié)論基本一致,但關(guān)于性別的影響則正好相反。

2.被訪者的教育程度對缺失值的作用不是線性的:相較于初中及以下教育程度者,高中可以顯著減少缺失值,而中專、技校者則又顯著增加缺失值,大專以上則在0.1的顯著性水平上可以顯著減少缺失值。為什么中專、技校的作用是這樣的呢?我們在訪談材料中發(fā)現(xiàn),一般來說,上中專、技校的人,可能是初中成績不太好,或者家庭經(jīng)濟(jì)條件不好,沒有考大學(xué)的可能和打算,而想學(xué)點(diǎn)技能早點(diǎn)工作。中專、技校的教育可能會增加受教育者的工作技能,但不一定會增加人文和社會知識,從而可能使他們欠缺回答問卷調(diào)查問題的能力。

3.和藍(lán)領(lǐng)相比,白領(lǐng)人員的缺失值顯著增多,可能說明白領(lǐng)人士對問卷調(diào)查更沒有耐心,或者說,藍(lán)領(lǐng)工人對問卷調(diào)查更為重視,更能配合調(diào)查。這一結(jié)果與Ferber認(rèn)為職業(yè)等級較低者的項(xiàng)目不回應(yīng)率較高1的結(jié)論正好相反。

4.有宗教信仰者比無宗教信仰者,缺失值顯著減少;權(quán)益遭受侵害者比未遭受者缺失值顯著增多;在精神健康狀況中,中危人群和高危人群比低危人群缺失值顯著減少;朋友數(shù)量越多,缺失值也隨之增多。

5.居住類型對缺失值無顯著影響。這一結(jié)果與王建平、張立娟的發(fā)現(xiàn)并不一致。在居住類型上,我們認(rèn)為,由于農(nóng)民工普遍來說居住的私密性都不是太好,他們對私密性的要求也不像城市普通居民要求那么高,所以影響并不明顯。此外,月均收入、問卷花費(fèi)時間、地區(qū)、問卷調(diào)查時訪問員與被訪者的性別配對都對缺失值沒有顯著影響。

6.在調(diào)查員層次,性別沒有顯著差異。但專業(yè)差異明顯,出人意料:社會學(xué)、社會工作和其他文科專業(yè)比理工醫(yī)科專業(yè)學(xué)生缺失值顯著增加,可能說明自然科學(xué)對學(xué)生嚴(yán)謹(jǐn)、認(rèn)真的要求更高;調(diào)查員所做問卷數(shù)多一些更能減少缺失值,根據(jù)我們的計(jì)算,做18份問卷的調(diào)查員所做問卷平均缺失值最低。

在上述發(fā)現(xiàn)中,最為我們重視的是第4點(diǎn)。在對中國人的實(shí)證研究尤其是定量研究中,很少能發(fā)現(xiàn)宗教信仰的顯著作用。在對華人社會的問卷調(diào)查中,宗教信仰對調(diào)查結(jié)果的影響也幾乎沒有人論及,比如邊燕杰等人所主編的兩本研究華人社會調(diào)查問題的專著中,就沒有討論宗教對問卷調(diào)查的影響2。我們卻發(fā)現(xiàn),有宗教信仰者更能全面回答問題,這可能說明宗教信仰使人更為坦誠、耐心,更能配合調(diào)查。農(nóng)民工是容易遭受權(quán)益侵害的群體。權(quán)益遭受侵害者缺失值更多,可能說明權(quán)益侵害對農(nóng)民工來說,不僅僅是直接的利益受損,更由于這個群體的特殊性,面對權(quán)益侵害大多無力抗?fàn)帲赡苁蛊鋵ι鐣?、對現(xiàn)實(shí)產(chǎn)生更多的悲觀、失望情緒,心理遭受打擊,使他們更加自我封閉、保持沉默。精神健康狀況中的中危人群和高危人群比低危人群缺失值顯著減少,也許說明這些人更需要傾訴,更需要人們?nèi)チ私?,因而也更愿意配合調(diào)查。朋友數(shù)量越多的人缺失值也越多,朋友數(shù)量在這里更可能是性格的外在表現(xiàn),交結(jié)朋友的人,可能愿意接受調(diào)查,但不一定有足夠的耐心來全面回答問題;還可能的是,朋友少的人,更需要社會關(guān)懷,當(dāng)有人對他們進(jìn)行問卷調(diào)查,他們會更為配合。

概而言之,我們在回歸分析中發(fā)現(xiàn),與西方研究者認(rèn)為經(jīng)濟(jì)、社會地位較低的被訪者具有較高的項(xiàng)目無回答率相反,作為中國社會階層中的弱勢群體的農(nóng)民工,其中更為弱勢的女性、有宗教信仰者、藍(lán)領(lǐng)工人、精神健康狀況中的中危與高危人群和朋友數(shù)量較少者更能配合問卷調(diào)查,他們回答的問卷更少缺失值。但是,其中遭受過權(quán)益侵害的人卻又有較高的缺失值。這一點(diǎn)非常值得我們深思。

五、討 論

對農(nóng)民工的問卷調(diào)查,不是一個簡單的信息收集過程,而是一個社會互動過程,既涉及被訪者的回答能力,更涉及被訪者的態(tài)度。農(nóng)民工是一個在異地城市打工的、與社會中上層不同的邊緣群體、弱勢群體,他們更需要社會的關(guān)懷,問卷調(diào)查也可能是一種社會關(guān)懷的形式。在我們的調(diào)查中,一些被訪者一旦了解了我們的研究目的,是為了了解他們的情況,并向政府反映,就非常配合調(diào)查,并堅(jiān)持不要報(bào)酬。從問卷調(diào)查是一種社會關(guān)懷形式的解釋邏輯出發(fā),我們看到,處于弱勢一方的女性、有宗教信仰者、藍(lán)領(lǐng)工人、精神健康狀況中的中危與高危人群和朋友數(shù)量較少者更能配合調(diào)查,他們回答的問卷更少缺失值。而年齡、教育程度更可能是表現(xiàn)被訪者回答能力的指標(biāo)。當(dāng)然,權(quán)益侵害的變量似乎不符合弱勢一方更配合調(diào)查的解釋,這一方面說明這種解釋有一定的界限,另一方面說明當(dāng)弱勢者遭遇打擊時其心理感受和社會態(tài)度會發(fā)生變化。弱勢但不對社會絕望的人,更希望社會了解他們。而弱勢群體中的絕望者則更可能保持沉默??傮w來看,將問卷調(diào)查視為一種對弱勢群體的關(guān)懷形式是符合社會實(shí)際和邏輯的。此外還有下列問題值得進(jìn)一步討論:

其一,盡管中國和西方社會存在著巨大的制度和文化差異,但是,有些影響問卷調(diào)查的因素在這兩種社會和文化中卻是相同的,具有普遍性。我們的回歸分析已經(jīng)表明像被訪者的年齡、教育程度等變量對缺失值的影響與西方研究者的發(fā)現(xiàn)是基本一致的。這一類因素,更可能是決定被訪者能力的因素。

其二,基于中西方社會、文化的不同,有很多因素對問卷調(diào)查的影響是不同的,如我們上面所討論過的職業(yè)類型、權(quán)益侵害、心理健康、朋友數(shù)量等等。這一類因素,更可能是決定被訪者態(tài)度的因素。

其三,在我們的研究中,沒有討論問卷問題的敏感性,這一方面是由于我們的問卷中涉及的敏感性問題不多(比如只有兩個問題涉及強(qiáng)暴和性騷擾),另一方面,一些在西方研究中公認(rèn)的敏感性問題,比如工資收入問題,對農(nóng)民工來說并不敏感。在我們2010年的問卷調(diào)查數(shù)據(jù)中,月平均工資的缺失值僅為20個,占全部4152個樣本的0.48%。這既可能是中西方文化對敏感性的理解不同,也可能是社會的下層和中上層對敏感性的理解不同。就工資收入來說,農(nóng)民工的收入不高,而且基本都是打工收入,沒有隱瞞的必要,這個問題對他們來說,一點(diǎn)都不敏感。但是,對企業(yè)家來說,這個問題也許就是敏感的。從文化上來說,中國社會歷來都有不露富的傳統(tǒng)。

其四,關(guān)于問卷缺失值(項(xiàng)目無回答)的問題,更為全面的研究應(yīng)該將對不同群體進(jìn)行調(diào)查的問卷類型、訪問方式(面對面、電話、信訪等)、更為仔細(xì)的訪問員資料和被訪者特征結(jié)合起來進(jìn)行研究,最好在一個模型中包括了這四個方面的變量?,F(xiàn)有的研究,幾乎沒有同時考慮上述四個方面因素,控制變量不足,具有較大的局限性,導(dǎo)致許多結(jié)論缺乏穩(wěn)定性。當(dāng)然,我們并不是說,用一個同時涉及上述四方面因素的模型進(jìn)行研究,就可以一網(wǎng)打盡,得出終極結(jié)論。而是說,要盡可能控制變量,減少遺漏變量偏誤,得出更為穩(wěn)定可靠的結(jié)論。

問卷缺失值問題,并不只是一個問卷設(shè)計(jì)、調(diào)查的技術(shù)性問題,更是一個重要的社會性問題,更進(jìn)一步說,它是問卷調(diào)查中的“元問題”。在人類活動中,無論是表明政治態(tài)度、進(jìn)行法庭辯論,還是開展學(xué)術(shù)討論和日常生活交流,都有保持沉默或者說“不清楚”、“不知道”的權(quán)利和現(xiàn)實(shí)。這種基本的權(quán)利和事實(shí)反映到問卷調(diào)查中來,就形成缺失值。換句話說,無論問卷設(shè)計(jì)得多完美、調(diào)查組織得多嚴(yán)密、調(diào)查員多么認(rèn)真負(fù)責(zé)、被調(diào)查者多么配合,缺失值只能減少,不能完全消除。完美的問卷調(diào)查,不在于有沒有缺失值,而在于不要有不應(yīng)該有的缺失值。所謂“不應(yīng)該有”,主要是技術(shù)性失誤所引起的。也就是說,當(dāng)被調(diào)查者由于社會原因不能說、不愿說、不會說、不知道怎么說時,缺失就是正常的。正常的缺失,是社會的問題,社會因素讓人們不能說、不愿說、不會說,應(yīng)該反思的是社會。

問卷調(diào)查的回答結(jié)果是多樣的,盡管人們將多樣化的社會現(xiàn)象納入有限的答案中,由于問題的不同和社會現(xiàn)象的復(fù)雜性,答案還是多種多樣的。唯有一種答案是一樣的,不論什么樣的問題,回答者都不給予回答,或者回答“不知道”、“不清楚”。 “凡是不能說的事情,就應(yīng)該沉默?!?與可說的世界相比,沉默的世界更為遼闊、深邃。問卷回答者的沉默,是社會生活中沉默的自然表現(xiàn),是各種沉默中的一種,它同樣乃至更加具有深刻的意義。定量的社會學(xué)家和社會科學(xué)家們更多地關(guān)注了外顯的、給予了明確答案的問卷回答結(jié)果,卻較少關(guān)注回答者內(nèi)斂的沉默。西方的研究者們更多地關(guān)注了問卷回答者沉默的技術(shù)層面。而對于我們來說,技術(shù)的也是社會的,通過技術(shù)問題去思考社會問題,這是本文的基本邏輯。當(dāng)然,我們的思考才剛剛開始。

(責(zé)任編輯:薛立勇)

Abstract: The issue of missing value in questionnaires (item non-response) has been less concerned by domestic researchers than western researchers, who mostly study it on the technical level. In the questionnaire of Chinese migration workers, we found that missing values occurred more often among those who were without religious believes, or with higher occupational level, or whose labor rights had ever been infringed, or with many friends or who had mental health problems. In our opinion, surveying migrant workers is not just a process of collecting information, but also a process of interaction that involves the respondents capability to answer questions and their attitudes toward the questions. What we argue here is that questionnaire surveys of rural-to-urban migrants could constitute a form of social care for them since this population is a disadvantaged group in China. Therefore, missing value is not just a problem of questionnaire design or investigation techniques, but a social problem which could be regarded as the “meta problem” in surveys. The silence of the respondents is a reflection of their silence in social life, which is worth academic reflection and study.

Keywords: Missing Value; Item Non-Response; Migrant Workers; Questionnaire Survey

猜你喜歡
問卷調(diào)查農(nóng)民工
我國2.8億農(nóng)民工月均收入3 275元
職校學(xué)生手機(jī)使用狀況調(diào)查報(bào)告
媒介融合背景下的分眾傳播與受眾反饋
高校“院任選課” 情況調(diào)查及問題解析
大學(xué)生對慕課的了解和利用
國家統(tǒng)計(jì)局:農(nóng)村剩余勞動力供給面臨拐點(diǎn)
公租房計(jì)劃中不能少了農(nóng)民工等5則
晋宁县| 阿鲁科尔沁旗| 清水县| 盘山县| 肃宁县| 姚安县| 开化县| 镇原县| 义马市| 前郭尔| 永川市| 义乌市| 潞西市| 任丘市| 射阳县| 兴安县| 阳东县| 射洪县| 孝义市| 营口市| 右玉县| 平泉县| 景东| 鄂托克旗| 土默特右旗| 无为县| 新平| 醴陵市| 河西区| 深圳市| 长治市| 修文县| 双城市| 梅州市| 卢湾区| 六盘水市| 海阳市| 马关县| 延长县| 永德县| 台江县|