帕特里克·ó.雷根,何山華,方小兵
提 要 語(yǔ)言人口學(xué)是一個(gè)跨學(xué)科的研究領(lǐng)域,在研究方法和數(shù)據(jù)使用上一般借鑒人口學(xué)、社會(huì)學(xué)和語(yǔ)言學(xué)等學(xué)科:其基本方法是進(jìn)行大規(guī)模調(diào)查;所采用的數(shù)據(jù)大多來(lái)自人口普查和大范圍調(diào)查。盡管在學(xué)術(shù)研究和政策調(diào)研中,與語(yǔ)言相關(guān)的普查和調(diào)查數(shù)據(jù)得到了廣泛應(yīng)用,但其方法論基礎(chǔ)尚未得到系統(tǒng)評(píng)估。人口普查機(jī)構(gòu)在將社會(huì)語(yǔ)言類專題納入調(diào)查問(wèn)卷時(shí),會(huì)根據(jù)需要采用專門測(cè)定手段,但他們很少描述這些手段是如何開(kāi)發(fā)出來(lái)的。人口普查中與語(yǔ)言相關(guān)的問(wèn)題會(huì)采用不同的表述方式、問(wèn)題形式或答題方案,這些差異所帶來(lái)的問(wèn)題使普查數(shù)據(jù)在信度和效度上都受到質(zhì)疑。本文旨在研究人口普查中有關(guān)語(yǔ)言水平測(cè)定問(wèn)題的設(shè)計(jì)和措辭方式對(duì)受訪者的影響,案例來(lái)自愛(ài)爾蘭共和國(guó)和英國(guó)北愛(ài)爾蘭地區(qū)對(duì)于愛(ài)爾蘭語(yǔ)的一系列普查。本文的分析借鑒了前期相關(guān)研究成果,不過(guò)也基于近年來(lái)調(diào)查方法和應(yīng)用語(yǔ)言學(xué)研究的理論發(fā)展,對(duì)前人探討范圍有所擴(kuò)展。
關(guān)鍵詞 語(yǔ)言人口學(xué);調(diào)查方法;語(yǔ)言水平問(wèn)題;人口普查;愛(ài)爾蘭
中圖分類號(hào) H002 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-1014(2019)06-0042-13
DOI 10.19689/j.cnki.cn10-1361/h.20190604
Measurement Issues with Language Proficiency Data in Censuses of Population
Pádraig ? Riagáin
AbstractDemography of Language is an inter-disciplinary research area that draws on the methodology and data of demography as well as sociology and linguistics. Its basic methodology is survey based and it relies on data collected by means of censuses of population and large-scale surveys. Despite the widespread use of language-related census and survey data in research and policy studies, their methodological underpinnings have not been systematically evaluated. In this paper, it is argued that census agencies, when they chose to include sociolinguistic topics in their questionnaires, use their ownad hocmeasures, and provide little description of how they were developed. Problems arising from the variable wording, format or response categories of language related questions in censuses call into question the reliability and validity of data collected with census methods. The objective of this paper is to investigate the way in which respondents are influenced by the way language proficiency questions in censuses are shaped and worded in a large set of censuses relating to one language (Irish) in the Republic of Ireland and the Northern Ireland region of the UK. The analysis draws on earlier research on this topic, but expands the analytical scope of previous work by applying the theoretical insights of recent methodological advances in social research and applied linguistic research.
Key wordsDemography of Language; survey methodology; language proficiency questions; census of population; Ireland
一、引 言
語(yǔ)言人口學(xué)是一個(gè)跨學(xué)科的研究領(lǐng)域,在研究方法上一般借鑒人口學(xué)(Rallu,Piché & Simon 2006)、社會(huì)學(xué)和語(yǔ)言學(xué)等學(xué)科,并采用這些領(lǐng)域的成果和數(shù)據(jù)。作為人口學(xué)的一個(gè)分支,其基本方法是進(jìn)行大規(guī)模調(diào)查,而非像民族志那樣進(jìn)行參與式觀察。該領(lǐng)域所采用的數(shù)據(jù)大多來(lái)自人口普查和大范圍調(diào)查,而這兩種數(shù)據(jù)采集方法密切相關(guān),兩者都追求:(1)標(biāo)準(zhǔn)化的測(cè)定方法,即對(duì)所有受訪者采用相同的調(diào)查方式以確保所有個(gè)體的信息具有可比性;(2)廣泛覆蓋目標(biāo)人口(如人口普查)及該人群可靠的、有代表性的樣本(抽樣調(diào)查)(Fowler 2014:3)。盡管人口覆蓋率有所不同,但典型的人口普查問(wèn)卷與一般情況下郵寄調(diào)查和網(wǎng)絡(luò)調(diào)查中使用的自填問(wèn)卷在很大程度上是一樣的,這一點(diǎn)在當(dāng)前社會(huì)學(xué)文獻(xiàn)中也是得到認(rèn)可的(例如Dillman(2000:288~322)“政府實(shí)施的家庭和個(gè)人調(diào)查”一章)。
采用人口統(tǒng)計(jì)學(xué)的方法研究社會(huì)之中的語(yǔ)言(有時(shí)也稱為“人口語(yǔ)言學(xué)”)時(shí),語(yǔ)言普查或語(yǔ)言調(diào)查中對(duì)語(yǔ)言水平的測(cè)定,一般被作為一個(gè)因變量予以考察,要考慮源數(shù)據(jù)中所有的社會(huì)人口變量背景(de Vries 1990)。在社會(huì)語(yǔ)言學(xué)文獻(xiàn)中,對(duì)于語(yǔ)言的人口統(tǒng)計(jì)學(xué)特征的分析主要屬于費(fèi)什曼所指的“宏觀社會(huì)語(yǔ)言學(xué)”(Fishman 1985)或“全局社會(huì)語(yǔ)言學(xué)”(McConnell 1997)等研究領(lǐng)域。這些研究領(lǐng)域包括社會(huì)雙語(yǔ)和多語(yǔ)現(xiàn)象、語(yǔ)言接觸和語(yǔ)言傳播、語(yǔ)言維持和語(yǔ)言更替以及語(yǔ)言規(guī)劃。上述研究已產(chǎn)生了大量與語(yǔ)言相關(guān)的數(shù)據(jù),覆蓋了很大的地理范圍,而且其中有部分也具有相當(dāng)?shù)臍v史深度。
盡管在學(xué)術(shù)研究和政策調(diào)研中,與語(yǔ)言相關(guān)的普查和調(diào)查數(shù)據(jù)得到了廣泛應(yīng)用,但其方法論基礎(chǔ)尚未得到系統(tǒng)評(píng)估。De Vries(2006:61)曾有總結(jié),認(rèn)為關(guān)于在人口普查中如何針對(duì)語(yǔ)言情況設(shè)計(jì)問(wèn)題僅有“少量的”“分散的”和“難以獲取的”研究。正如Starr(1987:7)多年前所述,雖然人口普查在人口統(tǒng)計(jì)研究中“經(jīng)常被用作一種分析手段”,但其本身“很少成為分析的對(duì)象”。這一情況至今沒(méi)有改變。
本文認(rèn)為,人口普查機(jī)構(gòu)在將社會(huì)語(yǔ)言類專題納入調(diào)查問(wèn)卷時(shí),會(huì)根據(jù)其需要采用專門的測(cè)定手段,但他們很少描述這些手段是如何開(kāi)發(fā)出來(lái)的(Heath & Martin 1997:71),Bulmer(2010:220)將其稱為簡(jiǎn)單的“操作定義”,相關(guān)解釋只是將普查問(wèn)題中有關(guān)的表述重復(fù)一下。在與語(yǔ)言相關(guān)的人口學(xué)研究中,對(duì)于諸如語(yǔ)言水平等關(guān)鍵的社會(huì)語(yǔ)言學(xué)概念,仍然沒(méi)有被普遍接受的測(cè)定手段。該領(lǐng)域的文獻(xiàn)中常會(huì)探討由于不同的表述方式、問(wèn)題形式或答題方案所帶來(lái)的問(wèn)題(例如Stevens 1999;Jones 2005)。正如Heath & Martin(1997:85~86)討論一般性調(diào)查研究時(shí)所指出的,本文認(rèn)為需要對(duì)近年來(lái)人口普查中采用不同測(cè)定方法所帶來(lái)的后果進(jìn)行更為系統(tǒng)的研究,包括所獲數(shù)據(jù)的信度和效度,并在此基礎(chǔ)上為今后的人口普查研究提供指導(dǎo)。
因此,本文旨在研究人口普查中有關(guān)語(yǔ)言水平測(cè)定問(wèn)題的設(shè)計(jì)和措辭對(duì)受訪者的影響。不過(guò),單篇論文的篇幅無(wú)法涵蓋所有相關(guān)的理論問(wèn)題,也無(wú)法考察全部現(xiàn)有數(shù)據(jù)。本文僅討論一個(gè)社會(huì)語(yǔ)言學(xué)概念,即語(yǔ)言水平的普查手段,案例來(lái)自愛(ài)爾蘭共和國(guó)和英國(guó)北愛(ài)爾蘭地區(qū)對(duì)于愛(ài)爾蘭語(yǔ)的一系列普查(? Riagáin 2018一書對(duì)本文提出的問(wèn)題有更為全面的討論)。
本文的分析借鑒了前期相關(guān)研究成果,不過(guò)基于近年來(lái)調(diào)查方法和應(yīng)用語(yǔ)言學(xué)研究的理論發(fā)展,對(duì)前人探討范圍也有所擴(kuò)展。
二、人口普查中對(duì)語(yǔ)言數(shù)據(jù)的早期考察
人口普查是人類歷史上最早的社會(huì)調(diào)查形式(Hakim 1985)。盡管早有先例,但現(xiàn)代形式的人口普查大多始于19世紀(jì)初(Baffour,King & Valente 2013:408),主要是為了向政府提供可靠和準(zhǔn)確的人口規(guī)模及地理分布信息,當(dāng)然也包括其他人口和社會(huì)經(jīng)濟(jì)信息。早在19世紀(jì)中葉,人口普查問(wèn)卷就開(kāi)始納入有關(guān)受訪者語(yǔ)言的問(wèn)題(例如Lieberson 1966;Kominski 2012;? Gliasáin 1996)。目前,在官方人口普查中列入語(yǔ)言相關(guān)的問(wèn)題這一現(xiàn)象已較為廣泛,盡管還并不普遍。Christopher(2011:536)對(duì)71個(gè)英聯(lián)邦國(guó)家或曾屬英聯(lián)邦國(guó)家的人口普查進(jìn)行了調(diào)查,發(fā)現(xiàn)有37個(gè)國(guó)家(占52%)納入了一個(gè)或多個(gè)關(guān)于語(yǔ)言的問(wèn)題。這37個(gè)國(guó)家包括英國(guó)、愛(ài)爾蘭、印度、南非和加拿大等。美國(guó)在每十年一次的人口普查中納入語(yǔ)言問(wèn)題已有一百多年歷史(Stevens 1999),蘇聯(lián)所有的人口普查都包括關(guān)于“母語(yǔ)”和“其他語(yǔ)言”的問(wèn)題(Silver 1986),而大多數(shù)后蘇聯(lián)國(guó)家和獨(dú)聯(lián)體國(guó)家都延續(xù)了這一做法(Silver 2001)。
對(duì)人口普查中的語(yǔ)言數(shù)據(jù)進(jìn)行批判性分析始于20世紀(jì)60年代。早期的社會(huì)語(yǔ)言學(xué)文獻(xiàn)中有一些論文討論了人口普查和大規(guī)模調(diào)查中收集語(yǔ)言相關(guān)數(shù)據(jù)時(shí)所遇到的方法論問(wèn)題(如Lieberson 1966;Fishman & Terry 1969),但在那之后對(duì)這一主題的探討相對(duì)較少,且分散在多個(gè)學(xué)科領(lǐng)域(de Vries 2006:616)。盡管現(xiàn)有研究關(guān)注的范圍相對(duì)較小,我們?nèi)钥梢钥偨Y(jié)出幾種不同的研究策略。
第一類研究基本上是描述性的,只是對(duì)一些國(guó)家的人口普查問(wèn)卷進(jìn)行分類和比較——通常是以列表形式對(duì)比——以展示人口普查所涵蓋的社會(huì)語(yǔ)言學(xué)話題(例如Courbage 1998;Poulain 2008;Christopher 2011)。這類研究的目的在于比較,而且確實(shí)涉及了普查問(wèn)卷的內(nèi)容;但其主要感興趣的是普查問(wèn)卷中納入的社會(huì)語(yǔ)言學(xué)話題,并不是所使用問(wèn)題的措辭和形式。
第二類研究也主要是描述性的,不過(guò)其重點(diǎn)已不是所涵蓋的話題范圍,而是問(wèn)卷中問(wèn)題的細(xì)節(jié)。此類研究中有不少是對(duì)歷年人口普查語(yǔ)言問(wèn)題的措辭和形式變化的追蹤。由于這些研究更為具體,因此其比較的范圍相對(duì)第一類研究要更小,往往僅限于一個(gè)國(guó)家的普查數(shù)據(jù)。例如,Stevens(1999)描述了20世紀(jì)美國(guó)人口普查中語(yǔ)言問(wèn)題的變化。Higgs,Williams & Dorling(2004)則回顧了之前50年英國(guó)人口普查中有關(guān)威爾士語(yǔ)問(wèn)題的變化。Chiswick & Miller(1998)對(duì)美國(guó)和加拿大人口普查中的語(yǔ)言問(wèn)題進(jìn)行了比較,不過(guò)這類對(duì)兩個(gè)或兩個(gè)以上國(guó)家的語(yǔ)言普查問(wèn)題以及普查數(shù)據(jù)進(jìn)行的比較相對(duì)少一些。
第三類研究與本文最為相關(guān)。這類研究通常在普查前或普查后采用大規(guī)模調(diào)查獲取語(yǔ)言數(shù)據(jù),以印證人口普查中語(yǔ)言問(wèn)題的調(diào)查質(zhì)量。他們先使用普查問(wèn)卷中的問(wèn)題對(duì)隨機(jī)選取的受訪者進(jìn)行提問(wèn),然后根據(jù)其回答追問(wèn)更多有關(guān)語(yǔ)言水平的問(wèn)題。研究者拿使用普查問(wèn)題獲得的數(shù)據(jù)與隨后補(bǔ)充問(wèn)題獲得的數(shù)據(jù)進(jìn)行關(guān)聯(lián)比較,以揭示受訪者如何理解普查問(wèn)題;也有研究對(duì)這一設(shè)計(jì)進(jìn)行擴(kuò)展,要求受訪者完成一個(gè)或多個(gè)語(yǔ)言測(cè)試,將其得分與普查答案進(jìn)行對(duì)比(相關(guān)案例可見(jiàn)Fishman & Terry 1969;?Kominski 1989;Chiswick & Miller 1998;Siegel,Martin & Bruno 2001)。此類研究的一般結(jié)論是,“普查中語(yǔ)言問(wèn)題與后續(xù)相關(guān)問(wèn)題的答案間存在高度的相關(guān)性和一致性”(Kominski 1989:4),Chiswick & Miller(1998:883)證明具有“高度一致性”。換言之,語(yǔ)言普查數(shù)據(jù)雖然并不完美,但研究人員認(rèn)為這些數(shù)據(jù)為全國(guó)人口的語(yǔ)言水平提供了有效的估測(cè)。
然而,有一項(xiàng)較近的研究在進(jìn)行了大量的原創(chuàng)性分析后(Edele et al. 2015),得出了更有依據(jù)的結(jié)論。在對(duì)大規(guī)模調(diào)查和人口普查中常用的“典型”自測(cè)型問(wèn)題與“可靠”的心理測(cè)試進(jìn)行比較后,Edele et al.(2015:112)認(rèn)為兩者“相關(guān)性僅為中等”“主觀性評(píng)測(cè)似不足以測(cè)定語(yǔ)言水平”。盡管受限于其調(diào)研對(duì)象的年齡范圍(青少年)和自估型問(wèn)題的數(shù)量,該項(xiàng)結(jié)論只是暫時(shí)性的,但是正如作者所指出的,確實(shí)需要在更廣泛的社會(huì)、人口和國(guó)家背景下,對(duì)其他自估型問(wèn)題和語(yǔ)言測(cè)試進(jìn)行更多研究。
除了上述初步結(jié)論,還有一點(diǎn)值得注意。在前述研究中,雖然研究方法都是非常關(guān)鍵的部分,但方法論問(wèn)題卻很少得到重點(diǎn)討論。這些研究主要關(guān)注具體普查問(wèn)題的一致性、有效性或有用性,而未探討不同問(wèn)題形式對(duì)受訪者答題的影響。此外,早期的研究大多在美國(guó)、加拿大或澳大利亞進(jìn)行。本文的目的之一,就是對(duì)當(dāng)前有限的語(yǔ)言普查研究進(jìn)行擴(kuò)充,對(duì)英國(guó)和愛(ài)爾蘭人口普查中愛(ài)爾蘭語(yǔ)的系列調(diào)查數(shù)據(jù)進(jìn)行詳細(xì)分析,提煉其獨(dú)有特征以及與其他語(yǔ)言普查共有的特征。其次,本文的研究也將人口普查數(shù)據(jù)與其他調(diào)查數(shù)據(jù)源進(jìn)行比較,試圖通過(guò)借鑒近數(shù)十年來(lái)關(guān)于調(diào)查問(wèn)題設(shè)計(jì)方法的研究成果,對(duì)語(yǔ)言普查問(wèn)題的討論范圍予以拓展。
如今已有大量關(guān)于調(diào)查中問(wèn)題和問(wèn)卷設(shè)計(jì)方法的文獻(xiàn)(較近的現(xiàn)狀梳理,可見(jiàn)Krosnick & Presser 2010)。關(guān)于問(wèn)題和問(wèn)卷形式如何影響調(diào)查結(jié)果,針對(duì)調(diào)查方法的相關(guān)研究正在總結(jié)出越來(lái)越多的形式特征(Schaeffer & Dykema 2011:909)。這些特征包括兩個(gè)方面:一是問(wèn)題的主體部分,即給出題干并提問(wèn)的部分(Smith 2003:70);二是應(yīng)答選項(xiàng),即記錄受訪者答案的部分。一些次要問(wèn)題則包括問(wèn)題的措辭和應(yīng)答選項(xiàng)的分級(jí)。然而,Alwin(2007:167)指出,所有這些都與問(wèn)題形式有關(guān),即問(wèn)題本身的形式特征。此外,他指出除了上述這類問(wèn)題的形式特征,還有一個(gè)方面值得研究,那就是如何將單個(gè)問(wèn)題組合成問(wèn)卷。他認(rèn)為,關(guān)于問(wèn)題上下文的某些方面值得關(guān)注,因?yàn)樗鼈兛赡軙?huì)對(duì)受訪者的答案產(chǎn)生影響,其中包括如何將問(wèn)題分成不同組別。
除了問(wèn)題的形式和語(yǔ)境,Alwin(2007:13)等(其他如Cohen 2008:633)還探討了讓受訪者報(bào)告其他人的信息(代理報(bào)告)和由受訪者直接回答本人信息(自估報(bào)告)對(duì)于數(shù)據(jù)質(zhì)量的影響。這是所有人口普查數(shù)據(jù)的一個(gè)關(guān)鍵問(wèn)題,而不僅僅是一個(gè)與語(yǔ)言話題有關(guān)的問(wèn)題,后文將予以具體解釋。
最后,在考慮人口普查中對(duì)語(yǔ)言水平的測(cè)定問(wèn)題時(shí),也應(yīng)參照語(yǔ)言測(cè)試領(lǐng)域?qū)τ谡Z(yǔ)言能力概念的界定、描述和測(cè)量,盡管兩者在實(shí)質(zhì)關(guān)注以及理論和方法上都存在較大差異。語(yǔ)言測(cè)試領(lǐng)域確有一些與本文密切相關(guān)的成果,其中之一是越來(lái)越多的大規(guī)模語(yǔ)言測(cè)試:多區(qū)域和多國(guó)家參與設(shè)計(jì)和管理的國(guó)際考試和測(cè)試實(shí)踐(Kunnan 2008)均涉及非常大的數(shù)據(jù)樣本。第二個(gè)值得關(guān)注的發(fā)展趨勢(shì)是,語(yǔ)言測(cè)試中越來(lái)越多地使用自我評(píng)估問(wèn)卷,有時(shí)在特定情況下還用這類問(wèn)卷替代正式的語(yǔ)言測(cè)試(Oscarson 1997)。在針對(duì)人口普查開(kāi)展的研究中,其核心問(wèn)題是受訪者能夠在多大程度上對(duì)自己的語(yǔ)言水平做出準(zhǔn)確和有效的判斷。
盡管上文回顧的文獻(xiàn)指出了多條研究線索,但我們的重要任務(wù)乃是將上述有關(guān)方法的研究成果應(yīng)用于語(yǔ)言普查中具體的“水平測(cè)定-概念界定”問(wèn)題(Blalock 1979:884)。本文無(wú)法探討所有相關(guān)問(wèn)題,只是對(duì)少數(shù)具有重要方法論價(jià)值,且可以在較短篇幅內(nèi)進(jìn)行討論的問(wèn)題進(jìn)行探討。
其中包括:
1.在人口普查數(shù)據(jù)中代理報(bào)告的可靠性如何?
2.人口普查中的是非兩分型問(wèn)題如何影響受訪者的回答?
3.如果將是非兩分型問(wèn)題嵌入一組相關(guān)問(wèn)題中,是否會(huì)影響測(cè)定的信度?
4.與大規(guī)模語(yǔ)言測(cè)試相比,人口普查中的語(yǔ)言水平概念如何界定?
三、數(shù)據(jù)來(lái)源
本文所用數(shù)據(jù)主要來(lái)自愛(ài)爾蘭和英國(guó)兩地的人口普查。在愛(ài)爾蘭共和國(guó),從1926年到1946年,每十年進(jìn)行一次人口普查;從1951年起每五年進(jìn)行一次人口普查(1976年和2001年除外)。在1981年之前,大多數(shù)(但不是全部)人口普查問(wèn)卷都會(huì)詢問(wèn)關(guān)于愛(ài)爾蘭語(yǔ)水平的問(wèn)題;1981年之后則每次普查都有此類問(wèn)題。因此,自1926年至2016年期間,除了1946年至1961年之間有15年的間隔外,人口普查中每10年至少會(huì)出現(xiàn)一次語(yǔ)言水平的問(wèn)題。人口普查出版資料一般專辟一章或單編一冊(cè),來(lái)描述愛(ài)爾蘭語(yǔ)水平問(wèn)題;本文所使用的統(tǒng)計(jì)數(shù)據(jù)取自于這些出版物。
在英國(guó)北愛(ài)爾蘭,1926年和1937年分別進(jìn)行了人口普查。由于戰(zhàn)爭(zhēng)的原因,直到1951年才重新開(kāi)始人口普查,此后每十年進(jìn)行一次。北愛(ài)爾蘭的人口普查直到1991年才納入關(guān)于愛(ài)爾蘭語(yǔ)水平的問(wèn)題,后來(lái)的人口普查(2001年和2011年)都保留了這一問(wèn)題。本文有關(guān)這些普查的數(shù)據(jù)是從公開(kāi)出版物中獲取的。(北愛(ài)爾蘭官方人口普查和調(diào)查機(jī)構(gòu)(NISRA)在實(shí)際上和法律上都是一個(gè)獨(dú)立機(jī)構(gòu),但它與英格蘭、威爾士和蘇格蘭的類似機(jī)構(gòu)有著密切的聯(lián)系;因此,如果不參考英國(guó)更廣泛范圍內(nèi)其他地區(qū)的人口普查,就無(wú)法理解其調(diào)查方法。)
在接下來(lái)的分析部分,本文使用了幾個(gè)抽樣調(diào)查結(jié)果,試圖對(duì)人口普查中獲得的語(yǔ)言數(shù)據(jù)進(jìn)行驗(yàn)證評(píng)估。在愛(ài)爾蘭共和國(guó),1983年至2013年期間,進(jìn)行了一系列全國(guó)范圍內(nèi)的調(diào)查,要求受訪者對(duì)其愛(ài)爾蘭語(yǔ)水平進(jìn)行分級(jí)排序評(píng)分,然后在訪談后期再問(wèn)這些受訪者,在本次調(diào)查前的那次人口普查中,他們關(guān)于語(yǔ)言問(wèn)題是如何作答的。本文選取的調(diào)查樣本都比較大(平均樣本量約為1000人);抽取的樣本是與人口普查重合的成年人口群體;受訪者系隨機(jī)抽取,除少數(shù)例外,均在其家中進(jìn)行“面對(duì)面”采訪。所有調(diào)查均由聲譽(yù)卓著的專門從事現(xiàn)場(chǎng)調(diào)查的機(jī)構(gòu)進(jìn)行。本文使用的數(shù)據(jù)都是從這些大規(guī)模調(diào)查的公開(kāi)報(bào)告中獲得的,或者通過(guò)對(duì)其數(shù)據(jù)文件重新加工得到的。
需要強(qiáng)調(diào)的是,本文的目的僅是評(píng)估人口普查研究中語(yǔ)言水平測(cè)定的方法論問(wèn)題。因此,愛(ài)爾蘭人口普查(和調(diào)查)結(jié)果所反映的許多政策和社會(huì)語(yǔ)言學(xué)問(wèn)題均未討論(關(guān)于這些問(wèn)題的討論,可見(jiàn)? Riagáin 1997)。
需要交代的是,愛(ài)爾蘭語(yǔ)使用者——無(wú)論這里“使用者”如何界定——在愛(ài)爾蘭共和國(guó)和英國(guó)北愛(ài)爾蘭都是少數(shù),在北愛(ài)爾蘭可能更是如此。在這兩地,將愛(ài)爾蘭語(yǔ)作為童年家庭語(yǔ)言(或母語(yǔ)、第一語(yǔ)言)來(lái)習(xí)得的人很少,其比例遠(yuǎn)遠(yuǎn)小于將其作為第二語(yǔ)言學(xué)習(xí)(通常是在學(xué)校)的人。因此人口普查中使用的語(yǔ)言問(wèn)題,便需要考慮如何測(cè)定愛(ài)爾蘭語(yǔ)的第一和第二語(yǔ)言使用者的水平。關(guān)于愛(ài)爾蘭語(yǔ)普查的案例研究在這方面所提出的方法問(wèn)題,便與其他語(yǔ)境下的相似問(wèn)題具有可比性,盡管那些語(yǔ)境中的基本政策問(wèn)題會(huì)有所不同。
四、人口普查中的代理報(bào)告
我們將人口普查歸為一般性調(diào)查的一種,但需要注意在進(jìn)行家庭調(diào)查時(shí),人口普查和抽樣調(diào)查之間存在一個(gè)重要的方法差異。這種差異是由人口普查的執(zhí)行管理方式所導(dǎo)致的。人口普查表或調(diào)查問(wèn)卷是以家庭而非特定個(gè)人為單位進(jìn)行分發(fā)的。在傳統(tǒng)人口普查中,法律只規(guī)定要求一個(gè)人——戶主或普查當(dāng)晚在場(chǎng)的任何成年家庭成員——回答有關(guān)所有家庭成員的問(wèn)題。在有關(guān)方法研究的文獻(xiàn)中,當(dāng)受訪者代為報(bào)告其家庭成員或社會(huì)關(guān)系中其他人的信息時(shí),被稱為“代理報(bào)告”。因此,在有一個(gè)以上居民的家庭中,人口普查報(bào)告可能包括了一個(gè)家庭成員的自我報(bào)告數(shù)據(jù)和為其他家庭成員提供的代理報(bào)告數(shù)據(jù)。這一區(qū)分很重要?,F(xiàn)在有為數(shù)不多但正在不斷增加的研究(Moore 1998;Sakshaug 2015),對(duì)普查和一般調(diào)查研究中代理報(bào)告數(shù)據(jù)的信度和效度提出了質(zhì)疑。爭(zhēng)論的焦點(diǎn)不是所使用的問(wèn)題類型或其形式上的特征,而是信息的來(lái)源。“由于代理應(yīng)答者的視角和記憶內(nèi)容迥異于調(diào)查的目標(biāo)對(duì)象,因此代理應(yīng)答可能會(huì)對(duì)調(diào)查中的測(cè)定誤差產(chǎn)生影響”(Cohen 2008:633)。一些有關(guān)調(diào)研方法的研究表明,代理報(bào)告通常是“大膽猜測(cè)”或“根據(jù)授意猜測(cè)”或僅僅是估猜的結(jié)果(Tourangeau,Rips & Rasinski 2000:65~67)。此外,當(dāng)問(wèn)題的性質(zhì)主觀性較強(qiáng)而非客觀且可觀測(cè)到時(shí),代理報(bào)告的信度要更低(Stafford 2010:765)。因此,在人口普查中使用代理報(bào)告收集的數(shù)據(jù)所存在的問(wèn)題,是不應(yīng)被忽略的。然而,語(yǔ)言普查數(shù)據(jù)中存在的這個(gè)問(wèn)題幾乎被完全忽視了。在一般做法中,代理報(bào)告可能造成人口普查數(shù)據(jù)偏差的問(wèn)題通常被回避了,大多數(shù)分析者將普查結(jié)果作為客觀的數(shù)據(jù)。
代理報(bào)告的問(wèn)題無(wú)法直接通過(guò)人口普查數(shù)據(jù)進(jìn)行分析,現(xiàn)有數(shù)據(jù)也無(wú)法將自我報(bào)告和代理報(bào)告的數(shù)據(jù)進(jìn)行區(qū)分并比較,因此只能依靠平行調(diào)查的數(shù)據(jù)。有一些大規(guī)模抽樣調(diào)查也收集代理報(bào)告的數(shù)據(jù),但會(huì)將自我報(bào)告和代理報(bào)告數(shù)據(jù)區(qū)分開(kāi)以供比較。例如,愛(ài)爾蘭共和國(guó)1993年的一項(xiàng)調(diào)查中,將已婚男女的自我報(bào)告結(jié)果與其伴侶所做的代理報(bào)告結(jié)果進(jìn)行比較(有關(guān)調(diào)查詳情,見(jiàn)? Riagáin 1997)。在這項(xiàng)調(diào)查中,受訪者需對(duì)其本人及其配偶或伴侶的愛(ài)爾蘭語(yǔ)水平進(jìn)行打分,共有6個(gè)等級(jí),從“完全不會(huì)愛(ài)爾蘭語(yǔ)”到“母語(yǔ)水平”(完整等級(jí)見(jiàn)表1)。
從表1可以看出,已婚男性自報(bào)的愛(ài)爾蘭語(yǔ)水平與其女性配偶/伴侶所報(bào)告的水平幾乎相同。換言之,已婚男性的自我報(bào)告數(shù)據(jù)和代理報(bào)告數(shù)據(jù)幾乎沒(méi)有區(qū)別。然而,同一調(diào)查中關(guān)于已婚女性的類似數(shù)據(jù)卻不符合這一模式,如表2所示。
通過(guò)比較可以發(fā)現(xiàn),代理報(bào)告中已婚女性愛(ài)爾蘭語(yǔ)的水平低于其自我報(bào)告的水平,盡管這有些令人困惑。有39%的已婚女性受訪者對(duì)自己的愛(ài)爾蘭語(yǔ)水平自視甚高,評(píng)定為較高水平的前三檔,但由男性配偶評(píng)定的(代理報(bào)告)妻子和伴侶中只有25%達(dá)到這一水平。當(dāng)然,這一發(fā)現(xiàn)僅限于這一項(xiàng)調(diào)查、這一人群,尚未發(fā)現(xiàn)其他關(guān)于語(yǔ)言調(diào)查/普查中有關(guān)代理報(bào)告的方法問(wèn)題的研究。
這一發(fā)現(xiàn)顯然不能被視為最終結(jié)論的確鑿證據(jù),但考慮到其他研究對(duì)這一方法問(wèn)題所表達(dá)的廣泛關(guān)切(如Maclean & Glenn(1979:76)的類似發(fā)現(xiàn)),這一比較確實(shí)表明通過(guò)代理報(bào)告獲得的語(yǔ)言數(shù)據(jù)應(yīng)謹(jǐn)慎對(duì)待。
當(dāng)然,使用代理報(bào)告確有好處(Cobb 2015:64)。例如可以更快地收集數(shù)據(jù),且成本更低。盡管如此,在語(yǔ)言人口學(xué)中,代理報(bào)告的風(fēng)險(xiǎn)依然存在,其對(duì)數(shù)據(jù)質(zhì)量的影響依舊是一個(gè)灰色地帶。關(guān)于語(yǔ)言水平調(diào)查中代理報(bào)告數(shù)據(jù)的準(zhǔn)確性仍需要進(jìn)行更多的研究,也需要尋找能夠提高代理報(bào)告準(zhǔn)確性的問(wèn)題設(shè)計(jì)(Cobb 2015對(duì)此有更為全面的討論和梳理)。
五、人口普查中的是非兩分型問(wèn)題
普查中的是非兩分型語(yǔ)言問(wèn)題簡(jiǎn)單地詢問(wèn)受訪者“你會(huì)說(shuō)(某種語(yǔ)言)嗎?”,請(qǐng)其回答“是”或“否”。此類問(wèn)題假設(shè)了受訪者使用一種語(yǔ)言的能力就如同其他技能一樣,要么有,要么沒(méi)有。愛(ài)爾蘭共和國(guó)1996年之后的所有人口普查都采用了這類問(wèn)題,即“(此人)會(huì)說(shuō)愛(ài)爾蘭語(yǔ)嗎?”,受訪者通過(guò)勾選相應(yīng)的方框(“是”或“否”)提交答案。全國(guó)匯總情況如表3所示。
可以看出,在1996年至2011年的15年間,4次人口普查分別得到的結(jié)果保持了高度一致,在41%上下。然而,對(duì)全國(guó)人口愛(ài)爾蘭語(yǔ)水平的這一普查測(cè)定結(jié)果經(jīng)常被批評(píng)為不準(zhǔn)確且具有誤導(dǎo)性。這些批評(píng)既有理論層面的,也有實(shí)證層面的。
要回答一個(gè)關(guān)于語(yǔ)言水平的是非兩分型問(wèn)題,需要受訪者首先評(píng)估一下他們能將這種語(yǔ)言說(shuō)得多好或多流利,然后考慮一下這個(gè)評(píng)估結(jié)果應(yīng)該用“是”(我會(huì)使用該語(yǔ)言)或“否”(我不會(huì)使用該語(yǔ)言)來(lái)回答。雖然這對(duì)水平很高或很低的人可能不會(huì)造成什么困擾,但那些水平中等的人可能很難將自己的語(yǔ)言能力劃分成(是/否)兩個(gè)等級(jí)(Krosnick,Judd & Wittenbrink(2005:34)對(duì)于是非兩分型問(wèn)題有一般性論述)。因此,是非兩分型問(wèn)題會(huì)導(dǎo)致受訪者之間的回答不一致,其中一些中級(jí)水平者勾選“是”,而其他則勾選“否”框。
2013年愛(ài)爾蘭共和國(guó)有一次針對(duì)這一問(wèn)題的調(diào)查(調(diào)查詳情見(jiàn)Darmody & Daly 2015)。在這次調(diào)查中,受訪者被要求回答兩個(gè)完全獨(dú)立的問(wèn)題,這兩個(gè)問(wèn)題之間沒(méi)有任何聯(lián)系。第一個(gè)問(wèn)題要求受訪者按六分制(見(jiàn)表1)對(duì)其愛(ài)爾蘭語(yǔ)水平進(jìn)行評(píng)分,第二個(gè)問(wèn)題則詢問(wèn)受訪者是如何回答2011年人口普查語(yǔ)言問(wèn)題的(在2011年人口普查中,有一個(gè)關(guān)于愛(ài)爾蘭語(yǔ)的問(wèn)題。調(diào)查者會(huì)問(wèn):“關(guān)于‘你是否會(huì)說(shuō)愛(ài)爾蘭語(yǔ)?這一問(wèn)題,你是否記得你本人或別人代你回答的答案?”)。需要指出的是,這兩個(gè)問(wèn)題是在45分鐘的采訪中,在兩個(gè)不同的時(shí)間點(diǎn)分別向所有受訪者提出的。
如表4所示,通過(guò)對(duì)這兩個(gè)問(wèn)題答復(fù)的交叉比較,可以獲知那些在2011年人口普查中對(duì)“你會(huì)說(shuō)愛(ài)爾蘭語(yǔ)嗎?”回答“是”或“否”的受訪者的一些額外信息。總體上,13%的受訪者表示他們?cè)?011年的人口普查中回答了會(huì)說(shuō)愛(ài)爾蘭語(yǔ),62%的人回答了不會(huì)說(shuō)愛(ài)爾蘭語(yǔ),25%的人則稱他們要么不知道當(dāng)時(shí)是怎么回答的,或是不記得了。然而,這里的研究興趣不在于這些答復(fù)與人口普查數(shù)據(jù)之間的對(duì)應(yīng)一致關(guān)系,而在于這3個(gè)分組關(guān)于自身愛(ài)爾蘭語(yǔ)水平的打分。
調(diào)查結(jié)果在很大程度上是可以預(yù)計(jì)的。那些在人口普查中回答了不會(huì)說(shuō)愛(ài)爾蘭語(yǔ)的人,其答復(fù)分布傾向于低水平級(jí)別。對(duì)照詳細(xì)列表信息,可知本組約93%的人聲稱最多只知道幾個(gè)“簡(jiǎn)單的句子”?;卮稹安恢馈钡牡谌M,答復(fù)分布模式與此相似。
然而,那些在2011年人口普查中聲稱會(huì)說(shuō)愛(ài)爾蘭語(yǔ)的人,答復(fù)分布模式卻不是那么清晰。很清楚的是,在普查中回答能講愛(ài)爾蘭語(yǔ)的人中,大多數(shù)受訪者(53%)將他們的愛(ài)爾蘭語(yǔ)水平評(píng)定為3個(gè)較高級(jí)別中的一個(gè),但也有較多受訪者(47%)將他們的實(shí)際愛(ài)爾蘭語(yǔ)水平評(píng)定為“簡(jiǎn)單句子”或“零散單詞”。因此,普查中的指標(biāo)只是非常隨意地區(qū)分了那些具有較高和較低水平的人。人口普查中回答“是”的人群中包含了大量愛(ài)爾蘭語(yǔ)實(shí)際水平相當(dāng)?shù)偷娜?,而那些回答不?huì)使用愛(ài)爾蘭語(yǔ)的人,其水平其實(shí)與前述回答“是”的人相當(dāng),或至少不是更低。
這些證據(jù)表明,在人口普查中使用是非兩分型問(wèn)題,受訪者偏向于回答“是”(Foddy 1993對(duì)此亦有論述)。鑒于“是/否”問(wèn)題所帶來(lái)的困難,Krosnick et al.(2005:35)認(rèn)為似乎最好完全避免這種形式的問(wèn)題。正如Foddy(1993:153)所指出的,“放棄是非兩分型問(wèn)題,使用其他變量,將獲得更高的準(zhǔn)確度,并允許使用更為復(fù)雜的統(tǒng)計(jì)程序來(lái)生成和測(cè)試更為復(fù)雜的假設(shè)?!保硪?jiàn)Schaeffer & Dykema 2011:921)
六、人口普查中的問(wèn)題組塊
在調(diào)查問(wèn)卷中使用問(wèn)題組塊毫無(wú)疑問(wèn)是一種廣泛的做法,不過(guò)這種做法也受到了批評(píng)。Alwin(2007:180)基于證據(jù)指出,將問(wèn)題歸入組塊會(huì)得出不可靠的答復(fù),不如將這些問(wèn)題單獨(dú)放置或作為一個(gè)主題系列但使用不同的回答形式。
如表5所示,在2001年的北愛(ài)爾蘭人口普查中,語(yǔ)言水平測(cè)量區(qū)塊包含了4個(gè)關(guān)于愛(ài)爾蘭語(yǔ)說(shuō)、聽(tīng)、讀和寫能力的是非兩分型問(wèn)題。每個(gè)問(wèn)題的回答形式都是“是”或“否”。此處我們的關(guān)注點(diǎn)是將這4個(gè)問(wèn)題歸入一個(gè)單獨(dú)的組塊,調(diào)查效果到底如何。
1991年,約有8.8%的人聲稱會(huì)說(shuō)愛(ài)爾蘭語(yǔ),能讀愛(ài)爾蘭語(yǔ)的人略少一些(6.3%),能寫愛(ài)爾蘭語(yǔ)的人要更少(5.6%)。這一排序較為典型,與蘇格蘭和威爾士同一年普查中關(guān)于蘇格蘭語(yǔ)和威爾士語(yǔ)同一問(wèn)題的答復(fù)比例相似。
在2001年的人口普查中,增加了一個(gè)能否“聽(tīng)懂”愛(ài)爾蘭語(yǔ)的新問(wèn)題。大約8.2%的人聲稱能夠“聽(tīng)懂”愛(ài)爾蘭語(yǔ),但原來(lái)3個(gè)問(wèn)題的回答呈現(xiàn)出一種矛盾的分布模式。在這一新的測(cè)定方式下,聲稱能熟練讀寫愛(ài)爾蘭語(yǔ)的百分比保持穩(wěn)定或略有增加,而聲稱能說(shuō)愛(ài)爾蘭語(yǔ)的百分比則從8.78%下降到7.16%。
然而,有一些內(nèi)部證據(jù)表明,增加了這個(gè)“聽(tīng)懂”愛(ài)爾蘭語(yǔ)的新問(wèn)題之后,可能對(duì)聲稱能說(shuō)愛(ài)爾蘭語(yǔ)的百分比產(chǎn)生了影響。交叉對(duì)比顯示,在聲稱會(huì)說(shuō)愛(ài)爾蘭語(yǔ)的人中,20%并未聲稱有能力聽(tīng)懂愛(ài)爾蘭語(yǔ)。在威爾士和蘇格蘭的人口普查中使用了同樣的系列問(wèn)題組塊,值得注意的是這些地區(qū)公布的數(shù)據(jù)中也出現(xiàn)了這種差異。聲稱能說(shuō)威爾士語(yǔ)的人中約有15%未聲稱能聽(tīng)懂威爾士語(yǔ),聲稱能說(shuō)蓋爾語(yǔ)的人中有16%未聲稱能聽(tīng)懂蓋爾語(yǔ)。北愛(ài)爾蘭統(tǒng)計(jì)和研究機(jī)構(gòu)(NISRA)對(duì)這種差異未予置評(píng),但在2001年人口普查的威爾士語(yǔ)言報(bào)告(國(guó)家統(tǒng)計(jì)局(ONS),2004:39)中指出,“能聽(tīng)懂威爾士語(yǔ)的人數(shù)可能被低估了,因?yàn)橐恍┠苈?tīng)懂威爾士語(yǔ)的人如果勾選了一個(gè)與‘更高技能有關(guān)的方框,可能就沒(méi)有勾選這個(gè)方框?!?/p>
雖然國(guó)家統(tǒng)計(jì)局沒(méi)有提供支持這一論點(diǎn)的證據(jù),但這一評(píng)論確實(shí)提出了一個(gè)有趣而可信的觀點(diǎn)。事實(shí)上,英國(guó)人口普查統(tǒng)計(jì)專家認(rèn)為,相當(dāng)多的人可能會(huì)直觀地將這一整套4個(gè)問(wèn)題看作是從最低技能(聽(tīng)懂)到最高技能(寫作)的一個(gè)排序。如果確實(shí)如此,倒是可以解釋為什么一些受訪者聲稱能夠?qū)懽?,卻不能閱讀;能夠說(shuō),但不能聽(tīng)懂這一語(yǔ)言。反過(guò)來(lái),將這4個(gè)問(wèn)題作為整體,受訪者只能回答“是/否”,那么,要表明口語(yǔ)水平較低這一狀態(tài),選擇“能聽(tīng)懂”愛(ài)爾蘭語(yǔ)比毫無(wú)保留地聲稱“能說(shuō)”愛(ài)爾蘭語(yǔ)更為可信。
因此,與1991年的調(diào)查結(jié)果相比,2001年的數(shù)字可能并非反映了口語(yǔ)水平的實(shí)際下降,而只是反映了這樣一個(gè)事實(shí):受訪人正在使用新的問(wèn)題格式,對(duì)其家庭成員的愛(ài)爾蘭語(yǔ)水平做出更細(xì)致的評(píng)價(jià)。Alwin(2007:180)雖非從事社會(huì)語(yǔ)言學(xué)研究,但他關(guān)于問(wèn)題組塊的結(jié)論仍然值得注意:“……回答格式的相似性實(shí)際上可能會(huì)干擾受訪者對(duì)所詢問(wèn)的信息進(jìn)行充分考慮,并使其忽視每個(gè)問(wèn)題的特殊性?!北睈?ài)爾蘭和英國(guó)的人口普查數(shù)據(jù)支持這一假設(shè),盡管顯然還需要進(jìn)一步調(diào)查這一問(wèn)題。
七、討 論
盡管近幾十年來(lái)在主流社會(huì)學(xué)研究中出現(xiàn)了大量有關(guān)調(diào)查方法的文獻(xiàn),用以評(píng)估一般性調(diào)查所獲數(shù)據(jù)的質(zhì)量,但還沒(méi)有人研究人口普查或大規(guī)模調(diào)查收集的語(yǔ)言數(shù)據(jù)的質(zhì)量。通過(guò)人口普查收集的語(yǔ)言數(shù)據(jù)被廣泛應(yīng)用于語(yǔ)言社會(huì)學(xué)、語(yǔ)言政策和規(guī)劃研究以及政策文件中,但調(diào)查中所采用的問(wèn)題本身所存在的問(wèn)題往往被忽視了,普查數(shù)據(jù)也常被用于其無(wú)法滿足或并不適用的科學(xué)研究和政策制定。
對(duì)目前語(yǔ)言普查研究進(jìn)行比較性梳理,這一工作早就應(yīng)該做了,這對(duì)于開(kāi)發(fā)出一種更復(fù)雜的方法來(lái)測(cè)定人口普查中的社會(huì)語(yǔ)言學(xué)概念,以及對(duì)于普查數(shù)據(jù)在縱向上進(jìn)行歷時(shí)比較和橫向上進(jìn)行跨國(guó)整合,都是有必要的。在語(yǔ)言政策和規(guī)劃中,無(wú)論是作為一個(gè)研究領(lǐng)域,還是作為一種具體實(shí)踐,這一工作都是很重要的。
由于人口普查研究中對(duì)語(yǔ)言水平的測(cè)定最終取決于受訪者對(duì)一個(gè)或多個(gè)問(wèn)題的回答,因此關(guān)于這一話題,本研究聚焦于問(wèn)題語(yǔ)境和問(wèn)題形式等幾方面的特征,探究其對(duì)結(jié)果數(shù)據(jù)質(zhì)量可能帶來(lái)的影響。從上文分析可以清楚地看出,在人口普查中廣泛使用,但在大規(guī)模調(diào)查中較少使用的是非兩分型問(wèn)題高估了高語(yǔ)言水平受訪者的比例,同時(shí)低估了低水平受訪者的比例。將是非兩分型問(wèn)題置于一個(gè)組別的廣泛做法已被證明給受訪者帶來(lái)了問(wèn)題,并導(dǎo)致相互矛盾的統(tǒng)計(jì)結(jié)果。而有些令人難以捉摸的代理報(bào)告方式,也給人口普查數(shù)據(jù)蒙上了陰影,但迄今為止在文獻(xiàn)中很少受到關(guān)注。
對(duì)于那些使用現(xiàn)有普查或調(diào)查數(shù)據(jù)開(kāi)展二次分析的人而言,這些問(wèn)題都是需要考慮的重要因素。不過(guò)需要指出的是,由于篇幅原因,本文無(wú)法全面考察問(wèn)題形式和語(yǔ)境的變化對(duì)受訪者理解和回答問(wèn)題的影響。例如,與單選題和多選題有關(guān)的問(wèn)題未有討論。因此,有必要對(duì)所有這些問(wèn)題進(jìn)行進(jìn)一步的研究,研究對(duì)象應(yīng)從調(diào)查方法擴(kuò)展到所有的研究方法(例如Madans et al. 2011)。
此外,Schaeffer & Dykema(2011:917)回顧了三十年來(lái)關(guān)于調(diào)查問(wèn)題設(shè)計(jì)的研究,提出了一個(gè)重要觀點(diǎn),即對(duì)調(diào)查問(wèn)題的全面評(píng)估“需要注意調(diào)查中各種概念的理論定義和操作定義以及問(wèn)題設(shè)計(jì)中出現(xiàn)的技術(shù)問(wèn)題”。Bulmer et al.(Bulmer,Gibbs & Hyman 2010:4)也持類似觀點(diǎn),認(rèn)為“實(shí)證性數(shù)據(jù)收集必須以相關(guān)的理論概念為依據(jù),并使用這些概念構(gòu)建數(shù)據(jù)收集的理論框架”。
與語(yǔ)言測(cè)試領(lǐng)域(例如Bachman & Palmer 2010)和教育政策領(lǐng)域正在開(kāi)發(fā)的一系列測(cè)定方式相比,迄今為止在人口普查中使用的簡(jiǎn)略的語(yǔ)言水平測(cè)定方式具有顯而易見(jiàn)的局限性。不過(guò),對(duì)于大規(guī)模調(diào)查而言,那些適合在課堂或語(yǔ)言實(shí)驗(yàn)室使用的語(yǔ)言水平測(cè)試顯然過(guò)于復(fù)雜和耗時(shí)。如果將課堂語(yǔ)言測(cè)試的細(xì)致和嚴(yán)謹(jǐn)應(yīng)用于大規(guī)模調(diào)查中,調(diào)查者和受訪者將承受巨大的負(fù)擔(dān)。盡管在實(shí)質(zhì)關(guān)注以及理論和方法上都存在較大差異,在考慮人口普查中語(yǔ)言水平的測(cè)定問(wèn)題時(shí),也應(yīng)參照語(yǔ)言測(cè)試領(lǐng)域?qū)τ谡Z(yǔ)言水平概念的界定、描述和測(cè)量。
如今在多區(qū)域和多國(guó)家參與設(shè)計(jì)和管理的國(guó)際測(cè)試中,越來(lái)越多地使用自我評(píng)估問(wèn)卷。首次“歐洲語(yǔ)言能力調(diào)查”(ESLC)(European Commission 2012a)就是一個(gè)很好的例子,它結(jié)合語(yǔ)言測(cè)試和自我評(píng)估問(wèn)卷進(jìn)行了大規(guī)模語(yǔ)言測(cè)試。雖然從該調(diào)查的報(bào)告中可以清楚地看出,其使用的自我評(píng)估量表仍需要大量的進(jìn)一步發(fā)展和完善才可用于人口普查問(wèn)卷,但顯然值得注意的是,在人口普查語(yǔ)言問(wèn)題的設(shè)計(jì)中處理概念界定和實(shí)際測(cè)定之類的問(wèn)題時(shí),可以參考語(yǔ)言評(píng)估和語(yǔ)言教育政策領(lǐng)域的工作成果。
參考文獻(xiàn)
Alwin, D. F. 2007. Margins of Error: A Study of Reliability in Survey Measurement. Hoboken, NJ: Wiley.
Bachman, L. & A. Palmer. 2010. Language Assessment in Practice. Oxford: Oxford University Press.
Baffour, B., T. King & P. Valente. 2013. The Modern census: Evolution, examples and evaluation. International Statistical Review?81, 407–425.
Blalock, H. 1979. Measurement and conceptualization problems: The major obstacle to integrating theory and practice. American Sociological Review?44, 881–894.
Bulmer, M. 2010. Challenges for social measurement. In M. Bulmer, J. Gibbs & L. Hyman (eds.), Social Measurement through Social Surveys: An Applied Approach, 215–226. Farnham: Ashgate.
Bulmer, M., J. Gibbs & L. Hyman. 2010. Introduction. In M. Bulmer, J. Gibbs & L. Hyman (eds.), Social Measurement through Social Surveys: An Applied Approach, 1–8. Farnham: Ashgate.
Chiswick, B.R. & Miller. 1998. Census language questions in North America. Journal of Economic and Social Measurement?25, 73–95.
Christopher, A. J. 2011. Questions of language in the commonwealth censuses. Population, Space and Place 17, 534–549.
Cobb, C. 2015. Proxy Reporting. In J. A. Krosnick, A. Jon, S. Presser, et al. (eds.), The Future of Survey Research: Challenges and Opportunities. The National Science Foundation Advisory Committee for the Social, Behavioral and Economic Sciences Subcommittee on Advancing SBE Survey Research, 64–66.
Cohen, M. 2008. Proxy respondent. In Lavrakas P. (ed.), Encyclopedia of Survey Research Methods, 633. London: Sage.
Courbage, Y. 1998. Survey of the statistical sources on religion, language(s), national and ethnic groups in Europe. In W. Haug, Y. Courbage & P. Compton (eds.), The Demographic Characteristics of National Minorities in Certain European States, 23–74. Strasbourg: Council of Europe.
Council of Europe. 2001. Common European Framework of Reference for Languages: Learning, Teaching, Assessment. Cambridge: Cambridge University Press.
Darmody, M. & T. Daly. 2015. Attitudes Towards the Irish Language on the Island of Ireland. Dublin: Economic and Social Research Institute.
de Vries, J. 1990. On coming to our census: A laymans guide to demolinguistics. Journal of Multilingual and Multicultural Development?11, 1–2, 57–76.
de Vries, J. 2006. Language Surveys. In K. Brown (ed.), The Encyclopedia of Language and Linguistics?(2nd edn., Vol. 6), 347–368. Amsterdam: Elvesier.
Dillman, D. A. 2000. Mail and Internet Surveys: The Tailored Design Method?(rev. edn.). Hoboken, N.J.: Wiley.
Edele, A., J. Seuring, C. Kristen, et al. 2015. Why bother with testing? The validity of immigrants self-assessed language proficiency. Social Science Research?52, 99–123.
European Commission. 2012a. First European Survey on Language Competences (ESLC). Brussels: European Commission.
European Commission. 2012b. First European Survey on Language Competences (ESLC): Technical Report. Brussels: European Commission.
Fishman, J. A. 1985. Macro-sociolinguistics and the Sociology of Language in the Early Eighties. Annual Review of Sociology?11, 116.
Fishman J. A. & C. Terry. 1969. The validity of census data on bilingualism in a Puerto Rican neighborhood. American Sociological Review?34, 636–650.
Foddy, W. 1993. Constructing Questions for Interviews and Questionnaires. Cambridge: Cambridge University Press.
Fowler, F. 2014. Survey Research Methods (5th edn.). Los Angeles: Sage.
Grek, S. 2009. Governing by numbers: The PISA ‘effect in Europe. Journal of Education Policy?24, 23–37.
Hakim, C. 1985. Social monitors: Population censuses as social surveys. In M. Bulmer (ed.), Essays on the History of British Sociological Research, 39–51. Cambridge: Cambridge University Press.
Heath, A. & J. Martin. 1997. Why are there so few formal measuring instruments in social and political research. In L. Lyberg, P. Biemer, M. Collins, et al. (eds.), Survey Measurement and Process Quality, 71–86. New York: Wiley.
Higgs, G., C. Williams & D. Dorling. 2004. Use of the census of population to discern trends in the Welsh language: An aggregate analysis. Area?36, 187–201.
Jones, H. 2005. Ability to speak Welsh in the census of population: A longitudinal analysis. Population Trends, Winter 2005, No. 122, 83–86.
Kominski, R. A. 1989. How good is ‘how well? An examination of the census English-speaking ability question. Paper presented at the Annual Meeting of the American Statistical Association, 6–11 August 1989, Washington DC.
Kominski, R. A. 2012. Languages spoken. In M. J. Anderson, C. F. Citro, J. J. Salvo, et al. (eds.), Encyclopedia of the U.S. Census from the Constitution to the American Community Survey?(2nd edn.), 299–300. Washington DC: CQ Press.
Krosnick, J., C. Judd & B. Wittenbrink. 2005. The measurement of attitudes. In D. Albarracin, B. Johnson & M. Zanna (eds.), The Handbook of Attitudes, 21–76. Mahwah NJ: Erlbaum.
Krosnick J. & S. Presser. 2010. Question and questionnaire design. In P.V. Marsden & J. D. Wright (eds.), Handbook of Survey Research (2nd edn.), 263–313. Bingley, Emerald Publishing Group.
Kunnan, A. 2008. Large-scale language assessment. In E. Shohamy & N. Hornberger (eds.), Encyclopedia of Language and Education?(2nd edn.) Vol. 7, 157–176. New York: Springer.
Lieberson, S. 1966. Language questions in censuses. Sociological Inquiry 36, 262–279.
Maclean, M. & H. Genn. 1979. Methodological Issues in Social Surveys. London: Macmillan.
Madans, J., K. Miller, A. Maitland, et al. (eds) 2011. Question Evaluation Methods: Contributing to the Science of Data Quality. Hoboken, NJ: Wiley.
McConnell, G. D. 1997. Global scale sociolinguistics. In F. Coulmas (ed.), The Handbook of Sociolinguistics, 344–357. Oxford: Blackwell.
Moore, J. 1988. Self/proxy response status and survey response quality —?Review of the literature. Journal of Official Statistics?4, 155–172.
Office for National Statistics (UK).2004. Census 2001: Report on the Welsh Language: Laid before Parliament Pursuant to Section 4(1) Census Act 1920. London: TSO.
? Gliasáin, M. 1996. The Language Question in the Census. Dublin: Institiúid Teangeolaíocht ?ireann.
? Riagáin, P. 1997. Language Policy and Social Reproduction: Ireland 1893–1993. Oxford: Oxford University Press.
? Riagáin, P. 2018. Measures of Language Proficiency in Censuses and Surveys. Springer International Publishing. https://doi.org/10.1007/978-3-319-72941-1.
Oscarson, M. 1997.?Self-assessment of foreign and second language proficiency. In C. Clapham & D. Corson (eds.), The Encyclopedia of Language and Education?(Vol. 7 Language Testing and Assessment),?175–187. Dordrecht: Kluwer Academic Publishers.
Poulain, M. 2008. European migration statistics: Definitions, data and challenges. In M. Barni & G. Extra (eds.). Mapping Linguistic Diversity in Multicultural Contexts, 43–66. Berlin: Mouton de Gruyter.
Rallu, J-L., V. Piché & P. Simon.2006. Demography and ethnicity: An ambiguous relationship. In G. Caselli, J. Vallin & G. Wunsch (eds.), Demography: Analysis and Synthesis?Vol. 3, 531–550.?Amsterdam: Elsevier.
Sakshaug, J. W. 2015. Proxy reporting in health surveys. In T. P. Johnson (ed.), Handbook of Health Survey Methods, 367–381. Hoboken NJ.: Wiley.
Schaeffer N. C. & J. Dykema. 2011. Questions for surveys: Current trends and future directions. Public Opinion Quarterly?75, 909–961.
Siegel, P., E. Martin & R. Bruno. 2001. Language use and linguistic isolation: Historical data and methodological issues. In Statistical Policy Working Paper 32: 2000 Seminar on Integrating Federal Statistical Information and Processes, 167–190. Washington DC: Federal Committee on Statistical Methodology, Office of Management and?Budget.
Silver, B. 1986. The ethnic and language dimensions in Russian and Soviet censuses. In R. S. Clem (ed.), Research Guide to the Russian and Soviet Censuses, 70–97. Ithaca: Cornell University Press.
Silver, B. 2001/2002. Nationality and Language in the New Censuses of the Baltic States. Paper presented at the Annual meeting of the Association for the study of Nationalism, April 2001, Columbia University, New York.
Smith, T.W. 2003. Developing comparable questions in cross-national surveys. In J. A. Harkness, F. J. R.van de Vijver & P. Mohler (eds.), Cross-cultural Survey Methods, 69–92. New York: Wiley.
Stafford, F. P. 2010. Panel surveys: Conducting surveys over time. In P.V. Marsden & J.D. Wright (eds), Handbook of Survey Research, 765–794. Bingley: Emerald Press.
Starr, P. 1987. The sociology of official statistics. In W. Alonso & P. Starr (eds.), The Politics of Numbers, 7–57. New York: Russell Sage Foundation.
Stevens, G. 1999. A century of U.S. censuses and the language characteristics of immigrants. Demography?36, 387–397.
Tourangeau, R., L. J. Rips & K. Rasinski. 2000. The Psychology of Survey Response. Cambridge: Cambridge University Press.
責(zé)任編輯:魏曉明