王 森
(作者單位:江蘇省海安市李堡鎮(zhèn)初級(jí)中學(xué))
抽樣調(diào)查是常用的調(diào)查方式之一,但隨機(jī)抽取樣本有一定的原則,若抽取時(shí)太過隨機(jī),有時(shí)會(huì)使樣本的代表性失真,這時(shí)需要進(jìn)行“干預(yù)”,以便使隨機(jī)抽取的樣本更有代表性,讓抽樣調(diào)查更能反映總體的情況。以下面兩例分析隨機(jī)抽樣造成偏差太大的原因,并提出一些改進(jìn)建議。
例1 小明同學(xué)為了調(diào)查全市初中生人數(shù),對(duì)自己所在城區(qū)人口和城區(qū)初中生人數(shù)作了抽樣調(diào)查:城區(qū)人口約3萬,初中生人數(shù)約1200。全市人口實(shí)際約300萬,為此他推斷全市初中生人數(shù)為12萬。但市教育局提供的全市初中生人數(shù)約8萬,與估計(jì)數(shù)據(jù)有很大偏差。請(qǐng)你用所學(xué)的統(tǒng)計(jì)知識(shí),幫助他分析造成很大偏差的原因。
【解析】由抽樣調(diào)查的原則知小明同學(xué)這次抽樣僅選取了城區(qū)人口,不能很好地代表全市人口,所以估計(jì)的初中生人數(shù)與實(shí)際人數(shù)有較大差距。其錯(cuò)誤原因是抽樣沒有代表性,沒有考慮城區(qū)與農(nóng)村兩種區(qū)域代表。
例2 小剛、小強(qiáng)和小穎住在同一小區(qū)中,在學(xué)習(xí)了“數(shù)據(jù)的收集與整理”后,他們用不同的方法調(diào)查了解所在小區(qū)中小朋友的年齡情況:小剛調(diào)查了當(dāng)天在院子里玩耍的小朋友,情況如圖1;小強(qiáng)調(diào)查了他所居住的二單元的小朋友,情況如圖2;小穎調(diào)查了每個(gè)單元一樓的兩家住戶家中小朋友的年齡,數(shù)據(jù)如下:
3,16,14,15,17,8,4,6,9,7,17,12,2,13,6,5,12,14,3,15,5,16,1,1(單位:歲)。
圖1
圖2
這個(gè)小區(qū)中小朋友的年齡情況到底如何?你認(rèn)為誰的調(diào)查方式好一些,為什么?如果你去調(diào)查的話,有沒有更好的方案?
【解析】這個(gè)小區(qū)中小朋友年齡在0~7歲比例最多,14~17歲占比第二,7~14歲的小朋友占比最少。
三個(gè)人中,以小穎的調(diào)查好一些。原因如下:小剛調(diào)查的范圍只是當(dāng)天在院子里玩耍的小朋友,在特定時(shí)間段與特定的地點(diǎn)(院子里)去進(jìn)行這樣的調(diào)查時(shí),抽樣一般不具有代表性;而小強(qiáng)調(diào)查的只是住在二單元的小朋友,對(duì)象較少,不具有廣泛性;相對(duì)來說,小穎調(diào)查的效果較好。
解后回顧:為使樣本更具代表性,這個(gè)問題的抽樣還可以進(jìn)一步優(yōu)化,比如我們?cè)谡{(diào)查前應(yīng)認(rèn)真規(guī)劃好抽樣的方案,應(yīng)用抽簽法對(duì)不同單元、不同樓層進(jìn)行調(diào)查,體現(xiàn)樣本抽取的隨機(jī)性、代表性和廣泛性。