梁敏
【摘要】對數(shù)據(jù)的條件分布為泊松分布的敏感問題,本文提出一種不需要知道先驗分布的廣義貝葉斯方法,得到了表達式很簡單的貝葉斯估計量.
【關(guān)鍵詞】敏感問題;隨機化回答技術(shù);廣義貝葉斯估計
【基金項目】北京師范大學珠海校區(qū)教師科研能力促進計劃項目.
一、問題的提出
對于敏感問題,人們通常采用古典的隨機化回答技術(shù)[1-2].為了利用一切可以利用的信息,Winkler和Franklin于1979年首次提出了貝葉斯方法(基于Warner模型)[3],1980年,Pitz對Simmons模型給出了貝葉斯分析[4],這些貝葉斯方法大都假定參數(shù)服從某種具體的先驗分布,但先驗分布需要根據(jù)經(jīng)驗和過去的歷史資料確定.
本文指出,對數(shù)據(jù)的條件分布為泊松分布的敏感問題,不需要知道參數(shù)的先驗分布即可算出具有敏感特征的人所占比例的貝葉斯估計量,而且其表達式很簡單.
二、廣義貝葉斯方法簡介
貝葉斯學派認為在沒有先驗信息的場合可以采取廣義先驗分布,其一般定義如下:
則稱π(θ)為θ的廣義先驗密度.
例如,在沒有先驗信息的情況下,人們對θ的任何可能取值既無偏愛,又同樣程度的不了解,因此,很自然地把θ取值范圍上的均勻分布取作θ的先驗分布,這樣當θ取值范圍是無限區(qū)間時,先驗概率密度函數(shù)不滿足
因此,不是一個正常的先驗分布,但由此算出的后驗概率密度函數(shù)卻滿足通常的性質(zhì).
一般情況下,無信息先驗分布不是唯一的,但它們對貝葉斯統(tǒng)計推斷的結(jié)果影響很小,所以任何無信息先驗分布都可以采用.當今無論在統(tǒng)計理論研究還是在應(yīng)用研究中,采用無信息先驗分布越來越多,連經(jīng)典統(tǒng)計學者也認為無信息先驗是“客觀”的,可以接受的.
三、敏感問題中的廣義貝葉斯方法
從推導(dǎo)過程可看出,我們不需要知道F(λ)具體是什么,即不需要知道λ的先驗分布,只要將實驗多進行幾次,直接根據(jù)樣本數(shù)據(jù)就可算出λ的貝葉斯估計量,此貝葉斯估計量表達式很簡單.
四、結(jié)束語
長期以來,貝葉斯方法由于需要知道未知參數(shù)的先驗分布而備受爭議,本文提出一種不需要知道先驗分布的廣義貝葉斯估計方法,得到了穩(wěn)健的貝葉斯估計量.不過,這種方法的使用要求受調(diào)查者重復(fù)同一實驗,重復(fù)次數(shù)越多效果越好,極端情況是當重復(fù)次數(shù)為無窮大時,該估計值等于真值.但無休止的重復(fù)可能會遭到拒絕,只能適當次數(shù)地重復(fù).
【參考文獻】
[1]Warner S L.Randomized response:A survey technique for eliminating evasive answer bias[J].Journal of theAmerican Statistical Association,1965(309):63-69.
[2]Horvitz D.G.Shah,B.V.Simmons etc.The Unrelated Question Randomized Response Model[J].Proceedings of Social Stati.Sec.Amer.Statist.Assoc.1967,65-72
[3]Winkler R L,F(xiàn)ranklin L A.Warners randomized response model:A Bayesian approach[J].Journal of the American Statistical Association,1979(365):207-214.
[4]Pitz,G.Bayesian analysis of randomized response models.Journal of Psychological Bulletin 87:209-212.