白高洪 楊鵬程 島寧
摘要:介紹了SPSS在市場(chǎng)調(diào)研中數(shù)據(jù)錄入的方法,以及對(duì)于錄入數(shù)據(jù)中遇到的問(wèn)題和麻煩提供了解決的方法,為人們進(jìn)一步對(duì)于SPSS在數(shù)據(jù)錄入上提供了方法。
關(guān)鍵詞:?jiǎn)柧礓浫敕绞?、?shù)據(jù)錄入、數(shù)據(jù)驗(yàn)證
一、認(rèn)識(shí)SPSS軟件
SPSS為IBM公司推出的一系列用于統(tǒng)計(jì)學(xué)分析運(yùn)算、數(shù)據(jù)挖掘、預(yù)測(cè)分析和決策支持任務(wù)的軟件產(chǎn)品及相關(guān)服務(wù)的總稱。SPSS對(duì)于調(diào)查問(wèn)卷數(shù)據(jù)的錄入和分析,更加準(zhǔn)確直觀的看出數(shù)據(jù)給我們的信息。利用SPSS錄入問(wèn)卷數(shù)據(jù)的有很多種不一樣的情況,多選題、單選題、開(kāi)放性問(wèn)題、半開(kāi)放問(wèn)題等,選用不同的錄入方法的時(shí)候要考慮到不同的功能和特點(diǎn)。
二、數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)
在錄入數(shù)據(jù)之前,首先要在變量視圖中設(shè)計(jì)調(diào)研問(wèn)卷的數(shù)據(jù)結(jié)構(gòu)。調(diào)研問(wèn)題的類型可分為開(kāi)放性問(wèn)題、半開(kāi)放性問(wèn)題、單選題、多選題,在數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)中需要采取不同的方法來(lái)處理。
(1)開(kāi)放性問(wèn)題的變量設(shè)計(jì)。
開(kāi)放性問(wèn)題是指允許被調(diào)研者自己填寫答案,而不提供選擇項(xiàng)。
例如:你的姓名?( )
開(kāi)放性問(wèn)題的變量設(shè)計(jì)只需要設(shè)計(jì)一個(gè)變量來(lái)存儲(chǔ)問(wèn)題的答案,變量的類型根據(jù)答案的內(nèi)容可以設(shè)置為字符型、數(shù)值型或日期型。變量寬度也根據(jù)答案內(nèi)容來(lái)確定,一個(gè)漢字為2個(gè)字符,一個(gè)數(shù)字或字母為一個(gè)字符。因?yàn)樽兞康膬?nèi)容需要被調(diào)研者自行錄入,所以值標(biāo)簽不需要設(shè)置。度量標(biāo)準(zhǔn)一般為名義類型。
(2)半開(kāi)放問(wèn)題的變量設(shè)計(jì)
半開(kāi)放題指有選項(xiàng),并且最后一個(gè)是開(kāi)放性的選項(xiàng),
例如:你的職業(yè)是(A、教師,B、學(xué)生,C、其他,——)
這一類題目在錄入時(shí)可以用兩個(gè)變量對(duì)其進(jìn)行定義,在第一個(gè)變量中,“其他,——”為選項(xiàng)之一;第二個(gè)變量將“其他,——”的具體內(nèi)容看做一個(gè)獨(dú)立的開(kāi)放題,按照開(kāi)放題的錄入方式進(jìn)行數(shù)據(jù)錄入,沒(méi)有選擇該選項(xiàng)的數(shù)據(jù)作為缺失值處理。
(3)單選題的變量設(shè)定
單選題的數(shù)據(jù)錄入只需要設(shè)置一個(gè)變量,然后將變量的標(biāo)簽值設(shè)置為每一個(gè)選項(xiàng)。
例如:你所在的城市是(A.成都、B.重慶、C.昆明)。
這里我們對(duì)于選項(xiàng)的編輯上,為了方便我們后期的數(shù)據(jù)的錄入一般會(huì)對(duì)數(shù)據(jù)進(jìn)行編輯,比如1代表成都,2代表重慶,3代表昆明,這樣就可以錄入到數(shù)據(jù)視圖里面。單選題的錄入有三種方式,但是為了方便問(wèn)卷后期的計(jì)算,一般我們采用數(shù)值代碼+值標(biāo)簽的形式。
(4)多選題的變量設(shè)定
多選題是調(diào)查問(wèn)卷中極為常見(jiàn)的一種問(wèn)題類型。多選題的答案至少為兩項(xiàng),選出的結(jié)果不同當(dāng)然這就需要設(shè)置多個(gè)變量來(lái)存儲(chǔ)答案,多選題的變量設(shè)定方法有兩種,多重二分法和多重分類法
第一種方法多重二分法適用于不限定最多選項(xiàng)數(shù)量的問(wèn)題。多重二分法是把多選題的每一個(gè)選項(xiàng)的選擇是否都進(jìn)行記錄,所以變量的數(shù)量與選項(xiàng)數(shù)量相等。如:你有貸款嘛?(A.車貸、B.房貸、C、其它貸款)這時(shí)候可以把這個(gè)問(wèn)題拆分成三個(gè)問(wèn)題,你有車貸嗎?(是 否)你有房貸嗎?(是 否)你有其他貸款嗎?(是 否)。然后設(shè)置三個(gè)變量來(lái)存儲(chǔ)調(diào)研的答案。
第二種方法多重分類法適用于選項(xiàng)多,但有最多選項(xiàng)數(shù)量限制的問(wèn)題,例如一個(gè)有8個(gè)選項(xiàng)的多選題,要求最多選兩項(xiàng)。針對(duì)這類問(wèn)題就可以采用多重分類法來(lái)設(shè)置變量。變量的數(shù)量與最多選擇選項(xiàng)數(shù)量相等的變量相同,一個(gè)變量錄入一個(gè)答案即可。若變量數(shù)大于選項(xiàng)數(shù),對(duì)缺少的選項(xiàng)對(duì)應(yīng)的變量采用空值處理。
三、在數(shù)據(jù)視圖里面錄入調(diào)研獲得的數(shù)據(jù)
在SPSS錄入變量的時(shí)候,對(duì)于值標(biāo)簽的設(shè)定是很有必要的。標(biāo)簽量和值的設(shè)定下我們可以更好地去錄入數(shù)據(jù),可以減少對(duì)于文字的編輯量。還可以采用Excle文件來(lái)采集數(shù)據(jù),然后復(fù)制粘貼到SPSS中,降低錄入數(shù)據(jù)的難度。
四、設(shè)置驗(yàn)證條件
檢驗(yàn)錄入數(shù)據(jù)是否符合業(yè)務(wù)規(guī)則,查找出不合規(guī)的數(shù)據(jù)。首先需要設(shè)置變量驗(yàn)證規(guī)則,驗(yàn)證規(guī)則分為單變量驗(yàn)證規(guī)則和多變量交叉驗(yàn)證規(guī)則。單變量驗(yàn)證規(guī)則可以設(shè)置錄入數(shù)據(jù)的值范圍或值列表。例如:年齡數(shù)據(jù)的錄入范圍可以設(shè)定為最大值100,最小值0。多變量交叉驗(yàn)證規(guī)則是用來(lái)約束變量之間的關(guān)系,例如在多選題的多個(gè)變量中,不能出現(xiàn)重復(fù)值。
檢查異常值(重復(fù)值、空值)對(duì)于異常值和極端值,最好的方法通過(guò)頻數(shù)表來(lái)觀察有無(wú)異常值,但是這樣過(guò)于繁瑣不便于很快的找出是哪一條記錄的問(wèn)題,最簡(jiǎn)單的方法是選擇根據(jù)自己的需要選擇變量進(jìn)行排序,這樣就可以更好的看出哪一條數(shù)據(jù)出現(xiàn)了問(wèn)題,也可以快速的對(duì)于這條記錄進(jìn)行修改。
五、數(shù)據(jù)錄入格式的規(guī)則
(1)每一個(gè)個(gè)案在不同的記錄中出現(xiàn),即每一個(gè)個(gè)案的數(shù)據(jù)應(yīng)該占據(jù)一行。
(2)每一個(gè)測(cè)量指標(biāo)/影響因數(shù)只能占據(jù)一列的位置,即同一個(gè)指標(biāo)的測(cè)量數(shù)據(jù)應(yīng)當(dāng)錄入到同一個(gè)變量中去。
六、變量視圖的幾種情況
(1)認(rèn)識(shí)變量視圖
名稱:代表這個(gè)變量的代號(hào)
類型:數(shù)值型:是用0——9的數(shù)字和其他的特殊的符號(hào)組成的類型。字符型:字符型數(shù)據(jù)以字符串方式存儲(chǔ),不能做四則運(yùn)算,但可以拆分、合并、檢索等操作。日期型:日期型數(shù)據(jù)用來(lái)存儲(chǔ)日期和時(shí)間。
測(cè)量尺度:統(tǒng)計(jì)分析中只有變量的存儲(chǔ)類型是不夠的,很多時(shí)候不能說(shuō)明變量的一些特征,這時(shí)候就需要有測(cè)量尺度。名義尺度是按照事物的某種屬性對(duì)其進(jìn)行分類或分組,變量的取值僅代表類別差異,不能比較各類大小。有序尺度是對(duì)事物之間等級(jí)或順序的差別的一種測(cè)量,可以比較優(yōu)劣或排序。定距尺度是對(duì)事物類別或次序之間間距的測(cè)量。定比尺度是能夠測(cè)算兩個(gè)測(cè)度值之間的比值的一種計(jì)量尺度。等距尺度和定比尺度統(tǒng)稱為“標(biāo)度”。
標(biāo)簽:可以對(duì)變量含義進(jìn)行詳細(xì)說(shuō)明
值:可以對(duì)變量的取值的含義加以說(shuō)明。
缺失值:用于設(shè)定自定義缺失值,主要用于問(wèn)卷數(shù)據(jù)
參考文獻(xiàn):
[1]張文彤,鄺春偉著 《SPSS統(tǒng)計(jì)分析基礎(chǔ)教程》第2版
[2]方穎《利用SPSS軟件處理臨床治療率》[J]《醫(yī)學(xué)理論與實(shí)踐》2011
作者簡(jiǎn)介:白高洪(1996.09-)男,研究方向:數(shù)據(jù)營(yíng)銷;楊鵬程(1997.06)男,研究方向:數(shù)據(jù)營(yíng)銷;島寧(1978.05-)女,講師,研究方向:數(shù)據(jù)營(yíng)銷。