国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

CSPro軟件在中國(guó)總膳食調(diào)查研究數(shù)據(jù)庫(kù)構(gòu)建中的應(yīng)用*

2012-03-11 14:01東南大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系210009李萬(wàn)慶王燦楠蔣文瀚
關(guān)鍵詞:數(shù)據(jù)項(xiàng)字典表格

東南大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系(210009) 李萬(wàn)慶 閔 捷 劉 沛 王燦楠 田 野 蔣文瀚

普查與調(diào)查數(shù)據(jù)處理系統(tǒng)(The Census and Survey Processing System,CSPro)是由美國(guó)普查局開(kāi)發(fā)、中國(guó)國(guó)家統(tǒng)計(jì)局計(jì)算中心進(jìn)行漢化移植的一個(gè)免費(fèi)應(yīng)用軟件。該軟件具有數(shù)據(jù)錄入、核查、雙份比較、合并、數(shù)據(jù)轉(zhuǎn)出且與其他軟件兼容等優(yōu)良特性,當(dāng)某些復(fù)雜調(diào)查由多級(jí)調(diào)查問(wèn)卷組成時(shí),CSPro可以用樹(shù)形結(jié)構(gòu)顯示隸屬關(guān)系,同時(shí)通過(guò)后臺(tái)編程使數(shù)據(jù)錄入質(zhì)量得到很好地保證,比較適合由多級(jí)調(diào)查問(wèn)卷組成且調(diào)查對(duì)象較多的現(xiàn)場(chǎng)調(diào)查。本文以2011年中國(guó)總膳食調(diào)查研究數(shù)據(jù)庫(kù)構(gòu)建為例,介紹CSPro軟件及其在中國(guó)總膳食調(diào)查研究數(shù)據(jù)庫(kù)構(gòu)建中的具體使用方法。

編寫數(shù)據(jù)字典

1.CSPro的數(shù)據(jù)字典,通過(guò)對(duì)級(jí)(level)、記錄(record)、數(shù)據(jù)項(xiàng)(item)和值集的定義來(lái)顯示所有表與表之間、表與變量之間的隸屬結(jié)構(gòu)關(guān)系以及每個(gè)變量的輸入類型、輸入范圍和輸入值限制,以便將來(lái)生成結(jié)構(gòu)清晰的三級(jí)調(diào)查表格數(shù)據(jù)庫(kù)〔1〕。一個(gè)數(shù)據(jù)字典可有n個(gè)級(jí)為第一級(jí),每級(jí)有n個(gè)記錄為第二級(jí),所有記錄的第一個(gè)均為id項(xiàng),每個(gè)記錄有n個(gè)數(shù)據(jù)項(xiàng)為第三級(jí),每級(jí)可由符號(hào)‘+’‘-’展開(kāi)。圖1為我們構(gòu)建的中國(guó)總膳食調(diào)查研究的多級(jí)整體結(jié)構(gòu)示意圖,它包括總膳食研究、食物編碼、recipecodes三個(gè)并列的數(shù)據(jù)字典,總膳食研究數(shù)據(jù)字典是總庫(kù),食物編碼和cecipecodes數(shù)據(jù)字典為質(zhì)量控制關(guān)聯(lián)子庫(kù)。其中,總膳食研究數(shù)據(jù)字典包含第一級(jí)總膳食研究questionnaire,總膳食研究questionnaire又包含第二級(jí)id、訪問(wèn)時(shí)間、完成質(zhì)量、家庭實(shí)物量登記表、家庭成員每人每日用餐登記表、三日家庭成員每日膳食詢問(wèn)表等記錄。而每個(gè)記錄又包含第三級(jí)多個(gè)數(shù)據(jù)項(xiàng),如id記錄下包含省份、城市、農(nóng)村、市、縣、居委會(huì)、村、調(diào)查戶等數(shù)據(jù)項(xiàng)。

2.在級(jí)的水平下對(duì)每個(gè)記錄項(xiàng)進(jìn)行設(shè)置,見(jiàn)圖2,列出級(jí)下四個(gè)記錄的設(shè)置,Type Value取不同的值區(qū)分不同類型的記錄,Required選Yes代表該記錄項(xiàng)為必填項(xiàng)目,Max取值表示每張表行數(shù)最大值,即四個(gè)記錄以4張表格形式出現(xiàn),每個(gè)表格的行數(shù)分別為4行,1行,60行和20行。

圖1 中國(guó)總膳食調(diào)查研究數(shù)據(jù)字典多級(jí)整體結(jié)構(gòu)示意

圖2 部分記錄的定義示意

3.每個(gè)記錄項(xiàng)下都包含n個(gè)數(shù)據(jù)項(xiàng),對(duì)于每個(gè)數(shù)據(jù)項(xiàng)可以從左到右依次定義變量標(biāo)簽,變量名,變量在總表中起始位數(shù)、變量長(zhǎng)度、變量類型(有Alpha和Num型)、變量類別、變量重復(fù)次數(shù)、有無(wú)小數(shù)點(diǎn)、小數(shù)點(diǎn)是否顯示、空值是否用0補(bǔ)齊〔1〕。如圖3對(duì)調(diào)查對(duì)象id記錄下的各數(shù)據(jù)項(xiàng)進(jìn)行變量設(shè)置。

4.我們可以對(duì)每一個(gè)數(shù)據(jù)項(xiàng)的集值進(jìn)行設(shè)置。如圖4中對(duì)生理狀態(tài)的輸入范圍進(jìn)行設(shè)置,正??捎?替代,孕婦可用1替代,乳母可用2替代,如果允許空缺,可設(shè)置missing,否則special選項(xiàng)設(shè)為空。設(shè)置好后在錄入時(shí)如果輸入其他值時(shí)就會(huì)顯示出錯(cuò)提示信息。

圖3 部分?jǐn)?shù)據(jù)項(xiàng)的定義示意

圖4 數(shù)據(jù)項(xiàng)輸入值設(shè)定示意

生成表格

1.三級(jí)數(shù)據(jù)字典編好后,點(diǎn)edit-generate forms,自動(dòng)形成三級(jí)調(diào)查表格。中國(guó)總膳食研究調(diào)查數(shù)據(jù)庫(kù)的部分表單如圖1所示,可以清晰的看到它們之間的隸屬關(guān)系,每張表分別與上述數(shù)據(jù)字典一一對(duì)應(yīng)。

2.中國(guó)總膳食調(diào)查研究數(shù)據(jù)庫(kù)中家庭食物登記表部分見(jiàn)圖5,因?yàn)樵跀?shù)據(jù)字典中我們對(duì)家庭食物登記表這一紀(jì)錄的最大行數(shù)max定義為60,故生成的該表格有60行,而且該記錄下每個(gè)數(shù)據(jù)項(xiàng)都有60行。

圖5 家庭食物登記表中信息輸入形式示意

編輯邏輯代碼程序

1.邏輯限制 CSPro有自己的編程語(yǔ)言,點(diǎn)viewlogic,進(jìn)入邏輯代碼編輯頁(yè)面,可以對(duì)每一個(gè)變量進(jìn)行進(jìn)一步邏輯限制,并設(shè)置輸入糾錯(cuò)提示。如在家庭成員每日用餐表中對(duì)調(diào)查人員的描述,當(dāng)性別為男時(shí),生理狀態(tài)就不能為乳母或孕婦,對(duì)生理狀態(tài)v28定義的程序如下:

Proc v28if$=2 or 3&a2=1 then errmsg(“男性生理狀態(tài)不能為乳母或孕婦”);reenter;endif;

其中,$指代當(dāng)前定義變量生理狀態(tài)v28,v28=2 or 3指代生理狀態(tài)孕婦或乳母,a2=1指性別為男性,errmsg()函數(shù)能夠?qū)崿F(xiàn)在錄入過(guò)程中數(shù)據(jù)輸入不符合要求時(shí)顯示括號(hào)內(nèi)的提示內(nèi)容。

2.變量間的自動(dòng)運(yùn)算 如在家庭食物量登記表中已經(jīng)依次輸入第一、二、三日購(gòu)進(jìn)量,則三日總購(gòu)進(jìn)量會(huì)自動(dòng)計(jì)算并填入。程序如下:

Proc v20apostproc v20a=v24a+v24b+v24c;

其中 v20a、v24a、v24b、v24c 分別為三日總購(gòu)進(jìn)量、第一、二、三日購(gòu)進(jìn)量。

3.跳轉(zhuǎn)的設(shè)置 當(dāng)一張表需要輸入的內(nèi)容已經(jīng)輸完,但表格行數(shù)的設(shè)置常大于等于需要的行數(shù),就需要進(jìn)行跳轉(zhuǎn)設(shè)置,我們?cè)谥袊?guó)總膳食研究調(diào)查數(shù)據(jù)庫(kù)中設(shè)置為當(dāng)該表的前兩個(gè)變量均輸入為空時(shí)跳轉(zhuǎn)至下一張表格。程序如下:

Proc v2aif$=missing&a1b=missing then skip to va1;endif;

其中,v2a和a1b均為當(dāng)前表的前兩個(gè)變量,va1為下張表的第一個(gè)變量。

4.通過(guò)關(guān)聯(lián)的質(zhì)控文件進(jìn)行限制〔2〕在總膳食調(diào)查數(shù)據(jù)庫(kù)構(gòu)建中,對(duì)所有要輸入的食物編碼,我們以楊月欣編撰的2002、2004中國(guó)食物營(yíng)養(yǎng)成份表中的編碼為依據(jù)進(jìn)行輸入限制。同編輯總庫(kù)一樣再編輯一個(gè)食物編碼子庫(kù),定義數(shù)據(jù)字典,形成錄入表格后,進(jìn)入錄入界面,輸入所有編碼,也可以從已有的電子文件中提取食物編碼,以文本文件形式導(dǎo)入到食物編碼子庫(kù)中,再將總膳食研究與食物編碼子庫(kù)連接,就可以對(duì)總庫(kù)中的食物編碼變量v14進(jìn)行l(wèi)ogic限制〔2〕,如果輸入的食品編碼在子庫(kù)定義的食物編碼范圍內(nèi),我們認(rèn)為是正確的,否則,輸入時(shí)會(huì)自動(dòng)提示“食物編碼不符合”。程序如下:

Proc v14postproc foodcode=$;if loadcase(foodcode_dict,foodcode)=0 then errmsg(食物編碼不符合);reenter;endif;

當(dāng)輸入到食物編碼變量時(shí)會(huì)自動(dòng)裝載foodcode子庫(kù)中的值并與當(dāng)前輸入值進(jìn)行比對(duì),如果不符合則自動(dòng)跳出“食物編碼不符合”提示框。

從編寫數(shù)據(jù)字典對(duì)各級(jí)level,各記錄record,各數(shù)據(jù)項(xiàng)item進(jìn)行數(shù)據(jù)庫(kù)名稱、各表格行數(shù)、變量名、數(shù)值類型、長(zhǎng)度、小數(shù)點(diǎn)位數(shù)、取值范圍等進(jìn)行定義,到自動(dòng)生成表格,再到logic中對(duì)變量進(jìn)行邏輯限制和自動(dòng)運(yùn)算,一個(gè)完整嚴(yán)格的調(diào)查數(shù)據(jù)庫(kù)就建立了。

討 論

CSPro尤其適用于設(shè)計(jì)復(fù)雜的多級(jí)表格數(shù)據(jù)庫(kù)。CSPro表格中每一列在構(gòu)建數(shù)據(jù)字典時(shí)只需要設(shè)置一個(gè)變量,如食品編碼v14,并設(shè)置該列有60行,CSPro會(huì)自動(dòng)為每一行格子從v14_01到v14_60依次自動(dòng)分配變量,并可對(duì)其進(jìn)行邏輯編輯。其次,CSPro在邏輯核查中可調(diào)用外部數(shù)據(jù)集文件進(jìn)行比對(duì)。在復(fù)雜調(diào)查由多級(jí)調(diào)查問(wèn)卷組成時(shí),CSPro可用樹(shù)形結(jié)構(gòu)顯示其隸屬關(guān)系,并通過(guò)變量編輯、各種邏輯限制和及時(shí)的輸入糾錯(cuò)提示功能等確保一次錄入就有較高的準(zhǔn)確度,相信以后在公共衛(wèi)生調(diào)查研究中會(huì)逐步得到更廣泛的應(yīng)用。

1.美國(guó)普查局國(guó)際項(xiàng)目中心,中國(guó)國(guó)家統(tǒng)計(jì)局計(jì)算中心.CSPro快速入門教程.http://www.stats.gov.cn/tdjt/xgzlxz/.

2.International Programs Center Population Division U.S.Census Bureau.CSPro User Guide Version 4.1.http://www.census.gov/population/international/software/cspro/.

猜你喜歡
數(shù)據(jù)項(xiàng)字典表格
國(guó)六柴油車遠(yuǎn)程排放監(jiān)測(cè)數(shù)據(jù)項(xiàng)間相關(guān)性特征研究*
《現(xiàn)代臨床醫(yī)學(xué)》來(lái)稿表格要求
基于相似度的蟻群聚類算法?
統(tǒng)計(jì)表格的要求
非完整數(shù)據(jù)庫(kù)Skyline-join查詢*
基于Python的Asterix Cat 021數(shù)據(jù)格式解析分析與實(shí)現(xiàn)
字典的由來(lái)
履歷表格這樣填
大頭熊的字典
表格圖的妙用