魏斐斐 張飄飄
摘 要:為改善城市居民的健康狀態(tài),降低慢性非傳染性疾病患病率,結(jié)合新版《中國居民膳食指南》標(biāo)準(zhǔn),提出一種對(duì)城市居民飲食習(xí)慣合理性評(píng)價(jià)方法。根據(jù)某地區(qū)居民生理指標(biāo)數(shù)據(jù)應(yīng)用TOPSIS模型進(jìn)行健康狀態(tài)打分,取得分的90%分位數(shù)作為界定閾值,把健康狀態(tài)分為健康與非健康兩類,將是否健康與飲食習(xí)慣是否合理相對(duì)應(yīng),以減少人工數(shù)據(jù)標(biāo)簽誤差。再選定對(duì)應(yīng)的飲食含量指標(biāo),建立Logistic回歸模型對(duì)居民飲食習(xí)慣進(jìn)行合理性評(píng)價(jià),結(jié)果表明模型準(zhǔn)確率為90%,AUC值為0.86,說明模型較穩(wěn)健,能夠?qū)υ摰貐^(qū)城市居民飲食習(xí)慣合理性做出較好的評(píng)價(jià),為其他地區(qū)居民飲食習(xí)慣合理性評(píng)價(jià)提供參考。
關(guān)鍵詞:TOPSIS模型;Logistic模型;飲食習(xí)慣;合理性評(píng)價(jià)
A Study on the Reasonableness Evaluation Method of Urban Residents Dietary Habits
WEI Feifei1, ZHANG Piaopiao2
(1.Guizhou Institute of Technology, Guiyang 550000, China; 2.Development and Reform Bureau of Xinpu New Area, Zunyi City, Guizhou, Zunyi 563000, China)
Abstract:In order to improve the health status of urban residents and reduce the incidence of chronic non communicable diseases, a method for evaluating the rationality of urban residents dietary habits is proposed based on the new version of the Chinese Dietary Guidelines for Residents. Based on the physiological indicator data of residents in a certain area, the TOPSIS model is applied to score the health status. The 90% percentile of the score is used as the defining threshold, and the health status is divided into two categories: healthy and non healthy. The health status corresponds to the rationality of dietary habits, reducing manual data labeling errors. Then select the corresponding dietary content indicators and establish a logistic regression model to evaluate the rationality of residents dietary habits. The results show that the accuracy of the model is 90%, and the AUC value is 0.86, indicating that the model is relatively robust and can make a good evaluation of the rationality of urban residents dietary habits in the region, providing reference for the evaluation of the rationality of residents dietary habits in other regions.
Key words: TOPSIS model; Logistic model; dietary habits; reasonability evaluation
以心腦血管疾病、糖尿病、惡性腫瘤以及慢性阻塞性肺病為代表的慢性非傳染性疾病已經(jīng)成為影響我國居民身體健康的重要因素。隨著人們生活方式與飲食習(xí)慣的改變,慢性病的患病率持續(xù)升高。2020年《中國居民營養(yǎng)與慢性病狀況報(bào)告》指出,我國18周歲以上成人糖尿病患病率約為11.9%、高血壓患病率約為27.5%,40周歲以上高膽固醇血癥患病率約為8.2%、慢性阻塞性肺病患病率約為13.6%,可見慢性病嚴(yán)重影響著我國居民的健康[1]。
我國飲食文化歷史悠久、源遠(yuǎn)流長,不同地區(qū)的菜系風(fēng)格不同,部分地區(qū)重口味而輕營養(yǎng),導(dǎo)致居民逐漸養(yǎng)成了不良的飲食習(xí)慣[2]。聚餐活動(dòng)多以過辣、過咸、過燙和過甜的食物為主,日常飲食中也偏愛動(dòng)物內(nèi)臟、禽肉等食物,而較少食用水果、蔬菜等。居民缺乏對(duì)飲食習(xí)慣、慢性病、膳食指南等知識(shí)的了解,形成了不規(guī)律的飲食習(xí)慣,對(duì)油、鹽、酒等攝入量把控不合理,導(dǎo)致患慢性病的風(fēng)險(xiǎn)
增加[3]。
飲食不平衡、不合理是引發(fā)慢性非傳染性疾病的重要因素[4-5]。體能直接影響人們的精神狀態(tài)與身體狀態(tài),飲食習(xí)慣與體能也呈正相關(guān)關(guān)系,這足以說明飲食習(xí)慣的重要性[6]。最新發(fā)布的《中國居民膳食指南》提出平衡膳食八項(xiàng)準(zhǔn)則,包括食物多樣、合理搭配,吃動(dòng)平衡、健康體重,多吃蔬果、奶類、全谷、大豆,適量吃魚、禽、蛋、瘦肉,少鹽少油、控糖限酒,規(guī)律進(jìn)餐、足量飲水,會(huì)烹會(huì)選、會(huì)看標(biāo)簽,公筷分餐、杜絕浪費(fèi),對(duì)居民日常飲食習(xí)慣提出了更高的要求[7]。
人體健康狀況與飲食習(xí)慣關(guān)系密切,日常生活中如何養(yǎng)成健康的飲食習(xí)慣和生活方式,保障身體健康,是全社會(huì)普遍關(guān)注的問題。對(duì)城市居民的飲食習(xí)慣進(jìn)行合理性評(píng)價(jià)對(duì)于促使城市居民養(yǎng)成良好的飲食習(xí)慣具有十分重要的意義。
1 數(shù)據(jù)與方法
1.1 數(shù)據(jù)來源與變量
本研究使用的數(shù)據(jù)來源于2023年深圳杯數(shù)學(xué)建模競賽A題中某市衛(wèi)生健康研究部門對(duì)城市居民所做的慢性非傳染性疾病及其相關(guān)影響因素流行病學(xué)調(diào)查結(jié)果[8]。該調(diào)查共有7 709例被調(diào)查者,通過對(duì)數(shù)據(jù)進(jìn)行變量選擇、空值處理、異常值處理,篩選出7 611份有效數(shù)據(jù)。
選取收縮壓、舒張壓、脈搏、膽固醇、血糖、高密度脂蛋白、低密度脂蛋白、甘油三酯、尿酸、BMI及腰臀比作為健康評(píng)價(jià)模型的評(píng)價(jià)指標(biāo);選取是否飲酒、是否吃薯類、是否吃禽肉、是否喝鮮奶、是否吃蛋類、是否吃豆腐、是否吃新鮮蔬菜、是否吃水果、植物油食用量以及鹽食用量作為飲食習(xí)慣合理性評(píng)價(jià)模型的評(píng)價(jià)指標(biāo)。
1.2 方法
為避免人工打標(biāo)簽的主觀性,本研究采用TOPSIS模型對(duì)城市居民的生理數(shù)據(jù)進(jìn)行健康打分,取評(píng)分的90%分位數(shù)作為健康評(píng)價(jià)閾值,≥評(píng)分的90%分位數(shù)即為健康,否則為非健康,健康即認(rèn)為飲食合理,不健康即認(rèn)為飲食不合理。根據(jù)飲食習(xí)慣指標(biāo)數(shù)據(jù)建立Logistic回歸模型,對(duì)居民的飲食習(xí)慣進(jìn)行評(píng)價(jià),使用Python語言的相關(guān)軟件包進(jìn)行數(shù)據(jù)分析及可視化[9-10]。
2 居民健康狀況評(píng)價(jià)
2.1 健康生理指標(biāo)
人身體健康的生理指標(biāo)具有一定范圍[11],且男女之間有差異,男性收縮壓、舒張壓、脈搏、膽固醇、血糖、高密度脂蛋白、低密度脂蛋白、甘油三酯、尿酸、BMI、腰臀比指標(biāo)對(duì)應(yīng)的正常值見表1,女性相關(guān)指標(biāo)對(duì)應(yīng)的正常值見表2。
2.2 TOPSIS方法
2.2.1 同趨勢(shì)化處理
由于選取的指標(biāo)均是區(qū)間型,需對(duì)各指標(biāo)進(jìn)行正向化處理,設(shè)第i個(gè)指標(biāo)為{xi},且最佳區(qū)間為[a,b],該指標(biāo)數(shù)據(jù)正向化數(shù)據(jù)公式為[12]
(1)
(2)
假設(shè)有n個(gè)評(píng)價(jià)對(duì)象,m個(gè)指標(biāo),則正向化矩陣為
2.2.2 歸一化處理
對(duì)矩陣進(jìn)行標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化公式為,
得到標(biāo)準(zhǔn)化矩陣為
2.2.3 確定最優(yōu)解與最劣解
定義,其中
;
定義,其中
。
2.2.4 計(jì)算得分
假設(shè)第i(i=1,2,……,n)個(gè)評(píng)價(jià)對(duì)象與最大值的距離為,第i(i=1,2,……,n)個(gè)評(píng)價(jià)對(duì)象與最小值的距離為,則可以計(jì)算出第i(i=1,2,……,n)個(gè)評(píng)價(jià)對(duì)象的得分為,取得分的90%為劃分閾值,男性健康劃分閾值為0.495 4,女性健康劃分閾值為0.496 1。將得分大于等于閾值的數(shù)據(jù)判斷為健康,小于等于閾值的數(shù)據(jù)判斷為非健康,得到健康數(shù)據(jù)765例,非健康數(shù)據(jù)6 846例。
3 飲食習(xí)慣合理性分析
依據(jù)居民生理數(shù)據(jù)對(duì)健康狀況進(jìn)行判斷,將健康視為飲食習(xí)慣合理,非健康視為飲食習(xí)慣不合理,建立Logistic回歸模型,對(duì)居民飲食習(xí)慣進(jìn)行評(píng)價(jià)
(1=健康=合理,0=不健康=不合理)[13]。
3.1 Logistic回歸模型
Logistic回歸模型是一種廣義線性回歸模型,常用于數(shù)據(jù)挖掘、經(jīng)濟(jì)預(yù)測等研究領(lǐng)域,其原理是通過對(duì)自變量數(shù)據(jù)集評(píng)估事件發(fā)生的概率,判斷數(shù)據(jù)所屬類別,達(dá)到分類效果,可用于二分類與多分類任務(wù)。
在二分類任務(wù)中,y∈{0,1},其分類表達(dá)式為Sigmoid函數(shù),將線性回歸的z=wTx+b代入上式可得到與,將y看做樣本x作為正例的可能性,則1-y是其為反例的可能性,兩者的比值稱為幾率,幾率反映樣本作為反例的相對(duì)可能性,稱為對(duì)數(shù)幾率,該模型的本質(zhì)是用線性回歸模型的預(yù)測結(jié)果逼近真實(shí)標(biāo)記的對(duì)數(shù)幾率,因此稱為對(duì)數(shù)幾率回歸或者Logistic回歸模型,求解模型時(shí)常采用極大似然估計(jì)法求解模型中的參數(shù)w與b。Logistic回歸模型可直接對(duì)分類可能性建模,無須事先假設(shè)數(shù)據(jù)的分布,避免假設(shè)數(shù)據(jù)分布不準(zhǔn)確帶來的誤差。
3.2 Logistic模型結(jié)果分析
對(duì)飲食指標(biāo)數(shù)據(jù)建立Logistic回歸模型,模型結(jié)果為Logit(p)=-2.839 8+(-0.026 1)×是否飲酒
+0.535 5×是否吃薯類+(-0.464 9)×是否吃禽肉
+(-1.307 8)×是否吃鮮奶+0.666 2×是否吃蛋類
+(-0.179 6)×是否吃豆腐+0.150 1×是否吃新鮮蔬菜+0.288 7×是否吃水果+(-0.241 7)×植物油食用量
+(-0.223 2)×鹽食用量。由模型可知,該地區(qū)居民增加薯類、蛋類、新鮮蔬菜、水果的攝入量能增加健康的概率,飲酒、過度食用植物油和鹽會(huì)降低健康概率。對(duì)模型的準(zhǔn)確率與AUC值進(jìn)行評(píng)價(jià),Logistic回歸模型的準(zhǔn)確率為90%,AUC值為 0.86,說明該模型較穩(wěn)健,能夠?qū)υ摰貐^(qū)的城市居民飲食習(xí)慣進(jìn)行合理性評(píng)價(jià)。ROC曲線如圖1。
4 結(jié)論
采用TOPSIS模型對(duì)城市居民的生理數(shù)據(jù)進(jìn)行健康打分,將其作為飲食習(xí)慣是否合理的評(píng)判依據(jù),避免人工打標(biāo)簽的主觀性,使數(shù)據(jù)標(biāo)簽更具說服力。選取某地區(qū)的城市居民飲食與身體健康數(shù)據(jù)作為實(shí)證數(shù)據(jù),能對(duì)居民健康狀態(tài)進(jìn)行合理評(píng)價(jià),在推廣應(yīng)用時(shí),應(yīng)結(jié)合不同地區(qū)的實(shí)際數(shù)據(jù)確定閾值,保證結(jié)果的準(zhǔn)確性。
利用Logistic回歸模型學(xué)習(xí)城市居民的飲食習(xí)慣特征,對(duì)個(gè)人飲食習(xí)慣進(jìn)行合理性評(píng)價(jià),結(jié)果表明模型準(zhǔn)確率為90%,AUC值為0.86,說明模型較穩(wěn)健,能對(duì)該地區(qū)城市居民飲食習(xí)慣合理性進(jìn)行評(píng)價(jià)。由該回歸模型方程可知,該地區(qū)居民增加薯類、蛋類、新鮮蔬菜、水果的攝入量能增加健康的概率,飲酒、過度食用植物油和鹽可導(dǎo)致健康概率降低。本文通過TOPSIS模型與Logistic回歸模型對(duì)城市居民城市飲食習(xí)慣合理性進(jìn)行評(píng)價(jià),為其他地區(qū)居民飲食習(xí)慣合理性評(píng)價(jià)研究提供參考。
參考文獻(xiàn)
[1]中國居民營養(yǎng)與慢性病狀況報(bào)告(2020年)[J].營養(yǎng)學(xué)報(bào),2020,42(6):521.
[2]謝叢尚.飲食習(xí)慣與慢性病相關(guān)性研究綜述[J].中國初級(jí)衛(wèi)生保健,2022,36(11):66-67.
[3]邢花,朱金亞.海門市城鎮(zhèn)居民營養(yǎng)知識(shí)、態(tài)度和飲食行為調(diào)查[J].中國初級(jí)衛(wèi)生保健,2015,29(2):90-91.
[4]于冬梅,付萍,許曉麗,等.2010-2012年中國成年居民血壓升高狀況[J].中華預(yù)防醫(yī)學(xué)雜志,2015,49(4):
320-324.
[5]趙冬.中國成人高血壓流行病學(xué)現(xiàn)狀[J].中國心血管雜志,2020,25(6):513-515.
[6]戚海兵,劉媛.飲食習(xí)慣與鍛煉對(duì)大學(xué)生體質(zhì)影響的評(píng)價(jià)體系研究[J].淮海工學(xué)院學(xué)報(bào)(人文社會(huì)科學(xué)版),2017,15(1):113-115.
[7]佚名.新版《中國居民膳食指南》發(fā)布提出平衡膳食8條準(zhǔn)則[J].食品與健康,2022,34(6):4.
[8]佚名.2023年“深圳杯”數(shù)學(xué)建模挑戰(zhàn)賽A題-影響城市居民身體健康的因素分析[EB/OL].(2023-07-25)[2023-09-12].http://www.m2ct.org/view-page.jsp?editId=12&uri=0D00279&pageType=sy.
[9]The SciPy community.Statistical functions(scipy.stats)[EB/OL].(2023-6-8)[2023-09-12].https://docs.scipy.org/doc/scipy/reference/stats.html#.
[10]The Matplotlib Development Team.Matplotlib:
Visualization with Python[EB/OL].(2023-6-15)[2023-09-12].
https://matplotlib.org/.
[11]徐潔,沈佼,程鎏.3279例65歲以上老人體質(zhì)量指數(shù)與部分健康指標(biāo)關(guān)系研究[J].中國實(shí)用醫(yī)藥,2015,10(10):267-268.
[12]UMAIR T,DOMINIKOS M K,NIKOS R,et al.A fuzzy TOPSIS model for selecting digital technologies in circular supply chains[J].Supply Chain Analytics,2023,4:100038.
[13]張新月,沙凱輝,宋淑霞,等.基于Logistic回歸模型與決策樹模型分析缺血性腦卒中后抑郁影響因素[J].護(hù)理研究,2023,37(18):3293-3300.