羅曉潔, 王 卉, 張崇林
(1.上海體育學(xué)院 體育教育訓(xùn)練學(xué)院,上海 200438; 2.井岡山大學(xué) 體育學(xué)院,江西 吉安 343009)
BMI和BFP均是評價營養(yǎng)狀況的指標(biāo)。BMI只反映整體的營養(yǎng)狀態(tài),而BFP除反映機(jī)體營養(yǎng)狀態(tài)之外還能預(yù)測內(nèi)臟脂肪,是心血管疾病、糖尿病、代謝紊亂的獨立危險因子。世界衛(wèi)生組織(WHO)定義BMI大于25 kg/m2為超重,大于30 kg/m2為肥胖[1],而適合中國人群的超重和肥胖判定標(biāo)準(zhǔn)分別為24 kg/m2和28 kg/m2[2],但BMI無法體現(xiàn)身高降低、體脂增加以及體脂的向心性沉積等衰老特性[3]。另外,整個成年期BMI相同,但女性BFP顯著高于男性[4-5]。因此,在不同年齡和性別人群BMI與BFP具有顯著性差異[6-7]。WHO認(rèn)定的正常體脂范圍女性為20%~25%,而男性為10%~15%[8],BFP的差異受激素、激素受體以及酶濃度的影響。女性高濃度的脂蛋白酶、不同性別間腎上腺素的類型及其受體數(shù)量差異,或許可解釋性別間BFP差異的原因[9]。另外,女性雌激素可減弱餐后脂肪酸的氧化而增加胰島素抵抗和高瘦素水平導(dǎo)致女性BFP較高[10]。
BMI與BFP之間是線性關(guān)系還是曲線關(guān)系還存在爭議[7-11]。先前有學(xué)者基于統(tǒng)計方法確定了BMI與BFP之間線性和二次公式的系數(shù)。這些公式十分類似,都是用性別、年齡和BMI預(yù)測BFP。
(1) Kupusinac公式[12]
BFP=0.8585 × BMI + 9.6576
BFP=-0.0174× BMI2+
2.2526 ×BMI-14.4480
(2) Deurenberg 公式[13]
BFP=1.29×BMI-0.20×AGE-
11.40×GEN-8.00
(3) Jackson公式[14]
BFP=1.46×BMI-0.14×AGE-
11.60×GEN-10.00
(4) Jackson-Pollock公式[14-15]
BFP=1.61×BMI-0.13×AGE-
12.10×GEN-13.90
(5) Jackson公式[15]
BFP=1.39×BMI-0.16×AGE-
10.34×GEN-9.00
(6) Sun公式[16]
BFP=-0.030×BMI2+0.033×AGE×
GEN-0.001×AGE×BMI-0.006×AGE+
12.409×GEN+3.306×BMI-32.515
在上述公式中:AGE表示年齡;GEN表示性別(男/女取值為0/1)。
本文采用ANN數(shù)據(jù)挖掘方法,更精細(xì)地探討B(tài)MI與BFP之間的關(guān)系。自發(fā)現(xiàn)ANN適合于解決現(xiàn)實世界復(fù)雜的問題后,被廣泛應(yīng)用于臨床,特別是對于非線性或不完整的模型[17]。ANN通過識別輸入和輸出之間的復(fù)雜模式構(gòu)建數(shù)據(jù)方程,而不是將這些知識應(yīng)用于未知數(shù)據(jù)[18-19]。張崇林等[20]曾以體質(zhì)健康整體評價為輸出、體質(zhì)單項指標(biāo)為輸入,采用單層正反饋、逆向傳播算法構(gòu)建ANN模型,其擬合精度高于93%。值得注意的是,這一單層正反饋ANN評價模型,可確定隱藏神經(jīng)元的最佳數(shù)目。本文擬通過使用大數(shù)據(jù)集和最優(yōu)的ANN架構(gòu)分析BMI與BFP之間的關(guān)系,從而達(dá)到測試集的最高精度。
受試對象以江西某高校公共體育課班級為單位整群隨機(jī)抽取(學(xué)生自由選課構(gòu)成班級),記錄性別、年齡、身高、體質(zhì)量、BMI、BFP等字段,建立數(shù)據(jù)集。由1 201名非體育專業(yè)大學(xué)生構(gòu)成,年齡為16~25歲,BMI為15.7 ~ 30.7 kg/m2,BFP為3.0%~46.5%(表1)。測試得到上海體育學(xué)院和江西某高校醫(yī)學(xué)倫理委員會批準(zhǔn),所有測試者測試前均簽署“知情同意書”并遵守測試相關(guān)規(guī)定。
表1 ANN建模數(shù)據(jù)集字段信息
所有受試者采用儀器Tanita WB-510(Tanita 社團(tuán),日本東京)測定身高(精確到0.1 cm)和體質(zhì)量(精確到0.1 kg),并計算BMI。采用Tanita Body Composition Analyzer MC-180 (Tanita 社團(tuán),日本東京)測定BFP。Tanita八電極片生物電阻抗體成分測試高精確性,已被諸多研究證實可以作為實驗室BFP測定的 “金標(biāo)準(zhǔn)”。受試者按照測試要求維持正常代謝狀態(tài):① 測試前4 h禁飲食飲水;② 測試前12 h內(nèi)禁運動;③ 測試前48 h內(nèi)禁酒精和咖啡等影響代謝過程的食物或飲品;④ 測試前30 min排尿;⑤ 排除電子植入物和懷孕者。不同性別大學(xué)生BMI和BFP相關(guān)的數(shù)據(jù)集描述如圖1所示。
采用逆?zhèn)鞑?Back Propagation,BP)訓(xùn)練算法構(gòu)建正反饋ANN模型,擬合BMI與BFP之間的關(guān)系,數(shù)學(xué)建模采用SPSS Clementine 12(IBM 公司,美國芝加哥)。ANN模型輸入的矢量值集合為
X(i)=[AGE(i),GEN(i),BMI (i)]
輸出集合為
Y(i)=BFP%(i)
其中,i=1,2,…,1 200?;谇捌谘芯拷?jīng)驗[20],構(gòu)建包含1個隱層和25個隱含神經(jīng)元的最優(yōu)化擬合ANN模型(圖2)。據(jù)建模需要,通過使用函數(shù)除數(shù)將數(shù)據(jù)集隨機(jī)按70∶15∶15比例分為訓(xùn)練集、驗證集和測試集。在訓(xùn)練階段,隱層采用雙曲正切函數(shù)傳遞神經(jīng)函數(shù),輸出層采用純線性神經(jīng)函數(shù)構(gòu)建模型,相關(guān)訓(xùn)練參數(shù)為:mingrad=10-10,mu=10-3,mudec=0.3,muinc=3和mumax=1010。在驗證階段,ANN基于年齡、性別和BMI估算的BFP精確度算法為:
圖1 數(shù)據(jù)集中BMI與BFP相關(guān)性散點圖Figure 1 Scatter plot of correlation between BMI and BFP in data set
其中:BFP為測試值;BFP′為ANN擬合值。設(shè)定最小擬合度為80%。
圖2 構(gòu)建的ANN擬合模型Figure 2 Fitted model of ANN
經(jīng)上百次的訓(xùn)練、驗證及測試后,建立的含有1個隱層及25個隱含神經(jīng)元的優(yōu)化ANN模型。每次測試要求在下列同一年齡段不同性別間的BFP擬合值與測試值精度>80%。擬合的條件集如下:
AGE=25
GEN=Female and BMI=
{15,16,…,35}
(1)
GEN=Maleand BMI=
{15,16,…,40}
(2)
經(jīng)男、女大學(xué)生總數(shù)據(jù)集各70%訓(xùn)練樣本學(xué)習(xí),并通過驗證集驗證性學(xué)習(xí)與反饋后,構(gòu)建BFP與條件集擬合結(jié)果如圖3所示。
圖3 基于ANN模型BFP與BMI擬合結(jié)果Figure 3 Fitting results between BMI and BFP by ANN model
將ANN模型輸出值進(jìn)行多項式擬合,獲得不同性別大學(xué)生BFP擬合方程。
女大學(xué)生線性方程:
BFP=1.81×BMI-9.34
女大學(xué)生二次方程:
BFP=-0.0061×BMI2+2.08×BMI-12.22
男大學(xué)生線性方程:
BFP=1.61×BMI-18.53
男大學(xué)生二次方程:
BFP=-0.02×BMI2+2.4×BMI-27.5
利用構(gòu)建的BFP預(yù)測方程,對數(shù)據(jù)集中15%測試樣本進(jìn)行測試,通過對預(yù)測值與實際值之間數(shù)據(jù)進(jìn)行分析,得出不同性別大學(xué)生應(yīng)用不同預(yù)測方程預(yù)測結(jié)果的均方差與精確度如表2所示。
表2 ANN模型BFP預(yù)測方程的均方差和精確度
Table 2 Mean variance and accuracy of BFP prediction equations by ANN model
類別女(n=650)男(n=551)線性方程二次方程線性方程二次方程均方差7.861.388.210.44精確度91.3795.4292.7195.63
表2顯示,以ANN構(gòu)建的針對當(dāng)代大學(xué)BFP的預(yù)測方程,整體精確度都大于91%,建立的二次方程精確度超過95%。整體而言,不同性別大學(xué)生BMI和BFP之間相關(guān)性二次方程預(yù)測結(jié)果優(yōu)于線性方程,與其他學(xué)者研究結(jié)果一致[7]。結(jié)果還顯示,BFP預(yù)測方程平均擬合值男大學(xué)生優(yōu)于女大學(xué)生,與Ranasinghe等[11]的研究結(jié)果一致。青春期之后,女性體脂率高于男性,雌激素水平升高是重要因素,進(jìn)而影響胰島素和瘦素水平及其抵抗[21-22]。大學(xué)女生二次方程預(yù)測值均方差(1.38)高于男生(0.44),說明BFP二次方程更適用于大學(xué)男生。單從線性方程而言,男女大學(xué)生均方差分別為8.21、7.86,說明女大學(xué)生BFP線性預(yù)測方程效果好于男生。從ANN擬合曲線(圖3)看,女大學(xué)生BMI和BFP擬合曲線更接近直線,也說明女大學(xué)生線性方程擬合效果更好。
本文以BMI為基礎(chǔ)建立的BFP預(yù)測公式,并未像Deurenberg 公式[13]、Jackson公式[14]、Jackson公式[15]、Sun公式[16]等將年齡納入方程。最初研究將年齡納入影響因素,但無論性別、一次方程、二次方程年齡因子的系數(shù)都小于0.02,研究結(jié)果對整體BFP預(yù)測的影響為0.8%~1.3%,即對BFP預(yù)測結(jié)果影響較小,故在預(yù)測方程中未納入年齡因素。分析認(rèn)為在校大學(xué)生生活方式相對同一,年齡因素對體成分的影響小于體力活動、營養(yǎng)、內(nèi)分泌等因素。
良好的BFP預(yù)測公式對大學(xué)生體質(zhì)健康促進(jìn)具有重大意義。BFP除了是心血管疾病、代謝性疾病的獨立危險因素,對其他體質(zhì)健康指標(biāo)亦有良好的預(yù)測能力。研究表明,1996—2008年男大學(xué)生BFP年增長0.654%,女大學(xué)生年增長0.513%,而同期VO2max男大學(xué)生年均下降0.812 mL/kg·min-1,女大學(xué)生年均下降0.414 mL/kg·min-1。分析認(rèn)為,VO2max男大學(xué)生下降23.9%、女大學(xué)生下降17.3%的原因為BFP的增高[23]。此外,一項針對60歲以上女性(47 660名)和男性(4 944名)的隊列研究表明,高BFP與死亡率增加獨立相關(guān),而高BMI與死亡率增加并無相關(guān)[24]。說明BFP無論在體成分表述的準(zhǔn)確性、對體質(zhì)健康的預(yù)測性、對死亡率的相關(guān)性上都較BMI更有優(yōu)勢。
前期大量研究表明,無論性別與年齡,BMI與BFP存在高度相關(guān)。如:Muhammad對印尼大學(xué)生BMI與BFP進(jìn)行相關(guān)性研究結(jié)果顯示,男女大學(xué)生BMI與BFP的相關(guān)性分別為0.853和0.834;Kupusinac等[12]研究了1 114名18~83歲人群BMI與BFP的相關(guān)性結(jié)果顯示,男女相關(guān)性分別為0.75和0.82。本文大學(xué)男女生BMI與BFP的相關(guān)性分別為0.864和0.867(P<0.001)。單就相關(guān)性而言,似乎BMI完全可以反映BFP,但眾多研究表明,BMI并不能準(zhǔn)確反映身體脂肪量和肌肉量[7,25-26]。運動、生活方式、增齡性內(nèi)分泌的變化導(dǎo)致人體在脂肪合成與分解上的平衡、堆積部位等變化上的差異,而BMI并不能準(zhǔn)確反映。例如,經(jīng)常參加增肌體育鍛煉的人,體質(zhì)量可能變化不大甚至上升(表現(xiàn)為肌肉質(zhì)量的增加),但身體脂肪含量卻是逐漸降低。賀杰等[27]研究發(fā)現(xiàn),BMI不能準(zhǔn)確反映體育專業(yè)大學(xué)女生BFP。與此相反,對于久坐少動生活方式群體,體質(zhì)量可能變化不明顯,但是肌肉質(zhì)量可能下降而脂肪質(zhì)量上升,導(dǎo)致BMI變化不大,但BFP差異較大。內(nèi)分泌的變化,特別是雌激素水平的變化,會導(dǎo)致機(jī)體脂肪的合成與分解、分布的差異。
體脂量尚無直接測定方法,當(dāng)前認(rèn)為測算精確度最高的方法為水下稱重法,但由于需要精密的設(shè)備、苛刻的測試要求以及耗時長等因素導(dǎo)致該方法不具備推廣性[28]。在以水下稱重為“金標(biāo)準(zhǔn)”體脂量推算方法的前提下研發(fā)的雙能X線吸收測定法(dual energy X-ray absorptiometry,DXA),其原理是采用不同X線通過組織kedge吸收過濾的差值推算不同部位的體脂量,在測試便捷性上有了很大提高,但測試設(shè)備昂貴,也不便于推廣。最近在實驗室體成分研究中,較多地采用生物電阻抗分析法(BIA),其測試原理為:當(dāng)電流通過人體不同部位時,通過不同部位對電流阻抗的差異確定其組織成分及其含量。該方法測試簡單,設(shè)備費用相對較低,并且與水下稱重測定的體脂量具有較高的相關(guān)性,被學(xué)界認(rèn)為是比較可靠的實驗室標(biāo)準(zhǔn)[29],但該測試方法所需要的儀器也比較昂貴,不便推廣使用。故本文采用了BIA測定大學(xué)生BFP。
現(xiàn)代生活方式、飲食結(jié)構(gòu)、環(huán)境雌激素作用以及個體的健康認(rèn)知,都會對身體形態(tài)、體脂代謝造成影響,因此,建立基于BMI的BFP方程,仍具有重要意義。構(gòu)建BFP預(yù)測方程,目的在于通過便捷易行、對設(shè)備要求不高的指標(biāo)測試,與相應(yīng)的“標(biāo)準(zhǔn)”測試結(jié)果進(jìn)行數(shù)據(jù)處理,得出預(yù)測方程,使用較多的是回歸方程[4,7,15]。在構(gòu)建回歸方程前,對變量方差齊性、正態(tài)分布、變量誤差等有要求,這樣對于變量中高肌肉量、低體脂的運動員群體,或高體脂量、低肌肉量的久坐少動生活方式群體,則產(chǎn)生較大的誤差,甚至因樣本不符合正態(tài)分布、樣本方差不齊而無法構(gòu)建回歸方程。如Deurenberg等[30]構(gòu)建的基于BMI預(yù)測BFP的回歸方程,如果將BFP肥胖男女分別定義為25%和35%,則男女肥胖誤判率為7%和8%。由于建立回歸方程對樣本變量相關(guān)性、方差齊性的高要求,構(gòu)建回歸方程一般也有較高的精確度(>80%)[12-16]。
ANN構(gòu)建具備動物神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)功能,即便對于特異性較大的人群(變量非線性關(guān)系數(shù)據(jù)),亦能通過逆?zhèn)鞑ニ惴ㄟM(jìn)行擬合,得到精確度很高的預(yù)測方程。Kupusinac等[12]基于BMI建立ANN的BFP預(yù)測公式,二次方程預(yù)測效果較一次方程精確度更高,而在性別上女性二次方程預(yù)測效果優(yōu)于男性,在年齡上,老年人二次方程預(yù)測效果優(yōu)于中青年人。推測可能由于內(nèi)分泌的變化、生活方式(體育鍛煉行為、家務(wù)勞動等)的差異、飲食習(xí)慣的變化等因素,老年人在體成分、體脂量、體脂分布等方面差異性更大,導(dǎo)致建立的基于ANN的BFP二次預(yù)測方程較線性方程預(yù)測度更高。幼年女性和絕經(jīng)期后女性二次方程相關(guān)度較孕齡期低,推測這是由于低雌激素水平影響體脂合成與分布導(dǎo)致的[12]。
本文研究對象為普通大學(xué)生,年齡集中在19~24歲,內(nèi)分泌系統(tǒng)功能穩(wěn)定,體脂合成與分布趨于一致,故基于BMI的BFP二次方程擬合度男、女分別高達(dá)95.42%和95.63%。另外,就數(shù)學(xué)建模方法而言,本文采用的ANN建模方法是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為特征,分布式信息處理的數(shù)學(xué)模型,該算法憑借復(fù)雜的系統(tǒng)結(jié)構(gòu)對內(nèi)部節(jié)點之間的權(quán)重進(jìn)行修正,從而達(dá)到處理信息的目的[31],使擬合值無限接近真值。故本文建立的基于BMI的BFP預(yù)測方程擬合度高(大于91%)。如表2所示,無論男女大學(xué)生,二次方程均方差和精確度較線性方程有較大提升。分析認(rèn)為,ANN構(gòu)建的二次方程,對自變量進(jìn)行了二次權(quán)重修正(線性方程只進(jìn)行一次權(quán)重修正),使預(yù)測結(jié)果更精確。另外,ANN建立的預(yù)測方程,可通過設(shè)置變量取值范圍,減少歧義值和錯誤值對方程的影響,當(dāng)樣本含量變化時,可通過自適應(yīng)性學(xué)習(xí),調(diào)整變量系數(shù)等方法,使預(yù)測方程更精確。
BFP與BMI之間的相關(guān)性受種族、文化等因素的影響[32],針對特定對象建立預(yù)測方程不具有普適性。目前,針對中國大學(xué)生人群的BFP預(yù)測方程尚不多見,建立可靠的BMI與BFP之間的預(yù)測方程,對大學(xué)生營養(yǎng)健康教育和身體形態(tài)健康教育具有指導(dǎo)意義。
BFP作為反映內(nèi)臟脂肪含量升高和心血管疾病、糖尿病、代謝紊亂的危險因子具有更好的預(yù)測性。本文旨在提出一種簡捷、無創(chuàng)、低成本的BMI與BFP相關(guān)性的分析方法,為當(dāng)代中國大學(xué)生營養(yǎng)評價、身體形態(tài)健康管理以及相關(guān)疾病的危險預(yù)測提供更科學(xué)的依據(jù)。由于智能學(xué)習(xí)和自適應(yīng)等特點,挖掘非參數(shù)大數(shù)據(jù)間相關(guān)性擬合精度高,ANN數(shù)據(jù)挖掘被廣泛應(yīng)用?;贏NN構(gòu)建適合于中國當(dāng)代大學(xué)生BMI與BFP的相關(guān)模型,從模型精度和均方差分析結(jié)果看,無論大學(xué)男生還是女生,二次方程擬合結(jié)果均優(yōu)于線性方程。