馮興剛李媛
(1.西南科技大學(xué)體育部 綿陽 621010;2.西南科技大學(xué)城市學(xué)院 綿陽 621000)
模糊聚類在大學(xué)生體質(zhì)健康分析中的應(yīng)用*
馮興剛1李媛2
(1.西南科技大學(xué)體育部 綿陽 621010;2.西南科技大學(xué)城市學(xué)院 綿陽 621000)
采用模糊聚類思想與方法,對大學(xué)生體質(zhì)健康測試數(shù)據(jù)進行分析,從龐雜的數(shù)據(jù)中獲取有價值的信息,建立學(xué)生體質(zhì)健康狀況評價模塊,用以幫助教師及學(xué)生更好的了解學(xué)生的體質(zhì)狀態(tài),選擇鍛煉方法,提高學(xué)生健康質(zhì)量。本文以 5000名在校大學(xué)生的體質(zhì)健康測試數(shù)據(jù)為案例,應(yīng)用模糊聚類方法對數(shù)據(jù)進行處理分析,得到了各類的語意解釋,從而量化的評價了學(xué)生體質(zhì)健康情況。
體質(zhì)健康;模糊聚類
《學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》是檢驗當(dāng)代大學(xué)生體質(zhì)健康的重要依據(jù),也是高校開展體育教學(xué)、課外活動、群體競賽等各項活動工作的主要參考指標(biāo)之一[1]。
本文對案例學(xué)校提供的大學(xué)男生的測試項目(如表1)進行模糊聚類分析和研究,以達到幫助教師改善教學(xué)方式,讓學(xué)生切實了解自身體質(zhì)健康狀況,有目的的進行鍛煉的目的。
表1 案例男學(xué)生《學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》測試項目成績
身高標(biāo)準(zhǔn)體重指身高與體重兩者的比例應(yīng)在正常的范圍,是評價人體形態(tài)發(fā)育水平和營養(yǎng)狀況及身體勻稱度的重要指標(biāo);肺活量是評價人體呼吸系統(tǒng)機能狀況的一個重要指標(biāo);臺階試驗指數(shù)是反映人體心血管系統(tǒng)機能狀況的重要指數(shù);握力體重指數(shù)反映的是肌肉的相對力量,即每公斤體重的握力;立定跳遠(yuǎn)反映了學(xué)生下肢爆發(fā)力[1,2]。
2.1 基本概念
2.1.1 樣本集:選取西南科技大學(xué)2007級5000名男學(xué)生《學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》測試數(shù)據(jù)作為原始數(shù)據(jù),樣本容量為5000。測試項目見表1。用X表示樣本集X={x1, x2, …, x5000}。xi表示第i個學(xué)生的測試成績,i =1, 2, …, 5000。
2.1.2 屬性集:在表1中,每一列為一個屬性。用F表示屬性集F = {f1, f2, f3, f4, f5}。這里,f1=“身高標(biāo)準(zhǔn)體重”;f2=“肺活量”;f3=“臺階試驗”;f4=“握力體重指數(shù)”;f5=“立定跳遠(yuǎn)”。
2.1.3 模糊集:在每一個屬性上定義三個模糊集,M為所取模糊集的集合,M ={m1, m2, …, m15}。其中,m1=“身高標(biāo)準(zhǔn)體重成績高”,m2=“身高標(biāo)準(zhǔn)體重成績中等”,m3=“身高標(biāo)準(zhǔn)體重較小”,m4=“肺活量大”,m5=“肺活量一般”,m6=“肺活量小”,m7=“臺階試驗成績高”m8=“臺階試驗成績中等”,m9=“臺階試驗成績低”,m10=“握力體重指數(shù)高”,m11=“握力體重指數(shù)中等”,m12=“握力體重指數(shù)低”,m13=“立定跳遠(yuǎn)成績高”,m14=“立定跳遠(yuǎn)成績中等”,m15=“立定跳遠(yuǎn)成績低”。模糊集經(jīng)過交、并運算之后還是模糊集。例如,m1∩ m4=“身高標(biāo)準(zhǔn)體重大并且肺活量大”,m8∪ m10=“臺階測試成績中等或者握力體重指數(shù)高”。
2.2 模糊聚類算法
本文采用聚類算法[3],其具體過程如下:Step1:
?x∈X,μθ(x)是x在聚類分析中屬于某一類的最大隸屬度,其中θ為M中的某個模糊集。Step 2:
對于每個 x∈X,求出 x的模糊描述ζx。ζx滿足:ζx∈2M,其中 2M是集合 M 的冪集;≥ μθ(x) - ε,ε是一個充分小的正數(shù)或零,并且對于y∈X,y ≠ x,盡可能地小。換句話說,用模糊集ζx把樣本x與X中其他樣本最大限度地區(qū)分開,那些無法與 x區(qū)分的樣本為 x的同類。模糊集ζx可以看作是這個男學(xué)生的一個表述。
下面給出求樣本x的模糊描述的算法步驟:
1.選取適當(dāng)?shù)摩?≥ 0,ε應(yīng)充分小。對任意x∈X,m∈M,計算μm(x),選出所有mj使得
將mj放入一個集合,記為。
2.選取極大的集合H?Bxε, 使得
然后將分子∩β∈Hβ放入一個集合,記為xεΛ。
Step 3:
根據(jù)x的模糊描述ζx給出任意xi, xj∈ X,xi與xj相關(guān)的程度
其中X={x1, x2, …, x5000},MΛ=(mij)為X上模糊關(guān)系矩
Step 5:
對于在置信度 下X被分為C1, C2,…, Cl類,
模糊集 ζCi為類Ci的模糊描述。求出所有樣本屬于每類模糊描述的隸屬度,進行比較。每個樣本屬于哪類模糊描述的隸屬度最大,那么該樣本就屬于哪類。這樣可以進一步對樣本聚類。模糊集ζbou描述了模糊分類的所有類之間的邊界,其中
指標(biāo)Iα可用于評價以 為置信度分類結(jié)果的好壞,其中
其中 當(dāng) Iα最小時,分類最清晰。
2.3 案例分析
按照上面的步驟,對西南科技大學(xué)的5000名男學(xué)生《學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》 測試數(shù)據(jù)進行聚類,聚類結(jié)果如表2所示,其中各參數(shù)的值為ε = 0,δ = 0.6,α = 0.6。5000名男學(xué)生被劃分為3類,第一類C1的包含1325樣本,這類模糊描述的模糊集ζC1為{m3∩ m12∩ m15} + {m6∩ m9∩ m12∩m15},即第一類為“身高標(biāo)準(zhǔn)體重小且握力體重指數(shù)低且立定跳遠(yuǎn)成績低”或“肺活量小且臺階試驗成績低且握力體重指數(shù)低且立定跳遠(yuǎn)成績低”。第二類C2包含3015個樣本,這類模糊描述的模糊集ζC2為{m8∩ m11∩ m14},即第二類為“臺階試驗成績中等且握力體重指數(shù)中等且立定跳遠(yuǎn)成績中等”。第三類C3包含660樣本,這類模糊描述的模糊集ζC3為{m4∩ m7∩ m10∩ m13},即第三類為“肺活量大且臺階試驗成績高且握力體重指數(shù)高且立定跳遠(yuǎn)成績高”。
通過對比三類模糊描述可以得出結(jié)論,影響學(xué)生整體評價的關(guān)鍵性因素是“臺階測試”,“握力體重指數(shù)”,“立定跳遠(yuǎn)”。第一類學(xué)生整體的測試指標(biāo)都比較低,或者可以認(rèn)為該類學(xué)生在關(guān)鍵性測試(臺階測試,握力標(biāo)準(zhǔn)體重指數(shù),立定跳遠(yuǎn))中的成績較低,從而導(dǎo)致整體評價不高。第二類學(xué)生在關(guān)鍵性測試中的測試指標(biāo)都比較一般,而“身高標(biāo)準(zhǔn)體重”和“肺活量”測試結(jié)果對這類學(xué)生而言整體性比較強,對類別的劃分影響不大。第三類學(xué)生的測試成績都比較高,他們的整體情況比較優(yōu)秀。
通過表2可以看出,模糊聚類結(jié)果并不是絕對的,也就是說某個學(xué)生并不是絕對的隸屬于哪一類,而是依隸屬程度而言的。比如第一個學(xué)生x1,明顯的隸屬于第三類,程度為0.88;而第二個學(xué)生x2,隸屬于第一類的程度為0.54,而隸屬于第二類的隸屬程度也有0.39,這就說明這個學(xué)生在某些方面成績還是比較突出的,整體而言,比較接近“中等”程度。對于這樣的學(xué)生,結(jié)合每個學(xué)生的模糊描述,我們就可以因人而異的制定鍛煉方案,搞清楚鍛煉方向,并不會盲目的對各項測試都進行訓(xùn)練。對于第一個學(xué)生而言,他隸屬于第三類的程度較高達到 0.88,但是根據(jù)他的模糊描述ζx1={m3} + {m10∩ m13},“身高標(biāo)準(zhǔn)體重小”或者“握力體重指數(shù)高并且立定跳遠(yuǎn)成績高”,該同學(xué)就可以針對身高標(biāo)準(zhǔn)體重小這個特點有針對性的在以后進行提高。
對于教師而言,通過對模糊聚類對學(xué)生測試成績進行分析,可以全面的了解學(xué)生的身體狀況,而根據(jù)不同學(xué)生的模糊描述ζx,可以有針對性的對學(xué)生進行訓(xùn)練,制定因人而異的訓(xùn)練方案。
本文通過案例分析的方法,將聚類分析的思想應(yīng)用到大學(xué)生體質(zhì)測評結(jié)果中,通過數(shù)據(jù)處理分析得到學(xué)生體質(zhì)情況評價描述,獲取了體質(zhì)健康數(shù)據(jù)中有價值的學(xué)生體質(zhì)信息,為提高體育教學(xué)工作質(zhì)量提供了新的思維方式和實踐方法。
1 徐武,羅建萍,李樹梅.《學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》測試報告信息增進系統(tǒng)的構(gòu)建研究[J].北京體育大學(xué)學(xué)報,2008,31(10):1264-1265
2 陳文杰.江蘇省高校實施《學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》現(xiàn)狀及對策研究[J].北京體育大學(xué)學(xué)報,2006,29(10):2
3 Xiaodong Liu, Wei Wang, and Tianyou Chai.The Fuzzy Clustering Analysis Based on AFS Theory [J], IEEE Transaction on Systems, Man, Cybernetics-partB: Cybernetics,2005, 35 (5): 1013 – 1027
The Application of Fuzzy Clustering in the Analysis of College Students' Physic Health Standard Test
Feng Xinggang,etal.
(Southwest University of Science and Technology, Mianyang, Sichuan 621010,china)
In this paper, fuzzy clustering is used to analyze students’ physic health standard test, which helps to teach students according to their individual differences, and to improve the teaching methods so that enhance the teaching quality.This paper takes 5000 college students’ physic health standard test performance for example, and the 5000 students are clustered into three categories with a clear semantic interpretation from which the student’s physic health conditions can be quantitatively evaluated.
physic health; fuzzy clustering
西南科技大學(xué)青年預(yù)研基金,項目編號:10sx3115。
馮興剛(1978—),男,陜西人,碩士,講師,研究方向:體育管理與教學(xué)。