王晶
摘 要: 為了科學(xué)評(píng)價(jià)大學(xué)生身體素質(zhì),提出基于機(jī)器學(xué)習(xí)算法的體育成績預(yù)測模型。對(duì)當(dāng)前大學(xué)生體育成績預(yù)測的研究現(xiàn)狀進(jìn)行分析,指出導(dǎo)致當(dāng)前模型預(yù)測精度低的原因,采用機(jī)器學(xué)習(xí)算法——支持向量機(jī)建立大學(xué)生體育成績預(yù)測模型,并采用粒子群算法選擇模型參數(shù),最后將該模型應(yīng)用于某大學(xué)的體育成績建模和預(yù)測中。應(yīng)用實(shí)例結(jié)果表明,機(jī)器學(xué)習(xí)算法可以克服傳統(tǒng)模型的不足,使得大學(xué)體育成績預(yù)測效果得到改善,預(yù)測結(jié)果可以指導(dǎo)大學(xué)體育學(xué)科的改革。
關(guān)鍵詞: 體育訓(xùn)練; 機(jī)器學(xué)習(xí)算法; 預(yù)測模型; 粒子群算法
中圖分類號(hào): TN911.1?34; TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)17?0116?04
Machine learning based prediction and analysis of college sports performance
WANG Jing
(Sias International University, Zhengzhou University, Xinzheng 451150, China)
Abstract: In order to evaluate the physical quality of college students scientifically, a sports performance prediction model based on machine learning algorithm is put forward. The research status of the current college students sports performance prediction is analyzed to point out the reason causing the low prediction accuracy of current model. The machine learning algorithm (support vector machine) is used to establish the sports performance prediction model of college students. The particle swarm optimization algorithm is adopted to choose the parameters of the model. The model is applied to the physical performance modeling and prediction of a certain college. The application results show that the machine learning algorithm can eliminate the shortcomings of the traditional model, improve the prediction effect of the college sports performance, and its prediction results can guide the reformation of the college physical education.
Keywords: physical training; machine learning algorithm; prediction model; particle swarm optimization algorithm
0 引 言
隨著人們生活水平的不斷提高,大學(xué)生物質(zhì)生活更加豐富,他們?nèi)鄙馘憻?,部分大學(xué)生身體素質(zhì)有不同程度的下降[1?2]。大學(xué)生體育課是提高大學(xué)生身體素質(zhì)的一個(gè)重要途徑,而大學(xué)生體育成績預(yù)測可以幫助大學(xué)體育管理部門合理開設(shè)相關(guān)的課程,制定最科學(xué)的訓(xùn)練機(jī)制,因此如何建立精度高的體育成績預(yù)測模型引起了廣大高校的高度重視[3]。
最原始的大學(xué)體育成績預(yù)測方法主要是通過體育老師實(shí)現(xiàn),它們采用統(tǒng)計(jì)學(xué)方法對(duì)大學(xué)生體育成績進(jìn)行計(jì)算和估計(jì),但是由于大學(xué)生體育成績受多方面因素的影響,體育老師不可能全面考慮到,即使全面考慮到了各種因素,計(jì)算過程也相當(dāng)復(fù)雜,體育成績預(yù)測效率低,無法滿足現(xiàn)代大學(xué)生體育訓(xùn)練的要求[3?4]。隨著信息技術(shù)、自動(dòng)化技術(shù)以及人工智能理論研究的不斷深入,許多高校體育老師和體育方面的研究專家提出了大量的大學(xué)體育成績自動(dòng)預(yù)測模型[5]。大學(xué)體育成績預(yù)測實(shí)質(zhì)是一種回歸問題,因此當(dāng)前模型可以劃分為兩種:線性回歸模型和非線性回歸模型[6]。應(yīng)用最廣泛的線性模型為多元線性回歸模型,根據(jù)大學(xué)生體育歷史成績對(duì)模型的相關(guān)參數(shù)進(jìn)行估計(jì),建立大學(xué)生體育預(yù)測模型,然后對(duì)某個(gè)大學(xué)生的體育成績進(jìn)行預(yù)測,當(dāng)影響因素比較少時(shí),預(yù)測精度高[7]。大學(xué)體育成績建模是一個(gè)十分復(fù)雜的過程,影響因素有大學(xué)生自身因素,還包括外界因素,因此大學(xué)體育成績沒有什么變化規(guī)律可循,隨機(jī)性大,而線性模型不能描述大學(xué)體育成績的隨機(jī)性[8]。非線性模型采用隨機(jī)性理論對(duì)大學(xué)生體育成績進(jìn)行建模,建立的模型預(yù)測精度更高,當(dāng)前主要為機(jī)器學(xué)習(xí)算法中的神經(jīng)網(wǎng)絡(luò)[9?10]。神經(jīng)網(wǎng)絡(luò)是基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最大化原則的機(jī)器學(xué)習(xí)算法,非線性擬合能力相當(dāng)強(qiáng),可以無限擬合大學(xué)生體育成績的變化特點(diǎn),取得了不錯(cuò)的應(yīng)用效果。但其基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最大化原則,因此需要大量的大學(xué)體育成績樣本才能獲得理想的大學(xué)生體育預(yù)測結(jié)果,而一個(gè)學(xué)生的體育成績歷史樣本相當(dāng)少,難以滿足該條件[11?12]。
支持向量機(jī)是一種新型的機(jī)器學(xué)習(xí)算法,采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,沒有神經(jīng)網(wǎng)絡(luò)的大樣本要求,在小樣本條件下仍然可以獲得良好的擬合能力[13]。為了提高大學(xué)生體育成績的預(yù)測效果,提出基于支持向量機(jī)的大學(xué)體育成績預(yù)測模型,并采用粒子群算法選擇模型參數(shù),最后將該模型應(yīng)用于某大學(xué)的體育成績建模和預(yù)測中,結(jié)果表明,支持向量機(jī)解決了其他傳統(tǒng)模型的不足,改善了大學(xué)體育成績的預(yù)測效果。endprint
1 機(jī)器學(xué)習(xí)算法的大學(xué)體育成績預(yù)測模型
1.1 機(jī)器學(xué)習(xí)算法?支持向量機(jī)
相對(duì)于神經(jīng)網(wǎng)絡(luò)以及其他傳統(tǒng)機(jī)器學(xué)習(xí)算法,支持向量機(jī)的限制條件更少,且不存在“過擬合”缺陷,十分適合于小樣本、非線性大學(xué)生體育成績的建模與預(yù)測[11]。
設(shè)大學(xué)生體育成績樣本集為支持向量機(jī)的回歸方式具體為:
(1)
式中和均為支持向量機(jī)的參數(shù)。
要建立大學(xué)生體育成績預(yù)測模型,必須找到最合理的和的值,為此,根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,將其轉(zhuǎn)化成如下形式:
(2)
式中:為回歸誤差;為誤差的懲罰參數(shù)。
為了簡化求解過程,降低建模的計(jì)算復(fù)雜度,引入松弛因子和得到二次規(guī)劃形式為:
(3)
采用拉格朗日乘子和進(jìn)一步對(duì)式(3)進(jìn)行變換,得到:
(4)
式中表示核函數(shù)。
支持向量機(jī)的回歸函數(shù)可以描述為:
(5)
選擇RBF函數(shù)作為核函數(shù),其定義為:
(6)
式中表示RBF的參數(shù)。
1.2 粒子群算法
粒子群算法的當(dāng)前最優(yōu)解為pbest,當(dāng)前群體的最優(yōu)解為gbest,構(gòu)建描述粒子個(gè)體優(yōu)劣程度的適應(yīng)度函數(shù)為:
(7)
和為粒子第次迭代的速度和位置,它們的更新方式為:
(8)
(9)
式中:為學(xué)習(xí)因子;Rand()為隨機(jī)數(shù);為慣性權(quán)重。
為了解決支持向量機(jī)參數(shù)的確定問題,采用粒子群優(yōu)化算法對(duì)支持向量機(jī)的訓(xùn)練過程進(jìn)行在線優(yōu)化,確定最優(yōu)參數(shù)和根據(jù)最優(yōu)參數(shù)和提高大學(xué)生體育成績的預(yù)測精度。
1.3 機(jī)器學(xué)習(xí)算法的大學(xué)體育成績預(yù)測模型
(1) 對(duì)于某一個(gè)體育項(xiàng)目的歷史數(shù)據(jù)進(jìn)行收集,并進(jìn)行如下處理:
(10)
式中和表示大學(xué)生體育成績的最小和最大值。
(2) 根據(jù)經(jīng)驗(yàn)確定支持向量機(jī)的參數(shù)和范圍。
(3) 初始化粒子群,每一個(gè)粒子的位置向量包括一組參數(shù)和。
(4) 根據(jù)每一組參數(shù)和對(duì)大學(xué)生體育成績訓(xùn)練樣本采用支持向量機(jī)進(jìn)行學(xué)習(xí),并計(jì)算每一個(gè)粒子的適應(yīng)度函數(shù)值。
(5) 根據(jù)適應(yīng)度函數(shù)值對(duì)全部粒子進(jìn)行排序,并對(duì)當(dāng)前最優(yōu)解pbest和當(dāng)前群體最優(yōu)解gbest進(jìn)行替換操作。
(6) 更新粒子群的速度和位置。
(7) 粒子群算法的迭代次數(shù)增加。
(8) 如果迭代次數(shù)超過預(yù)先設(shè)定的最大值,那么就終止算法執(zhí)行,否則返回步驟(4)繼續(xù)執(zhí)行優(yōu)化操作。
(9) 根據(jù)群體最優(yōu)解gbest得到支持向量機(jī)的最優(yōu)參數(shù)和值。
(10) 根據(jù)和對(duì)大學(xué)生體育成績重新訓(xùn)練,建立基于支持向量機(jī)的大學(xué)生體育成績預(yù)測模型。
(11) 采用大學(xué)生體育成績測試樣本對(duì)大學(xué)生體育成績預(yù)測模型的性能進(jìn)行測試和分析。
綜上可知,基于機(jī)器學(xué)習(xí)算法的大學(xué)生體育成績預(yù)測模型工作流程如圖1所示。
2 大學(xué)生體育成績預(yù)測模型的應(yīng)用實(shí)例
2.1 大學(xué)生體育成績數(shù)據(jù)
為了全面分析基于機(jī)器學(xué)習(xí)算法的大學(xué)生體育成績預(yù)測模型的有效性和優(yōu)越性,選擇鄭州大學(xué)的大學(xué)生體育成績作為實(shí)驗(yàn)對(duì)象,首先選擇100 m跑的成績進(jìn)行測試,共500個(gè)成績?nèi)鐖D2所示,其中300個(gè)100 m用于建立大學(xué)生體育成績預(yù)測模型,其他用于檢測模型的泛化性能。
2.2 模型的有效性測試
200個(gè)100 m跑的成績組成的測試樣本預(yù)測結(jié)果如圖3所示,對(duì)圖3的預(yù)測結(jié)果進(jìn)行詳細(xì)分析可以發(fā)現(xiàn),基于機(jī)器學(xué)習(xí)算法的大學(xué)生體育成績預(yù)測模型可以描述500個(gè)100 m跑的成績變化趨勢,獲得了理想的100 m跑的成績預(yù)測結(jié)果,實(shí)驗(yàn)結(jié)果驗(yàn)證了該模型的有效性。
2.3 模型的優(yōu)越性測試
為了測試機(jī)器學(xué)習(xí)算法的大學(xué)生體育成績預(yù)測模型的優(yōu)越性,選擇文獻(xiàn)[3]的線性回歸模型、文獻(xiàn)[8]的神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比實(shí)驗(yàn),統(tǒng)計(jì)它們的男生100 m跑成績的預(yù)測精度,精度如表1所示,對(duì)表1的結(jié)果進(jìn)行對(duì)比和分析,可以得到如下結(jié)論:
(1) 在全部大學(xué)生體育成績的預(yù)測模型中,線性回歸模型的預(yù)測精度最低,這是因?yàn)榫€性回歸模型只能對(duì)男生100 m跑成績的部分變化特點(diǎn)進(jìn)行描述,無法描述全面的變化特點(diǎn),大學(xué)生體育成績預(yù)測效果差。
(2) 相對(duì)于線性回歸模型,神經(jīng)網(wǎng)絡(luò)的大學(xué)生成績預(yù)測精度得到了一定的提高,這是因?yàn)樯窠?jīng)網(wǎng)絡(luò)是一種機(jī)器學(xué)習(xí)算法,可以對(duì)男生100 m跑成績的線性和非線性變化特點(diǎn)進(jìn)行擬合,取得更優(yōu)的預(yù)測效果,但由于要求樣本數(shù)量多,導(dǎo)致部分點(diǎn)的預(yù)測偏差大,預(yù)測誤差隨之增大,模型的大學(xué)生成績預(yù)測效果整體欠佳。
(3) 相對(duì)于線性回歸模型以及神經(jīng)網(wǎng)絡(luò),支持向量機(jī)的大學(xué)生體育成績預(yù)測精度最高,這是因?yàn)橹С窒蛄繖C(jī)要求的訓(xùn)練樣本少,克服了線性回歸模型的缺陷,解決了神經(jīng)網(wǎng)絡(luò)的局限性,提高了男生100 m跑成績預(yù)測的精度,具有十分明顯的優(yōu)越性。
2.4 通用性分析
為了測試機(jī)器學(xué)習(xí)算法的大學(xué)生體育成績預(yù)測模型的通用性,采用鄭州大學(xué)的男生三級(jí)跳遠(yuǎn)、男生3 000 m跑、男生引體向上、女生1 000 m跑、女生立定跳遠(yuǎn)成績作為研究對(duì)象,統(tǒng)計(jì)它們的預(yù)測精度,結(jié)果如表2所示。從表2的預(yù)測精度可以發(fā)現(xiàn),全部大學(xué)生體育成績的預(yù)測精度均超過90%,遠(yuǎn)遠(yuǎn)大于實(shí)際應(yīng)用范圍的85%,這表明該模型的通用性強(qiáng),可以應(yīng)用于實(shí)際的大學(xué)體育成績預(yù)測中。
3 結(jié) 語
體育訓(xùn)練是提高大學(xué)生身體素質(zhì)的一個(gè)重要因素,而體育成績預(yù)測可以幫助大學(xué)制定有效的體育訓(xùn)練方案。為了提高大學(xué)生體育成績的預(yù)測效果,解決當(dāng)前大學(xué)生體育成績預(yù)測模型的缺陷,構(gòu)建了基于機(jī)器學(xué)習(xí)算法的大學(xué)體育成績預(yù)測模型,采用機(jī)器學(xué)習(xí)算法中性能最優(yōu)的支持向量機(jī)對(duì)大學(xué)生體育成績數(shù)據(jù)進(jìn)行建模和擬合,具體應(yīng)用實(shí)例結(jié)果表明,該模型的通用性能強(qiáng),可以應(yīng)用于各種大學(xué)生體育成績預(yù)測,而且預(yù)測結(jié)果可靠,可以為大學(xué)體育訓(xùn)練提供有價(jià)值的信息。
參考文獻(xiàn)
[1] 許晶.我國頂尖男子十項(xiàng)全能運(yùn)動(dòng)員競技特征及實(shí)力分析[J].廣州體育學(xué)院學(xué)報(bào),2008,28(5):61?64.
[2] 趙波.十項(xiàng)全能世界頂尖男子運(yùn)動(dòng)員成績分析及預(yù)測研究[J].體育文化導(dǎo)刊,2013(3):76?79.
[3] 趙丙軍.運(yùn)用多元回歸方法建立我國男子跳遠(yuǎn)項(xiàng)目訓(xùn)練模型的研究[J].西安體育學(xué)院學(xué)報(bào),2001,18(1):81?82.
[4] 周偉.對(duì)中外優(yōu)秀女子三級(jí)跳遠(yuǎn)運(yùn)動(dòng)員三跳技術(shù)的灰色關(guān)聯(lián)分析[J].吉林體育學(xué)院學(xué)報(bào),2004,20(3):64?65.
[5] 鄧美蘭.奧運(yùn)會(huì)男子十項(xiàng)全能前三名成績的灰色預(yù)測模型的研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2009(18):44?49.
[6] 魏春玲.我國十項(xiàng)全能運(yùn)動(dòng)成績的因子分析及灰色系統(tǒng)回歸預(yù)測研究[J].體育科學(xué),2004,24(11):66?69.
[7] 孫群,劉國璧,程偉,等.基于模糊神經(jīng)網(wǎng)絡(luò)的劉翔110 m欄成績預(yù)測[J].重慶科技學(xué)院學(xué)報(bào)(自然科學(xué)版),2011,10(2):104?107.
[8] 王宗平,孫光.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)算法對(duì)運(yùn)動(dòng)成績預(yù)測的實(shí)證研究[J].南京體育學(xué)院學(xué)報(bào),2006,20(4):109?111.
[9] 李征宇,閆生.神經(jīng)網(wǎng)絡(luò)模型在運(yùn)動(dòng)成績預(yù)測中的應(yīng)用[J].哈爾濱體育學(xué)院學(xué)報(bào),2009,27(2):110?113.
[10] 戴敏.基于數(shù)據(jù)挖掘的運(yùn)動(dòng)員體能測試數(shù)據(jù)分析[J].計(jì)算機(jī)工程與應(yīng)用,2003(9):38?40.
[11] 劉昊.非線性篩選因子和加權(quán)的體育成績建模與預(yù)測[J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(11):105?108.
[12] 夏軒,許偉明.改進(jìn)的粒子群算法對(duì)RBF神經(jīng)網(wǎng)絡(luò)的優(yōu)化[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(5):37?40.
[13] 龍斌.基于支持向量機(jī)的劉翔110 m欄成績預(yù)測[J].天津體育學(xué)院學(xué)報(bào),2009,24(4):330?333.endprint