崔鵬 承德石油高等專科學(xué)校
基于Apriori算法的大學(xué)生早餐數(shù)據(jù)分析
崔鵬 承德石油高等??茖W(xué)校
大學(xué)生的課程相對(duì)其它學(xué)習(xí)階段較為輕松,但是依然算得上繁重,每天學(xué)習(xí)新的知識(shí)、熟練技能,腦力勞動(dòng)非常消耗能量,尤其是消耗蛋白質(zhì),為了保證學(xué)校效果,學(xué)生要保證每天能儲(chǔ)存足夠多的營(yíng)養(yǎng)素。早餐距離前一晚餐的時(shí)間最長(zhǎng),一般在12小時(shí)以上,體內(nèi)儲(chǔ)存的糖原已經(jīng)消耗殆盡,因此早餐是非常重要的,本文利用Apriori算法對(duì)大學(xué)生的早餐消費(fèi)信息進(jìn)行挖掘,以期找到影響早餐的因素。
Apriori算法 高校餐飲 大學(xué)生食堂 飲食營(yíng)養(yǎng) 大數(shù)據(jù) 數(shù)據(jù)挖掘
首先需要準(zhǔn)備一個(gè)有2000份就餐信息的數(shù)據(jù)倉(cāng)庫(kù),從中把在時(shí)間段6:00至9:00消費(fèi)為0元以上的數(shù)據(jù)進(jìn)行提取,得到數(shù)據(jù)如表1所示,以文本形式保存后指定給程序,在程序中設(shè)置的輸入數(shù)據(jù)為:最小支持度min_sup=0.05。
表1 學(xué)生早餐消費(fèi)表(限于篇幅此處只展示了八個(gè)學(xué)生)
然后利用Aprior算法,把在6:00至9:00消費(fèi)金額為0元的全部置“0”,通過(guò)“與”運(yùn)算獲得K-頻繁集,一旦出現(xiàn)2-項(xiàng)集就可以停止運(yùn)算了,最終輸出得到關(guān)聯(lián)規(guī)則如表2所示。
表2 有早餐消費(fèi)記錄學(xué)生的關(guān)聯(lián)規(guī)則(此處以五個(gè)規(guī)則為例)
挖掘結(jié)果顯示所選高校的大學(xué)生在早餐上有諸多不良飲食行為,主要表現(xiàn)在:首先是不重視早餐,并且早餐質(zhì)量普遍偏低。從結(jié)果上看絕大多數(shù)的學(xué)生早餐攝取的食物種類不超過(guò)兩種,種類單調(diào)、營(yíng)養(yǎng)結(jié)構(gòu)不合理,而且還有部分學(xué)生根本不吃早餐;然后是學(xué)生食用牛奶及乳制品和水果頻率偏低,油雜食品以及零食攝入過(guò)多。最后是存在挑食現(xiàn)象,這類學(xué)生數(shù)量很多。
除去早餐之外,從大學(xué)生的整體飲食習(xí)慣所表現(xiàn)出來(lái)的差異,通過(guò)挖掘結(jié)果證明:性別的差異、不同的生源地以及所在專業(yè)的不同都有密切關(guān)系。女生的飲食習(xí)慣相對(duì)男生要好,喜歡吃零食是其最需要改正的不良飲食習(xí)慣,男生最需要的是去吃一頓豐盛的早餐,并且盡可能少吃宵夜。整體情況來(lái)看是來(lái)自城市的學(xué)生要好于來(lái)自農(nóng)村的,文科專業(yè)相比其他是最好的。