国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)時代下體育科研的變革①

2017-02-02 09:34樊花梅
當代體育科技 2017年34期
關鍵詞:樣本預測時代

樊花梅

(廣東醫(yī)科大學體育教學部 廣東湛江 524023)

大數(shù)據(jù)時代無聲無息悄然來臨,在全球范圍內,大數(shù)據(jù)地來臨帶來信息技術的革命性變革,大數(shù)據(jù)不但和云計算、物聯(lián)網聯(lián)系緊密,更有自己獨特的特點和優(yōu)點,分分秒秒影響著社會生活、社會生產和人類生存生活方式[1]。如今,世界各國已經把大數(shù)據(jù)技術地研究和產業(yè)發(fā)展上升為國家戰(zhàn)略重點推進。對于整個國家而言,能否真正抓住大數(shù)據(jù)發(fā)展機遇,快速形成自己的核心技術和成果應用,參與到全球化競爭的隊伍,是決定未來國家科技力量格局的最重要的內容,是決定一個民族能否昂首挺胸與世界民族前列的核心技術成果應用。數(shù)據(jù)產生的變革無處不在,數(shù)據(jù)產生的變革如此影響巨大,數(shù)據(jù)產生的變革如此滲透力強,那么我們生活、工作、研究的步伐不得不考慮改變傳統(tǒng)策略和方法,盡快走上大數(shù)據(jù)的優(yōu)化時代。體育研究是對與體育相關的各個層面進行的價值挖掘和探討其因果關系,得到預想的科研成果。那么在大數(shù)據(jù)時代,體育科研又要開辟什么樣的道路呢?

1 體育科研方法的改變

傳統(tǒng)的體育科研方面有文獻資料法、訪談法、問卷調查法、統(tǒng)計法、實驗法等,這些方法都是在有限的數(shù)據(jù)條件下隨機抽取一定的樣本,按照因果關系盡量去解釋已經出現(xiàn)的問題。大數(shù)據(jù)時代對這些方法已經提出了徹底的革命性的挑戰(zhàn)和要求舞臺更換。

1.1 研究對象的改變

過去,我們在做科研的時候因為收集數(shù)據(jù)的局限性和處理數(shù)據(jù)能力的限制,在科學研究中我們通常采用隨機從全集數(shù)據(jù)中抽樣進行問卷調查、訪談,試驗等,然后通過對隨機性樣本數(shù)據(jù)的分析來推斷全部數(shù)集的總體特征,就此而言,我們所研究對象的范圍比真正的數(shù)據(jù)范圍小很多,我們是在我們自己能夠控制研究過程的前提下來讓分析盡量變得簡單?,F(xiàn)在,我們迎來的大數(shù)據(jù)時代,我們面對的是海量的數(shù)據(jù),已經不是以前對千字節(jié)(KB)或者兆字節(jié)(MB)進行刪減取其有效準確數(shù)據(jù)進行分析研究,而是面對拍字節(jié)(PB),甚至艾字節(jié)(EB)這種海量數(shù)據(jù)的處理和分析。這些非結構化數(shù)據(jù)的大量產生來源于物聯(lián)網的飛速發(fā)展,它們構成了生物大數(shù)據(jù)、交通大數(shù)據(jù)、電信大數(shù)據(jù)、金融大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)、科研大數(shù)據(jù)、教育大數(shù)據(jù)等。這些數(shù)據(jù)存在的特點就是結構性數(shù)據(jù)和非結構性數(shù)據(jù)混合存在,有效數(shù)據(jù)和模糊數(shù)據(jù)混合存在,我們根本不能從中看到價值取向。于是,大數(shù)據(jù)技術提供了海量數(shù)據(jù)的儲存和分析:分布式文件系統(tǒng)和分布式數(shù)據(jù)庫技術提供了無限制的數(shù)據(jù)儲存能力,分布式并行變成框架MapReduce提供了強大的數(shù)據(jù)處理能力。因此,在這些技術支持的前提下,我們對全體數(shù)據(jù)的分析完全可以在短時間內迅速得到結果,速度之快超乎想象。

統(tǒng)計學家們曾反復證明:采樣分析的精確性隨著采樣隨機性的增加而大幅度的提高,但與樣本數(shù)量的增加關系不大[2]。他們還認為:樣本選擇的隨機性比樣本數(shù)量更重要[2]。他們的這種觀點,確實可以通過隨機收集樣本,用很低的代價做出高精度的判斷,在過去的時代里取得了很大的成就,是那個時代測量領域的主心骨,但是,這條捷徑是在數(shù)據(jù)不可收集和無法分析全部數(shù)據(jù)的情況下不可挑剔的最佳選擇,它本身存在很多很多固有的缺陷。祝建華教授在一次討論中明確指出:如果抽樣隊形更復雜,根本找不到最佳抽樣對象,那么,我們就不能從隨機抽樣中得到反映總體的結構性數(shù)據(jù)[3]。就此而言,我們就根本無法從事一些研究,比如,我們在網絡中調查人們對于體育運動項目選擇性喜好時,我們根本無法確定我們隨機得到的樣本是否是我們真正需要的、真正有研究意義的樣本,或許,你抽取的樣本剛好是一個區(qū)域的數(shù)據(jù)!或許,你的抽樣代表了一定階層的體育運動者的喜好!又或許,我們再進行深層次細分領域的研究時,隨機抽取的樣本根本不可取,因為,宏觀領域起作用的方法,在微觀領域就失去了價值功能。所以,我們需要大數(shù)據(jù),我們需要大數(shù)據(jù)的儲存和處理分析,我們需要的樣本就是“總體”,我們才能有更客觀的成果反映。

1.2 研究結果的改變

在過去的抽樣分析中,我們追求分析結果的準確性,隨機采取樣本需要可行的、有效的、嚴密的布置和實施,選擇好比較恰當?shù)年P聯(lián)物,然后通過理論指導從收集到的數(shù)據(jù)來進行相關分析,最后從相關結果的有效性得到自己事先所設想的問題和需要解決的問題的比較精確的答案,所以整個過程是在假設條或預想中開展,整個數(shù)據(jù)的分析目的就是為解決現(xiàn)有的懷疑和問題。比如,我們要分析優(yōu)秀跳遠運動員在起跳過程中擺動腿的擺動角度對跳遠成績的影響,我們搜集一定樣本的數(shù)據(jù),對樣本中優(yōu)秀運動員整個起跳過程中擺動腿的擺動角度進行分析總結,我們發(fā)現(xiàn),運動員擺動腿控制在一定的角度內,會出現(xiàn)同級別的運動員跳遠成績更理想的情況。在同樣情況下,我們只能從這些樣本數(shù)據(jù)中解決我們自己提出的問題,這些數(shù)據(jù)不會再回答你突然意識到的新問題。我們可以肯定地說,這種樣本分析方法是一個解決問題的有效方法,但是它只僅僅是一個有限制和范圍的路徑,它不能適用于新情況新現(xiàn)象,我們在體育運動發(fā)展到現(xiàn)在這個水平上,已經不僅僅是只解決一個事先設計好的問題,我們需要從數(shù)據(jù)中得到更有價值,更有延展性的實實在在的信息,能得到我們沒有料想到的,我們計劃之外的,具有時代意義的分析結果。那么,精確性就只能在小樣本時代存在,而在大數(shù)據(jù)時代,我們追求的是實時分析結果(因為有些數(shù)據(jù)是秒級響應,否則會失去價值)和更多的數(shù)據(jù)自己說出來的不能預料的有效價值,那么,我們進行數(shù)據(jù)分析就需要的是效率,需要的是新價值,它們成為數(shù)據(jù)分析的核心。

大數(shù)據(jù)時代,我們傳統(tǒng)的體育統(tǒng)計小樣本量基礎上實驗結果關聯(lián)物有精確相關性的方法要慢慢淡出歷史舞臺,我們不再需要人工耗時耗材去選擇可行的樣本和關聯(lián)物去分析預想和假設的問題了。其實更有很多假設同時也帶有個人偏見的,僅僅只為找到線性關系,也很容易導致錯誤,所以精確度已經屬于個別事物的小數(shù)據(jù)現(xiàn)象了[4]?,F(xiàn)在,我們擁有如此宏大的數(shù)據(jù)庫,擁有如此高效率分析的現(xiàn)代化機器計算能力,這些現(xiàn)代化的信息和技術為我們提供了一系列新的視野和有效的預測,我們能看到以前我們根本不曾注意到的聯(lián)系,還能夠掌握以前無法理解的復雜運動技術、運動動態(tài)、運動現(xiàn)象、運動黑幕和其他相關的體育世界。我們不再去刻意去得到精確的數(shù)據(jù)發(fā)現(xiàn)關聯(lián),因為大數(shù)據(jù)優(yōu)劣互摻,紛繁復雜,形式多樣,我們在如此海量的數(shù)據(jù)中不能去刨根問底,而是要去尋找相關關系,要去從大體上把握發(fā)展方向,當然,我們不是放棄精確度,只是我們不再沉迷于此,我們適當放棄微觀上層面上的精確度會讓我們在宏觀層面有更為寬廣的觀察力。自然,要求精確已經轉變到尋找相關了。

1.3 研究核心的轉變

過去,我們要在研究中要去努力發(fā)現(xiàn)因果關系,發(fā)現(xiàn)導致一種現(xiàn)象的原因,比如一場體育賽事的收入顯著偏低,那么,我們就要從廣告、門票、轉播、贊助等方面收集樣本數(shù)據(jù),然后分析得出導致這種結果的原因,我們是在找原因,找因果關系。大數(shù)據(jù)時代開辟了一場尋找無聲無息的游戲,開辟了一場挖掘寶藏的游戲,而人們對于數(shù)據(jù)的看法以及相關關系釋放出的潛在價值正是這場演出的關鍵所在。大數(shù)據(jù)不需要去建立假設,不需要去找問題的結果,大數(shù)據(jù)的核心是從相關關聯(lián)基礎上去預測,比如,2014年巴西世界杯期間,大數(shù)據(jù)預測已經成為關注的焦點,百度、谷歌、微軟和高盛等巨頭都競相利用大數(shù)據(jù)預測比賽結果,期間,百度預測最為亮眼,預測淘汰賽準確率竟然為94%。百度的做法就是收集到過去5年內全世界987支球隊的3.7萬場比賽數(shù)據(jù),同時,搜索外圍相關的數(shù)據(jù)。建立了一個囊括199972名球員和1.2億條數(shù)據(jù)的預測模型,并在此基礎上進行數(shù)據(jù)處理發(fā)現(xiàn)相關關系進行預測[4]。再如,芝加哥大學的一位經濟學家使用11年中超過64000場摔跤比賽的記錄發(fā)現(xiàn)了非法操縱比賽結果的實時現(xiàn)象,從而正確的預測到未來一場比賽的非法操縱的可能性,有效遏制了體育比賽的丑陋現(xiàn)象[2]。事實上,大數(shù)據(jù)之于全球體育領域的重要性,正在不斷升級,諸如Amisco、OPTA、SAP、以及Prozone這樣的數(shù)據(jù)公司,已經成為足球界必不可少的數(shù)據(jù)細分環(huán)節(jié),細分技術就是對相關關系的搜索[1]。2016年樂視和搜達的合作,開辟了互聯(lián)網大數(shù)據(jù)最具價值的第四極,成為消費者和互聯(lián)網的新連接點。另外,“創(chuàng)冰科技”已經成為中國體育產業(yè)的大數(shù)據(jù)公司之一,專注于體育賽事分析和賽事預測[5]??梢?,大數(shù)據(jù)時代已經不是刻意的去尋求因果關系,而是發(fā)現(xiàn)數(shù)據(jù)的相關關系,從相關關系中有效的預測會發(fā)生的事件。這就是大數(shù)據(jù)時代最為影響力的時代產物。我們在做一種運動的時候大數(shù)據(jù)相關分析會預測你還會做另外一種事情,但為什么要做這種事情,大數(shù)據(jù)不會告訴你原因,只是在分析關聯(lián)中的一種預測。所以,我們在做科研時需要在大數(shù)據(jù)中挖掘縱橫交錯的相關關系,在相關關系中我們去處理我們需要做的事情,預測未來可能發(fā)生的事情,積極推進有利的可能,努力預防有害的現(xiàn)象。

2 體育科研關鍵技術的變化

我們談及大數(shù)據(jù)時,已經不是單指數(shù)據(jù)的本身,而是大數(shù)據(jù)和大數(shù)據(jù)技術兩者的協(xié)同,也就是說,在存在海量數(shù)據(jù)的前提下,我們要有實施大數(shù)據(jù)的采集、儲存、分析和應用的技術,是一系列使用非傳統(tǒng)的工具來對大量的結構化、半結構化和非結構化數(shù)據(jù)進行處理,從而獲得分析和預測結果的一系列數(shù)據(jù)處理和分析技術。

我們在討論數(shù)據(jù)處理時,首先要了解數(shù)據(jù)處理的基本流程,其實也就是采集、儲存、分析和結果展示。數(shù)據(jù)無處不在,足球比賽、籃球比賽、門票收入、廣告展示、場地面積、技術動作錄像、觀眾意見,還有一些傳感器信息,個人微信、個人微博信息等,大量的分散數(shù)據(jù)從各個層面各個角度、各個地方涌現(xiàn)。這就需要有相應的軟件進行采集數(shù)據(jù),采集后的數(shù)據(jù)無法直接用于后續(xù)的數(shù)據(jù)分析,因為這些數(shù)據(jù)類型多樣,來源廣泛,還有數(shù)不盡的殘缺數(shù)據(jù)和模糊不清的數(shù)據(jù),所以要有采取一定的措施把這些數(shù)據(jù)預處理變成一個集合,這個集合里面的數(shù)據(jù)呈可用狀態(tài)。處理后的數(shù)據(jù)放進數(shù)據(jù)庫系統(tǒng)中儲存管理,然后采用數(shù)據(jù)挖掘工具對數(shù)據(jù)進行處理分析,最后呈現(xiàn)給我們的是挖掘出來的科研寶藏,我們在寶藏指導下進行有意義的體育工作。在整個數(shù)據(jù)技術過程中,還要注意隱私保護和安全問題,具體如表1所示。

表1 大數(shù)據(jù)技術的幾個層面和功能

3 結語

大數(shù)據(jù)已經是無處不在,包括電信、能源、教育、醫(yī)療、金融等社會的各行各業(yè),它同物質資源、人力資源一樣成為國家的重要戰(zhàn)略資源,影響著國家和社會的安全、穩(wěn)定與發(fā)展。在大數(shù)據(jù)發(fā)展的背景下,我們體育科研工作已經不能再遵循傳統(tǒng)的科研方法了,傳統(tǒng)是在一定條件限制下所形成的優(yōu)化研究方法,隨著科技的飛速發(fā)展和科研成果的轉化應用,我們的科研方法也走在了非變不可的重要時刻,我們要抓住機遇,緊跟大數(shù)據(jù)時代的全球性科研方法的更新和轉變,把我們的體育科研工作切實的更上一層樓。

[1]維克托.邁爾-舍恩伯格.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2016.

[2]林子雨.大數(shù)據(jù)技術原理與應用[M].北京:人民郵電出版社,2017.

[3]徐子沛.正在到來的數(shù)據(jù)革命[M].南寧:廣西師范大學出版社,2015.

[4]朱潔.大數(shù)據(jù)架構詳解:從數(shù)據(jù)獲取到深度學習[M].南寧:電子工業(yè)出版社,2016.

[5]楊百會.體育大數(shù)據(jù)的資本狂潮[J].企業(yè)觀察家,2016(10):78-79.

猜你喜歡
樣本預測時代
無可預測
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
選修2—2期中考試預測卷(A卷)
規(guī)劃·樣本
人大專題詢問之“方城樣本”
隨機微分方程的樣本Lyapunov二次型估計
e時代
e時代
e時代
邵东县| 乡宁县| 徐汇区| 延安市| 韶山市| 轮台县| 呼和浩特市| 武隆县| 东海县| 张掖市| 丽江市| 多伦县| 潜江市| 南和县| 台州市| 乐至县| 金沙县| 汉阴县| 唐海县| 鄂尔多斯市| 余姚市| 五大连池市| 余江县| 新野县| 高要市| 安徽省| 邮箱| 武安市| 绵阳市| 仁寿县| 温州市| 华阴市| 慈溪市| 阳西县| 平陆县| 淮北市| 灵宝市| 体育| 双辽市| 随州市| 长兴县|