国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)對科學(xué)活動的影響

2014-05-30 20:41:16劉偉榕王秋君
理論觀察 2014年5期
關(guān)鍵詞:知識生產(chǎn)大數(shù)據(jù)

劉偉榕 王秋君

[摘 要]科學(xué)界正在從數(shù)據(jù)缺乏時代過渡到數(shù)據(jù)泛濫時代,大數(shù)據(jù)處理系統(tǒng)有望成為新一代的科研基礎(chǔ)設(shè)施。在新的技術(shù)環(huán)境下,數(shù)據(jù)成了科研最主要的對象,統(tǒng)計算法成了最有力的科研工具,科研思路也將從假說驅(qū)動轉(zhuǎn)向數(shù)據(jù)探索。為了分享知識生產(chǎn)日益依賴的技術(shù)與設(shè)備,科學(xué)家將結(jié)成聯(lián)盟進(jìn)行工程化協(xié)作,科學(xué)進(jìn)步中的共享化與全球化也將更為顯著。有樂觀的學(xué)者認(rèn)為大數(shù)據(jù)有望成為科學(xué)研究的“第四范式”,不過也可能伴隨著科研路徑依賴、資源壟斷、成果糾紛等負(fù)面影響。

[關(guān)鍵詞]大數(shù)據(jù);科學(xué)發(fā)現(xiàn);知識生產(chǎn);第四范式

[中圖分類號]G311 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1009 — 2234(2014)05 — 0042 — 02

大數(shù)據(jù)通常用來指無法在可容忍的時間內(nèi)用傳統(tǒng)IT技術(shù)和軟硬件工具對其進(jìn)行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合,具有容量大、產(chǎn)生速度快、類型繁多、信息價值大與冗余信息多等四個特征。〔1〕人類正在進(jìn)入大數(shù)據(jù)時代,推動這個時代到來的科學(xué)研究活動將不可避免地受到大數(shù)據(jù)的反作用。本文綜合最新的大數(shù)據(jù)研究、前沿的科研案例及科學(xué)哲學(xué)理論,嘗試對科學(xué)活動正在發(fā)生與將要發(fā)生的變化進(jìn)行探討。

一、科學(xué)研究工具、方法、對象的變革

一是大數(shù)據(jù)處理系統(tǒng)將成科研基礎(chǔ)設(shè)施。在科研信息化的推動下,人類對自然和社會的觀察、感知、計算、仿真、模擬、傳播等活動產(chǎn)生出大量科學(xué)數(shù)據(jù)。如何存儲海量的科學(xué)數(shù)據(jù)成為科學(xué)家遇到的首要困難,例如歐洲粒子中心的大型強(qiáng)子對撞機(jī)每天都產(chǎn)生好幾個千萬億字節(jié)(PB),但現(xiàn)在卻只能按照可管理的能力限制其數(shù)據(jù)速率?!?〕科學(xué)家難以密切關(guān)注到任何一項單獨的數(shù)據(jù),而需要機(jī)器進(jìn)行輔助篩選??鐚W(xué)科研究的興起更是加大了數(shù)據(jù)的規(guī)模和復(fù)雜性,包含采集、管理與分析工具的大數(shù)據(jù)處理系統(tǒng)對環(huán)境應(yīng)用科學(xué)、海洋科學(xué)、生態(tài)科學(xué)、物理學(xué)、天文學(xué)、生物學(xué)等領(lǐng)域來說已經(jīng)成為一種基本的科研設(shè)施。在大數(shù)據(jù)科研設(shè)施布局方面,美國已經(jīng)走在世界前列。例如能源部(DOE)將斥資2500萬美元建立可擴(kuò)展數(shù)據(jù)管理與可視化研究所,幫助科學(xué)家對數(shù)據(jù)進(jìn)行有效管理,促進(jìn)其生物和環(huán)境研究計劃、美國核數(shù)據(jù)計劃等的研究成果?!?〕

二是科研方法從假說驅(qū)動轉(zhuǎn)向數(shù)據(jù)探索。正如第谷的助手開普勒從第谷對天體運動的系統(tǒng)觀察記錄中發(fā)現(xiàn)了行星運動定律那樣,在對所采集并仔細(xì)保存的實驗數(shù)據(jù)進(jìn)行挖掘和分析的基礎(chǔ)上建立起新的理論,正是大數(shù)據(jù)時代科學(xué)活動的一個重要特征。大數(shù)據(jù)技術(shù)的巨大魅力在于通過統(tǒng)計算法揭示事物之間的相關(guān)性。美國 Wired 雜志主編 Chris Anderson就認(rèn)為“理論已終結(jié)”、“數(shù)據(jù)洪流使傳統(tǒng)科學(xué)方法變得過時”。 〔4〕他相信只要將有相互關(guān)系的PB級數(shù)據(jù)丟進(jìn)巨大的計算機(jī)機(jī)群中,統(tǒng)計分析算法可以發(fā)現(xiàn)過去的科學(xué)方法發(fā)現(xiàn)不了的新規(guī)律、新知識?;谶@樣的技術(shù),人們有理由相信,未來的科研方法將從傳統(tǒng)的假說驅(qū)動型轉(zhuǎn)向數(shù)據(jù)探索型??茖W(xué)家們不必關(guān)心通過什么實驗來驗證假說,而是追求從現(xiàn)有數(shù)據(jù)中發(fā)現(xiàn)研究對象之間的關(guān)聯(lián),把多個學(xué)科和領(lǐng)域的數(shù)據(jù)進(jìn)行融合,或許就能有新的發(fā)現(xiàn)。

三是科研對象的雙重虛擬與觀察滲透。與大數(shù)據(jù)科研方法相對應(yīng),科學(xué)研究的對象被以數(shù)據(jù)的形式二重虛擬化?!昂A繑?shù)據(jù)的出現(xiàn)催生了一種新的科研模式,科研人員只需從數(shù)據(jù)中直接查找或挖掘所需要的信息、知識和智慧,甚至無需直接接觸所研究的對象。”〔5〕美國的海洋觀測站計劃(OOI)旨在幫助科學(xué)家們通過高清影像設(shè)備、傳感器控制、遙控潛水器等與海洋實現(xiàn)互動。但要實現(xiàn)該計劃,還需要計算機(jī)科學(xué)家與海洋學(xué)家合作,共同提供采用連續(xù)數(shù)據(jù)的模型、自動化的數(shù)據(jù)質(zhì)量控制和校準(zhǔn)、支持?jǐn)?shù)據(jù)分析和可視化方面的新方法。〔2〕(P32-35)這預(yù)示著在大數(shù)據(jù)時代,科學(xué)的觀察滲透進(jìn)一步加強(qiáng):獲取數(shù)據(jù)的方法與設(shè)備、處理龐大數(shù)據(jù)的能力決定科學(xué)家能研究什么以及得到怎樣的研究結(jié)果;滲透到觀察結(jié)果中的不僅有本領(lǐng)域的科學(xué)理論,還有來自數(shù)據(jù)處理領(lǐng)域的理論與算法。

二、知識生產(chǎn)方式和科學(xué)進(jìn)步模式的變化

首先,知識生產(chǎn)對技術(shù)與資本的依賴性增強(qiáng)。大數(shù)據(jù)時代,科學(xué)研究與信息技術(shù)手段之間的聯(lián)系越來越緊密。以大數(shù)據(jù)技術(shù)進(jìn)行的研究需要極多的資源,收集、儲存、保留、管理、分析和共享海量數(shù)據(jù)各個環(huán)節(jié)都需要設(shè)備、技術(shù)與人才,獲得相當(dāng)?shù)目蒲匈Y金才可能進(jìn)行。先進(jìn)的數(shù)據(jù)處理技術(shù)既對科學(xué)研究提供了有力和有效的手段,又造成了科研路徑上的依賴甚至是障礙。研究者若沒有相應(yīng)的技術(shù)與設(shè)備,就無法獲得足夠的數(shù)據(jù)和深入的分析處理。因此,資源以及獲取資源的能力決定著科學(xué)家事業(yè)的前途,資本對知識生產(chǎn)的控制力將得到空前的強(qiáng)化。例如美國和加拿大海洋氣象臺的海王星項目撥出大約30%的預(yù)算用于信息化基礎(chǔ)設(shè)施(將近1億美元),而小實驗室的科學(xué)家只能用免費的EXCEL來處理數(shù)據(jù)。

其次,知識生產(chǎn)更傾向于工程化協(xié)作。由于使用大數(shù)據(jù)系統(tǒng)需要昂貴的技術(shù)成本,這使得科學(xué)家之間形成合作聯(lián)盟,共享儀器設(shè)備與技術(shù)服務(wù)。如LHC每年將產(chǎn)生50-100PB的數(shù)據(jù),其中大約20PB數(shù)據(jù)通過國家級網(wǎng)格的全球聯(lián)盟進(jìn)行存儲和加工,這一聯(lián)盟連接了100萬臺CPU?!?〕 除了節(jié)約成本的考慮外,產(chǎn)生大數(shù)據(jù)的項目大多本身就是一個大科學(xué)工程,需要科研人員進(jìn)行跨越多個領(lǐng)域的協(xié)同工作、各個領(lǐng)域的專家共同解決一些復(fù)雜問題。例如海洋觀測站計劃(OOI)的電纜部件研究由華盛頓大學(xué)負(fù)責(zé),維多利亞大學(xué)領(lǐng)導(dǎo)了在加拿大的工作,美國海洋規(guī)劃協(xié)會管理和整合整個OOI系統(tǒng),伍茲霍爾海洋研究所和加利福尼亞大學(xué)圣地亞哥分校分別負(fù)責(zé)管理項目的沿海-全球部分和網(wǎng)絡(luò)基礎(chǔ)設(shè)施部分?!?〕(P32)

再者,科學(xué)進(jìn)步日益共享化與全球化。在工程化協(xié)作中所實現(xiàn)的科學(xué)進(jìn)步,實質(zhì)上也是一種共享式進(jìn)步。得益于大規(guī)模計算能力、存儲能力和科學(xué)儀器的共享支持,科學(xué)家們能夠方便地獲得和使用大量的來自其他科研團(tuán)隊的科學(xué)數(shù)據(jù)。例如,2009年丹麥第一例H1N1感染者得到確認(rèn)的幾天之后,H1N1病毒中的H1亞單位序列的全部1699個堿基就被提交到了EMBL-Bank(歐洲分子生物學(xué)實驗室核酸序列數(shù)據(jù)庫),此后美國、意大利、墨西哥、加拿大、以色列等多個國家都提交了更多的病毒亞單位序列數(shù)據(jù)?!?〕(P120)在這樣的共享中,研究周期和研究費用將大幅度縮減,從而提高了科學(xué)進(jìn)步的速度與質(zhì)量。大數(shù)據(jù)還使得科學(xué)進(jìn)步日益呈現(xiàn)出全球化的效應(yīng)。例如微軟全球望遠(yuǎn)鏡(WWT)作為國際“虛擬天文臺”的一部分,現(xiàn)在可以無縫鏈接到天文學(xué)家們已經(jīng)習(xí)慣的定量研究工具上?!?〕(P41)在這樣的研究模式中,科學(xué)家足不出戶就能獲得其他國家的技術(shù)設(shè)備與科研成果,來自全球的數(shù)據(jù)和信息能夠被用來為某一研究課題服務(wù),得出的成果原則上是一種全球性的成果。

三、反思:大數(shù)據(jù)的利與弊

從積極的一面來看,大數(shù)據(jù)或?qū)㈤_創(chuàng)科學(xué)研究的“第四范式”。大數(shù)據(jù)相關(guān)的科研方法將在越來越多的領(lǐng)域中發(fā)揮重大的甚至是決定性的作用。有了數(shù)據(jù)處理系統(tǒng)的輔助,科學(xué)家可以把精力集中在創(chuàng)造性的勞動上,大數(shù)據(jù)不會自動產(chǎn)生科學(xué)知識,但至少增加了科學(xué)家做出科學(xué)發(fā)現(xiàn)的時間和可能。一批樂觀的科學(xué)家更是看到了大數(shù)據(jù)對科學(xué)的變革力量。2007年,已故圖靈獎得主吉姆·格雷(Jim Gray)把數(shù)據(jù)密集型科學(xué)從計算科學(xué)中區(qū)分出來,提出了數(shù)據(jù)密集型科學(xué)研究的“第四范式”??茖W(xué)研究最早的兩種范式是實驗型科研與理論型科研,第三種范式即計算型科研通過利用計算能力發(fā)揮理論的作用,第四種范式則是在未知規(guī)律的情況下,運用計算能力從大數(shù)據(jù)中發(fā)現(xiàn)規(guī)律。

依賴大數(shù)據(jù)也可能帶來眾多負(fù)面影響。一是科研資源壟斷可能加劇??茖W(xué)家能否進(jìn)入大數(shù)據(jù)的研究平臺,受制于海量的科研數(shù)據(jù)是否開放,也取決于是否有相應(yīng)的設(shè)備來獲取和處理這些數(shù)據(jù)。大數(shù)據(jù)與資本緊密結(jié)合的特性強(qiáng)化了科研資源掌握者對科研的走向與產(chǎn)出的控制。二是科學(xué)家可能形成技術(shù)路徑依賴。數(shù)據(jù)技術(shù)只能對豐富而且復(fù)雜的真實世界提供相對簡略的描述。更進(jìn)一步而言,尋找不同尋常和意料之外的東西需要創(chuàng)造性和洞察力。計算機(jī)和數(shù)據(jù)庫不可能自動導(dǎo)致創(chuàng)造性的科學(xué)發(fā)現(xiàn),科學(xué)家如果過分依賴數(shù)據(jù)資源和搜索工具,就會造成親身實踐獲取“第一手”資料的能力退化。三是科學(xué)合作的成果歸屬易引起紛爭。首先,對于數(shù)據(jù)提供方能否算作合作者并給予一定的署名權(quán)存在爭議;其次,對于工程化和全球化協(xié)作產(chǎn)生的成果是屬于集體智慧的,對于成果的所有權(quán)該如何分配?2013年的諾貝爾物理學(xué)獎僅頒給兩位理論創(chuàng)始人弗朗索瓦·恩格勒特和彼得·希格斯,而發(fā)現(xiàn)希格斯玻色子的幾千名粒子物理學(xué)家卻無緣此榮譽(yù),這引起了包括諾獎評委安德斯?巴拉尼在內(nèi)的抗議。最令人擔(dān)心的是,隨著科學(xué)和技術(shù)和商業(yè)性的開發(fā)越來越聯(lián)系緊密,一些具有商業(yè)價值的科學(xué)信息和數(shù)據(jù)為擁有者所不愿意公開,甚至通過申請專利來實施保護(hù),這將帶來更大范圍的不公平與糾紛。

大數(shù)據(jù)是對人類信息處理能力的挑戰(zhàn),對科學(xué)家們來說則是面臨著科研數(shù)據(jù)爆炸式增長的威脅,如果沒有應(yīng)對好,科學(xué)可能就無從進(jìn)步??茖W(xué)家們面對數(shù)據(jù)的泛濫,還應(yīng)該從根源上去反思,比如實驗思路是否出了問題。同時,大數(shù)據(jù)是應(yīng)對數(shù)據(jù)挑戰(zhàn)而提出的技術(shù)系統(tǒng),這也使得科學(xué)研究與技術(shù)手段之間的界限越來越模糊,科學(xué)能力甚至在某種意義上轉(zhuǎn)化為了技術(shù)能力,這對科學(xué)與技術(shù)之間的關(guān)系提出了新的問題,值得學(xué)者們深入研究。

〔參 考 文 獻(xiàn)〕

〔1〕Manyika,J,Chui M,Brown J,et al. Big Data: The Next Frontier for Innovation, Competition and Productivity〔R〕.McKinsey Global Institute,2011:1.

〔2〕Tony Hey,等.第四范式:數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)〔M〕.潘教峰,等,譯.北京:科學(xué)出版社,2012.

〔3〕馮海超.透視美國大數(shù)據(jù)爆發(fā)全景〔J〕.互聯(lián)網(wǎng)周刊,2013,(01):39.

〔4〕Chris Anderson. The End of Theory: The Data Deluge Makes the Scientific Method Obsolete〔J〕. Wired, 2008,(07):16.

〔5〕牛祿青.構(gòu)建大數(shù)據(jù)產(chǎn)業(yè)環(huán)境——專訪中國工程院院士、中科院計算所首席科學(xué)家李國杰〔J〕.新經(jīng)濟(jì)導(dǎo)刊,2012,(12):39.

〔6〕A.M.Parker.Towards 2020 Science〔M〕.MicrosoftCorporation,2006.

〔責(zé)任編輯:陳玉榮〕

猜你喜歡
知識生產(chǎn)大數(shù)據(jù)
知識生產(chǎn)模式II中的跨學(xué)科研究轉(zhuǎn)型
高教探索(2017年2期)2017-03-18 15:11:51
ERP管理咨詢?nèi)瞬排囵B(yǎng)的知識生產(chǎn)實踐
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
知識的革命
基于協(xié)同創(chuàng)新的高校內(nèi)部治理變革
高教探索(2015年4期)2015-04-29 03:31:37
網(wǎng)絡(luò)時代知識生產(chǎn)、出版與管理的體制重建
邳州市| 随州市| 长顺县| 扶绥县| 祁东县| 左贡县| 应城市| 大同县| 黄龙县| 瓦房店市| 泾阳县| 抚松县| 福泉市| 呼玛县| 惠安县| 莱芜市| 绿春县| 台北市| 柯坪县| 威宁| 阿图什市| 正蓝旗| 农安县| 定襄县| 佛教| 江孜县| 仁布县| 雷山县| 西林县| 扎兰屯市| 泾源县| 襄城县| 唐山市| 焦作市| 桃园市| 建昌县| 嘉祥县| 沧源| 阿合奇县| 长治市| 元江|