陳秀剛/編譯
編者按:“數(shù)據(jù)即金礦”,這是大數(shù)據(jù)時代人們耳熟能詳?shù)囊痪湓挕榱藥椭侵揶r(nóng)民擺脫貧窮,八國集團正在考慮開放農(nóng)業(yè)數(shù)據(jù)來提高非洲的生產(chǎn)力。不過,開放與私有、公共與個人之間,永遠都存在難以調(diào)和的矛盾?!稌r代》雜志的前攝影師說,“眼下主要是企業(yè)和政府在考慮有關(guān)大數(shù)據(jù)的用途,我們每個人也應(yīng)當(dāng)考慮大數(shù)據(jù)是如何影響我們的生活的?!睔W盟正在討論如何保護大數(shù)據(jù)時代的個人隱私,正在修改中的《歐盟個人數(shù)據(jù)保護指令》要求科學(xué)家在利用個人數(shù)據(jù)時必須經(jīng)過每個數(shù)據(jù)持有者的同意——但這幾乎是不可能實際操作的。于是希望通過大數(shù)據(jù)來獲得下一個大的突破的科學(xué)家們開始尋求特殊條款。科學(xué)家們與出版商之間也在激烈交鋒。前者希望通過計算機程序下載和閱讀論文,并以此獲得新的發(fā)現(xiàn)。然而出版商則認為無限制的文本挖掘會使他們的服務(wù)器疲勞過度。既然是金礦,就一定存在利益分配的問題。本組本章,將帶領(lǐng)我們進入這一熱點領(lǐng)域,一探究竟。
農(nóng)業(yè)專家提出,數(shù)據(jù)共享將提高非洲的生產(chǎn)力
現(xiàn)今,農(nóng)民的食物產(chǎn)出量是50年前的3倍,而使用的土地僅僅比50年前多了12%,這都要歸功于新技術(shù)以及更優(yōu)良的耕作方式的應(yīng)用。但全球各地的水平參差不齊。非洲農(nóng)業(yè)研究論壇研究表明,非洲農(nóng)民的個人實際產(chǎn)出量僅占全球平均個人產(chǎn)出量的一小部分,大部分人都在與土壤貧瘠和氣候干旱的斗爭中勉強度日。
幫助非洲和其他地區(qū)的農(nóng)民生產(chǎn)出更多的食物,將會是數(shù)百萬人擺脫貧困以及養(yǎng)活2050年的90億世界人口的關(guān)鍵。食品政策專家認為,實現(xiàn)這一目標(biāo)的關(guān)鍵在于,給農(nóng)民、科學(xué)家和企業(yè)家自由訪問農(nóng)業(yè)數(shù)據(jù)的權(quán)力。在為期2天的關(guān)于開放農(nóng)業(yè)數(shù)據(jù)問題的國際會議上,八國集團——即世界上最富裕的八個國家——的領(lǐng)導(dǎo)人們集體討論出了取消數(shù)據(jù)限制的最佳途徑,而且這些數(shù)據(jù)也很容易被人和機器所分析。
“農(nóng)業(yè)數(shù)據(jù)非常有趣,因為它分好幾種類型,”詹姆斯·亨德勒(James Hendler)說,他是紐約特洛伊市倫斯勒理工學(xué)院的計算機科學(xué)教授,負責(zé)美國政府網(wǎng)站Data.gov的建設(shè)。該網(wǎng)站上有關(guān)于諸如植物基因組學(xué)和當(dāng)?shù)靥鞖馇闆r的詳盡數(shù)據(jù)庫。還有一些比如特定土壤條件下最好的作物研究、降水量的變化、害蟲和疾病的跡象,以及當(dāng)?shù)厥袌鲎魑锏钠谕麅r格等數(shù)據(jù)庫。
來自法國蒙彼利埃國際農(nóng)業(yè)研究中心的皮爾斯博科克在國際農(nóng)業(yè)研究組織聯(lián)合會上說,如果這些數(shù)據(jù)集都能做到免費提供,那么他們將會派上大用場。在這次會議上,來自大學(xué)及研究機構(gòu)的專家們介紹了他們開發(fā)的數(shù)據(jù)應(yīng)用程序,這些程序已經(jīng)可以公開使用。其中包括MyFarm,一款基于安卓的多語言應(yīng)用程序,能夠為小農(nóng)戶提供相應(yīng)的農(nóng)業(yè)咨詢;Aqueduct是一款互動工具,能提供與水相關(guān)的風(fēng)險問題的高分辨率地圖。
在非洲,即使最貧窮的農(nóng)民都會攜帶手機,享受開放式數(shù)據(jù)帶來的福利,這僅是一個設(shè)想——令人難以置信——但也不是完全不可能實現(xiàn)。 “想象一下”,博科克說,“一個站在馬拉維農(nóng)田里的女人,用剛剛借來的錢創(chuàng)辦了自己的農(nóng)場,如果我們在她的手機上進行地理定位設(shè)置,然后通過運用數(shù)據(jù)生態(tài)系統(tǒng)知識庫,系統(tǒng)能夠識別土壤類型和特定土層的需求,告訴她應(yīng)該買什么樣的種子、何時種植、收獲等等?!?/p>
想要讓這些“假設(shè)”的方案成為現(xiàn)實,就需要更多免費的農(nóng)業(yè)科研資料挖掘平臺入口——不僅人類能自主使用,機器也能自主挖掘辨認。一些大學(xué)和研究中心的科學(xué)家們對于自己收集的大部分?jǐn)?shù)據(jù),明確表示,出于安全或隱私原因,這些數(shù)據(jù)不能公開?!艾F(xiàn)在流行一種說法,‘我不想分享,這是我的私人財產(chǎn)’,或‘這是政府財產(chǎn)’”,博科克說道。
即便有些資料是免費的,也不一定很容易被搜索到并投入使用。例如,亨德勒說,目前存在這樣一個日益增長的趨勢,政府及機構(gòu)提供原始形式的數(shù)據(jù),或通過應(yīng)用程序的數(shù)據(jù)操作軟件,或者創(chuàng)建移動應(yīng)用程序來公開一些數(shù)據(jù)。然而,這樣的數(shù)據(jù)集很難在互聯(lián)網(wǎng)上被搜索到。同時也可能由于缺少標(biāo)注或其他原因難以被識別和應(yīng)用。
亨德勒因研究語義網(wǎng)而出名,他將目前的情況比作前網(wǎng)絡(luò)時代的超文本時期,既沒有共享信息的標(biāo)準(zhǔn),也沒有任何能找到信息的搜索引擎。他說,目前亟需新的方法和技術(shù),這樣發(fā)現(xiàn)數(shù)據(jù)并進行數(shù)據(jù)交互,才能變得更便捷。
八國集團開放數(shù)據(jù)會議標(biāo)志著文本共享的開始。在這次會議上,一些國家公布了關(guān)于農(nóng)業(yè)數(shù)據(jù)庫公開的政策方案。其中加拿大、印度、美國,正在推動建設(shè)一個開放性的數(shù)據(jù)共享平臺。例如美國農(nóng)業(yè)部,宣布在Data.gov上建立一個門戶網(wǎng)站,該網(wǎng)站能鏈接到348個農(nóng)業(yè)數(shù)據(jù)集。
不過,要真正做到大規(guī)模的資料開放,仍需要八國集團和合作國、國際組織,以及私營部門之間長久的努力?!氨举|(zhì)上說來,這屬于文化變化”,博科克說,“老派的研究作風(fēng)認為,我所收集的資料是自己的私人財產(chǎn):‘為什么我要把它給別人?’而公開數(shù)據(jù)的行為將會改變整個世界?!?/p>