尹國偉 聶鳳英 杜紹明
(1.農(nóng)業(yè)農(nóng)村部信息中心,北京 100125;2.中國農(nóng)業(yè)科學(xué)院海外農(nóng)業(yè)研究中心,北京 100081)
美國農(nóng)業(yè)部(United States Department of Agriculture,以下簡稱USDA)致力于成為美國政府中最高效、最有效和最以客戶為中心的部門,是美國開放共享涉農(nóng)數(shù)據(jù)的重要主體。USDA 制定的2018—2022年7 個戰(zhàn)略愿景[1]中有4 個明確提到了信息或數(shù)據(jù):戰(zhàn)略愿景一“確保高效落實好USDA 工作計劃,并專注于客戶服務(wù)”指出“通過現(xiàn)代化的信息技術(shù)基礎(chǔ)架構(gòu)、設(shè)施和支持服務(wù),以改善客戶體驗”及“改善資源管理,并利用數(shù)據(jù)驅(qū)動的分析來最大化投資回報”;戰(zhàn)略愿景四“促進農(nóng)村繁榮與經(jīng)濟發(fā)展”指出“改善基礎(chǔ)設(shè)施、寬帶接入和連通性”;戰(zhàn)略愿景五“通過技術(shù)和研究加強對土地的管理”指出“利用基于科學(xué)的工具和信息來增強保護規(guī)劃”;戰(zhàn)略愿景七“提供安全、營養(yǎng)豐富的食品供應(yīng)”指出“通過數(shù)據(jù)驅(qū)動、靈活和以客戶為中心的方法來支持和鼓勵健康的飲食選擇”。USDA 有關(guān)組織機構(gòu)結(jié)合業(yè)務(wù)開展專業(yè)領(lǐng)域數(shù)據(jù)信息資源建設(shè)工作,形成了一系列數(shù)據(jù)集、數(shù)據(jù)產(chǎn)品和基于數(shù)據(jù)的專業(yè)報告,并在線發(fā)布了豐富的可開放獲取的涉農(nóng)數(shù)據(jù)信息資源。美國在涉農(nóng)數(shù)據(jù)開放共享方面的做法對開展數(shù)據(jù)信息資源建設(shè)工作,加速數(shù)字化轉(zhuǎn)型升級,激發(fā)數(shù)據(jù)作為新型生產(chǎn)要素價值作用具有一定的參考價值。
美國根據(jù)其政府?dāng)?shù)據(jù)開放法案[2]及循證決策法案[3]等有關(guān)條文要求,開設(shè)了其政府?dāng)?shù)據(jù)門戶(Data.Gov)①https://www.data.gov并持續(xù)更新,政府機構(gòu)使用標(biāo)準(zhǔn)化的機器可讀數(shù)據(jù)格式在線開放共享數(shù)據(jù)信息資源,并將元數(shù)據(jù)發(fā)布到數(shù)據(jù)門戶的數(shù)據(jù)目錄中,用以提升各方參與政府事務(wù)的互動性、創(chuàng)造更多的經(jīng)濟發(fā)展機會,為公共及私營部門議事及決策提供數(shù)據(jù)支撐。
美國是對農(nóng)業(yè)數(shù)據(jù)收集比較齊全的國家,也是較早進行農(nóng)業(yè)數(shù)據(jù)開放的國家。目前,有關(guān)農(nóng)業(yè)數(shù)據(jù)的采集、共享和利用正對美國農(nóng)業(yè)政策制定者制定農(nóng)業(yè)部門發(fā)展的各種政策提供有力支持。不僅如此,美國各大農(nóng)場主協(xié)會以及涉農(nóng)企業(yè)也不惜投入大量的時間、金錢以及花費巨大的精力去搜集被人們稱為“大數(shù)據(jù)”的涉農(nóng)數(shù)據(jù)[4]。影響作物生長的因素有很多,如土壤、氣候、水分、品種、病蟲害和雜草等,作物產(chǎn)量是這些因素的綜合結(jié)果,農(nóng)業(yè)從業(yè)者光憑經(jīng)驗做出決策已遠(yuǎn)遠(yuǎn)不夠,需要依靠科學(xué)、概率和專業(yè)分析得出優(yōu)化決策[5]。美國政府?dāng)?shù)據(jù)門戶設(shè)置有農(nóng)業(yè)、氣候、生態(tài)系統(tǒng)、能源、地方政府、海上運輸、海洋、老年健康等八大專題。農(nóng)業(yè)專題位列八大專題之首,內(nèi)設(shè)“更新”、“數(shù)據(jù)”、“應(yīng)用”、“開發(fā)者”和“聯(lián)系”等欄目。其中,“更新”欄目匯集農(nóng)業(yè)生產(chǎn)、糧食安全、農(nóng)村發(fā)展、營養(yǎng)、自然資源和區(qū)域糧食系統(tǒng)等有關(guān)的新聞信息;“數(shù)據(jù)”欄目可按主題、分類、數(shù)據(jù)類型、數(shù)據(jù)文件格式、機構(gòu)、發(fā)布者等對數(shù)據(jù)進行過濾搜索查詢;“應(yīng)用”欄目列出了能夠幫助做出有關(guān)農(nóng)業(yè)、食品和營養(yǎng)等明智決策的應(yīng)用程序;“開發(fā)者”欄目鏈接到USDA網(wǎng)站的開發(fā)者資源網(wǎng)頁,可以獲取各有關(guān)部門提供的涉農(nóng)特色數(shù)據(jù)集、數(shù)據(jù)產(chǎn)品和web 服務(wù)等;“聯(lián)系”欄目可就農(nóng)業(yè)專題提出意見與問題。
美國政府?dāng)?shù)據(jù)門戶2009 年5 月上線運行[6],截至2020 年9 月15 日,數(shù)據(jù)目錄中可查詢到包括USDA等在內(nèi)199 個機構(gòu)在線發(fā)布的225 599 個數(shù)據(jù)集。其中,以USDA 機構(gòu)名義發(fā)布的數(shù)據(jù)集①https://catalog.data.gov/organization/usda-gov總計1808 個,內(nèi)含396個標(biāo)記地理空間信息數(shù)據(jù)集。
美國政府?dāng)?shù)據(jù)門戶由美國總務(wù)管理局技術(shù)轉(zhuǎn)化服務(wù)中心建設(shè)和管理,技術(shù)開發(fā)基于綜合知識檔案網(wǎng)絡(luò)(The Comprehensive Knowledge Archive Network,以下簡稱CKAN)和WordPress兩個開源框架,數(shù)據(jù)目錄中的元數(shù)據(jù)遵循開放元數(shù)據(jù)架構(gòu)約定(字段信息包括標(biāo)題、描述、標(biāo)簽、更新情況、發(fā)布者、時間、聯(lián)系人情況等)。
CKAN 是開放源碼數(shù)據(jù)資料入口平臺,由Open Knowledge Foundation(OKF)支持發(fā)展,英國和澳大利亞政府?dāng)?shù)據(jù)門戶也基于此開源框架。除了最重要的數(shù)據(jù)資料存取與發(fā)布外,CKAN 還支持可視化展示、標(biāo)記、搜索及過濾、分享、版本控制等,還有不少可擴展插件,以滿足不同領(lǐng)域機構(gòu)組織的多樣化需求。CKAN使用以Python為基礎(chǔ)的Pylons網(wǎng)頁框架,數(shù)據(jù)庫使用PostgreSQL,搜索使用Apache Solr,采用Babel 支持多國語言(不過目前CKAN 對中文的支持并不友好,在字碼轉(zhuǎn)換和漢字識別上還存在不足)。WordPress 是一個免費開源的網(wǎng)站內(nèi)容管理系統(tǒng)(Content management system,CMS),用PHP 代碼編寫,并能夠與MySQL 或MariaDB 數(shù)據(jù)庫聯(lián)動,提供模板功能來支持頁面設(shè)計,還可以通過插件形式拓展網(wǎng)站內(nèi)容管理功能。
美國政府在提高農(nóng)業(yè)勞動生產(chǎn)率、保護農(nóng)業(yè)資源、宏觀調(diào)控農(nóng)業(yè)等方面取得了非常明顯的成績,這與其得天獨厚的農(nóng)業(yè)自然資源相關(guān),也與農(nóng)業(yè)部門間高效組織、明確分工及一體化管理等因素密切相關(guān)[7]。USDA 網(wǎng)站②https://www.usda.gov的數(shù)據(jù)專題頁面介紹了USDA 數(shù)據(jù)治理大體情況,并給出了USDA 開放數(shù)據(jù)目錄鏈接。USDA 成立了專門的數(shù)據(jù)治理機構(gòu),分別設(shè)置了數(shù)據(jù)治理指導(dǎo)委員會和數(shù)據(jù)治理咨詢委員會[8]來領(lǐng)導(dǎo)和實施其數(shù)據(jù)治理工作,設(shè)首席信息官辦公室(Office of Chief information officer,OCIO)負(fù)責(zé)總體信息技術(shù)戰(zhàn)略和管理。數(shù)據(jù)治理指導(dǎo)委員會成員包括首席數(shù)據(jù)官(主席)、首席評估官、首席統(tǒng)計官和有關(guān)任務(wù)領(lǐng)域的首席運營官;常設(shè)季度會議,以及主席確定的特別會議。數(shù)據(jù)治理咨詢委員會成員包括副首席數(shù)據(jù)官(主席),有關(guān)任務(wù)區(qū)域的助理首席數(shù)據(jù)官,來自監(jiān)察長辦公室、隱私保護、地理空間計劃和資本規(guī)劃等有關(guān)方面的無表決權(quán)代表;常設(shè)每月例行會議,以及主席確定的特別會議。
USDA 構(gòu)建了以USDA 網(wǎng)站為主站,由USDA 直屬服務(wù)機構(gòu)網(wǎng)站、行政辦公室網(wǎng)站、專業(yè)服務(wù)網(wǎng)站組成的網(wǎng)站群信息服務(wù)體系[9]。USDA 開放數(shù)據(jù)目錄①https://www.usda.gov/content/usda-open-data-catalog是公開的USDA 數(shù)據(jù)的權(quán)威來源。USDA 有關(guān)機構(gòu)在網(wǎng)站設(shè)專題專欄在線發(fā)布各自業(yè)務(wù)領(lǐng)域數(shù)據(jù)及數(shù)據(jù)產(chǎn)品。其中,農(nóng)業(yè)市場服務(wù)局(Agricultural Marketing Service,以下簡稱AMS)子網(wǎng)站可查詢業(yè)務(wù)清單和目錄(如全國農(nóng)貿(mào)市場目錄、國家食品中心目錄、有機認(rèn)證劑清單、國內(nèi)原產(chǎn)地驗證參與者清單、批復(fù)的種子計劃、批復(fù)的有關(guān)出口計劃、牲畜飼養(yǎng)索賠審核參與者清單、出口加工蛋及蛋制品清單等),信息圖和可視化數(shù)據(jù)(如農(nóng)業(yè)與市場交互數(shù)據(jù)、當(dāng)?shù)睾蛥^(qū)域食品系統(tǒng)、消費者標(biāo)簽和購物提示等),微生物數(shù)據(jù),牛奶營銷訂單統(tǒng)計數(shù)據(jù),國家棉花數(shù)據(jù),農(nóng)藥數(shù)據(jù),植物品種數(shù)據(jù)等;農(nóng)業(yè)研究服務(wù)局(Agricultural Research Service,以下簡稱ARS)子網(wǎng)站發(fā)布有與營養(yǎng)、食品質(zhì)量安全,動物養(yǎng)殖與保護,作物生產(chǎn)與保護,自然資源與可持續(xù)農(nóng)業(yè)系統(tǒng)等有關(guān)的數(shù)據(jù)產(chǎn)品;營養(yǎng)政策與促進中心(Center for Nutrition Policy and Promotion,以下簡稱CNPP)子網(wǎng)站列出了食品營養(yǎng)計劃項目信息,兒童營養(yǎng)數(shù)據(jù)表,食物分配計劃數(shù)據(jù)表,營養(yǎng)援助計劃表,婦女、嬰兒和兒童營養(yǎng)補充特別計劃數(shù)據(jù)表等;經(jīng)濟研究服務(wù)局(Economic Research Service,以下簡稱ERS)子網(wǎng)站發(fā)布有農(nóng)業(yè)資源管理調(diào)查數(shù)據(jù),轉(zhuǎn)基因品種作物數(shù)據(jù),農(nóng)業(yè)與食品統(tǒng)計數(shù)據(jù),農(nóng)業(yè)基準(zhǔn)數(shù)據(jù)庫,農(nóng)業(yè)貿(mào)易匯率數(shù)據(jù),美國農(nóng)業(yè)生產(chǎn)力數(shù)據(jù),農(nóng)產(chǎn)品生產(chǎn)和農(nóng)產(chǎn)品貿(mào)易對美國就業(yè)、經(jīng)濟產(chǎn)出的影響數(shù)據(jù),美國鄉(xiāng)村和小城鎮(zhèn)地圖集,商品成本與收益數(shù)據(jù),食源性疾病成本估算數(shù)據(jù),棉花、羊毛和紡織品數(shù)據(jù),縣級數(shù)據(jù)集,乳制品數(shù)據(jù),農(nóng)戶收入和特征數(shù)據(jù),農(nóng)場收入和財富統(tǒng)計數(shù)據(jù),飼料谷物數(shù)據(jù),化肥使用和價格數(shù)據(jù),糧食獲取研究圖集,糧食供應(yīng)量(人均)數(shù)據(jù),食物消費及營養(yǎng)攝入數(shù)據(jù),糧食價格展望及預(yù)警數(shù)據(jù),美國糧食安全監(jiān)測數(shù)據(jù),全國家庭食品購置調(diào)查數(shù)據(jù),美國對外農(nóng)產(chǎn)品貿(mào)易數(shù)據(jù),果樹、堅果數(shù)據(jù),水果和蔬菜價格數(shù)據(jù),國際農(nóng)業(yè)生產(chǎn)力數(shù)據(jù),國際農(nóng)產(chǎn)品供需及貿(mào)易基準(zhǔn)數(shù)據(jù),國際糧食安全評估數(shù)據(jù),畜牧和肉類國內(nèi)數(shù)據(jù),畜禽肉國際貿(mào)易數(shù)據(jù),主要土地用途數(shù)據(jù),農(nóng)產(chǎn)品從生產(chǎn)到消費價差數(shù)據(jù),牛奶生產(chǎn)成本估算數(shù)據(jù),主要農(nóng)業(yè)投入和產(chǎn)出標(biāo)準(zhǔn)化價格數(shù)據(jù),小麥、水稻、油料、蔬菜、豆類、糖類等生產(chǎn)、供應(yīng)、消費、貿(mào)易及價格數(shù)據(jù),季度居家食物價格數(shù)據(jù),城鄉(xiāng)結(jié)合體代碼,季節(jié)平均價格預(yù)測數(shù)據(jù),州出口數(shù)據(jù),有關(guān)人口、收入、貧困、糧食安全、教育、就業(yè)、農(nóng)場特征等國家級、州級數(shù)據(jù),美國生物能源統(tǒng)計數(shù)據(jù),美國食品進口數(shù)據(jù)等;農(nóng)場服務(wù)局(Farm Service Agency,以下簡稱FSA)提供的FSAfarm+系統(tǒng)可在線查詢公共土地數(shù)據(jù)、相關(guān)農(nóng)場數(shù)據(jù)以及其他生產(chǎn)者信息,可為辦理貸款、保險等業(yè)務(wù)提供參考;食品安全檢驗服務(wù)局(Food Safety and Inspection Service,以下簡稱FIS)子網(wǎng)站及時更新認(rèn)可實驗室名單、實驗室采樣數(shù)據(jù)、季度抽樣數(shù)據(jù)報告等;外國農(nóng)業(yè)服務(wù)局(Foreign Agricultural Service,以下簡稱FAS)子網(wǎng)站提供按商品和目的地國家分類的每周更新的美國出口銷售信息(Exports Sales Reporting,以下簡稱ESR),海外辦事處對影響農(nóng)業(yè)生產(chǎn)和貿(mào)易的問題的見解和分析(Global Agricultural Information Network,以下簡稱GAIN),有關(guān)農(nóng)產(chǎn)品、魚類、森林和紡織品國際貿(mào)易當(dāng)前和歷史數(shù)據(jù)系統(tǒng)(Global Agricultural Trade System,以下簡稱GATS),有關(guān)美國以及主要生產(chǎn)國和消費國的農(nóng)產(chǎn)品生產(chǎn)、供應(yīng)和配給數(shù)據(jù)(Production Supply and Distribution,以下簡稱PSD)。美國最早的農(nóng)業(yè)科技合作項目就是由FAS 承擔(dān)的USDA 資助的植物收集,與原產(chǎn)國的合作方共同執(zhí)行[10]。
統(tǒng)計調(diào)查數(shù)據(jù)是美國涉農(nóng)數(shù)據(jù)的重要組成部分。美國國家農(nóng)業(yè)統(tǒng)計局(National Agricultural Statistical Service,以下簡稱NASS)作為USDA 的專業(yè)統(tǒng)計機構(gòu),負(fù)責(zé)收集、分析和分發(fā)有關(guān)美國最新最全面的涉農(nóng)數(shù)據(jù),每年開展上百項經(jīng)常性調(diào)查項目,每5 年進行一次農(nóng)業(yè)普查,還參與建設(shè)其他國家的農(nóng)業(yè)統(tǒng)計系統(tǒng)。農(nóng)業(yè)普查涉及美國農(nóng)場和牧場及其經(jīng)營者的全部數(shù)據(jù),通過農(nóng)業(yè)普查,生產(chǎn)者可以向全國展示農(nóng)業(yè)的價值和重要性,以影響決定美國農(nóng)業(yè)未來的決策。農(nóng)民和牧場主可以使用農(nóng)業(yè)普查數(shù)據(jù)幫助自己預(yù)估經(jīng)營前景,進而做出更為明智的決定;公司和合作社使用這些數(shù)據(jù)來為農(nóng)業(yè)生產(chǎn)者提供更好服務(wù);社區(qū)計劃者使用這些數(shù)據(jù)為農(nóng)村居民提供所需服務(wù);立法者在制定農(nóng)場政策和計劃時會使用相關(guān)的人口普查數(shù)據(jù)。
USDA 設(shè)有農(nóng)業(yè)統(tǒng)計咨詢委員會,通過召開由NASS 與世界農(nóng)業(yè)展望委員會(World Agricultural Outlook Board,以下簡稱WAOB)、FSA、ERS、AMS、FAS以及美國人口普查局合作組織的數(shù)據(jù)用戶會議,使數(shù)據(jù)使用者了解對農(nóng)業(yè)重要的各種統(tǒng)計信息計劃最近和即將發(fā)生的變化,并征求對這些計劃的意見和建議。NASS 有關(guān)改善農(nóng)業(yè)統(tǒng)計的國際項目在幫助非洲、中南美洲、亞洲以及中歐和東歐的30 多個發(fā)展中國家和新興市場國家發(fā)展和改進其農(nóng)業(yè)統(tǒng)計工作方面發(fā)揮了重要作用。通過幫助其他國家改善其農(nóng)業(yè)統(tǒng)計系統(tǒng),USDA 評估世界糧食和纖維產(chǎn)量的能力也得到了提高。與世界各地的其他農(nóng)業(yè)統(tǒng)計學(xué)家建立牢固的工作關(guān)系,進而有機會收集改進美國農(nóng)業(yè)統(tǒng)計系統(tǒng)的新思路,而接觸其他文化和工作環(huán)境則可以增強自身解決問題的能力。
NASS 制定了數(shù)據(jù)調(diào)查工作指南,明確了數(shù)據(jù)范圍、內(nèi)容、頻率、方法和用途等。涉農(nóng)數(shù)據(jù)統(tǒng)計調(diào)查項目涉及:全國農(nóng)業(yè)分類調(diào)查,目標(biāo)產(chǎn)量,農(nóng)用化學(xué)品,農(nóng)產(chǎn)品價格及價格指數(shù),農(nóng)業(yè)資源管理,作物產(chǎn)量/庫存,蜜蜂和蜂蜜,肉雞孵化場,現(xiàn)金租金,魚生產(chǎn),牛庫存,牛飼料,農(nóng)業(yè)普查,邊遠(yuǎn)地區(qū)農(nóng)業(yè)普查,水產(chǎn)養(yǎng)殖普查,園藝專業(yè)普查,雞和雞蛋,冷庫,保護效果評估,棉花軋花,縣農(nóng)業(yè)生產(chǎn),作物進度/條件,當(dāng)前農(nóng)業(yè)產(chǎn)業(yè)報告,乳制品和價格,農(nóng)場勞動,花藝,水果和堅果,豬庫存,灌溉與水管理(以前是農(nóng)場和牧場灌溉),灌溉機構(gòu),六月區(qū)域(June Area),牲畜屠宰,當(dāng)?shù)厥称窢I銷實踐,牛奶產(chǎn)量和所有牛奶價格,貂,苗圃和圣誕樹生產(chǎn),非農(nóng)谷物庫存,有機農(nóng)業(yè),家禽屠宰,綿羊和山羊庫存,鱒魚生產(chǎn),火雞,蔬菜,土地使用權(quán)、所有權(quán)和過渡。
以調(diào)查項目“六月區(qū)域(June Area)”為例進行簡要說明。六月區(qū)域調(diào)查是國家農(nóng)業(yè)統(tǒng)計局(NASS)年度規(guī)模最大的調(diào)查項目之一,為整個調(diào)查計劃提供重要的實用工具。收集到的數(shù)據(jù)用于提供直接的面積估計和抽樣覆蓋率的度量。六月區(qū)域調(diào)查采用區(qū)域抽樣框架。除阿拉斯加外,所有州的區(qū)域框架均按土地用途劃分?;谕恋孛娣e的主要抽樣單位完全覆蓋了該土地上發(fā)生的所有農(nóng)業(yè)活動,因此也涵蓋了該州的所有經(jīng)營者。從每個土地利用層次中選擇將近11 000個分區(qū)(較小單元大約2.6km2)作為樣本,以進行數(shù)據(jù)收集。采訪在選定區(qū)域范圍內(nèi)運營的所有農(nóng)場經(jīng)營者。在給定的年份中,在抽樣的細(xì)分范圍內(nèi)確定大約85 000 個農(nóng)業(yè)和非農(nóng)業(yè)土地使用區(qū)域。通過識別,將對在范圍邊界內(nèi)經(jīng)營農(nóng)場或有資格成為農(nóng)場的農(nóng)民進行35 000 多次詳細(xì)的個人訪談。每5 年,對3000 多個額外部分進行抽樣,以作為人口普查的補充工作。
(1)項目內(nèi)容。六月區(qū)域調(diào)查的目的是要說明范圍邊界內(nèi)的每英畝土地,所有農(nóng)業(yè)活動和土地用途。收集作物面積,谷物庫存,牲畜庫存,生豬庫存,綿羊庫存,家禽庫存,土地價值,現(xiàn)金租金,農(nóng)場編號和銷售收入數(shù)據(jù)。
(2)用途?,F(xiàn)代農(nóng)業(yè)日益要求提供可靠,及時和詳細(xì)的信息。關(guān)于美國農(nóng)村的經(jīng)濟數(shù)據(jù)和統(tǒng)計數(shù)據(jù)變得越來越重要,六月區(qū)域調(diào)查在這些計劃領(lǐng)域中扮演著至關(guān)重要的角色。調(diào)查覆蓋的農(nóng)作物,牲畜和經(jīng)濟統(tǒng)計數(shù)據(jù)有助于建立穩(wěn)定的經(jīng)濟氛圍,并降低生產(chǎn)、銷售和分銷業(yè)務(wù)的風(fēng)險。
(3)頻率。六月區(qū)域調(diào)查每年進行一次。
(4)方法。六月區(qū)域調(diào)查的數(shù)據(jù)收集完全在6 月的前兩周通過個人訪談完成。此外,被調(diào)查者必須檢查航空照片以識別每個田間邊界并報告種植的農(nóng)作物。種植面積數(shù)據(jù)是當(dāng)前作物年度數(shù)據(jù),而牲畜和種群數(shù)據(jù)是6月1日數(shù)據(jù)。
(5)其他。六月區(qū)域調(diào)查為多個遙感項目和地理信息系統(tǒng)研究與產(chǎn)品開發(fā)提供了參考,同時也為其他研究項目提供支持。
NASS 僅發(fā)布聚合的統(tǒng)計數(shù)據(jù),而不發(fā)布單個或特定農(nóng)場的數(shù)據(jù)??焖俳y(tǒng)計系統(tǒng)①https://www.nass.usda.gov/Quick_Stats/Lite/index.php(Quick Stats System,以下簡稱QSS)和人口普查數(shù)據(jù)查詢工具②https://www.nass.usda.gov/Quick_Stats/CDQT/chapter/1/table/1(Census Data Query Tool,以下簡稱CDQT)是結(jié)構(gòu)化統(tǒng)計調(diào)查數(shù)據(jù)和農(nóng)業(yè)普查數(shù)據(jù)的最佳來源。快速統(tǒng)計系統(tǒng)可以按產(chǎn)品、位置或時間段等自定義查詢,在線獲取常用的統(tǒng)計數(shù)據(jù)信息,并能導(dǎo)出數(shù)據(jù)文件,提供應(yīng)用程序編程接口(Application Programming Interface,以下簡稱API)對快速統(tǒng)計數(shù)據(jù)庫中統(tǒng)計數(shù)據(jù)信息的直接訪問,可以使用PHP、PERL 等任何支持HTTP GET 請求的編程語言調(diào)用數(shù)據(jù)接口。基于Web 的人口普查數(shù)據(jù)在線查詢工具,可用于訪問和下載美國“農(nóng)業(yè)普查”出版物中人口等有關(guān)表格級數(shù)據(jù)。在NASS 子網(wǎng)站上發(fā)布的VegScape 工具可通過基于衛(wèi)星的美國作物狀況植被評估和監(jiān)測Web 服務(wù)提供數(shù)據(jù)服務(wù)和制圖能力,還列出了地理空間數(shù)據(jù)可視化查詢?nèi)肟?,可查看地理空間數(shù)據(jù)交互式地圖,如某些州的土地利用地層、農(nóng)田數(shù)據(jù)層、作物景觀、災(zāi)害分析等。
美國彰顯其涉農(nóng)領(lǐng)域影響力的重要方式之一是發(fā)布基于數(shù)據(jù)的專業(yè)報告。從數(shù)據(jù)到報告,USDA 有一套嚴(yán)密的工作機制[11]。USDA 發(fā)布的官方報告,都是在WAOB 組織下,由專門的委員會進行審核發(fā)布,委員會對報告質(zhì)量負(fù)責(zé)。WAOB 協(xié)調(diào)美國農(nóng)業(yè)部的商品預(yù)測項目(包括商品供需預(yù)測和中長期農(nóng)業(yè)展望等),監(jiān)測世界各地的自然災(zāi)害等情況,收集全球作物和畜牧業(yè)生產(chǎn)數(shù)據(jù)和進出口信息等[12]。如月度《世界農(nóng)產(chǎn)品供需評估報告》(World Agricultural Supply and Demand Estimates Report,以下簡稱WASDER)由WAOB 主持下的多個跨部門商品預(yù)測委員會(Interagency Commodity Estimates Committees,以下簡稱ICECs)召開閉門會議后發(fā)布。中長期展望報告雖然由ERS 為主導(dǎo)進行研究撰寫,但最終報告審核發(fā)布由WAOB 主持下的國際農(nóng)業(yè)預(yù)測委員會(International Agriculture predict Committee,以下簡稱IAPC)負(fù)責(zé),成員來自WAOB、ERS、FAS 等11 個部門。報告的發(fā)布有明確的先后順序:每月的WASDER 是后續(xù)其他報告的起點,月報發(fā)布后,ERS 及其他有關(guān)單位才會陸續(xù)發(fā)布更詳細(xì)的解讀報告以及農(nóng)場收入、食物價格預(yù)測、政策建議等報告;未來十年的展望報告用上年11 月的月度供需報告作為開始點,以確保短期報告和長期報告的內(nèi)在一致性。
USDA 基于豐富的數(shù)據(jù)信息資源和強大的分析研究能力,出版發(fā)布有系列專業(yè)報告,可通過經(jīng)濟、統(tǒng)計和市場信息系統(tǒng)①https://usda.library.cornell.edu(Economics,Statistics and Market Information System,以下簡稱ESMIS)獲取。ESMIS由美國康奈爾大學(xué)曼恩圖書館維護,涵蓋美國和國際農(nóng)業(yè)及相關(guān)主題的2100 多種報告出版物,來自NASS、ERS、AMS、WAOB和FAS等機構(gòu)。
美國涉農(nóng)數(shù)據(jù)共享平臺①https://data.nal.usda.gov(Ag Data Commons)是存儲與糧食、農(nóng)業(yè)有關(guān)的研究數(shù)據(jù)的信息資料庫,致力于實現(xiàn)政府資助的研究數(shù)據(jù)可公開、可訪問且可機讀,使得其既符合數(shù)據(jù)公開要求,又能回應(yīng)公共訪問需求。USDA 國家農(nóng)業(yè)圖書館(National Agricultural Library,以下簡稱NAL)通過數(shù)據(jù)共享平臺提供數(shù)據(jù)服務(wù),使獲得USDA經(jīng)費資助的項目數(shù)據(jù)和相關(guān)數(shù)據(jù)產(chǎn)品可查找、可獲取、可互操作和可重用。
涉農(nóng)數(shù)據(jù)共享平臺存儲的數(shù)據(jù)資源涉及農(nóng)學(xué)、基因組學(xué)、水文學(xué)、土壤、農(nóng)業(yè)生態(tài)系統(tǒng)、可持續(xù)性科學(xué)和經(jīng)濟統(tǒng)計等多學(xué)科,數(shù)據(jù)集標(biāo)識信息包含標(biāo)題、描述、作者和開放作者身份標(biāo)識(Open Researcher and Contributor ID,以下簡稱ORCID)、發(fā)行人、ISO 主題類別、時間、地理邊界、數(shù)據(jù)聯(lián)系人姓名和電子郵件、標(biāo)簽、相關(guān)代碼、許可、資金來源、資源標(biāo)題、資源文件格式、資源鏈接等信息。涉農(nóng)數(shù)據(jù)共享平臺對訪問和使用的限制很小,用戶無需注冊帳戶或登錄即可訪問、查詢、下載數(shù)據(jù)集,并能夠根據(jù)需要選擇使用所提供的數(shù)據(jù)分析軟件應(yīng)用工具(通常鏈接到外部托管的開放源代碼)。涉農(nóng)數(shù)據(jù)共享平臺中所有數(shù)據(jù)均帶有開放許可證,使用標(biāo)準(zhǔn)DKAN 端點提供所有已發(fā)布數(shù)據(jù)集及其元數(shù)據(jù)的JSON 列表,以供符合條件的數(shù)據(jù)被提取列入美國數(shù)據(jù)門戶相應(yīng)數(shù)據(jù)目錄中,提供的API 可查詢所存儲的所有數(shù)據(jù)。CKAN 和DKAN 是國內(nèi)學(xué)者研究的兩種主要開源平臺[13]。DKAN 是受CKAN啟發(fā)的基于Drupal的開放式數(shù)據(jù)平臺工具,提供了一個“data.json”索引來滿足美國政府對開放項目數(shù)據(jù)的要求,使政府、非營利組織和大學(xué)等能夠輕松地向公眾發(fā)布數(shù)據(jù),并由專門提供數(shù)字化服務(wù)的機構(gòu)CivicActions 進行維護。DKAN 的設(shè)計目標(biāo)之一是使擁有廉價托管環(huán)境的任何人都可以輕松創(chuàng)建開放數(shù)據(jù)目錄,能夠非常方便地對接到采用PHP 或Drupal技術(shù)框架的項目。
涉農(nóng)數(shù)據(jù)共享平臺上有專門頁面以圖表形式展示平臺月度運營指標(biāo)有關(guān)情況,比如注冊用戶數(shù)、數(shù)據(jù)集公開量、下載量、搜索量等。截至2020 年8 月31日,涉農(nóng)數(shù)據(jù)共享平臺注冊用戶數(shù)為540,提交數(shù)據(jù)的注冊用戶數(shù)為169(占比31%);公開數(shù)據(jù)集記錄3022 條;2015 年以來最高的月度下載量為2019 年11月份的4335;2020 年最高的月度搜索量為7 月份的1773。
從美國涉農(nóng)數(shù)據(jù)開放共享情況可看出,美國涉農(nóng)數(shù)據(jù)類別多、內(nèi)容豐富、連續(xù)性強、容易獲取、方便分析處理,基于或圍繞數(shù)據(jù)形成了多種數(shù)據(jù)管理信息系統(tǒng)及系列數(shù)據(jù)產(chǎn)品,設(shè)置了專門的數(shù)據(jù)治理機制、機構(gòu),并且在法律層面作出了有關(guān)規(guī)定。特別是,美國對于政府涉密數(shù)據(jù)和政府非涉密但敏感數(shù)據(jù)的分類分級管理極大程度地平衡了數(shù)據(jù)開放與數(shù)據(jù)安全之間的關(guān)系,還采用多種類型的數(shù)據(jù)授權(quán)協(xié)議促進數(shù)據(jù)安全開放與充分利用[14]。USDA 連續(xù)、及時公開發(fā)布的生產(chǎn)、庫存、供需、消費、進出口、價格等涉農(nóng)數(shù)據(jù)信息,增強了市場透明度、提高了市場運行服務(wù)效率。美國在國際涉農(nóng)領(lǐng)域的競爭力和影響力,與其所開展的涉農(nóng)數(shù)據(jù)信息資源建設(shè)工作成效密切相關(guān)。從全球范圍來看,未來的農(nóng)業(yè)技術(shù)競爭將圍繞大數(shù)據(jù)展開,農(nóng)業(yè)的生產(chǎn)過程正被大數(shù)據(jù)深刻地影響[15]。未來10 年,美國將致力于推動更快地收集、分析、存儲、共享和集成高度異構(gòu)的農(nóng)業(yè)生產(chǎn)數(shù)據(jù)集的能力,推動農(nóng)業(yè)領(lǐng)域數(shù)據(jù)驅(qū)動的發(fā)展[16]。全面、準(zhǔn)確、有效的數(shù)據(jù)能夠為科學(xué)決策提供有力支撐,美國開放共享的涉農(nóng)數(shù)據(jù)信息資源在日益積累,關(guān)注、跟蹤美國涉農(nóng)數(shù)據(jù)信息資源建設(shè)進展、深入研究美國涉農(nóng)部門數(shù)據(jù)管理機制和所使用的技術(shù)工具,對開展涉農(nóng)數(shù)據(jù)信息資源建設(shè)及管理工作具有積極意義。