国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

貴州作物種質(zhì)資源調(diào)查數(shù)據(jù)可視化研究

2017-09-07 06:49陳麗娜司海平方溈陳彥清曹永生
作物學(xué)報(bào) 2017年9期
關(guān)鍵詞:種質(zhì)可視化貴州

陳麗娜司海平方 溈陳彥清曹永生,*

1商丘師范學(xué)院信息技術(shù)學(xué)院, 河南商丘476000;2中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所, 北京100081;3河南農(nóng)業(yè)大學(xué)信息與管理科學(xué)學(xué)院,河南鄭州450002

貴州作物種質(zhì)資源調(diào)查數(shù)據(jù)可視化研究

陳麗娜1,2司海平3方 溈2陳彥清2曹永生2,*

1商丘師范學(xué)院信息技術(shù)學(xué)院, 河南商丘476000;2中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所, 北京100081;3河南農(nóng)業(yè)大學(xué)信息與管理科學(xué)學(xué)院,河南鄭州450002

“貴州農(nóng)業(yè)生物資源調(diào)查”項(xiàng)目產(chǎn)生了大量數(shù)據(jù)資料, 采用有效的方法分析這些資料有利于全面了解當(dāng)?shù)厣镔Y源的利用和保護(hù)情況, 可為決策部門制定資源保護(hù)策略和進(jìn)一步科學(xué)研究提供依據(jù)。分析了不同的可視化方法,針對以往調(diào)查數(shù)據(jù)研究結(jié)果呈現(xiàn)不直觀等特點(diǎn), 本文采用Microsoft Excel、GIS和R多種手段對調(diào)查數(shù)據(jù)進(jìn)行可視化研究, 并分析了可視化的結(jié)果。試驗(yàn)結(jié)果表明, 電子表格可做簡單的統(tǒng)計(jì)分析; 空間數(shù)據(jù)可視化方法可用于數(shù)據(jù)校驗(yàn)、顯示種質(zhì)資源富集程度; 統(tǒng)計(jì)分析可視化方法整合了不同類型的數(shù)據(jù), 可用于挖掘出隱藏在數(shù)據(jù)中的信息。多種數(shù)據(jù)可視化手段可使數(shù)據(jù)及分析結(jié)果以更直觀的形式呈現(xiàn), 有助于全面了解生物資源, 促進(jìn)資源充分利用。分析了作物種質(zhì)資源調(diào)查過程中存在的問題, 對進(jìn)一步規(guī)范種質(zhì)調(diào)查數(shù)據(jù)提出了建議。

貴州; 作物種質(zhì)資源; 可視化

農(nóng)作物種質(zhì)資源是一個(gè)國家重要的戰(zhàn)略資源,是作物遺傳改良和相關(guān)基礎(chǔ)研究的物質(zhì)基礎(chǔ)[1], 農(nóng)作物種質(zhì)資源的擁有和開發(fā)利用程度已成為衡量一個(gè)國家綜合國力和可持續(xù)發(fā)展能力的重要指標(biāo)之一。由中國農(nóng)業(yè)科學(xué)院牽頭的國家科技基礎(chǔ)性工作專項(xiàng)“貴州農(nóng)業(yè)生物資源調(diào)查”項(xiàng)目(編號為2012FY110200)于2012年啟動(dòng), 3年來, 先后共普查了貴州省42個(gè)縣(市), 4次系統(tǒng)性調(diào)查了其中的21個(gè)縣(市), 主要調(diào)查了糧食作物、蔬菜、果樹及藥用植物等作物種質(zhì)資源, 獲得了大量種質(zhì)資源及原始數(shù)據(jù)資料。這些寶貴的數(shù)據(jù)資料是關(guān)于生物資源的基礎(chǔ)數(shù)據(jù), 可以幫助了解貴州省作物種質(zhì)資源的分布及變化情況, 為深入研究與資源保護(hù)提供支撐。由于種質(zhì)資源收集費(fèi)時(shí)費(fèi)力, 通常是分多個(gè)小組多時(shí)段進(jìn)行的, 盡管有“農(nóng)作物種質(zhì)資源收集技術(shù)規(guī)程”作指導(dǎo), 并通過“調(diào)查數(shù)據(jù)錄入系統(tǒng)”錄入數(shù)據(jù),但由于收集者技術(shù)水平等各方面因素的影響, 收集到的數(shù)據(jù)必須通過分類、整理、校對、整合及分析,才能更大效能地發(fā)揮作用。在數(shù)據(jù)量日益增長的背景下, 通過數(shù)據(jù)分析可以發(fā)現(xiàn)隱藏在海量數(shù)據(jù)中的信息, 而信息以可視化的形式呈現(xiàn)顯得尤為重要。

可視化技術(shù)給數(shù)據(jù)分析提供了新手段, 可以使數(shù)據(jù)及分析結(jié)果以更直觀的形式呈現(xiàn), 越來越廣泛地被用在各種數(shù)據(jù)分析領(lǐng)域。可視化最初主要應(yīng)用在科學(xué)計(jì)算領(lǐng)域, 稱為科學(xué)計(jì)算可視化, 它是指利用計(jì)算機(jī)圖形學(xué)和圖像處理等技術(shù), 將數(shù)據(jù)轉(zhuǎn)換成圖形或圖像, 在屏幕上顯示并進(jìn)行交互處理的理論、方法和技術(shù)[2]。后來逐漸發(fā)展成為包括數(shù)據(jù)可視化和信息可視化等一系列分支學(xué)科[3], 已經(jīng)成為研究數(shù)據(jù)表示、數(shù)據(jù)處理和決策分析的綜合技術(shù)??茖W(xué)計(jì)算可視化側(cè)重于處理科學(xué)計(jì)算或工程測量獲得的數(shù)據(jù), 處理該類數(shù)據(jù)的主要方法大致可分為基于矢量場的圖標(biāo)法、流線法和紋理法等[4-6], 基于標(biāo)量場的顏色法、等值線(面)法、體繪制法等[7-8]。隨著可視化應(yīng)用領(lǐng)域的擴(kuò)展, 可視化越來越多地應(yīng)用于處理抽象的非數(shù)值數(shù)據(jù), 旨在借助于圖形化手段,研究大規(guī)模非數(shù)值信息資源的視覺呈現(xiàn), 清晰有效地傳達(dá)與溝通信息, 幫助人們理解和分析數(shù)據(jù)。常用的處理抽象數(shù)據(jù)的可視化方法主要包括幾何可視化方法[9-12]、圖標(biāo)可視化方法[13-14]、層次可視化方法[15-16]、基于GIS的可視化方法[17-18]、多視圖的可視化方法[19]等。可視化方法眾多, 難以選擇, 往往根據(jù)不同領(lǐng)域、不同目的而采用合適的方法。在數(shù)據(jù)可視化方面, 更側(cè)重于使用軟件工具來分析數(shù)據(jù),表達(dá)結(jié)果。目前, 對農(nóng)作物種質(zhì)資源調(diào)查數(shù)據(jù)的分析, 有直接的統(tǒng)計(jì)分析處理[20-21], 但很少有文獻(xiàn)介紹具體的工具或方法, 結(jié)果呈現(xiàn)也并不直觀。有基于 GIS對農(nóng)作物種質(zhì)資源數(shù)據(jù)的空間分析[22-24], 這些研究的重點(diǎn)集中在種質(zhì)資源的地理分布方面, 并沒有深入研究數(shù)據(jù)之間的關(guān)系; 還有對種質(zhì)資源數(shù)據(jù)的關(guān)聯(lián)挖掘分析[25-26], 但這些研究只針對種質(zhì)資源某一方面, 沒有著眼于種質(zhì)資源數(shù)據(jù)整體。當(dāng)前,對數(shù)據(jù)分析尤其是大數(shù)據(jù)分析的標(biāo)準(zhǔn)流程為數(shù)據(jù)收集、數(shù)據(jù)集成、數(shù)據(jù)分析及數(shù)據(jù)可視化。用可視化的圖形圖像方式展示數(shù)據(jù)分析的結(jié)果, 已經(jīng)成為必然的趨勢。因此, 根據(jù)作物種質(zhì)資源調(diào)查數(shù)據(jù)的特點(diǎn),利用Excel進(jìn)行基本的可視化分析, 利用GIS進(jìn)行生態(tài)分布研究, 利用R進(jìn)行較復(fù)雜的統(tǒng)計(jì)分析, 多種可視化手段為作物種質(zhì)資源調(diào)查數(shù)據(jù)分析服務(wù)。期望調(diào)查數(shù)據(jù)能以更直觀、更詳盡的形式呈現(xiàn)給使用者, 并對作物種質(zhì)資源調(diào)查數(shù)據(jù)規(guī)范化提出了建議。

1 材料與方法

1.1 數(shù)據(jù)來源

以“貴州農(nóng)業(yè)生物資源調(diào)查”相關(guān)資料為基礎(chǔ),數(shù)據(jù)包括GPS信息、采集小組信息、調(diào)查表信息、訪談信息、樣本圖片信息及與民族有關(guān)的信息等,通過匯總、整合、預(yù)處理(校正、補(bǔ)充完善信息項(xiàng)不全的數(shù)據(jù)), 規(guī)范了 4600余份調(diào)查資源的相關(guān)資料信息。研究中用到的貴州省生態(tài)地理資料包括貴州省地圖資料(來源于國家基礎(chǔ)地理信息中心), 貴州省溫度、氣候及降雨等資料(來源于DIVA-GIS網(wǎng)站),貴州省 2010年人口普查資料及《貴州統(tǒng)計(jì)年鑒2013》中與人口和民族有關(guān)的數(shù)據(jù)資料。

1.2 研究方法

本文采用多種可視化手段研究作物種質(zhì)資源調(diào)查數(shù)據(jù)。試驗(yàn)所用工具包括 Microsoft Excel、DIVA-GIS和R, 不同工具適用于不同的需求。

Microsoft Excel主要擅長數(shù)據(jù)的計(jì)算, 其簡單易行的圖表功能給非專業(yè)人員快速分析數(shù)據(jù)的能力,長期以來一直在數(shù)據(jù)可視化領(lǐng)域占有重要地位。盡管作為一款可視化入門級的工具, 但Excel也可以可視化比較復(fù)雜的數(shù)據(jù), 比如單元格的熱點(diǎn)圖和散點(diǎn)圖。尤其是2013年微軟發(fā)布了3D可視化插件GeoFlow,用戶在Microsoft Excel 2013版本上安裝插件后, 可以將數(shù)據(jù)與電子地圖交互, 畫出熱力圖和氣泡圖等復(fù)雜圖形。但該軟件在繪制復(fù)雜圖形時(shí)比較麻煩, 且其顏色、線條和風(fēng)格難以自由設(shè)置, 繪制的圖形不夠精美。

空間數(shù)據(jù)可視化需要用到GIS工具。GIS軟件很多, 如 ArcGIS、MapGIS、SuperMap等, 這些軟件功能強(qiáng)大, 但是也存在系統(tǒng)龐大或付費(fèi)等問題。而農(nóng)作物種質(zhì)資源調(diào)查數(shù)據(jù)的空間可視化分析, 主要是想得到有關(guān)作物的生態(tài)地理分布信息。由國際馬鈴薯中心開發(fā)的一款小型軟件DIVA-GIS, 完全免費(fèi), 且可以方便地在網(wǎng)站上獲取世界陸地上任意地點(diǎn)的氣候信息, 其下載地址為 http://www.diva-gis. org/, 它在空間數(shù)據(jù)分析方面具有獨(dú)特優(yōu)勢[27], 利用它可以簡單快捷地實(shí)現(xiàn)生物地圖的繪制, 但不適用作復(fù)雜數(shù)據(jù)分析。

統(tǒng)計(jì)分析可視化可利用R軟件實(shí)現(xiàn)。R作為一個(gè)統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境, 因其跨平臺、開源和免費(fèi)等特點(diǎn), 越來越受到用戶青睞[28]。尤其是 R有數(shù)以千計(jì)的安裝包, 使用這些軟件包可以勝任任何復(fù)雜的數(shù)據(jù)分析, 且其可視化能力非常強(qiáng),可以做出各種炫目的圖表, 繪制精美的圖形。因其是命令行操作, 入門門檻比較高, 需要具有編程能力, 但一旦掌握之后, 數(shù)據(jù)處理將非常方便。將統(tǒng)計(jì)分析與可視化結(jié)合具有廣闊的應(yīng)用前景。

2 結(jié)果與分析

2.1 利用Excel進(jìn)行基本的統(tǒng)計(jì)分析

假定想要了解貴州農(nóng)業(yè)生物資源調(diào)查數(shù)據(jù)中不同地方各類作物種質(zhì)資源的收集情況, 根據(jù)2012年5月至2014年10月進(jìn)行的4次系統(tǒng)調(diào)查, 調(diào)查地點(diǎn)涵蓋貴州省東、西、南、北、中各個(gè)不同地理位置,涉及21個(gè)縣。首先對調(diào)查數(shù)據(jù)按作物分類, 再使用Excel排序、篩選等, 通過計(jì)算得出每個(gè)縣各類資源的具體數(shù)目, 最后使用圖表功能將結(jié)果展示出來,如圖1所示。

圖1 貴州調(diào)查數(shù)據(jù)各縣(市)不同種類種質(zhì)資源收集情況Fig. 1 Chart of germplasm resources investigation sample in different counties of Guizhou

該調(diào)查資源包括糧食作物、蔬菜、果樹和藥用植物四大類。從圖1可見, 21個(gè)縣調(diào)查收集得到的資源中, 糧食作物種類都相對較多, 說明糧食作物在貴州仍然是主導(dǎo), 其多樣性在一定程度上得以保存。務(wù)川、安龍、松桃和道真各縣收集的蔬菜資源數(shù)目超過了糧食作物數(shù)目; 織金、印江、威寧和荔波各縣的果樹資源較為豐富, 種類僅次于糧食作物;務(wù)川、赤水和鎮(zhèn)寧各縣的藥用植物資源最為豐富,收集資源數(shù)超過了糧食作物數(shù)。使用 Excel作基本分析, 簡單易操作, 可以橫向?qū)Ρ? 能直觀地表達(dá)出每個(gè)地方各類資源的不同, 是快速分析數(shù)據(jù)的理想工具。但如果數(shù)據(jù)的分類太多, 圖片會(huì)顯得雜亂,不利于數(shù)據(jù)分析。而且, 如果想再進(jìn)一步分析形成這些不同的原因, 比如當(dāng)?shù)氐拿褡濉⒔?jīng)濟(jì)、地理特性等對作物多樣性的影響, Excel就很難再發(fā)揮作用,必須尋求其他方法來解決。

2.2 利用DIVA-GIS進(jìn)行地理分布研究

農(nóng)作物種質(zhì)資源調(diào)查數(shù)據(jù)帶有經(jīng)緯度坐標(biāo)信息,可使用空間數(shù)據(jù)可視化方法分析。使用 DIVA-GIS工具校驗(yàn)數(shù)據(jù), 除顯示種質(zhì)資源富集程度, 還可顯示資源所在地的海拔、平均溫度和年降雨量等信息。

2.2.1 利用DIVA-GIS校驗(yàn)數(shù)據(jù)和顯示資源分布

將貴州地圖和帶有空間坐標(biāo)信息的貴州生物資源調(diào)查數(shù)據(jù)導(dǎo)入 DIVA-GIS軟件, 可得調(diào)查種質(zhì)資源分布情況, 如圖2所示。

圖2顯示了貴州調(diào)查中全部21個(gè)縣的種質(zhì)資源分布情況, 每個(gè)點(diǎn)代表一個(gè)資源采集點(diǎn), 一個(gè)坐標(biāo)點(diǎn)有可能收集多份資源。分別使用“○”、“□”、“Δ”和“+”符號代表第1、第2、第3和第4次調(diào)查的坐標(biāo)點(diǎn), 第1次調(diào)查地點(diǎn)主要在貴州東南部; 第2次調(diào)查地點(diǎn)主要在貴州南部和貴州北部; 第 3次和第 4次則兼顧了貴州的各個(gè)方位, 說明資源收集工作分步驟有計(jì)劃地進(jìn)行, 兼顧貴州省的各個(gè)位置。另外,在匯集數(shù)據(jù)時(shí)發(fā)現(xiàn), GPS數(shù)據(jù)在錄入時(shí)經(jīng)常會(huì)出錯(cuò),比如漏掉小數(shù)點(diǎn)或小數(shù)點(diǎn)位置不對等, 導(dǎo)致某個(gè)地方的采集坐標(biāo)點(diǎn)出現(xiàn)在另外一個(gè)地方, 使用 DIVAGIS軟件可以非常方便地校驗(yàn)明顯不合理的數(shù)據(jù)。在 DIVA-GIS地理分布圖中, 將光標(biāo)定位在待校驗(yàn)點(diǎn), 即彈出信息框顯示該調(diào)查坐標(biāo)點(diǎn)的信息, 包括資源名稱、地點(diǎn)、采集人及經(jīng)緯度信息等。從圖 2可以看到, 鎮(zhèn)遠(yuǎn)縣境內(nèi)出現(xiàn)了一個(gè)單獨(dú)的坐標(biāo)點(diǎn),但 4次系統(tǒng)調(diào)查均沒有對該縣做大規(guī)模調(diào)查, 因此需要校驗(yàn)。查詢提交的原始數(shù)據(jù), 發(fā)現(xiàn)該資源確實(shí)是鎮(zhèn)遠(yuǎn)縣資源, 是采集于鎮(zhèn)遠(yuǎn)縣農(nóng)業(yè)局經(jīng)作站的蔬菜資源, 有關(guān)該資源的詳細(xì)信息會(huì)在提示框中顯示。由此可見, 使用 GIS工具有利于全面了解資源的分布情況, 也有利于收集資源的準(zhǔn)確和進(jìn)一步規(guī)范化。

圖2 貴州調(diào)查資源地理分布Fig. 2 Geographic distribution of resources investigated in Guizhou

2.2.2 利用 DIVA-GIS進(jìn)行統(tǒng)計(jì)計(jì)算 使用DIVA-GIS軟件還可以進(jìn)行簡單的統(tǒng)計(jì)計(jì)算。在DIVA-GIS中導(dǎo)入貴州調(diào)查數(shù)據(jù)和地圖, 并進(jìn)行統(tǒng)計(jì)計(jì)算, 可得到圖3所示的貴州調(diào)查資源富集情況。

圖3中每個(gè)采集點(diǎn)資源的豐富程度用不同顏色的方塊表示, 代表了該點(diǎn)收集的資源數(shù)量, 也可以認(rèn)為該點(diǎn)資源的豐富程度。從紅、黃到藍(lán)依次表明該點(diǎn)資源的數(shù)量在增加, 也即資源越來越豐富。但通過分析發(fā)現(xiàn), 在資源采集過程中, 各個(gè)小組對于坐標(biāo)定位方法不統(tǒng)一, 有些小組嚴(yán)格以每家每戶為坐標(biāo), 而有些調(diào)查小組則以自然村為單位作為坐標(biāo),導(dǎo)致并不能準(zhǔn)確地反映該坐標(biāo)點(diǎn)資源的豐富程度。因此, 在地理坐標(biāo)定位規(guī)整統(tǒng)一的情況下, 資源的富集統(tǒng)計(jì)分析才真實(shí)可靠。

圖3 貴州調(diào)查資源的地理富集Fig. 3 Geographic enrichment diagram of resources investigated in Guizhou

2.2.3 利用DIVA-GIS顯示地理數(shù)據(jù) DIVA-GIS網(wǎng)站上有世界各地近幾十年的地理、氣候數(shù)據(jù), 可以使用該軟件方便地顯示出貴州省任意地點(diǎn)的海拔、平均氣溫和年降雨量等氣候信息。圖4是貴州省的海拔、平均氣溫和平均降雨量圖。

圖4 貴州海拔、平均氣溫和年降雨量圖Fig. 4 Maps of altitude, average temperature, and annual precipitation in Guizhou

海拔、平均氣溫和年降雨量的配色均是由紅綠藍(lán)依次增加。由圖 4可以看到, 貴州海拔西高東低,威寧縣和赫章縣的大部分地區(qū)海拔在1600 m以上,而東部的黎平縣和松桃縣的海拔則大部分在 800 m以下; 貴州大部分的平均氣溫在11~18℃之間; 貴州西部大部分地區(qū)平均降雨量小于 1000 mm, 東南部大部分地區(qū)平均降雨量超過1300 mm。特定的地理和氣候條件對作物的分布有一定影響, 比如位于黔西北的威寧彝族回族苗族自治縣, 低緯度、高海拔(平均海拔2300 m左右, 海拔最高點(diǎn)為2879.6 m, 最低點(diǎn)1234 m), 平均氣溫在10~12℃之間, 年平均日照時(shí)數(shù)為 1812 h, 降雨量較少, 特殊的地理位置和氣候形成了當(dāng)?shù)靥赜匈Y源, 如金鐵鎖(也叫撐藥, 編號為 201352534)。利用氣候數(shù)據(jù)可以分析資源的生態(tài)地理分布原因, 但一個(gè)地區(qū)的作物種質(zhì)資源分布受多個(gè)因素的影響, 除了海拔、經(jīng)緯度等空間信息外, 還有民族習(xí)俗、人口等各種因素, 應(yīng)綜合分析。

2.3 利用R作多數(shù)據(jù)統(tǒng)計(jì)分析

貴州是多民族省份, 全省共有49個(gè)民族, 少數(shù)民族數(shù)量僅次于云南, 居全國第二, 少數(shù)民族風(fēng)俗習(xí)慣對種質(zhì)資源多樣性的影響是最重要的因素之一。據(jù)貴州省2010年第6次人口普查數(shù)據(jù), 全省常住人口中, 漢族有2219.8485萬人, 占63.89%, 各少數(shù)民族有1254.7983萬人, 占36.11%, 漢族仍占貴州省人口的大多數(shù)。但采集的資源中, 漢族提供的種質(zhì)資源只占全部資源的 16%, 而其他各少數(shù)民族則提供了貴州省種質(zhì)資源的84%。使用R軟件, 綜合貴州調(diào)查數(shù)據(jù)、民族數(shù)據(jù)和人口數(shù)據(jù)等, 分析少數(shù)民族人數(shù)和分布對資源收集數(shù)量的影響。為了處理方便, 對各少數(shù)民族分布進(jìn)行數(shù)字化處理, 使用 R軟件繪制各民族資源收集情況氣泡圖(使用 R軟件graphics包中的 symbols函數(shù)), 得到的各少數(shù)民族資源收集情況如圖5所示。

圖5 貴州省各少數(shù)民族資源收集情況Fig. 5 Bubble chart of resources collection number of some minorities in Guizhou

各少數(shù)民族中, 苗族收集的資源數(shù)目最多, 有1744份, 占全部資源的36%。這是因?yàn)槊缱迦藬?shù)最多, 有 397萬人, 分布也最廣, 遍布調(diào)查涉及的 21個(gè)縣; 其次是布依族, 收集的資源數(shù)為679份, 占全部資源的14%, 布依族有251萬人, 分布也較廣; 分布比較集中的仡佬族、水族和土家族, 人數(shù)雖少, 但較好地保留了本民族特色(圖5)。

3 討論

自20世紀(jì)70年代末第2次全國性資源征集至今, 已過去30多年了, 資源收集流程及標(biāo)準(zhǔn)制定等方面已經(jīng)比較規(guī)范[29], 但在數(shù)據(jù)分析過程中發(fā)現(xiàn),具體每個(gè)資源收集者在遵守標(biāo)準(zhǔn)方面, 仍不十分嚴(yán)格, 有些數(shù)據(jù)項(xiàng)缺失, 對可視化工作帶來了一些難題, 無法作定量分析。因此, 為便于調(diào)查數(shù)據(jù)的可視化分析, 針對資源調(diào)查存在的問題進(jìn)行分析, 并提出以下建議: (1)資源的大類劃分仍不是很清楚, 有交叉。在貴州收集的種質(zhì)資源中, 有些收集者將資源分為“糧食作物”、“蔬菜”、“果樹”和“藥用植物”四大類; 而有些收集者則又加上“蔬菜及一年生經(jīng)濟(jì)作物”、“果樹及多年生經(jīng)濟(jì)作物”; 還有再細(xì)分為“多年生經(jīng)濟(jì)作物”、“糧油”、“蔬菜及多年生經(jīng)濟(jì)作物”和“食用菌”等種類, 導(dǎo)致資源的分類混亂。而且一些油料作物, 包括“花生”、“向日葵”、“芝麻”和“油菜”的歸類也比較亂, 有些將其歸于“蔬菜及一年生經(jīng)濟(jì)作物”, 而有些則歸于“糧食作物”, 無法比較精準(zhǔn)地統(tǒng)計(jì)出各類資源的數(shù)目。雖然每種歸類方法都有自己的合理性, 但還是建議對資源的大類劃分盡量統(tǒng)一, 便于對調(diào)查資源的準(zhǔn)確歸類。(2)資源的特性“特異”、“特有”、“特優(yōu)”、“特用”和“一般”的劃分依據(jù)不很明確。很多分類間也都有交叉, 同時(shí)既是“特優(yōu)”和“特用”, 還有很多資源的這組特性是“不明確”和空白。建議用更詳細(xì)的指標(biāo)來劃分資源的類型,以便快速區(qū)分出優(yōu)質(zhì)資源, 優(yōu)先針對性地進(jìn)一步鑒定分析。(3)資源表型信息不完全。大多資源的表型信息都比較籠統(tǒng), 有些資源, 比如采集號為2012521100的“長辣椒”, 特性只是“品質(zhì)優(yōu)”, 還有很多資源的表型信息根本就沒有。建議資源采集時(shí)盡量比較多地描述表型信息, 分不同指標(biāo)更詳細(xì)的描述, 這樣可為數(shù)據(jù)可視化提供便利, 有利于對資源進(jìn)行挖掘分析。(4)資源采集過程中坐標(biāo)的定位不統(tǒng)一。有些小組嚴(yán)格以每家每戶為坐標(biāo), 而有些調(diào)查小組則以自然村為單位作為坐標(biāo)。因我國村級行政單位都不大,居住也相對比較集中, 建議以村小組為統(tǒng)一的坐標(biāo)定位點(diǎn), 以防止標(biāo)準(zhǔn)的不統(tǒng)一導(dǎo)致使用 GIS工具分析時(shí)產(chǎn)生誤差。(5)大量調(diào)查數(shù)據(jù)沒有被充分利用。貴州調(diào)查數(shù)據(jù)資料, 共有超過 100GB的數(shù)據(jù), 其中大部分是圖片、錄音等, 文字資料只占不到10%, 大量的圖片等資料沒有被很好利用。建議采集時(shí)圖片大小統(tǒng)一、命名統(tǒng)一, 以數(shù)據(jù)庫的方式統(tǒng)一管理, 提高資料的利用效率, 避免浪費(fèi)辛苦采集得到的數(shù)據(jù)資料。

4 結(jié)論

本研究綜合使用多種可視化手段分析貴州種質(zhì)資源調(diào)查數(shù)據(jù), 電子表格適用快速對數(shù)據(jù)作簡單統(tǒng)計(jì)分析; 空間數(shù)據(jù)可視化方法適合生物資源地理分布的研究, 可進(jìn)行數(shù)據(jù)校驗(yàn)、顯示種質(zhì)資源富集程度; 統(tǒng)計(jì)分析方法可挖掘出隱藏在數(shù)據(jù)中的信息,但R軟件高級應(yīng)用需要有編程技能??梢暬侄文苁拐{(diào)查數(shù)據(jù)以更直觀的形式展示, 有利于全面了解貴州生物資源的利用和保護(hù)情況, 為進(jìn)一步的科學(xué)研究提供依據(jù)。種質(zhì)資源工作包括資源的收集、保存、鑒定評價(jià)和創(chuàng)新利用, 其最終目的是創(chuàng)新利用。目前鑒定評價(jià)數(shù)據(jù)不完整, 大量的基因數(shù)據(jù)沒有整合, 未來希望對鑒定評價(jià)數(shù)據(jù)進(jìn)行可視化研究, 進(jìn)一步整合種質(zhì)資源基因數(shù)據(jù), 并結(jié)合生物信息學(xué)的知識進(jìn)行可視化分析。

致謝:本項(xiàng)目主要數(shù)據(jù)來源于國家農(nóng)作物種質(zhì)資源平臺信息中心和國家科技基礎(chǔ)性工作專項(xiàng)(2012FY110200), 特此感謝。

[1] 黎裕, 李英慧, 楊慶文, 張錦鵬, 張金梅, 邱麗娟, 王天宇. 基于基因組學(xué)的作物種質(zhì)資源研究: 現(xiàn)狀與展望. 中國農(nóng)業(yè)科學(xué), 2015, 48: 3333–3353

Li Y, Li Y H, Yang Q W, Zhang J P, Zhang J M, Qiu L J, Wang T Y. Genomics-based crop germplasm research: advances and perspectives. Sci Agric Sin, 2015, 48: 3333–3353 (in Chinese with English abstract)

[2] McCormick B H, DeFanti T A, Brown M D. Visualization in scientific computing. IEEE Comput Graph Appl, 1987, 7(10): 69–69

[3] 楊峰. 從科學(xué)計(jì)算可視化到信息可視化. 情報(bào)雜志, 2007, 26(1): 18–20

Yang F. From visualization in scientific computing to information visualization. J Inform, 2007, 26(1): 18–20 (in Chinese with English abstract)

[4] Huang J, Pan Z, Chen G, Chen W, Bao H J. Image-space texture-based output-coherent surface flow visualization. IEEE Trans Visual Comp Graph, 2013, 19: 1476–1487

[5] Netzel R, Weiskopf D. Texture-based flow visualization. Comput Sci Eng, 2013, 15(6): 96–102

[6] 王成恩, 李海杰. 基于網(wǎng)格的矢量場紋理繪制算法. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013, 34: 1529–1532

Wang C E, Li H J. Vector field texture rending algorithm based on mesh. J Northeastern Univ (Nat Sci), 2013, 34: 1529–1532 (in Chinese with English abstract)

[7] Kronander J, Jonsson D, Low J, Ljung P, Ynnerman A, Unger J. Efficient visibility encoding for dynamic illumination in direct volume rendering. IEEE Trans Visual Comp Graph, 2012, 18: 447–462

[8] Hero R, Ho C C, Ma K L. Volume rendering of curvilinear-grid data using low-dimensional deformation textures. IEEE Trans Visual Comp Graph, 2014, 20: 1330–1343

[9] Viau C, McGuffin M J, Chiricota Y, Jurisica I. The FlowVizMenu and parallel scatterplot matrix: hybrid multidimensional visualizations for network exploration. IEEE Trans Visual Comp Graph, 2010, 16: 1100–1108

[10] 齊曉飛, 王光霞, 馬俊, 王富強(qiáng). 利用散點(diǎn)圖矩陣與回歸分析建立地形描述精度模型. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2013, 38: 1344–1348

Qi X F, Wang G X, Ma J, Wang F Q. An accuracy model of DEM terrain representation based on scatterplot matrices and regression analysis. Geomatics Inf Sci Wuhan Univ, 2013, 38: 1344–1348 (in Chinese with English abstract)

[11] 陳誼, 李瀟瀟, 蔡進(jìn)峰, 陳紅倩, 蔡強(qiáng). 基于類區(qū)間的多維數(shù)據(jù)可視化方法. 系統(tǒng)仿真學(xué)報(bào), 2013, 25: 2418–2423

Chen Y, Li X X, Cai J F, Chen H Q, Cai Q. Visualization of multi-dimensional data based on cluster region. J Syst Simulation, 2013, 25: 2418–2423 (in Chinese with English abstract)

[12] 孫揚(yáng), 唐九陽, 湯大權(quán), 肖衛(wèi)東. 改進(jìn)的多變元數(shù)據(jù)可視化方法. 軟件學(xué)報(bào), 2010, 21: 1462–1472

Sun Y, Tang J Y, Tang D Q, Xiao W D. Improved multivariate data visualization method. J Software, 2010, 21: 1462?1472 (in Chinese with English abstract)

[13] Farshid M, Chan A, Nel D. A sweet face man: using Chernoff faces to portray social media wine brand images. Int J Wine Business Res, 2012, 24(3): 183–195

[14] 宋偉杰, 崔俊芝, 葉正麟. 基于面圖標(biāo)的三維對稱張量場可視化研究. 工程圖學(xué)學(xué)報(bào), 2011, (6): 146–150

Song W J, Cui J Z, Ye Z L. Research on the visualization of 3D symmetric tensor fields based on surface icons. J Eng Graphics, 2011, (6): 146–150 (in Chinese with English abstract)

[15] Schulz H J. Treevis. net: a tree visualization reference. IEEE Comput Graph Appl, 2011, 31(6): 11–15

[16] 許彥如, 王長波, 劉玉華, 張群燕. 多維網(wǎng)絡(luò)論壇數(shù)據(jù)的層次可視化. 計(jì)算機(jī)科學(xué), 2011, 38: 206–209

Xu Y R, Wang C B, Liu Y H, Zhang Q Y. Hierarchical visualization of multi-dimensional forum data. Computer Sci, 2011, 38: 206–209 (in Chinese with English abstract)

[17] Uddin W. Remote sensing laser and imagery data for inventory and condition assessment of road and airport infrastructure and GIS visualization. Int J Roads Airports, 2011, 1: 53–67

[18] Kulawiak M, Prospathopoulos A, Perivoliotis L, Luba M, Kioroglou S, Stepnowski A. Interactive visualization of marine pollution monitoring and forecasting data via a web-based GIS. Comput Geosci, 2010, 36: 1069–1080

[19] 陳誼, 蔡進(jìn)峰, 石耀斌, 陳紅倩. 基于平行坐標(biāo)的多視圖協(xié)同可視分析方法. 系統(tǒng)仿真學(xué)報(bào), 2013, 25: 81–86

Chen Y, Cai J F, Shi Y B, Chen H Q. Coordinated visual analytics method based on multiple views with parallel coordinates. J Syst Simulation, 2013, 25: 81–86 (in Chinese with English abstract)

[20] 高愛農(nóng), 鄭殿升, 李立會(huì), 劉旭. 貴州少數(shù)民族對作物種質(zhì)資源的利用和保護(hù). 植物遺傳資源學(xué)報(bào), 2015, 16: 549–554

Gao A N, Zheng D S, Li L H, Liu X. Utilization and conservation on crop germplasm resource of minority nationality in Guizhou province. J Plant Genet Resour, 2015, 16: 549–554 (in Chinese with English abstract)

[21] 丁漢鳳, 王棟, 張曉冬, 李潤芳, 李湛, 馬玉敏, 張煜, 李娜娜,陳為京, 范仲學(xué), 樊守金, 張立賓, 張輝. 山東省沿海地區(qū)農(nóng)作物種質(zhì)資源調(diào)查與分析. 植物遺傳資源學(xué)報(bào), 2013, 14: 367–372

Ding H F, Wang D, Zhang X D, Li R F, Li Z, Ma Y M, Zhang Y, Li N N, Chen W J, Fan Z X, Fan S J, Zhang L B, Zhang H. Investigation and analysis of crop germplasm resources in coastal areas of Shandong province. J Plant Genet Resour, 2013, 14: 367–372 (in Chinese with English abstract)

[22] 劉旭, 黎裕, 曹永生, 董玉琛, 方溈, 陸平. 中國禾谷類作物種質(zhì)資源地理分布及其富集中心研究. 植物遺傳資源學(xué)報(bào), 2009, 10: 1–8

Liu X, Li Y, Cao Y S, Dong Y C, Fang W, Lu P. Geographic distribution and germplasm-rich region of cereals in China. J Plant Genet Resour, 2009, 10: 1–8 (in Chinese with English abstract)

[23] 曹永生, 張賢珍, 白建軍, 龔高法. 中國主要糧食作物野生種質(zhì)資源地理分布. 作物學(xué)報(bào), 1999, 25: 424–432

Cao Y S, Zhang X Z, Bai J J, Gong G F. Distribution on the wild germplasm resources of main food crops in China. Acta Agron Sin, 1999, 25: 424–432 (in Chinese with English abstract)

[24] 楊忠義, 蘇艷, 曹永生, 鄒菊, 劉曉利, 奎麗梅, 盧義宣. 云南稻種資源多樣性的生態(tài)地理分布研究. 植物遺傳資源學(xué)報(bào), 2008, 9: 475–479

Yang Z Y, Su Y, Cao Y S, Zou J, Liu X L, Kui L M, Lu Y X. Studies on geographical distribution of rice germplasm diversity in Yunnan province. J Plant Genet Resour, 2008, 9: 475–479 (in Chinese with English abstract)

[25] 潘愷, 方溈, 陳麗娜, 曹永生. 基于云計(jì)算的農(nóng)作物種質(zhì)資源數(shù)據(jù)挖掘平臺研究. 植物遺傳資源學(xué)報(bào), 2015, 16: 649–652

Pan K, Fang W, Chen L N, Cao Y S. Research of crop germplasm resources data mining platform based on cloud computing. J Plant Genet Resour, 2015, 16: 649–652 (in Chinese with English abstract)

[26] 唐合文. 基于國家作物種質(zhì)資源數(shù)據(jù)庫的知識發(fā)現(xiàn)研究. 中國農(nóng)業(yè)科學(xué)院博士學(xué)位論文, 北京, 2007

Tang H W. Study on Knowledge Discovery Based on National Crop Germplasm Resources Database. PhD Dissertation of Chinese Academy of Agricultural Sciences, Beijing, China, 2007 (in Chinese with English abstract)

[27] Hijmans R J, Guarino L, Cruz M, Pojas E. Computer tools for spatial analysis of plant genetic resources data: 1. DIVA-GIS. Plant Genet Resour Newsl, 2001, 127: 15–19

[28] Ihaka R, Gentleman R. R: a language for data analysis and graphics. J Comput & Graph Stat, 1996, 5: 299–314

[29] 曹永生, 方溈. 國家農(nóng)作物種質(zhì)資源平臺的建立和應(yīng)用. 生物多樣性, 2010, 18: 454–460

Cao Y S, Fang W. Establishment and application of national crop germplasm resources infrastructure in China. Biodiversity Sci, 2010, 18: 454–460 (in Chinese with English abstract)

Visualization Study for Investigation Data of Crop Germplasm Resources in Guizhou Province

CHEN Li-Na1,2, SI Hai-Ping3, FANG Wei2, CHEN Yan-Qing2, and CAO Yong-Sheng2,*

1School of Information Technology, Shangqiu Normal College, Shangqiu 476000, China;2Institute of Crop Science, Chinese Academy of Agricultural Sciences, Beijing 100081, China;3College of Information and Management Science, Henan Agricultural University, Zhengzhou 450002, China

The large amounts of data derived from the project of “Agro-biological Resources Investigation in Guizhou Province”require analyzing in effective methods and providing comprehensive information on conservation and utilization of biological resources in this province to support local policy makers. Visualized and intuitive demonstration of data analysis is a well-liked but ignored in previous systems regarding resource investigation and data excavation. In this study, we compared several visualization methods, including Microsoft Excel, GIS, and R software, and proposed an effective strategy. We found that the spreadsheet was suitable for simple data analysis, spatial data visualization method was suitable for validating data and showing richness of resources, and statistical analysis visualization method had the advantage of mining hiding information because it could integrate different types of data. Using several visualization methods can make the intuitive results of data analysis, from which we are able to better understand germplasm resources and promote utilization efficiency of germplasm resources. This article also discussed the existing problems and data-standardizing proposals in the investigation of crop germplasm resources.

Guizhou; Crop germplasm resources; Visualization

(

): 2016-11-09; Accepted(接受日期): 2017-04-20; Published online(網(wǎng)絡(luò)出版日期): 2017-04-27.

10.3724/SP.J.1006.2017.01300

本研究由國家農(nóng)作物種質(zhì)資源平臺(2005DKA21001), 河南省科技惠民計(jì)劃項(xiàng)目(152207110002)和鄭州市科技惠民計(jì)劃項(xiàng)目(163PKJHM201)資助。

This study was supported by the National Infrastructure for Crop Germplasm Resources (2005DKA21001), the Science and Technology Plan Project in Henan Province (152207110002), and the Science and Technology Plan Project in Zhengzhou City (163PKJHM201).

*通訊作者(Corresponding author): 曹永生, E-mail: caoyongsheng@caas.cn, Tel: 010-62186693

聯(lián)系方式: E-mail: chenlina@cgris.org

URL: http://kns.cnki.net/kcms/detail/11.1809.S.20170427.0948.020.html

猜你喜歡
種質(zhì)可視化貴州
華南地區(qū)最大農(nóng)作物種質(zhì)資源保護(hù)庫建成
華南地區(qū)最大農(nóng)作物種質(zhì)資源保護(hù)庫建成
基于CiteSpace的足三里穴研究可視化分析
思維可視化
基于CGAL和OpenGL的海底地形三維可視化
四川省桑樹種質(zhì)資源保存與應(yīng)用
貴州,有多美
“融評”:黨媒評論的可視化創(chuàng)新
沉醉貴州
多彩的貴州 多彩的茶
米脂县| 翼城县| 东港市| 鹤壁市| 黑河市| 大名县| 德阳市| 旌德县| 甘孜| 逊克县| 师宗县| 鄂托克前旗| 咸阳市| 昌平区| 常德市| 增城市| 马关县| 兰西县| 牡丹江市| 河南省| 呼玛县| 武强县| 阿巴嘎旗| 东丰县| 涿州市| 天水市| 安塞县| 从江县| 西丰县| 通江县| 伊春市| 陆河县| 托克托县| 莎车县| 中山市| 岗巴县| 东辽县| 临颍县| 河南省| 武城县| 钟祥市|