李建新,席蒙慧,張嘉瑋,席蒙娟,田丁,魯懿哲,陳曉陽(yáng),李衛(wèi)華,張雪海,湯繼華
(1河南農(nóng)業(yè)大學(xué)農(nóng)學(xué)院/省部共建小麥玉米作物學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,鄭州 450002;2南陽(yáng)師范學(xué)院化學(xué)與制藥工程學(xué)院,河南南陽(yáng) 473061;3新鄉(xiāng)醫(yī)學(xué)院管理學(xué)院,河南新鄉(xiāng) 450003;4鄭州工程技術(shù)學(xué)院中德學(xué)院,鄭州 450000)
【研究意義】玉米是世界上主要的糧食、飼料與工業(yè)原料,對(duì)保證全球糧食安全發(fā)揮了重要作用[1]。在玉米增產(chǎn)的諸多因素中,品種改良的貢獻(xiàn)率約為35%[2],因此,新品種的選育與推廣是促進(jìn)中國(guó)玉米產(chǎn)量不斷提高的重要因素。由于玉米是利用雜種優(yōu)勢(shì)的作物,優(yōu)良自交系的選育是組配出強(qiáng)優(yōu)勢(shì)雜交組合的前提,而明確不同自交系的血緣關(guān)系是自交系改良與雜交組合組配的重要基礎(chǔ)[3]。然而,中國(guó)玉米種質(zhì)資源主要來(lái)源于外來(lái)種的引進(jìn)。此外,隨著中國(guó)種子法的頒布實(shí)施及玉米試驗(yàn)與審定制度的改革,玉米育種逐漸由科研單位主導(dǎo)的公益性研究向以企業(yè)為主的商業(yè)化育種模式轉(zhuǎn)變,形成了科研單位、企業(yè)和獨(dú)立育種人并行的局面。商業(yè)化育種在一定程度上限制了種質(zhì)資源的交流利用,導(dǎo)致不同單位間選育的自交系系譜關(guān)系并不十分明確,已成為不同來(lái)源種質(zhì)資源進(jìn)一步改良利用的限制因素[4]。在自交系選系基礎(chǔ)材料組配過(guò)程中,育種家如果想要了解基礎(chǔ)材料的血緣與系譜關(guān)系,往往需要翻閱大量資料。另外,在種質(zhì)資源交流與利用過(guò)程中,許多育種人員對(duì)自交系的來(lái)源與系譜關(guān)系并不一定全面了解,致使在基礎(chǔ)材料組配過(guò)程中存在一定的盲目性,從而限制了育種效率的提高?!厩叭搜芯窟M(jìn)展】隨著計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)思維逐漸滲入到育種行業(yè)[5],一些商業(yè)化育種軟件及考種系統(tǒng)被逐漸開(kāi)發(fā)。而在品種系譜數(shù)據(jù)庫(kù)方面,目前,僅有水稻和花生兩大作物構(gòu)建了詳細(xì)的品種系譜數(shù)據(jù)庫(kù)[6-7],并且被廣泛使用。而玉米上,僅有諸如種業(yè)商務(wù)網(wǎng)[8]、中國(guó)種業(yè)大數(shù)據(jù)平臺(tái)[9]、第一種業(yè)網(wǎng)[10]、《中國(guó)玉米品種及其系譜》[11]等可以查詢(xún)自交系或品種信息的網(wǎng)站或書(shū)本,未見(jiàn)可以查詢(xún)自交系或品種詳細(xì)系譜數(shù)據(jù)庫(kù)的報(bào)道?!颈狙芯壳腥朦c(diǎn)】玉米是中國(guó)第一大糧食作物,且播種區(qū)域跨度大,品種類(lèi)型繁多,加之不同自交系之間相互雜交改良,親緣信息沒(méi)有得到有效梳理,造成很多自交系的系譜難以有效追溯,給自交系的進(jìn)一步改良利用造成一定困難[12]。【擬解決的關(guān)鍵問(wèn)題】本研究以現(xiàn)有玉米自交系及品種審定信息為基礎(chǔ),構(gòu)建了中國(guó)玉米品種及其親本系譜數(shù)據(jù)庫(kù),彌補(bǔ)了現(xiàn)有玉米品種信息數(shù)據(jù)庫(kù)的不足,尤其是添加了系譜追溯、子代查詢(xún)、定制化查詢(xún)、糾錯(cuò)系譜信息及他人上傳自交系及品種系譜信息等功能,供國(guó)內(nèi)玉米育種及科研工作者共同使用、開(kāi)發(fā)和維護(hù)。
數(shù)據(jù)庫(kù)以省級(jí)及中國(guó)農(nóng)業(yè)農(nóng)村部網(wǎng)站的玉米品種審定公示公告、引種公示公告、更名公示公告(僅有2017年及以后審定的品種信息)等信息作為第一數(shù)據(jù)源;以百度文庫(kù)、種業(yè)商務(wù)網(wǎng)、中國(guó)種業(yè)大數(shù)據(jù)平臺(tái)、第一種業(yè)網(wǎng)[8-10]的自交系及品種信息作為第二數(shù)據(jù)源;以書(shū)本[11-16]及相關(guān)文獻(xiàn)[3,17-30]的自交系及品種信息作為第三數(shù)據(jù)源。
數(shù)據(jù)庫(kù)采用基于LNMP(Linux系統(tǒng)+Nginx服務(wù)器軟件+MySQL數(shù)據(jù)庫(kù)管理系統(tǒng)+PHP超文本預(yù)處理軟件)的服務(wù)器環(huán)境配置[31],相比于 Windows+IIS+SQL服務(wù)器環(huán)境配置,LNMP具有成熟、開(kāi)源、穩(wěn)定、免費(fèi)等特點(diǎn),已被各大網(wǎng)站廣泛使用[32-34]。MySQL數(shù)據(jù)庫(kù)根據(jù)《主要農(nóng)作物品種審定辦法》第五章第三十二條內(nèi)容,通過(guò)查閱大量審定品種的詳細(xì)信息并總結(jié)規(guī)律,確定了基本信息、特征信息和其他信息三張數(shù)據(jù)表。其中,基本信息表包括8個(gè)字段:品種名稱(chēng)(name)、審定編號(hào)(certification code)、審定年份(year)、審定地點(diǎn)(certification place)、審定單位(certification organization)、選育單位(breeding organization)、母本(mother)和父本(father);特征信息表包括5個(gè)字段:來(lái)源類(lèi)型(origin)、種植區(qū)域(area)、特征特性(feature)、產(chǎn)量表現(xiàn)(yield)和栽培要點(diǎn)(point);其他信息表包括2個(gè)字段:數(shù)據(jù)來(lái)源(data source)和備注(note)。每個(gè)字段根據(jù)其文字?jǐn)?shù)量配置不同的字段類(lèi)型,確保數(shù)據(jù)庫(kù)信息被充分利用。
在服務(wù)器上運(yùn)行織夢(mèng)內(nèi)容管理系統(tǒng)(DedeCMS),用于數(shù)據(jù)庫(kù)管理、網(wǎng)站制作及對(duì)數(shù)據(jù)庫(kù)進(jìn)行快速操作[35]。系譜樹(shù)的實(shí)現(xiàn)通過(guò) AJAX(Asynchronous Javascript And XML)異步請(qǐng)求方式向服務(wù)器提交查詢(xún)請(qǐng)求,經(jīng)PHP處理后從數(shù)據(jù)庫(kù)提取相關(guān)自交系及品種信息,并將處理后的信息以詳細(xì)信息及系譜樹(shù)返回給網(wǎng)頁(yè)前端展現(xiàn)給用戶(hù)(圖1和圖2)。
圖1 客戶(hù)端向服務(wù)端發(fā)送ajax請(qǐng)求后處理流程圖Fig.1 The processing flowchart of an ajax request sent by the client to the server
圖2 系譜樹(shù)顯示原理Fig.2 The principle of genealogical tree
利用 DedeCMS管理并更新數(shù)據(jù)庫(kù),可實(shí)現(xiàn)玉米品種及自交系系譜信息的增加、修改、刪除等操作。同時(shí)使用phpMyAdmin軟件對(duì)數(shù)據(jù)庫(kù)結(jié)構(gòu)進(jìn)行后期優(yōu)化和新功能的添加,滿(mǎn)足玉米育種及科研工作者的需求。
第一數(shù)據(jù)源采用通配符、正則表達(dá)式等方式匹配并整合到數(shù)據(jù)庫(kù)對(duì)應(yīng)的字段中。第二和第三數(shù)據(jù)源因數(shù)據(jù)格式不統(tǒng)一,無(wú)法采用通配符和正則表達(dá)式等方式匹配數(shù)據(jù),則采用人工錄入整合到數(shù)據(jù)庫(kù)。為方便第二、三數(shù)據(jù)源的錄入,網(wǎng)頁(yè)前端設(shè)置了數(shù)據(jù)提交入口(https://maizedata.cn/submit/genealogy/),采用前臺(tái)提交數(shù)據(jù),后臺(tái)審核發(fā)布的方式將采集到的數(shù)據(jù)開(kāi)放給用戶(hù)瀏覽,訪(fǎng)客也可自行通過(guò)該入口提交信息。目前總共收錄玉米自交系及品種信息10 000余條,其中涉及自交系1 218個(gè),雜交種7 823個(gè),每個(gè)雜交種因?qū)彾ň幪?hào)不同,收錄的品種信息從1至10條不等。
網(wǎng)站采用自適應(yīng)頁(yè)面,自適應(yīng)不同屏幕尺寸的PC、手機(jī)及平板電腦端,無(wú)需安裝客戶(hù)端,即可快捷查詢(xún)。此外,本網(wǎng)站(https://www.maizedata.cn)已被百度、360搜索、必應(yīng)等搜索引擎收錄;亦可通過(guò)小麥玉米作物學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室(http://foodcrop.henau.edu.cn/)頁(yè)面的常用網(wǎng)站鏈接進(jìn)入。
網(wǎng)站首頁(yè)搜索欄中輸入自交系或品種名稱(chēng),即可檢索出相應(yīng)自交系和品種信息;網(wǎng)頁(yè)搜索欄下方為定制化查詢(xún)板塊(圖 3)?!鞍搓P(guān)鍵詞搜索”欄,可根據(jù)品種名稱(chēng)、審定編號(hào)、母本名和父本名等任意一條或多條信息組合,檢索自交系和品種的系譜及信息;此外,在審定編號(hào)欄輸入年份,即可查詢(xún)?cè)撃攴輰彾ǖ乃衅贩N及其系譜信息;輸入父(母)本信息,可查詢(xún)?cè)撟越幌邓凶右淮贩N及其系譜信息;按此方法循環(huán)查詢(xún)?cè)摍z索結(jié)果頁(yè)面的所有品種信息,則可查詢(xún)到一份既有親代又有子代的完整系譜樹(shù)。
高級(jí)搜索板塊“按時(shí)間跨度搜索”欄(圖 3),訪(fǎng)客可輸入起始時(shí)間(左邊輸入框)和結(jié)束時(shí)間(右邊輸入框)或拖動(dòng)輸入框上方的滑塊來(lái)確定查詢(xún)時(shí)間區(qū)間,點(diǎn)擊“提交”按鈕即可查詢(xún)到該時(shí)間區(qū)間內(nèi)的所有自交系、品種及其系譜信息。
在高級(jí)搜索板塊“按地點(diǎn)搜索”欄中(圖 3),用戶(hù)只需點(diǎn)擊相應(yīng)省份或直轄市即可查詢(xún)?cè)摰貐^(qū)不同時(shí)期的玉米自交系及歷年審定品種信息。
圖3 高級(jí)搜索頁(yè)面Fig.3 Advanced Search page
詳情頁(yè)可同時(shí)查看品種信息和系譜樹(shù),為節(jié)省服務(wù)器帶寬,系譜樹(shù)默認(rèn)不展開(kāi)(圖4,以必祥101為例)。訪(fǎng)客點(diǎn)擊“”展開(kāi)下一級(jí)系譜樹(shù)(父母本縮進(jìn)約2個(gè)字符);已展開(kāi)系譜的品種左邊顯示為“”,再次點(diǎn)擊即可收起。若品種左邊顯示為“□”,表示該品種已無(wú)父母本。點(diǎn)擊自交系或品種名稱(chēng)即可查看其詳細(xì)信息。
子代查詢(xún)模塊位于詳情頁(yè)中系譜樹(shù)模塊下方,該模塊列出了該自交系或品種的所有子代及子代的子代(圖5,以黃早四為例,所有雜交種前面均注明雜交種,未注明的為自交系)。訪(fǎng)客點(diǎn)擊“”展開(kāi)下一級(jí)系譜樹(shù)(每一代縮進(jìn)約2個(gè)字符),已展開(kāi)系譜的自交系或品種左邊顯示為“”,再次點(diǎn)擊即可收起。若用戶(hù)點(diǎn)完“”,子一代左邊顯示為“”,但下一級(jí)卻不顯示,則表示數(shù)據(jù)庫(kù)中沒(méi)有該自交系或品種的子代。點(diǎn)擊自交系或品種名稱(chēng)即可查看其詳細(xì)信息。
圖4 必祥101系譜Fig.4 Genealogical of Bixiang 101
圖5 黃早四的子代及子代的子代Fig.5 Offsprings of Huang Zaosi and their offsprings
玉米品種及其親本系譜數(shù)據(jù)庫(kù)的創(chuàng)建,在一定程度上集合了更多的玉米自交系信息及品種審定信息,解決了系譜追溯困難等問(wèn)題,節(jié)約了玉米育種及科研工作者查詢(xún)玉米自交系和品種信息及系譜追溯的時(shí)間。截止到目前,本數(shù)據(jù)庫(kù)收錄的玉米自交系及品種信息最為齊全(10 000余條)。此外,本數(shù)據(jù)庫(kù)的查詢(xún)功能更豐富,擁有強(qiáng)大的系譜樹(shù)組件、子代查詢(xún)及定制化查詢(xún)等功能。然而由于從網(wǎng)上及文獻(xiàn)搜集的系譜信息有限,導(dǎo)致有些品種僅能查詢(xún)到品種本身信息,無(wú)父母本信息,加之近幾年玉米審定品種數(shù)量大幅度增加,部分品種信息可能未被及時(shí)收錄。未來(lái)隨著數(shù)據(jù)量的增多,仍有需要優(yōu)化和完善的地方,比如品種權(quán)、推廣面積等查詢(xún)功能;或根據(jù)品種特征的定制化查詢(xún)功能,如查詢(xún)畝產(chǎn)大于特定重量或生育期低于特定天數(shù)的所有品種;或根據(jù)用戶(hù)需求開(kāi)發(fā)出滿(mǎn)意且實(shí)用的功能等。鑒于此,呼吁玉米育種及科研工作者一起向數(shù)據(jù)庫(kù)添加更多系譜數(shù)據(jù),及時(shí)補(bǔ)充更新相關(guān)自交系及品種信息,完善數(shù)據(jù)庫(kù)/網(wǎng)站,相信在用戶(hù)+互聯(lián)網(wǎng)+大數(shù)據(jù)的支持下,數(shù)據(jù)庫(kù)會(huì)建設(shè)的更加完善。需要注意的是編寫(xiě)本網(wǎng)站采用的 css代碼版本較高(frontawsome5.0,jquery1.9.8),使用IE瀏覽器瀏覽本網(wǎng)站時(shí)會(huì)出現(xiàn)模塊無(wú)法加載的情況,故不兼容internet explorer全系瀏覽器,遇此情況,建議根據(jù)頁(yè)面提示更換瀏覽器。
為明確不同自交系的血緣與系譜關(guān)系,育種工作者需要查閱審定品種信息、追溯親本來(lái)源,特別是對(duì)親本信息不詳?shù)钠贩N需要查閱大量文獻(xiàn)資料,而建立基于互聯(lián)網(wǎng)的玉米系譜數(shù)據(jù)庫(kù)可減少系譜查詢(xún)時(shí)間,提高工作效率,為育種家在基礎(chǔ)材料組配過(guò)程中選擇合適的種質(zhì)資源提供重要參考依據(jù)。本數(shù)據(jù)庫(kù)在搜集、整合多個(gè)網(wǎng)站及文獻(xiàn)中自交系和品種信息的基礎(chǔ)上,通過(guò)完善并優(yōu)化數(shù)據(jù)結(jié)構(gòu),可以為用戶(hù)提供更完善的信息支撐。
玉米自交系及品種的系譜來(lái)源及系譜樹(shù)的繪制一般通過(guò)查閱系譜資料手工繪制,費(fèi)時(shí)費(fèi)力,不易保存且出錯(cuò)率高?,F(xiàn)有玉米品種信息數(shù)據(jù)庫(kù)均無(wú)系譜樹(shù)功能,雖然某些紙質(zhì)版文件提供系譜樹(shù),但查詢(xún)不方便;單機(jī)版系譜查詢(xún)軟件存在數(shù)據(jù)更新不及時(shí)問(wèn)題;本數(shù)據(jù)庫(kù)添加了可快速對(duì)某一品種或親本進(jìn)行系譜追溯的系譜樹(shù)功能,且系譜樹(shù)和子代樹(shù)均為系統(tǒng)自動(dòng)生成,降低了錯(cuò)誤率,保證了系譜的完整性及準(zhǔn)確性。
傳統(tǒng)紙質(zhì)版系譜如《中國(guó)玉米品種及其系譜》[14],僅能通過(guò)目錄查詢(xún)相關(guān)自交系或品種的系譜,系譜樹(shù)因紙質(zhì)媒介而固定,可用性及靈活性不高,數(shù)據(jù)更新難度大,存在一定的滯后性?,F(xiàn)今,新審定玉米品種數(shù)量飛速增長(zhǎng),紙質(zhì)版系譜已無(wú)法滿(mǎn)足育種需求,利用互聯(lián)網(wǎng)優(yōu)勢(shì)構(gòu)建的系譜數(shù)據(jù)庫(kù),更新速度快,可以顯著提高查詢(xún)效率。
本數(shù)據(jù)庫(kù)添加定制查詢(xún)功能,用戶(hù)可通過(guò)關(guān)鍵詞、時(shí)間區(qū)間、審定地點(diǎn)、審定編號(hào)、模糊和自動(dòng)分詞查詢(xún)等方式進(jìn)行查詢(xún),方便用戶(hù)快速查詢(xún)所需品種信息。此外,還提供了用戶(hù)上傳、糾錯(cuò)系譜信息等功能,供國(guó)內(nèi)玉米育種及科研工作者共同使用、開(kāi)發(fā)和維護(hù)。
基于LNMP服務(wù)器環(huán)境配置創(chuàng)建了中國(guó)玉米品種及其親本系譜數(shù)據(jù)庫(kù)(https://www.maizedata.cn);目前總共收錄玉米自交系及品種信息10 000余條,其中涉及自交系1 218個(gè),雜交種7 823個(gè);實(shí)現(xiàn)了品種信息檢索、系譜追溯、子代查詢(xún)、定制化查詢(xún)、用戶(hù)上傳及糾錯(cuò)系譜信息等核心功能。