宋 輝
(青島農(nóng)業(yè)大學(xué)草業(yè)學(xué)院, 山東 青島 266109)
生物信息學(xué)(bioinformatics),是由Paulien Hogeweg和Ben Hesper 兩 位 博 士 于1970 年 依 據(jù) 荷 蘭 語(bioinformatica)創(chuàng) 造 的 名 詞[1], 其 英 語 單 詞bioinformatics 于1978 年被首次使用。美國國家衛(wèi)生研究院對生物信息學(xué)的定義為:為擴(kuò)展生物學(xué)、醫(yī)學(xué)、行為學(xué)和衛(wèi)生學(xué)數(shù)據(jù)的用途,而進(jìn)行有關(guān)計算機(jī)方法手段的研究、開發(fā)與應(yīng)用,包括系類數(shù)據(jù)的采集、存貯、整理、歸納、分析與可視化。雖然生物信息學(xué)以計算機(jī)科學(xué)為基礎(chǔ),但該學(xué)科隸屬于生物學(xué)范疇。生物信息學(xué)的快速發(fā)展得益于人類基因組計劃的實施。人類基因組以及模式生物基因組的破解,產(chǎn)生大量核苷酸序列和氨基酸序列,單純利用人工對數(shù)據(jù)進(jìn)行整理、歸納和分析漸顯弊端。在此背景下,計算機(jī)技術(shù)介入生物學(xué)的研究,促進(jìn)了生物學(xué)在組學(xué)研究的發(fā)展。
草學(xué)是生物學(xué)領(lǐng)域一門重要的學(xué)科,傳統(tǒng)的草業(yè)科學(xué)偏重生態(tài)學(xué)研究。但是,隨著分子生物學(xué)的不斷發(fā)展,草業(yè)科學(xué)研究領(lǐng)域早已深入到細(xì)胞和分子水平。草業(yè)科學(xué)工作者借助轉(zhuǎn)錄組等組學(xué)研究,已深入揭示了牧草耐旱、耐冷、高產(chǎn)等多個性狀的形成機(jī)制。最近,我國科學(xué)家相繼完成多個牧草的基因組測序,包括紫花苜蓿(Medicago sativa)、無芒隱子草(Cleistogenes songorica)、草木樨(Melilotus suaveolens)、假儉草(Eremochloa ophiuroides)等[2-5],標(biāo)志著我國草業(yè)科學(xué)研究已邁入基因組學(xué)時代,有利于牧草抗性、優(yōu)質(zhì)、高產(chǎn)相關(guān)基因的挖掘和利用。但是,草業(yè)科學(xué)研究者所具備的生物信息學(xué)知識有限,限制了在基因組層面開展數(shù)據(jù)分析。因此,應(yīng)盡快對草業(yè)科學(xué)專業(yè)的學(xué)生進(jìn)行生物信息學(xué)相關(guān)知識的授課,培養(yǎng)后備人才。青島農(nóng)業(yè)大學(xué)于2006 年設(shè)立了草業(yè)科學(xué)專業(yè),主要從事牧草分子育種、生態(tài)學(xué)和草坪草研究。近期,課題組開展了百喜草(Paspalum notatum)、紅三葉(Trifolium pratense)等牧草的基因組測序工作,但生物信息學(xué)的研究背景薄弱。于是,青島農(nóng)業(yè)大學(xué)于2019 年開設(shè)了生物信息學(xué)概論與實踐課程,以期提高學(xué)生的生物信息學(xué)分析能力?,F(xiàn)就授課過程中遇到的問題和解決方案做一個總結(jié),希望能為后續(xù)授課的教師提供參考。
青島農(nóng)業(yè)大學(xué)草業(yè)學(xué)院于2019 年開設(shè)了生物信息學(xué)概論與實踐課程,為專業(yè)限選課。現(xiàn)將授課過程遇到的問題概括如下。
經(jīng)過中學(xué)時期對生物學(xué)課程的學(xué)習(xí),學(xué)生對植物學(xué)、動物學(xué)和微生物學(xué)等傳統(tǒng)學(xué)科已有深入的認(rèn)知。但是,學(xué)生對生物信息學(xué)相關(guān)課程缺乏認(rèn)知。因此,學(xué)生很難認(rèn)知本課程的研究內(nèi)容、意義和目的。授課期間對學(xué)生進(jìn)行調(diào)研,為何選修該課程。學(xué)生一致回復(fù),為了修學(xué)分。由此證明,學(xué)生對授課內(nèi)容缺乏興趣。因此,要求授課教師一方面講授課程內(nèi)容,重塑學(xué)生的學(xué)識結(jié)構(gòu);另一方面,還需提高學(xué)生對課程的認(rèn)知,使學(xué)生深入認(rèn)識以及理解本課程的地位,強(qiáng)調(diào)該門課程在今后科學(xué)研究過程的重要性。
開課伊始,授課教師對學(xué)生的基礎(chǔ)知識缺乏認(rèn)知。學(xué)生缺失或未掌握分子生物學(xué)相關(guān)課程的知識。在講授美國國家生物技術(shù)信息中心(NCBI,National Center for Biotechnology Information,https://www.ncbi.nlm.nih.gov)數(shù)據(jù)庫時,學(xué)生無法完全理解NCBI 數(shù)據(jù)庫建立的意義。再則,在講授系統(tǒng)發(fā)育關(guān)系時,學(xué)生對共同起源、中性選擇、分子鐘等內(nèi)容部分或者完全不了解。在授課過程當(dāng)中,專業(yè)名詞高頻率出現(xiàn)。雖然教師對其逐一解釋,但是學(xué)生在短時間內(nèi)難以理解。例如,在講解序列比對原理時,學(xué)生對于動態(tài)規(guī)劃、全局比對算法、局部比對算法等難以接受。背景知識的缺乏,使學(xué)生在心理上產(chǎn)生了畏懼心理。劉文獻(xiàn)老師在蘭州大學(xué)講授R語言作圖時,面臨了相同的問題[6]。
生物信息學(xué)教材繁多,但目前沒有針對草業(yè)科學(xué)專業(yè)的教材。一般而言,國內(nèi)生物信息學(xué)教材主要包括數(shù)據(jù)庫檢索、序列比對、系統(tǒng)發(fā)育樹構(gòu)建、蛋白質(zhì)結(jié)構(gòu)與性質(zhì)、常用生物軟件或網(wǎng)站、基因組結(jié)構(gòu)注釋等內(nèi)容。國外教材,雖然也囊括了以上知識結(jié)構(gòu),但是教材還涵蓋了計算機(jī)編程語言等。這些教材的適用對象主要面向生命科學(xué)或者計算機(jī)科學(xué)專業(yè)人員,他們具有良好的分子生物學(xué)、生物化學(xué)、數(shù)學(xué)和計算機(jī)科學(xué)等背景知識,對國內(nèi)外教材均能駕馭。反觀草業(yè)科學(xué)專業(yè)學(xué)生,缺少對以上課程系統(tǒng)地學(xué)習(xí),在教材選用上存在一定困難。
生物信息學(xué)的授課主要采用課堂講授的方式,課程內(nèi)容包括了生物信息學(xué)的發(fā)展、數(shù)據(jù)庫的分類和檢索、序列比對(包括算法)、系統(tǒng)發(fā)育樹的構(gòu)建、蛋白質(zhì)結(jié)構(gòu)與性質(zhì)。該授課方式并不理想。在授課過程,學(xué)生多低頭玩手機(jī);如果對所講內(nèi)容進(jìn)行提問,多數(shù)情況得不到正確回應(yīng)。學(xué)生反饋效果不好,未對生物信息學(xué)有深入的理解,不能熟練使用公共數(shù)據(jù)庫。例如,不能熟練使用NCBI 數(shù)據(jù)庫檢索序列、下載序列等。
生物信息學(xué)雖然有其獨(dú)特的基于生物學(xué)和計算機(jī)科學(xué)背景知識的理論框架,但是,對于生命科學(xué)(包括農(nóng)學(xué)和草業(yè)科學(xué)等專業(yè))背景的學(xué)生而言,能夠熟練使用生物信息學(xué)已有的程序和公共數(shù)據(jù)庫是首要任務(wù)。因為軟件的開發(fā)和公共數(shù)據(jù)庫的建立需要具有深厚計算機(jī)背景知識的人員開發(fā),生命科學(xué)背景的學(xué)生短時間內(nèi)難以達(dá)到相應(yīng)水平。另外,草業(yè)學(xué)院缺少生物信息學(xué)專用計算機(jī)機(jī)房。雖然可以借用計算機(jī)科學(xué)專業(yè)的機(jī)房,但是,生物信息學(xué)相關(guān)軟件的購買、安裝、調(diào)試等工作仍需專業(yè)教師的輔助。專業(yè)教輔人員的缺失也限制了相應(yīng)實踐的開展。
基于在教學(xué)過程中發(fā)現(xiàn)的以上問題,在隨后的教學(xué)過程做了教學(xué)的探索和優(yōu)化?,F(xiàn)總結(jié)如下,希望能為授課教師提供參考。
在授課過程中,增加科學(xué)故事,將其設(shè)計為思政元素穿插到整個教學(xué)過程,激發(fā)學(xué)生的科學(xué)興趣,并使其理解科學(xué)家艱辛的工作[7]。科學(xué)或者科學(xué)家相關(guān)的故事包括博物學(xué)家(生物學(xué)家)與宗教的關(guān)系、關(guān)于進(jìn)化論的三次大辯論、拉馬克和達(dá)爾文比較、人類起源與遷移等。這些內(nèi)容一方面引起了學(xué)生對生物學(xué)發(fā)展的認(rèn)識;另一方面,有些內(nèi)容涉及了生物信息學(xué)的范疇,引起學(xué)生對生物信息學(xué)的認(rèn)識。例如,人類起源與遷移涉及到了系統(tǒng)發(fā)育關(guān)系的鑒定和推導(dǎo),與本門課程具有親密的關(guān)系。
基于學(xué)生基礎(chǔ)知識薄弱,對授課內(nèi)容做了調(diào)整和優(yōu)化,弱化了涉及計算算法的部分、簡化了算法的推導(dǎo)、增加了分子生物學(xué)知識。生物信息學(xué)程序算法的工作主要由計算機(jī)科學(xué)相關(guān)背景的科研人員完成,生命科學(xué)背景的科研人員能夠熟練運(yùn)用相關(guān)程序完成科研工作即可。學(xué)生對算法內(nèi)容的恐懼心理嚴(yán)重?;谶@些考慮,本次課程刪除了該部分內(nèi)容。增加的分子生物學(xué)內(nèi)容主要包括DNA 復(fù)制、轉(zhuǎn)錄、翻譯、轉(zhuǎn)錄翻譯調(diào)控等內(nèi)容,占用2 個學(xué)時。類似的修改在之前的教學(xué)改革中已有探索,蘭州大學(xué)草地農(nóng)業(yè)科技學(xué)院教師們對草類植物種子學(xué)的授課內(nèi)容進(jìn)行了冗余內(nèi)容的簡化和刪減,以及最新研究進(jìn)展的添加,獲得了良好的教學(xué)反饋[8]。
國外教材《生物信息學(xué)與功能基因組學(xué)》[9]雖然內(nèi)容充實,但是32 學(xué)時不能完成授課,且教材價格過高。與此相比,《生物信息學(xué)應(yīng)用教程》[10]通俗易懂,是生物信息學(xué)的入門教材,但是該教材的適用人群仍為生命科學(xué)相關(guān)人員。為了授課的需要,綜合了《生物信息學(xué)與功能基因組學(xué)》和《生物信息學(xué)應(yīng)用教程》的內(nèi)容,加入了實踐內(nèi)容,制定了青島農(nóng)業(yè)大學(xué)草業(yè)科學(xué)專業(yè)學(xué)生的生物信息學(xué)概論與實踐課程的授課內(nèi)容(表1)。增加了Endnote、Adobe Illustrator、 Beacon Designer、 MAFFT、 IQ-tree、Figtree、HMMER 等軟件,以及部分R語言作圖的應(yīng)用。除此之外,講授了轉(zhuǎn)錄組學(xué)、蛋白組學(xué)和代謝組學(xué)在科學(xué)研究的應(yīng)用。為了滿足課時要求,對數(shù)據(jù)庫檢索、序列比對、系統(tǒng)發(fā)育關(guān)系、蛋白質(zhì)結(jié)構(gòu)與性質(zhì)等內(nèi)容進(jìn)行了壓縮,著重偏向軟件操作能力的講授。
表1 生物信息學(xué)概論與實踐的授課計劃Table 1 Teaching plan of Fundamental Concepts and Practices of Bioinformatics
授課方式采用課堂講授和實踐操作的模式。課堂講授主要包括生物信息學(xué)的基礎(chǔ)知識以及生物進(jìn)化的相關(guān)知識。除此之外,授課過程,要求學(xué)生自帶筆記本電腦。一方面,向?qū)W生演示軟件和數(shù)據(jù)庫的使用。例如,Endnote、NCBI 數(shù)據(jù)庫、序列比對、系統(tǒng)發(fā)育樹構(gòu)建等。另一方面,指導(dǎo)學(xué)生統(tǒng)一安裝軟件,做自己電腦軟件的維護(hù)者。鼓勵學(xué)生多動手操作,出現(xiàn)問題,在課堂及時解決,促進(jìn)了學(xué)生的學(xué)習(xí)熱情,減少了課堂玩手機(jī)學(xué)生的數(shù)量。
本課程采用考查方式進(jìn)行考核,注重考察實際操作能力。例如,在NCBI 檢索規(guī)定的基因,使用BLAST 程序比對,獲得至少5 條同源基因,隨后構(gòu)建系統(tǒng)發(fā)育樹(圖1);提交每一步操作截圖和紙質(zhì)文檔??己私Y(jié)果顯示,學(xué)生在適當(dāng)指導(dǎo)下均能完成規(guī)定操作(圖1)。該類型考核著重考查了學(xué)生使用生物信息學(xué)相關(guān)軟件的能力,為將來從事科學(xué)研究打下堅實基礎(chǔ)。另外,軟件的熟練使用也能使學(xué)生進(jìn)一步了解以及理解軟件的運(yùn)行原理(或算法),反饋到理論知識的自我學(xué)習(xí)。
圖1 期末考核Figure 1 Final test
生物信息學(xué)相關(guān)課程是草業(yè)科學(xué)專業(yè)的新課,所參考的授課經(jīng)驗有限,因此,筆者對該課程的授課進(jìn)行了探索。目前,形成了課堂講授和實踐操作相結(jié)合的模式,逐漸提高了學(xué)生的上課熱情。隨著草類植物基因組的不斷破解和多組學(xué)數(shù)據(jù)的完成,已產(chǎn)生大量序列數(shù)據(jù)。草業(yè)科學(xué)專業(yè)需要更多的科研人員能夠使用生物信息學(xué)方法助力科學(xué)問題的解決。希望本文對草業(yè)科學(xué)專業(yè)生物信息學(xué)課程的授課探索,能夠為其他授課教師提供參考,進(jìn)一步完善本課程的授課,培養(yǎng)更多的優(yōu)秀人才。