吉植,王傳超②?
①廈門大學 社會與人類學院,福建 廈門 361005;②廈門大學 生命科學學院細胞應激生物學國家重點實驗室,福建 廈門 361102
北京時間2022年10月3日,瑞典生物學家、進化遺傳學家斯萬特·帕博(Svante P??bo)成為最新的諾貝爾生理學或醫(yī)學獎的獲獎者。斯萬特·帕博帶領團隊測序了已滅絕的古人類——尼安德特人(尼人)和丹尼索瓦人的基因組,發(fā)現這些已滅絕的古人類與現代人的祖先存在基因交流,非洲以外的現代人群都帶有古人類的基因?,F代人基因組中的古人類基因遺存有些是具有生理學意義的,例如,來自古人類的基因可能會影響現代人免疫系統(tǒng)面對感染時的反應。諾貝爾獎委員會表示通過揭示現代人與已滅絕的古人類在基因方面的差異,帕博的發(fā)現提供了探索人類獨特性的基礎。
古DNA研究是以分子生物學技術為基礎發(fā)展起來的一個跨學科領域,通過結合考古學、歷史學、語言學和古生物學等知識,分析古代生物的譜系、分子演化理論、人類的起源和遷徙、動植物的家養(yǎng)和馴化過程等。人類的DNA由30多億對堿基組成,每一代人身上都會有一些堿基發(fā)生改變,叫基因突變,而有些突變會對一些性狀產生影響。根據某些突變在人群中的分布和突變速率,我們可以了解人群擴張、縮減、分裂和融合等事件的歷史情況,包括這些事件發(fā)生的大致時間[1]。研究古人類DNA可以幫助我們厘清人群之間的親緣關系,以及具體基因的演化過程。這有助于我們了解現代人類一些表型特征的出現時間,進而推測當時的演化環(huán)境和自然選擇條件,是探索人類演化背后動力和機制的重要一環(huán)。
研究幾千甚至數萬年前古人類的基因是一項充滿挑戰(zhàn)的任務。DNA極易隨時間發(fā)生降解和化學修飾等現象,前者會使DNA片段變短,后者甚至會改變基因的堿基序列。另外,來自細菌和現代人類DNA的污染也是一個令人頭疼的問題,有時污染的比例可能高達99.9%。帕博的部分研究與如何解決這些技術方面的問題有關[2-6]。他和團隊制定了一系列的實驗規(guī)范與流程,包括“超凈室”的使用等。本文將從帕博對古DNA技術方法的探索、他的團隊關于尼人和丹尼索瓦人的重要研究及發(fā)現、古基因組學的發(fā)展歷程和最新進展等方面進行綜述。
斯萬特·帕博1955年出生于瑞典的斯德哥爾摩,1997年成為新成立的馬克斯·普朗克進化人類學研究所的5個負責人之一,并在那里一直工作至今。1985年,還是博士生的帕博在Nature上發(fā)表了一篇用分子克隆法研究埃及木乃伊DNA的文章。當時,30歲的帕博從一具2 400年前的木乃伊表層組織上提取到了一些古DNA片段。這些克隆出的古DNA片段長短不一,大部分只有不到500 bp(base pairs),但小部分超過了5 000 bp,克隆后甚至出現長達3.4 kb的片段[7]。根據我們今天對古DNA片段的了解,過長的片段很可能是由污染造成的[8-9],但這并不影響帕博的這次嘗試對于古DNA研究的重要性。在這項研究中,帕博將分子克隆技術完整地應用到古DNA上,成為將DNA技術應用于考古人類學的先行者。這篇文章的最后,帕博還提出古DNA研究可以幫助人們回答人群或個體親緣關系問題這一遠見。
當時帕博使用的分子克隆法是20世紀70年代發(fā)展起來的一項技術,它可以幫助研究者分離和研究特定的基因片段[10]。不過這種DNA片段擴增的方法也有一些不足之處。分子克隆需要在活的組織內進行,且克隆結束后要對結果進行篩查才能獲得最終需要的重組DNA。另外,這項技術需要特定的限制性內切酶將DNA切割成研究所需的片段。同時,完成一次分子克隆實驗往往需要2~4天。
20世紀80年代發(fā)展出另一種擴增DNA片段的技術——聚合酶鏈式反應 (polymerase chain reaction, PCR)。至今這項技術仍在遺傳學研究中起著至關重要的作用。樣本保存情況不理想或樣本量過少,都有可能導致沒有足夠量的DNA進行后續(xù)研究。PCR可以快速、大量地復制DNA片段,只需幾納克DNA就能實現擴增,在一定程度上降低了古DNA研究的門檻。PCR用控制溫度來控制DNA的變性(雙鏈變單鏈)和復性(單鏈變雙鏈),并通過加入引物、聚合酶和脫氧核糖核酸實現DNA片段的不斷復制[11]。這項技術的發(fā)明者Kary Mullis因此獲得1993年諾貝爾化學獎。
帕博緊跟科學技術發(fā)展前沿,在1988年就利用PCR技術從7 000年前的腦組織中測序到古人類的線粒體DNA(mtDNA)片段[12]。帕博發(fā)現與現代人類的DNA不同,可以成功擴增的古DNA片段都不超過200 bp。在這篇文章中,帕博特別提到可以通過片段的長短來區(qū)分古人類和現代人類DNA,以及使用個體不同位置的組織進行實驗等方法來控制古DNA實驗中可能來自其他個體的污染。此后幾年里,帕博和其他研究者將古DNA的研究方法應用到哺乳動物上,并在這些研究中不斷完善以PCR為核心的古DNA研究技術[13-15]。
隨著古DNA研究技術的不斷成熟,越來越多研究者開始利用古人類和現代人類的DNA來研究人類起源和擴散問題。研究發(fā)現非洲人群擁有很多其他地區(qū)沒有的mtDNA單倍群[16]。非洲人群mtDNA序列的多樣性是非洲以外人群的兩倍之多,這表明非洲人群可能有著更長的遺傳歷史[17-18]。根據DNA多態(tài)性和全線粒體DNA序列建立的譜系樹也支持現代人類的晚近非洲起源這一觀點[17,19]。Cann、Stoneking和Wilson在1987年發(fā)表在Nature上的文章表明現代人類的mtDNA可以追溯到約20萬年前的一位非洲女性身上[20],這一發(fā)現后來被稱為“夏娃理論”。說到現代人類的祖先就不得不提尼人,尼人是一群在30萬~3萬年前生活在歐洲和西亞的古人類。尼人與現代人的祖先生活過的時空是有重合的,相較于猿類,尼人與現代人是更晚才分化開的。研究尼人有助于我們了解現代人類在與猿類分離之后,最近的幾十萬年中演化出了哪些新的特征。對人類起源問題和考古發(fā)現的關注讓帕博將注意力放到尼人身上。
帕博和他的團隊在對比了現代人類和尼人的mtDNA序列后發(fā)現,現代人類之間在mtDNA高變I區(qū)(hypervariable region I)的堿基突變平均差異為(8±3)個,而現代人和尼人在這一區(qū)間的平均堿基突變差異達到(27±2)個[21]。雖然這個數字要遠小于人類和黑猩猩之間的平均差異,但是也說明了尼人與現代人類的遺傳距離較遠。同時,遺傳譜系樹和基于形態(tài)學的觀察也支持這一結論[22]。根據計算,現代人類最近的共同祖先出現在12萬~15萬年前[20],而現代人和尼人的共祖時間要早于50萬年前[21,23]。這表明尼人不是現代人的一支,他們與現代人分離的時間要遠早于現代人類內部分化的時間。后續(xù)的研究發(fā)現尼人之間的mtDNA序列十分相似,但是在約25 000年前的現代人mtDNA序列中找不到這些尼人的序列[24]。這進一步說明尼人沒有與現代人進行大規(guī)模的融合,但不能完全排除少量融合的可能性。如果想完全排除融合的可能性就需要非常大量的古人類樣本[25]。
對于mtDNA的研究開始只局限于控制區(qū)(D-loop),這一區(qū)域長度占mtDNA長度的不到7%[17],但是高通量測序的出現改變了這一局面。比起傳統(tǒng)的Sanger末端終止測序法,基于大規(guī)模平行測序的第二代高通量測序法將DNA分子打斷成更短的片段,可以通過邊合成邊測序的方法一次性對數百萬個片段進行測序。高通量測序法也大大降低了實驗成本,使得對尼人mtDNA全序列和核基因組測序成為可能。根據尼人mtDNA全序列得出的結論表明他們與現代人的分化時間約為66萬年,與此前研究得出的結論基本一致[26]。在尼人mtDNA的13個編碼蛋白質的基因中,研究者發(fā)現了更高的非同義突變比例,這可能與尼人的有效人口規(guī)模更小有關[26]。非同義突變多數是有害的。由于在規(guī)模較小的群體里遺傳時的抽樣誤差更大,也就是說自然選擇的效力更弱而遺傳漂變的效力更強,因此輕微有害突變更有可能因隨機事件被固定下來[27-29]。對5個尼人mtDNA全序列的進一步研究發(fā)現,他們的mtDNA多樣性只有現代人類的三分之一,但非同義突變與同義突變比(0.168)約是現代人類(0.082)的兩倍(圖1)[30]。這也表明尼人可能長期有著較小的有效人口。帕博的實驗室先是用高通量測序法測出尼人核基因組中100萬對堿基的序列[23],為后續(xù)全基因組序列的獲取打下良好的基礎。未來對于來自更多時間與空間的尼人樣本的研究可以幫助我們更好地認識這一問題。
圖1 現代人類、尼人和猿類的mtDNA進化樹。箭頭所指的位置為現代非洲人和非洲以外人群最近的共祖時間(MRCA)(根據[17]和[30]繪制)
一節(jié)來自西伯利亞阿爾泰山丹尼索瓦洞穴的指骨為研究者們提供了認識尼人以外古人類的契機。2010年帕博的團隊從這節(jié)指骨上用DNA捕獲技術提取到完整的mtDNA序列[31]。他們發(fā)現這些mtDNA序列不屬于已知的任何古人類。這些古人類與現代人的mtDNA有385個核苷酸的差異,而現代人與尼人的mtDNA核苷酸差異只有202個[31]。這說明這些古人類與現代人的母系遺傳距離要遠于尼人與現代人。在后續(xù)的研究中,他們將此次新發(fā)現的古人類命名為丹尼索瓦人。根據尼人、現代人和丹尼索瓦人的mtDNA所構建的進化樹顯示,丹尼索瓦人與尼人和現代人有共同祖先[31]。丹尼索瓦人與現代人和尼人的共同祖先分化的時間在距今約100萬年前,大約是現代人與尼人分化時間的兩倍。研究者們也提到,mtDNA更易受到遺傳漂變和正向選擇的影響,因此全基因組的研究對于進一步明確丹尼索瓦人、尼人和現代人之間的關系及分化時間是十分有必要的[31-32]。考古學的證據還表明丹尼索瓦人與尼人和現代人曾經在3萬~5萬年前共同生活在阿爾泰山地區(qū),這也使該地區(qū)成為研究現代人與古人類人群交流的重要地區(qū)[31]。
mtDNA的研究還被國內外學者應用在許多其他人群上。帕博等學者通過mtDNA探索了歐洲狩獵采集人群(H-Gs)和農業(yè)人群在新石器時期的變遷歷史。通過對來自現代歐洲人的1 151個mtDNA序列的研究,他們發(fā)現與早期農業(yè)人群相關的H單倍群和與H-Gs相關的U單倍群[33]。分析結果顯示,歐洲的H-Gs在15 000~10 000年前的這段時間呈增長趨勢,而在10 000~5 000年前的時間段出現人口規(guī)模的縮減[33]。這一變化可能與歐洲農業(yè)的發(fā)展以及農業(yè)人口從9 000年前開始的擴張有關。但是從約4 000年前開始,攜帶H型和U型單倍群的人群又同時開始增長[33]。這可能與農業(yè)人群大規(guī)模地在歐洲擴張之后同化了各地的H-Gs有關。研究者們發(fā)現,現代歐洲人的mtDNA有約20%是來自于H-Gs的(圖2)[33]。這也表明農業(yè)人群不是完全地替換了H-Gs,而是在一定程度上與他們發(fā)生了融合。
圖2 現代歐洲人群及其祖先人群中各類mtDNA單倍群的頻率占比(根據[33]繪制)
隨著DNA測序技術和古DNA提取方法的不斷進步,遺傳學家研究的樣本從mtDNA逐漸擴大到整個基因組。帕博的團隊在2010年成功測序出尼人的全基因組[34],論文發(fā)表在Science上,該文章是帕博最重要的學術成果之一。根據尼人和不同地區(qū)現代人全基因組的對比,研究者們發(fā)現尼人和非洲人群的遺傳距離要稍遠于他們和非洲以外人群的遺傳距離[33]。但是,尼人與歐洲人群和東亞人群的遺傳距離是一樣的,說明尼人與現代人類的接觸可能發(fā)生在歐洲與亞洲人分化之前。通過對比不同地區(qū)現代人群、尼人和黑猩猩之間的遺傳距離,研究者們認為大部分的基因交流都是從尼人到現代人的[33]。同時,該研究還算出非洲以外人群中來自尼人的基因占1%~4%[33],且這些基因交流發(fā)生在3.7萬~8.6萬年前[35]。在后續(xù)的研究中,帕博的團隊發(fā)現,一群來自阿爾泰山的古老現代人類可能對同一地區(qū)的尼人有基因的滲入[36]。他們發(fā)現比起其他地方的尼人,阿爾泰地區(qū)尼人的第21號染色體與非洲人群的這一染色體共享更多等位基因?;谶@些位點,研究者們認為在約11萬年前,早期現代人類的一個分支對阿爾泰地區(qū)尼人有0.1%~2.1%的基因滲入[33]。對尼人全基因組的研究,證明現代人類和尼人是存在雙向的基因交流的。這也說明將古DNA的研究范圍擴大到全基因組是必要的,將使我們得到更多更全面的信息。
除了對尼人的研究以外,帕博的團隊還對丹尼索瓦人的核基因組進行了測序。從全基因組的數據來看,丹尼索瓦人與尼人有更近的共同祖先,而且他們與現代人類的遺傳距離和現代人類與尼人的遺傳距離是差不多的[32]。這與基于mtDNA所得到的結論不完全一致[31,37]。這種不一致也許可以用不完全譜系分選來解釋,即由于基因組中不同片段的進化速率和保守性不同,某些基因的多態(tài)性可能會被隨機固定下來,因此通過不同片段構建的進化樹之間可能會有差別。進一步研究發(fā)現,丹尼索瓦人在更新世晚期曾廣泛分布于亞洲,在今天太平洋的美拉尼西亞人中有4%~6%的丹尼索瓦人基因[32]。在澳大利亞土著、新幾內亞人、菲律賓南部的尼格利陀人群、波利尼西亞和東印度尼西亞的人群中都有發(fā)現來自于丹尼索瓦人的遺傳混合[38]。在亞洲人群中可能同時存在屬于尼人和丹尼索瓦人的基因片段,但是在歐洲幾乎很難找到丹尼索瓦人的痕跡(圖3)[39]。從距今34 000年前來自于蒙古東北部肯特省薩勒黑特(Salkhit)峽谷的古人類頭蓋骨提取到的基因組中,研究者們發(fā)現了約1.7%的來自尼人的基因,而來自丹尼索瓦人的基因只占0.127 5% (圖4)[40]。研究還發(fā)現,在東亞地區(qū)古人類DNA中發(fā)現的丹尼索瓦人基因組片段與現代亞洲人群中的丹尼索瓦人的片段是高度重合的。然而在新幾內亞人或澳大利亞土著中則找不到這些東亞古人類特有的丹尼索瓦人基因片段[40]。這說明丹尼索瓦人與現代人類至少有過兩次獨立的人群混合,分別發(fā)生在亞洲大陸和太平洋地區(qū)。
圖3 不同地區(qū)人群平均每個個體中檢測到的阿爾泰尼人和阿爾泰丹尼索瓦人基因片段的長度(單位:Mb)(根據[39]繪制)
圖4 基于全基因組的現代人、尼人和丹尼索瓦人的進化樹。紅色箭頭代表尼人向丹尼索瓦人的基因流;黃色箭頭代表尼人向現代人的基因流;綠色箭頭代表丹尼索瓦人向太平洋人群的基因流;藍色箭頭代表丹尼索瓦人向東亞人群的基因流(根據[32]和[36]繪制)
德國馬克斯·普朗克所的Johannes Krause和哈佛醫(yī)學院的David Reich團隊通過古代人群全基因組的研究進一步明確了歐洲H-Gs和早期農業(yè)人群遷徙與融合的過程,并探索了現代歐洲人的祖先成分來源。他們找到了現代歐洲人的三個主要祖先人群,西歐的H-Gs、歐亞大陸北部的古西伯利亞人和來自近東的早期農業(yè)人群[41]。f4檢驗的結果顯示,在近東的農業(yè)人群擴張到歐洲之后,來自西伯利亞地區(qū)的古代人群越來越多地與西歐人群發(fā)生融合。另外,f4檢驗還表明西歐的H-Gs沒有和近東人群發(fā)生太多基因交流[41]。不同祖先人群對歐洲人的影響也與地域有一定關系。西歐H-Gs對北歐的影響更大,近東早期農業(yè)人群對南歐的影響更大(圖5)。從整體來看,比起古西伯利亞人,歐洲人與歐洲西部的狩獵采集者有更多的基因交流。但是在近東早期農業(yè)人口中有約29%的古西伯利亞人基因,卻沒有西歐狩獵采集者的基因[41]。這說明古西伯利亞人基因可能以較小的占比更廣泛地分布在當今的歐洲人群中。全基因組研究結果表明歐洲人的祖先成分是復雜的,不是簡單地由農業(yè)人群替換了H-Gs。
圖5 PCA圖。1~11號橢圓中的點代表不同地區(qū)的現代西歐人群,方框中的點代表不同地區(qū)的古人類樣本。從PCA圖中可以看出H-Gs與現代西歐人的距離較遠。早期農業(yè)人群與西班牙(7和10號橢圓)、法國南部(7號橢圓)和地中海的意大利撒丁島(10號橢圓)人群距離最近。古西伯利亞人群落在北歐和俄羅斯人群(11號橢圓)附近(根據[41]繪制)
基于全基因組的研究可以提供更精確的人群遷徙和融合的時間。近幾年國內外學者還利用全基因組進一步解釋了東亞和東南亞人群形成的過程,以及不同時期人群交流的情況。研究發(fā)現3 300~1 200年前的臺灣地區(qū)人群有75%的祖先成分是與現代南島語人群、壯侗語人群、南亞語人群以及長江流域的農業(yè)人群同源的,但另外25%的祖先成分則與中國北方黃河流域的早期農業(yè)人群有關[42]。在新石器晚期(4 600~4 200年前),東亞南部人群中就已經出現來自東亞北部人群的基因成分[43-44]。同時,福建與臺灣地區(qū)之間的亮島人被認為與南島語人群、壯侗語人群、青銅器時代的東南亞人群以及南亞語人的祖先人群有關[42]。這為南島語的祖先人群從中國華南地區(qū)擴散到臺灣地區(qū)進而向東南亞擴散這一觀點提供了證據支持。不過東南亞H-Gs的基因依然存在于現代東南亞人群中。這說明來自東亞的南島語祖先人群在到達東南亞后與當地的原住民發(fā)生融合而不是直接替換了原有的人群。這一人群交流的過程與近東早期農業(yè)人群在歐洲擴散的過程有相似之處,即不同人群之間都傾向于融合而不是替換。另外,研究發(fā)現太平洋瓦努阿圖地區(qū)的古代人群與新石器晚期的東亞南部人群的遺傳距離比與新石器早期的更近[43-44]。因此可以推測,新石器晚期有更多南島語祖先人群從東亞南部向外擴散[45]。進一步研究發(fā)現,來自1 800~2 300年前的印度尼西亞和菲律賓的古代個體可以被模擬為南島和南亞語祖先人群的混合[45]。這表明南島語人群到達臺灣后,在距今2 000年前后到達了東南亞島嶼地區(qū)。
古DNA研究是從mtDNA開始的,而對于Y染色體的探索開始得晚一些。1995年,帕博在Science雜志上發(fā)表了一篇關于Y染色體的綜述文章[46],在這篇文章中他對mtDNA和Y染色體進行了初步的比較。mtDNA在人體中有較多的拷貝數,具有適中的突變率,不重組,且只能由女性遺傳給后代,因此很適合用來研究群體間的母系親緣關系[17]。由于mtDNA的多樣性更容易受到遺傳漂變、自然選擇、人口規(guī)模變化等原因的影響[32],研究者們漸漸意識到只依靠mtDNA追溯人類的起源和發(fā)展還是有局限性的。對于DNA不同區(qū)域的研究可以幫助人們更全面地了解人類進化的相關問題,于是很多研究者開始將目光投向Y染色體[47-48]。Y染色體比mtDNA結構更復雜,片段更長,也有更豐富的多態(tài)性,而且不同位點的突變速率是不同的[49]。在同一人群中,由于婚配制度和遺傳方式的限制,Y染色體和mtDNA的多樣性可能存在差異[50-51]。根據多態(tài)性可以區(qū)分出Y染色體上特定基因或區(qū)域的不同單倍型(haplotype),進而追蹤不同人群的父系祖先來源[52]。
由于高質量男性尼人樣本的缺乏,關于尼人和丹尼索瓦人的Y染色體的研究直到近幾年才取得突破。對3個尼人和2個丹尼索瓦人的Y染色體研究的結果顯示,丹尼索瓦人與尼人和現代人的父系共同祖先分化的時間在距今70萬年前,而實驗中的3個尼人與現代人Y染色體的分化時間在37萬年前[53]。對比基于mtDNA、Y染色體和全基因組所構建的譜系樹,研究者們發(fā)現丹尼索瓦人與尼人和現代人遺傳關系的不一致可能是由于晚期尼人的線粒體和Y染色體被早期現代人的一個分支人群替換了[53]。因此,丹尼索瓦人與現代人的分化時間在三個譜系樹中是相對一致的,而根據Y染色體和mtDNA建立的譜系樹會顯示晚期尼人與現代人的距離更近。在阿爾泰地區(qū)發(fā)現的有現代人類基因滲入的尼人為這一論點提供了有力的支持[36]。關于尼人的最新研究發(fā)現,尼人Y染色體的多樣性要遠小于mtDNA的,而且被研究的13個尼人的Y染色體共祖時間也遠小于mtDNA的[54]。這可能是因為尼人女性在不同群體間的遷徙更頻繁。根據Y染色體和mtDNA所建立的模型顯示,尼人群體的平均人口為20人,其中有60%~100%的女性來自其他群體[54]。通過對古人類基因的深入探索和先進分析方法的應用,研究者們可以對古人類從人群交流到社會結構的多個維度進行探索。
除了研究人類起源和不同人群之間親緣關系與遷徙歷史等問題,古DNA還可以通過研究某些基因突變或者滲入的時間,來推測現代人類某些特征出現的時間和背景。帕博等[34]通過對比現代人類和尼人的全基因組,找到了現代人類中212個發(fā)生了核苷酸多態(tài)性選擇性清除(selective sweep)的區(qū)域。這些區(qū)域往往與自然選擇中對基因的正向選擇有關。選擇的作用越強烈,發(fā)生選擇性清除的區(qū)域可能就會越大。在該項研究中找到的最大區(qū)域包含THADA基因,這個基因附近的單核苷酸多態(tài)性(SNP)位點與2型糖尿病有關。另外,他們還發(fā)現一個與顱骨鎖骨發(fā)育不良有關的基因RUNX2 (CBFA1)。研究者們認為這個基因的突變與現代人和包括尼人在內的其他古人類在形態(tài)上的一些差別有關[34]。RUNX2基因與顱骨縫的延遲閉合、鎖骨的發(fā)育不良、牙齒畸形和鐘形胸廓有關[55]。其中,鐘形胸廓是一個在尼人和其他智人身上很典型的特征?,F代人類在這些形態(tài)上的變化很可能為其提供了某種進化方面的優(yōu)勢。對于人類基因正向選擇歷史的探索可以幫助我們更好地了解現代人類重要特征進化的歷程,以及現代人類是如何應對自然選擇的壓力的。
現代人中一些尼人和丹尼索瓦人的基因由于有利于人類對環(huán)境的適應,從而被保留下來。研究發(fā)現,與免疫相關的STAT2基因在歐亞人群中的一類單倍型(N)與尼人的高度相似,且在撒哈拉以南的非洲人群中沒有出現[56]。這類單倍型在歐亞人群中的平均占比為5%,但在太平洋的美拉尼西亞人中的出現頻率高達54%[56]。美拉尼西亞人中并沒有更多尼人祖先成分,因此帶有單倍型的免疫基因STAT2可能在美拉尼西亞地區(qū)受到正向選擇。丹尼索瓦人的基因也對現代人的免疫系統(tǒng)有一定的積極影響。與人類白細胞抗原相關的一個等位基因HLA-B*73就是由于丹尼索瓦人在西亞的基因滲透,進而擴散到整個歐亞地區(qū)的[57]。這個等位基因可以編碼許多獨特的自然殺傷細胞受體的配體,對自然殺傷細胞的運轉有著重要作用。自然殺傷細胞是一類與人體抗病毒抗感染等免疫調節(jié)功能有關的重要免疫細胞。HLA-B*73在調節(jié)免疫系統(tǒng)運作方面的優(yōu)勢使它在歐亞人群中的占比超過50%[57]。除了免疫系統(tǒng)外,丹尼索瓦人的基因滲透還對高海拔的青藏高原人群適應低氧環(huán)境有一定貢獻。EPAS1基因是一個與個體對低氧環(huán)境反應相關的基因,它通過在低氧情況下調節(jié)血紅蛋白的濃度來降低個體高原反應等心血管疾病的風險[58]。研究發(fā)現,青藏高原人群特有的更利于低氧環(huán)境的EPAS1基因單倍型大多存在于藏族人中,且與丹尼索瓦人的EPAS1基因單倍型十分相似,而這一單倍型在包括漢族人在內的世界其他族群中是很罕見的[59],這說明藏族人的EPAS1基因更有可能是來自丹尼索瓦人而不是現代人群。
帕博和Zeberg還發(fā)現了一些可以增加或減少新型冠狀病毒感染后重癥概率的相關基因,而這些基因與尼人有關。他們先是發(fā)現在3號染色體上的與感染新型冠狀病毒后呼吸衰竭有關的基因[60],這組基因被認為是新型冠狀病毒重癥的主要風險因素之一。涵蓋這組基因的片段在南亞人群中的占比為50%,在歐洲人群中為16%(圖6)。而這個基因片段的序列與尼人基因中對應區(qū)域的序列十分相似,因此推斷這一新型冠狀病毒重癥的風險因素可能來自尼人。在后續(xù)的研究中,他們又在12號染色體上發(fā)現一個與降低新型冠狀病毒感染后重癥風險有關的單倍型[61]。這個長度為75 kb的片段會在個體受到病毒感染時編碼一些有重要作用的蛋白質,在非洲以外地區(qū)都有較高的出現頻率(圖6)。研究者們在尼人基因相對應的區(qū)域中找到與這個單倍型一致的片段,因此現代人很有可能是從尼人的基因中獲得這一單倍型的;而且,這個片段長達75 kb,說明它不太可能來自于現代人類和尼人的共同祖先[61]。研究結果表明,尼人對現代人類的基因滲透既有積極也有消極的影響,但是基因的功能大多不是單一的,因此不能只從一個方面去判斷一個基因的利弊。
圖6 與冠狀病毒重癥風險相關的單倍型的頻率分布地圖。藍色代表與重癥風險增加有關的單倍型,紅色代表與重癥風險降低有關的單倍型(根據[60]和[61]繪制)
通過對有語言障礙的家族和個體的探索,研究者們發(fā)現在FOXP2基因上發(fā)生的突變與語言能力的發(fā)展息息相關。FOXP2基因的缺陷會影響大腦語言相關區(qū)域的發(fā)育,從而影響口面部的活動能力和語言的表達與認知能力[62]。FOXP2基因負責編碼一個由715個氨基酸組成的蛋白質。人類的FOXP2蛋白質與老鼠的只有3個氨基酸的差別。黑猩猩和大猩猩的FOXP2蛋白質與老鼠的只有1個氨基酸的差異,而與現代人類有2個位點的差異[63]。黑猩猩與老鼠的FOXP2蛋白質結構基本一致,而人類的FOXP2蛋白質與前兩者在結構和功能上是有區(qū)別的[63]。這說明人類FOXP2基因的關鍵突變更可能發(fā)生在人類與猿類進化分離以后,而且不同地區(qū)現代人的FOXP2蛋白質是一樣的,不存在多態(tài)性[63],這說明FOXP2在現代人類中已經經過正向選擇被固定下來。為了進一步驗證正向選擇對現代人類FOXP2基因的作用,研究人員分別測序了現代人類和黑猩猩該基因上非編碼區(qū)域的14 063組堿基對。他們發(fā)現一些在黑猩猩中頻率很低的等位基因在現代人類中有著較高的頻率[63]。這說明在現代人類中這些非編碼區(qū)域的多樣性由于編碼區(qū)域被正向選擇而受到了選擇性清除。根據似然法建立的模型顯示,現代人類FOXP2的固定可能發(fā)生在距今20萬年前,這一時間點可以對應到目前已知的現代人類祖先人群走出非洲向歐亞擴張的時間點之一[63]。人類語言的進化可能為人類的擴張?zhí)峁┝擞欣臈l件。
帕博對尼人FOXP2基因的研究發(fā)現,尼人和現代人在這個基因上的位點突變是一樣的。同時,這些突變附近由于正向選擇所發(fā)生的選擇性清除的信號也是一致的。因此,現代人類FOXP2基因出現的時間有可能比20萬年前更早,在尼人與現代人分化之前[64]。也有研究顯示尼人與現代人一致的FOXP2基因可能是由于早期現代人類向尼人的基因滲入而導致的[36]。隨著研究的不斷深入,對于這一問題的認識會不斷更新。在探索現代人類特征對應的基因突變是在何時產生的這類問題時,尼人和丹尼索瓦人這樣的古人類就像人類漫長演化歷史中的坐標。通過尋找這些坐標并進行比對,現代人類進化歷程的時間軸將得到更精確的矯正。
斯萬特·帕博通過30多年在古DNA領域的探索,實現了從mtDNA到全基因組的測序。他對于古人類研究的專注與奉獻為我們打開了一扇了解人類進化歷程的窗戶。同時,帕博對前沿技術的敏銳洞察力,也使他一直處于古DNA技術革新的前沿。研究像尼人和丹尼索瓦人這樣的已滅絕古人類,可以深化我們對于現代人類演化過程的了解。雖然帕博的研究重點集中在尼人和丹尼索瓦人上,但是他所開創(chuàng)或優(yōu)化的古DNA研究方法使得許多研究者受益,從而使越來越多的人加入到了古基因組學的行列。研究古基因組不僅可以回答有關人群起源與擴張的問題,還可以回答與現代人類特征的進化有關的問題。依托先進的實驗與分析技術,可供研究的古DNA范圍不斷擴大,可以回答的問題將不斷細化與深化。