王凱莉,陳佳欣,范雪
1.安徽農業(yè)大學 資源與環(huán)境學院,安徽 合肥,230036 2.中國科學院植物研究所,北京 100093
薔薇科 (Rosaleae) 屬種子植物門被子植物亞門雙子葉植物綱薔薇目,全世界共有 124 屬 3300 余種,廣布于全球,北溫帶地區(qū)分布較多[1]。薔薇科植物一直備受各國學者的關注,我國約有 51 屬 1000 多種,也是薔薇科植物的分布中心[2]。薔薇科植物具有很高的經濟價值和生態(tài)價值,包括觀賞價值、藥用價值、食用價值以及大氣污染物的檢測治理,與此同時富饒的物種資源、較強的生態(tài)適應能力、多樣化的景觀效果以及深厚的文化內涵使得薔薇科植物成為生產生活中必不可少的一部分,因此科研人員致力于薔薇科植物方面的相關研究。例如,常見薔薇科植物對大氣中的氟化物吸收累計特征的研究中表明研究所選取的薔薇科植物屬于氟化物敏感物種, 特別是紅葉李、桃等吸收累積氟化物的能力較強,基本適宜用于氟污染的監(jiān)測和治理工程中[3];各地區(qū)薔薇科植物木本資源的觀賞及園林應用的研究結果顯示為在各地區(qū)的城市景觀建設與園林應用中,薔薇科植物十分普遍。近些年來,記載物種分布的標本記錄數據被廣泛地應用于開展經典的生物地理學和保護生物學領域的研究,郭書賢等 (2007) 通過調查并結合有關文獻和植物標本的資料,對青海幾種重要薔薇科野生果樹資源進行了評價,并提出了開發(fā)利用以及保護的建議[4]。宋敏麗等 (2010) 根據歷山植物野外實習調查、標本的采集和鑒定以及歷山標本館標本的相關資料,統計歷山薔薇科植物亞科、屬、種的數量、生活型及地理分布,對歷山自然保護區(qū)薔薇科植物區(qū)系分布區(qū)類型進行劃分[5]。
植物標本是研究各植物類群的起源,演化及時空動態(tài)的基本參考資料。采集人員在標本采集的過程中往往會因為地理條件、氣候和個人的主觀意識而出現采集偏差,導致采集地區(qū)分布不均勻,部分地區(qū)采集遺漏,或采集數量過少導致數據不完整,例如常見種和具有較高的科研、經濟和觀賞價值的植物在采集過程中會受到偏愛,這是物種分布數據庫普遍存在的地理性采集偏差[6]。由于采集的地理偏差的存在,許多物種的地理分布信息沒有完全記錄[7];在小尺度上,地區(qū)的物種名錄往往不完全的,把它稱為名錄不完整性。有相關的研究表明地理性的采集偏差會影響人們對生物多樣性格局的認識,基于原始的物種分布數據得出的物種豐富度格局往往是不真實甚至是扭曲的[8-9]。其次,由于薔薇科植物標本采集數據是其他有關數據分析的分析基礎,所以數據的不完整性會使后續(xù)的研究結果產生誤差。而大多數的研究人員是直接應用數據進行研究分析,很少會有人去對數據進行檢測和評估,當前針對薔薇科植物標本采集地理性偏差和采集完整性的評估研究較為缺乏。本研究以中國薔薇科植物標本采集記錄為研究對象,依據 (1) 標本記錄數量;(2) 物種豐富度記錄數;(3) 物種豐富度估計值;(4) 估計值與記錄數之間的差值;(5) 物種累積曲線末端 10% 的斜率這五個方面對標本采集完整程度進行評估分析。擬解決植物標本記錄的采集強度不均衡所帶來的誤差,減小植物采集數據對后期研究結果的影響,對指導野外標本的采集、生物多樣性空間格局研究以及薔薇科植物保護策略制定等領域有著重要的借鑒意義。
1.1.1 數字化標本記錄的獲取與篩選
本研究中選取的薔薇科植物數字化標本信息均從“中國國家標本資源共享平臺 (National Specimen Information Infrastructure,”NSII (http://www.nsii.org.cn/) 以及其下的全部子平臺系統數據庫中獲得 (圖 1)。NSII 平臺數據是實時更新的,開始處理數據時獲取薔薇科植物標本的詳細信息約 605640 份,這些標本信息是由全國近 200 家單位提供。經過初步的篩選,選取了 474166 份薔薇科植物的標本采集記錄,包括序列編號、科名、種名、所屬國家、省名以及縣名。
為避免異常數據的干擾,進一步對初步篩選出的標本記錄進行了校對,具體步驟如下:(1) 以數據庫中唯一的序列編號為標準,對于重復輸入的標本記錄進行確認并刪除保留唯一記錄;(2) 植物學拉丁名校正,主要利用網站 (http://tnrs.iplantcollaborative.org/TNRSapp.html) 對薔薇科植物標本拉丁名進行剔除錯誤數據與標準化,將查詢標本拉丁名準確率結果顯示在 0.9 以下的標本數據剔除,準確率在 0.9 以上的替換為正確拉丁名;(3) 對于采集于中國行政轄區(qū)以外的記錄和栽培記錄進行確認并進行刪除;(4) 采集地點在自然保護區(qū)內的標本記錄,根據電子地圖查詢自然保護區(qū)所在地,若完整保護區(qū)在某個縣級地區(qū)內,將保護區(qū)名改為該縣名。(5) 依據我國最新的行政區(qū)劃圖對縣名進行校對,統一縣的名稱。部分舊縣名經歷行政區(qū)劃的合并和重新劃分,經查找其歷史沿革后,確定最新的縣名。
圖1 薔薇科植物標本館藏分布統計圖Fig.1 Institutional preservation of Rosaceae specimen
1.2.1 物種豐富度與 Chao1 估計
對于某個地區(qū)而言,由于稀有種的存在和野外調查限制,被記錄的物種數量一般要少于真實存在的物種數量。因此,利用物種豐富度估計模型 (species richness estimator) Chao1 來估計中國每個縣真實的薔薇科植物物種數量,采用 Chao1 指數評估每個生境類型中真實的薔薇科植物物種豐富度。Chao1 在生態(tài)學中常用來估計物種總數,由 Chao (1984) 最早提出,Chao1 指數是用來反映物種豐富度的指標。它通過觀測到的結果推算出一個理論的豐富度,這個豐富度更接近真實的豐富度。Chao1 值越大代表物種總數越多。它僅使用單數和雙數的數量來估計未檢測到的物種的數量。Chao1 指數是基于這樣一種假設:在一個群體中隨機抽樣,當稀有的物種 (singletons) 依然不斷的被發(fā)現時,則表明還有一些稀有的物種沒有被發(fā)現;直到所有物種至少被抽到兩次 (doubletons) 時,則表明不會再有新的物種被發(fā)現。Chao1 的估計是根據已有取樣中物種個體數量的分布頻率來進行的[10-11],當取樣中每個物種都是兩個或兩個以上的個體時,Chao1 認為該地區(qū)的取樣比較完全;而當取樣中有物種只有一個個體時,Chao1 認為該地區(qū)仍有新物種有待發(fā)現。
Chao1 指數計算公式為:
其中,Sobs是觀測到的物種數量,F1是取樣中只有一個個體的物種數量,F2是只有兩個個體的物種數量。
從公式可以得知當每個縣中稀有種數量越多,根據 Chao1 認為該地區(qū)新物種未被發(fā)現的概率越大;而每個縣中稀有種數量越少,根據 Chao1 認為該地區(qū)新物種未被發(fā)現的概率越小。一般來講能觀測到的物種豐富度肯定會比實際少,兩者之間的差距通過對 singletons 和 doubletons 進行了合理的推算,分析chao1經典公式的后半段 (F1^2)/(2*F2) 可以得知 F1^2比2*F2 變化的速度更快。綜上,Chao1是度量物種豐富度的指標,它和豐度、均勻度無關,但是它對稀有的物種很敏感。
1.2.2 標本采集記錄完整性評估
用兩種方法來評估薔薇科植物物種在每個縣的采集數據的不完整程度。第一種方法計算每個縣觀測的物種數量和 Chao1 估計的物種數量之間的差值來表示某一個縣物種在該地的采集數據的不完整程度。第二種方法是利用物種累積曲線的彎曲程度來表示物種的不完整程度。物種累積曲線 (species accumulation curve,SAC) 用于描述隨著抽樣量的的加大物種增加的狀況,它以抽樣量作為橫坐標,以物種數目作為縱坐標,將每一抽樣量所對應的物種數目在坐標系中標出并連起來,就得到了一條曲線。在生物多樣性和群落調查中,科研人員用物種累積曲線對抽樣量是否充分進行判斷以及對物種豐富度的估計。它記錄了繼續(xù)抽樣下新物種出現的概率,是理解調查樣地物種組成和預測物種豐富度的有效工具。抽樣量可以用多種形式來表現,包括樣本數量,個體數量,采集時間等等,本文抽樣量是薔薇科植物標本記錄數。物種累積曲線具有以下特點:在一定的抽樣范圍內,隨著抽樣量的加大,群落中大量的物種被發(fā)現,物種積累速率較快,曲線表現為急劇上升;至某一抽樣量,物種積累速率變的緩慢,曲線不再急劇上升而是趨于平緩。根據這一特點,可對抽樣量是否充分進行判斷,如果曲線一直急劇上升,幾乎為直線,表明抽樣量不足,需要增加抽樣量; 如果曲線在急劇上升后變?yōu)橐粷u近線,上升舒緩,則表明抽樣充分,可進行數據分析[12-14]。計算物種累積曲線末端 10% 部分的平均斜率來表示物種各累積曲線的彎曲程度,代表某個縣名錄的不完整程度。當斜率值近于 0 時,說明取樣較為完整,而當斜率近于 1 時,說明取樣十分不完整。該斜率值還意味著如果采集繼續(xù)時,有新種增加到取樣的概率。
定義一個域值 0.05,當斜率值小于或等于 0.05 (SAC slope ≤ 0.05) 時,認為縣的名錄較為完整,斜率值大于 0.05 (SACslope > 0.05) 時,認為名錄不完整。由于客觀原因,大多數生物多樣性和群落調查無法做到全面系統的調查,只能是抽樣調查。而抽樣調查總是很難完全的反映實際存在的物種數目,對未知地區(qū)進行調查時往往缺乏全面準確的方法,通常是根據經驗設計抽樣調查的方案,卻沒有對抽樣量是否充分進行考察,就不能確定調查結果是否能夠真實反映物種存在的狀況,其科學性就令人置疑。因此,需要通過物種累積曲線來判斷抽樣量是否充分。將名錄不完整的縣 (SAC slope > 0.05) 按照名錄的不完整程度高低逐漸排除出去,每排除一些縣,把剩下的縣作為一個數據子集 (data subset),一直到只有名錄完整的縣 (SAC slope ≤ 0.05) 留下,這樣一共得到了4個數據子集,分別略微不完整 (0.05 < SAC slope ≤ 0.30)、相對不完整 (0.30 < SAC slope ≤ 0.55)、十分不完整 (0.55 < SAC slope ≤ 0.80)、極其不完整 (SAC slope > 0.80)。
前期初步選取的 474166 份標本信息在統計分析之前,經過認真仔細的處理得到符合要求的數據是 370543 份,遍布 1164 個縣,該標本數據所在縣涵蓋 32 個省,占全國省份的 94.12%。根據統計,標本記錄數最多的是四川省、云南省,最少的記錄數是臺灣省 (圖 2)。標本數量最多的縣級市是四川省峨眉山市,有 12151 份標本 (圖 3)。中國縣級地區(qū)2377個,有 22% 的縣 (n = 428) 沒有標本記錄。24% 的縣 (n = 564) 標本數量少于 11 (圖 4-A)。沒有標本記錄或標本記錄數很少的縣大多分布在青海省、甘肅省、新疆維吾爾自治區(qū)、西藏自治區(qū)以及內蒙古自治區(qū)等偏遠地區(qū)。在中國還沒實施針對縣級水平的植物調查時。采集地點的選擇一般是根據采集者的經驗決定,采集主要集中在物種豐富度高的地區(qū),如西南地區(qū)的四川省、重慶市、云南省和華南地區(qū)的廣東省,廣西省以及華中地區(qū)的湖南省,湖北省。而偏遠地區(qū)的采集強度較低,如西北地區(qū)的新疆維吾爾自治區(qū)、青海省、甘肅省、寧夏和東北地區(qū)。
根據圖表可知,薔薇科物種豐富度較高的數據分布在西南地區(qū)。物種數量較多的縣是四川省峨眉山市以及重慶市的南川縣級市,每個縣記錄的物種數量最少為 10 個,最多為 481 個。四川、重慶一帶的物種豐富度記錄數與估計的理論值普遍高于其他地區(qū),這是因為其中包含了自然保護區(qū)、風景區(qū)、四川大學標本館、重慶自然保護館等 (圖 4-B,圖 4-C)。利用每個縣觀測記錄到的物種數量和 Chao1 估計的物種數量之間的差值來表示某一個縣物種在該地的采集完整程度。物種豐富度的原始記錄數與 Chao1估計數差值越大,說明該地發(fā)現稀有種的概率越大;原始記錄數與 Chao1估計數差值越小,說明該地發(fā)現稀有種的概率越小。當差值大于 0 時,表明該地區(qū)標本采集不完整,還有未被發(fā)現的新物種等待著采集記錄,需要對采集不完整的地區(qū)加大采集強度;當差值為 0 時,表明該地區(qū)的標本采集完整。通過對薔薇科植物標本數據的統計分析得知采集完整的縣主要分布在西南地區(qū),分別是勃利縣、大邑縣、關嶺布依族苗族自治縣、偏關縣、仁壽縣、銅梁縣、西吉縣、資中縣、達川市、桂林市市轄區(qū)、虹橋區(qū)。 (表 1,圖 4-D)
縣級名錄不完整程度指數 (用物種累積曲線末端斜率值 SACslope 來表示) 在 0.006135 和 0.882353 之間變化,其中有 53 個縣 (占數據統計分析縣的 4.5%) 的斜率值小于或等于 0.05,可以認為是名錄較為完整的縣。這些完整的縣所在的省份分別是黑龍江、重慶、浙江、新疆、西藏、四川、上海、陜西、山西、山東、青海、寧夏、內蒙古、江西、湖南、河南、河北、廣西、廣東、甘肅 (圖 4-E)。而1111個采集不完整的縣中,略微不完整 (0.05<SACslope≤0.30) 的縣數遠大于極其不完整 (SACslope>0.80) 的縣,表明薔薇科植物標本數據具有一定的利用價值,其可信程度相對較高 (圖 5)。但科研人員在利用這些數據進行相關的生態(tài)分析時,也會造成結果的不準確性,所以薔薇科縣級的植物物種名錄有待于完善,在以后的薔薇科植物標本采集的方案制定中應完善略微不完整縣的采集,加強極其不完整的縣的采集工作。
圖2 各省薔薇科植物標本記錄數Fig.2 Specimen records of Rosaceae plants in each province
圖3 薔薇科植物標本數量排名前 20 的縣 (縣級市,縣級區(qū))Fig.3 The top 20 counties of the Rosaceae plant specimens (county-level cities, county-level districts)
圖5 不完整縣的梯度圖Fig.5 Graph showing the gradients of counties with incomplete collection
使用兩種方法來評估每個縣物種名錄的不完整程度。第一種方法計算縣的記錄物種數量和 Chao1 估計的理論值之間的差值來表示某一個縣物種名錄的不完整程度。這種方法必須先利用 CHAO1 模型估計每個分析地“真實”的物種豐富度。然而,對于采集數量很少的地區(qū),物種豐富度的估計往往是不可靠的,為了克服這個問題,采用了第二種方法就是利用物種累積曲線末端斜率作為物種名錄完整程度指數。該方法的優(yōu)點是不需要估計地區(qū)“真實”的物種豐富度,因此對于取樣嚴重不足的地區(qū)同樣適用。
表1 各縣薔薇科植物的豐富度記錄數、CHAO1 估計值、殘差Table 1 Richness records, CHAO1 estimates, and residuals of Rosaceae plants in each county
根據兩種評估物種名錄完整性的方法可知,薔薇科植物標本記錄的縣級植物名錄 95.5% (n =1111) 是不完整的。對于中國植物物種如此豐富的國家,在縣級水平名錄不完整程度高的原因可能是中國植物采集的歷史相對較短和標本總體數量不足有關[15]。結合采集的地理偏差可知,在不同省份地區(qū)的采集強度不均衡,或是在同一省份的不同縣級地區(qū)采集力度不一致,都會導致數據的不完整,因為采集不全面的影響,數據庫只包括一部分植物標本,并且每年還有一些新類群被不斷發(fā)現,說明目前的物種名錄還是不完全的,而這些信息是生物地理和生態(tài)學研究的數據基礎,也是評估物種生存狀況和保護等級的重要依據[16-17]?,F有數據得出的物種豐富度可能不是真實的。因此建議在使用物種分布數據之前應該評估數據的質量,以確保分析結果的可靠性。
本研究選取國家標本資源共享平臺收錄的薔薇科植物標本記錄數據,對其進行一系列的處理,得知標本采集強度不均衡和采集地理偏差對縣級名錄的采集完整度有影響。根據標本采集地理偏差分析的結果可知現階段需要將中國的薔薇科植物每個物種的縣級地理分布信息名錄趨于完整,增加對新類群發(fā)現熱點地區(qū)的采集。這意味著有必要開展針對縣級的物種名錄清查工作,逐漸完善縣級的植物物種名錄。因此,有必要繼續(xù)增加在野外調查和采集和標本館管理等方面的人力、物力和財力的投入,基于現有的標本采集信息,開展更細致深入的研究,找出采集薄弱的地區(qū)和類群,作為未來植物調查的重點。