周潔白,王向東
腫瘤生物信息學(xué):系統(tǒng)臨床醫(yī)學(xué)的新手段
周潔白,王向東
腫瘤是臨床上患者死亡最常見的原因,其診斷、治療和預(yù)后情況取決于腫瘤的嚴(yán)重程度、病程、部位、對(duì)藥物治療的敏感性和耐藥性、細(xì)胞的分化和起源以及對(duì)其病理過程了解程度的差異等多種因素。鑒于基因與蛋白質(zhì)之間的聯(lián)系和網(wǎng)絡(luò)在腫瘤分子機(jī)制的研究中起重要作用,在腫瘤研究中引入了“系統(tǒng)臨床醫(yī)學(xué)”這個(gè)全新概念。腫瘤生物信息學(xué)根據(jù)疾病代謝、信號(hào)通路、信息交流以及增殖的特異性,將生物信息學(xué)方法應(yīng)用于腫瘤研究,這種新興的手段不僅是腫瘤系統(tǒng)臨床醫(yī)學(xué)的一個(gè)重要部分,而且是系統(tǒng)臨床醫(yī)學(xué)中進(jìn)行腫瘤相關(guān)研究的核心手段,是改善腫瘤患者預(yù)后的一種最關(guān)鍵和最有效的方法。
腫瘤;生物信息學(xué);系統(tǒng)臨床醫(yī)學(xué)
腫瘤是臨床上患者死亡最常見的原因,是發(fā)生在機(jī)體某個(gè)系統(tǒng)多個(gè)器官、某個(gè)器官多個(gè)系統(tǒng),或者這兩種情況共同存在的一種復(fù)雜的疾病。腫瘤的嚴(yán)重程度、病程、部位、對(duì)藥物治療的敏感性和耐藥性、細(xì)胞的分化和起源以及對(duì)其病理過程了解程度的差異,決定了腫瘤的診斷、治療和預(yù)后情況。越來越多證據(jù)表明基因與蛋白質(zhì)之間的聯(lián)系和網(wǎng)絡(luò)在腫瘤分子機(jī)制的研究中起重要作用,因此把“系統(tǒng)臨床醫(yī)學(xué)”這個(gè)全新的概念引入腫瘤研究至關(guān)重要。系統(tǒng)臨床醫(yī)學(xué)整合了系統(tǒng)生物學(xué)、臨床科學(xué)、譜學(xué)技術(shù)、生物信息學(xué)和計(jì)算機(jī)科學(xué),改善疾病的診斷、治療和預(yù)后情況。腫瘤生物信息學(xué)是腫瘤系統(tǒng)臨床醫(yī)學(xué)的一個(gè)重要部分,同樣也是系統(tǒng)臨床醫(yī)學(xué)中進(jìn)行腫瘤相關(guān)研究的核心手段?!澳[瘤生物信息學(xué)主題系列”集合了BMC Bioinformatics、BMC Cancer、Genome Medicine和Journal of Clinical Bioinformatics等雜志的長處,關(guān)注腫瘤生物信息學(xué)在生物信息學(xué)方法、網(wǎng)絡(luò)生物標(biāo)志物和精準(zhǔn)醫(yī)學(xué)發(fā)展中的應(yīng)用?!跋盗小本劢鼓[瘤生物信息學(xué)和計(jì)算機(jī)系統(tǒng)生物學(xué)的新發(fā)展,探索其臨床應(yīng)用的潛力,以期改善腫瘤患者的預(yù)后。
腫瘤生物信息學(xué)是根據(jù)疾病代謝、信號(hào)通路、信息交流以及增殖的特異性,將生物信息學(xué)方法應(yīng)用于腫瘤研究的一種手段。臨床生物信息學(xué),一門結(jié)合了臨床信息學(xué)、生物信息學(xué)、醫(yī)學(xué)信息學(xué)、信息技術(shù)、數(shù)學(xué)和譜學(xué)的新興學(xué)科[1],是解決臨床上腫瘤患者早期診斷、有效治療和預(yù)后評(píng)估這些相關(guān)挑戰(zhàn)關(guān)鍵因素的方法。有必要引入腫瘤生物信息學(xué)特異性方法學(xué),或者引入全新、高級(jí)的生物信息學(xué)工具,來回答腫瘤相關(guān)的問題。例如,語義網(wǎng)技術(shù)的運(yùn)用可以幫助分析從Corvus檢索到的大量臨床數(shù)據(jù),建立定量的語義模型。Corvus是一個(gè)數(shù)據(jù)庫,為不同形式的譜學(xué)數(shù)據(jù)提供一個(gè)統(tǒng)一的平臺(tái),基于系統(tǒng)生物學(xué)知識(shí)以及SPARQL(simple protocoland esource description framework query language)節(jié)點(diǎn)的應(yīng)用[2]。語義模型,包含惡性黑色素瘤患者的基因組、轉(zhuǎn)錄物組和表觀基因組數(shù)據(jù),以及構(gòu)建于轉(zhuǎn)錄因子結(jié)合信息的調(diào)節(jié)網(wǎng)絡(luò),用于研究不同分子階段與其對(duì)于抗腫瘤治療反應(yīng)的相互作用。多元檢驗(yàn),一個(gè)闡明檢驗(yàn)中由于樣本準(zhǔn)備而引入內(nèi)源性誤差并且檢測(cè)共同作用因子的過程,用于幫助和指導(dǎo)臨床醫(yī)師了解基于PAM50的基因組預(yù)估在乳腺癌患者治療計(jì)劃中的應(yīng)用,并且將不確定的信息用于一個(gè)可行的方案[3]。
方法學(xué)、軟件、計(jì)算機(jī)工具和數(shù)據(jù)庫可用于研究腫瘤的分子機(jī)制、發(fā)現(xiàn)并證實(shí)腫瘤新的生物標(biāo)志物、網(wǎng)絡(luò)生物標(biāo)志物和個(gè)體化藥物,這些資源的適用性、特異性和整合性應(yīng)予以關(guān)注。miRTrail是一種整合工具,用于分析基因和miRNA間全面的交互聯(lián)系,基于表達(dá)特征,從而得出更多關(guān)于失調(diào)節(jié)的病理過程的有力證據(jù)和可靠結(jié)果。miRTrail可能為研究人類疾病(包括腫瘤)進(jìn)程中基因和miRNA間調(diào)節(jié)關(guān)系提供一種全新的手段,通過整合 20000個(gè)基因、近 1000個(gè)miRNA和大約 280000種普遍聯(lián)系的信息而成形[4]。探索可能的計(jì)算機(jī)方法,將基因和miRNA間的調(diào)節(jié)關(guān)系與臨床表型聯(lián)系起來,例如不同的腫瘤部位、腫瘤階段、分化情況、患者癥狀,或者對(duì)治療的反應(yīng)中不同的基因間相互關(guān)系,可能對(duì)相關(guān)研究有所幫助。醫(yī)學(xué)影像學(xué)應(yīng)該成為腫瘤生物信息學(xué)應(yīng)用中的一個(gè)重要因素,因?yàn)橥ㄟ^臨床病理、超聲、CT、MRI以及PET等技術(shù)得到的影像,是腫瘤的“早期和準(zhǔn)確”發(fā)現(xiàn)和診斷一個(gè)必要及重要的方法。對(duì)于醫(yī)學(xué)影像中腫塊和其他異常表現(xiàn)的形態(tài)學(xué)特征的生物信息學(xué)分析,開始于數(shù)學(xué)形態(tài)學(xué)對(duì)于目標(biāo)特征的選擇性獲取,以及通過兩種對(duì)照的修飾技術(shù)對(duì)于獲取特征的強(qiáng)化[5]。Haustein 和 Schumacher[6]在“腫瘤生物信息學(xué)主題系列”中描述的計(jì)算機(jī)模型可以模擬腫瘤生長和轉(zhuǎn)移形成的動(dòng)態(tài)過程,從而在出現(xiàn)臨床癥狀前發(fā)現(xiàn)可疑轉(zhuǎn)移灶的形成。
腫瘤生物信息學(xué)專家?guī)椭R床醫(yī)師建立基因間或蛋白質(zhì)間關(guān)系,以及與腫瘤的類型、密度或部位相關(guān)的一些機(jī)制的概念,可能是一個(gè)不相關(guān)的問題,或者說是一個(gè)未來的設(shè)想。von der Heyde和Beissbarth[7]在“腫瘤生物信息學(xué)主題系列”中的一篇文章通過對(duì)表皮生長因子受體(epidermal growth factor receptor,EGFR)通路的分析,得出西妥昔單抗在頭頸部腫瘤中耐藥機(jī)制的最新進(jìn)展。
腫瘤生物信息學(xué)在生物標(biāo)志物的發(fā)現(xiàn)和證實(shí)中起重要的作用,尤其在早期診斷相關(guān)的臨床表型、判斷疾病進(jìn)展監(jiān)測(cè)和治療反應(yīng)以及評(píng)估患者生活質(zhì)量的改善方面。在腫瘤多種基于基因、蛋白質(zhì)、多肽、化學(xué)、或者生理的變量中,生物標(biāo)志物的研究從單個(gè)標(biāo)志物到多個(gè)標(biāo)志物,從表達(dá)到功能指標(biāo),從網(wǎng)絡(luò)到動(dòng)態(tài)網(wǎng)絡(luò)。網(wǎng)絡(luò)生物標(biāo)志物是一類新的生物標(biāo)志物,與蛋白質(zhì)間關(guān)系有關(guān),通過整合蛋白質(zhì)注解、聯(lián)系和信號(hào)通路的相關(guān)知識(shí)進(jìn)行研究。網(wǎng)絡(luò)生物標(biāo)志物在疾病發(fā)展的不同階段和時(shí)間點(diǎn)會(huì)有所改變,標(biāo)志物的改變可以被檢測(cè)和評(píng)估,即所謂的動(dòng)態(tài)網(wǎng)絡(luò)生物標(biāo)志物,是一種新的研究方法。動(dòng)態(tài)網(wǎng)絡(luò)生物標(biāo)志物可能與臨床信息學(xué)有關(guān),包括患者主訴、既往史、治療、臨床癥狀和體征、生化檢查、影像學(xué)檢查、病理以及其他一些檢查手段[8]。
系統(tǒng)臨床醫(yī)學(xué)在腫瘤生物標(biāo)志物的研究發(fā)展中是推薦的一種新方法。系統(tǒng)臨床醫(yī)學(xué)整合了系統(tǒng)生物學(xué)、臨床表型、高覆蓋技術(shù)、生物信息學(xué)和計(jì)算機(jī)科學(xué),以期改善疾病的診斷、治療和預(yù)后情況。腫瘤生物標(biāo)志物應(yīng)該具有網(wǎng)絡(luò)、動(dòng)態(tài)、關(guān)聯(lián),以及對(duì)于疾病診斷、治療和預(yù)后具有特異性等特征。認(rèn)識(shí)臨床信息學(xué)和生物信息學(xué)間的聯(lián)系是研究發(fā)展疾病新的診斷和治療手段的第一步,也是關(guān)鍵的一步。這種研究方法在腎移植后急性排斥反應(yīng)和肺臟疾病的研究中已經(jīng)有所涉及[9-10]。簡而言之,臨床研究中,按照清晰和嚴(yán)格的入組標(biāo)準(zhǔn)將研究對(duì)象入組,進(jìn)行樣本搜集,將臨床描述轉(zhuǎn)化為一套完整的臨床生物信息學(xué)信息。通過生物信息學(xué)和系統(tǒng)生物學(xué),可以分析樣本的基因和(或)蛋白質(zhì)特征,從而探索基因和(或)蛋白質(zhì)間動(dòng)態(tài)網(wǎng)絡(luò)和相互聯(lián)系。
通過計(jì)算機(jī)方法篩選出的具有疾病特異性的基因和(或)蛋白質(zhì)網(wǎng)絡(luò)和動(dòng)態(tài)網(wǎng)絡(luò)與各個(gè)臨床表型分別相關(guān),可以證實(shí)并完善疾病特異性的生物標(biāo)志物。然而,在系統(tǒng)臨床醫(yī)學(xué)的應(yīng)用中面臨許多挑戰(zhàn)需要克服。例如將臨床描述信息轉(zhuǎn)化成臨床信息學(xué)信息的最優(yōu)系統(tǒng),以疾病嚴(yán)重程度、病程、部位、對(duì)治療的敏感性和疾病進(jìn)展為目標(biāo)的生物信息學(xué)分析,或者是將來自臨床的所有信息和高覆蓋數(shù)據(jù)整合從而得出精確結(jié)論的計(jì)算機(jī)方法。除了尋找基因與蛋白質(zhì)表達(dá)的變化和重要性,探索分子網(wǎng)絡(luò)之間、分子網(wǎng)絡(luò)和臨床表型之間,以及基因和(或)蛋白質(zhì)相互關(guān)系之間的變化和重要性也是一個(gè)挑戰(zhàn)。Cun和Fr?hlich[11]在“腫瘤生物信息學(xué)主題系列”中報(bào)告,在一項(xiàng)將乳腺癌患者分級(jí)的研究中,結(jié)合蛋白質(zhì)網(wǎng)絡(luò)和關(guān)聯(lián)的數(shù)據(jù),提高了判斷基因特點(diǎn)的能力,R加權(quán)回歸特征消去和平均通路表達(dá)是那些被檢驗(yàn)的方法中發(fā)現(xiàn)可識(shí)別特點(diǎn)最有效的方法,這一發(fā)現(xiàn)證實(shí)了以上觀點(diǎn)。
系統(tǒng)腫瘤醫(yī)學(xué)是認(rèn)識(shí)并了解預(yù)言性、預(yù)防性、個(gè)體化和分享性(P4)醫(yī)學(xué)的新手段[12-15]。Tian 等[15]最近提出,應(yīng)用高覆蓋技術(shù)將得出與患者相關(guān)的大量實(shí)體數(shù)據(jù),包括疾病關(guān)聯(lián)器官的細(xì)胞中一個(gè)或更多個(gè)與疾病相關(guān)的分子網(wǎng)絡(luò)。通過疾病相關(guān)的分子網(wǎng)絡(luò)可以發(fā)現(xiàn)早期的異常信號(hào),最終實(shí)現(xiàn)腫瘤的P4醫(yī)學(xué)。腫瘤臨床生物信息學(xué)是實(shí)現(xiàn)系統(tǒng)臨床醫(yī)學(xué)的一個(gè)重要的方法,通過將臨床檢查結(jié)果與體征和人類腫瘤組織來源的生物信息學(xué)信息結(jié)合起來,認(rèn)識(shí)臨床癥狀和體征、疾病發(fā)展和進(jìn)展以及治療策略,繪制與臨床檢查、病理、生化分析、影像和治療的關(guān)系,整合在一個(gè)特定譜學(xué)類別中共同指向完整功能的離散元素[1,8]。Ren 和其同事[16]在“腫瘤生物信息學(xué)主題系列”中介紹了一個(gè)名為“分類優(yōu)化工具”的計(jì)算機(jī)軟件,該軟件可應(yīng)用于例如基因表達(dá)特征、蛋白譜等的多種檢測(cè),揭示腫瘤的表型、提高診斷的準(zhǔn)確性。
腫瘤生物信息學(xué)在檢測(cè)和預(yù)計(jì)精準(zhǔn)醫(yī)學(xué)的效率和有效性中有重要的作用,基于每一個(gè)個(gè)體基因和蛋白質(zhì)表達(dá)的變異,精準(zhǔn)醫(yī)學(xué)提供最安全和有效的治療策略。微陣列、蛋白組學(xué)、表觀基因組學(xué)和新一代排序等來源的數(shù)據(jù)存在語義異質(zhì)性,通過一個(gè)有效的方式整合分子、病理、放射和臨床數(shù)據(jù),為廣泛分布于服務(wù)導(dǎo)向、模型來源基礎(chǔ)結(jié)構(gòu)的數(shù)據(jù)庫的質(zhì)疑提供了一個(gè)實(shí)體的解決方案[17]。一項(xiàng)最近的研究在人類肝細(xì)胞肝癌基因組學(xué)分析的前提下進(jìn)行了基因篩選,通過隨后的小鼠模型分析和RNA干擾分析,發(fā)現(xiàn)肝癌中一個(gè)普遍的基因改變(11q13.3擴(kuò)增)激活成纖維細(xì)胞生長因子19(fibroblast growth factor,F(xiàn)GF19),導(dǎo)致對(duì) FGF19抑制劑的選擇敏感性[18]?;诿恳粋€(gè)患者腫瘤的分子網(wǎng)絡(luò)特征,以期可以發(fā)展出一種精確的工具,在正確的時(shí)間為正確的患者提供正確的治療。腫瘤生物信息學(xué)和系統(tǒng)生物學(xué)通過治療設(shè)計(jì),以期改善腫瘤的預(yù)防、診斷和治療情況。分析基因組、生物序列、大規(guī)模譜學(xué)數(shù)據(jù)和蛋白質(zhì)三維結(jié)構(gòu)的經(jīng)典統(tǒng)計(jì)學(xué)技術(shù)是計(jì)算機(jī)輔助腫瘤研究中不可或缺的[19]。
總體而言,腫瘤生物信息學(xué)是一種新興的手段,是系統(tǒng)臨床醫(yī)學(xué)中進(jìn)行臨床研究和應(yīng)用并且改善腫瘤患者預(yù)后的一種最關(guān)鍵和最有用的方法?!澳[瘤生物信息學(xué)主題系列”為科學(xué)家整合譜學(xué)、生物信息學(xué)工具和數(shù)據(jù)、臨床研究、疾病特異性生物標(biāo)志物、動(dòng)態(tài)網(wǎng)絡(luò)與精準(zhǔn)醫(yī)學(xué)提供了一個(gè)獨(dú)特的平臺(tái)和難得的機(jī)遇,以期共同對(duì)抗腫瘤,改善腫瘤患者的生活質(zhì)量。
[1]Wang X,Liotta L.Clinical bioinformatics:a new emerging science[J].J Clin Bioinforma,2011,1(1):1.
[2]Holford ME,McCusker JP,Cheung KH,et al.A semantic web framework to integrate cancer omics data with biological knowledge[J].BMC Bioinformatics,2012,13(Suppl 1):S10.
[3]Ebbert MT,Bastien RR,Boucher KM,et al.Characterization of uncertainty in the classification of multivariate assays:application to PAM50 centroid-based genomic predictors for breast cancer treatment plans[J].J Clin Bioinforma,2011,1:37.
[4]Laczny C,Leidinger P,Haas J,et al.miRTrail--a comprehensive webserver for analyzing gene and miRNA patterns to enhance the understanding of regulatory mechanisms in diseases[J].BMC Bioinformatics,2012,13:36.
[5]Kimori Y.Mathematical morphology-based approach to the enhancement of morphological features in medical images[J].J Clin Bioinforma,2011,1:33.
[6]Haustein V,Schumacher U.A dynamic model for tumour growth and metastasis formation[J].J Clin Bioinforma,2012,2(1):11.
[7]von der Heyde S,Beissbarth T.A new analysis approach of epidermal growth factor receptor pathway activation patterns provides insights into cetuximab resistance mechanisms in head and neck cancer[J].BMC Med,2012,10:43.
[8]Wang X.Role of clinical bioinformatics in the development of network-based Biomarkers[J].J Clin Bioinforma,2011,1(1):28.
[9]Wu D,Zhu D,Xu M,et al.Analysis of transcriptional factors and regulation networks in patients with acute renal allograft rejection[J].J Proteome Res,2011,10(1):175-181.
[10]Chen H,Song Z,Qian M,et al.Selection of disease-specific biomarkers by integrating inflammatory mediators with clinical informatics in AECOPD patients:a preliminary study[J].J Cell Mol Med,2012,16(6):1286-1297.
[11]Cun Y,F(xiàn)r?hlich H.Prognostic gene signatures for patient stratification in breast cancer-accuracy,stability and interpretability of gene selection approaches using prior knowledge on protein-protein interactions[J]. BMC Bioinformatics,2012,13(1):69.
[12]Chen H,Wang Y,Bai C,et al.Alterations of plasma inflammatory biomarkers in the healthy and chronic obstructive pulmonary disease patients with or without acute exacerbation[J].J Proteomics,2012,75(10):2835-2843.
[13]Hood L,F(xiàn)riend SH.Predictive,personalized,preventive,participatory(P4)cancer medicine[J].Nat Rev Clin Oncol,2011,8(3):184-187.
[14]Hood L,Heath JR,Phelps ME,et al.Systems biology and new technologies enable predictive and preventative medicine[J].Science,2004,306(5696):640-643.
[15]Tian Q,Price ND,Hood L.Systems cancer medicine:towards realization of predictive,preventive,personalized and participatory(P4)medicine[J].J Intern Med,2012,271(2):111-121.
[16]Ren X,Wang Y,Wang J,et al.A unified computational model for revealing and predicting subtle subtypes of cancers[J].BMC Bioinformatics,2012,13(1):70.
[17]González-Beltrán A,Tagger B,F(xiàn)inkelstein A.Federated ontology-based queries over cancer data[J].BMC Bioinformatics,2012,13(Suppl 1):S9.
[18]Sawey ET,Chanrion M,Cai C,et al.Identification of a therapeutic strategy targeting amplified FGF19 in liver cancer by Oncogenomic screening[J].Cancer Cell,2011,19(3):347-358.
[19]Nagl S.Cancer bioinformatics:from therapy design to treatment[M].Publisher:John Wiley & Sons,2006:287.
R73;R-05
A
2095-3097(2012)01-0041-03
10.3969/j.issn.2095-3097.2012.01.011
200032上海,復(fù)旦大學(xué)附屬中山醫(yī)院呼吸科(周潔白),生物醫(yī)學(xué)研究中心(王向東)
王向東,E-mail:xiangdong.wang@clintransmed.org
2012-06-18 本文編輯:徐海琴)