国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于貝葉斯網絡學習的胎兒心臟病非遺傳相關因素分析

2022-07-30 06:33阮燕萍陸義杰朱皞罡韓建成劉曉偉孫琳張燁谷孝艷趙映李磊冉素珍陳景麗于瓊許燕夏紅梅何怡華
關鍵詞:貝葉斯網絡結構胎兒

阮燕萍,陸義杰,朱皞罡,韓建成,劉曉偉,孫琳,張燁,谷孝艷,趙映,李磊,冉素珍,陳景麗,于瓊,許燕,夏紅梅,何怡華

先天性心臟病(CHD)是胎兒期心臟發(fā)育異常引起的心臟結構和功能缺陷,其發(fā)病率為每1000個活產兒中19~75個,因包含的缺陷類型不同而導致發(fā)病率不同[1],是中國最常見的先天性缺陷之一[2]。許多因素與胎兒CHD風險增加有關,分為遺傳[3],母體或胎兒因素。母體因素包括糖尿病、結締組織病、藥物暴露、感染、使用輔助生殖技術及家族史等,而胎兒因素包括心律失?;蛩[。在美國心臟協(xié)會關于胎兒心臟病的診斷和治療的科學聲明中詳細闡述了各種因素的風險[4]。

以往研究中,胎兒CHD影響因素的統(tǒng)計建模方法通常基于因素相互獨立的前提,建立邏輯回歸模型,根據(jù)比值比(OR)值反映每個因素與CHD之間的相關性。然而,CHD是一種多因素復雜疾病,在既往研究中CHD影響因素之間的相互作用和多因素協(xié)同的效應難以考慮和準確估計。

貝葉斯網絡是概率圖形模型的一個分支,也稱為信念網絡,它主要學習變量之間的因果關系,有力地進行概率推理和臨床診斷,對統(tǒng)計假設沒有嚴格要求。通過構造有向無環(huán)圖(DAG)來直觀地反映多個因素之間的潛在關系,條件概率分布表用于反映相關程度[5]。本研究主要根據(jù)龐大的母胎數(shù)據(jù)建立最佳BN模型,檢測胎兒CHD的影響因素并量化相關性的程度。 同時,我們將準確估計多因素組合對胎兒CHD的影響。

1 資料與方法

1.1 研究對象從2010年6月至2017年6月連續(xù)納入首都醫(yī)科大學附屬北京安貞醫(yī)院母胎數(shù)據(jù)庫中進行胎兒超聲心動圖檢查的孕婦(n=16 086)。孕周為16~39周。孕周由最后一次月經計算并用胎兒生物測定法校正,包括雙頂徑,頭圍,腹圍和股骨長度。入組標準包括:①相對完整的孕婦和胎兒因素數(shù)據(jù);②胎兒心臟檢查和胎兒CHD的診斷符合來自美國心臟協(xié)會的科學聲明于2013年發(fā)表DE胎兒心臟病診斷和治療規(guī)范[4]。排除標準為:①缺失變量超過50%的受試者;②數(shù)據(jù)缺失超過50%的變量。本研究經首都醫(yī)科大學附屬北京安貞醫(yī)院機構審查委員會批準,所有參與者均簽署知情同意書。

1.2 數(shù)據(jù)收集和變量賦值來自參與機構的數(shù)據(jù)和胎兒超聲心動圖圖像在我中心進行分析,這些圖像與我中心自己的數(shù)據(jù)一起從母胎數(shù)據(jù)庫中導出。通過問卷調查獲得了以下信息,母體因素包括:年齡,合并癥(糖尿病、妊娠早期上呼吸道感染、貧血、抗SSA/SSB陽性結締組織疾病和甲狀腺疾?。?,藥物暴露,引產或自發(fā)流產,以及CHD家族史,近親婚姻,孕婦和配偶的職業(yè)和不良習慣,接觸放射性物質,精神壓力,懷孕方式和懷孕期間的遺傳學檢測。胎兒因素包括妊娠周,單胎或雙胎,胎兒水腫以及胎兒心律失常。此外,根據(jù)胎兒超聲心動圖的診斷,將胎兒分為正常組和CHD組兩組。根據(jù)入選和排除標準篩選,最終分析中包含16 086個研究對象和26個變量。變量及其賦值見表1。

表1 研究所包含變量及其賦值

1.3 胎兒CHD診斷胎兒CHD是通過胎兒超聲心動圖檢查來診斷的,使用Voluson E8-RAB4-8和2到8-MHz換能器(GE Healthcare,Little Chalfont,英國),Aloka 10,UST-9130用3到36-MHz換能器(Aloka,Tokyo,Japan),或Philips IU-22,C5-1,帶有1或5-MHz換能器(Philips Healthcare,Bothell,WA)。胎兒超聲心動圖圖像的采集遵循美國超聲心動圖學會(ASE)[4]和國際婦產科超聲學會(ISUOG)的指南和標準[6]。

胎兒超聲心動圖由經驗豐富的副主任醫(yī)師和主任醫(yī)師進行操作及診斷。根據(jù)多節(jié)段篩查,基于灰階,彩色圖像和脈搏波多普勒進行診斷,包括四腔心,左右心室流出道(LVOT和RVOT),三血管(3V),三血管和氣管(3VT)切面,以及上下腔靜脈切面,主動脈弓和導管弓的矢狀面。參與機構的所有相關醫(yī)生都按照這些指南進行了培訓。從參與機構上傳到我們數(shù)據(jù)庫的所有圖像均由兩位經驗豐富的醫(yī)生獨立審查,并確認或糾正外院上傳圖像的診斷。

1.4 統(tǒng)計學分析基本統(tǒng)計采用SPSS 22.0進行分析。服從正態(tài)分布的連續(xù)變量表示為平均值±標準差,組間比較采用t檢驗。而不服從正態(tài)分布的變量表示為中位數(shù)(四分位數(shù)間距,IQR),組間比較采用非參數(shù)檢驗。計數(shù)資料以例數(shù)(構成比)表示,組間比較采用卡方檢驗。

1.4.1 構建貝葉斯網絡貝葉斯網絡采用matlab軟件,主要由兩個部分組成:編碼網絡依賴結構的有向無環(huán)圖(DAG)和在給定父節(jié)點情況下,每個節(jié)點的條件概率表(CPT)。數(shù)據(jù)處理階段:為了簡化模型,這里采用的是基于離散變量的貝葉斯網絡。大部分的暴露變量的取值都是離散的,將孕周、孕婦年齡等多個取值較多的變量,根據(jù)臨床劃分標準,歸類幾個取值狀態(tài)的離散變量,方便貝葉斯網絡的學習。

采用基于評分搜索和貪心算法計算得到近似最佳的貝葉斯網絡結構。由于貝葉斯網絡結構空間是節(jié)點個數(shù)的超指數(shù)函數(shù),因此首先通過最小權重生成樹(MWST)算法確定貝葉斯網絡的拓撲排序,降低貝葉斯網絡結構的搜索空間范圍。該方法是在每一條邊上計算兩個節(jié)點的互信息權重,再通過最小生成樹算法將圖轉化為一個樹形結構,從而確定了節(jié)點的拓撲順序(即排在前面的節(jié)點不能是后面節(jié)點的子節(jié)點,排在后面的節(jié)點不能是節(jié)前面點的父節(jié)點),這樣可以大大減小DAG的搜索空間,優(yōu)化網絡結構的學習時間。

K2算法是通過最大化網絡后驗概率來選擇貝葉斯網絡的最佳結構,但是由于貝葉斯網絡結構的搜索空間很大,計算時間較長,因此,一般的方法是通過MWST算法來縮小網絡的搜索空間來提高計算速率。K2+T算法便是在MWST確定的搜索空間范圍內,找到的最優(yōu)網絡結構的算法;K2-T算法是在MWST確定的節(jié)點逆序的搜索空間范圍內,找到的最優(yōu)網絡結構的算法[7]。GS+T算法是在MWST確定的搜索空間范圍內,采用貪心算法搜索最佳的網絡結構。GES算法在馬爾科夫等效空間中使用貪婪搜索,因為馬爾科夫等效貝葉斯網絡被認為符合等價性質[8]。

1.4.2 貝葉斯網絡參數(shù)學習當確定好貝葉斯網絡的結構后,給定完整數(shù)據(jù)D,通過最大似然函數(shù)估計(MLE)學習每個節(jié)點的CPT參數(shù)。對數(shù)似然函數(shù)計算見公式(1.1)。

K2+T,K2-T,GS+T和GES算法可以搜索得到四個最佳的網絡結構,再通過參數(shù)學習的方式,最終完成貝葉斯網絡結構的構建。四個模型從不同的角度擬合了環(huán)境變量的聯(lián)合概率分布,本文通過K折交叉驗證的方法,畫出四個模型ROC曲線,根據(jù)ROC曲線圍成的面積AUC值來選擇最優(yōu)的貝葉斯網絡模型。

在忽略孕周和考慮孕周變量兩種條件下,采用四種貝葉斯網絡結構學習算法,通過十折交叉驗證的方法,得到二分類AUC值如表2所示??梢钥闯?,通過K2-T算法學習得到的貝葉斯網絡結構是最優(yōu)的,且考慮孕周后,二分類AUC的值提升了將近6%,雖說臨床沒有將孕周劃分為危險環(huán)境因素,但從模型的分類結果上表現(xiàn)出的差異,在量化不同危險環(huán)境因素的致病風險時,需分類討論忽略孕周變量和考慮孕周變量兩種情況。

表2 貝葉斯網絡交叉驗證的分類結果

1.4.3 聯(lián)合樹推理算法(JTA)貝葉斯網絡推理是在觀測到部分變量的取值證據(jù)信息后,結合貝葉斯網絡的結構信息和每個節(jié)點上的條件概率表CPT,在網絡中計算目標節(jié)點的概率分布信息。貝葉斯網絡推理算法分為精確推理和近似推理兩種算法,聯(lián)合樹推理算法是目前使用范圍最廣,計算速度最快的精確推理算法。其JTA推理過程是將貝葉斯網絡轉換為一個聯(lián)接樹(每個節(jié)點由無向圖的最大完全子圖構成的無向樹),然后通過聯(lián)合樹上的證據(jù)收集或證據(jù)擴散消息傳遞方案,計算目標節(jié)點的概率分布。

1.4.4 致病風險量化指標研究環(huán)境因素對于結局的致病風險,通常設置實驗組和對照組,計算兩組的風險比(RR),又稱為相對風險度,表示實驗組與對照組患病率之比。如表3和公式(1.2)所示,RR表示暴露于危險環(huán)境條件下的患病率是對照組的倍數(shù),取值范圍為非負數(shù)。當RR>1,表示暴露的環(huán)境使得患病的風險增加,該環(huán)境是疾病風險因素,稱做“正相關”;當RR<1,說明暴露的環(huán)境使得患病的風險減少,稱做“負相關”;當RR=1,表示暴露的環(huán)境與疾病無關,計算過程見公式(1.2)。

表3 風險比計算表

在本文中,實驗組和對照組通過控制環(huán)境變量取值來區(qū)分的。在貝葉斯網絡模型下,風險比RR值的計算見公式(1.3)。表示實驗組患病率與對照組患病率的比值。

2 結果

2.1 正常組和胎兒CHD組的基線特征在所有參與者中共檢出3312例胎兒患有胎兒CHD,其余為正常胎兒(表4)。大多數(shù)孕婦(約80%)的年齡范圍在20~35歲。妊娠周(GW)的范圍為16~39周。與正常組相比,CHD組糖尿病、貧血、上呼吸道感染、黃體酮使用和冠心病史的比例低于正常組(P<0.05);而自然流產,配偶吸煙和飲酒,雙胞胎的比例高于正常組(P<0.05)。兩組間其他因素無明顯差異(P>0.05),表5。

表4 檢出胎兒CHD的類型

表5 正常胎兒組與CHD胎兒組孕婦基線資料比較

2.2 基于BN的單因素和多因素效應分析通過K2-T算法學習得到的貝葉斯網絡結果如圖1所示。紅色節(jié)點表示的是先心病變量,藍色節(jié)點是影響先心病的環(huán)境因素變量,網絡中兩個節(jié)點直接通過邊相連,邊則表示兩個變量直接相關關系。因此,可以得出和先心病直接相關的環(huán)境變量分別是感冒、胞胎數(shù)、糖尿病、貧血和流產,這些環(huán)境變量的不同取值直接影響先心病的發(fā)生概率;其他環(huán)境變量通過影響這些環(huán)境變量間接的改變胎兒患上先心病的風險。

圖1 忽略孕周的貝葉斯網絡結構圖

通過枚舉單個至全部環(huán)境變量組合的不同取值集空間,計算實驗組(暴露在危險環(huán)境條件)和對照組(暴露在正常環(huán)境條件)致病率的比值RR,找到相互加重的危險環(huán)境變量組合及風險值,結果如圖2所示。

BN結構分析顯示了因素之間的相互作用,以及與胎兒冠心病直接相關的幾個因素,包括自發(fā)流產,妊娠早期上呼吸道感染,貧血和孕婦精神壓力,以及單胎或雙胞胎和配偶吸煙?;贐N的因果推理,我們發(fā)現(xiàn)從單因素暴露逐漸增加到多因素暴露胎兒CHD的風險逐漸增加。單因素分析表明,胞胎數(shù)、自發(fā)流產、配偶吸煙的風險比分別為1.50、1.38和1.11。當胞胎數(shù)與自發(fā)流產或配偶吸煙相結合時,F(xiàn)HD的RR比單因子暴露更大(RR=1.96或1.63)。當三個因素疊加時,風險繼續(xù)增加,例如貧血和上呼吸道感染的組合,加入胞胎數(shù),或自發(fā)流產,或配偶吸煙,RR分別為1.56,1.45或1.17。以此類推,當我們結合四個因素,包括胞胎數(shù),孕早期上呼吸道感染,孕婦的貧血,精神壓力,以及自發(fā)流產或配偶吸煙時,風險范圍可達1.67到2.12。當將上述因素合并為五個因子時,風險增加1.62倍(RR=2.62或2.28),高于那些低于五個因素組合的情況(圖2)。除上述因素外,其他因素不會繼續(xù)導致胎兒CHD的風險。

圖2 忽略孕周的多環(huán)境因素組合的致病風險

變量 CHD胎兒組 正常胎兒組 P值近親結婚(n,%) 0.283是2(0.06) 3(0.02)否3310(99.94) 12 771(99.98)先天性心臟病家族史(n,%) 0.030是24(0.72) 148(1.16)否3288(99.28) 12626(98.84)單胎或雙胎(n,%) <0.001單胎 3235(97.68) 12601(98.65)雙胎 77(2.32) 173(1.35)胎兒心律失常(n,%) 0.950是40(1.21) 156(1.22)否3272(98.79) 12618(98.78)胎兒水腫(n,%) 0.124是72(2.17) 338(2.65)否3240(97.83) 12436(97.35)

2.3 基于孕周分組的單因素和多因素效應分析在分析中發(fā)現(xiàn),孕周是一個很強的混雜變量,而非風險因素,因此進一步對患者按孕周劃分為(A組:16~28周,B組:28~40周)兩組人群?;贙2-T算法,學習得到貝葉斯網絡結構如圖3所示。

圖3 考慮孕周的貝葉斯網絡結構圖

可以看出,相對于忽略孕周變量構建的貝葉斯網絡,該網絡中直接影響先心病的環(huán)境因素除了感冒、胞胎數(shù)、糖尿病、貧血和流產,又多了一個孕周因素,因此可看出,在量化危險環(huán)境因素得致病風險時,孕周是重要的影響因素。

進一步對參與者按孕周進行敏感性分析(A組:16~28周,B組:28~40周)?;贐N的因果推理,無論是針對A組還是B組的人群,單因素或多因素暴露分析,都能得出與上述一致的結果。不同之處在于,我們發(fā)現(xiàn)A組胎兒CHD的風險高于B組,單因素暴露和多因素暴露呈現(xiàn)相同的趨勢。結果表明,A組五個因素合并的風險高達2.88,B組的風險高達2.02,其中的危險因素包括胞胎數(shù),妊娠早期上呼吸道感染,貧血,精神壓力以及自發(fā)流產(圖4)。

圖4 多環(huán)境因素組合對于胎兒CHD的致病風險結果

3 討論

這項橫斷面研究是目前樣本量很大的胎兒CHD危險因素分析,16 086例受試者中冠心病3312例。更重要的是,我們使用BN,一種基于概率推理的方法來揭示多個數(shù)據(jù)集之間的潛在關系,檢測因子的相互作用以及與胎兒CHD風險增加相關的因素,而不是傳統(tǒng)的邏輯回歸分析。這項研究的結果發(fā)現(xiàn),胎兒CHD的直接相關因素包括自發(fā)流產史,孕早期上呼吸道感染,貧血和孕婦精神壓力及胞胎數(shù)和配偶吸煙。當上述因素合并時風險逐漸增加,五個因素協(xié)同效應風險比達2.62。

前面提到,有許多與冠心病相關的因素,包括母體疾病,母體治療和非治療藥物暴露,環(huán)境暴露和父親暴露,這在美國心臟病學會的胎兒心臟病科學聲明中已有闡述。在該研究中發(fā)現(xiàn)的與胎兒CHD相關的因素也已在其他類似研究中描述。

其中一個因素是妊娠早期上呼吸道感染。在2019年,Ye等[9]發(fā)表的關于母體病毒感染和胎兒冠心病風險的觀察性研究的薈萃分析表明,懷孕初期有病毒感染史的母親后代患CHD的風險顯著增加(RR=2.28),在患有風疹和巨細胞病毒的母親中更為顯著。然而,其他病毒感染與CHD無明確關系。正如我們所知,非特異性母體感染的影響難以與用于治療疾病的藥物,產婦發(fā)熱和感染的效應明確區(qū)分開來。Jenkins等報道,與母親發(fā)熱性疾病相關的心臟缺陷風險增加高達1.9倍,妊娠早期母體感染的任何心臟缺陷增加1.1倍[10]。這些研究的結果與我們的一致。本研究中未對病毒進行詳細分類。

除了母體感染外,還有報告稱母體其他慢性病與后代患有CHD風險相關,如糖尿病,高血壓,CHD,貧血,結締組織疾病,癲癇和情緒障礙與后代任何形式CHD的高發(fā)病率顯著相關。同時,調查了人群歸因于CHD的風險,表明最高的人群歸因風險是貧血(2.17%),其次是2型糖尿?。?.45%)和高血壓(0.71%)[11]。類似的結果由Liu等[12]報道。貧血是一種復雜的疾病,可能與許多因素有關,應該仔細分析以確定CHD風險的潛在原因和混雜因素的可能性,如多種維生素和葉酸補充劑或營養(yǎng)不良。與CHD相關的另一個風險因素是妊娠早期的母親精神壓力(OR=2.48~3.93),這個結果是兩個基于醫(yī)院的病例對照研究得出的[13,14]。本研究亦有此結論。雖然產婦壓力導致冠心病的生物學機制尚不清楚,但我們強烈建議加強對孕婦的心理管理,特別是在懷孕初期。本研究中發(fā)現(xiàn),自發(fā)性流產與CHD風險有關。自發(fā)流產的增加常由先天性畸形引起的。根據(jù)目前的知識無法推斷出二者因果關系,我們只是觀察到流產是嬰兒出生時CHD的預測因子,或與法洛四聯(lián)癥風險增加有關[14,15]。無論如何,這些研究結果表明應該加強對有流產史的婦女的產科保健和咨詢管理,以減少冠心病的發(fā)病率。

許多研究[4,11,12]表明母體糖尿病與CHD風險增加有關。但在本研究中沒有類似的發(fā)現(xiàn)??赡苁怯捎谖覀冎行娜巳旱倪x擇偏倚造成的,因為許多患有糖尿病的孕婦被當?shù)蒯t(yī)院轉診到我們的胎兒超聲心動圖中心,這些胎兒大多數(shù)是正常的,導致非隨機選擇的人群,并進一步影響研究結果。

父親吸煙與先天性心血管缺陷之間的相關性已有報道。有研究顯示在托兒所的許多先天性缺陷中,煙草暴露組心血管系統(tǒng)異常的發(fā)生率顯著增加[16]。2011年,一項病例對照研究[17]表明受孕期間煙草暴露與新生兒期CHD風險增加之間存在關聯(lián),并且還表明劑量效應,這需要通過大量人群來證實。不幸的是,我們的研究無法驗證這種劑量-效應關系,盡管它確實表明父親吸煙是CHD的危險因素。與受孕期間煙草暴露相關的致畸性的潛在機制仍不清楚。一個可能的原因是尼古丁和一氧化碳對胎盤功能造成損害,導致胎兒缺氧[18,19]。

對于胎兒因素,我們發(fā)現(xiàn)多胎妊娠與胎兒CHD之間存在相關性。2016年,Panagiotopoulou等進行了雙胞胎CHD的研究,結果表明單絨毛膜雙胎(OR=3.49,95%CI:1.57~7.77)是CHD的重要決定因素,獨立于母親年齡,分娩次數(shù)和后代性別[20]。在另一項研究中,與單胎相比,單絨毛膜雙胞胎患CHD風險顯著增高。這些發(fā)現(xiàn)對醫(yī)師對于多胎妊娠孕婦進行咨詢是很重要的[21]。

此外,我們根據(jù)妊娠周組進行了敏感性分析,這是一個重要的混雜因素,表明胎兒CHD的風險在妊娠周<28周的參與者中高于超過28周者,主要是因為人群的選擇偏倚,或者部分是因為胎心檢查的最佳時間是18~24周。

本研究是大樣本量研究,且首次使用貝葉斯網絡探索了與胎兒CHD相關的因素。該方法不僅顯示出與胎兒CHD明顯相關的因素,而且還呈現(xiàn)了對多因素協(xié)同作用因素的準確估計,以彌補當前研究的不足。但單本研究亦有一定的局限性,首先,數(shù)據(jù)主要來自于問卷,這意味著信息收集的準確性是一個需要考慮的問題。本研究探討了胎兒CHD的相關因素,而不僅是活產兒,本研究的結局變量是通過胎兒超聲心動圖診斷的,并沒有逐一進行出生后確診,但是基于我中心此前關于胎兒超聲心動圖與尸體解剖的對比研究,我中心胎兒超聲心動圖對于胎兒CHD的準確性很高,完全吻合率在87%左右[22]。其次,這是一項橫斷面研究,僅顯示因子與胎兒CHD之間的相關性,而非因果關系。再次,我中心是胎兒心臟病的轉診中心,來我中心的一些患者是已知危險因素的孕婦或在當?shù)蒯t(yī)院發(fā)現(xiàn)患有CHD的胎兒,這可能導致人群的選擇偏倚。最后,本研究中未考慮遺傳因素與胎兒CHD之間的關系,只關注臨床特征??紤]到上述因素,我們的研究結果需謹慎解讀,可能不適用于所有患者和所有情況。

綜上所述,貝葉斯網絡的結構學習和參數(shù)估計表明,胎兒CHD直接相關因素包括自發(fā)流產史,孕早期上呼吸道感染,貧血和孕婦精神壓力,以及胞胎數(shù)和配偶吸煙。上述因素越多,胎兒冠心病的風險越高。研究表明,應加強對上述危險因素婦女的產科保健和產前咨詢的管理,以降低冠心病的發(fā)病率。

猜你喜歡
貝葉斯網絡結構胎兒
產前超聲診斷胎兒雙主動弓1例
胎兒三維超聲科普知識
租賃房地產的多主體貝葉斯博弈研究
租賃房地產的多主體貝葉斯博弈研究
貝葉斯網絡概述
貝葉斯公式的應用和推廣
試論分布式計算機網絡結構分析與優(yōu)化
帶通信配網故障指示器故障監(jiān)測方法及安裝分析
非常規(guī)突發(fā)事件跨組織合作網絡結構演化機理研究
預測胎兒缺陷的新方法