宋周洲 張涵寓 劉釗 朱平
摘要:
高維不確定性傳播目前面臨維度災難和小樣本的問題,難以利用有限的樣本資源獲得高精度的分析結果,針對此問題,提出了一種基于監(jiān)督降維和自適應Kriging模型的高維不確定性傳播方法。利用改進充分降維方法將高維輸入投影到低維空間中,并利用Ladle估計器確定低維空間的維度。將降維投影矩陣嵌入Kriging核函數中以減少待估計超參數的數量,提高建模精度和效率。最后,創(chuàng)新性地定義了投影矩陣留一交叉驗證誤差,并基于此提出了相應的Kriging自適應采樣策略,可以有效避免模型精度在自適應采樣過程中發(fā)生較大波動。數值算例與工程案例的結果表明,相比現有方法,所提方法能夠以較少的樣本點獲得高精度不確定性傳播結果,對復雜裝備結構的不確定性分析和設計具有一定參考作用。
關鍵詞:高維不確定性傳播;監(jiān)督降維;Kriging模型;自適應采樣
中圖分類號:O212;O302;TH122
DOI:10.3969/j.issn.1004132X.2024.05.001
開放科學(資源服務)標識碼(OSID):
A High-dimensional Uncertainty Propagation Method Based on Supervised
Dimension Reduction and Adaptive Kriging Modeling
SONG Zhouzhou1,2? ZHANG Hanyu1,2? LIU Zhao3? ZHU Ping1,2
1.State Key Laboratory of Mechanical System and Vibration,Shanghai Jiao Tong University,
Shanghai,200240
2.National Engineering Research Center of Automotive Power and Intelligent Control,
Shanghai Jiao Tong University,Shanghai,200240
3.School of Design,Shanghai Jiao Tong University,Shanghai,200240
Abstract: High-dimensional uncertainty propagation currently faced the curse of dimensionality, which made it difficult to utilize the limited sampling resources to obtain high-precision uncertainty analysis results. To address this problem, a high-dimensional uncertainty propagation method was proposed based on supervised dimension reduction and adaptive Kriging modeling. The high-dimensional inputs were projected into the low-dimensional space using the improved sufficient dimension reduction method, and the dimensionality of the low-dimensional space was determined by using the Ladle estimator. The projection matrix was embedded into the Kriging kernel function to reduce the number of hyperparameters to be estimated and improve the modeling accuracy and efficiency. Finally, the leave-one-out cross-validation error of the projection matrix was innovatively defined and the corresponding Kriging adaptive sampling strategy was proposed, which might effectively avoid large fluctuations of model accuracy in the adaptive sampling processes. The results of numerical and engineering examples show that, compared with the existing methods, the proposed method may obtain high-precision uncertainty propagation results with fewer sample points, which may provide references for the uncertainty analysis and design of complex structures.
Key words: high-dimensional uncertainty propagation; supervised dimension reduction; Kriging model; adaptive sampling
收稿日期:20231222
基金項目:國家自然科學基金(52375256,12302152);上海市自然科學基金(23ZR1431600)
0? 引言
在實際中,結構或系統(tǒng)的性能會受到諸如材料屬性波動、加工誤差和隨機外載荷等眾多不確定性因素[1-3]的影響而表現出一定的隨機性。不確定性傳播旨在量化輸入不確定性如何通過系統(tǒng)傳遞到輸出[4],是不確定分析與優(yōu)化的基礎。為了降低計算量,節(jié)省時間,通常采用代理模型來代替高保真度的仿真模型進行不確定性傳播。常用的代理模型有徑向基函數[5]、支持向量機[6]、Kriging模型[7]、混沌多項式展開[8]、神經網絡[9]等。然而,大多數代理模型都存在“維度災難”的問題,也即構建高精度代理模型所需的訓練樣本數量隨著問題維度的增加而呈指數級增長[10]。對于需要昂貴的物理實驗或高保真度仿真來獲取輸出響應的復雜裝備結構,通常難以獲得大量的訓練樣本點,也就限制了代理模型乃至不確定性傳播的精度。
基于監(jiān)督降維和自適應Kriging建模的高維不確定性傳播方法研究——宋周洲? 張涵寓? 劉? 釗等
中國機械工程 第35卷 第5期 2024年5月
近年來,基于代理模型的高維不確定性傳播方法受到了國內外學者的廣泛關注。劉竟飛[11]提出一種基于貝葉斯深度學習的神經網絡方法,能處理輸入變量服從任意概率分布的高維不確定性傳播問題。ZHANG等[12]提出了一種徑向基函數網絡模型,并將其用于機器人定位精度分析。赫萬鑫[13]提出了基于貝葉斯理論的自適應稀疏多項式維度分解代理模型并用于水下航行體結構動力響應不確定性分析。Kriging模型適用性強且能提供代理模型不確定性的度量,基于降維的高維Kriging建模方法得到了較多的研究。LIU等[14]首先利用Sammon映射進行降維,然后構建低維輸入到輸出的Kriging模型。Sammon映射屬于非監(jiān)督降維,由于未能考慮到輸出的信息,所構建的代理模型精度可能不高[15],因此,一些學者將監(jiān)督降維引入代理模型建模中。BOUHLEL等[16]利用偏最小二乘回歸進行降維,并且將降維投影矩陣的元素嵌入到Kriging核函數中,相比直接在低維空間中構建的Kriging模型具有更高的精度。CONSTANTINE等[17]提出了活躍子空間降維方法并將其用于構建Kriging模型。ZHOU等[15]利用切片逆回歸方法進行監(jiān)督降維,并在訓練Kriging模型時利用降維矩陣構建了新的核函數。SONG等[18]提出一種基于改進充分降維的Kriging模型建模方法并用于高維不確定性傳播。
雖然高維Kriging模型建模方法得到了較為廣泛的研究,但現有方法通?;谝淮涡猿闃樱聪壤迷囼炘O計進行抽樣,然后利用樣本點訓練代理模型。一次性抽樣無法自適應地調整樣本在空間中的分布,所需要的樣本數量通常偏大,這會浪費一些昂貴的樣本資源。而自適應抽樣方法能根據當前代理模型提供的預測誤差信息自適應地選擇最能提升模型精度的樣本,從而減少訓練樣本數量,提高計算效率,因此,如何將自適應抽樣方法與監(jiān)督降維方法有效結合,用盡可能少的樣本構建出高精度的代理模型,對高維不確定性傳播具有重要意義。
本文針對復雜裝備結構不確定性傳播面臨的維度災難以及小樣本問題,研究了基于監(jiān)督降維的高維Kriging代理模型建模方法,提出了基于降維投影矩陣估計誤差的Kriging自適應采樣策略,建立了高維不確定性傳播分析框架,可高效獲取高精度不確定性傳播結果。
1? 基于Kriging模型的不確定性傳播
1.1? 不確定性傳播
假設結構或系統(tǒng)的輸出性能為Y,由函數Y=g(X)確定,其中X為p維輸入。不確定性傳播的目標是在給定輸入參數概率密度函數X~fX(x)(x為隨機變量X的一個具體取值)的情況下求得輸出Y的統(tǒng)計信息。常用的統(tǒng)計信息包括Y的均值[19]
μY=∫g(x)fX(x)dx(1)
和方差[19]
σ2Y=∫(g(x)-μY)2fX(x)dx(2)
以及概率密度函數Y~fY(y)(y為隨機變量Y的一個具體取值)
解析求解式(1)和式(2)中的積分是非常困難的,通常利用蒙特卡羅模擬(Monte Carlo simulation, MCS)方法來近似估計式中的積分。MCS方法首先根據fX(x)生成大量獨立同分布的輸入樣本xi(x1,x2,…,xNMCS,其中NMCS為輸入樣本數量),隨后利用計算模型獲得輸入樣本對應的響應yi(y1,y2,…,yNMCS),則μY和σ2Y可分別通過下式進行估計[4]:
μ^Y=1NMCS∑NMCSi=1yi(3)
σ^2Y=1NMCS∑NMCSi=1(yi-μ^Y)2(4)
然而,MCS方法需要大量樣本才能準確估計出Y的不確定性信息,這對復雜裝備結構而言是不可行的,因此,通常構建系統(tǒng)輸出函數g(X)的代理模型g^(X),并用計算效率高的g^(X)代替g(X)進行不確定性傳播。
1.2? Kriging模型
Kriging模型強大的表征能力以及可以給出代理模型不確定性的量化表達,使其成為了最常用的代理模型方法之一。普通Kriging模型[20]可以由下式表達:
y(x)=μ+Z(x)(5)
其中,μ為全局均值,Z(x)是一個表示局部變化的零均值高斯過程,其協(xié)方差函數可以寫為
Cov(Z(x),Z(x′))=σ2R(x,x′)(6)
式中,σ2為高斯過程的方差;R(·,·)表示相關性函數(也被稱作Kriging核函數);x′為與x不同的另一個輸入矢量。
高斯相關性函數是使用最多的一類核函數,其形式為
R(x,x′)=exp(-∑pm=1θm(xm-x′m)2)(7)
式中,θm為Kriging模型待估計的第m個超參數;xm、x′m分別為x和x′的第m個分量。
給定訓練集D={(xi,yi),i=1,2,…,N},μ和σ2可通過極大似然估計方法估計如下:
μ^=1TR-1y1TR-11
σ^2=(y-μ^1)TR-1(y-μ^1)N(8)
其中,N為構建Kriging模型的樣本點的數量;y為輸出向量,y=(y1,y2,…,yN)T;1為一個長度為N、元素均為1的向量;R為相關性矩陣,其元素為R(xi,xj)(i,j=1,2,…,N)。Kriging超參數θ={θ1,θ2,…,θp}可通過最大化中心對數似然函數獲得:
θ^=argmaxθ(-N2ln(σ^2)-12ln|R|)(9)
估計出Kriging超參數后,Kriging模型在未知點處的預測均值和預測方差可分別由下式獲得:
μ^y^(x)=μ^+rTR-1(y-μ^1)(10)
σ^2y^(x)=σ^2[1-rTR-1r+(1TR-1r-1)21TR-11](11)
r=(R(x,x1),R(x,x2),…,R(x,xN))T
2? 基于監(jiān)督降維和自適應采樣的高維不確定性傳播
2.1? 監(jiān)督降維
監(jiān)督降維的目標是求得p×d維的降維投影矩陣W,將原p維的高維輸入X投影成d維的低維輸入WTX。 監(jiān)督降維主要分為兩步:①確定低維投影的方向,也就是如何求出W的列向量;②確定低維投影的數量,也就是如何確定低維空間的維度d。
確定低維投影方向的方法有偏最小二乘回歸[21](partial least squares, PLS)、活躍子空間[17](active subspace, AS)、切片逆回歸[22](sliced inverse regression, SIR)、改進充分降維[18](improved sufficient dimension reduction, ISDR)等。PLS方法可能不適用于小樣本或輸入變量是非高斯的情形[23]。而AS方法則需要響應的梯度信息,這在實際應用中獲取難度較大。SIR方法需要對輸出數據進行切片,通常難以確定最佳切片數量,并且由于自適應采樣過程中樣本數量會動態(tài)變化,導致SIR方法的切片數量也需要動態(tài)調整,實施起來較為繁瑣。而ISDR方法不需要梯度信息,也不需要對數據進行切片,因此本文選擇ISDR方法對高維數據進行監(jiān)督降維。
ISDR屬于線性充分降維方法的一種,旨在尋找高維輸入的一個低維線性組合,該線性組合包含預測輸出所需要的全部信息。這在數學上可以描述為
YX|WTX(12)
其中,W為待估計的p×d維的投影矩陣,它將p維的高維輸入X投影到d維空間中;表示隨機變量的獨立性。式(12)的含義是,在給定低維輸入WTX的條件下,原高維輸入X與輸出Y相互獨立,也就是低維投影WTX包含了預測Y所需要的全部信息。在ISDR方法中,W可以按如下步驟計算得到[18]。
(1)對輸入數據進行標準化:
Z=Σ-1/2XX(X-E[X])(13)
式中,ΣXX為輸入數據X的協(xié)方差矩陣;E[X]為X的數學期望;Z為標準化之后的輸入數據。
(2)對矩陣M=-E[Z′ZT|Y-Y′|]進行估計,則有
M^=-1N(N-1)∑1≤i≠j≤NzizTj|yi-yj|(14)
(3)求出矩陣M^中前d大的特征值λ1≥λ2≥…≥λd所對應的特征向量ξ1,ξ2,…,ξd。
(4)求出投影矩陣:
W=Σ-1/2XX(ξ1,ξ2,…,ξd)(15)
監(jiān)督降維的另一個關鍵問題是如何確定低維空間的維度d。常用的方法為:當矩陣M中前d大的特征值之和占全部特征值之和的比例超過一閾值時(如99%),或當矩陣M的特征值圖譜在第d個特征值處有顯著變化時,將維度確定為d。但是這類方法帶有一定的主觀性,缺乏數學上的嚴謹性。另一類方法則是從1開始逐漸增大低維空間的維度,對每一個維度構建相應的代理模型,并且用交叉驗證求出代理模型的預測誤差,直至預測誤差收斂。但是這類方法需要反復構建代理模型,計算效率低。注意到低維空間維度的估計問題等價于確定矩陣M的秩,而矩陣的秩可由其特征值以及特征向量的變化情況準確估計得到,因此本文采用LUO等[24]提出的秩估計器——
Ladle估計器來估計矩陣M的秩。Ladle估計器計算方便,具有嚴格的數學定義,且LUO等[24]證明了Ladle估計器在大樣本下的收斂性質,因此本研究用它來確定低維空間的維度d。有關Ladle估計器算法的實施細節(jié)可以參考文獻[24]。
2.2? 基于監(jiān)督降維的Kriging建模方法
估計出降維投影矩陣W后,即可用其構建代理模型。由于直接將低維輸入WTX作為Kriging模型的輸入可能會造成信息損失從而導致模型預測精度偏低,因此將W的元素嵌入到Kriging相關性函數中構建一個新的核函數[18]:
RW(x,x′)=exp(-∑dl=1∑pm=1θlw2ml(xm-x′m)2)(16)
其中,wml為位于矩陣W第m行、第l列的元素,θl為第l個新Kriging核函數的超參數??芍虢稻S矩陣后,Kriging超參數的數量由式(7)中的p個減少到了式(16)中的d個,由于dp,因此利用改進后的核函數訓練Kriging模型會有更高的計算效率。
超參數θl同樣也可以通過最大化中心對數似然函數獲得。在進行超參數優(yōu)化時,式(16)中θl的取值范圍是(0,+∞)。為了提高優(yōu)化性能,可以將θl進行重參數化[25]:
θl=10φl? l=1,2,…,d(17)
重參數化后的超參數φl的取值范圍為全體實數。本文利用有限內存Broyden-Fletcher-Goldfarb-
Shanno(BFGS)優(yōu)化算法[26]來對φl進行優(yōu)化。
2.3? 自適應采樣策略
有了高維Kriging模型建模方法后,就可將其與自適應采樣相結合來進一步減少訓練模型所需的樣本量。目前已有許多面向全局Kriging建模的自適應采樣策略,但是面向高維Kriging模型的自適應采樣方法還不多見。由于基于監(jiān)督降維的Kriging建模方法引入了降維矩陣W,因此W的估計精度會直接影響到Kriging模型的精度。直觀上看,可以選取對W估計精度影響最大的樣本點作為新增樣本點。類似于代理模型的留一交叉驗證誤差,可以定義投影矩陣在訓練集中每一個樣本點處的留一估計誤差為
e(W)LOO(xi)=‖W-W-i‖F? i=1,2,…,N(18)
其中,W為利用訓練集D={(xi,yi),i=1,2,…,N}中所有樣本點估計得到的投影矩陣,W-i為將樣本點(xi,yi)從D中剔除后估計得到的投影矩陣,‖·‖F表示矩陣的Frobenius范數。e(W)LOO(xi)越大,表明xi對投影矩陣估計精度的影響越大,則在xi附近選擇新增樣本點就有更大可能提高W的估計精度,因此可選擇在具有最大e(W)LOO的樣本點x*附近進行采樣,x*由下式確定:
x*=argmaxx∈{x1,x2,…,xN}e(W)LOO(xi)(19)
這里參照LIU等[27]的工作,利用歐氏距離來定義“鄰近”關系,即如果未知點x到x*的歐氏距離小于x到訓練集中其他任意點的歐氏距離,則認為x是x*附近的點。
由于輸入空間中位于x*附近的點有無窮多個,故為了簡化采樣流程,通常根據輸入參數的不確定性分布,利用MCS方法獲得一個大樣本集S(樣本數量通常為105及以上),并用該樣本集中的點來代替整個輸入空間,因此,在確定具有最大e(W)LOO的x*后,直接從大樣本集S中找到x*附近的點,記為S*:
S*={x∈S|‖x-x*‖2≤‖x-xi‖2,xi≠x*}(20)
隨后從S*中選擇具有最大Kriging預測方差的點作為新增樣本點,其表達式如下:
xnew=argmaxx∈S*(σ^2y^(x))(21)
值得指出的是,之所以這里從S*而不是整個輸入空間S中選擇具有最大預測方差的點,是因為這可以保證在相鄰兩次自適應采樣中,投影矩陣W不至于發(fā)生很大的波動進而導致Kriging模型精度產生大幅變動,本文第3節(jié)將結合算例結果對此問題進行更深入的討論。
2.4? 算法流程
本文所提出的基于監(jiān)督降維和自適應采樣的高維不確定性傳播流程如圖1所示,其主要步驟如下:
(1)利用MCS方法獲得輸入空間的大樣本集S,利用最優(yōu)拉丁超立方抽樣獲得初始輸入樣本點并利用高保真度有限元仿真獲得相應的輸出,形成訓練集D。
(2)對訓練集D中的數據進行改進充分降維,獲得降維投影矩陣W,將W嵌入Kriging核函數后訓練得到高維Kriging代理模型。
(3)判斷新增樣本點是否達到規(guī)定值,若是,則跳轉至步驟(5),若不是,則跳轉至步驟(4)。
(4)進行自適應采樣。首先根據式(19)確定具有最大投影矩陣估計誤差的樣本點x*;再根據式(20)從S中選擇出x*附近的樣本點形成集合S*;隨后根據式(21)確定新增樣本點xnew;最后利用高保真度仿真模型獲取新樣本點對應的響應ynew,并更新訓練集D=D∪(xnew,ynew),且跳轉至步驟(2)。
(5)結束自適應采樣,并獲得高維Kriging模型。
(6)利用構建好的高維Kriging模型進行不確定性傳播。
3? 算例與應用研究
3.1? 導熱問題不確定性傳播
本算例是一個二維矩形區(qū)域中的熱傳導問題[28]。如圖2所示,所考察的區(qū)域為C=(-0.5,0.5)m×(-0.5,0.5)m。區(qū)域D的上邊界溫度恒定為0 ℃,并且C的初始溫度也為0 ℃。C的左、下、右邊界分別有恒定的熱流H1、H2、H3流入(熱流密度的符號以流入區(qū)域C為正)。C內有一熱源A=(0.2,0.3)m×(0.2,0.3)m以恒定功率Q向外釋放熱量。受材料分布的場不確定性的影響,區(qū)域C的熱導率κ(z)用一個對數正態(tài)隨機場來描述,其表達式如下:
κ(z)=exp(aκ+bκg(z))(22)
其中,aκ、bκ為參數,z為區(qū)域中某點的坐標,g(z)表示一個標準高斯隨機場,其自相關函數為
ρ(z1,z2)=exp(-‖z1-z2‖20.04)(23)
式(22)中aκ、bκ的取值使κ(z)的均值和標準差分別為μκ=1 W/(m·K)以及σκ=0.3 W/(m·K)。本算例所考察的輸出為區(qū)域B=(-0.2,-0.3)m×(-0.2,-0.3)m在熱流傳導1 s后的平均溫度,其表達式如下:
Y=1|B|∫z∈BT(z,t=1)dz(24)
其中,T(z,t)表示坐標為z的點在t時刻的溫度,Y由有限元分析方法求出。表1給出了導熱問題隨機參數的信息。隨機場g(z)利用最優(yōu)線性估計展開[29]離散為53個隨機變量,即
g(z)=∑53i=1ξiλiφTicg(z)(25)
以確保截斷誤差小于1%。其中,ξi為相互獨立的標準正態(tài)變量,λi、φi分別為隨機場協(xié)方差矩陣的特征值和特征向量,cg(z)為協(xié)方差向量。在本算例中,由于隨機場κ(z)被離散成53個隨機變量,再加上表1中的4個隨機參數,本問題是一個57維的高維問題。
首先比較了利用不同方法構建的代理模型建模誤差,這里利用歸一化的均方根誤差(normalized root mean square error, NRMSE)來量化模型誤差:
VNRMSE=1Ntest∑Ntesti=1(yi-y^iyi)2(26)
式中,Ntest為測試集樣本數量;yi為響應的真實值;y^i為代理模型的預測值。
利用MCS方法額外生成1000個樣本作為測試集。所有方法運行10次后的箱線圖見圖3,其中OK代表普通Kriging模型;A-OK代表自適應普通Kriging建模方法,自適應采樣策略為最大化期望預測誤差[27];KISDR代表基于改進充分降維的Kriging建模方法;A-KISDR代表基于最大化期望預測誤差[27]采樣準則的改進充分降維Kriging建模方法;A-KISDR-W則是本文所提出的方法。OK和KISDR方法的訓練集的樣本數量為150,A-OK、A-KISDR和A-KISDR-W方法的初始訓練集樣本數量為100,隨后利用自適應采樣的新增樣本數量為50,以保證最后所有方法的訓練樣本數量一致。從圖3中可以看出,OK方法和A-OK方法的建模精度相差不大,這說明對于高維問題,如果不引入降維技術,則自適應采樣相比一次性采樣并沒有明顯優(yōu)勢。對于KISDR、A-KISDR和A-KISDR-W這三種基于降維的方法,自適應采樣方法(A-KISDR-W和A-KISDR)的建模精度和穩(wěn)定性優(yōu)于一次性采樣方法(KISDR),并且基于投影矩陣估計誤差方法(A-KISDR-W)的建模精度比傳統(tǒng)自適應采樣策略(A-KISDR)的建模精度更高,這說明了本文所提方法的優(yōu)勢。
圖4給出了A-OK、A-KISDR和A-KISDR-W這三種自適應采樣方法預測誤差的迭代曲線,可以看出,A-KISDR方法相比于A-OK方法,誤差下降速度總體上更快。相比于A-KISDR方法,A-KISDR-W方法在迭代過程中的波動更小。這是因為A-KISDR-W方法每次選擇在投影矩陣估計誤差最大的區(qū)域內進行采樣,能夠有效防止投影矩陣出現較大波動,從而避免代理模型精度出現大的波動。
圖5給出了不同方法預測得到的區(qū)域B平均溫度的概率密度函數,概率密度函數是根據MCS方法生成的105個樣本點利用核密度估計得到的。由圖5可以看出,本文提出的A-KISDR-W方法估計得到的概率密度曲線與真實的概率密度曲線最為接近,這驗證了所提方法在高維不確定性傳播上的優(yōu)勢。
3.2? 異種材料膠鉚混合連接結構不確定性傳播
本算例考察的是碳纖維增強復合材料與鋁合金膠鉚混合連接結構準靜態(tài)拉伸強度的不確定性傳播。異種材料膠鉚混合連接結構結合了兩種優(yōu)異輕質高強材料,通過膠接、鉆孔、鉚接的工序制成,在新能源汽車輕量化中具有良好的應用前景。由于汽車上大部分的結構失效發(fā)生在連接位置,因此連接性能對車身強度、彎扭剛度、疲勞耐久等性能有重大影響。圖6給出了膠鉚混合連接結構的示意圖。
由于膠鉚連接結構屬于多材料多工藝連接結構,影響其力學性能的參數也非常多,如圖7所示,既包括四種材料(碳纖維復合材料、膠、不銹鋼鉚釘、鋁合金)的力學性能參數,又包括膠接、鉆孔、鉚接等工藝參數,以及結構的幾何參數等,因此,膠鉚連接結構性能的不確定性傳播屬于典型的高維問題。本文主要考察連接結構的30個不確定性參數對結構的準靜態(tài)拉伸強度不確定性的影響,30個參數的不確定性分布信息可參考ZHANG等[30]的工作。這里利用經過試驗驗證的高保真度有限元仿真模型[31]來獲得結構的強度,由于仿真模型非常耗時,因此需要利用本文所提方法構建出結構強度的代理模型。
表2列出了采用不同方法所構建的代理模型的預測誤差,其中OK和KISDR方法的訓練集樣本數量為150,A-OK、A-KISDR和A-KISDR-W方法的初始訓練集樣本數量為100,隨后利用自適應采樣新增50個樣本。利用拉丁超立方抽樣額外生成100個樣本作為測試集。從表2中可以看出,基于降維的方法的建模精度高于普通Kriging方法的建模精度,自適應采樣方法的建模精度高于一次性采樣方法的建模精度。同時,本文所提出的采樣策略相比傳統(tǒng)的自適應采樣策略具有更高的建模精度。
圖8給出了A-OK、A-KISDR和A-KISDR-W這三種自適應采樣方法預測誤差的迭代曲線,可以看出,A-OK方法在此問題中精度波動非常大,這可能是由于普通Kriging方法在樣本量較小時建模精度不穩(wěn)定導致的。而A-KISDR和A-KISDR-W方法相對來說波動較小,也說明了基于降維的Kriging模型在小樣本時也可以獲得較為精確和穩(wěn)定的代理模型。相比于A-KISDR方法,A-KISDR-W方法在迭代過程中的波動更小。這說明所提方法能夠有效防止投影矩陣出現較大波動,從而避免代理模型精度出現大的波動。圖9給出了不同方法預測得到的膠鉚連接結構強度的概率密度函數,概率密度函數是根據MCS方法生成的105個樣本點利用核密度估計得到的。雖然不同方法預測得到的概率密度函數有細微區(qū)別,但都近似服從于正態(tài)分布。
4? 結論
本文針對基于代理模型的高維不確定性傳播中面臨的維度災難問題,提出了一種基于改進充分降維和自適應Kriging建模的高維不確定性傳播方法,可以較少的樣本量獲得高精度不確定性傳播結果。所獲得的結論如下:
(1)利用改進充分降維對高維輸入進行降維,不需要響應的梯度信息,也不需要對數據進行切片,簡單易行,適用范圍廣。
(2)利用具有嚴格數學定義的Ladle估計器對低維輸入空間的維度進行估計,既提高了維度估計的效率,又能確保結果穩(wěn)定可靠。
(3)本文創(chuàng)新性地提出了基于投影矩陣留一估計誤差的自適應采樣策略,數值算例和工程應用結果表明,所提出的策略相比傳統(tǒng)的Kriging自適應采樣策略在迭代過程中精度波動更小,并且在新增樣本數量相同時,能獲得更高精度的Kriging模型。
所提方法對復雜裝備結構的不確定性分析和設計具有一定參考。
參考文獻:
[1]? 許燦. 面向復雜產品穩(wěn)健可靠性的多層次系統(tǒng)不確定性分析與優(yōu)化設計方法研究[D]. 上海:上海交通大學, 2021.
XU Can. Research on Uncertainty Analysis and Uncertainty-based Design Optimization of Multilevel Systems for Robustness and Reliability of Complex Products[D]. Shanghai:Shanghai Jiao Tong University, 2021.
[2]? 蔣琛, 邱浩波, 高亮. 隨機不確定性下的可靠性設計優(yōu)化研究進展[J]. 中國機械工程, 2020, 31(2): 190-205.
JIANG Chen, QIU Haobo, GAO Liang. Research Progresses in Reliability-based Design Optimization under Aleatory Uncertainties[J]. China Mechanical Engineering, 2020, 31(2): 190-205.
[3]? 高進, 崔海冰, 樊濤,等. 一種基于自適應Kriging集成模型的結構可靠性分析方法[J]. 中國機械工程, 2024, 35(1): 83-92.
GAO Jin, CUI Haibing, FAN Tao, et al. A Structural Reliability Calculation Method Based on Adaptive Kriging Ensemble Model[J]. China Mechanical Engineering, 2024, 35(1): 83-92.
[4]? LEE S H, CHEN W. A Comparative Study of Uncertainty Propagation Methods for Black-box-type Problems[J]. Structural and Multidisciplinary Optimization, 2009, 37: 239-253.
[5]? GUTMANN H M. A Radial Basis Function Method for Global Optimization[J]. Journal of Global Optimization, 2001, 19: 201-227.
[6]? SMOLA A J, SCHLKOPF B. A Tutorial on Support Vector Regression[J]. Statistics and Computing, 2004, 14: 199-222.
[7]? RASMUSSEN C E, WILLIAMS C K. Gaussian Processes for Machine Learning[M]. Cambridge: MIT Press, 2006.
[8]? XIU D, KARNIADAKIS G E. The Wiener-Askey Polynomial Chaos for Stochastic Differential Equations[J]. SIAM Journal on Scientific Computing, 2002, 24: 619-644.
[9]? BISHOP C M. Neural Networks for Pattern Recognition[M]. New York: Oxford University Press, 1995.
[10]? SHAN S, WANG G G. Metamodeling for High Dimensional Simulation-based Design Problems[J]. Journal of Mechanical Design, 2010, 132: 051009.
[11]? 劉竟飛. 基于貝葉斯深度學習的高維不確定性傳播方法研究[D]. 長沙:湖南大學, 2021.
LIU Jingfei. Study of Uncertainty Propagation Method via Bayesian Deep Learning for High Dimensional Problems[D]. Changsha:Hunan University, 2021.
[12]? ZHANG D, ZHANG N, YE N, et al. Hybrid Learning Algorithm of Radial Basis Function Networks for Reliability Analysis[J]. IEEE Transactions on Reliability, 2021, 70: 887-900.
[13]? 赫萬鑫. 基于高維模型表征的隨機不確定性分析高效算法研究[D]. 大連:大連理工大學, 2021.
HE Wanxin. Efficient Stochastic Uncertainty Analysis Algorithms Based on High-dimensional Model Representation[D]. Dalian: Dalian University of Technology, 2021.
[14]? LIU B, ZHANG Q, GIELEN G G E. A Gaussian Process Surrogate Model Assisted Evolutionary Algorithm for Medium Scale Expensive Optimization Problems[J]. IEEE Transactions on Evolutionary Computation, 2014, 18: 180-192.
[15]? ZHOU Y, LU Z. An Enhanced Kriging Surrogate Modeling Technique for High-dimensional Problems[J]. Mechanical Systems and Signal Processing, 2020, 140: 106687.
[16]? BOUHLEL M A, BARTOLI N, OTSMANE A, et al. Improving Kriging Surrogates of High-dimensional Design Models by Partial Least Squares Dimension Reduction[J]. Structural and Multidisciplinary Optimization, 2016, 53: 935-952.
[17]? CONSTANTINE P G, DOW E, WANG Q. Active Subspace Methods in Theory and Practice: Applications to Kriging Surfaces[J]. SIAM Journal on Scientific Computing, 2014, 36: A1500-A1524.
[18]? SONG Z, LIU Z, ZHANG H, et al. An Improved Sufficient Dimension Reduction-based Kriging Modeling Method for High-dimensional Evaluation-expensive Problems[J]. Computer Methods in Applied Mechanics and Engineering, 2024, 418: 116544.
[19]? TRIPATHY R, BILIONIS I, GONZALEZ M. Gaussian Processes with Built-in Dimensionality Reduction: Applications to High-dimensional Uncertainty Propagation[J]. Journal of Computational Physics, 2016, 321:191-223.
[20]? KLEIJNEN J P C. Kriging Metamodeling in Simulation:a Review[J]. European Journal of Operational Research, 2009, 192:707-716.
[21]? HELLAND I S. On the Structure of Partial Least Squares Regression[J]. Communications in Statistics-simulation and Computation, 1988, 17:581-607.
[22]? LI K C. Sliced Inverse Regression for Dimension Reduction[J]. Journal of the American Statistical Association, 1991, 86:316-327.
[23]? GOODHUE D L, LEWIS W, THOMPSON R. Does PLS Have Advantages for Small Sample Size or Non-normal Data?[J]. MIS Quarterly, 2012, 36:981-1001.
[24]? LUO W, LI B. Combining Eigenvalues and Variation of Eigenvectors for Order Determination[J]. Biometrika, 2016, 103:875-887.
[25]? MACDONALD B, RANJAN P, CHIPMAN H. GPfit:an R Package for Fitting a Gaussian Process Model to Deterministic Simulator Outputs[J]. Journal of Statistical Software, 2015, 64:1-23.
[26]? LIU D C, NOCEDAL J. On the Limited Memory BFGS Method for Large Scale Optimization[J]. Mathematical Programming, 1989, 45:503-528.
[27]? LIU H, CAI J, ONG Y S. An Adaptive Sampling Approach for Kriging Metamodeling by Maximizing Expected Prediction Error[J]. Computers & Chemical Engineering, 2017, 106:171-182.
[28]? KONAKLI K, SUDRET B. Polynomial Meta-models with Canonical Low-rank Approximations:Numerical Insights and Comparison to Sparse Polynomial Chaos Expansions[J]. Journal of Computational Physics, 2016, 321:1144-1169.
[29]? LI C C, DER KIUREGHIAN A. Optimal Discretization of Random Fields[J]. Journal of Engineering Mechanics, 1993, 119:1136-1154.
[30]? ZHANG H, ZHANG L, XU C, et al. Global Sensitivity Analysis of Mechanical Properties in Hybrid Single Lap Aluminum-CFRP (Plain Woven) Joints Based on Uncertainty Quantification[J]. Composite Structures, 2022, 280:114841.
[31]? ZHANG H, ZHANG L, LIU Z, et al. Research in Failure Behaviors of Hybrid Single Lap Aluminum-CFRP(Plain Woven) Joints[J]. Thin-Walled Structures, 2021, 161:107488.
(編輯? 胡佳慧)
作者簡介:
宋周洲,男,1998年生,博士研究生。研究方向主要為不確定性分析、可靠性設計等。E-mail:zhouzsong@sjtu.edu.cn。
朱? 平(通信作者),男,1966年生,教授、博士研究生導師。研究方向主要為輕量化設計與制造、汽車安全性與可靠性、大數據與數字孿生等。E-mail:pzhu@sjtu.edu.cn。