李 揚(yáng) 趙 鋒 劉先斌 ,*
1 南京理工大學(xué)自動(dòng)化學(xué)院, 南京 210094
2 南京航空航天大學(xué)機(jī)械結(jié)構(gòu)力學(xué)及控制國(guó)家重點(diǎn)實(shí)驗(yàn)室, 南京 210016
與非線性一樣, 隨機(jī)性也是客觀世界的本質(zhì)屬性. 客觀世界豐富多彩的復(fù)雜現(xiàn)象, 其成因通常是源于系統(tǒng)內(nèi)稟的非線性、隨機(jī)性及其之間的相互作用. 由于噪聲樣本的多樣性及不確定性,受隨機(jī)擾動(dòng)的非線性系統(tǒng)所呈現(xiàn)的與原確定性系統(tǒng)截然不同的復(fù)雜且有趣的隨機(jī)動(dòng)力學(xué)行為一直是人們關(guān)注的焦點(diǎn)! 而其中, 受弱噪聲擾動(dòng)的系統(tǒng)動(dòng)力學(xué)行為則更為有趣: 對(duì)于未受擾系統(tǒng)與受擾系統(tǒng), 一方面, 在噪聲充分弱的前提下, 人們會(huì)自然期待后者行為與前者充分接近 (依概率、概率1、均方意義等); 另一方面, 前者是確定性的, 其動(dòng)力學(xué)行為由初始條件唯一確定, 而弱噪聲是否會(huì)導(dǎo)致后者長(zhǎng)期的隨機(jī)動(dòng)力學(xué)行為完全不同則更值得關(guān)注! 對(duì)此, 大偏差原理及其與之密切相關(guān)的離出問題研究給出了一個(gè)很好的回答. 與大數(shù)定律 (law of large numbers) 和中心極限定理 (central limit theorem) 不同, 這兩者只關(guān)心大概率事件及其極限行為, “大偏差理論 (large deviation theory)” (Freidlin & Wentzell 2012) 則試圖揭示“非線性隨機(jī)系統(tǒng)中最初的小概率事件經(jīng)長(zhǎng)時(shí)間演化可成為大概率事件” 的機(jī)理. 這是因?yàn)槭芪_系統(tǒng)行為對(duì)未受擾系統(tǒng)行為的大偏差在有限的時(shí)間內(nèi)是小概率事件. 大偏差現(xiàn)象產(chǎn)生的原因在于, 概率理論中, 所謂一個(gè)“弱”隨機(jī)擾動(dòng), 指的是其統(tǒng)計(jì)意義, 即: 擾動(dòng)幅值很小的概率很大, 擾動(dòng)幅值很大的概率很小, 且擾動(dòng)的均值很小 (陳朕 2018).
數(shù)學(xué)上,粗略地說,大偏差理論源于一個(gè)事實(shí):一族由實(shí)參數(shù)化的概率測(cè)度對(duì)于可測(cè)事件的估值呈現(xiàn)參數(shù)的指數(shù)變化率. 理論起源可追溯到北歐的精算師對(duì)保險(xiǎn)行業(yè)風(fēng)險(xiǎn)估計(jì)研究——Cramér (1944) 的關(guān)于獨(dú)立隨機(jī)變量和一般的大偏差結(jié)果. Sanov (1957) 推導(dǎo)了獨(dú)立同分布隨機(jī)變量的經(jīng)驗(yàn)分布. 隨后, Donsker 和Varadhan (1975a, 1975b, 1976, 1983), G?rtner (1977) 將其推廣至一般的Markov 鏈和Markov 過程. 而動(dòng)力系統(tǒng)受弱隨機(jī)擾動(dòng)所產(chǎn)生的樣本路徑大偏差的結(jié)果最初由Varadhan (1967)、Ventsel 和Freidlin (1970)、Freidlin 和Wentzell (2012) 給出. 上述研究均基于一種廣義Cramér 變換, 即通過選取參考測(cè)度, 使其對(duì)于所考察的事件具有大的概率測(cè)度,然后對(duì)于所考察的概率族建立關(guān)于參考測(cè)度的Radon-Nikodym 導(dǎo)數(shù), 并進(jìn)行估值 (Freidlin &Wentzell 2012; Wentzell 2012; Varadhan 1984, 2016; Deuschel & Stroock 2001; Dembo & Zeitouni 1998; Feng & Kurtz 2006). 20 世紀(jì)90 年代, Puhalskii, O’Brien 和Vervaat, Acosta 等通過類似于“基于Prohorov 緊性證明一族概率測(cè)度弱收斂”的方法, 將大偏差理論推廣至樣本路徑左連續(xù)且具有右極限的隨機(jī)過程類 (Varadhan 1984, 2016; Deuschel & Stroock 2001; Dembo & Zeitouni 1998; Feng & Kurtz 2006).
在隨機(jī)動(dòng)力系統(tǒng)中, 噪聲誘導(dǎo)的大偏差現(xiàn)象會(huì)導(dǎo)致系統(tǒng)遠(yuǎn)離平衡態(tài)的復(fù)雜動(dòng)力學(xué)行為, 即從穩(wěn)態(tài)的吸引域中的離出現(xiàn)象. 離出現(xiàn)象是噪聲誘導(dǎo)的非線性系統(tǒng)的全局動(dòng)力學(xué)行為, 是非線性隨機(jī)系統(tǒng)所特有的復(fù)雜現(xiàn)象! 在弱隨機(jī)擾動(dòng)下, 即使一個(gè)結(jié)構(gòu)穩(wěn)定的動(dòng)力系統(tǒng), 其受擾后的軌線可與未擾系統(tǒng)軌線之間產(chǎn)生大偏差并因此失去“結(jié)構(gòu)穩(wěn)定性” ! 一個(gè)即使只有漸近穩(wěn)定平衡點(diǎn)的動(dòng)力系統(tǒng), 在非常弱的隨機(jī)擾動(dòng)下, 其長(zhǎng)期作用的累積效應(yīng)可使其樣本軌線具有從吸引域中概率1的離出概率且可以到達(dá)任何有界的區(qū)域 (朱金杰等 2020, 劉先斌等 1996). 數(shù)學(xué)嚴(yán)格意義上, 反映確定性動(dòng)力系統(tǒng)長(zhǎng)期行為的非游蕩點(diǎn)集、平衡點(diǎn)和極限環(huán)的穩(wěn)定性、全局結(jié)構(gòu)等概念已不再適用于隨機(jī)系統(tǒng), 因?yàn)榇藭r(shí)相空間結(jié)構(gòu)可能已面目全非. 而對(duì)系統(tǒng)隨機(jī)動(dòng)力學(xué)行為“如何偏差”以及“偏差發(fā)生的統(tǒng)計(jì)特征”等問題的探索便自然成為大偏差理論研究意義之所在 (Freidlin &Wentzell 2012, 朱金杰等 2020, 李揚(yáng) 2021).
在離出問題中, 最優(yōu)離出路徑 (optimal exit path) 或稱最大可能離出路徑 (most probable exit path, MPEP)、平均首次離出時(shí)間 (mean first passage time, MFPT) 和離出位置分布 (exit location distribution, ELD) 是刻畫系統(tǒng)“怎樣離出” “何時(shí)離出”和“從哪離出”的三個(gè)重要的特征量,對(duì)它們的計(jì)算和分析一直是隨機(jī)動(dòng)力學(xué)領(lǐng)域的核心問題. Freidlin 和Wentzell (2012) 建立的大偏差理論從數(shù)學(xué)上為這個(gè)問題的解答提供了理論基礎(chǔ), 其核心思想在于, 定義了作用量泛函 (action functional) 的概念, 導(dǎo)出了軌道鄰域小管道的概率的指數(shù)估計(jì)式, 從而將稀有事件的概率計(jì)算問題轉(zhuǎn)化為泛函的變分問題. 基于經(jīng)典力學(xué)的結(jié)果, 推導(dǎo)了最優(yōu)離出路徑滿足的歐拉-拉朗格朗日方程 (Euler-Lagrange equation), 通過定義作用量泛函最小值為擬勢(shì) (quasi-potential), 同時(shí)證明了平均離出時(shí)間和離出位置分布與擬勢(shì)的指數(shù)關(guān)系.
對(duì)于Markov 過程, MFPT 是停時(shí) (stopping time) (Freidlin & Wentzell 2012, Bernt 2010)的均值. 它在諸多學(xué)科領(lǐng)域中都有其實(shí)際的應(yīng)用價(jià)值, 如動(dòng)力系統(tǒng)中衡量吸引子之間的相對(duì)穩(wěn)定性(K?osek-Dygas et al. 1988)、神經(jīng)元自發(fā)性放電現(xiàn)象的峰峰間期 (interspike interval) (朱金杰2018, Ryashko 2018)、工程領(lǐng)域中結(jié)構(gòu)的可靠性分析 (Chen & Zhu 2009, 2010)、生物學(xué)中基因的轉(zhuǎn)錄與翻譯 (Bressloff 2017) 等. 針對(duì)MFPT 的研究由來已久, 最早可以追溯到20 世紀(jì)40 年代,Kramers (1940) 研究了朗之萬(wàn)方程 (Langevin equations) 的離出問題, 發(fā)現(xiàn)MFPT 與噪聲強(qiáng)度的指數(shù)依賴關(guān)系. 針對(duì)擬可積哈密頓系統(tǒng), 朱位秋等 (1992, 2017) 利用隨機(jī)平均法研究了首次穿越時(shí)間和首次穿越失效的問題, 并以此刻畫系統(tǒng)的可靠性. 此外, 胞映射作為一種有效的全局動(dòng)力學(xué)行為分析方法, 也是計(jì)算MFPT 的有效數(shù)值工具 (徐偉等 2013). 另外, 許多研究者發(fā)現(xiàn), 當(dāng)MFPT 與系統(tǒng)內(nèi)稟的或外在的時(shí)間尺度匹配時(shí), 系統(tǒng)會(huì)產(chǎn)生類似于共振的行為, 如隨機(jī)共振和自誘導(dǎo)隨機(jī)共振等現(xiàn)象, 在機(jī)械系統(tǒng)和醫(yī)學(xué)等領(lǐng)域都有重要的應(yīng)用 (Kang et al. 2017, Zhang et al.2021, 王煒 2020, 顏志2021).
對(duì)于受高斯白噪聲擾動(dòng)的非線性系統(tǒng), MFPT 方程v(x)=Exτ滿足如下Pontryagin 方程 (狄利克雷邊值問題) (Bernt 2010, Duan 2015)
其中A為生成元 (即Fokker-Planck 算子的伴隨算子),D為待離出區(qū)域. 利用奇異攝動(dòng)法和特征線法, Matkowsky 和Schuss 等 (1982, 1983, ) 及Naeh 等(1990)解析近似計(jì)算了在特征邊界 (characteristic boundary) 和非特征邊界 (non-characteristic boundary) 條件下的MFPT 漸進(jìn)展開式. 基于van der Pol 變換、奇異攝動(dòng)法和隨機(jī)平均法, 孔琛和劉先斌 (2014) 計(jì)算了一類分段線性系統(tǒng)的MFPT, 發(fā)現(xiàn)分形邊界會(huì)造成理論與數(shù)值結(jié)果的偏差. 之后, Kong 和Liu (2017) 利用廣義圖胞映射方法進(jìn)行全局動(dòng)力學(xué)分析以及結(jié)合隨機(jī)平均法降維, 研究了受弱高斯白噪聲擾動(dòng)的分段線性系統(tǒng)的噪聲誘導(dǎo)的混沌現(xiàn)象, 發(fā)現(xiàn)MFPT 可以作為“噪聲誘導(dǎo)混沌”的指示器.
離出位置分布刻畫了系統(tǒng)跨越邊界時(shí)在邊界上的離出點(diǎn)的分布情況, 同樣是一個(gè)重要的物理量.對(duì)任意的連續(xù)函數(shù)f(x),函數(shù)u(x)=f(y)pe(x,y)dSy(pe(x,y)為離出位置分布) 滿足方程
在弱高斯噪聲條件下, Matkowsky 和Schuss 等 (1982, 1983,) 及Naeh 等(1990)利用奇異攝動(dòng)法推導(dǎo)了離出位置分布的解析近似表達(dá)式. 針對(duì)高斯白噪聲擾動(dòng)的FitzHugh-Nagumo 系統(tǒng),Chen 等 (2017) 發(fā)現(xiàn)模擬軌道離出位置與邊界擬勢(shì)最低點(diǎn)的偏差, 即鞍點(diǎn)回避現(xiàn)象(saddle point avoidance), 本質(zhì)上來源于有限噪聲強(qiáng)度的影響. 對(duì)于另一個(gè)可激系統(tǒng), Li 等 (2020b) 同樣揭示了鞍點(diǎn)回避現(xiàn)象, 并利用WKB 近似攝動(dòng)計(jì)算了離出位置分布, 發(fā)現(xiàn)一階修正能夠彌補(bǔ)這個(gè)偏差.由于方程 (2) 的求解較為困難, 許多研究者設(shè)計(jì)了一系列計(jì)算離出位置分布的數(shù)值方法. 例如, 廣義胞映射方法作為分析非線性系統(tǒng)全局動(dòng)力學(xué)結(jié)構(gòu)的有效工具, 同樣能夠用來計(jì)算離出位置分布 (Han et al. 2016). Zhu 等 (2018) 綜合了正向通量采樣 (forward flux sampling) (Allen et al.2005) 和快速M(fèi)onte Carlo 模擬方法的優(yōu)點(diǎn), 提出了概率演化算法 (probability evolution method),能使用模擬方法快速得到離出位置分布.
最優(yōu)離出路徑的計(jì)算是最后也是最難的問題, 它旨在刻畫離出發(fā)生的內(nèi)在機(jī)理, 具有結(jié)構(gòu)性的難度, 是大偏差理論的核心問題. 基于作用量泛函的變分, 最優(yōu)離出路徑滿足歐拉-拉格朗日方程或?qū)?yīng)的哈密頓系統(tǒng). 此時(shí), 哈密頓相空間相對(duì)于原確定性相空間擴(kuò)展一倍. 若考慮具有穩(wěn)定不動(dòng)點(diǎn)的二維系統(tǒng), 則確定性相空間作為不動(dòng)點(diǎn)的二維穩(wěn)定流形嵌入到四維拓展哈密頓相空間中. 由于噪聲的加入, 不動(dòng)點(diǎn)多出兩個(gè)不穩(wěn)定方向, 張成了二維不穩(wěn)定流形, 即拉格朗日流形(Lagrangian manifold), 此流形到確定性相空間的投影構(gòu)成離出路徑的圖案. 由于最優(yōu)離出路徑的解析計(jì)算比較困難, 眾多研究者發(fā)展了大量的數(shù)值方法, 如action plot (Beri et al. 2005)、幾何最小作用量方法 (geometric minimum action method, GMAM) (Heymann & Vanden-Eijnden 2008)、有序逆風(fēng)法 (ordered upwind method, OUM) (Cameron 2012)、歷程概率分布 (prehistory probability distribution) (Dykman et al. 1992) 和機(jī)器學(xué)習(xí) (Machine Learning) (Li et al. 2021a) 等方法.
一般情況下, 若終點(diǎn)坐標(biāo)在相空間中連續(xù)變化, 人們自然認(rèn)為連接始末端點(diǎn)的最優(yōu)路徑也隨之連續(xù)變化. 然而, 對(duì)于非平衡態(tài)系統(tǒng), 情況卻未必如此. Chen 和Liu (2016) 通過對(duì)周期激勵(lì)雙勢(shì)阱系統(tǒng)的離出問題的研究, 發(fā)現(xiàn)最優(yōu)路徑可能隨著終點(diǎn)的變化發(fā)生突變, 出現(xiàn)這種現(xiàn)象的根本原因在于拉格朗日流形出現(xiàn)折疊結(jié)構(gòu), 導(dǎo)致泛函極值的多值性和離出軌跡圖案的奇異性. 在折疊的邊緣——焦散線 (caustic) 處, 擬勢(shì)的二階導(dǎo)數(shù)發(fā)散, WKB 近似指數(shù)前因子也因此發(fā)散 (孔琛2018). 在折疊區(qū)域有一條明顯的切換線 (switching line), 切換線兩側(cè)即使相距很近的兩個(gè)點(diǎn), 會(huì)有兩條拓?fù)湫再|(zhì)完全不同的最優(yōu)路徑到達(dá). 在切換線上, 擬勢(shì)不可微. Chen 等 (2019) 研究了Type-I 和Type-II 可激性條件下的Morris-Lecar 系統(tǒng), 揭示了擬勢(shì)的非可微性、最優(yōu)路徑的非光滑性和拉格朗日流形的奇異性的聯(lián)系, 同時(shí)發(fā)現(xiàn)最優(yōu)路徑滿足的非光滑向量場(chǎng)會(huì)出現(xiàn)閉軌, 本質(zhì)上是非光滑系統(tǒng)的擦切分岔所產(chǎn)生的擦切環(huán), 或由滑移分岔產(chǎn)生的滑移環(huán).
另外, 離出問題中某些奇異現(xiàn)象的出現(xiàn)來源于動(dòng)力系統(tǒng)本身的復(fù)雜結(jié)構(gòu), 如混沌現(xiàn)象和分形邊界等. 針對(duì)非雙曲混沌吸引子的離出問題, 最新研究 (Chen et al. 2016) 發(fā)現(xiàn)其離出過程是沿著一個(gè)異宿軌道的交叉層次結(jié)構(gòu)進(jìn)行的, 噪聲不斷地將離出軌跡從當(dāng)前鞍型周期軌道的不穩(wěn)定流形擾至包含其上一層不穩(wěn)定流形, 而離出軌跡在不穩(wěn)定流形上的每一次躍遷都伴隨著噪聲的一次劇烈波動(dòng). Kraut 和Feudel (2003) 研究了吸引域中存在混沌鞍的Ikeda 映射的離出問題, 發(fā)現(xiàn)在混沌鞍上擬勢(shì)幾乎水平, 由此極大降低了離出所需的能量. 還有一些學(xué)者研究了具有局部不連通 (locally disconnected) 和局部連通 (locally connected) 分形邊界的連續(xù)和離散動(dòng)力系統(tǒng)的離出問題, 發(fā)現(xiàn)離出總是發(fā)生于唯一的可達(dá)邊界點(diǎn) (accessible boundary point) 上 (Silchenko et al.2005).
目前, 除了涉及混沌系統(tǒng)的復(fù)雜離出機(jī)理和離出路徑的拓?fù)淦娈愋詥栴}之外, 有關(guān)高斯噪聲離出問題的結(jié)果相對(duì)較為完善. 而關(guān)于非高斯隨機(jī)系統(tǒng)的研究則較為匱乏, 近年來逐漸成為離出問題研究的焦點(diǎn)之一. 事實(shí)上, 相比高斯擾動(dòng), 自然界中的大量涉及跳躍、突變、間歇、爆破、躍遷等客觀現(xiàn)象, 如基因突變、火山爆發(fā)、能級(jí)躍遷等, 更適合利用具有非高斯噪聲的隨機(jī)動(dòng)力系統(tǒng)建立模型 (Duan 2015, 李揚(yáng)2021). 因此, 非高斯隨機(jī)動(dòng)力系統(tǒng)是具有深刻科學(xué)意義的現(xiàn)象學(xué)模型, 相關(guān)的離出問題的研究不僅對(duì)于隨機(jī)動(dòng)力系統(tǒng)理論具有推動(dòng)作用, 更有著重要的實(shí)際應(yīng)用價(jià)值.
非高斯擾動(dòng)往往涉及噪聲樣本的跳躍特性, 目前研究較多和應(yīng)用廣泛的非高斯隨機(jī)系統(tǒng)主要有三種. 第一種是隨機(jī)混合系統(tǒng) (stochastic hybrid system), 即連續(xù)變量與離散變量耦合的過程. 控制連續(xù)變量演化的方程的向量場(chǎng)依賴于離散變量, 離散變量是轉(zhuǎn)移率依賴于連續(xù)變量的跳躍Markov 過程, 因此兩者構(gòu)成耦合隨機(jī)過程. 第二種是具有指數(shù)輕跳躍擾動(dòng) (exponentially light jump fluctuation) 的隨機(jī)動(dòng)力系統(tǒng), 這種噪聲是Lévy 噪聲的一種, 其跳躍測(cè)度 (jump measure) 指數(shù)衰減. 第三種非高斯噪聲也是Lévy 噪聲的一種, 即α穩(wěn)定Lévy 噪聲, 其跳躍測(cè)度多項(xiàng)式衰減.本文第二節(jié)引入大偏差理論的基本思想, 第三、四、五節(jié)分別介紹三種常見非高斯隨機(jī)系統(tǒng)的離出問題的主要處理方法和近期研究進(jìn)展, 并在最后一節(jié)提出一些開放性問題.
在非線性動(dòng)力學(xué)中, 人們往往更加關(guān)注極限行為, 如平衡點(diǎn)、極限環(huán)和奇怪吸引子等不變集結(jié)構(gòu). 類似地, 眾所周知的大數(shù)定律和中心極限定理是概率理論中有關(guān)極限行為的兩個(gè)主要結(jié)果. 直觀上, 對(duì)于類型的隨機(jī)動(dòng)力系統(tǒng),ξt為給定的隨機(jī)擾動(dòng),ε為小的噪聲強(qiáng)度,ε=0對(duì)應(yīng)確定性系統(tǒng)t=b(xt),大數(shù)定律給出了擾動(dòng)系統(tǒng)的解在有限時(shí)間內(nèi)對(duì)于未受擾軌道xt的依概率收斂性結(jié)果, 中心極限定理則進(jìn)一步斷言一階近似依分布收斂于正態(tài)分布.
與大數(shù)定律和中心極限定理不同, 這兩者只關(guān)心未受擾軌道附近的大概率事件, 而大偏差理論則反其道而行之, 它關(guān)注稀有事件 (rare events), 如噪聲誘導(dǎo)的從吸引域中的逃逸現(xiàn)象 (Maier &Stein 1992, Li & Liu 2019)、噪聲誘導(dǎo)的不同穩(wěn)態(tài)之間的轉(zhuǎn)移 (Li et al. 2020a, Chen & Liu 2017)、神經(jīng)元系統(tǒng)跨閾值放電現(xiàn)象 (Khovanov et al. 2013, Li et al. 2020b, Chen et al. 2017)、噪聲誘導(dǎo)的混沌 (Tamás & Lai 2010, Kong &Liu 2017) 等, 均屬大偏差理論的應(yīng)用范疇. 在有限時(shí)間內(nèi), 大偏差現(xiàn)象發(fā)生的概率很小, 這樣深度挖掘極度稀有的事件似乎與概率論的宗旨相悖, 因?yàn)樗坪醮蟾怕适录?duì)預(yù)測(cè)事物演化更具啟發(fā)式意義. 然而, 若將時(shí)間尺度延至無窮, 小概率事件長(zhǎng)期的累積效應(yīng)將可能逐漸演化為大概率事件. 因此, 在有限時(shí)間內(nèi)精細(xì)區(qū)分出哪些事件是“更不可能的(more improbable)”, 哪些事件是“稍不可能的 (less improbable)”, 成為揭示無限時(shí)間尺度下概率1 的大偏差現(xiàn)象本質(zhì)機(jī)理的一把鑰匙.
數(shù)學(xué)上, Freidlin-Wentzell (2012) 大偏差理論建立了隨機(jī)動(dòng)力系統(tǒng)的解穿過一個(gè)給定路徑φt的鄰域的概率估計(jì)式
其中S0T[φ]=即為引言中提到的作用量泛函,L為拉格朗日量, 其形式取決于所研究的隨機(jī)過程 (擴(kuò)散過程、隨機(jī)混合系統(tǒng)等), sup|·|記為上確界范數(shù),δ是一個(gè)正的小參數(shù), Px的下標(biāo)為初值=φ0=x. 由于單條路徑的概率必然為零, 為了對(duì)比不同路徑實(shí)現(xiàn)的可能性, 式 (3)利用軌道附近小鄰域的概率代替原軌道的概率. 根據(jù)Laplace 方法, 諸多事件的概率均取決于此泛函的約束最小化, 例如B為Rn的某一Borel 子集, 則∈B的概率對(duì)數(shù)等價(jià)于exp( inf表示下確界). 因此, 大偏差理論的精辟之處在于, 它將概率的復(fù)雜計(jì)算問題轉(zhuǎn)化為作用量泛函的約束最小化問題, 從而可以利用分析力學(xué)和變分學(xué)的經(jīng)典結(jié)果進(jìn)行求解.
根據(jù)變分原理, 作用量泛函的駐值解-最優(yōu)離出路徑, 滿足歐拉-拉格朗日方程
或?qū)?yīng)的輔助哈密頓系統(tǒng)
其中哈密頓量H是L的Legendre 變換. 盡管離出路徑的眾多樣本是隨機(jī)的, 然而它以壓倒性的概率落在最優(yōu)路徑附近, 且ε →0時(shí), 它依概率收斂于最優(yōu)路徑. 大偏差理論的結(jié)果使得隨機(jī)動(dòng)力學(xué)的某些復(fù)雜行為變得近乎可預(yù)測(cè)! 在離出問題中, 最優(yōu)路徑的研究始終是一個(gè)結(jié)構(gòu)性的難題. 分析最優(yōu)路徑的結(jié)構(gòu)對(duì)于理解噪聲在離出問題中的作用至關(guān)重要, 是隨機(jī)動(dòng)力學(xué)的核心問題之一.
如引言所述, 平均離出時(shí)間和離出位置分布均指數(shù)依賴于作用量泛函的最小值, Freidlin 和Wentzell (2012) 將其定義為擬勢(shì). 具體來說, 擬勢(shì)具有如下形式
其中φ ∈(0,T)表示φ(0)=,φ(T)=x,記為絕對(duì)連續(xù)函數(shù)集. 換句話說, 擬勢(shì)是連接初始位置和終點(diǎn)位置x之間所有絕對(duì)連續(xù)函數(shù)的作用量的最小值, 且要求對(duì)軌跡和時(shí)間都取最小. 通常, 初始位置選為穩(wěn)定不變集 (如穩(wěn)定不動(dòng)點(diǎn)O), 此時(shí)可將擬勢(shì)V(O,x)簡(jiǎn)記為V(x). 對(duì)于多穩(wěn)態(tài)的系統(tǒng), 需要先計(jì)算出每個(gè)穩(wěn)態(tài)的吸引域擬勢(shì), 然后將幾個(gè)區(qū)域的擬勢(shì)拼接起來, 得到全局范圍的擬勢(shì).
針對(duì)簡(jiǎn)單的加性高斯噪聲的情況, 擬勢(shì)的意義可以按下述方式理解. 首先, 假定向量場(chǎng)b(x)具有如下的分解
其中連續(xù)可微函數(shù)U(x)滿足U(O)=0(O為D中的穩(wěn)定平衡點(diǎn)), 對(duì)x/=0有U(x)>0且?U(x)/=0,(l(x),?U(x))=0.則系統(tǒng)關(guān)于點(diǎn)O的擬勢(shì)V(x)滿足V(x)=2U(x) (Freidlin & Wentzell 2012). 若U(x)是二次連續(xù)可微的, 則從O到x的最大可能路徑φs,-∞≤s≤T, 滿足下面的方程
對(duì)比方程 (8) 和原始確定性方程后發(fā)現(xiàn), 在噪聲的驅(qū)動(dòng)下, 離出路徑保持旋轉(zhuǎn)分量l(x)不變,僅僅將向內(nèi)的法向分量-?U(x)翻轉(zhuǎn)向外, 使得噪聲能夠消耗盡可能小的能量驅(qū)動(dòng)系統(tǒng)離出. 若考慮有勢(shì)系統(tǒng), 即旋轉(zhuǎn)分量l(x)=0,則擬勢(shì)與勢(shì)函數(shù)U(x)僅僅相差一個(gè)常數(shù)因子. 換句話說, 在有勢(shì)系統(tǒng)中, 擬勢(shì)與勢(shì)函數(shù)完全等價(jià). 即使在非有勢(shì)系統(tǒng)中, 擬勢(shì)仍然可以看成是廣義的勢(shì)函數(shù).這也是擬勢(shì)這個(gè)名稱的來源.
通常, 對(duì)向量場(chǎng)進(jìn)行線性化并計(jì)算特征值或最大李雅普諾夫指數(shù) (largest Lyapunov exponent) 是最常見的系統(tǒng)穩(wěn)定性分析方法. 特征值取決于勢(shì)函數(shù)的二階導(dǎo)數(shù), 刻畫了系統(tǒng)離開不動(dòng)點(diǎn)鄰域的難易程度, 因此可以理解為系統(tǒng)離出時(shí)“爬得多陡”. 然而, 這種方式只能刻畫系統(tǒng)的局部穩(wěn)定性, 無法展現(xiàn)涉及全局結(jié)構(gòu)的信息. 在隨機(jī)擾動(dòng)下, 系統(tǒng)從不動(dòng)點(diǎn)的整個(gè)吸引域中的離出行為是許多動(dòng)力學(xué)問題的核心, 而局部穩(wěn)定性顯然不足以刻畫此類問題. 另一種穩(wěn)定性是根據(jù)吸引域半徑的長(zhǎng)度來定義, 即考察系統(tǒng)“走得多遠(yuǎn)”. 這種定義方式在某些情況下非常適用, 例如噪聲強(qiáng)度較大時(shí)的跳躍噪聲. 盡管這種穩(wěn)定性是比前一種更加全面的全局穩(wěn)定性, 在一定程度上能夠刻畫平衡點(diǎn)的穩(wěn)定范圍, 然而單純以吸引域大小定義穩(wěn)定性仍有一定的局限性. 例如, 定義在區(qū)域[-1,1]上的兩個(gè)分別具有勢(shì)函數(shù)U1(x)=x2與U2(x)=0.01x2的系統(tǒng), 盡管穩(wěn)定區(qū)域一致, 兩個(gè)系統(tǒng)的穩(wěn)定性明顯不同, 相應(yīng)的離出難度也不一樣. 這就涉及第三種穩(wěn)定性的定義方式, 即從能量的角度考察離出需要越過的勢(shì)壘高度, 在物理化學(xué)系統(tǒng)中稱為活化能, 可以理解為“登得多高”(朱金杰等 2020). 在大偏差理論中, 擬勢(shì)扮演了這樣一個(gè)勢(shì)壘的角色, 在有勢(shì)系統(tǒng)中, 它也能與勢(shì)函數(shù)重合. 因此, 擬勢(shì)的概念從能量的角度為吸引子的全局穩(wěn)定性提供了一種定量判據(jù), 從而噪聲誘導(dǎo)的不同穩(wěn)態(tài)之間的轉(zhuǎn)移現(xiàn)象轉(zhuǎn)化為不同擬勢(shì)勢(shì)阱的躍遷行為.
生物系統(tǒng)中的噪聲依據(jù)來源可以分為兩類, 以神經(jīng)元系統(tǒng)為例, 可以分為固有噪聲 (intrinsic noise) 和外在噪聲 (extrinsic noise) (Bressloff & Newby 2013). 后者來源于環(huán)境因素, 主要由突觸輸入的持續(xù)性沖擊構(gòu)成, 相關(guān)的系統(tǒng)一般模型化為基于郎之萬(wàn)方程的連續(xù)Markov 過程. 而固有噪聲產(chǎn)生于有限個(gè)離子通道的隨機(jī)開閉, 具有明顯的離散特性, 一般模型化為跳躍Markov 過程.一般地, 若x(t)表示連續(xù)的突觸變量,n(t)∈{0,1,2,··· ,K}為離散的開通道數(shù), 只考慮固有噪聲的情況下,x(t)在n(t)兩次跳躍之間滿足確定性方程
其中τ為突觸時(shí)間常數(shù), 而n(t)的演化服從轉(zhuǎn)移率為Wnn′(x)/τn的跳躍Markov 過程n′ →n, 因此[x(t),n(t)]構(gòu)成耦合Markov 過程, 稱為分段確定馬氏過程 (piecewise deterministic Markov process), 或隨機(jī)混合系統(tǒng) (stochastic hybrid system) (Bressloff & Newby 2014). 為了簡(jiǎn)化, 這里考慮連續(xù)變量是一維的情況. 除了神經(jīng)元模型外, 它在物理化學(xué)、分子動(dòng)力學(xué)、基因轉(zhuǎn)錄等領(lǐng)域都有著重要應(yīng)用 (Assaf et al. 2011, Newby 2014a).
對(duì)于這個(gè)耦合系統(tǒng), 引入對(duì)應(yīng)的概率密度pn(x,t)
則概率密度的演化服從微分形式的Chapman-Kolmogorov (CK) 方程
注意, 在這個(gè)系統(tǒng)中引入了兩個(gè)時(shí)間尺度, 弛豫時(shí)間尺度τ和轉(zhuǎn)移時(shí)間尺度τn. 一方面, 若考慮極 限τ →0,根據(jù)式 (9) 得到vn(x)=0,則x為依賴于n的常數(shù), 從而概率P(n,t)=P{n(t)=n}的演化控制方程轉(zhuǎn)化為
即跳躍Markov 過程. 若n(t)每次只跳躍一步, 即n →n±1, 則系統(tǒng)簡(jiǎn)化為更為人們所熟知且應(yīng)用更廣泛的生滅過程 (birth-and-death process) (Dykman et al. 1994), 即
其中邊界條件為P(-1,t)=0,P(K+1,t)=0.令Ω±(n/K)=ω±(n)/K,x=n/K, 結(jié)合方程 (13),當(dāng)K →∞時(shí)得到確定性方程
另一方面, 在諸多實(shí)際的生物物理模型中, 跳躍過程的動(dòng)力學(xué)遠(yuǎn)快于連續(xù)變量的弛豫行為,即τn ?τ(Bressloff & Newby 2014). 因此, 令τ=1,τn=ε, 可以將方程 (11) 改寫成另一種更加緊湊的形式
在ε →0極限下, 式 (15) 約化為確定性方程或稱平均場(chǎng)方程 (mean field equation)
其中ρn(x)是滿足Anm(x)ρm(x)=0唯 一的平穩(wěn)分布. 這里假定, 對(duì)固定的x, 矩陣A(x)是不可約的.
注意到當(dāng)前者K →∞或后者ε →0時(shí), 這兩種系統(tǒng)分別收斂于對(duì)應(yīng)的確定性系統(tǒng). 換句話說,1/K和ε分別刻畫了它們的噪聲強(qiáng)度. 在K較大或ε較小的情況下, 許多學(xué)者研究了這兩種系統(tǒng)中弱噪聲誘導(dǎo)的擾動(dòng)系統(tǒng)與未受擾系統(tǒng)之間的大偏差現(xiàn)象及相關(guān)的復(fù)雜隨機(jī)動(dòng)力學(xué)行為. 下面兩子節(jié)分別介紹這兩種系統(tǒng)的研究進(jìn)展.
考慮上述生滅過程 (13), 寫成關(guān)于x的密度形式如下
此處KΩ+(x) (KΩ-(x))表示x跳躍至x+1/K(x-1/K) 的轉(zhuǎn)移率. 對(duì)于任意光滑函數(shù)f(x), 上述過程的無限小生成元為
給定任意初始分布, 上式唯一定義了一個(gè)跳躍Markov 過程. 一個(gè)非常有趣的問題是: 當(dāng)K →∞時(shí), 該Markov 過程具有怎樣的極限行為?
事實(shí)上, 當(dāng)K →∞,O(1/K)階次的跳躍步長(zhǎng)意味著上述過程逼近其連續(xù)極限, 而O(K)階次的轉(zhuǎn)移率說明系統(tǒng)關(guān)于時(shí)間快速變化, 系統(tǒng)將快速收斂至其唯一的平穩(wěn)不變分布. 與此同時(shí), 若系統(tǒng)具有某種遍歷性特征, 則這種“快速震蕩”使得該Markov 過程的軌道呈現(xiàn)出大概率集中于其“平均系統(tǒng)”, 而小概率發(fā)生偏離的現(xiàn)象. 這一現(xiàn)象可由大偏差原理解釋.
令H(x,β)=Ω+(x)(eβ -1)+Ω-(x)(e-β -1),L(x,α)=(αβ-H(x,β))為H(x,β)的Legendre 變換. 記為上述過程以x0為起始點(diǎn)的概率分布, 則根據(jù)大偏差原理 (Freidlin & Wentzell 2012), 有
由于H(x,0)=0,可以推得L(x,α)≥0.同時(shí)L(x,α)=0當(dāng)且僅當(dāng)α=Ω+(x)-Ω-(x), 立即有推論
即, 當(dāng)K →∞,在O(1)時(shí)間尺度, 系統(tǒng)大概率沿著確定性軌線運(yùn)動(dòng). 這實(shí)際上是大數(shù)定律的結(jié)果,該確定性運(yùn)動(dòng)正是上述“快速震蕩”導(dǎo)致的系統(tǒng)平均動(dòng)力學(xué)行為. 大偏差理論相比于傳統(tǒng)大數(shù)定律和中心極限定理的優(yōu)越性在于, 它使得系統(tǒng)相對(duì)于其確定性平均的有限偏差的指數(shù)小概率可以得到估計(jì), 并可以應(yīng)用于研究系統(tǒng)長(zhǎng)期動(dòng)力學(xué)的漸近行為. 如系統(tǒng)的轉(zhuǎn)移概率PK(t,x0,x)取決于V(t,x0,x)=,平穩(wěn)概率分布(x)由擬勢(shì)V(x)支配, 平均離出時(shí)間近似具有exp(KC)階次, 而常數(shù)C由擬勢(shì)確定. 這些結(jié)果與擴(kuò)散情形一致, 此處不再闡述.
一個(gè)有趣的現(xiàn)象是, 當(dāng)K →∞且t →∞時(shí), 系統(tǒng)在不同的時(shí)間尺度呈現(xiàn)不同的動(dòng)力學(xué)行為.如先有K →∞再有t →∞,此時(shí)xK(t)大概率趨于初值x0的ω極限集; 而若先有t →∞再有K →∞,系統(tǒng)呈現(xiàn)位于所有極限集上的集中分布; 而當(dāng)t ~exp(KC), 如前所述, 系統(tǒng)呈現(xiàn)有界區(qū)域的離出行為 (Schuss 2009). 那么, 在其他時(shí)間尺度, 隨機(jī)系統(tǒng)又有怎樣的行為呢?
令x(t)為任意一條確定性平均系統(tǒng)的軌線, 可以證明標(biāo)準(zhǔn)偏差K1/2(xK(t)-x(t))在任意有限時(shí)間區(qū)間弱收斂于高斯擴(kuò)散過程ξ(t), 其對(duì)應(yīng)的無限小生成元為
這實(shí)際上是中心極限定理類型的結(jié)果 (Ge & Qian 2011). 取x(t)=為確定性系統(tǒng)的穩(wěn)定平衡點(diǎn),由ξ離出O(1)區(qū)域的時(shí)間近似是O(1)階的可知,xK(t)相比于的O(K-1/2)偏差發(fā)生在O(1)時(shí)間尺度.
進(jìn)一步, 考慮偏差ηK(t)=Kγ(xK(t)-x(t))=(xK(t)-x(t)),0<γ <1/2, 有
同樣地, 取x(t)=為確定性系統(tǒng)的穩(wěn)定平衡點(diǎn), 由ηK(t)發(fā)生O(1)偏差的時(shí)間近似是O(exp(K1-2γC))階次的可知,xK(t)相比于的O(K-γ)偏差發(fā)生在O(exp(K1-2γC))階時(shí)間尺度.
相似的結(jié)果可以推廣至高維. 考慮狀態(tài)空間為εZn(Z為整數(shù)集) 的連續(xù)時(shí)間跳躍Markov 過程, 其生成元為
利用與一維情形相似的推導(dǎo)過程, 上述結(jié)論可自然在高維進(jìn)行推廣, 此處不再贅述.
隨機(jī)混合系統(tǒng)在神經(jīng)元模型、分子動(dòng)力學(xué)、基因轉(zhuǎn)錄等領(lǐng)域都有大量的應(yīng)用 (Assaf et al.2011, Newby 2014a, Li & Liu 2019). 其連續(xù)變量和離散變量耦合的特殊結(jié)構(gòu), 既能模型化一大類實(shí)際物理系統(tǒng), 同時(shí)也帶來了高度的復(fù)雜性. 盡管擾動(dòng)一般較弱, 即ε通常較小, 長(zhǎng)期作用下離出行為仍十分普遍. 為此, 眾多研究者分析了隨機(jī)混合系統(tǒng)的大偏差現(xiàn)象, 設(shè)計(jì)了多種解析與數(shù)值方法, 并得到了一系列引人注目的結(jié)果. 例如, 一些研究者利用攝動(dòng)法近似計(jì)算了基因調(diào)控和離子通道等模型的平均首次離出時(shí)間 (Bressloff & Lawley 2017). 基于WKB 近似和路徑積分公式,Bressloff 和Newby (2013, 2014) 推導(dǎo)了隨機(jī)混合系統(tǒng)的作用量泛函和最優(yōu)離出路徑滿足的輔助系統(tǒng), 計(jì)算了隨機(jī)混合神經(jīng)網(wǎng)絡(luò)系統(tǒng)的離出路徑和離出時(shí)間, 分析了隨機(jī)混合Morris-Lecar 系統(tǒng)離出路徑的奇異性結(jié)構(gòu). 分析發(fā)現(xiàn), 類似于擴(kuò)散過程的情況, 隨機(jī)混合系統(tǒng)的最優(yōu)路徑仍然滿足哈密頓系統(tǒng). 然而, 區(qū)別在于, 哈密頓量由一個(gè)符號(hào)矩陣的特征值提供, 而作用量泛函為哈密頓量的Legendre 變換 (即拉格朗日量) 的積分, 因此作用量泛函與哈密頓量一般無法給出顯式形式,這為問題的求解帶來了極大的困難與挑戰(zhàn). 為此, 許多研究者提出了諸多近似方法, 如擬穩(wěn)態(tài)擴(kuò)散近似 (quasi-steady-state diffusion approximation, QSS), 絕熱近似 (adiabatic approximation), 系統(tǒng)尺寸擴(kuò)展 (system-size expansion) 等方法 (Bressloff & Newby 2011, Brooks & Bressloff 2015,Keener & Newby 2011), 試圖利用擴(kuò)散過程近似隨機(jī)混合系統(tǒng). 這些方法對(duì)于捕捉系統(tǒng)的高斯型漲落以及揭露擬環(huán) (quasi-cycle) (Brooks & Bressloff 2015) 的出現(xiàn)等局部性質(zhì)具有突出的優(yōu)越性.然而, 在考慮亞穩(wěn)態(tài) (metastability) 現(xiàn)象時(shí), 擬勢(shì)和最優(yōu)路徑會(huì)出現(xiàn)不可接受的誤差 (Li & Liu 2019).
下面引入一些典型的隨機(jī)混合系統(tǒng)的理論和數(shù)值方法, 如擴(kuò)散近似方法中最常用的QSS, 處理大偏差問題的WKB 近似, 并介紹近期發(fā)展的重要結(jié)果.
3.2.1 擬穩(wěn)態(tài)擴(kuò)散近似
假定ε很小, 則內(nèi)部變量n的 轉(zhuǎn)移率充分大, 使得n快 速跳躍的同時(shí)x的變化很小. 這個(gè)結(jié)果表明, 系統(tǒng)位于狀態(tài)n的概率快速收斂于ρn(x). 這一事實(shí)引出了QSS 方法的基本思想, 即, 概率密度pn(x,t)可以近似分解為給定x的狀態(tài)n的平穩(wěn)分布ρn(x)與x的邊際分布的乘積 (Bressloff & Newby 2014). 具體來說, 假設(shè)概率密度為
代入微分CK 方程 (15) 中, 并利用攝動(dòng)法得到C(x,t)的演化滿足的FPK 方程
其中漂移系數(shù)和擴(kuò)散系數(shù)分別為
Zn(x)是滿足條件Zn(x)=0, 且是方程(28)的唯一解
注意在這里只保留了FPK 方程 (26) 的漂移與擴(kuò)散的最低階項(xiàng). 函數(shù)C(x,t)表示近似的擴(kuò)散過程的概率密度函數(shù). 由此可以利用擴(kuò)散過程 (26) 近似原先的隨機(jī)混合系統(tǒng), 從而使系統(tǒng)簡(jiǎn)化.
實(shí)際上, QSS 擴(kuò)散近似方法的優(yōu)勢(shì)主要在于二維情況下能夠捕捉到不動(dòng)點(diǎn)附近的高斯型漲落. 具體來說, 考察平均場(chǎng)方程處于接近超臨界Hopf 分岔點(diǎn)的情況, 系統(tǒng)存在一個(gè)穩(wěn)定的焦點(diǎn),雅可比矩陣具有一對(duì)復(fù)共軛特征值. 此時(shí)確定性流表現(xiàn)為暫態(tài)振蕩模式, 衰減率為特征值實(shí)部.而當(dāng)存在固有噪聲時(shí), 即對(duì)于隨機(jī)混合系統(tǒng), 暫態(tài)振蕩轉(zhuǎn)化為長(zhǎng)期的大振幅振蕩, 對(duì)應(yīng)的功率譜出現(xiàn)一個(gè)峰值, 稱為擬環(huán) (quasi-cycle) 現(xiàn)象. 通過QSS 方法計(jì)算出近似的It?隨機(jī)微分方程, 在不動(dòng)點(diǎn)處線性化后經(jīng)過Fourier 變換可以得到系統(tǒng)的功率譜. 近似結(jié)果得到的功率譜會(huì)出現(xiàn)一個(gè)峰值, 與原隨機(jī)混合系統(tǒng)的模擬結(jié)果相當(dāng)吻合 (Bressloff 2010, 2017; Brooks & Bressloff 2015). 因此,QSS 方法對(duì)于擬環(huán)現(xiàn)象的分析具有顯著的優(yōu)勢(shì).
以單集群隨機(jī)混合神經(jīng)網(wǎng)絡(luò)模型 (Li & Liu 2019) 為例, 討論QSS 擴(kuò)散近似方法的應(yīng)用. 對(duì)于此模型, 連續(xù)變量x代表總的突觸電流, 離散的內(nèi)部變量n表示激活的神經(jīng)元個(gè)數(shù).n(t)的演化服從一個(gè)轉(zhuǎn)移率為Ω±(x,n)/ε的單步跳躍Markov 過程
其中Ω+=n(t),Ω-=F(x).F是Sigmoid 激活率, 定義為
其中F0,Γ和θ分別為速率常數(shù), 增益和閾值. 突觸電流x(t)滿足分段確定方程
則系統(tǒng)的概率密度pn(x,t)滿足的CK 方程形式為
其中的矩陣A(x)滿足
通過計(jì)算, 平穩(wěn)分布ρn(x)滿足參數(shù)為F(x)的泊松分布, 則可得到平均場(chǎng)方程
平均場(chǎng)方程關(guān)于參數(shù)θ的分岔圖如圖1 所示,θ=0.95時(shí),存在兩個(gè)穩(wěn)定不動(dòng)點(diǎn)x1,x2和一個(gè)不穩(wěn)定不動(dòng)點(diǎn)x0.
圖 1 平均場(chǎng)方程關(guān)于 θ從單穩(wěn)態(tài)到雙穩(wěn)態(tài)的分岔圖.θ =0.95時(shí),存在兩個(gè)穩(wěn)定不動(dòng)點(diǎn) x1, x2和一個(gè)不穩(wěn)定不動(dòng)點(diǎn)x0
其中ξt是一個(gè)高斯白噪聲, 漂移系數(shù)f(x)是由式 (34) 定義的平均場(chǎng)方程的向量場(chǎng), 擴(kuò)散系數(shù)滿足D(x)=w2F(x).
若要考察系統(tǒng)的離出現(xiàn)象, 則根據(jù)人們所熟知的擴(kuò)散過程的大偏差理論的結(jié)果, 易得擬勢(shì)VFP(x)滿足哈密頓雅可比方程 (李揚(yáng)2021)
根據(jù)經(jīng)典力學(xué)的結(jié)果, 這個(gè)方程可以沿著下面的參數(shù)化軌道進(jìn)行積分求解
事實(shí)上, 對(duì)于此一維模型, 擬勢(shì)可以直接通過式 (36) 求解得到
當(dāng)然, 后面會(huì)看到, 擴(kuò)散近似后的大偏差結(jié)果相對(duì)于原混合系統(tǒng), 在遠(yuǎn)離不動(dòng)點(diǎn)處會(huì)出現(xiàn)較大的誤差.
3.2.2 WKB 近似
如前文所述, 盡管擴(kuò)散近似在捕捉不動(dòng)點(diǎn)鄰域內(nèi)的高斯型漲落等局部性質(zhì)時(shí)具有突出的優(yōu)越性, 然而, 當(dāng)考察離出問題等全局現(xiàn)象時(shí)會(huì)出現(xiàn)不可接受的誤差. 此時(shí), 直接對(duì)原隨機(jī)混合系統(tǒng)應(yīng)用WKB 近似方法是十分必要的.
一般地, 假設(shè)CK 方程 (15) 的平穩(wěn)概率密度滿足下面的WKB 形式
其中V(x)為擬勢(shì),Rn(x)是給定x的狀態(tài)n的條件分布.pn(x)的值主要取決于指數(shù)項(xiàng),N為前因子函數(shù), 由ε的更高階的齊次方程決定, 這里不做討論. 將方程 (39) 代入CK 方程的時(shí)齊版本并合并ε的最低階項(xiàng)得到
其矩陣形式為
眾所周知, 在弱噪聲極限下, 擴(kuò)散過程對(duì)應(yīng)的擬勢(shì)滿足哈密頓雅可比方程. 類似地, Bressloff和Newby (2014) 證明了隨機(jī)混合系統(tǒng)的擬勢(shì)滿足下面的哈密頓雅可比方程
其中,λ0是矩陣Q的主特征值, 稱為Perron 特征值. 它是實(shí)的單特征值, 并且大于所有余下的特征值的實(shí)部. Perron-Frobenius 定理保證了它對(duì)應(yīng)的特征向量是嚴(yán)格正的. 因此, 最優(yōu)離出路徑滿足輔助哈密頓系統(tǒng)
沿著這些極值路徑, 擬勢(shì)的演化滿足
可以看出, 隨機(jī)混合系統(tǒng)的哈密頓量一般沒有解析表達(dá)式, 因?yàn)樗且粋€(gè)符號(hào)矩陣的主特征值. 這正是隨機(jī)混合系統(tǒng)復(fù)雜性的根源所在. 因此, 用隨機(jī)微分方程逼近隨機(jī)混合系統(tǒng)的QSS 等方法就顯示出它們的重要意義.
事實(shí)上, 由方程 (41) 的解決定的哈密頓量的選擇并不唯一. 例如, 它也可以定義為(x,p)=det(Q)(Newby 2014b). 盡管這個(gè)定義有一定的優(yōu)勢(shì), 即哈密頓量總能寫出解析表達(dá)式,但它有一個(gè)缺點(diǎn), 即這樣定義的哈密頓量不是動(dòng)量p的凸函數(shù), 而凸函數(shù)性質(zhì)是處理更高維問題的幾何最小作用量方法 (Heymann & Vanden-Eijnden 2008)、有序逆風(fēng)法 (Cameron 2012) 等數(shù)值方法所需的本質(zhì)特性. 盡管如此, 可以證明H和具有相同的極值路徑, 只是時(shí)間參數(shù)化不同(Newby 2014b). 一般地, 將系統(tǒng)的哈密頓量取為Perron 特征值.
上一子節(jié)的隨機(jī)混合神經(jīng)網(wǎng)絡(luò)模型是少有的能夠解析計(jì)算出哈密頓量的例子. 應(yīng)用WKB近似方法, 通過將Rn(x)假設(shè)成Poisson 分布的形式, 根據(jù)方程 (41), 可推導(dǎo)出哈密頓量 (Li &Liu 2019)
最優(yōu)離出路徑和擬勢(shì)可以通過積分對(duì)應(yīng)的常微分方程組 (43) 和 (44) 得到.
根據(jù)式 (45), 零值哈密頓量分別導(dǎo)出兩條零能量軌道, 即對(duì)應(yīng)于p=0的弛豫軌道和對(duì)應(yīng)于p=1/w-F(x)/x的活化軌道, 如圖2 所示. 容易看出, 每條最優(yōu)路徑都是連接不動(dòng)點(diǎn)和鞍點(diǎn)的異宿軌. 如果p=0, 可以發(fā)現(xiàn)輔助哈密頓系統(tǒng) (43) 約化為平均場(chǎng)方程, 因此系統(tǒng)在弛豫軌道上運(yùn)動(dòng)不需要能量. 這表明動(dòng)量實(shí)際上度量了最優(yōu)路徑和確定性路徑之間的距離. 因此, 類似于擴(kuò)散過程, 動(dòng)量p的值可以看成是反映噪聲影響的指示器. 然而, 系統(tǒng)在活化軌道上的運(yùn)動(dòng)需要克服穩(wěn)定不動(dòng)點(diǎn)的吸引性, 能量當(dāng)然是需要的, 大小為
圖 2 哈密頓系統(tǒng)的相圖和離出路徑.粉色和亮藍(lán)曲線分別代表從 x1到x2和x2到 x1的離出路徑.綠色和棕色虛線表示擴(kuò)散近似的離出路徑
如前所述, 若考慮噪聲誘導(dǎo)的離出現(xiàn)象, 則隨機(jī)混合系統(tǒng)與其擴(kuò)散近似的結(jié)果相比有顯著的偏差, 如圖3(a)所示的擬勢(shì). 對(duì)于亞穩(wěn)態(tài)問題, 這種偏差即使很小, 也會(huì)導(dǎo)致QSS 方法的失效. 其原因是, 擬勢(shì)出現(xiàn)在MFPT 的指數(shù)項(xiàng)中, 因此擬勢(shì)的微小差異將導(dǎo)致MFPT 的較大誤差. 通過Monte Carlo 模擬 (Li & Liu 2019), 針對(duì)不同的噪聲強(qiáng)度, 計(jì)算出從右邊不動(dòng)點(diǎn)穿過鞍點(diǎn)的MFPT,如圖3(b)所示. 利用MFPT 的對(duì)數(shù)與擬勢(shì)、噪聲強(qiáng)度的倒數(shù)成正比的事實(shí), 可以很容易地得到MFPT 的對(duì)數(shù)與噪聲強(qiáng)度倒數(shù)的函數(shù)關(guān)系. 在圖3(b)中, 擬合直線的斜率代表了擬勢(shì)的大小, 約為0.097 8, 這與原系統(tǒng)的WKB 近似結(jié)果0.0964 一致, 而與QSS 給出的結(jié)果有很大差異.
Li & Liu (2019) 給出了QSS 方法失效的原因. 通過對(duì)比擴(kuò)散近似前后的兩個(gè)哈密頓量H(x,p)=-xp+wp·F(x)/(1-wp)和(x,p)=[-x+wF(x)]p+w2F(x)p2,容易發(fā)現(xiàn)(x,p)恰好是H(x,p)關(guān)于動(dòng)量p的二階近似. 因此, 在不動(dòng)點(diǎn)或鞍點(diǎn)鄰域內(nèi),H(x,p)和(x,p), 以及它們對(duì)應(yīng)的離出軌道, 吻合地很好. 在圖2 中, 動(dòng)量p關(guān)于坐標(biāo)x的曲線的斜率代表擬勢(shì)的二階導(dǎo)數(shù). 基于此, 可以發(fā)現(xiàn), 在不動(dòng)點(diǎn)鄰域, 有效FPK 和原系統(tǒng)的結(jié)果幾乎是重合的. 這一特殊事實(shí)意味著,QSS 前后計(jì)算的擬勢(shì)關(guān)于x的二階以內(nèi)是一致的. 然而, 在相空間的其他區(qū)域, 由于動(dòng)量很大, 哈密頓量的二階近似是不夠精確的. 事實(shí)上, 正是遠(yuǎn)離不動(dòng)點(diǎn)處的較大的動(dòng)量推動(dòng)系統(tǒng)克服了不動(dòng)點(diǎn)的吸引力, 使稀有的離出事件得以實(shí)現(xiàn). 這就是QSS 失效的原因. 值得注意的是, FPK 方程的解所提供的哈密頓量必然是動(dòng)量p的 二次函數(shù), 而矩陣Q的Perron 特征值一般不會(huì)正好是這種形式. 鑒于此, 當(dāng)考慮離出事件時(shí), 擴(kuò)散近似的失效是自然的.
圖 3 (a)擴(kuò)散近似和原始系統(tǒng)的擬勢(shì)對(duì)比,(b)平均離出時(shí)間的對(duì)數(shù)和噪聲強(qiáng)度的倒數(shù)之間的關(guān)系
圖 4 細(xì)致平衡條件分析示意圖
3.2.3 細(xì)致平衡條件
細(xì)致平衡 (detailed balance) 原是物理學(xué)中的一個(gè)概念, 由van Kampen (1957)、Graham 和Haken (1971) 獨(dú)立地應(yīng)用于FPK 方程. 粗略地說, 一個(gè)馬爾可夫過程, 如果在平穩(wěn)情形下, 每一個(gè)可能的狀態(tài)轉(zhuǎn)移都與其逆轉(zhuǎn)移平衡, 那它就處于細(xì)致平衡. 細(xì)致平衡現(xiàn)象與大偏差問題具有密切聯(lián)系, 若系統(tǒng)處于細(xì)致平衡, 則從穩(wěn)態(tài)漲落到某一點(diǎn)的最優(yōu)離出路徑與該點(diǎn)在無噪聲情況下弛豫到穩(wěn)態(tài)的確定性軌跡完全重合, 只需將時(shí)間反向. 因此, 離出路徑構(gòu)成的拉格朗日流形的奇異性也不會(huì)出現(xiàn), 問題得到了極大地簡(jiǎn)化.
表1 中列出了幾種典型隨機(jī)過程的細(xì)致平衡條件. 眾所周知, 對(duì)于加性高斯噪聲的具有勢(shì)函數(shù)的隨機(jī)微分方程, 細(xì)致平衡自動(dòng)成立. 對(duì)于其他情況, 朱位秋 (1992) 給出了擴(kuò)散過程處于細(xì)致平衡時(shí)漂移和擴(kuò)散系數(shù)需要滿足的條件, 并以此可得到系統(tǒng)的平穩(wěn)勢(shì), 從而能夠求解平穩(wěn)FPK方程. 對(duì)于一般的齊次Markov 過程, 在滿足若干假設(shè)下, Gardiner (1985) 推導(dǎo)了此類過程微分形式的CK 方程, 并利用其系數(shù)導(dǎo)出了此過程滿足細(xì)致平衡的充要條件. 基于此, Dykman等 (1994) 證明了跳躍Markov 過程的細(xì)致平衡條件為WjiPi=WijPj.
表 1 幾種典型隨機(jī)過程的細(xì)致平衡條件
對(duì)于隨機(jī)混合系統(tǒng), Li 和Liu (2019) 證明了此類過程必然不滿足細(xì)致平衡. 數(shù)學(xué)上, Gardiner(1985) 推導(dǎo)的齊次Markov 過程處于細(xì)致平衡的充要條件在隨機(jī)混合系統(tǒng)的情況下約化為
根據(jù)第一個(gè)方程, 得到vn(x)=0.存在兩種可能: 一方面, 若vn(x)與x無關(guān), 則可解出狀態(tài)n為某個(gè)常數(shù), 即狀態(tài)n不存在轉(zhuǎn)移, 此時(shí)離散變量已不再是隨機(jī)的, 這時(shí)系統(tǒng)已不再是隨機(jī)混合系統(tǒng). 另一方面, 若vn(x)與x相關(guān), 則可得到x=f(n), 意味著一個(gè)連續(xù)變量等于一個(gè)離散變量. 顯然, 這個(gè)事件概率為零. 綜上, 隨機(jī)混合系統(tǒng)必然不滿足細(xì)致平衡.
前面的解釋是由數(shù)學(xué)語(yǔ)言給出的, 然而怎樣才能直觀地理解這種奇特的現(xiàn)象呢? 如圖4所示, 假設(shè)系統(tǒng)在時(shí)刻t跳到狀態(tài)n, 然后它會(huì)在狀態(tài)n上停留一個(gè)正隨機(jī)時(shí)間τ(τ=0的概率為零), 然后它將跳到另一個(gè)狀態(tài). 在這個(gè)時(shí)間間隔內(nèi), 系統(tǒng)沿著由x˙=vn(x)定義的確定軌跡移動(dòng).假設(shè)系統(tǒng)起始于(n,x),在充分小的時(shí)間區(qū)間 Δt內(nèi),系統(tǒng)從狀態(tài)n跳躍到其他狀態(tài)的概率為CΔt, 留在狀態(tài)n的概率為1-CΔt.因此, 若vn(x)不等于零, 則轉(zhuǎn)移概率
然而, 若系統(tǒng)起始于狀態(tài)x+vn(x)Δt,在n保持不變的情況下, 系統(tǒng)在 Δt時(shí)間之后不可能到達(dá)狀態(tài)(n,x),這是因?yàn)閤˙=vn(x)是確定性方程, 而相軌跡不可能與自身相交. 因此,n必須在 Δt時(shí)間區(qū)間內(nèi)跳躍數(shù)次才能抵達(dá)狀態(tài)(n,x). 鑒于隨機(jī)軌道精確到達(dá)某一點(diǎn)的概率必然為零, 因此轉(zhuǎn)移概率
于是, 正向與反向的運(yùn)動(dòng)概率不可能相等, 除非vn(x)=0. 這與前面的分析一致, 即對(duì)于隨機(jī)混合系統(tǒng), 時(shí)間不可逆性總是存在的.
作為高斯白噪聲的推廣, Lévy 噪聲是另一種近年來備受關(guān)注的隨機(jī)過程. 類似于高斯白噪聲, Lévy 噪聲可以看作是Lévy 過程的形式導(dǎo)數(shù). 布朗運(yùn)動(dòng)是具有平穩(wěn)獨(dú)立增量性和概率1 連續(xù)樣本路徑的高斯過程, 而Lévy 過程去掉了高斯分布的要求, 并將概率1 連續(xù)退化至隨機(jī)連續(xù). 由此, Lévy 過程及Lévy 噪聲驅(qū)動(dòng)的隨機(jī)微分方程的解一般是不連續(xù)的, 甚至跳躍點(diǎn)可能是稠密的(Duan 2015). 這一方面使得此類問題的處理變得相當(dāng)困難, 但另一方面在研究地球氣候的tipping現(xiàn)象 (Serdukova et al. 2017, Zheng et al. 2020)、基因轉(zhuǎn)錄過程中的突變 (Cheng et al. 2019, Chen X et al. 2019) 與股票市場(chǎng)的“笑狀波幅 (implied volatility smile)” (Poirot & Tankov 2006) 等現(xiàn)象時(shí), 人們發(fā)現(xiàn)Lévy 過程更加符合實(shí)際模型.
具體來說, 令Lt為Rn上的Lévy 運(yùn)動(dòng), 定義跳躍過程ΔL(t)為
其中Lt-是Lt在t時(shí)刻的左極限.對(duì)于一個(gè)Borel 集S ∈B(Rn{0})和t>0,定義[0, t)時(shí)間區(qū)間內(nèi)跳躍幅度落在S內(nèi)的次數(shù)為
其中ω為樣本路徑.
定義一個(gè)在B(Rn{0})上的Borel 測(cè)度ν為
稱為Poisson 隨機(jī)測(cè)度, 或跳躍測(cè)度 (jump measure). 進(jìn)一步, 定義補(bǔ)償Poisson 隨機(jī)測(cè)度為
則對(duì)任意t≥0,Lévy 運(yùn)動(dòng)Lt具有如下Lévy-It?分解 (Duan 2015)
其中b ∈Rn,為 具有某個(gè)協(xié)方差矩陣Q的n維布朗運(yùn)動(dòng). 數(shù)字1 將大跳躍與小跳躍分開, 實(shí)際上可以用任何正數(shù)替代. (b, Q, ν)稱為L(zhǎng)évy 運(yùn)動(dòng)的生成三元組 (generating triplet).
根據(jù)Lévy-Khintchine 公式 (Duan 2015), Lévy 運(yùn)動(dòng)的特征函數(shù)為
其中I為示性函數(shù). Lévy 運(yùn)動(dòng)的無限小生成元為
其中H為函數(shù)的Hessian 矩陣, Tr表示矩陣取跡. 實(shí)際上, 對(duì)于受Lévy 噪聲激勵(lì)的隨機(jī)動(dòng)力系統(tǒng),式 (54) 中的前兩項(xiàng)可以分別并入漂移與擴(kuò)散項(xiàng)中. 因此, 人們通??紤]純跳的Lévy 運(yùn)動(dòng)(0,0, ν).關(guān)于Lévy 運(yùn)動(dòng)及具有Lévy 噪聲的隨機(jī)微分方程的更多性質(zhì), 見文獻(xiàn) (Duan 2015, Applebaum 2009).
在滿足某些假定下, Freidlin 和Wentzell (2012) 證明了Lévy 噪聲和高斯白噪聲驅(qū)動(dòng)的隨機(jī)微分方程滿足大偏差理論, 并隱式的給出了其作用量泛函. 然而, 這些條件很難驗(yàn)證. 為此, Lipster和Puhalskii (1992) 利用隨機(jī)微分方程的系數(shù)給出了這些假定的部分充分條件. Budhiraja 等(2011) 對(duì)具有Lévy 噪聲的隨機(jī)系統(tǒng)建立了Poisson 隨機(jī)測(cè)度的泛函的變分公式, 并且推導(dǎo)了另一個(gè)滿足大偏差原理的充分條件. 隨后, 他們成功地將這一研究結(jié)果應(yīng)用于滿足合適條件的有限維 (Budhiraja et al. 2013) 和無限維 (Budhiraja & Fischer 2012) 隨機(jī)動(dòng)力系統(tǒng)的研究之中. 對(duì)于一維梯度系統(tǒng), Imkeller 等 (2009) 研究了指數(shù)輕跳躍過程 (exponentially light jump process) 擾動(dòng)的首次離出時(shí)間問題.
指數(shù)輕跳躍過程是一類特殊的Lévy 過程, 其跳躍測(cè)度滿足ν(dy)=e-|y|αdy. 考慮隨機(jī)動(dòng)力系統(tǒng)
為了簡(jiǎn)化, 考慮一維的情況. 當(dāng)α≥1時(shí), 隨機(jī)系統(tǒng) (57) 的解服從大偏差原理 (de Oliveira Gomes 2018, Yuan & Duan 2019)
其作用量泛函為
對(duì)任意的x,z ∈R, 定義擬勢(shì)為 (de Oliveira Gomes 2018)
一般地, 若起始點(diǎn)z為系統(tǒng)的不動(dòng)點(diǎn), 則擬勢(shì)簡(jiǎn)記為V(x).若D為包含不動(dòng)點(diǎn)的待離出區(qū)域, 記和首次離出時(shí)間
則對(duì)任意的δ >0和x ∈D, 有 (de Oliveira Gomes 2018)
然而, 作用量泛函 (59) 的形式并不適合最優(yōu)離出路徑的計(jì)算. Yuan 和 Duan (2019) 給出了等價(jià)的另一種形式的作用量泛函
然而, 不同于高斯噪聲的情況, 式中的拉格朗日量不能顯式解析地表達(dá). 幸運(yùn)的是, 對(duì)應(yīng)的哈密頓量, 即拉格朗日量的Legendre 變換, 具有下面的解析表達(dá)式
這里,p=?L/?x˙為動(dòng)量. 積分項(xiàng)ypχ|y|≤1實(shí)際上為零, 因?yàn)闇y(cè)度ν關(guān)于y是對(duì)稱的.
基于此, Li 等 (2020a) 推廣了高斯情況下的計(jì)算最優(yōu)路徑和擬勢(shì)的哈密頓形式 (Hamiltonian formalism) 應(yīng)用于此類系統(tǒng). 如前所述, 作用量泛函實(shí)際上支配著軌跡實(shí)現(xiàn)的可能性, 其全局最小值對(duì)應(yīng)于概率最大的路徑. 于是, 通過作用量泛函變分得到的輔助哈密頓系統(tǒng)的解提供了最優(yōu)離出路徑
于是, 這個(gè)哈密頓系統(tǒng)的積分解(x(t), p(t))到坐標(biāo)空間的投影x(t)提供了最優(yōu)離出路徑.
從式 (64) 中注意到H(x,0)=0,則H(x1,0)=0 (x1為確定性系統(tǒng)的穩(wěn)定不動(dòng)點(diǎn)). 由于這樣兩個(gè)事實(shí), 即最優(yōu)路徑連接不動(dòng)點(diǎn)且哈密頓量在連續(xù)的相連軌道上為常數(shù), 因此在整個(gè)最優(yōu)路徑上H(x,p)=0.注意到起始于x1的最優(yōu)路徑在x →x1時(shí)t0→-∞, 根據(jù)式 (60)、式(63) 及Legendre 變換, 可以得到, 在最優(yōu)路徑上
或等價(jià)地
注意, 方程 (65) 和 (67) 構(gòu)成一組計(jì)算離出路徑和擬勢(shì)的完備微分-積分方程組. 然而, 仍然需要初始條件來進(jìn)行數(shù)值積分. 從理論上講, 當(dāng)初始時(shí)間趨于負(fù)無窮時(shí), 最優(yōu)路徑應(yīng)該起始于不動(dòng)點(diǎn), 而在實(shí)際中這是不可能的. 于是, 初始點(diǎn)應(yīng)選在擴(kuò)展相空間的不動(dòng)點(diǎn)的不穩(wěn)定流形上, 并接近不動(dòng)點(diǎn). 因此, 需要在不動(dòng)點(diǎn)附近進(jìn)行局部線性化. 將B記為方程 (65) 的雅可比矩陣
可以看到B有兩個(gè)特征值C <0,-C >0.對(duì)應(yīng)于特征值-C的不動(dòng)點(diǎn)的不穩(wěn)定特征向量為(1,-2C/D)T. 因此, 最優(yōu)路徑的初始條件可以選為
其中δ是一個(gè)小參數(shù).
Li 等 (2020a) 給出了類似高維情況下具有指數(shù)輕跳躍噪聲的隨機(jī)動(dòng)力系統(tǒng)的哈密頓形式, 以能量平衡模型和Maier-Stein 系統(tǒng)為例, 數(shù)值計(jì)算了系統(tǒng)的最優(yōu)離出路徑和擬勢(shì). 研究發(fā)現(xiàn), 在一維情況下, 擬勢(shì)的形狀與勢(shì)函數(shù)完全相同, 表明這種噪聲定性類似于高斯噪聲. 研究結(jié)果同時(shí)給出了擬勢(shì)與跳躍測(cè)度的參數(shù)之間的解析近似關(guān)系, 并分析了跳躍測(cè)度對(duì)最優(yōu)離出路徑的影響. 在高維情況下, 發(fā)現(xiàn)了跳躍測(cè)度誘導(dǎo)的拉格朗日流形的奇異性.
中度偏差原理與大偏差原理的形式是類似的, 只是指數(shù)衰減率的階數(shù)更低一些. 一般地, 中度偏差原理建立了隨機(jī)過程xt穿過給定函數(shù)φt的小鄰域的概率估計(jì)式
其中,S0T[φ]為作用量泛函,ε →0時(shí),a(ε)→0且ε/a2(ε)→0,因此階數(shù)ε/a2(ε)低于大偏差原理的ε.
由于理論上的難度, 目前關(guān)于中度偏差原理的研究還相對(duì)較少. Hu 和Shi (2004) 對(duì)一類具有“布朗勢(shì)”的擴(kuò)散過程建立了長(zhǎng)時(shí)行為的中度偏差估計(jì). Budhiraja 等 (2012, 2013) 對(duì)滿足充分條件的有限維和無限維Lévy 型隨機(jī)系統(tǒng)建立了中度偏差原理. 在此基礎(chǔ)上, de Oliveira Gomes(2018) 證明了0<α <1時(shí)的指數(shù)輕跳躍過程滿足中度偏差原理, 并估計(jì)了平均離出時(shí)間的大小.
當(dāng)0<α <1時(shí),可以證明方程 (57) 的解服從速率為εα的中度偏差原理, 即a(ε)=ε(1-α)/2, 其作用量泛函為
為此, 定義一個(gè)重整化偏差過程(renormalized deviation process)
可以證明, 此過程同樣服從速率為εα的中度偏差原理 (de Oliveira Gomes 2018), 作用量泛函為
類似地, 定義擬勢(shì)為
此時(shí)的擬勢(shì)在有界區(qū)域內(nèi)始終是有界的. 類似地, 若起始點(diǎn)z為系統(tǒng)的不動(dòng)點(diǎn), 則擬勢(shì)簡(jiǎn)記為V(x).若D為 包含不動(dòng)點(diǎn)的待離出區(qū)域, 記
給定y0=x ∈D, 考察離出時(shí)間
則對(duì)任意的δ >0和x ∈D, 有
根據(jù)過程yt的定義, 這個(gè)隨機(jī)時(shí)間τε實(shí)際上是xt從區(qū)域+a(ε)D中的首次離出時(shí)間. 若考察未受擾系統(tǒng)的不動(dòng)點(diǎn), 即則中度偏差所關(guān)心的問題的本質(zhì)實(shí)際上是系統(tǒng)從不動(dòng)點(diǎn)的a(ε)階小鄰域中的離出現(xiàn)象.
非高斯α穩(wěn)定Lévy 噪聲是最常見的一種Lévy 噪聲, 具有廣泛的實(shí)際應(yīng)用, 其原因主要有兩點(diǎn). 一方面, 穩(wěn)定隨機(jī)變量X的定義為:X是一個(gè)尺度化序列(Sn-bn)/an的依分布極限, 其中SnX1+X2+···+Xn,{Xi}是一列獨(dú)立同分布的隨機(jī)變量序列,an >0,bn是某個(gè)實(shí)序列, 這里并不要求{Xi}具有有限的均值或方差 (Duan 2015). 也就是說, 穩(wěn)定隨機(jī)變量相當(dāng)于高斯隨機(jī)變量的推廣, 其定義可以看成是廣義的中心極限定理. 另一方面, 以旋轉(zhuǎn)對(duì)稱α穩(wěn)定Lévy 運(yùn)動(dòng)為例,其跳躍測(cè)度為
其中的常數(shù)為
其中Gamma 函數(shù)Γ定義為. 無限小生成元為
其中, 右端項(xiàng)理解為柯西主值積分 (Cauchy principal value integral). 基于Fourier 變換發(fā)現(xiàn), 這個(gè)積分算子本質(zhì)上是一個(gè)分?jǐn)?shù)階拉普拉斯算子. 這兩點(diǎn)使得α穩(wěn)定Lévy 噪聲不僅具有理論上的研究?jī)r(jià)值, 對(duì)實(shí)際物理系統(tǒng)也有重要的應(yīng)用.
例如, 基于真實(shí)的格陵蘭冰芯測(cè)量數(shù)據(jù), Ditlevsen (1999) 發(fā)現(xiàn)氣候變化系統(tǒng)可以建模為具有布朗運(yùn)動(dòng)和α穩(wěn)定Lévy 過程的隨機(jī)微分方程. 隨后Zheng 等 (2020) 發(fā)展了一個(gè)概率框架來研究在溫室效應(yīng)和非高斯Lévy 噪聲共同作用下的能量平衡系統(tǒng)的最大可能氣候變化. 一些研究者發(fā)現(xiàn)在可激神經(jīng)元模型中α穩(wěn)定Lévy 噪聲能夠誘導(dǎo)隨機(jī)共振現(xiàn)象 (Patel & Kosko 2008, Cognata et al. 2010). 此外, Liu 等 (2018) 研究了具有暫時(shí)免疫和Lévy 跳躍的延遲接種SIR 流行病模型的持久性和滅絕性. Guarcello 等 (2016) 通過將電流偏置的長(zhǎng)約瑟夫森結(jié)建模為受振蕩場(chǎng)驅(qū)動(dòng)并受外部非高斯噪聲影響的sine-Gordon 方程, 對(duì)其動(dòng)力學(xué)進(jìn)行了數(shù)值研究. 理論上, 具有布朗運(yùn)動(dòng)和Lévy 過程的隨機(jī)微分方程可以用來模型化一大類重要的馬氏過程, 稱為Feller 過程 (B?ttcher 2010).
這些工作表明, 具有α穩(wěn)定Lévy 噪聲的隨機(jī)動(dòng)力系統(tǒng)是具有深刻科學(xué)意義的現(xiàn)象學(xué)模型. 本節(jié)針對(duì)此類系統(tǒng), 介紹離出現(xiàn)象及其相關(guān)動(dòng)力學(xué)行為的主要處理方法和近期研究進(jìn)展.
考慮一維隨機(jī)動(dòng)力系統(tǒng)
其中Bt為布朗運(yùn)動(dòng),為對(duì)稱α穩(wěn) 定Lévy 過程, 跳躍測(cè)度滿足να(dy)=c(1,α)|y|-1-αdy,Λ和σ分別是對(duì)應(yīng)的噪聲強(qiáng)度. 則系統(tǒng)的生成元為
引言中方程 (1) 和 (2) 分別給出了高斯白噪聲條件下平均首次離出時(shí)間和離出位置分布滿足的狄利克雷邊值問題. 根據(jù)Dynkin 公式, 針對(duì)形如式 (80) 的系統(tǒng), 平均離出時(shí)間v(x)仍滿足類似的方程 (Duan 2015)
只是其中的算子改為生成元 (81), 邊界條件由D的 邊界上的值改成D的補(bǔ)集Dc上的值.
另一方面, 由于Lévy 過程的跳躍特性, 離出位置分布的概念已不再適用, 因?yàn)橄到y(tǒng)離出時(shí)未必與邊界相交. 取而代之的是離出概率 (escape probability) 的概念, 即系統(tǒng)起始于區(qū)域D中的x,首次離出區(qū)域D時(shí)落在Dc的某個(gè)子集E內(nèi)的概率, 記為PE(x), 滿足下面的方程 (Duan 2015)
根據(jù)生成元的形式 (81), 可以發(fā)現(xiàn)方程 (82) 和 (83) 是微分-積分方程, 并且積分算子是奇異積分, 因此求解的難度遠(yuǎn)大于僅有高斯噪聲的情況. 由于復(fù)雜性較高, 目前處理此類問題的解析方法較少, 只有在特殊情況下能近似求解. 例如Λ=0,σ為小量, 即無高斯噪聲且Lévy 噪聲較弱,此時(shí)基于α穩(wěn)定Lévy 噪聲尾部的多項(xiàng)式衰減特性, 可利用多項(xiàng)式級(jí)數(shù)攝動(dòng)近似平均離出時(shí)間和離出概率 (Qiao & Duan 2015).
然而, 多數(shù)情況下, 得到這兩個(gè)方程的理論解是較為困難的, 為此發(fā)展相應(yīng)的數(shù)值方法是十分必要的. 通過將積分分割為并數(shù)值離散化, 且利用差分代替微分,Gao 等 (2014) 設(shè)計(jì)了一個(gè)有效的數(shù)值方法用來計(jì)算平均離出時(shí)間和離出概率. 基于此方法, Wu等 (2018) 計(jì)算了一個(gè)基因表達(dá)模型的平均離出時(shí)間、離出概率和隨機(jī)吸引域 (stochastic basins of attraction), 采用非高斯與高斯噪聲強(qiáng)度之比來識(shí)別轉(zhuǎn)移過程中的最優(yōu)選擇. Cai 等 (2017) 通過計(jì)算離出時(shí)間與離出概率來刻畫神經(jīng)元系統(tǒng)中α穩(wěn)定Lévy 噪聲誘導(dǎo)的興奮事件. Xu 等 (2016)通過計(jì)算穩(wěn)態(tài)概率密度和平均離出時(shí)間, 研究了非高斯噪聲對(duì)相干轉(zhuǎn)換和開/關(guān)轉(zhuǎn)換的影響. 反過來, 基于對(duì)平均離出時(shí)間的觀測(cè), Zhang 等 (2020) 設(shè)計(jì)了一個(gè)數(shù)據(jù)驅(qū)動(dòng)方法, 能夠從離出時(shí)間數(shù)據(jù)中提取具有高斯布朗噪聲或非高斯Lévy 噪聲的隨機(jī)微分方程.
為了從理論上確定最優(yōu)離出路徑, 本節(jié)引入Onsager-Machlup (OM) 理論. OM 理論是研究隨機(jī)動(dòng)力系統(tǒng)離出現(xiàn)象的常用方法, 其基本思想是利用圍繞某條路徑的固定厚度的管道的概率來代替這條路徑實(shí)現(xiàn)的可能性, 可以看成是Freidlin-Wentzell 大偏差理論在有限噪聲強(qiáng)度下的推廣. 在高斯噪聲情況下, OM 作用量泛函比Freidlin-Wentzell 作用量泛函多了一項(xiàng)漂移系數(shù)的散度項(xiàng), 在弱噪聲極限下OM 作用量泛函退化為Freidlin-Wentzell 作用量泛函的結(jié)果.
早在1953 年, Onsager 和Machlup (1953) 首先導(dǎo)出了具有線性漂移系數(shù)和常擴(kuò)散系數(shù)的擴(kuò)散過程的OM 泛函. Tisza 和Manning (1957) 隨后對(duì)非線性系統(tǒng)進(jìn)行了擴(kuò)展. 此外, Dürr 和Bach(1978) 提出了另一種推導(dǎo)OM 泛函的方法, 將Girsanov 變換應(yīng)用于擴(kuò)散過程誘導(dǎo)的測(cè)度. Chao和Duan (2019) 將此方法推廣到求解 (非高斯) Lévy 噪聲和 (高斯) 布朗噪聲下隨機(jī)動(dòng)力系統(tǒng)的更復(fù)雜情況. Tang 等 (2014, 2017) 從另一個(gè)方面進(jìn)一步推導(dǎo)了帶乘性高斯噪聲的過阻尼朗之萬(wàn)方程和一般隨機(jī)解釋的OM 泛函. 綜合以上研究成果, 本節(jié)介紹較為一般的乘性高斯噪聲和加性非高斯Lévy 噪聲驅(qū)動(dòng)下的隨機(jī)動(dòng)力系統(tǒng)的OM 理論.
考慮下面的n維隨機(jī)動(dòng)力系統(tǒng)
其中Bt=[B1,t, B2,t ··· , Bn,t]T是n維布朗運(yùn)動(dòng),Lt=[L1,t, L2,t ··· , Ln,t]T是非高斯Lévy 過程, 其跳躍測(cè)度ν滿足. Lévy 過程的大幅值跳躍可以通過交錯(cuò) (interlacing) (Applebaum 2009) 方法來處理, 因此這里只考慮小跳躍是第4 節(jié)引入的補(bǔ)償Poisson 隨機(jī)測(cè)度. 向量f(x)=[f1(x), f2(x), ··· , fn(x)]T為漂移系數(shù),ΛΛT是擴(kuò)散矩陣.
對(duì)于具有乘性高斯噪聲的方程 (84), 選擇積分方法時(shí)的模糊性會(huì)導(dǎo)致不同的隨機(jī)解釋, 一般表示法為α-解釋 (Shi et al. 2012). 為了避免與α穩(wěn)定Lévy 噪聲的參數(shù)混淆, 采用κ解釋代替α.κ=0,κ=1/2和κ=1分別對(duì)應(yīng)于It?, Stratonovich 和anti- It?的解釋. 通過修正漂移項(xiàng), 隨機(jī)微分方程 (84) 可以轉(zhuǎn)化為統(tǒng)一的Stratonovich 形式
其中
記為修正的漂移系數(shù). 使用這種統(tǒng)一的Stratonovich 形式的優(yōu)點(diǎn)是可以簡(jiǎn)單地應(yīng)用普通的微積分法則, 由此為路徑積分法推導(dǎo)后續(xù)的OM 函數(shù) (Tang et al. 2014) 帶來了一些便利. 事實(shí)上,統(tǒng)一隨機(jī)解釋形式的選擇只影響推導(dǎo)過程, 而不影響OM 函數(shù)的結(jié)果.
在隨機(jī)擾動(dòng)下, 亞穩(wěn)態(tài)之間可能發(fā)生躍遷. 在這個(gè)過程中, 最感興趣的是確定最大可能的轉(zhuǎn)移路徑. 由于單條路徑的概率必然為零, 需要研究隨機(jī)軌跡通過某條路徑的鄰域或管道的概率.在給定管道厚度的條件下, 軌道留在管內(nèi)的概率實(shí)際上描述了這一特定路徑實(shí)現(xiàn)的可能性. 更準(zhǔn)確地說, 考慮一個(gè)圍繞參考路徑φ(t),t ∈[0, T]的管道. 如果δ足夠小, 則解過程x(t)落在管道內(nèi)的概率可按以下形式估算
因此, 類似于Freidlin-Wentzell 大偏差理論的結(jié)果, OM 泛函的全局最小值對(duì)應(yīng)于具有最大概率的路徑, 即最優(yōu)路徑. 于是, 概率的計(jì)算轉(zhuǎn)化為OM 泛函的變分問題. 基于分析力學(xué)的經(jīng)典結(jié)果, 連接點(diǎn)x0和點(diǎn)xf的最優(yōu)路徑滿足歐拉-拉格朗日方程
其邊界條件為x(0)=x0和x(T)=xf. 這里將符號(hào)φ替換為了x. 因?yàn)檫@是一個(gè)二階微分方程, 將它轉(zhuǎn)化為一個(gè)等價(jià)的哈密頓系統(tǒng)對(duì)于數(shù)值積分會(huì)更為方便
這里,H(x,p)是OM 函數(shù)的Legendre 變換,p=OM(x˙,x)/x˙為動(dòng)量. 解(x(t),p(t))到坐標(biāo)空間的投影x(t)給出了最優(yōu)路徑.
根據(jù)文獻(xiàn) (Chao & Duan 2019, Tang et al. 2014), 方程 (87) 的OM 函數(shù)在不考慮加性常數(shù)的情況下由下式給出
其中Tr[A]=. 為了方便, 記yνdy. 則Legendre 變換計(jì)算出的哈密頓量為
因此, 哈密頓系統(tǒng)具有下面的形式
若高斯噪聲為加性的, 方程約化為
對(duì)式 (90) 中OM 函數(shù)的形式作兩點(diǎn)說明. 一方面, 如果考慮α穩(wěn)定的Lévy 運(yùn)動(dòng), 則條件<∞要求0<α <1.另一方面, 當(dāng)令式 (90) 中的ν=0時(shí), 它恢復(fù)為擴(kuò)散過程的OM函數(shù). 換句話說, Lévy 噪聲對(duì)躍遷現(xiàn)象的影響反映在式 (90) 中OM 函數(shù)的第三項(xiàng)中. 特別地, 如果Lévy 運(yùn)動(dòng)是對(duì)稱的, 則結(jié)果與擴(kuò)散過程的結(jié)果是一致的.
注意5.2 節(jié)中的方程 (93) 是一個(gè)常微分方程的兩點(diǎn)邊值問題, 通??梢杂胹hooting 方法來處理. 也就是說, 可以調(diào)整動(dòng)量的初始值并對(duì)方程進(jìn)行數(shù)值積分, 直到終點(diǎn)x(T)抵達(dá)xf. 然而, 這種方法在實(shí)踐中仍存在兩個(gè)不足之處. 第一, 通常選擇一個(gè)稱為亞穩(wěn)態(tài)的穩(wěn)定不動(dòng)點(diǎn)作為初始點(diǎn)x0來考慮它的躍遷. 由于共軛動(dòng)量方程 (即式 (93) 中的第二個(gè)方程) 包含-(?f)Tp, 因此在時(shí)間上向前的數(shù)值積分在數(shù)值上是不穩(wěn)定的, 甚至是不適定的. 此外, 在高維系統(tǒng)中會(huì)出現(xiàn)另一個(gè)問題,即很難決定應(yīng)該調(diào)整初始動(dòng)量的哪一分量. Li 等 (2021) 設(shè)計(jì)了一個(gè)機(jī)器學(xué)習(xí)方法來解決這兩個(gè)問題, 算法分為哈密頓系統(tǒng)的重公式化和神經(jīng)網(wǎng)絡(luò)算法兩部分.
首先, 為了處理動(dòng)量的發(fā)散問題, 記ST[x(t)]=dt并且
其中C1={x ∈C[0,T]|x(0)=x0, x(T)=xf}. 另外, 定義
其中C0={x ∈C[0,T]|x(0)=x0}. 注意這個(gè)極小化并不在終點(diǎn)上施加約束. 換句話說, 函數(shù)空間C0刻畫了起始于 x0無所謂終點(diǎn)的連續(xù)軌道的集合. 事實(shí)上,I?(λ)和I(xf)構(gòu)成一組Fenchel-Legendre 變換對(duì).
I?(λ)和I(xf)的關(guān)系事實(shí)上允許處理最小化問題 (95) 來代替 (94). 式(95) 的變分結(jié)果導(dǎo)出下面的哈密頓系統(tǒng)
從式 (89) 可以看出, 邊界條件約束在初始坐標(biāo)和最終坐標(biāo)上, 但在動(dòng)量上不存在. 而在式(96) 中, 它們被轉(zhuǎn)換成一個(gè)坐標(biāo)的邊界條件和另一個(gè)動(dòng)量的邊界條件. 這種操作的好處是顯而易見的. 式 (96) 的計(jì)算是時(shí)間前向積分x(t),然后時(shí)間后向積分動(dòng)量p(t). 這種方法成功地解決了前面提到的shooting 方法的第一個(gè)缺點(diǎn), 因?yàn)閮蓚€(gè)方向的積分都是收斂的.
這個(gè)方法的算法總結(jié)如下:
算法1:
Step 1 給定λ的一個(gè)值和一條初始軌跡xk(t)(初始k=1);
Step 2 從p(T)=λ時(shí)間后向積分方程(xk,p)得到pk;
Step 3 從x(0)=x0時(shí)間前向積分方程(x,pk)得到xk+1;
Step 4 迭代Step 2 和Step 3 直到收斂.
接下來, 如何根據(jù)x的 終點(diǎn)邊界條件確定λ的值可以通過一個(gè)深度神經(jīng)網(wǎng)絡(luò)來完成, 該神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖5 所示. 根據(jù)研究目的, 輸入和輸出狀態(tài)分別固定為xf和λ,每個(gè)狀態(tài)都有n個(gè)分量.假設(shè)在輸入和輸出之間有L層隱藏層, 第l層有nl個(gè)神經(jīng)元,l=1,2, ··· , L. 因此, 一個(gè)復(fù)雜的非線性函數(shù)可以用一系列簡(jiǎn)單函數(shù)的復(fù)合來近似
圖 5具有 L層隱藏層的神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu). xfi和λi,i=1, 2, ··· , n分別是神經(jīng)網(wǎng)絡(luò)的輸入和輸出.表示第 l層第 j個(gè)神經(jīng)元的值,其中j =1, 2, ··· , nl,l=1, 2, ··· , L
每層的函數(shù)g(l)(·)定義為
為方便起見, 記a(0)=xf和a(L+1)=λ.此外,W(l)和b(l)分別稱為權(quán)重矩陣和偏置向量.σ(l)表示一個(gè)非線性激活函數(shù), 應(yīng)用于變量的每個(gè)分量上, 常用的函數(shù)有sigmoid, tanh, ReLu 等. 接下來, 對(duì)所有隱藏層使用ReLu 函數(shù)ReLu(x)=max{0,x}.而輸出層選擇恒同函數(shù), 以覆蓋λ的空間.
令θ為這個(gè)神經(jīng)網(wǎng)絡(luò)參數(shù)的集合, 即θ={W(l), b(l):l=1,2, ··· , L+1}. 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是通過對(duì)參數(shù)θ進(jìn)行優(yōu)化, 使其輸出狀態(tài)能夠最優(yōu)地逼近λ(xf).具體來說,假設(shè)有數(shù)據(jù)集D=, 并引入網(wǎng)絡(luò)預(yù)測(cè)和目標(biāo)之間的L2距離作為損失函數(shù)(loss function). 然后通過搜索最優(yōu)參數(shù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練, 求解損失函數(shù)的非線性回歸問題
λNN表示輸入數(shù)據(jù)時(shí)網(wǎng)絡(luò)的輸出. 一般地, 最小化參數(shù)通過梯度下降法進(jìn)行迭代
其中學(xué)習(xí)率 (learning rate)η是一個(gè)較小的數(shù).
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程總結(jié)如下:
算法2:
Step 1 給定數(shù)據(jù)集和初始參數(shù)集θ0;
Step 2 應(yīng)用前向傳播計(jì)算網(wǎng)絡(luò)的輸出和代價(jià)函數(shù);
Step 3 應(yīng)用后向傳播計(jì)算代價(jià)函數(shù)對(duì)參數(shù)的梯度;
Step 4 利用方程 (100) 迭代參數(shù);
Step 5 迭代直到收斂.
作為總結(jié), 算法框架如下:
算法3:
Step 1 生成數(shù)據(jù): 具體來說, 在λ的空間的一個(gè)合適的區(qū)域隨機(jī)選擇M個(gè)點(diǎn). 將初始點(diǎn)固定在系統(tǒng)的穩(wěn)態(tài), 利用算法1, 對(duì)λ的每個(gè)點(diǎn)計(jì)算最大可能路徑x(t);
Step 2 訓(xùn)練神經(jīng)網(wǎng)絡(luò): 基于算法2, Step 1 生成的數(shù)據(jù)可用于訓(xùn)練神經(jīng)網(wǎng)絡(luò), 其中x(T)為輸入,λ為輸出;
Step 3 測(cè)試: 給定某個(gè)終點(diǎn)xtest,利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)來計(jì)算對(duì)應(yīng)的輸出λtest;
Step 4 計(jì)算最大可能路徑: 再次利用算法1 對(duì)λtest計(jì)算最大可能路徑, 將終點(diǎn)與xtest做對(duì)比.
此機(jī)器學(xué)習(xí)方法在兩個(gè)典型例子中的成功應(yīng)用(Li et al. 2021a), 證實(shí)了它對(duì)于有或沒有Lévy 噪聲、加性或弱乘性高斯噪聲、不同隨機(jī)積分解釋 (It?意義、Stratonovich 意義和anti-It?意義) 的系統(tǒng)以及各種維數(shù)的系統(tǒng)的有效性. 結(jié)果表明, 該方法相比非高斯噪聲更適用于高斯噪聲, 相比乘性噪聲更適用于加性噪聲, 該算法對(duì)Stratonovich 意義是最有效的, 然后anti- It?的,再之后It?的.
這種方法還可以推廣到其他類似的問題. 例如, 除了OM 理論外, 在計(jì)算Freidlin-Wentzell 的大偏差理論下的最大可能路徑時(shí)仍然可行. 更廣泛地說, 它也可以應(yīng)用于其他領(lǐng)域, 如最優(yōu)控制問題等.
最后, 值得注意的是, 該算法在實(shí)際應(yīng)用中還存在一個(gè)挑戰(zhàn). 如果積分結(jié)果的數(shù)據(jù)xf分布相對(duì)均勻, 則可以更有效、更準(zhǔn)確地訓(xùn)練神經(jīng)網(wǎng)絡(luò). 然而, 如果這些點(diǎn)集中在幾個(gè)特定的區(qū)域中, 由于損失函數(shù)在各個(gè)區(qū)域的權(quán)重差異過大, 則效果不佳. 因此, 該算法的成功應(yīng)用要求系統(tǒng)的向量場(chǎng)具有某種均勻性.
盡管具有Lévy 噪聲的隨機(jī)動(dòng)力系統(tǒng)的OM 作用量泛函已有結(jié)果, 然而它只對(duì)某一類Lévy噪聲成立, 應(yīng)用具有局限性. 另一方面, 理論結(jié)果也需得到數(shù)值方法的驗(yàn)證. 因此, 發(fā)展其他的計(jì)算最大可能路徑的方法是十分必要的. 基于轉(zhuǎn)移概率密度滿足的Fokker-Planck 方程, Zheng 等(2020) 開發(fā)了一種計(jì)算最大可能路徑的最大似然法.
為了方便表示, 以一維系統(tǒng)為例
p(x(t)=u)代表隨機(jī)微分方程 (101) 的解位于x(t)=u的概率密度, p(u,t|z,s)表示給定x(s)=z的條件下到x(t)=u的轉(zhuǎn)移概率密度, 其中0 ≤s <t≤tf, 即
根據(jù) (Duan 2015), 轉(zhuǎn)移概率密度p(u,t|z,s)滿足下面的Fokker-Planck 方程
右邊的積分部分實(shí)際上是非局部或分?jǐn)?shù)階拉普拉斯算子, 對(duì)應(yīng)非高斯α穩(wěn)定Lévy 擾動(dòng). 轉(zhuǎn)移概率密度的初始條件滿足
對(duì)任意的t ∈[0,tf],x, x0, xf ∈Rn,假設(shè)條件概率密度PA(x,t)用于刻畫在條件A下x(t)在時(shí)刻t位于點(diǎn)x的概率密度. 這里, 條件A指初始條件x(0)=x0和終止條件x(tf)=xf. 根據(jù)馬氏性, 它可以表示為
在條件A下, 對(duì)任一時(shí)刻t ∈[0,tf],密度函數(shù)PA(x,t)出現(xiàn)的峰值位置對(duì)應(yīng)狀態(tài)xm(t). 這意味著, 在給定時(shí)刻t, 條件概率密度PA(x,t)的峰值位置xm(t)記為這些隨機(jī)軌道的最大可能位置, 即
將所有這些位置連接起來即得到從初始位置x(0)=x0轉(zhuǎn)移到終點(diǎn)位置x(tf)=xf的最大可能軌跡.
式 (105) 中的轉(zhuǎn)移概率密度p是 Fokker-Planck 方程 (103) 的解, 理論求解相當(dāng)困難. 為此, 基于時(shí)間-空間離散化的Toeplitz 矩陣結(jié)構(gòu), Gao 等 (2016) 提出了一種快速精確的數(shù)值算法用于計(jì)算具有吸收邊界或無窮區(qū)域的非局部Fokker-Planck 方程, 并證明了其收斂性. 目前, 這個(gè)方法已經(jīng)廣泛應(yīng)用于離出現(xiàn)象 (Chen X 2019)、隨機(jī)分岔 (Wang 2020) 和數(shù)據(jù)驅(qū)動(dòng)方法 (Zhang 2017) 等相關(guān)問題中. 另外, 機(jī)器學(xué)習(xí)方法也可以應(yīng)用于求解Fokker-Planck 方程, 例如Xu 等 (2020) 利用深度神經(jīng)網(wǎng)絡(luò)計(jì)算高斯噪聲下的概率密度, Chen 等 (2020) 基于樣本路徑數(shù)據(jù)求解同時(shí)具有高斯布朗噪聲和非高斯Lévy 噪聲的隨機(jī)系統(tǒng)Fokker-Planck 方程.
對(duì)于實(shí)際工程結(jié)構(gòu)和自然科學(xué)等問題的研究, 人們通常利用牛頓第二定律或拉格朗日力學(xué)等理論建立系統(tǒng)的動(dòng)力學(xué)方程. 通過求解此控制方程, 希望得到系統(tǒng)的響應(yīng), 或得到系統(tǒng)的一些動(dòng)力學(xué)性質(zhì), 例如計(jì)算不同穩(wěn)態(tài)的轉(zhuǎn)移路徑. 然而, 由于人們對(duì)許多復(fù)雜現(xiàn)象的內(nèi)部機(jī)制缺乏完備的理解, 如生物醫(yī)藥、腦科學(xué)、大氣科學(xué)等領(lǐng)域, 很難直接建立其顯式的運(yùn)動(dòng)方程. 幸運(yùn)的是,隨著科研工具和仿真能力的進(jìn)步, 人們能夠獲得越來越多的復(fù)雜系統(tǒng)數(shù)據(jù)集. 因此, 從噪聲數(shù)據(jù)中提取控制規(guī)律或動(dòng)力學(xué)特性在各個(gè)科學(xué)領(lǐng)域都起著至關(guān)重要的作用.
針對(duì)具有高斯布朗噪聲的隨機(jī)動(dòng)力系統(tǒng), Dai 等 (2020) 提出了一個(gè)數(shù)據(jù)驅(qū)動(dòng)框架, 用以從樣本數(shù)據(jù)中提取最大可能轉(zhuǎn)移路徑. 此方法的基本思想是, 先利用Kramers-Moyal 公式從樣本路徑數(shù)據(jù)中提取隨機(jī)微分方程的漂移和擴(kuò)散系數(shù), 然后利用前一子節(jié)的最大似然法計(jì)算最大可能路徑. 然而, 這種方法無法直接推廣到具有非高斯Lévy 噪聲的情況. 其原因在于,α穩(wěn)定分布的尾部多項(xiàng)式衰減, 具有重尾 (heavy-tailed) 特性, 其二階矩及以上必然發(fā)散, 一階矩是否發(fā)散依賴于α的取值. 因此, Kramers-Moyal 公式不再適用Lévy 噪聲的情況. 另一個(gè)難點(diǎn)在于此時(shí)的Fokker-Planck 方程是微分-積分方程, 這也使得問題變得更加復(fù)雜. 幸運(yùn)地是, Li 和Duan (2021) 推導(dǎo)的非局部 (nonlocal) Kramers-Moyal 公式有效解決了這個(gè)問題, 下面對(duì)此公式做簡(jiǎn)要介紹.
考慮一個(gè)n維 隨機(jī)動(dòng)力系統(tǒng)
其中b(x)=[b1(x), b2(x), ··· , bn(x)]T是 Rn中的漂移系數(shù),Bt=[B1,t, B2,t, ··· , Bn,t]T是n維布朗運(yùn)動(dòng),Λ(x)是一個(gè)n×n的矩陣,Lt=[L1,t, L2,t, ··· , Ln,t]T是具有正常數(shù)噪聲強(qiáng)度σ的對(duì)稱Lévy運(yùn)動(dòng). 假定初始條件為x(0)=z,a(x)=ΛΛT為擴(kuò)散矩陣,Lt的跳躍測(cè)度滿足ν(dy)=W(y)dy,y ∈Rn{0}.由于Lévy 運(yùn)動(dòng)的對(duì)稱性,W(-y)=W(y).
基于系統(tǒng) (107) 的Fokker-Planck 方程, 可以推導(dǎo)出下面的定理和推論.
定理1對(duì)每個(gè)ε>0,概率密度函數(shù)p(x,t|z,0)和跳躍測(cè)度、漂移、擴(kuò)散具有如下的關(guān)系:
(1) 對(duì)每個(gè)滿足|x-z|>ε的x和z
對(duì)x和z一致成立;
(2) 對(duì)i=1,2, ··· , n
(3) 對(duì)i,j=1,2, ··· , n
這個(gè)定理的思想可以按照下述方式理解. 在不含Lévy 噪聲的情況下, It?隨機(jī)微分方程的樣本軌道是概率1 連續(xù)的. 也就是說, 漂移系數(shù)和擴(kuò)散系數(shù)貢獻(xiàn)的是連續(xù)部分, 而Lévy 噪聲貢獻(xiàn)的是跳躍部分. 在很短的一段時(shí)間內(nèi), 大的跳躍幾乎都來自于Lévy 噪聲. 依據(jù)這個(gè)思想, 這個(gè)定理將相空間分割為球內(nèi)和球外兩部分. 球外部分 (即定理的第一條) 用來表達(dá)Lévy 跳躍項(xiàng), 球內(nèi)部分 (即定理的第二條和第三條) 用來表達(dá)漂移和擴(kuò)散項(xiàng). 由于將積分區(qū)域限制在球內(nèi), 從而有效避開了重尾特性導(dǎo)致積分發(fā)散的問題, 成功地將漂移、擴(kuò)散與Lévy 跳躍項(xiàng)利用轉(zhuǎn)移概率密度來表達(dá). 然而, 這個(gè)定理對(duì)于數(shù)值算法的設(shè)計(jì)并不友好. 為此, 可以將其改寫成下面的推論形式, 從而將漂移、擴(kuò)散與Lévy 跳躍項(xiàng)利用樣本路徑數(shù)據(jù)來表達(dá):
推論1對(duì)每個(gè)ε>0, 隨機(jī)微分方程 (107) 的解和跳躍測(cè)度、漂移、擴(kuò)散具有如下的關(guān)系:
(1) 對(duì)每個(gè)m>1
這個(gè)推論第二條和第三條與Kramers-Moyal 公式具有類似的形式, 因此這個(gè)推論可以稱為非局部Kramers-Moyal 公式. 對(duì)于推論的第一條, 考慮多個(gè)不同的區(qū)間, 可以近似得到Lévy 跳躍測(cè)度和噪聲強(qiáng)度. 關(guān)于第二條和第三條, 利用基函數(shù)的線性組合近似, 并結(jié)合最小二乘法, 可以估計(jì)出漂移與擴(kuò)散項(xiàng)的近似表達(dá)式. 具體的數(shù)據(jù)驅(qū)動(dòng)算法的設(shè)計(jì)參考文獻(xiàn) (Li & Duan 2021), 這里不再詳細(xì)介紹. 因此, 給定樣本路徑數(shù)據(jù), 利用非局部Kramers-Moyal 公式, 可以識(shí)別出具有高斯布朗噪聲和非高斯Lévy 噪聲的隨機(jī)動(dòng)力系統(tǒng), 結(jié)合上一節(jié)介紹的最大似然法, 可以計(jì)算出系統(tǒng)亞穩(wěn)態(tài)間轉(zhuǎn)移的最大可能路徑, 從而從樣本路徑數(shù)據(jù)中提取出了最大可能路徑.
最后, 可以發(fā)現(xiàn), 將這種方法擴(kuò)展到具有乘性Lévy 噪聲的隨機(jī)動(dòng)力系統(tǒng)的數(shù)據(jù)集是一個(gè)挑戰(zhàn). 在這種情況下, 乘性Lévy 噪聲破壞了定理1 中第一個(gè)斷言的“空間齊次性”, 導(dǎo)致函數(shù)W同時(shí)依賴于x和z(而不僅僅依賴于空間平移x-z), 從而給數(shù)據(jù)驅(qū)動(dòng)算法的設(shè)計(jì)帶來了困難 (Li &Duan 2021).
嚴(yán)格意義上, 在自然科學(xué)、社會(huì)科學(xué)和工程科學(xué)等領(lǐng)域中, 非高斯模型比高斯過程更具有普遍性, 但同時(shí)非線性非高斯噪聲系統(tǒng)的隨機(jī)動(dòng)力學(xué)行為亦更為復(fù)雜. 隨著人們對(duì)自然現(xiàn)象的描述越發(fā)精細(xì), 新的問題層出不窮, 對(duì)大偏差理論在非高斯隨機(jī)動(dòng)力系統(tǒng)的應(yīng)用提出了更多的挑戰(zhàn).以發(fā)展的眼光來看, 從以下幾個(gè)方面提出一些潛在性問題:
(1) 如前所述, 用于計(jì)算隨機(jī)混合系統(tǒng)的離出問題的哈密頓量是一個(gè)符號(hào)矩陣的主特征值.然而, 對(duì)于高維的問題, 目前只有個(gè)別特殊系統(tǒng)能夠解析求解. 對(duì)于一般的隨機(jī)混合系統(tǒng), 如何解析近似或數(shù)值計(jì)算其哈密頓量仍是一個(gè)巨大的挑戰(zhàn);
(2) 近年來隨著計(jì)算機(jī)技術(shù)的蓬勃發(fā)展, 機(jī)器學(xué)習(xí)方法以其強(qiáng)大的功能被廣泛應(yīng)用于解決動(dòng)力系統(tǒng)中的難題, 如利用機(jī)器學(xué)習(xí)方法求解哈密頓-雅可比方程、Fokker-Planck 方程和變分問題等. 由于計(jì)算大偏差問題中的最大可能路徑和擬勢(shì)的難度較大, 在大量觀測(cè)和模擬數(shù)據(jù)的基礎(chǔ)上, 利用機(jī)器學(xué)習(xí)方法來求解大偏差問題具有廣闊的應(yīng)用前景.
致 謝國(guó)家自然科學(xué)基金資助項(xiàng)目 (11772149).