国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

量子生成模型*

2021-08-05 07:35孫太平吳玉椿2郭國平2
物理學(xué)報 2021年14期
關(guān)鍵詞:量子態(tài)比特量子

孫太平 吳玉椿2)? 郭國平2)3)

1) (中國科學(xué)技術(shù)大學(xué), 中國科學(xué)院量子信息重點實驗室, 合肥 230026)

2) (合肥綜合性國家科學(xué)中心人工智能研究院, 合肥 230088)

3) (合肥本源量子計算科技有限責(zé)任公司, 合肥 230026)

近年來, 很多基于生成模型的機器學(xué)習(xí)算法, 如生成對抗網(wǎng)絡(luò)、玻爾茲曼機、自編碼器等, 在數(shù)據(jù)生成、概率模擬等方面有廣泛的應(yīng)用. 另一方面, 融合量子計算和經(jīng)典機器學(xué)習(xí)的量子機器學(xué)習(xí)算法也不斷被提出.特別地, 量子生成模型作為量子機器學(xué)習(xí)的分支, 目前已有很多進展. 量子生成算法是一類量子-經(jīng)典混合算法, 算法中引入?yún)?shù)量子線路, 通過執(zhí)行參數(shù)線路得到損失函數(shù)及其梯度, 然后通過經(jīng)典的優(yōu)化算法來優(yōu)化求解, 從而完成對應(yīng)的生成任務(wù). 與經(jīng)典生成模型相比, 量子生成模型通過參數(shù)線路將數(shù)據(jù)流映射到高維希爾伯特空間, 在高維空間中學(xué)習(xí)數(shù)據(jù)的特征, 從而在一些特定問題上超越經(jīng)典生成模型. 在中等規(guī)模含噪聲的量子體系下, 量子生成模型是一類有潛力實現(xiàn)量子優(yōu)勢的量子機器學(xué)習(xí)算法.

1 引 言

在經(jīng)典計算領(lǐng)域, 生成模型被廣泛應(yīng)用于各個領(lǐng)域, 如圖像生成[1]、語音合成[2]、藥物設(shè)計[3]、圖像轉(zhuǎn)換[4]等. 近來已有對經(jīng)典生成模型的量子版本的研究, 如量子生成對抗網(wǎng)絡(luò)[5,6]、量子玻恩機[7,8]、量子玻爾茲曼機[9-12]、量子自編碼器[13-15]以及量子貝葉斯網(wǎng)絡(luò)[16]等.

量子生成模型是受經(jīng)典機器學(xué)習(xí)模型啟發(fā), 使用量子計算機來改進經(jīng)典模型中的生成步驟, 以完成數(shù)據(jù)生成、概率模擬任務(wù)的一類算法.

這類算法的主要步驟是, 通過量子線路生成量子態(tài), 用量子態(tài)觀測結(jié)果構(gòu)建損失函數(shù), 再通過經(jīng)典的優(yōu)化算法進行迭代優(yōu)化, 從而得到最優(yōu)的參數(shù)變量集合以完成相應(yīng)的生成任務(wù). 因此, 這些算法被統(tǒng)稱為量子-經(jīng)典混合算法. 這種量子-經(jīng)典混合的閉環(huán)優(yōu)化思想始于變分量子算法[17], 即通過量子計算機和參數(shù)化量子門操作集合獲得分子的量子態(tài)表示, 測量分子模型對應(yīng)的哈密頓量的期望值, 以此作為目標函數(shù)進行變分優(yōu)化.

量子相位估計[18]在大數(shù)分解[18]、HHL[19]等被證明有量子優(yōu)勢的算法上具有廣泛的應(yīng)用, 但基于以下原因相位估計算法無法在當前的計算體系下有效實現(xiàn): 1) 當前硬件體系多集中于單量子門和兩比特糾纏門的實現(xiàn), 相位估計用到的受控幺正門(c-Uj)必須分解為基本門的組合, 此過程會顯著降低受控幺正門的保真度; 2) 相位估計用到的量子傅里葉逆變換需要O(n2) (n為量子比特個數(shù))數(shù)量級的量子門, 使得深層量子線路的態(tài)保真度無法達到量子計算要求. 量子計算體系的噪聲不可避免, 當前只有中等規(guī)模的量子比特、無法實現(xiàn)有效的量子糾錯[20]技術(shù), 這使量子-經(jīng)典混合算法受到廣泛關(guān)注.

盡管已有多種量子生成任務(wù)在真實量子芯片上完成, 如利用量子生成對抗網(wǎng)絡(luò)進行圖像生成與識別[21], 但對于參數(shù)量子線路(Parameterized Quantum Circuit, PQC, 見附錄)的表示能力與經(jīng)典網(wǎng)絡(luò)相比是否具有優(yōu)勢還缺少理論的結(jié)果.Du等[22]嘗試從內(nèi)在的線路結(jié)構(gòu)出發(fā)證明其結(jié)論,而經(jīng)典深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)和量子線路的比較還沒有結(jié)論. 同樣的, 量子生成網(wǎng)絡(luò)作為量子機器學(xué)習(xí)的一部分, 如何將經(jīng)典數(shù)據(jù)轉(zhuǎn)化為量子態(tài)、如何從測量結(jié)果獲取經(jīng)典信息仍需要更直觀更普適的方法.

本文主要分析一些常見量子生成模型的優(yōu)勢和劣勢, 并對其擴展性展開討論. 量子生成模型的分類與經(jīng)典生成模型類似, 是以任務(wù)為導(dǎo)向的. 量子生成模型基本沿襲與之對應(yīng)的經(jīng)典生成模型的命名, 如量子生成對抗網(wǎng)絡(luò)是使用量子線路來完成經(jīng)典生成對抗任務(wù)的一種量子生成模型. 對于利用量子體系特有的性質(zhì)以完成生成任務(wù)的, 如量子玻恩機, 則是用量子專有的玻恩測量命名. 還有一些模型保留了原作者的命名方式, 歸并在“其他生成模型”這一節(jié)進行介紹. 一些量子生成模型如量子生成對抗網(wǎng)絡(luò)、量子玻恩機、量子自編碼器等用到的參數(shù)量子線路, 在附錄里會有詳細的介紹. 通過對這些模型的比較, 可以從不同角度理解量子生成模型的構(gòu)建思路, 以此為不同的計算任務(wù)構(gòu)建與之適應(yīng)的計算模型提供啟發(fā).

2 量子生成模型

2.1 量子生成對抗網(wǎng)絡(luò)

經(jīng)典的生成對抗網(wǎng)絡(luò)[23](generative adversarial Network, GAN)被視為深度學(xué)習(xí)中的前沿進展. GAN在生成圖像[1]、語音[2]、文本[24]等方面具有非常廣泛的應(yīng)用. 經(jīng)典生成對抗網(wǎng)絡(luò)是一類有兩個玩家的博弈游戲, 一個是生成器(generator), 記為G, 另一個為鑒別器(discriminator), 記為D. 對于已存在的源數(shù)據(jù)→x~pdata, 生成器G生成新的數(shù)據(jù)以逼近真實的源數(shù)據(jù)分布, 使D無法區(qū)分數(shù)據(jù)的來源; 而鑒別器D對每個輸入數(shù)據(jù)給出真或假的決策概率, 以最大程度地區(qū)分這兩類數(shù)據(jù).

如果G產(chǎn)生的數(shù)據(jù)足夠逼近目標數(shù)據(jù), D無論對于何種輸入數(shù)據(jù), 都有50%的幾率誤判, 這時生成對抗網(wǎng)絡(luò)就達到了Nash平衡點. 設(shè)真實的源數(shù)據(jù)標簽為1, 由G產(chǎn)生的數(shù)據(jù)標簽為0, D輸出(0,1)間的概率值, 那么生成對抗網(wǎng)絡(luò)的損失函數(shù)可以被定義為:

生成對抗網(wǎng)絡(luò)的訓(xùn)練策略是, 更新其中一方的參數(shù)時, 另一方的參數(shù)保持不變. 對于上述的損失函數(shù)模型, 優(yōu)化任務(wù)為 m inθGmaxθDL(D,G). 采用經(jīng)典神經(jīng)網(wǎng)絡(luò)構(gòu)建的GAN模型, 可以用反向傳播算法來實現(xiàn)梯度計算.

量子的生成對抗網(wǎng)絡(luò)[5,21,25,26](quantum GAN,QGAN)基本保留了經(jīng)典生成對抗模型的特征, 不同之處在于量子生成對抗網(wǎng)絡(luò)用到的數(shù)據(jù)集既可以是量子的也可以是經(jīng)典的, 而且可選擇地, 生成器與鑒別器也可以為經(jīng)典神經(jīng)網(wǎng)絡(luò)或參數(shù)量子線路.

對于數(shù)據(jù)是量子的, 生成器與鑒別器也都是量子的情況, Dallaire-Demers等[5]提出了這樣的QGAN模型: 源數(shù)據(jù)的概率分布模型為pR(x) , 由某個未知(有可能很復(fù)雜)的過程R生成. 由參數(shù)θG確定的生成器G生成新的數(shù)據(jù)樣本, 由參數(shù)θD確定的鑒別器D識別這兩類數(shù)據(jù). 用標簽λ指定源數(shù)據(jù)中的類別,, 考慮噪聲|z〉 , 可以按照(1)式定義與參數(shù)有關(guān)的損失函數(shù)L(θD,θG) , 這里D的輸入是R(|λ〉) 或G(θG,|λ,z〉)) :

其中含φ的項是調(diào)整源數(shù)據(jù)和生成部分占整體的比例. 一般取Dallaire-Demers等構(gòu)建的量子生成對抗網(wǎng)絡(luò)線路圖如圖1所示.

圖1 量子生成對抗網(wǎng)絡(luò)結(jié)構(gòu)[5]Fig. 1. The general structure of QGAN[5].

量子生成對抗網(wǎng)絡(luò)的任務(wù)就是通過參數(shù)優(yōu)化來實現(xiàn) m inθGmaxθDL(θD,θG) , 從而得到最接近于源數(shù)據(jù)概率分布的分布模型與鑒別模型. 量子線路的梯度可以用數(shù)值差分[27]、參數(shù)位移法則[27]、以及Hadamard test線路[5]來求. Dallaire-Demers在數(shù)值模擬上實現(xiàn)了源數(shù)據(jù)為|0〉,|1〉 兩個量子態(tài)的生成對抗任務(wù).

Lloyd等[6]討論了當數(shù)據(jù)是量子的, 鑒別器是量子或經(jīng)典的, 生成器是經(jīng)典的量子生成對抗模型. Lloyd所述的量子數(shù)據(jù)是通過對一個量子體系進行固定的測量得到的數(shù)據(jù)分布. 根據(jù)量子優(yōu)越性[19]的表述, 經(jīng)典的生成器不能有效地匹配量子數(shù)據(jù)分布, 或者更準確地, 除非有指數(shù)的資源可用,經(jīng)典的生成器無法模擬量子數(shù)據(jù)的分布pR(x). 對于數(shù)據(jù)是經(jīng)典的, 生成器和鑒別器都是量子的情況, Lloyd通過對比得出, 經(jīng)典的生成器和鑒別器在計算梯度時需要O(N2) 個比特和O(N2) 步時間(N是經(jīng)典數(shù)據(jù)的維度), 而量子的生成器和鑒別器在計算協(xié)方差矩陣時, 如果矩陣是低秩和稀疏的,需要O(logN) 個量子比特和O(poly(logN)) 個邏輯門操作.

Zeng等[26]結(jié)合量子玻恩機構(gòu)建了經(jīng)典數(shù)據(jù)-量子生成器-經(jīng)典鑒別器的量子生成對抗模型, 實現(xiàn)條帶圖(bars and stripes, BAS)[8,16,26,28]的概率生成與識別(見第2節(jié)). 類似的, Situ等[29]將BAS圖的每個點都編碼至量子比特上, 通過參數(shù)量子線路構(gòu)建的生成器生成量子態(tài), 測量結(jié)果輸入至經(jīng)典神經(jīng)網(wǎng)絡(luò)構(gòu)建的鑒別器, 也實現(xiàn)了BAS圖的生成.Zouful等[25]通過測量量子態(tài)在計算基上的投影,將其轉(zhuǎn)化為數(shù)據(jù)對應(yīng)的概率, 以此為基礎(chǔ)構(gòu)建生成對抗網(wǎng)絡(luò), 實現(xiàn)了對數(shù)正態(tài)分布、雙峰高斯分布等概率分布的學(xué)習(xí)和生成. 值得注意的是, 連續(xù)數(shù)據(jù)被截斷并舍入到臨近整數(shù)值, 所以該模型仍是離散數(shù)據(jù)的概率學(xué)習(xí)模型.

隨著量子硬件操控水平的提高, 在量子芯片上實現(xiàn)量子生成對抗網(wǎng)絡(luò)已經(jīng)有相關(guān)的工作. Hu[30]等利用超導(dǎo)量子體系首次實現(xiàn)了具有量子數(shù)據(jù)、量子生成器、量子鑒別器的量子生成對抗網(wǎng)絡(luò)的實驗驗證, 生成保真度高達98.8%. 在Hu的實驗中, 量子數(shù)據(jù)為單比特量子態(tài), 生成器參數(shù)為量子門旋轉(zhuǎn)角度. 在優(yōu)化D或G時采用梯度下降算法, 量子系統(tǒng)的操控和測量通過FPGA(field programmable gate arrays)實現(xiàn), 線路梯度通過經(jīng)典計算機估算得到. 該實驗對于NISQ體系下的量子機器學(xué)習(xí)優(yōu)勢的探索具有重要意義. 此外, Huang等[21]通過將測量量子生成器得到的數(shù)據(jù)作為經(jīng)典圖像灰度值, 完成了手寫數(shù)字集0和1的生成對抗任務(wù), 為量子比特資源受限條件下經(jīng)典數(shù)據(jù)的生成提供了一個思路.

2.2 量子玻恩機

量子玻恩機[7,8](quantum circuit Born machine,QCBM)是基于波函數(shù)的概率解釋的一種模型. 量子玻恩機將概率分布編碼至初態(tài)上, 把量子態(tài)在計算基上的投影作為數(shù)據(jù)的概率. 量子玻恩機是一種隱式的生成模型, 因為我們實際上并不需要知道這個純態(tài)的密度矩陣, 而只需要知道疊加態(tài)振幅的模值. 這樣的設(shè)定對量子線路的結(jié)構(gòu)限制也更少, 所以一般被認為具有更強的表示能力.

對目標概率分布 π (x) 進行采樣得到數(shù)據(jù)集D={x}, QCBM通過參數(shù)量子線路把初態(tài)|0〉 演化為|ψθ〉 , 并在計算基上的測量得到生成數(shù)據(jù)x~pθ(x)=|〈x|ψθ〉|2的概率分布. 訓(xùn)練目標是讓模型的概率分布pθ接近真實數(shù)據(jù)分布 π (x). QCBM采用所謂的MMD(Maximum Mean Discrepancy)損失函數(shù):

其中φ將x映射到高維Hilbert空間. 進一步地,定義核函數(shù)K(x,y)=φ(x)Tφ(y) , (3)式即可避免在高維空間中進行運算, 等價于

核函數(shù)可以取為高斯形式:K(x,y)=直接計算上述損失函數(shù)的梯度比較困難, 但可以證明, 下式無偏地等價于梯度:

其中pθ+(x) 和pθ-(x) 是在參數(shù)下 的模型輸出概率,是參數(shù)空間的第 (l,α) 個單位矢量(α和l分別表示迭代的步數(shù)與當前迭代的第l個參數(shù)的下標).

對所有量子比特進行測量, 會得到計算基上的概率分布. 源數(shù)據(jù)被映射為經(jīng)典的比特流數(shù)據(jù), 與量子態(tài)的計算基一一對應(yīng). 這種映射是一種同構(gòu),源數(shù)據(jù)空間和映射空間一樣大, 因此數(shù)據(jù)集的數(shù)據(jù)必須是有限的. 對于N個數(shù)據(jù)的集合, 需要n~O(log(N))個量子比特. 而生成線路中所用的量子門個數(shù)一般為O(poly(n)).

量子玻恩機是一種隱式生成模型, 模型本身并不涉及經(jīng)典數(shù)據(jù)的特征維度, 甚至不涉及數(shù)據(jù)本身的形態(tài). 在量子體系中不需要考慮數(shù)據(jù)的原本面貌是什么. 無論是圖片、數(shù)字還是文字, 都會被編碼為經(jīng)典比特流數(shù)據(jù). 一旦數(shù)據(jù)同構(gòu)的方式確定了,基于量子線路的優(yōu)化體系就與原本的數(shù)據(jù)形態(tài)無關(guān)了.

利用量子玻恩機進行概率分布的學(xué)習(xí)和生成在條帶圖(bars and stripes, BAS)[8,16,26,28]任務(wù)中取得很好的結(jié)果, 對于理想的無誤差測量, 量子玻恩機生成真實數(shù)據(jù)分布的比率為95.7%[8]. 此外通過對量子玻恩機的非計算基測量, 可以得到更多的信息, 這種方法可用來生成先驗概率分布, 如經(jīng)典生成對抗網(wǎng)絡(luò)的先驗分布[31]. Cheng等[32]還從信息熵的角度比較了量子玻恩機與受限玻爾茲曼機[33,34], 為理解基于概率的生成模型和基于能量的生成模型提供了一個新的視角. Coyle等[35]提出一種量子玻恩機的子類—量子伊辛玻恩機—并引入量子核函數(shù)[36]來討論量子學(xué)習(xí)優(yōu)勢.

2.3 量子玻爾茲曼機

與前述模型不同, 量子玻爾茲曼機[9-12](quantum Boltzmann machine, QBM)需要一種專用的量子計算機—量子退火機.

經(jīng)典的玻爾茲曼機被廣泛用作機器學(xué)習(xí)的基礎(chǔ)工具, 例如深度信念網(wǎng)絡(luò)[37,38]和深度玻爾茲曼機[37,39]. 玻爾茲曼機是二進制數(shù)節(jié)點構(gòu)成的概率生成網(wǎng)絡(luò), 由可見節(jié)點和隱藏節(jié)點組成, 記為za,a=1,2,···,N, 其中N是總節(jié)點數(shù). 這里為了和后面的量子生成模型保持一致, 取za∈{+1,-1}而不是za∈{+1,0}. 為區(qū)別可見節(jié)點和隱藏節(jié)點, 我們分別記為zν,zi. 同時用向量符號v,h,z=(v,h) 表示可見態(tài)、隱藏態(tài)和組合態(tài). 在物理上其能量可以用伊辛模型表示:

其中ba,wab是在訓(xùn)練的過程中進行需要優(yōu)化的參數(shù). 定義負對數(shù)相似度損失函數(shù):

其中觀測到可見態(tài)h的概率為邊際分布Pv=那么玻爾茲曼機的任務(wù)就是優(yōu)化哈密頓量的參量θ∈{ba,wab}, 使邊際分布盡可能接近真實的數(shù)據(jù)分布這樣就可以用梯度的方法來優(yōu)化玻爾茲曼機:

其中 〈 ···〉 和 〈 ···〉v分別為對自由變量的玻爾茲曼均值以及對可見變量的玻爾茲曼均值.是雙重均值. 這樣我們就得到更新法則:

關(guān)于如何估算等式右邊的兩項均值, 在機器學(xué)習(xí)領(lǐng)域已經(jīng)有較多的方案, 其中一個簡化的玻爾茲曼機模型—稱之為受限玻爾茲曼機(restricted Boltzmann machine, RBM)—已經(jīng)成功的應(yīng)用于實例[40].

量子玻爾茲曼機的出發(fā)點是使用作為物理實體的量子比特來替代經(jīng)典的比特或節(jié)點. 然而不同的是, 量子力學(xué)體系的哈密頓量是 2N×2N維的矩陣. 而且量子力學(xué)算符大多是不對易的, 這對于求解梯度十分不便. 橫場伊辛模型的哈密頓量形式為:

其中I,σz,σx為泡利矩陣, 下標a表示作用于第a個量子比特. 與經(jīng)典玻爾茲曼機類似, 定義配分函數(shù)和密度矩陣分別為:Z=Tr[e-H],ρ=Z-1e-H. 對于給定的可見態(tài) |v〉 , 可定義邊際分布Pv=Tr[Λvρ],Λv=|v〉〈v|?Ih. 其 中Ih為 作 用在隱藏變量的單位陣.

那么類似地, 可以得到量子損失函數(shù)和對應(yīng)梯度為:

然而H和?θH并不對易, 也就是e-H?θH. 這樣在求解期望值的時候就會十分困難. 盡管Amin[9]通過分析的方法估算除了損失函數(shù)的界, 在一些特定的條件下可以估算損失函數(shù)的梯度, 但與前述量子生成模型相比, 參數(shù)更新的成本已然增加了.

盡管如此, 量子玻爾茲曼機仍然可以用來完成監(jiān)督學(xué)習(xí)任務(wù), 可以生成概率分布, 可以進行鑒別學(xué)習(xí). Amin等[9]用量子玻爾茲曼機實現(xiàn)了伯努利分布的概率生成. Kieferová[12]用量子玻爾茲曼機設(shè)計了一種生成模型用以實現(xiàn)部分的量子態(tài)層析,并且除非BQP=BPP, 經(jīng)典計算機無法有效地模擬其訓(xùn)練過程. Dorband[41]在D-wave量子退火機上演示了量子玻爾茲曼機的構(gòu)建過程. 但是, 相較于其他量子生成模型, 量子玻爾茲曼機帶來的近似誤差是難以避免的, 同時也難以說明相較于經(jīng)典版本的優(yōu)勢所在.

2.4 量子自編碼器

在經(jīng)典的數(shù)據(jù)處理中, 通過機器學(xué)習(xí)中的自編碼器可以將數(shù)據(jù)從一個高維空間縮減到低維空間.經(jīng)典的自編碼模型可以概括為: 通過參數(shù)化的神經(jīng)網(wǎng)絡(luò)來訓(xùn)練一個數(shù)據(jù)集, 其數(shù)據(jù)維度為 (n+k) , 得到擦除k個特征或維度的新數(shù)據(jù), 如果這些數(shù)據(jù)可以通過解碼器(神經(jīng)網(wǎng)絡(luò))重新生成接近于原數(shù)據(jù)的一組新數(shù)據(jù), 那么留下的n維數(shù)據(jù)被稱為壓縮數(shù)據(jù). 這個過程被稱為數(shù)據(jù)壓縮. 數(shù)據(jù)壓縮對于處理稀疏特征數(shù)據(jù)集或高維數(shù)據(jù)集是十分直觀和有效的手段. 受此啟發(fā), 量子自編碼器[13-15](quantum autoencoder)被設(shè)計為量子態(tài)壓縮的工具.

Romero等[13]提出的量子自編碼器與經(jīng)典類似: 記{pi,|ψi〉A(chǔ)B}是 (n+k) 個量子比特上的純態(tài)集合, 子系統(tǒng)A和子系統(tǒng)B分別占有n和k個比特. 記Uθ為作用在 (n+k) 個比特上的幺正算符,其中θ={θ1,θ2,···}是參數(shù)集合, 以及|a〉B′為k比特寄存器的參考純態(tài). 通過經(jīng)典的優(yōu)化方式, 我們希望平均保真度函數(shù)取得最大值:

其中ψiAB=|ψi〉〈ψi|AB, 以及aB′=|a〉〈a|B′.

量子自編碼器的核心在于, 如果想要有效地壓縮量子態(tài), 必須保證態(tài)|ψi′〉=Uθ|ψi〉A(chǔ)B是A, B兩個子系統(tǒng)的直積態(tài). 即當下式成立時, 才有C1=1 :

對輸出態(tài)進行量子態(tài)層析以確定其密度矩陣是非常困難的. 可以證明測量B和B'寄存器的態(tài)保真度等價于AB寄存器初態(tài)和末態(tài)的保真度(我們稱B寄存器輸出態(tài)為冗態(tài)). 這樣, 可以定義另一種平均保真度C2(θ) ,

實際上求兩個態(tài)的保真度, 有一種SWAP測試線路可以完成[42].

通過參數(shù)量子線路來構(gòu)建作用于AB系統(tǒng)的幺正變換, 并通過SWAP測試線路得到保真度信息. 取損失函數(shù)為L=-log(1-C2) , 采用經(jīng)典方式進行優(yōu)化, 可以得到保真度最高的參數(shù)線路, 這樣就實現(xiàn)了數(shù)據(jù)壓縮.

如圖2所示, 量子態(tài)壓縮模型可以由以下步驟來構(gòu)建: 第一, 制備初態(tài)|ψi〉 和參考態(tài) |a〉 , 并假設(shè)制備是有效的; 第二, 構(gòu)建參數(shù)線路, 初態(tài)在幺正算符U下演化; 第三, 通過SWAP測試得到冗態(tài)和參考態(tài)之間的保真度.

圖2 量子自編碼器的訓(xùn)練示意圖, 其中 p 表示變量, 摘自[13]Fig. 2. Schematic representation of the hybrid scheme for training a quantum autoencoder where p represents variables, image from[13].

量子自編碼器在氫分子態(tài)的應(yīng)用是一個成功的例證[13]. 其方法是用4 qubits來模擬氫分子, 通過變分量子求解器(VQE)求出對于固定原子間距的量子態(tài), 以此作為量子自編碼器的輸入態(tài). 氫分子的態(tài)并非占滿了4 bit的希爾伯特空間, 這就為量子態(tài)壓縮提供了可能. 直觀上看, 量子態(tài)壓縮的過程就像在整個希爾伯特空間中將若干子空間碎片像拼圖一樣拼接成緊密的空間. 量子自編碼器在量子加法器方面也有一定的應(yīng)用[14], 這種加法器用以實現(xiàn)將兩個相同比特數(shù)的量子子系統(tǒng)編碼到一個新的子空間. Ding等[43]借助超導(dǎo)量子體系在實驗上驗證了量子加法器的可行性, 實驗保真度與理論值一致.

Pepper等[44]采用了Romero等[13]提出的量子自編碼器框架, 不同的是, 其數(shù)據(jù)壓縮任務(wù)是將多維量子比特(qutrit,|ψ〉=α|0〉+β|1〉+γ|2〉(已歸一化))壓縮為二維量子比特(qubit)態(tài). 通過光量子實驗體系, Pepper等在實驗上實現(xiàn)了qutrits的壓縮, 并且證明了這樣的實驗優(yōu)化系統(tǒng)對擾動是魯棒的. Bondarenko等[45]注意到經(jīng)典數(shù)據(jù)通過經(jīng)典自編碼器可以有效地去除噪聲, 因此量子自編碼器同樣有類似的作用. 通過構(gòu)建以自旋翻轉(zhuǎn)噪聲和任意幺正門噪聲為主的GHZ含噪聲量子態(tài), Bondarenko等驗證了量子自編碼器在量子數(shù)據(jù)去噪方面的作用.

如何判斷量子態(tài)能否通過量子自編碼器有效壓縮一直受到關(guān)注, Huang等[46]在理論上論證了實現(xiàn)有效量子自編碼態(tài)壓縮的條件, 并證明了若輸入數(shù)據(jù)的最大線性無關(guān)向量的個數(shù)不超過隱變量空間(壓縮后的低維空間)的維度, 那么量子自編碼器就可以無損地將高維數(shù)據(jù)壓縮至低維. Huang等利用量子光學(xué)體系在實驗上驗證了其理論的結(jié)果. 此外Cao等[47]提出可在量子退火機上運行、通過噪聲輔助的絕熱模型, 同樣可以完成量子自編碼任務(wù). 同時, 對量子態(tài)壓縮的探索也使得量子梯度消失的現(xiàn)象—也即貧瘠高原的現(xiàn)象—得到進一步的研究[48].

2.5 其他生成模型

從前述量子生成模型可以看出, 經(jīng)典機器學(xué)習(xí)給我們帶來了很多啟發(fā). 類似地, 經(jīng)典領(lǐng)域中因子圖(factor graph)可以作為概率生成模型, Gao等[49]提出了一種量子生成模型(quantum generative model, QGM), 并證明此模型可以高效地表示任意因子圖. 并且通過理論證明至少存在一些特定的概率分布, 可以被QGM有效表示, 但不能被任意具有多項式量級變量的因子圖有效表示. 如果多項式層次作為Pvs. NP問題的泛化是不塌縮的話,QGM相對于經(jīng)典的因子圖具有指數(shù)優(yōu)勢.

同時, 除了QGM的表示能力和泛化能力,Gao等[49]還提出了一種通用的量子學(xué)習(xí)算法, 該算法利用張量網(wǎng)絡(luò)、對多體糾纏量子態(tài)的父哈密頓量(parent Hamiltonian)構(gòu)建、以及遞歸的量子相位估計進行學(xué)習(xí). 顯然希望這種算法對任意問題都能在多項式時間內(nèi)解決是不現(xiàn)實的, 但作者證明了至少存在一些問題, QGM相對于任意經(jīng)典算法均有指數(shù)加速的效果, 前提是假設(shè)量子計算機不能被經(jīng)典計算機有效地模擬.

直觀地理解QGM中的指數(shù)加速效果: 機器學(xué)習(xí)中的生成模型旨在通過尋找潛在的概率分布, 對自然界任意的數(shù)據(jù)生成過程進行建模. 由于自然界受量子力學(xué)定律支配, 用經(jīng)典生成模型中的概率分布對真實世界中的數(shù)據(jù)進行建模具有很大的局限性. Gao等[49]提出的QGM模型, 用一個多體糾纏量子態(tài)的概率幅對數(shù)據(jù)的相關(guān)性進行參數(shù)化. 因為量子概率幅的相干性產(chǎn)生的現(xiàn)象比經(jīng)典的復(fù)雜得多, QGM才有可能在特定情況下實現(xiàn)性能的顯著提升. QGM使用圖態(tài)|G〉 表示, 由m個量子比特與圖G構(gòu)成. 如圖3所示.

圖3 經(jīng)典和量子生成模型 (a) 因子圖表示; (b)張量網(wǎng)絡(luò)態(tài)表示; (c)量子生成模型定義[49]Fig. 3. Classical and quantum generative models: (a) Illustration of a factor graph; (b) illustration of a tensor network state;(c) QGM definition[49].

Gao[50]有另一篇工作同樣旨在發(fā)掘量子相關(guān)性在生成模型中的作用. 其中比較了經(jīng)典貝葉斯網(wǎng)絡(luò)順序模型與對應(yīng)的一維張量網(wǎng)絡(luò), 展示了矩陣直積態(tài)(matrix product states, MPSs)比經(jīng)典機器學(xué)習(xí)模型有更強的表示能力. 因為一維模型可以在經(jīng)典計算機上被有效模擬, Gao等采用數(shù)值模擬的方式測試了真實數(shù)據(jù)集的生成, 發(fā)現(xiàn)MPS生成能力比經(jīng)典模型有提升. 此結(jié)果為理解基于MPS的機器學(xué)習(xí)算法提供了新的視角, 因為有一類張量網(wǎng)絡(luò)子類不能有效地被經(jīng)典計算機模擬, 但是可以在量子計算機上構(gòu)建, 這就使得在機器學(xué)習(xí)中的生成模型框架下量子優(yōu)勢是可能存在的.

除以上的量子生成模型外, 還有基于貝葉斯理論提出量子貝葉斯線路[16]. 這種量子線路引入輔助比特表示先驗概率分布, 通過受控操作傳遞給數(shù)據(jù)比特寄存器. 這樣可以極大地規(guī)避參數(shù)量子線路中出現(xiàn)的生成概率不均勻的問題.

3 量子生成模型展望

隨著量子計算機硬件的不斷發(fā)展, 量子生成模型也不只在量子虛擬機上得到實現(xiàn), 基于真實量子芯片的生成模型受到了廣泛的關(guān)注, 但是量子生成模型存在的問題仍待解決.

首先, 量子生成模型是否可以生成任意概率分布的數(shù)據(jù)? 對于連續(xù)變量的數(shù)據(jù), 量子生成模型還無法像經(jīng)典神經(jīng)網(wǎng)絡(luò)一樣有效地生成. 同時, 數(shù)據(jù)是量子還是經(jīng)典的決定了生成模型的選取. 對于經(jīng)典數(shù)據(jù), 利用MPQCs或MPSs生成量子態(tài), 對量子態(tài)的測量得到了量子信息的經(jīng)典統(tǒng)計結(jié)果. 如何更有效地生成量子態(tài)以及如何從量子態(tài)讀取更多信息一直受到關(guān)注, 不同的量子生成模型給出了不同的策略, 然而對于任意連續(xù)變量數(shù)據(jù)的生成還需要進一步的探索.

其次, 量子生成模型作為量子機器學(xué)習(xí)的一部分, 如何體現(xiàn)量子計算的優(yōu)勢, 仍然是一個開放性問題. 對量子線路的表示能力的研究為我們提供了一個思路, 但是對于不同的生成模型很難給出統(tǒng)一的表示能力定義. 而Gao等[49,50]從量子相關(guān)性出發(fā), 直觀上將量子內(nèi)在相關(guān)性的參數(shù)化來實現(xiàn)經(jīng)典生成模型無法模擬的任務(wù), 說明了量子優(yōu)勢在機器學(xué)習(xí)領(lǐng)域中的存在性.

對于量子生成模型, 還需要進一步探索. 在量子領(lǐng)域, 量子生成模型提供了NISQ體系下可執(zhí)行的算法, 在機器學(xué)習(xí)領(lǐng)域, 它引入了量子計算和量子信息的理念, 使機器學(xué)習(xí)算法突破經(jīng)典計算的瓶頸成為可能.

感謝中國科學(xué)技術(shù)大學(xué)薛程博士和趙健博士的討論.

附錄A 參數(shù)量子線路

量子計算機遵循量子力學(xué)定律進行邏輯運算和信息存取. 而量子力學(xué)體系區(qū)別于經(jīng)典體系之處在于, 由于疊加態(tài)和糾纏態(tài)的存在, 相同位數(shù)的量子數(shù)據(jù)比經(jīng)典數(shù)據(jù)有著指數(shù)強的表示能力. 將量子信息轉(zhuǎn)化為經(jīng)典信息需要對量子態(tài)進行測量.

量子計算的基本計算單位是量子比特(qubit), 單比特量子疊加態(tài)記為|ψ〉=α|0〉+β|1〉 (已歸一化). 根據(jù)玻恩的幾率解釋, 對單比特量子態(tài)進行測量, 得到0態(tài)的概率為|α|2, 得到1態(tài)的概率為|1〉. 對于多量子比特系統(tǒng), 根據(jù)量子力學(xué)體系的完備性, 量子態(tài)可在計算基上展開, 由|Φ〉=測得任意態(tài) |i〉 的概率為|ai|2. 對于泡利算符σi,i∈{0,x,y,z}, 其期望值可以通過算符的譜來計算, 即其中λj為本征值,|ψj〉為本征態(tài). 對于一個更復(fù)雜的哈密頓量H, 我們總能將其分解為若干泡利算符的直積, 再分別求出各個部分的期望值,即m∈{0,x,y,z},αi,j,k...m為泡利基的實系數(shù).

通過測量量子態(tài)在計算基上的投影或哈密頓量的期望值得到的經(jīng)典數(shù)據(jù), 其處理策略也根據(jù)量子生成模型的不同而有各式的差異. 如對于量子玻恩機, 量子測量得到的數(shù)據(jù)被映射為數(shù)據(jù)集的概率分布, 顯然這樣對于小型數(shù)據(jù)集或稀疏數(shù)據(jù)集有表示優(yōu)勢. 而對于量子生成對抗網(wǎng)絡(luò), 測量得到的數(shù)據(jù)可直接作為生成數(shù)據(jù)以混淆源數(shù)據(jù).

量子生成模型的核心在于利用量子計算機生成量子態(tài),對量子態(tài)進行測量得到經(jīng)典的有效信息. 如何有效地生成量子態(tài), 是我們面臨的首要問題. 參數(shù)量子線路(PQC)為這一問題提供了一個思路.

參數(shù)量子線路一般由若干單量子門和多量子糾纏門組合得到, 單量子門可以是任意單比特幺正門US(θ) , 常用的有泡利旋轉(zhuǎn)門多量子門一般采用UCZ=|0〉〈0|?I+|1〉〈1|?σz,UCNOT=|0〉〈0|?I+|1〉〈1|?σx等兩比特門. 單量子門和多量子門交替的結(jié)構(gòu)極大地提高了態(tài)的糾纏能力, 擴展了態(tài)的表示空間.

記量子線路的參數(shù)為θ, 則參數(shù)量子線路可以用U(θ)表示. 若要保證參數(shù)量子線路是有效的, 其參數(shù)總量和線路深度都有相應(yīng)的限制. 一般設(shè)定參數(shù)的總量是多項式級的,即n~O(poly(N)) , 其中n為參數(shù)個數(shù),N為量子比特個數(shù).同時線路的深度也設(shè)為多項式級的, 即L~O(poly(N)).

如何使參數(shù)量子線路有更強的表示能力一直受到關(guān)注.最直觀的方式是增加參數(shù)量子線路的深度, 構(gòu)成MPQCs(multiple parameterized quantum circuits). 然而MPQCs的線路深度至多為多項式級的才能滿足有效性要求, 也即圖A1中的PQC模塊數(shù)是常數(shù)級的, 不隨量子比特數(shù)目增長. 而且由于量子噪聲的存在, 增加PQC的模塊數(shù)會極大地影響量子態(tài)的保真度, 所以在真實的任務(wù)中往往會限制PQC的模塊數(shù). 除此之外還可以通過非計算基補充測量的方式, 來獲取更多的數(shù)據(jù)信息, 這種方法在QCAAN線路[31]中被提到.

圖 A1 參數(shù)量子線路示意圖Fig. A1. Illustration of MPQCs.

對經(jīng)典神經(jīng)網(wǎng)絡(luò)的表示能力的研究是一項非常重要的課題, 參數(shù)量子線路的表示能力直接關(guān)系到其能否體現(xiàn)量子優(yōu)越性. Du等[22]證明了在多項式層次結(jié)構(gòu)保持的前提下, 具有O(poly(N)) 個門的參數(shù)量子線路, 其表示能力比具有O(poly(N)) 個參數(shù)的經(jīng)典玻爾茲曼機要強. 盡管如此, 參數(shù)量子線路和經(jīng)典神經(jīng)網(wǎng)絡(luò)的直接比較還有一些困難, 如何定義對量子和經(jīng)典體系均適用的表示能力指標, 以及參數(shù)量子線路能否體現(xiàn)量子的優(yōu)越性, 仍是開放性的問題.

猜你喜歡
量子態(tài)比特量子
《量子電子學(xué)報》征稿簡則
基于l1范數(shù)相干度的量子態(tài)區(qū)分
決定未來的量子計算
一類兩體非X-型量子態(tài)的量子失諧
新量子通信線路保障網(wǎng)絡(luò)安全
比特幣還能投資嗎
比特幣分裂
比特幣一年漲135%重回5530元
一種簡便的超聲分散法制備碳量子點及表征
給定不確定結(jié)果的量子比特的量子態(tài)區(qū)分*
安丘市| 磐石市| 靖安县| 文昌市| 南涧| 元谋县| 永靖县| 茌平县| 乐都县| 松溪县| 裕民县| 湖口县| 康保县| 通化县| 晋江市| 蒲江县| 重庆市| 清水河县| 江油市| 五华县| 清新县| 理塘县| 公安县| 河南省| 北票市| 黔东| 天峨县| 南靖县| 蓝田县| 慈溪市| 都匀市| 闽侯县| 福海县| 桐乡市| 炎陵县| 子洲县| 连江县| 衡阳市| 定陶县| 慈利县| 莱州市|