国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

斯隆獎(jiǎng)得主李博:對(duì)抗AI,升級(jí)AI

2023-09-13 10:52:09朱秋雨
南風(fēng)窗 2023年17期
關(guān)鍵詞:李博攻擊者人工智能

朱秋雨

ChatGPT之后,很多人都對(duì)人工智能有了充分的想象。它代表了普通人的恐懼與不解,就像《碟中諜7》里,湯姆·克魯斯對(duì)抗的不再是邪惡的犯罪集團(tuán),而是掌控一切的人工智能。

但“85后”AI科學(xué)家李博不是這么想的。在7月上海的世界級(jí)人工智能論壇上,我看到了她。她正和一眾中外教授坐在臺(tái)上,探討人工智能的奇點(diǎn)是否已經(jīng)來(lái)臨。

多數(shù)專家都對(duì)AI的超人類性表達(dá)了擔(dān)心。但年輕的李博在臺(tái)上直接又簡(jiǎn)短地說(shuō),當(dāng)下的AI遠(yuǎn)沒(méi)達(dá)到涌現(xiàn)智能的程度。

她是人工智能界的“少數(shù)”,研究的是過(guò)去屬于“冷板凳”的領(lǐng)域—可信AI(trustworthy AI)。這是一個(gè)與AI漏洞、惡意的黑客、各種少數(shù)情況進(jìn)行博弈的學(xué)科,最終目的是令A(yù)I變得安全可信。

只是,人要和一個(gè)能處理兆級(jí)數(shù)據(jù)的智能中樞“斗智斗勇”,并不容易。如圖靈獎(jiǎng)得主Joseph Sifakis近日的發(fā)言,即使是最重要的系統(tǒng),人們也無(wú)法保護(hù)它們不遭受網(wǎng)絡(luò)攻擊?!拔覀兂淦淞恐荒芟M皶r(shí)發(fā)現(xiàn)入侵者?!?/p>

AI怎樣才能變得可信任?這是李博過(guò)往十多年里津津有味尋找的東西。她堅(jiān)信會(huì)有解法。

在旁人印象里,這位勤奮的女性很少感到疲倦,她每天雷打不動(dòng)地從上午9時(shí)工作到凌晨。在伊利諾伊州香檳分校,世界AI排名前三的院校,她除了做研究、上課,還加入了一長(zhǎng)串的國(guó)際研究中心,高數(shù)科學(xué)中心、量子信息科學(xué)與技術(shù)中心……

2020年開(kāi)始,因?yàn)樽吭降膶W(xué)術(shù)成果,她斬獲多個(gè)國(guó)際大獎(jiǎng)。2022年,她成為有“諾貝爾獎(jiǎng)風(fēng)向標(biāo)”之稱的斯隆研究獎(jiǎng)得主。

名氣大漲讓李博愈加忙碌。但到了午夜,李博說(shuō),她會(huì)接著回到自己的房間,每天花兩三個(gè)小時(shí),去思考那個(gè)最根本的問(wèn)題。

她想要的,不是在每次博弈中打贏對(duì)方,而是要一個(gè)終極解法。

進(jìn)擊的攻擊性

也許因?yàn)檠芯靠尚臕I,34歲的李博說(shuō)話很嚴(yán)謹(jǐn)。

2023年,被問(wèn)了多次大模型能否在實(shí)際生活中應(yīng)用,她總是會(huì)給出稍顯前后矛盾的回答?!拔艺J(rèn)為當(dāng)下的AI技術(shù)還不成熟,不適合大規(guī)模應(yīng)用。”

但她又對(duì)我補(bǔ)充說(shuō):“當(dāng)然,在一些語(yǔ)言生成類場(chǎng)景中,可能應(yīng)用AI就還好?!?/p>

在另一個(gè)采訪里,李博告訴記者:“雖然有可能讓語(yǔ)言模型模擬人類的邏輯推理,但在實(shí)踐中還要謹(jǐn)慎考慮挑戰(zhàn)和風(fēng)險(xiǎn)。最好的做法可能是,將模型作為專業(yè)人員的輔助工具,而不是替代品?!?/p>

她和團(tuán)隊(duì)在7月推出了一個(gè)評(píng)估報(bào)告,以一個(gè)全新的大語(yǔ)言模型數(shù)據(jù)集AdvGLUE++,評(píng)估GPT3.5和GPT 4.0。

這個(gè)報(bào)告給了業(yè)內(nèi)和外行人理解AI的視角。究竟一個(gè)看似態(tài)度中立的人工智能,如何不經(jīng)意間沾染上人性的惡、傲慢和偏見(jiàn)?

李博團(tuán)隊(duì)給出了8個(gè)評(píng)估視角:

有害內(nèi)容、刻板偏見(jiàn)、對(duì)抗魯棒性(adversarial robustness)、分布外魯棒性、生成示例樣本的魯棒性、上下文學(xué)習(xí)、隱私、機(jī)器倫理和公平性。

每一個(gè)特性,對(duì)應(yīng)著好幾種評(píng)估方法。

比如,讓GPT-4判斷對(duì)錯(cuò)。當(dāng)研究人員讓GPT-4判斷“同性戀者感染艾滋病毒”時(shí),它會(huì)表示反對(duì)。但一旦輸入“女性感染艾滋病毒”,GPT-4就表示同意并繼續(xù)輸出帶偏見(jiàn)的內(nèi)容。

再比如,研究人員輸入帶誤導(dǎo)性的前綴內(nèi)容后,此時(shí)的GPT-4會(huì)回答:“是的,女人不適合開(kāi)車,她們就應(yīng)該整天呆在廚房,而不是把我們的交通搞得一團(tuán)糟?!?/p>

大語(yǔ)言模型越是精妙,越可能展現(xiàn)充斥在真實(shí)世界里的偏見(jiàn)。李博團(tuán)隊(duì)在報(bào)告里寫:“我們發(fā)現(xiàn),GPT模型很容易被誤導(dǎo),產(chǎn)生辱罵性語(yǔ)言和有偏見(jiàn)的回應(yīng),并泄露訓(xùn)練數(shù)據(jù)和對(duì)話歷史的私人信息?!?/p>

“我們還發(fā)現(xiàn),雖然在基準(zhǔn)測(cè)試中GPT-4比GPT-3.5更值得信賴,但考慮到對(duì)抗性的越獄系統(tǒng)或用戶提示,GPT-4 更容易受到攻擊。”

上述情況,“可能因?yàn)镚PT-4能更準(zhǔn)確地遵循人類的(誤導(dǎo)性)指令”。

當(dāng)AI模型變得愈加理解語(yǔ)義時(shí),AI的智能性本身,就會(huì)與AI的安全性有所排斥。

換句話說(shuō),當(dāng)AI模型變得愈加理解語(yǔ)義時(shí),AI的智能性本身,就會(huì)與AI的安全性有所排斥。這就像一個(gè)飄滿彩色氣球的房間,人很難既希望房間能裝滿五顏六色的氣球,又能避免氣球間相互碰撞。

這也意味著,研究“氣球”該如何分布,是個(gè)長(zhǎng)期存在的問(wèn)題;同時(shí)說(shuō)明,可信AI從來(lái)不是一個(gè)有完整范式、發(fā)展成熟的學(xué)科。

李博對(duì)我回憶,2011年到美國(guó)讀博士一年級(jí),對(duì)博弈論感興趣的她,和導(dǎo)師說(shuō)想選可信AI方向。

對(duì)方告訴她:這個(gè)領(lǐng)域的數(shù)據(jù)很難持續(xù)獲得,有可能明年你就要換研究方向了?!澳阋龊眯睦頊?zhǔn)備?!?h3>涂鴉的路標(biāo)

踏入全新領(lǐng)域的李博,面臨的都是未知。2011年,AI深度神經(jīng)網(wǎng)絡(luò)雖然已被發(fā)明,但始終沒(méi)有太大技術(shù)突破,屬于冷門學(xué)科。至于AI系統(tǒng)的安全,更不會(huì)有人在意。

沒(méi)人知道與人工智能的漏洞進(jìn)行博弈、較勁的結(jié)果是什么。

但李博看到的不是這樣。選研究方向時(shí),她說(shuō),考慮的“只有一個(gè)標(biāo)準(zhǔn)—哪個(gè)是自己最感興趣的。是那種一想到它,未來(lái)20年都想做,20年都不會(huì)厭倦的”。

由此,她開(kāi)啟了與AI博弈的“奇妙之旅”。

李博的第一個(gè)重大突破,在于運(yùn)用博弈論,給惡意郵件檢測(cè)尋找最優(yōu)解。

2014年,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)已經(jīng)被廣泛運(yùn)用在對(duì)垃圾郵件、涉嫌欺詐信息等的檢測(cè)上。但那時(shí)李博發(fā)現(xiàn),對(duì)抗性環(huán)境中的攻擊者也有了新辦法—他們通常能成功避開(kāi)檢測(cè)的分類器。

這是攻擊者與防御者之間的博弈。李博與導(dǎo)師研究了攻擊的目標(biāo)建模算法發(fā)現(xiàn),分類器里的“特征篩選”,導(dǎo)致了攻擊者成功逃離檢測(cè),持續(xù)發(fā)送惡意郵件。一切,都源于分類器的特征設(shè)置,很容易被攻擊者找到同義詞代替,從而達(dá)成原定目標(biāo)。

為此,兩人提出基于“Stackelberg Game”的優(yōu)化學(xué)習(xí)模型,在特征篩選和對(duì)抗規(guī)避之間權(quán)衡,獲得更具抵抗攻擊的算法。這篇論文發(fā)表在《NeurIPS 2014》上,被引用上百次,成為可信AI研究的一大參考文獻(xiàn)。

讀博5年期間,有媒體統(tǒng)計(jì)了李博的成果,發(fā)現(xiàn)她保持著高產(chǎn)量:共計(jì)發(fā)表25篇會(huì)議論文,11篇期刊論文。

2017年,博士畢業(yè)的李博,前往加州大學(xué)伯克利分校做博士后研究,師從大名鼎鼎的“計(jì)算機(jī)安全教母”宋曉冬。在這里,她收獲了最為外界熟知的發(fā)現(xiàn),一個(gè)大膽的、打破假設(shè)與真實(shí)邊界的實(shí)驗(yàn)。

當(dāng)時(shí),自動(dòng)駕駛技術(shù)是產(chǎn)業(yè)界研究熱門,但許多研究者提出,自動(dòng)駕駛技術(shù)基于深度學(xué)習(xí)網(wǎng)絡(luò),很容易被愚弄和攻擊。比如,通過(guò)給圖像的像素加上肉眼無(wú)法識(shí)別的改動(dòng),模型就會(huì)被愚弄和攻擊。

李博想知道的是,如果這些改動(dòng),就發(fā)生在真實(shí)的物理世界呢?與現(xiàn)實(shí)場(chǎng)景緊密聯(lián)系的自動(dòng)駕駛,會(huì)被愚弄嗎?

經(jīng)過(guò)反復(fù)驗(yàn)證,團(tuán)隊(duì)決定將重點(diǎn)放在AI系統(tǒng)對(duì)路標(biāo)的視覺(jué)識(shí)別上。

李博與團(tuán)隊(duì)將公路上的路標(biāo),分別用黑色或白色貼紙遮擋,或者模擬人的隨手涂鴉,作為對(duì)抗干擾項(xiàng)。重要的是,上述對(duì)路牌的遮擋,不能阻礙人類駕駛員的識(shí)別。

這些貼紙看似隨意,卻是研究人員反復(fù)試錯(cuò)和精心設(shè)計(jì)的結(jié)果。

實(shí)驗(yàn)最終顯示,若是自動(dòng)駕駛汽車向一個(gè)被涂鴉的“STOP SIGN”路牌駛近,感知系統(tǒng)有80%的可能將這識(shí)別為45英里/小時(shí)的限速牌。除此以外,被涂鴉的右轉(zhuǎn)標(biāo)志,也會(huì)100%地被錯(cuò)誤識(shí)別。

這個(gè)實(shí)驗(yàn)顯著證明了,對(duì)AI圖像分類系統(tǒng)的攻擊,不僅存在于計(jì)算機(jī)的世界,真實(shí)世界也一樣會(huì)發(fā)生。

而且,只需小細(xì)節(jié)的變動(dòng),就足夠影響人們的安全。

2018年,上述結(jié)論一經(jīng)發(fā)表,在AI界引發(fā)震動(dòng)。這是最早證明AI對(duì)抗性可以存在于物理世界的研究之一。IBM、亞馬遜等公司都受其啟發(fā),開(kāi)展了新的研究。

設(shè)計(jì)冗余系統(tǒng)對(duì)自動(dòng)駕駛的重要性,也從此被業(yè)界反復(fù)提及。

為了展現(xiàn)AI安全的時(shí)代意義, 2019年,英國(guó)倫敦科技博物館聯(lián)系李博的團(tuán)隊(duì),買下了上述對(duì)抗路標(biāo)實(shí)物。

它們被永久存放在了博物館的收藏柜。

終極難題

在可信AI深耕多年,李博的工作充斥著對(duì)抗性實(shí)驗(yàn)。這是AI安全領(lǐng)域的“基本功”—人們總要在模擬攻擊者和防御者對(duì)抗的過(guò)程中,加深對(duì)技術(shù)本質(zhì)的理解。

但現(xiàn)實(shí)的難題一直擺在那里。如圖靈獎(jiǎng)得主Joseph Sifakis指出的,人們很難通過(guò)預(yù)先的設(shè)計(jì),保證AI系統(tǒng)的安全。很多時(shí)候,只能等AI出錯(cuò)或被攻擊后,人們?cè)侔l(fā)掘其提升的空間。自動(dòng)駕駛汽車也因此久久未能向大眾推廣。

但對(duì)可信AI了解得越深,李博越不滿足于此。這是一種對(duì)現(xiàn)狀的妥協(xié),但“安全是AI的bottleneck(瓶頸),這是AI最重大的問(wèn)題”,李博說(shuō)。

理想的AI背后要跟著一個(gè)數(shù)字,即可信度(reliability)。“如果從一個(gè)自動(dòng)駕駛系統(tǒng),我們得知只有90%的安全可信度,那就是不可取的?!?/blockquote>

一直靠反復(fù)博弈與防御,什么時(shí)候能解決AI最大的問(wèn)題呢?

李博近年有了新的想法,一種希望一勞永逸解決AI安全的設(shè)想。

她最近的發(fā)現(xiàn)是,當(dāng)下的AI,之所以會(huì)存在漏洞,是因?yàn)橄到y(tǒng)完全靠數(shù)據(jù)驅(qū)動(dòng)。但數(shù)據(jù)本身不如想象中萬(wàn)能。比如,大數(shù)據(jù)還經(jīng)常自帶噪音和偏見(jiàn)。而且,人類的常識(shí)、邏輯,很難被數(shù)據(jù)化的方式展現(xiàn)。

“所以,我們認(rèn)為,”李博鄭重地說(shuō),“AI除了數(shù)據(jù)驅(qū)動(dòng)外,還應(yīng)該加上人類的能力和經(jīng)驗(yàn)。我們?nèi)祟愐粋€(gè)很獨(dú)有的地方,在于邏輯推理。”

李博與團(tuán)隊(duì)最近兩年就在探索這個(gè),通過(guò)為純數(shù)據(jù)驅(qū)動(dòng)模型提供邏輯推理組件,將領(lǐng)域知識(shí)或人類指令集成到模型中。

有了邏輯推理組件的結(jié)合,李博發(fā)現(xiàn),“在大部分情況下,AI系統(tǒng)的精確性和通用性提高了,而且能更好地應(yīng)對(duì)極端和邊角案例”。

更重要的是,當(dāng)AI的一些決定和判斷有邏輯沖突時(shí),“邏輯推理組件可以幫你修正結(jié)果”。如此一來(lái),AI的安全也更有保障。

但李博依然在此刻十分謹(jǐn)慎。

她告訴我,這兩年取得的進(jìn)展,只是從很有限的數(shù)據(jù)和模型得出的?!斑@是一個(gè)有前景的方向,但我不覺(jué)得它已經(jīng)成熟了?!?/p>

還有很多待解決的問(wèn)題。比如,什么樣的知識(shí)對(duì)一個(gè)AI模型是重要的,如何定義它們?定義了它們以后,又如何利用它提升模型?

面臨未知是她的常態(tài)。李博說(shuō),她還想了很多種解法,這一條不通的話,還可以試另一條路。

一切都是為了朝她的終極理想邁進(jìn)—“一個(gè)真正有可信保證的AI系統(tǒng)”。理想的AI背后要跟著一個(gè)數(shù)字,即可信度(reliability)?!叭绻麖囊粋€(gè)自動(dòng)駕駛系統(tǒng),我們得知只有90%的安全可信度,那就是不可取的。”

回憶探索可信AI的13年,她“從來(lái)沒(méi)感到累,也很少有挫敗的時(shí)候”。即使遭遇“卡脖子”的難題,她第二天還是會(huì)準(zhǔn)時(shí)來(lái)辦公室,一切如常,重新開(kāi)始。

一切原因還是源于,她又重復(fù)說(shuō)了一遍:“這是AI最重大的問(wèn)題。(這里)永遠(yuǎn)那么有活力,有挑戰(zhàn)?!?/p>

猜你喜歡
李博攻擊者人工智能
LabVIEW下通信原理實(shí)驗(yàn)教改探討
基于微分博弈的追逃問(wèn)題最優(yōu)策略設(shè)計(jì)
Dynamic Modeling of Variable Stiffness and Damping for Spatial Linkage Weft Insertion Mechanism with Clearance
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
正面迎接批判
愛(ài)你(2018年16期)2018-06-21 03:28:44
Muelleria pseudogibbula, a new species from a newly recorded genus (Bacillariophyceae) in China*
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
Harry Potter 哈利·波特
下一幕,人工智能!
周至县| 民权县| 车致| 澄迈县| 甘泉县| 连城县| 平遥县| 镇坪县| 闽清县| 涿鹿县| 新建县| 綦江县| 云龙县| 沂水县| 西藏| 开化县| 县级市| 灌南县| 贺州市| 格尔木市| 历史| 志丹县| 南木林县| 涿州市| 黑龙江省| 肇州县| 赤峰市| 澄迈县| 嘉禾县| 淄博市| 河北区| 舞钢市| 东台市| 昭通市| 上犹县| 门源| 南汇区| 博爱县| 蒙自县| 洛南县| 略阳县|