部分人工智能系統(tǒng)已擅長“說謊”

2024-06-22 00:51

文萃報(bào)·周五版 2024年21期

近期美國麻省理工學(xué)院一個(gè)研究團(tuán)隊(duì)稱，部分人工智能系統(tǒng)已經(jīng)學(xué)會(huì)如何欺騙人類，其中包括部分號(hào)稱已被訓(xùn)練成樂于助人和誠實(shí)的系統(tǒng)。該研究成果發(fā)表在美國細(xì)胞出版社旗下的《模式》雜志上。

文章第一作者、美國麻省理工學(xué)院人工智能安全領(lǐng)域博士后彼得·帕克和他的同事們分析了一些文獻(xiàn)，重點(diǎn)關(guān)注了人工智能系統(tǒng)傳播虛假信息的方式——通過習(xí)得性欺騙，它們系統(tǒng)地學(xué)會(huì)了“操縱”他人。

研究人員發(fā)現(xiàn)的最引人注目的人工智能系統(tǒng)欺騙例子是元宇宙平臺(tái)公司的“西塞羅”人工智能系統(tǒng)，它被設(shè)計(jì)在一個(gè)虛擬外交戰(zhàn)略游戲中作為人類玩家的對(duì)手。盡管元宇宙平臺(tái)公司聲稱，“西塞羅”人工智能系統(tǒng)“在很大程度上是誠實(shí)和樂于助人的”，并且在玩游戲時(shí)“從不故意背刺”它的人類盟友，但該公司發(fā)表的論文數(shù)據(jù)顯示，該系統(tǒng)并沒有公平地玩游戲。

“我們發(fā)現(xiàn)元宇宙平臺(tái)公司的人工智能系統(tǒng)已經(jīng)成為欺騙大師。”帕克說，“雖然元宇宙平臺(tái)公司成功訓(xùn)練其人工智能系統(tǒng)在游戲中獲勝——‘西塞羅人工智能系統(tǒng)在玩家排行榜中排名前10%——但沒能訓(xùn)練它誠實(shí)地獲勝。”

其他人工智能系統(tǒng)則具有在撲克游戲中虛張聲勢的能力，或在戰(zhàn)略游戲“星際爭霸2”中為了擊敗對(duì)手而假裝攻擊的能力，以及為了在談判游戲中占上風(fēng)而歪曲偏好的能力等。

帕克說：“我們需要盡可能多的時(shí)間，為未來人工智能產(chǎn)品和開源模型可能出現(xiàn)的更高級(jí)欺騙做好準(zhǔn)備。我們建議將欺騙性人工智能系統(tǒng)歸類為高風(fēng)險(xiǎn)系統(tǒng)?！?/p>

（據(jù)新華社客戶端）

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

部分人工智能系統(tǒng)已擅長“說謊”