這款名為SynthID的工具,是生成式人工智能輸出水印工具家族的一部分。去年,谷歌公司推出了用于圖像的水印,隨后又推出了用于人工智能生成視頻的水印。2024年5月,谷歌宣布在其Gemini應(yīng)用和在線聊天機(jī)器人中使用SynthID,并在HuggingFace這一開放的人工智能數(shù)據(jù)集和模型庫中免費(fèi)提供。水印已成為幫助人們識(shí)別人工智能生成內(nèi)容的重要工具,這有助于防范如虛假信息等的潛在危害。
“現(xiàn)在,其他生成式人工智能開發(fā)者可以使用這一技術(shù),幫助他們檢測(cè)文本輸出是否來自自己的大語言模型,這將使更多開發(fā)者能夠更負(fù)責(zé)任地構(gòu)建人工智能?!惫雀鐳eepMind研究副總裁普什米特·科利說。
SynthID通過在人工智能模型生成文本時(shí),直接在文本中加入一個(gè)不可見的水印。
大型語言模型通過將語言分解為“令牌”,然后預(yù)測(cè)哪個(gè)令牌最有可能接在前一個(gè)令牌之后來運(yùn)作。一個(gè)令牌可以是單個(gè)字符、單詞或短語的一部分,每個(gè)令牌都會(huì)得到一個(gè)百分比分?jǐn)?shù),表示其成為句子中下一個(gè)詞的可能性。百分比越高,模型使用該令牌的可能性就越大。
“SynthID通過在生成的那一刻引入額外的信息來改變令牌生成的概率?!笨评忉尩?。
要檢測(cè)水印并確定文本是否由人工智能工具生成,SynthID通過比較帶水印和不帶水印文本中單詞的預(yù)期概率分?jǐn)?shù)來實(shí)現(xiàn)。
GoogleDeepMind發(fā)現(xiàn),使用SynthID水印并未影響生成文本的質(zhì)量、準(zhǔn)確性、創(chuàng)造力或生成速度。這一結(jié)論來自SynthID在Gemini產(chǎn)品中的大規(guī)模實(shí)地測(cè)試,數(shù)百萬人使用了帶有水印的文本。Gemini允許用戶對(duì)人工智能模型的回復(fù)進(jìn)行評(píng)分,選擇“贊”或“踩”。
科利和他的團(tuán)隊(duì)分析了約2000萬條帶水印和不帶水印的聊天機(jī)器人回復(fù)的評(píng)分。他們發(fā)現(xiàn),用戶并未察覺兩者在質(zhì)量和實(shí)用性上有何差別。此次實(shí)驗(yàn)的結(jié)果詳見最近發(fā)表在《自然》上的論文。目前,SynthID僅適用于谷歌的模型生成的內(nèi)容,但開源這一工具的目的是希望擴(kuò)大其兼容工具的范圍。
然而,SynthID也存在一些局限性。水印在應(yīng)對(duì)文本裁剪、輕度編輯或重寫時(shí)具有一定的抗干擾能力,但當(dāng)人工智能生成的文本被重寫或翻譯成另一種語言時(shí),效果不如預(yù)期。在回答諸如“法國的首都是哪里”這種事實(shí)性問題時(shí),水印的可靠性也較低。原因在于,在不改變事實(shí)的前提下,調(diào)整句子中下一個(gè)可能單詞的概率空間更為有限。
“在生成式人工智能文本中實(shí)現(xiàn)可靠且不可察覺的水印是極具挑戰(zhàn)性的,尤其是在輸出結(jié)果接近確定性的場(chǎng)景中,例如事實(shí)性問題或代碼生成任務(wù)?!瘪R里蘭大學(xué)副教授費(fèi)茲說,他曾研究過人工智能水印的脆弱性。
費(fèi)茲表示,GoogleDeepMind決定開源其水印方法,是對(duì)人工智能社區(qū)的一個(gè)積極信號(hào)?!斑@讓社區(qū)可以測(cè)試這些檢測(cè)器,并在不同的環(huán)境中評(píng)估其魯棒性,從而更好地理解這些技術(shù)的局限性?!彼a(bǔ)充道。
HuggingFace的機(jī)器學(xué)習(xí)工程師若昂指出,開源工具還有另一個(gè)好處,開源意味著任何人都可以使用代碼,并無附加限制地將水印整合到他們的模型中。這將提升水印的隱私性,因?yàn)橹挥袚碛姓咧榔浼用苊孛堋?/p>
“隨著可訪問性的提升和功能的驗(yàn)證,我希望水印技術(shù)能成為標(biāo)準(zhǔn),這有助于我們檢測(cè)語言模型的惡意使用?!比舭赫f道。
但水印并非萬能的解決方案,HuggingFace全球政策負(fù)責(zé)人索萊曼指出?!八∈潜U夏P桶踩囊徊糠郑麄€(gè)生態(tài)系統(tǒng)還需要許多互補(bǔ)的安全措施。類似地,即便是人工生成的內(nèi)容,事實(shí)核查的效果也因情境而異?!彼硎?。