為促進(jìn)生成式人工智能的發(fā)展,應(yīng)當(dāng)豁免模型訓(xùn)練階段所獲語料的版權(quán)責(zé)任,但也應(yīng)審慎考量版權(quán)方保護(hù)問題。
對于人工智能科技公司來說,當(dāng)前一種通行的運營方式是從網(wǎng)絡(luò)上抓取現(xiàn)成的信息數(shù)據(jù)作為語料,用于生成式人工智能模型的訓(xùn)練及內(nèi)容輸出。隨著人工智能技術(shù)應(yīng)用的不斷發(fā)展和普及,內(nèi)容生產(chǎn)者的反應(yīng)日益強烈。近日,加拿大各主要新聞機構(gòu)就此對美國開放人工智能研究中心(OpenAI)提起訴訟。加拿大國會眾議院醞釀推動立法,規(guī)制人工智能科技公司獲取數(shù)據(jù)作為語料的行為。
2024年11月底,加拿大多家主要新聞機構(gòu)指控OpenAI未經(jīng)許可抓取媒體發(fā)表的文章,用于聊天生成預(yù)訓(xùn)練轉(zhuǎn)換器(ChatGPT)。參與起訴的原告方包括《多倫多星報》及該集團(tuán)旗下的大都會媒體公司、《環(huán)球郵報》媒體集團(tuán)和加拿大廣播公司等具有廣泛影響的加拿大傳媒巨頭。這些新聞機構(gòu)指控OpenAI侵犯著作權(quán),在網(wǎng)絡(luò)上抓取大量由媒體生產(chǎn)出的內(nèi)容,并利用這些內(nèi)容獲利。
《環(huán)球郵報》刊發(fā)的相關(guān)聲明稱:“新聞報道服務(wù)于公共利益。OpenAI利用已成文的新聞報道獲取商業(yè)利益的行為不符合公共利益,屬于非法行為?!薄抖鄠惗嘈菆蟆芳瘓F(tuán)首席執(zhí)行官尼爾·奧利弗在發(fā)送給全體員工的備忘錄中寫道:“科技公司竊取我們生產(chǎn)的內(nèi)容,我們不會坐視不理。雖然我們要擁抱技術(shù)創(chuàng)新帶來的機遇,但所有參與者都必須遵守法律。我們的知識產(chǎn)權(quán)必須得到合理使用?!?/p>
據(jù)英國《衛(wèi)報》報道,一系列訴訟可能讓OpenAI付出巨大代價?!抖鄠惗嘈菆蟆返刃侣剻C構(gòu)要求OpenAI為每一篇其非法抓取用于訓(xùn)練ChatGPT的文章支付2萬加拿大元(約合1.47萬美元)。相關(guān)訴訟的索賠總額高達(dá)數(shù)十億美元。
這不是人工智能科技公司首次面對有關(guān)新聞著作權(quán)的訴訟。近來,內(nèi)容版權(quán)方針對人工智能科技公司發(fā)起多起訴訟。2024年10月21日,媒體大亨默多克旗下新聞集團(tuán)的子公司道瓊斯和《紐約郵報》對Perplexity公司提起訴訟,指控這家人工智能初創(chuàng)公司非法復(fù)制大量版權(quán)作品。
成立兩年多的Perplexity公司為用戶提供人工智能聊天機器人,它可以總結(jié)搜索結(jié)果,列出答案的引用來源,并幫助用戶優(yōu)化查詢到的信息,以得出最佳答案。鑒于Perplexity公司在搜索領(lǐng)域的亮眼表現(xiàn),外界認(rèn)為該公司或?qū)_擊由谷歌主導(dǎo)的搜索引擎市場。
道瓊斯和《紐約郵報》指控稱,為了搶占市場,Perplexity公司非法利用出版商生產(chǎn)的內(nèi)容獲取利益,該公司必須為此進(jìn)行賠償。
在此之前,美國《紐約時報》曾以侵犯版權(quán)為由對OpenAI提起訴訟,要求其停止使用《紐約時報》刊發(fā)的內(nèi)容(主要為在線內(nèi)容)訓(xùn)練人工智能模型,刪除已收集到的語料數(shù)據(jù),并作出賠償。
面對接踵而至的訴訟,OpenAI否認(rèn)相關(guān)指控,并針對美國和加拿大新聞機構(gòu)發(fā)表聲明稱:“我們的模型以公開數(shù)據(jù)為基礎(chǔ),以公平使用原則和相關(guān)國際版權(quán)原則為依據(jù)。我們對創(chuàng)作者是公平的,而且這是支持創(chuàng)新的舉措。”O(jiān)penAI還表示,對遭遇訴訟感到“驚訝和失望”,公司可以就版權(quán)問題與新聞機構(gòu)進(jìn)行“建設(shè)性談判”。
Perplexity公司對新聞機構(gòu)和出版商示好,表示愿意開展合作。該公司為此推出了“出版商收入共享計劃”。根據(jù)該計劃,當(dāng)新聞媒體和出版商生產(chǎn)的內(nèi)容被人工智能生成的答案引用時,Perplexity公司將分享一定比例的廣告收益。
英國《衛(wèi)報》指出,人工智能科技公司讓出小部分利益,難以滿足內(nèi)容生產(chǎn)方的版權(quán)訴求——一些生成式人工智能業(yè)內(nèi)人士也是這樣認(rèn)為的。人工智能公司Stability AI的高管埃德·雷克斯在接受采訪時就指出,人工智能科技公司建立并運營生成式人工智能模型,依賴三種關(guān)鍵資源——人員、計算系統(tǒng)和語料數(shù)據(jù)。很多公司在前兩者上投入巨資,有些工程師年薪超過100萬美元,一些計算系統(tǒng)的成本超過10億美元。然而,人工智能科技公司普遍沒有針對語料數(shù)據(jù)進(jìn)行大規(guī)模投資,甚至希望一直免費獲取語料。
人工智能科技公司忽略了創(chuàng)作語料的機構(gòu)和個人。公司通常解釋說,其做法受到版權(quán)法“合理使用”條款的保護(hù)。但是,作為內(nèi)容生產(chǎn)者,新聞機構(gòu)和出版商對“合理使用”的理解與科技公司不同。隨著人工智能技術(shù)應(yīng)用的不斷發(fā)展和普及,內(nèi)容生產(chǎn)者傾向于發(fā)起反擊。
據(jù)加拿大《多倫多星報》報道,加拿大國會眾議院下屬的工業(yè)、自然資源和科學(xué)技術(shù)委員會,近日發(fā)布了討論立法規(guī)制生成式人工智能語料來源的報告。
該委員會認(rèn)為,生成式人工智能模型訓(xùn)練階段的版權(quán)責(zé)任問題,涉及版權(quán)保護(hù)、激勵創(chuàng)作及技術(shù)創(chuàng)新、產(chǎn)業(yè)發(fā)展等多重價值目標(biāo),無疑需要科學(xué)合理的制度設(shè)計。從國際競爭的角度看,為了促進(jìn)生成式人工智能的產(chǎn)業(yè)和技術(shù)發(fā)展,應(yīng)當(dāng)豁免模型訓(xùn)練階段所獲語料數(shù)據(jù)的版權(quán)責(zé)任。但是,也應(yīng)審慎考量如何設(shè)計搭建具有實操性的版權(quán)方保護(hù)機制。
目前針對“生成式人工智能模型訓(xùn)練語料來源”存在成文法規(guī)定的國家和地區(qū),具有代表性的是日本、美國和歐盟。三者原則上都豁免模型廠商事前獲得著作權(quán)人授權(quán)的義務(wù),即不必得到著作權(quán)人的明確授權(quán)。但是,對著作權(quán)人給予一定的保護(hù)也是相關(guān)法律法規(guī)的必備條款。報告認(rèn)為,加拿大應(yīng)避免采用日本的“寬松模式”和歐盟的“從緊模式”,而應(yīng)傾向于采用與美國類似的模式。
日本2018年修訂著作權(quán)法,加入“非欣賞性利用”條款。該條款不區(qū)分商業(yè)利用和非商業(yè)利用情形,豁免了生成式人工智能模型獲取語料的責(zé)任,規(guī)定了“但書條款”——不得對版權(quán)人的利益造成不當(dāng)損害。日本文化審議會著作權(quán)分會的相關(guān)解釋指出,如果版權(quán)人主動采取技術(shù)保護(hù)措施,以防止自身作品被用于生成式人工智能,而人工智能科技公司規(guī)避這類技術(shù)措施獲取語料,即屬違法。
2024年3月13日,歐洲議會批準(zhǔn)施行新版人工智能法案,其中關(guān)于生成式人工智能模型所用語料版權(quán)責(zé)任的規(guī)定有三項:一是模型所獲語料的版權(quán)責(zé)任豁免,前提是廠商合法獲取相關(guān)作品;二是對于以商業(yè)利用為目的語料獲取行為,版權(quán)方享有事前獲知權(quán);三是廠商須制定相應(yīng)的規(guī)則,以識別以商業(yè)利用為目的語料獲取行為,從而確保第二項規(guī)定的執(zhí)行。
歐盟的上述規(guī)定對于人工智能科技公司來說較為嚴(yán)格。2024年3月,谷歌公司就因在訓(xùn)練Gemini產(chǎn)品時違反相關(guān)規(guī)定,被法國競爭管理局處以2.5億歐元罰款。
加拿大傾向于采用類似美國的規(guī)制模式,即重點關(guān)注人工智能模型獲取語料是否符合“合理使用”原則。2023年9月25日,美國特拉華州地方法院審結(jié)了美國首起人工智能版權(quán)侵權(quán)案。法院傾向于支持“復(fù)制版權(quán)作品用于訓(xùn)練人工智能模型”構(gòu)成“合理使用”,即符合“轉(zhuǎn)換性使用”中的“中間復(fù)制”標(biāo)準(zhǔn)。但其前提是:相關(guān)模型僅是學(xué)習(xí)現(xiàn)成作品中的自然語言模式及相關(guān)性等,然后根據(jù)用戶提問,輸出不同于原語料作品的新內(nèi)容。如果相關(guān)模型只將原作品復(fù)制并存儲,然后以類似檢索工具的方式根據(jù)用戶提問輸出與原作品相同的內(nèi)容,則不屬于“合理使用”的范疇。
編輯:姚志剛" " winter-yao@163.com