加拿大擬對人工智能語料來源立法

2025-02-13 00:00:00劉秉軍

檢察風(fēng)云 2025年3期

為促進(jìn)生成式人工智能的發(fā)展，應(yīng)當(dāng)豁免模型訓(xùn)練階段所獲語料的版權(quán)責(zé)任，但也應(yīng)審慎考量版權(quán)方保護(hù)問題。

對于人工智能科技公司來說，當(dāng)前一種通行的運營方式是從網(wǎng)絡(luò)上抓取現(xiàn)成的信息數(shù)據(jù)作為語料，用于生成式人工智能模型的訓(xùn)練及內(nèi)容輸出。隨著人工智能技術(shù)應(yīng)用的不斷發(fā)展和普及，內(nèi)容生產(chǎn)者的反應(yīng)日益強烈。近日，加拿大各主要新聞機構(gòu)就此對美國開放人工智能研究中心（OpenAI）提起訴訟。加拿大國會眾議院醞釀推動立法，規(guī)制人工智能科技公司獲取數(shù)據(jù)作為語料的行為。

人工智能公司頻遇訴訟

2024年11月底，加拿大多家主要新聞機構(gòu)指控OpenAI未經(jīng)許可抓取媒體發(fā)表的文章，用于聊天生成預(yù)訓(xùn)練轉(zhuǎn)換器（ChatGPT）。參與起訴的原告方包括《多倫多星報》及該集團(tuán)旗下的大都會媒體公司、《環(huán)球郵報》媒體集團(tuán)和加拿大廣播公司等具有廣泛影響的加拿大傳媒巨頭。這些新聞機構(gòu)指控OpenAI侵犯著作權(quán)，在網(wǎng)絡(luò)上抓取大量由媒體生產(chǎn)出的內(nèi)容，并利用這些內(nèi)容獲利。

《環(huán)球郵報》刊發(fā)的相關(guān)聲明稱：“新聞報道服務(wù)于公共利益。OpenAI利用已成文的新聞報道獲取商業(yè)利益的行為不符合公共利益，屬于非法行為?！薄抖鄠惗嘈菆蟆芳瘓F(tuán)首席執(zhí)行官尼爾·奧利弗在發(fā)送給全體員工的備忘錄中寫道：“科技公司竊取我們生產(chǎn)的內(nèi)容，我們不會坐視不理。雖然我們要擁抱技術(shù)創(chuàng)新帶來的機遇，但所有參與者都必須遵守法律。我們的知識產(chǎn)權(quán)必須得到合理使用?！?/p>

據(jù)英國《衛(wèi)報》報道，一系列訴訟可能讓OpenAI付出巨大代價?！抖鄠惗嘈菆蟆返刃侣剻C構(gòu)要求OpenAI為每一篇其非法抓取用于訓(xùn)練ChatGPT的文章支付2萬加拿大元（約合1.47萬美元）。相關(guān)訴訟的索賠總額高達(dá)數(shù)十億美元。

這不是人工智能科技公司首次面對有關(guān)新聞著作權(quán)的訴訟。近來，內(nèi)容版權(quán)方針對人工智能科技公司發(fā)起多起訴訟。2024年10月21日，媒體大亨默多克旗下新聞集團(tuán)的子公司道瓊斯和《紐約郵報》對Perplexity公司提起訴訟，指控這家人工智能初創(chuàng)公司非法復(fù)制大量版權(quán)作品。

成立兩年多的Perplexity公司為用戶提供人工智能聊天機器人，它可以總結(jié)搜索結(jié)果，列出答案的引用來源，并幫助用戶優(yōu)化查詢到的信息，以得出最佳答案。鑒于Perplexity公司在搜索領(lǐng)域的亮眼表現(xiàn)，外界認(rèn)為該公司或?qū)_擊由谷歌主導(dǎo)的搜索引擎市場。

道瓊斯和《紐約郵報》指控稱，為了搶占市場，Perplexity公司非法利用出版商生產(chǎn)的內(nèi)容獲取利益，該公司必須為此進(jìn)行賠償。

在此之前，美國《紐約時報》曾以侵犯版權(quán)為由對OpenAI提起訴訟，要求其停止使用《紐約時報》刊發(fā)的內(nèi)容（主要為在線內(nèi)容）訓(xùn)練人工智能模型，刪除已收集到的語料數(shù)據(jù)，并作出賠償。

對“合理使用”有不同理解

面對接踵而至的訴訟，OpenAI否認(rèn)相關(guān)指控，并針對美國和加拿大新聞機構(gòu)發(fā)表聲明稱：“我們的模型以公開數(shù)據(jù)為基礎(chǔ)，以公平使用原則和相關(guān)國際版權(quán)原則為依據(jù)。我們對創(chuàng)作者是公平的，而且這是支持創(chuàng)新的舉措。”O(jiān)penAI還表示，對遭遇訴訟感到“驚訝和失望”，公司可以就版權(quán)問題與新聞機構(gòu)進(jìn)行“建設(shè)性談判”。

Perplexity公司對新聞機構(gòu)和出版商示好，表示愿意開展合作。該公司為此推出了“出版商收入共享計劃”。根據(jù)該計劃，當(dāng)新聞媒體和出版商生產(chǎn)的內(nèi)容被人工智能生成的答案引用時，Perplexity公司將分享一定比例的廣告收益。

英國《衛(wèi)報》指出，人工智能科技公司讓出小部分利益，難以滿足內(nèi)容生產(chǎn)方的版權(quán)訴求——一些生成式人工智能業(yè)內(nèi)人士也是這樣認(rèn)為的。人工智能公司Stability AI的高管埃德·雷克斯在接受采訪時就指出，人工智能科技公司建立并運營生成式人工智能模型，依賴三種關(guān)鍵資源——人員、計算系統(tǒng)和語料數(shù)據(jù)。很多公司在前兩者上投入巨資，有些工程師年薪超過100萬美元，一些計算系統(tǒng)的成本超過10億美元。然而，人工智能科技公司普遍沒有針對語料數(shù)據(jù)進(jìn)行大規(guī)模投資，甚至希望一直免費獲取語料。

人工智能科技公司忽略了創(chuàng)作語料的機構(gòu)和個人。公司通常解釋說，其做法受到版權(quán)法“合理使用”條款的保護(hù)。但是，作為內(nèi)容生產(chǎn)者，新聞機構(gòu)和出版商對“合理使用”的理解與科技公司不同。隨著人工智能技術(shù)應(yīng)用的不斷發(fā)展和普及，內(nèi)容生產(chǎn)者傾向于發(fā)起反擊。

加拿大國會醞釀相關(guān)立法

據(jù)加拿大《多倫多星報》報道，加拿大國會眾議院下屬的工業(yè)、自然資源和科學(xué)技術(shù)委員會，近日發(fā)布了討論立法規(guī)制生成式人工智能語料來源的報告。

該委員會認(rèn)為，生成式人工智能模型訓(xùn)練階段的版權(quán)責(zé)任問題，涉及版權(quán)保護(hù)、激勵創(chuàng)作及技術(shù)創(chuàng)新、產(chǎn)業(yè)發(fā)展等多重價值目標(biāo)，無疑需要科學(xué)合理的制度設(shè)計。從國際競爭的角度看，為了促進(jìn)生成式人工智能的產(chǎn)業(yè)和技術(shù)發(fā)展，應(yīng)當(dāng)豁免模型訓(xùn)練階段所獲語料數(shù)據(jù)的版權(quán)責(zé)任。但是，也應(yīng)審慎考量如何設(shè)計搭建具有實操性的版權(quán)方保護(hù)機制。

目前針對“生成式人工智能模型訓(xùn)練語料來源”存在成文法規(guī)定的國家和地區(qū)，具有代表性的是日本、美國和歐盟。三者原則上都豁免模型廠商事前獲得著作權(quán)人授權(quán)的義務(wù)，即不必得到著作權(quán)人的明確授權(quán)。但是，對著作權(quán)人給予一定的保護(hù)也是相關(guān)法律法規(guī)的必備條款。報告認(rèn)為，加拿大應(yīng)避免采用日本的“寬松模式”和歐盟的“從緊模式”，而應(yīng)傾向于采用與美國類似的模式。

日本2018年修訂著作權(quán)法，加入“非欣賞性利用”條款。該條款不區(qū)分商業(yè)利用和非商業(yè)利用情形，豁免了生成式人工智能模型獲取語料的責(zé)任，規(guī)定了“但書條款”——不得對版權(quán)人的利益造成不當(dāng)損害。日本文化審議會著作權(quán)分會的相關(guān)解釋指出，如果版權(quán)人主動采取技術(shù)保護(hù)措施，以防止自身作品被用于生成式人工智能，而人工智能科技公司規(guī)避這類技術(shù)措施獲取語料，即屬違法。

2024年3月13日，歐洲議會批準(zhǔn)施行新版人工智能法案，其中關(guān)于生成式人工智能模型所用語料版權(quán)責(zé)任的規(guī)定有三項：一是模型所獲語料的版權(quán)責(zé)任豁免，前提是廠商合法獲取相關(guān)作品；二是對于以商業(yè)利用為目的語料獲取行為，版權(quán)方享有事前獲知權(quán)；三是廠商須制定相應(yīng)的規(guī)則，以識別以商業(yè)利用為目的語料獲取行為，從而確保第二項規(guī)定的執(zhí)行。

歐盟的上述規(guī)定對于人工智能科技公司來說較為嚴(yán)格。2024年3月，谷歌公司就因在訓(xùn)練Gemini產(chǎn)品時違反相關(guān)規(guī)定，被法國競爭管理局處以2.5億歐元罰款。

加拿大傾向于采用類似美國的規(guī)制模式，即重點關(guān)注人工智能模型獲取語料是否符合“合理使用”原則。2023年9月25日，美國特拉華州地方法院審結(jié)了美國首起人工智能版權(quán)侵權(quán)案。法院傾向于支持“復(fù)制版權(quán)作品用于訓(xùn)練人工智能模型”構(gòu)成“合理使用”，即符合“轉(zhuǎn)換性使用”中的“中間復(fù)制”標(biāo)準(zhǔn)。但其前提是：相關(guān)模型僅是學(xué)習(xí)現(xiàn)成作品中的自然語言模式及相關(guān)性等，然后根據(jù)用戶提問，輸出不同于原語料作品的新內(nèi)容。如果相關(guān)模型只將原作品復(fù)制并存儲，然后以類似檢索工具的方式根據(jù)用戶提問輸出與原作品相同的內(nèi)容，則不屬于“合理使用”的范疇。

編輯：姚志剛" " winter-yao@163.com

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

加拿大擬對人工智能語料來源立法

人工智能公司頻遇訴訟

對“合理使用”有不同理解

加拿大國會醞釀相關(guān)立法