楊延超
ChatGPT引爆了全球大模型產(chǎn)業(yè)發(fā)展。大模型通過大數(shù)據(jù)、大算力和大算法的結(jié)合,實現(xiàn)了對世界的深度理解。大數(shù)據(jù)提供了豐富的知識,大算力使得模型能夠快速有效地學(xué)習(xí)這些知識,大算法則幫助模型優(yōu)化參數(shù),提取有用信息。這三個維度的結(jié)合使得大模型具有強(qiáng)大的理解力,能夠更好地理解和生成人類語言,處理更復(fù)雜的任務(wù),如文本理解、圖像識別等,從而極大地提升了AI的能力。大模型時代,也催生了人工智能領(lǐng)域一系列全新知識產(chǎn)權(quán)問題。
知識產(chǎn)權(quán)立法對于人工智能產(chǎn)業(yè)的發(fā)展具有重要的意義,不僅可以保護(hù)創(chuàng)新者的權(quán)益,激勵產(chǎn)業(yè)的投資和創(chuàng)新,也可以推動技術(shù)的進(jìn)步,促進(jìn)知識的傳播。同時,也需要兼顧社會安全和社會倫理的考量,以保護(hù)社會的安全和倫理。
人工智能的專利布局總體而言,主要集中在一些發(fā)達(dá)經(jīng)濟(jì)體,包括美國、日本、中國、歐盟等國家和地區(qū)。這些國家和地區(qū)在人工智能技術(shù)的研發(fā)和應(yīng)用上都有著深厚的積累和優(yōu)勢。然而,專利布局的數(shù)量并不能完全代表技術(shù)的質(zhì)量和領(lǐng)先度。一個技術(shù)的應(yīng)用,它的用戶體驗,以及市場上它最終的實踐情況,才能更科學(xué)地檢驗它的技術(shù)領(lǐng)先度。
在人工智能的各個子領(lǐng)域中,不同的國家和地區(qū)具有不同的技術(shù)優(yōu)勢。例如,在工業(yè)機(jī)器人領(lǐng)域,日本、德國、瑞士的專利布局就比較明顯。在自然語言處理領(lǐng)域,美國和中國的專利布局也比較凸顯。在無人駕駛領(lǐng)域,中國和美國的專利布局近年來發(fā)展迅速。這些專利布局反映了各個國家在這些領(lǐng)域的技術(shù)優(yōu)勢和發(fā)展方向。人工智能技術(shù)已經(jīng)廣泛應(yīng)用于生活、醫(yī)療、金融等多領(lǐng)域。例如,工業(yè)機(jī)器人廣泛應(yīng)用于生產(chǎn)實踐中;自然語言處理技術(shù),如ChatGPT,被廣泛應(yīng)用于對話和交流中;無人駕駛技術(shù)正在逐步改變我們的出行方式。這些應(yīng)用都有著相關(guān)的專利布局,反映了人工智能技術(shù)的廣泛應(yīng)用和深遠(yuǎn)影響。
在這里要特別強(qiáng)調(diào)一點,對人工智能的保護(hù),專利布局從某種意義上只能代表一個數(shù)量,它并不能完全代表著質(zhì)量,尤其是在很多技術(shù)領(lǐng)域中,可能后期你雖然有龐大的專利數(shù)量,但不代表著你占領(lǐng)了這個領(lǐng)域的核心技術(shù),這是要特別關(guān)注的。一個技術(shù)的應(yīng)用,它的用戶體驗,以及市場上它最終的實踐情況,以此來檢驗它的技術(shù)領(lǐng)先度更科學(xué)。還有一點需特別強(qiáng)調(diào)的是,隱藏在專利布局背后的,是商業(yè)秘密。比如說這次的ChatGPT,它的論文也沒公布,具體的算法也沒公布。這背后,至少目前它是技術(shù)秘密的狀態(tài)。它在1.0版和2.0版公布了論文,但是到目前3.5版之后,它就沒有公布論文,它是通過這種商業(yè)秘密的方式來保護(hù)。所以對未來的AI時代,我們要考察技術(shù)領(lǐng)先度應(yīng)該是多維的,而不應(yīng)該僅僅是從專利布局的數(shù)量來單維考察。
在專利布局背后,還隱藏著商業(yè)秘密。例如,ChatGPT在1.0版和2.0版的時候公布了論文,但在3.5版之后,它沒有公布論文,而是通過保護(hù)技術(shù)秘密的方式來保護(hù)自己的技術(shù)優(yōu)勢。這種方式在未來的AI時代可能會越來越常見。此外,一些公司可能會選擇在關(guān)鍵技術(shù)上申請專利,而在其他非核心技術(shù)上選擇開源,以此來平衡保護(hù)技術(shù)秘密和推動技術(shù)發(fā)展的需要。
在AI領(lǐng)域,開源、專利保護(hù)和商業(yè)秘密是三種常見的選擇,它們之間的關(guān)系和選擇取決于公司的戰(zhàn)略和市場環(huán)境。
開源是一種以共享和協(xié)作為基礎(chǔ)的開發(fā)模式,它可以推動技術(shù)進(jìn)步和社區(qū)發(fā)展。例如,F(xiàn)acebook(現(xiàn)Meta)已經(jīng)將其最新的大型語言模型Llama 2開源,供研究和商業(yè)使用。開源模型可以幫助開發(fā)者和研究者更好地理解和利用AI技術(shù),同時也能吸引更多的人才和資源參與到項目中來,推動技術(shù)的進(jìn)步和社區(qū)的發(fā)展。
專利保護(hù)是一種法律手段,通過獲得專利權(quán)來保護(hù)技術(shù)成果和市場份額。專利保護(hù)可以防止他人在一定期限內(nèi)未經(jīng)許可使用、銷售或進(jìn)口專利產(chǎn)品,從而保護(hù)發(fā)明者的利益。然而,專利的申請和維護(hù)成本較高,且專利信息公開可能會暴露技術(shù)細(xì)節(jié)。
商業(yè)秘密是一種通過保密措施來保護(hù)核心技術(shù)和競爭優(yōu)勢的方式。例如,OpenAI在發(fā)布GPT-3后,沒有公開其詳細(xì)的技術(shù)細(xì)節(jié)和算法,而是選擇通過商業(yè)秘密的方式來保護(hù)其技術(shù)優(yōu)勢。商業(yè)秘密沒有時間限制,只要信息保密,就可以一直保護(hù)。然而,一旦秘密泄露,就可能無法獲得法律保護(hù)。
隨著AI技術(shù)的發(fā)展和應(yīng)用,開源、專利保護(hù)和商業(yè)秘密這三種方式可能會并存和互補。一方面,開源可以推動AI技術(shù)的進(jìn)步和社區(qū)的發(fā)展,另一方面,專利保護(hù)和商業(yè)秘密可以保護(hù)公司的技術(shù)成果和市場份額。具體選擇哪種方式,需要根據(jù)公司的戰(zhàn)略、技術(shù)特性和市場環(huán)境來決定。
未來,我們可能會看到更多的混合策略出現(xiàn)。例如,一些公司可能會選擇在關(guān)鍵技術(shù)上申請專利,而在其他非核心技術(shù)上選擇開源,以此來平衡保護(hù)技術(shù)秘密和推動技術(shù)發(fā)展的需要。同時,隨著AI技術(shù)的發(fā)展,一些新的技術(shù)領(lǐng)域可能會出現(xiàn),這些領(lǐng)域可能會有新的保護(hù)方式出現(xiàn),例如,數(shù)據(jù)保護(hù)和算法保護(hù)可能會成為新的保護(hù)方式。
此外,在涉及技術(shù)保護(hù)問題上,人工智能公司也會在選擇商業(yè)秘密還是專利保護(hù)問題上進(jìn)行平衡。一般通過產(chǎn)品可以復(fù)現(xiàn)技術(shù),會申請專利,這樣權(quán)利人就獲得了專利的獨占權(quán),可以有效防止產(chǎn)品上市后,其他商家通過分析產(chǎn)品復(fù)現(xiàn)技術(shù)。在這種情況下,商業(yè)秘密是無意義的,因為產(chǎn)品一旦上市,商業(yè)秘密也就不存在了。然而,像對話類機(jī)器人,產(chǎn)品通過網(wǎng)絡(luò)使用,在使用中對底層算法是無法復(fù)現(xiàn)的,權(quán)利人也就不擔(dān)心產(chǎn)品上市后復(fù)現(xiàn),這樣的話,一般會通過商業(yè)秘密的方法保護(hù)。當(dāng)然,隨著技術(shù)迭代,落后的技術(shù)會逐步開源,最先進(jìn)的技術(shù)會通過商業(yè)秘密進(jìn)行保護(hù)的。
人工智能大模型的發(fā)展,對版權(quán)法的挑戰(zhàn)與變革將是全面而深遠(yuǎn)的。知識產(chǎn)權(quán)法基本上解決了三個核心問題:創(chuàng)作者(發(fā)明者)身份的確定,智力成果的定義,以及如何保護(hù)。然而,人工智能的發(fā)展將對這三個問題提出新的挑戰(zhàn)和解決方案。下面以版權(quán)為例進(jìn)行討論。
首先,作者身份的確定問題。一般而言,作者是一位具有專門技能的藝術(shù)家或者創(chuàng)作者,往往從很小的時候就開始學(xué)習(xí)和磨煉這些技能。然而,大模型的出現(xiàn)可能會對我們對“作者”的定義提出全新的要求。它要求我們重新考慮獨創(chuàng)性的定義,并為此設(shè)定全新的標(biāo)準(zhǔn)。這不僅關(guān)乎版權(quán)法的問題,也涉及教育的問題,包括我們應(yīng)該如何培養(yǎng)孩子的技能。
其次,作品的定義問題。傳統(tǒng)上,作品的存在和價值在很大程度上取決于它的可復(fù)制性,復(fù)制權(quán)是版權(quán)中最重要的一種權(quán)利。然而,大模型的出現(xiàn)和發(fā)展可能會改變這種情況。未來的作品可能不再是千篇一律的復(fù)制品,而是可以根據(jù)每個人的需求進(jìn)行個性化調(diào)整的產(chǎn)品。預(yù)測未來,大模型的發(fā)展可能會使得每個人觀看的電視劇、玩的游戲都具有獨一無二的特性。這種轉(zhuǎn)變在未來都將實現(xiàn)。
最后,版權(quán)的保護(hù)方法。過去,我們主要依靠法律訴訟來保護(hù)版權(quán)。然而,大模型的出現(xiàn)使得技術(shù)性的保護(hù)方法成為可能。在這種情況下,我們不再需要通過頻繁的法律修訂來保護(hù)權(quán)利,而是可以依賴于技術(shù)來實現(xiàn)版權(quán)的保護(hù)。相比較法律保護(hù),技術(shù)保護(hù)可以極大節(jié)省權(quán)利人保護(hù)權(quán)利的成本,同時極大提升保護(hù)效果。
總的來說,大模型的出現(xiàn)和發(fā)展將對版權(quán)法提出全新的挑戰(zhàn),也將為版權(quán)法的改革提供全新的可能性。我們需要密切關(guān)注這一發(fā)展趨勢,并在此基礎(chǔ)上進(jìn)行適應(yīng)性的改革。
1.對人工智能產(chǎn)品的專利保護(hù)有利于激勵產(chǎn)業(yè)投資與創(chuàng)新。
人工智能產(chǎn)品的核心往往是與算法有關(guān)。然而,算法在現(xiàn)行的專利法中,可能會被納入到智力活動規(guī)則的范疇,從而不受專利保護(hù)。這種情況下,人工智能產(chǎn)品的創(chuàng)新和投資可能會受到阻礙。因此,我們需要重新審視專利法,區(qū)分算法類產(chǎn)品與純粹的智力活動規(guī)則之間的區(qū)別,制定更科學(xué)的專利保護(hù)范疇。這樣,不僅可以保護(hù)創(chuàng)新者的權(quán)益,也可以激勵更多的投資和創(chuàng)新。
在現(xiàn)實中,許多人工智能產(chǎn)品的創(chuàng)新都是基于算法的。例如,深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等技術(shù),都是基于復(fù)雜的算法。這些算法的創(chuàng)新,為人工智能產(chǎn)品的發(fā)展提供了強(qiáng)大的動力。然而,如果這些算法不能得到專利保護(hù),那么創(chuàng)新者可能會失去創(chuàng)新的動力,因為他們無法從他們的創(chuàng)新中獲得經(jīng)濟(jì)回報。因此,對人工智能產(chǎn)品的專利保護(hù),對于激勵產(chǎn)業(yè)投資與創(chuàng)新具有重要的意義。
2.人工智能時代,做好利益平衡,有利于推動技術(shù)進(jìn)步。
許多人工智能技術(shù)的發(fā)展都是基于數(shù)據(jù)共享、技術(shù)共享和模型共享的。例如,許多深度學(xué)習(xí)的模型,都是基于公開的數(shù)據(jù)集進(jìn)行訓(xùn)練的。這些數(shù)據(jù)集的共享,為深度學(xué)習(xí)的發(fā)展提供了強(qiáng)大的支持。由此,就需要在保護(hù)數(shù)據(jù)私有性和推動技術(shù)進(jìn)步之間找到一個平衡。在人工智能時代,數(shù)據(jù)共享、技術(shù)共享、模型共享成為了一種趨勢。這不僅可以推動技術(shù)的進(jìn)步,也可以促進(jìn)知識的傳播。然而,這也需要我們在保護(hù)創(chuàng)新的同時,合理設(shè)定權(quán)利限制,如合理使用、法定許可等制度。這樣,我們既可以保護(hù)創(chuàng)新者的權(quán)益,也可以讓技術(shù)成果、文學(xué)藝術(shù)得到極大的傳播與交流。
3.人工智能產(chǎn)業(yè)發(fā)展還要兼顧社會安全和社會倫理考量。
人工智能的發(fā)展,不僅僅是技術(shù)的問題,更是社會安全和社會倫理的問題。因此,知識產(chǎn)權(quán)法也需要劃出紅線,對于違反社會安全和社會倫理的人工智能產(chǎn)品,我們需要堅決說不。這樣,我們既可以保護(hù)社會的安全,也可以維護(hù)社會的倫理。在現(xiàn)實中,人工智能的發(fā)展已經(jīng)引發(fā)了許多社會安全和社會倫理的問題。例如,人工智能的決策可能會引發(fā)歧視問題,人工智能的自主性可能會引發(fā)法律責(zé)任分配問題,相關(guān)問題也都有必要在人工智能的知識產(chǎn)權(quán)立法中進(jìn)行充分的考慮。
(摘自8月2日《經(jīng)濟(jì)參考報》。作者為中國社科院法學(xué)所研究員、科技與法研究中心主任)