侯澤琦
(北京理工大學(xué) 法學(xué)院,北京 100081)
算法解釋與算法透明成為綜合業(yè)界與學(xué)界在進(jìn)行橫跨文理的技術(shù)考量后,形成的技術(shù)性與可行性相統(tǒng)一的算法規(guī)制手段,并在《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》(以下簡稱《算法推薦規(guī)定》)中得到確定?!吨腥A人民共和國個人信息保護(hù)法》與《中華人民共和國反不正當(dāng)競爭法》同樣要求算法公正與透明,但是規(guī)定較為粗略,缺乏行之有效的實操內(nèi)容。歐盟《一般數(shù)據(jù)保護(hù)條例》(GDPR)要求,企業(yè)必須從技術(shù)與組織結(jié)構(gòu)層面告知算法決策的邏輯。由于算法評估、備案等公開機(jī)制均過分強(qiáng)調(diào)監(jiān)管部門的作用,這在增加治理成本的同時,也忽略了市場自律的可能。專利公開制度是賦予企業(yè)合法壟斷,以公開換取競爭優(yōu)勢的重要制度;而算法可解釋的核心在于,算法歧視的主觀行為能否通過公開的技術(shù)指標(biāo)得以體現(xiàn)。那么,專利公開的技術(shù)內(nèi)容能否既滿足監(jiān)管部門所規(guī)定的公開披露要求,又使企業(yè)在與商業(yè)秘密不沖突的前提下,利用專利公開最大化市場競爭力的同時,滿足算法透明度的要求,最終使專利公開制度作為企業(yè)自律的一環(huán),并與國家主導(dǎo)的算法審查制度相配合,實現(xiàn)企業(yè)以趨利避害為基礎(chǔ)進(jìn)行自律。這將是筆者主要探討的問題。
《算法推薦規(guī)定》對于算法解釋、算法透明概念以及二者的關(guān)系未進(jìn)行明確的規(guī)定,學(xué)界對此也看法不一。筆者認(rèn)為,算法解釋是以技術(shù)為出發(fā)點,利用自然語言與可視化的方式,對算法設(shè)計的決策邏輯與法律風(fēng)險向有關(guān)機(jī)關(guān)或個人進(jìn)行解釋。算法解釋可以細(xì)化為可執(zhí)行的標(biāo)準(zhǔn)和程序,且解釋對象為具備技術(shù)背景的監(jiān)管部門、評估方、個人。算法透明,則是指算法主體披露算法應(yīng)用、設(shè)計參數(shù)等一系列信息,從而獲得外界的信任[1]。算法透明本身具備一定的政治性,且評判標(biāo)準(zhǔn)主觀,難以形成規(guī)范化的可執(zhí)行標(biāo)準(zhǔn)和程序,超出了法律與技術(shù)的范疇[2]。其目的在于,使監(jiān)管主體和公眾,了解并信服其算法安全性。有學(xué)者提出,算法的透明度應(yīng)當(dāng)通過參數(shù)可視化、實例解釋等方式進(jìn)行公開[3]。筆者認(rèn)為,這種方式的本質(zhì)依然是算法解釋,因為算法解釋與算法透明二者是手段與目的的關(guān)系,所以算法主體通過算法解釋的手段進(jìn)行算法公開,從而獲得適度的算法透明度,進(jìn)而達(dá)成企業(yè)公信力的提升。因此,《新一代人工智能發(fā)展規(guī)劃》在建設(shè)新一代人工智能算法體系的過程中,要求實現(xiàn)具備高可解釋性、強(qiáng)泛化能力(算法兼容性)的人工智能[4],但并未提及算法透明的相關(guān)內(nèi)容,可見算法解釋更適合量化并作為法律標(biāo)準(zhǔn)規(guī)制的客體。專利制度中,企業(yè)遞交的算法專利申請書與說明書,必定需要列明算法的數(shù)據(jù)服務(wù)方法、算法模塊結(jié)構(gòu)等原理,并附上方法實施例,與上文提及的參數(shù)可視化、實例解釋等公開方式相似。因此,下文將探討算法專利的公開內(nèi)容,是否屬于算法解釋且能否達(dá)到適度的算法透明要求。對于《算法推薦規(guī)定》中的算法透明不再予以討論。
在明確算法解釋之前,要明確算法的黑箱來源,才能找準(zhǔn)體現(xiàn)算法主觀行為惡性的算法技術(shù)指標(biāo)。首先需要明確的是,并非所有的算法都具備黑箱性。人工智能算法的目標(biāo)在于利用計算機(jī)模擬人的思維,而人的思維在數(shù)學(xué)上可以抽象地表示為各類函數(shù)及其總和,也即算法的核心構(gòu)成,是其作出決策的關(guān)鍵[5]。相應(yīng)地,目前市面上主要存在三種類型的算法:線性(linear)、決策樹(decision tree)、神經(jīng)網(wǎng)絡(luò)(deep network)。線性算法通常具有優(yōu)秀的解釋能力,因為線性回歸模型可以很直觀地展示每個樣本數(shù)據(jù)參與模型運算的特征權(quán)重,由此可以清晰地知道決策原委。決策樹算法可以清晰地看到每個節(jié)點和問題,并且可以通過結(jié)果向上逆推得到?jīng)Q策過程,看似是一個既可解釋又能支持復(fù)雜模型的算法,但當(dāng)決策樹模型復(fù)雜到可以構(gòu)成隨機(jī)森林(random forest)的時候,其就不再具備自解釋性。深度學(xué)習(xí)算法本身就是由多層非線性函數(shù)構(gòu)成的,同時,算法的應(yīng)用需要經(jīng)過數(shù)據(jù)訓(xùn)練后形成神經(jīng)網(wǎng)絡(luò)算法模型,訓(xùn)練數(shù)據(jù)也會影響算法的決策[6]。此外,還需引入確定推理與不確定推理概念。確定推理包含法律人熟悉的經(jīng)典演繹推理,在定罪量刑中得到了廣泛應(yīng)用,也是行政與審判自動化的技術(shù)基礎(chǔ);不確定推理則是基于統(tǒng)計學(xué)而來的,輸入值差之毫厘,將會因為落在不同的概率區(qū)間而導(dǎo)致輸出值謬以千里。神經(jīng)網(wǎng)絡(luò)算法就是由大量的“不確定”“非線性”系統(tǒng)層層疊加得到的[7],導(dǎo)致神經(jīng)網(wǎng)絡(luò)中關(guān)鍵參數(shù)的波動范圍在整個訓(xùn)練過程中無法可控,難以使用普通人熟知的自然語言予以解釋[8]。
算法解釋的核心還是要依賴算法解釋技術(shù)的進(jìn)步,而法律在其中主要承擔(dān)規(guī)訓(xùn)技術(shù),并設(shè)定可選解釋路徑和分場景分級別設(shè)定相關(guān)技術(shù)參數(shù)披露紅線的作用。筆者將其總結(jié)為法律對算法解釋的定性、定量、定體功能,通過對算法解釋應(yīng)當(dāng)達(dá)到的透明度、解釋路徑、程序規(guī)范等進(jìn)行綱領(lǐng)性、結(jié)果性的指引,并通過技術(shù)標(biāo)準(zhǔn)、指南等技術(shù)性、靈活性規(guī)制手段進(jìn)行具體細(xì)化。
算法解釋的定性,是指通過自然語言對規(guī)范性文件中要求的算法功能進(jìn)行解釋,表達(dá)出算法分析與決策過程的實質(zhì),由此作為算法解釋是否滿足要求的判定原則。筆者認(rèn)為,算法解釋的理想目標(biāo)是全方位地解釋算法模型的工作機(jī)理,并準(zhǔn)確、全面、清晰地告知分析與決策的步驟。但是,囿于算法的復(fù)雜與解釋技術(shù)的限制,現(xiàn)階段尚未有技術(shù)可以達(dá)到此目標(biāo)。因此,算法解釋的定性應(yīng)當(dāng)以“信任”為判斷標(biāo)準(zhǔn),而非“透明度”。由于人腦的決策實際也是一種黑箱,但是基于語言交互的便利與法律對行為的限制,人與人之間較易產(chǎn)生信任。所以,無需苛責(zé)人工智能算法需要在完全透明的狀態(tài)下才能獲得信任,現(xiàn)階段算法解釋定性應(yīng)當(dāng)要求算法使用者在考慮模型使用數(shù)據(jù)、適用場景、解釋對象的基礎(chǔ)上,盡全力以人類能夠理解的方式解釋算法的學(xué)習(xí)與決策機(jī)理,并驗證其可靠與可信度,最終獲得解釋對象的認(rèn)可[9]。
算法解釋的定量在于將具體評價參數(shù)標(biāo)準(zhǔn)化,即探尋上文提到的算法的主觀惡性反映在哪些具體的技術(shù)指標(biāo)上,一旦算法解釋的各類參數(shù)在合理的范圍內(nèi),即可認(rèn)定為行之有效的算法解釋,并達(dá)到算法透明度之預(yù)期。現(xiàn)階段,《算法推薦規(guī)定》對算法機(jī)制機(jī)理、模型、數(shù)據(jù)和應(yīng)用結(jié)果提出了披露要求,即要求算法解釋的定量以技術(shù)說明、評價參數(shù)等形式出現(xiàn)。目前,軟件工程中的軟件驗收說明書與此有類似之處,會對軟件的各項技術(shù)參數(shù)、穩(wěn)定性等制定技術(shù)性評估標(biāo)準(zhǔn),筆者將其歸納為四個評價方向并作為算法解釋定量的技術(shù)標(biāo)準(zhǔn):公平性(fairness)、可信任度(trustworthiness)、可達(dá)性(accessibility)和交互性(interactivity)、因果關(guān)系(causality),并將在下文進(jìn)行詳細(xì)論述。
算法解釋的定體在于為達(dá)到算法解釋的定量要求,算法主體采取法律或政策許可的固定體例或形式向有關(guān)機(jī)關(guān)或個人進(jìn)行算法解釋。目前主要有兩類解釋形式:其一,在算法模型構(gòu)建之初就考慮到事前可解釋的需求,從而在算法設(shè)計中預(yù)留解釋接口或直接采用自解釋的算法設(shè)計,但目前市面上絕大多數(shù)算法并未采用此種先進(jìn)設(shè)計理念。其二,在現(xiàn)有算法模型的基礎(chǔ)上對輸入數(shù)據(jù)進(jìn)行預(yù)處理,并通過直觀展示輸出數(shù)據(jù)的變化從而對模型進(jìn)行解釋[10]。在技術(shù)上抽象體現(xiàn)為調(diào)整模型內(nèi)部參數(shù),判斷參數(shù)對于結(jié)果的影響,或者向輸入樣本中添加擾動,探索表征向量來對系統(tǒng)中不同變量的重要程度進(jìn)行評估,尋找系統(tǒng)判斷決策的依據(jù)。在技術(shù)上大致有可視化、基于局部近似、基于黑盒測試三種技術(shù)思路[11]。未來,可由行業(yè)技術(shù)標(biāo)準(zhǔn)或者《人工智能算法金融應(yīng)用評價規(guī)范》這類行業(yè)標(biāo)準(zhǔn)在凝練各類算法解釋技術(shù)路線的基礎(chǔ)上,分場景分級別對各類算法主體設(shè)定規(guī)范可行但又靈活可選的定體解釋路徑,給予企業(yè)多種類但又確定的指引。
綜上可知,算法解釋是一項技術(shù)性很強(qiáng)且未成熟,但又亟須法律規(guī)制的行為。采取現(xiàn)有制度的適應(yīng)性改造與行政法規(guī)、行業(yè)標(biāo)準(zhǔn)這類靈活性較強(qiáng)的規(guī)制工具,將有助于算法技術(shù)進(jìn)步與算法侵權(quán)治理的有機(jī)平衡?,F(xiàn)階段,國家立法導(dǎo)向與學(xué)界觀點主要集中于通過國家行政主導(dǎo)的方式,以公權(quán)力工具鏈展開算法治理。知識產(chǎn)權(quán)制度作為法律與科技結(jié)合的典型產(chǎn)物,不應(yīng)在本輪科技變革中缺席,因此,下文將探討以現(xiàn)有專利權(quán)利申請書、說明書、附圖、實施例為組成的專利公開文件,其內(nèi)容能否滿足上文中算法解釋的定體需求,并呈現(xiàn)出與《算法推薦規(guī)定》要求一致的算法解釋定量標(biāo)準(zhǔn),從而滿足算法解釋定性要求,最終實現(xiàn)算法適度透明的法律訴求。
算法的可專利性,是專利制度在算法解釋領(lǐng)域發(fā)揮作用的前提。算法是基于一定推理結(jié)構(gòu),并由各類數(shù)學(xué)函數(shù)表示的集合。由此立法一直貫徹“防止人工智能算法的可專利性”原則,并認(rèn)為其與抽象方法、智力活動等一致,從而不具備專利授予的基本條件。近年來,學(xué)界一直呼吁給予算法專利,尤其是人工智能基礎(chǔ)算法的專利適格性。人工智能算法的可專利性是專利制度在算法解釋與透明功能中的起點,因此,本節(jié)將探討“是否可專利性”到“算法專利保護(hù)”的理論證成與制度轉(zhuǎn)變。
目前,中國正處于“防止算法專利適格性”逐步向“科學(xué)探尋算法專利適格標(biāo)準(zhǔn)”的法理轉(zhuǎn)化的過程中,首先需要厘清“防止算法專利適格性”理論基礎(chǔ),才能有的放矢、推陳出新,建立“科學(xué)探尋算法專利適格標(biāo)準(zhǔn)”的理論體系。全世界范圍內(nèi)對于算法專利的可專利擔(dān)憂主要出于三個方面。
其一,智力活動除外原則①。由于人工智能算法的技術(shù)抽象性與應(yīng)用基礎(chǔ)性,容易被歸類為智力活動——人們進(jìn)行思維、表達(dá)、判斷、記憶的規(guī)則和方法。而智力活動在中國、歐洲、美國②均不能獲得專利適格性[12]。算法從人腦思維到“躍然紙上”再到計算機(jī)實施的過程,本就是需要投入大量時間、精力、財力的研發(fā)過程,因此,將人工智能算法歸于智力活動在智能時代逐漸失去意義,更多是捍衛(wèi)人腦思維自由高于專利壟斷的法律宣言[13]。
其二,區(qū)分基礎(chǔ)研究與實際應(yīng)用原則。傳統(tǒng)上認(rèn)為,人工智能算法開發(fā)作為計算機(jī)領(lǐng)域典型的基礎(chǔ)類研究,由于其缺乏直接商業(yè)應(yīng)用性,不適用于專利制度進(jìn)行保護(hù)與激勵,容易使專利覆蓋范圍過寬,難以平衡專利權(quán)人與社會公共利益[14]。
其三,技術(shù)應(yīng)用領(lǐng)域限制原則。歐洲與中國將算法專利應(yīng)用于具體技術(shù)領(lǐng)域,被視為可專利性的必要條件;美國則認(rèn)為,技術(shù)領(lǐng)域含義模糊,并在“Bilsky 案”確立不采用“技術(shù)領(lǐng)域”標(biāo)準(zhǔn)[15];日本更是對此沒有要求,使得人工智能基礎(chǔ)算法得以在日本獲得專利[16],但隨著機(jī)械時代轉(zhuǎn)向信息時代,日本對技術(shù)性的認(rèn)識也在逐漸發(fā)生變化;德國最高法院在“集成電路分層邏輯檢驗方法”的司法實踐中指出,對“傳統(tǒng)自然力”的直接應(yīng)用不是具有“技術(shù)性”的必要前提,此外,德國對審查人員專業(yè)水平與現(xiàn)有算法專利數(shù)據(jù)檢索庫建設(shè)不健全等制度成本的考量,也是影響“技術(shù)應(yīng)用領(lǐng)域限制”原則的因素。
應(yīng)當(dāng)綜合行業(yè)發(fā)展進(jìn)行適當(dāng)?shù)姆ɡ碚{(diào)整,在肯定算法專利適格性的前提下,以發(fā)展的眼光看待“技術(shù)性”的范圍[17],并審視“應(yīng)用于具體技術(shù)領(lǐng)域”的限定是否必要,從而平衡個人利益與社會公益,進(jìn)而更加明晰算法專利的權(quán)利范圍。
其一,機(jī)械時代到信息時代的轉(zhuǎn)變,使得算法理論到程序應(yīng)用的距離大幅縮短。算法專利審查標(biāo)準(zhǔn)轉(zhuǎn)變的現(xiàn)實依據(jù)是,信息時代使得數(shù)學(xué)基礎(chǔ)理論從原本使用機(jī)械類實現(xiàn)方式轉(zhuǎn)變?yōu)槭褂谩坝嬎銠C(jī)+大數(shù)據(jù)”的信息化實現(xiàn)方式。因此,在計算機(jī)領(lǐng)域,基礎(chǔ)理論與具體應(yīng)用的界限逐漸模糊,許多算法由于軟硬件一體化設(shè)計,自始至終就是為實際應(yīng)用而存在的,因而無法忽視其技術(shù)性。
其二,人工智能基礎(chǔ)算法可作為“信息系統(tǒng)中的組件”通過具體技術(shù)加工,選定具體技術(shù)方向,進(jìn)入實際產(chǎn)業(yè)應(yīng)用,無須與具體技術(shù)應(yīng)用綁定③。在以復(fù)雜系統(tǒng)化計算機(jī)軟件、大型工業(yè)機(jī)械為產(chǎn)品應(yīng)用的今天,一項產(chǎn)品從基礎(chǔ)研究到實際應(yīng)用往往需要經(jīng)歷多層技術(shù)、配件供應(yīng)商等多個環(huán)節(jié)。所以,處在中間層的人工智能算法具備抽象思維與技術(shù)方案兼有的二元性特征,傳統(tǒng)機(jī)械工程領(lǐng)域的專利審查標(biāo)準(zhǔn)變化,為智能時代人工智能算法專利適格性判斷提供了應(yīng)對變革的借鑒。例如,人們熟知的發(fā)動機(jī)配氣機(jī)構(gòu)中的“可變節(jié)氣門技術(shù)”,其作為教科書中的典型基礎(chǔ)工程理論不可能授予專利。但是,各車廠以此理論結(jié)合工業(yè)設(shè)計、材料學(xué)、精密機(jī)加工等不同技術(shù)方案,設(shè)計出的功能相同但表現(xiàn)形式不同的配氣機(jī)構(gòu),卻能各自獲得專利,成為發(fā)動機(jī)模塊的重要組成部分。此外,上述專利也可以在航空發(fā)動機(jī)、發(fā)電機(jī)等一系列新領(lǐng)域進(jìn)行應(yīng)用,并不需要再次申請專利。相應(yīng)地,人工智能算法中的抽象神經(jīng)網(wǎng)絡(luò)理論無法獲得專利,但是一旦與計算機(jī)技術(shù)結(jié)合,通過數(shù)學(xué)函數(shù)表達(dá)—數(shù)據(jù)結(jié)構(gòu)開發(fā)—計算機(jī)代碼實現(xiàn)等一系列技術(shù)開發(fā),不同廠商會據(jù)此路徑開發(fā)出功能類似但表現(xiàn)形式不同的工程成果,并可能應(yīng)用于多種場景。因此,現(xiàn)階段將人工智能算法視為智力活動,并要求與具體應(yīng)用領(lǐng)域相結(jié)合才能獲得專利的二分法,實則與產(chǎn)業(yè)現(xiàn)狀脫節(jié)。因此,有必要結(jié)合產(chǎn)業(yè)實踐,借鑒“抽象層次法”[18],考慮在抽象思想與具體發(fā)明之間可能具有多重抽象層次,不再謀求絕對的“抽象思想—具體應(yīng)用”二分法對立④。
綜上所述,人工智能基礎(chǔ)算法作為“中間產(chǎn)品”一開始就以應(yīng)用為導(dǎo)向進(jìn)行研發(fā),且創(chuàng)新活躍、科技競爭力強(qiáng)??紤]到專利保護(hù)范圍與現(xiàn)實技術(shù)貢獻(xiàn)的“比例原則”,理應(yīng)獲得專利適格性。
面向新一輪技術(shù)革命與市場需求,國家知識產(chǎn)權(quán)局發(fā)布了《關(guān)于修改〈專利審查指南〉的公告》(第343 號),并在2020 年 2 月施行的《專利審查指南》(以下簡稱“2020 年《指南》”)中,第一次將“人工智能算法”納入中國專利類法律文件。但是,對于算法專利依然存在整體論和與具體應(yīng)用領(lǐng)域相結(jié)合兩大限制。其中,整體論(俗稱“三技術(shù)判斷法”),是指每一項發(fā)明的核心在于權(quán)利要求是否具有技術(shù)問題、技術(shù)手段、技術(shù)效果三要素的同時,以一個整體的視角判斷權(quán)利要求是否體現(xiàn)出“技術(shù)性”特征[19];而與具體應(yīng)用領(lǐng)域相結(jié)合,是指人工智能算法必須通過適用于某一特殊領(lǐng)域,形成“人工智能算法+具體應(yīng)用場景”的模式才能獲得可專利性。然而,人工智能算法專利的核心技術(shù)性并不在于算法應(yīng)用領(lǐng)域的創(chuàng)新,以及技術(shù)問題、技術(shù)效果這類功能性描述。核心基礎(chǔ)算法的開發(fā)以及利用計算機(jī)進(jìn)行算法訓(xùn)練這一技術(shù)手段,才是核心科技競爭力⑤。
因此,2020 年《指南》在同年12 月就迎來了第二次修改。筆者認(rèn)為,中國此次專利審查標(biāo)準(zhǔn)的修改較以往有了突破性進(jìn)展。此次修改首先弱化了整體論中的“技術(shù)三要素”并確立了以“技術(shù)手段”為主的審查思路,同時明確了“利用計算機(jī)實施的各類人工智能算法”是技術(shù)手段的一種,此類判斷標(biāo)準(zhǔn)實際上更加接近專利審查的核心。以往的整體論審查技術(shù)三要素+與具體應(yīng)用領(lǐng)域相結(jié)合,更注重審查標(biāo)準(zhǔn)的“形”,而非“實”。專利的適格性審查往往依賴審查員的“自由心證”與專利申請人的解釋答復(fù)來判斷。因為對于人工智能算法專利的審查,難點在于對適格性沒有清晰的判斷標(biāo)準(zhǔn)。整體論的出現(xiàn)實際上是適格性審查標(biāo)準(zhǔn)未明晰的妥協(xié)產(chǎn)物,任何一項創(chuàng)新被賦予專利都是由于其核心技術(shù)手段,而非“手段+問題+效果”的混同,技術(shù)效果、技術(shù)問題都只是輔助審查員理解技術(shù)的手段。另一關(guān)鍵改動是對“應(yīng)用于具體領(lǐng)域”的程序后移,不再在適格性審查中進(jìn)行判斷,而是后移至“創(chuàng)造性”的審查中。而此次意見稿也對技術(shù)手段(算法)與技術(shù)數(shù)據(jù)的關(guān)聯(lián)性作出了規(guī)定:要求算法每一個步驟所處理的數(shù)據(jù)皆為技術(shù)數(shù)據(jù)。并通過實施例的修改,使得“人工智能算法+技術(shù)數(shù)據(jù)”的組合可被認(rèn)定為專利客體。因此,中國基本在審查標(biāo)準(zhǔn)上放開了對于人工智能基礎(chǔ)算法的專利適格限制,只要求其必須處理技術(shù)數(shù)據(jù)并且能夠在計算機(jī)上運行。
智能時代的算法治理著眼點在于如何有序地促進(jìn)算法公開,其中就包括合理的政府審查、企業(yè)的自愿公開、適當(dāng)?shù)墓_機(jī)制。專利制度作為科技與法律結(jié)合的代表,同時又以“公開換壟斷”為主旨,理應(yīng)承擔(dān)企業(yè)通過私法自治,自愿利用合理公開機(jī)制進(jìn)行算法解釋的任務(wù),從而促進(jìn)與政府的協(xié)同共治。這既能激勵創(chuàng)新,也能滿足公共監(jiān)督的訴求。在明確算法理應(yīng)獲得專利適格性后,下文將探討專利公開的具體內(nèi)容能否滿足中國以《算法推薦規(guī)定》確立的算法解釋需求,并以法律對算法解釋的定性、定量、定體要求作為判斷標(biāo)準(zhǔn)。
算法解釋的關(guān)鍵在于利用自然語言的方式,通過公開算法的結(jié)構(gòu)、數(shù)據(jù)流向、關(guān)鍵參數(shù)等方式,使具備一定專業(yè)素養(yǎng)的理性人能夠理解并認(rèn)可其不含違法的價值判斷,從而滿足可能存在的政府審查、企業(yè)自律、個人申訴這三大場景的解釋需求。算法專利審查員與算法審查工作人員擁有類似的技術(shù)背景和法律訴求,通過審查員“自由心證”首先判斷算法是否違反國家法律與自然道德,這是一切專利的前置條件。以往大量的算法專利作為一個子模塊潛藏于方法專利中,而現(xiàn)階段單獨以算法為內(nèi)容的專利公開,將會通過審查員第一步判斷其技術(shù)風(fēng)險。為此,算法專利申請書將會盡可能地解釋算法的機(jī)制機(jī)理、模型、數(shù)據(jù)、應(yīng)用實例等,以換取“信任”從而達(dá)到算法解釋的定性需求。
為了盡可能直觀地展示算法“主觀惡性”與技術(shù)指標(biāo)之間的關(guān)系,筆者嘗試提出算法解釋定量的四個標(biāo)準(zhǔn)⑥。一是公平性。從社會角度出發(fā),提供的解釋要具有保證模型決策公平的能力,使模型能夠進(jìn)行道德分析,識別出模型中存在的偏見,此標(biāo)準(zhǔn)應(yīng)當(dāng)為算法解釋中的首要考量。二是可信任度??尚湃味仁侵改P托阅艿闹眯哦雀?,具有魯棒性和穩(wěn)定性,并產(chǎn)生可靠的、可信的解釋,從而降低因技術(shù)不成熟造成無意侵權(quán)的可能[20]。三是可達(dá)性和交互性。可達(dá)性是指構(gòu)建模型時,終端用戶能夠更多地參與到過程中;交互性是指終端用戶可以對模型施加影響,獲得一定的控制權(quán)。由于智能決策的終端受眾大部分是非計算機(jī)技術(shù)人員,該標(biāo)準(zhǔn)能夠給予個人視角下更多的算法透明信息,幫助其理解和參與智能決策模型的運作[21]。四是因果關(guān)系。當(dāng)前的機(jī)器學(xué)習(xí)模型大多揭示了數(shù)據(jù)之間的相關(guān)關(guān)系而沒有揭示因果關(guān)系,但人們更希望看到因果性解釋而不是相關(guān)性解釋[22]。
首先,公平性是算法治理的最優(yōu)法律價值訴求,具體又可以分為數(shù)據(jù)公平、設(shè)計公平、結(jié)果公平三類。數(shù)據(jù)公平主要是指數(shù)據(jù)質(zhì)量的準(zhǔn)確性和完整性,以及數(shù)據(jù)標(biāo)注過程中不存在偏見歧視;設(shè)計公平包括模型是否試圖識別并避免任何潛在的偏見和歧視,是否對輸入的樣本特征采取了減少偏見的措施,是否在后續(xù)模型訓(xùn)練、測試和評估階段通過調(diào)整參數(shù)或模型結(jié)構(gòu)來減少可能存在的偏見;結(jié)果公平是指算法作出的決策對受決策主體而言沒有不公平的影響。僅就海內(nèi)外公開的算法專利來看,由于算法專利說明書多為嚴(yán)肅的算法結(jié)構(gòu)與數(shù)據(jù)流向介紹,不會出現(xiàn)顯示主觀道德判斷的內(nèi)容,只有專業(yè)技術(shù)人員才能從中判斷出可能的道德風(fēng)險。而訓(xùn)練數(shù)據(jù)“權(quán)重值”的未公開[23],一方面是出于商業(yè)秘密考慮,另一方面在于權(quán)重值是動態(tài)調(diào)整的。
其次,可信度是算法的重要參數(shù),是其運行與結(jié)果可靠性的重要指標(biāo),雖然不能直接體現(xiàn)算法的主觀惡性標(biāo)準(zhǔn),但是與算法不成熟而導(dǎo)致的過失侵權(quán)相關(guān)??尚哦冗€可以拆分為準(zhǔn)確性與安全性:準(zhǔn)確性是指模型實際輸出與設(shè)計輸出之間的比例,安全性則是系統(tǒng)免受破壞和確保重要數(shù)據(jù)、個人信息不泄露的能力。目前,各類主流算法專利都將能夠提升可信度的技術(shù)手段寫入權(quán)利要求中,并作為重要的創(chuàng)新點與功能性特征,顯然大部分專利公開文書是“不羞于”展示其算法可信度的。
再次,可達(dá)性和交互性的本意是使智能決策的終端用戶理解和參與智能決策模型的運作,此舉在技術(shù)上過于激進(jìn)。不過在軟件工程中,技術(shù)人員在做單元與集成測試時,也會對交互性提出要求。人工智能算法的發(fā)展也是近年來才突飛猛進(jìn)的,而將可解釋端口融入算法設(shè)計更屬于前沿理念。因此,即便面臨當(dāng)下交互性在專利公開中的缺失,一旦未來可解釋性納入算法設(shè)計成為主流,相信更多算法專利也會將交互性模塊寫入專利申請書中。
最后,因果關(guān)系體現(xiàn)在目前算法專利公開中,呈現(xiàn)重數(shù)據(jù)相關(guān)性解釋、輕權(quán)重邏輯性解釋的現(xiàn)狀。例如:在推薦算法中,推薦結(jié)果與用戶特征、樣本推薦信息特征、信息瀏覽特征等相關(guān);在基因判定算法中,輸入的DNA 序列與輸出的子位點預(yù)測、預(yù)測非編碼變異功能相對應(yīng)。此類公開僅存在輸入輸出的相關(guān)性描述,無法準(zhǔn)確進(jìn)行邏輯解釋。畢竟算法專利以算法的邏輯決策為主要內(nèi)容,涉及數(shù)據(jù)正義的解釋訴求都是專利公開難以滿足的。但是,算法透明度的分級分類,使得淺層的數(shù)據(jù)相關(guān)性公開也能滿足輕度算法透明的解釋需求[24]。再考慮到商業(yè)秘密與算法公開之間的平衡,法律不應(yīng)要求專利公開承擔(dān)全部解釋任務(wù),在適度公開的同時,為后續(xù)技術(shù)性的解釋報告提供快速落腳點,也是專利公開的算法解釋功能體現(xiàn)。
綜上可知,算法專利公開可以部分填平“主觀惡性”與技術(shù)指標(biāo)之間的鴻溝,不過,未來經(jīng)過系統(tǒng)的技術(shù)加工,并形成技術(shù)性的算法解釋報告才能更好地實現(xiàn)算法解釋的定量分析。但是,專利公開文件作為兼具法律性、技術(shù)性、文學(xué)性的復(fù)合體,同時具備技術(shù)正義、機(jī)制原理、解釋公告的功能,即便無法直接視為算法解釋報告,也依舊披露了部分原理與參數(shù),可以成為算法解釋報告的基礎(chǔ)參考,是一種介于黑箱與白箱的中間態(tài),并且較多部分的描述也能夠直接體現(xiàn)算法解釋的定量要求。
作為承載算法解釋功能的法定表現(xiàn)形式與必備內(nèi)容,在算法解釋報告或其他國家、行業(yè)統(tǒng)一的算法公開紙質(zhì)文書尚未形成的當(dāng)下,算法專利公開文書成為現(xiàn)階段唯一針對算法公開的、具備法律效力的統(tǒng)一技術(shù)文書。《算法推薦規(guī)定》中第8 條和第12 條分別就算法公開作了內(nèi)容與功能的定體要求。前者包括機(jī)制機(jī)理、模型、數(shù)據(jù)、應(yīng)用結(jié)果等內(nèi)容,后者為優(yōu)化檢索、排序、推送等功能??梢圆捎每梢暬?、實例、元素權(quán)重排序等形式,展示上述內(nèi)容與功能,目的在于,通過最簡單明晰的方式,展示技術(shù)手段(算法)與技術(shù)效果(結(jié)果)之間的因果關(guān)系,檢驗是否存在法律風(fēng)險。
因此,專利公開文書若能滿足上述內(nèi)容、功能、形式要求,則可以判定達(dá)到了算法解釋的定體要求。首先,在內(nèi)容上,《算法推薦規(guī)定》所要求的機(jī)制機(jī)理與模型結(jié)構(gòu)是算法專利權(quán)利要求中的必備元素,尤其是人工智能基礎(chǔ)算法,會將模型結(jié)構(gòu)以及每一層神經(jīng)網(wǎng)絡(luò)性質(zhì)、功能、相互關(guān)系、數(shù)據(jù)流向一一列明。相應(yīng)地,數(shù)據(jù)與應(yīng)用結(jié)果通常會出現(xiàn)在說明書與實施例中。算法訓(xùn)練的數(shù)據(jù)類型(如人臉特征、行為標(biāo)注等)、應(yīng)用結(jié)果也是專利授予三標(biāo)準(zhǔn)⑦中“實用性”的關(guān)鍵考量,申請主體都會詳細(xì)列明其算法可實際應(yīng)用的技術(shù)領(lǐng)域與預(yù)期結(jié)果。其次,在功能上,通過技術(shù)手段,解決技術(shù)問題,達(dá)到長久以來技術(shù)效果作為人工智能算法專利的審查重點。即便審查標(biāo)準(zhǔn)修改后,降低了技術(shù)效果的審查權(quán)重,但是觀察國內(nèi)外算法專利的公開文件,除少量人工智能基礎(chǔ)算法的技術(shù)效果描述以抽象的技術(shù)提升為主⑧外,其他傳統(tǒng)算法專利的技術(shù)效果依舊以“檢索、排序、推送”等實際應(yīng)用為主⑨。最后,在形式上,要分情況討論。一是以算法模型為主要內(nèi)容的人工智能基礎(chǔ)算法,由于其專利公開內(nèi)容幾乎只包括機(jī)制機(jī)理、模型、數(shù)據(jù),因此無法也沒必要知曉其技術(shù)手段與技術(shù)效果之間的關(guān)系,由于缺乏具體的應(yīng)用場景(技術(shù)效果),算法風(fēng)險自然無從談起。二是傳統(tǒng)具備明確應(yīng)用場景的算法,技術(shù)手段與技術(shù)效果的關(guān)系即為算法專利內(nèi)容與功能的關(guān)系,二者的因果關(guān)系將是能否授予專利的核心標(biāo)準(zhǔn)。但是,因果關(guān)系的判定是由審查員通過每一技術(shù)特征綜合分析后得到的整體性判斷,難以在短時間內(nèi)通過專利公開文件中的格式性段落得到快速的解釋,需要后續(xù)技術(shù)加工后形成明確的技術(shù)性評價才能體現(xiàn)出專利審查員的心證過程。并且,專利審查員會側(cè)重考察二者的關(guān)聯(lián)性是否緊密,不會著重于可能出現(xiàn)的法律風(fēng)險,因此,也需要具備相似技術(shù)背景的監(jiān)管人員從法律側(cè)依照現(xiàn)有的專利公開內(nèi)容進(jìn)行提煉,形成法律價值判斷[25]。
綜上可知,專利公開制度與算法解釋制度具備相似的法律價值追求,在內(nèi)容、功能、形式上也存在大量重疊。但相較于學(xué)界呼吁的技術(shù)解釋報告,專利公開書在披露細(xì)節(jié)時還存在不足,同時二者也各有側(cè)重。其一,二者在算法內(nèi)容、功能的公開方向上基本趨同,可以滿足算法解釋定體需求。雖然算法專利只能部分起到算法解釋的作用,但是在算法分級分類公開的背景下,部分算法僅通過專利公開便能夠滿足專利性要求,并且成為后續(xù)算法解釋不可缺少的參考基礎(chǔ)。同時,企業(yè)面對的算法解釋訴求也不盡相同,如果不需要提供嚴(yán)格的解釋報告,只需要在算法機(jī)理與“輸入—輸出”關(guān)系上做出簡要答復(fù)要求,則專利公開完全能夠滿足適度的算法透明訴求。其二,二者各有側(cè)重且制度定位不同。如果說算法專利申請書是通過明晰技術(shù)原理、體現(xiàn)技術(shù)效果來說服審查員認(rèn)可其創(chuàng)造性,那么算法解釋則是通過可視化的方式簡化與明晰算法輸入與輸出因果關(guān)系,使擁有一定技術(shù)背景的理性人認(rèn)可其不存在歧視與違法風(fēng)險。二者可能形成“原材料”與“加工產(chǎn)品”的關(guān)系,從專利申請書到算法解釋報告,可以通過部門規(guī)章、行業(yè)標(biāo)準(zhǔn)等限定技術(shù)路徑形成算法解釋報告等專為算法透明而生的法律文本,最終滿足形式上的定體需求。算法的專利公開最終為監(jiān)管主體提供了良好的基礎(chǔ)研究資料,從而有效降低監(jiān)管成本,快速明確監(jiān)管方向,做到有的放矢。
創(chuàng)新與穩(wěn)定、效率與公平是法律在規(guī)制科技時所面臨的永恒矛盾,而平衡上述矛盾的主要方法就是每一級別的技術(shù)都有適應(yīng)其“松緊度”的法律予以規(guī)制,從而將剛性矛盾轉(zhuǎn)化為多個柔性交互[26]。目前,算法技術(shù)主要以商業(yè)秘密、算法專利、開源社區(qū)三種狀態(tài)存在,對應(yīng)完全封閉、半公開、完全公開的算法透明度。至于選擇何種存在方式,則完全由企業(yè)自主選擇。所以,如何科學(xué)地引導(dǎo)企業(yè)盡可能選擇后兩種方式,就在于最大化算法公開制度的算法解釋功能。
商業(yè)秘密由于其天然的非公開性,通常用于保護(hù)企業(yè)核心競爭力資產(chǎn)。人工智能基礎(chǔ)算法屬于行業(yè)內(nèi)最底層的基礎(chǔ)技術(shù),具備研發(fā)難度高、供應(yīng)鏈話語權(quán)強(qiáng)等特征,使得國內(nèi)企業(yè)都傾向利用商業(yè)秘密保護(hù)其算法技術(shù)。但是,《優(yōu)化營商環(huán)境條例》提出“包容審慎監(jiān)管原則”,對“有效監(jiān)管”與“高效創(chuàng)新”提升治理能力提出了新要求。在此背景下,商業(yè)秘密無法像算法專利公開制度那樣,滿足企業(yè)合規(guī)與可持續(xù)創(chuàng)新的新時代要求。首先,在目前算法透明定成治理趨勢的當(dāng)下,商業(yè)秘密與企業(yè)合規(guī)在一定程度上是矛盾的。因此,除最基礎(chǔ)的科研類算法創(chuàng)新外,一切有可能較易應(yīng)用于實際且對產(chǎn)品用戶產(chǎn)生實際影響的算法創(chuàng)新都可能被納入算法審查的范圍[27]。其次,人工智能所屬的軟件工程學(xué)科與市場都非常注重生態(tài)建設(shè),知識的共享與交流反倒更容易促進(jìn)技術(shù)的進(jìn)步,所以才會有大量科技公司在注冊算法專利的同時,甚至建立開源算法庫,供世界范圍內(nèi)所有開發(fā)者與企業(yè)免費使用,從而有助于整體軟件生態(tài)的可持續(xù)性創(chuàng)新。畢竟軟件生態(tài)才是企業(yè)的顯性競爭力,強(qiáng)大的算法開發(fā)能力所帶來的溢出效應(yīng)足以阻斷后發(fā)國家的算法自主開發(fā)道路。因此,以公開換壟斷甚至換信任,來促進(jìn)企業(yè)自律,在有助于監(jiān)管的同時,更為中國自主算法開發(fā)生態(tài)提供了良好基礎(chǔ)。最后,專利所構(gòu)建的專利墻與開放算法所形成的生態(tài)壁壘逐漸成為科技公司博弈的新業(yè)態(tài),二者的公開性使得各企業(yè)之間已經(jīng)不完全以算法技術(shù)為競爭核心,數(shù)據(jù)才是真正的行業(yè)壁壘[28]。由于人工智能應(yīng)用對于數(shù)據(jù)的高度依賴,無論是營商環(huán)境還是算法歧視,其法律風(fēng)險實則源于“數(shù)據(jù)正義”而非算法黑箱。算法更多是一個連接“數(shù)據(jù)”與“用戶”的自動化決策執(zhí)行器。無論是算法開發(fā)中的“訓(xùn)練數(shù)據(jù)歧視”,還是應(yīng)用后的“非正義數(shù)據(jù)輸入”,都將帶來侵害權(quán)益的“輸出結(jié)果”,更大的法律風(fēng)險實際在數(shù)據(jù)端[29]。所以,固守工業(yè)時代商業(yè)秘密的思維既無益于合規(guī)建設(shè),也無用于激勵創(chuàng)新。
基于構(gòu)建算法治理體系的特殊性和復(fù)雜性,算法治理應(yīng)進(jìn)一步發(fā)展和完善已初見格局的政府監(jiān)管、社會監(jiān)督、公民維權(quán)、企業(yè)自治的多元共治體系,從而使專利公開成為政府主導(dǎo)、個人參與、企業(yè)自治法治模式中企業(yè)側(cè)的重要制度。以算法審計、算法透明度報告為代表的呼聲較高的治理路徑,都不可避免地會增加治理成本與企業(yè)抵觸心理。而專利公開與算法解釋有機(jī)結(jié)合,在降低治理成本的同時,其核心還在于激發(fā)企業(yè)活力。
算法創(chuàng)新是充分發(fā)揮數(shù)據(jù)及硬件資源之價值的關(guān)鍵前提,是智能社會運轉(zhuǎn)的基石,也是先進(jìn)生產(chǎn)力的標(biāo)志。西方以Google 為首的科技公司大量申請人工智能算法專利,一方面是凸顯其技術(shù)優(yōu)勢,另一方面則是為后續(xù)可能專利競爭做儲備??紤]到目前中國大量科技公司在關(guān)鍵算法上依舊依賴進(jìn)口,因此,當(dāng)前中國亟須大力加強(qiáng)在基礎(chǔ)算法層面的核心技術(shù)創(chuàng)新,提高專利質(zhì)量。據(jù)筆者走訪與調(diào)研發(fā)現(xiàn),除少數(shù)大公司申請了算法類專利外,絕大多數(shù)科技類公司并未充分利用專利制度保障自己的研發(fā)成果,其中原因既有對專利適格性的擔(dān)憂,又有對算法審查的懼怕。在供給側(cè)結(jié)構(gòu)性改革的大背景下,高技術(shù)附加值產(chǎn)品的創(chuàng)新需要基礎(chǔ)科研與應(yīng)用創(chuàng)新的共同發(fā)展?;A(chǔ)科研的進(jìn)步,主要依靠政府財政對高??蒲袉挝坏耐度?,應(yīng)用技術(shù)的創(chuàng)新則更多依賴企業(yè)進(jìn)行專利創(chuàng)新。通過公開換壟斷,實現(xiàn)基于其商業(yè)化后的利益保障,是企業(yè)創(chuàng)新的原動力。因此,人工智能基礎(chǔ)算法的可專利性,將進(jìn)一步引導(dǎo)企業(yè)加大投入并申請專利,同時利用專利公開減輕企業(yè)面臨的監(jiān)管壓力,最終達(dá)到利用專利公開破除算法黑箱的功能。但是,算法解釋是專利公開制度下的有益副產(chǎn)物,并不能完全代替企業(yè)自發(fā)公開說明、政府強(qiáng)制性監(jiān)管等一系列專為算法透明而設(shè)的算法解釋制度。
算法規(guī)制的特殊性在于其黑箱性帶來的侵權(quán)風(fēng)險既具備法律性也具備技術(shù)性,因此,其治理思路應(yīng)當(dāng)尋找法律與技術(shù)兼?zhèn)涞穆窂健K惴ń忉屪鳛橐钥山忉尲夹g(shù)為基礎(chǔ)、合規(guī)評價為內(nèi)容、特定文書為體裁的監(jiān)管工具,其與現(xiàn)有專利制度的契合性,為算法解釋盡快落地提供了有利基礎(chǔ)。以審查員為核心的專利公開理念與算法解釋監(jiān)管,追求使算法專利公開滿足算法解釋的定性要求;專利公開中的算法結(jié)構(gòu)、實施例等與《算法推薦規(guī)定》要求披露的內(nèi)容部分重合,從而在一定程度上能滿足算法解釋的定量要求;專利公開文書由于其面向用戶與功能定位的差異使得其難以直接代替算法解釋文書,但是依然具備基礎(chǔ)參考意義,因而可以部分滿足算法解釋的定體要求。綜上所述,如何科學(xué)地將專利公開文書與其他算法治理途徑相結(jié)合,實現(xiàn)政府治理壓力與企業(yè)合規(guī)壓力的雙減負(fù),將是未來持續(xù)探討的方向。
注釋:
① 專利法上排除智力活動方法的理由主要包括:一是智力活動對物理世界不產(chǎn)生影響;二是人的智力活動具有不確定性,不具備產(chǎn)業(yè)上的可重復(fù)性;三是智力活動是基本的創(chuàng)新工具,對其授權(quán)將妨礙創(chuàng)新;四是不應(yīng)限制人在頭腦中的思維自由。
② 美國雖在其《專利法》中未予以明文規(guī)定,但在司法實踐中“智力活動方法”原則在美國聯(lián)邦最高法院審理的軟件專利適格性第一案“Benson 案”中得以確定。即如果一項發(fā)明創(chuàng)造可以完全通過人腦執(zhí)行完成,那么該發(fā)明創(chuàng)造就與智力活動方法同一,則不屬于可以授予專利權(quán)的對象。Douglas 大法官專門指出,涉訴專利申請中的數(shù)學(xué)過程“可以不使用計算機(jī)就被執(zhí)行”,即意指其可涵蓋智力活動方法。
③ 信息技術(shù)產(chǎn)業(yè)的實踐中,已有大量通用算法通過商業(yè)或非商業(yè)的函數(shù)庫、構(gòu)件庫、開源代碼、開放平臺等多種形式提供給他人。例如:谷歌的開源機(jī)器學(xué)習(xí)平臺TensorFlow 提供核心開源庫;阿里云人工智能平臺“機(jī)器學(xué)習(xí)PAI”、騰訊智能鈦機(jī)器學(xué)習(xí)平臺等均提供豐富的基礎(chǔ)智能算法組件,支持眾多具體領(lǐng)域的應(yīng)用開發(fā)。人工智能是中國“新基建”的七大重點領(lǐng)域之一,可以通過集成先進(jìn)算法的開源框架或開放平臺,對外提供公共普惠的人工智能相關(guān)產(chǎn)品及服務(wù)。
④ 騰訊研究發(fā)布的《人工智能:國家人工智能戰(zhàn)略行動抓手》,將人工智能技術(shù)按照“基礎(chǔ)設(shè)施—算法—技術(shù)方向—具體技術(shù)—行業(yè)解決方案”進(jìn)行層次劃分。
⑤ 例如,原有卷積神經(jīng)網(wǎng)絡(luò)默認(rèn)輸入是圖像,可以把特定性質(zhì)編碼寫入網(wǎng)絡(luò)結(jié)構(gòu),使前饋函數(shù)更加有效率,并減少了大量參數(shù),對于大型圖像處理有出色表現(xiàn)。
⑥ 該標(biāo)準(zhǔn)參考了 2017 年7 月美國國防部高級研究計劃署(DARPA)啟動一項7 000 萬美元的可解釋性人工智能計劃。參見:參考文獻(xiàn)[9]。
⑦ 專利申請需要滿足“新穎性”“創(chuàng)造性”“實用性”三個標(biāo)準(zhǔn)。
⑧ 例如,所描述的方法可以使模型在不同網(wǎng)絡(luò)中的訓(xùn)練時長更短。
⑨ 例如,只需要通過一個模型,就能夠同時對目標(biāo)對象的關(guān)鍵點的位置信息和可見性信息進(jìn)行識別,從而能夠降低資源占用率。