衣俊霖
內容摘要:我國的數(shù)字化轉型正進入數(shù)字孿生時代,現(xiàn)實世界與虛擬世界出現(xiàn)“虛實相生”甚至“以虛運實”的趨勢。在數(shù)字孿生系統(tǒng)的分層體系下,通過算法黑箱將模型和數(shù)據(jù)封裝于交互界面之后是一種常見的工程模式,在化簡技術復雜性的同時也導致“規(guī)則隔音”現(xiàn)象日益嚴重。決策規(guī)則的隱而不顯致使事后法律問責難以奏效,而追求算法透明的披露手段在與技術復雜性和商業(yè)秘密的沖突中不斷妥協(xié),逐漸成為強弩之末。實際上,無論事前規(guī)制還是事后問責都需要以法律系統(tǒng)與算法系統(tǒng)的良性互動為前提。借助技術標準的場景性、靈活性、技術性等優(yōu)勢,可以制定信息交換的結構性元規(guī)則促進算法與法律的跨系統(tǒng)溝通。此外,應當通過算法標準自我聲明機制推動軟法的“硬化”,規(guī)范算法貼標逐漸消滅“無標生產(chǎn)”,構建軟法硬法混合算法規(guī)制模式。
關鍵詞:數(shù)字化轉型 數(shù)字孿生 算法黑箱 結果問責 算法透明 技術標準
中圖分類號:DF0? 文獻標識碼:A? 文章編號:1674-4039-(2021)04-0077-92
“數(shù)字孿生”無疑是時下最受追捧的新技術概念之一,不僅成為與人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)并列的科技弄潮兒,而且已悄然進入各國的國家戰(zhàn)略。以我國為例,國家發(fā)改委2020年4月把數(shù)字孿生列為數(shù)字化轉型的支撐性基礎設施和技術創(chuàng)新賦能的關鍵對象;政府2021年新鮮出爐的“十四五”規(guī)劃綱要也把建設數(shù)字孿生城市作為數(shù)字化轉型的重要突破口?!? 〕地方層面,從上海市選取百年建筑南京大樓試點數(shù)字孿生“最小治理單元”,到雄安新區(qū)打造全球首個數(shù)字孿生城市的“一張藍圖”,乃至貴州省將數(shù)字孿生入駐其賴以成名的大數(shù)據(jù)“數(shù)谷”,數(shù)字孿生可謂一時風頭無限。若把目光投向海外,日本在制造領域的數(shù)字孿生戰(zhàn)略規(guī)劃、 〔2 〕新加坡的“虛擬新加坡”項目以及英國發(fā)布的國家數(shù)字孿生體原則等頂層設計讓人們看到了數(shù)字孿生在國際上的巨大前景。
數(shù)字孿生并非單指某一特定技術,而是一個對人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、虛擬現(xiàn)實等技術進行綜合運用的技術框架。數(shù)字孿生的走紅既源于人們對新技術的好奇心,也因為它與人們對于數(shù)字社會、數(shù)字化治理的想象頗為契合。當前,數(shù)字中國的建設已經(jīng)步入“數(shù)字孿生時代”,數(shù)字空間正在實現(xiàn)對現(xiàn)實空間的復制甚至超越?!? 〕數(shù)字孿生視野下,智慧交通、智慧城市、智慧法院等項目把大量決策移至數(shù)字空間中,并反過來影響著人們現(xiàn)實生活中的行動。例如,防疫健康碼APP便是數(shù)字孿生時代的一個典型應用,體現(xiàn)著“虛實相生”和“以虛運實”的特征。一方面,移動設備作為物聯(lián)網(wǎng)的邊緣節(jié)點采集個人的健康和行程信息,將現(xiàn)實世界中的行動軌跡和健康狀況在數(shù)字世界予以重建并實時更新;另一方面,算法模型基于防疫規(guī)則和大數(shù)據(jù)信息判斷風險等級,并以“紅綠燈”式界面管理著人們的出行,數(shù)字世界的運行結果反過來控制和影響著現(xiàn)實世界。
在技術狂飆突進的年代,物聯(lián)網(wǎng)、人工智能、5G甚至6G等新概念你方唱罷我登場,但都能納入數(shù)字孿生的理論模型和體系架構之內。因此,研究數(shù)字孿生視野下的法律和問責既有其特殊性,同時對普遍意義上的技術規(guī)制問題亦有所裨益。筆者聚焦數(shù)字孿生的核心問題——算法規(guī)制——特別是近年來頗受重視的算法黑箱,重新解讀其背后的技術復雜性和法律困境,試圖超越“打開”黑箱和“避讓”黑箱的二元思維,運用技術標準建立法律與算法之間的溝通機制,加強作為法治基石的問責機制,構建軟法硬法混合治理的算法規(guī)制模式。
一、數(shù)字孿生中的算法及其規(guī)制
得益于物聯(lián)網(wǎng)、大數(shù)據(jù)和云計算等底層支撐性技術的日益成熟,數(shù)字孿生的概念和技術架構得到廣泛關注。但平心而論,數(shù)字孿生的雛形早已有之,最經(jīng)典的案例當屬阿波羅13號登月飛船在1970年驚心動魄的故障事件。發(fā)射兩天后,氧氣罐突然爆炸導致船體嚴重毀損,此時事前制造的15個登月飛船的“孿生”設備派上了用場。飛船數(shù)據(jù)經(jīng)由彼時最先進的通信技術傳向地面的電腦環(huán)境中,工程師得以分析處理遠在33萬公里外的飛船工作狀態(tài)。地面小組經(jīng)過復雜的仿真推演,制定出緊急操作步驟,協(xié)助宇航員在將飛船穩(wěn)定至返回軌道,奇跡般回到了地球?!? 〕
與今天相比,五十多年前的數(shù)據(jù)通信和存儲能力都極為有限,也沒有AI算法輔助決策,主要靠地面人員對著實體控制臺手動仿真。盡管如此,數(shù)字孿生的基本概念和系統(tǒng)架構已初現(xiàn)端倪。
(一)數(shù)字孿生的基本概念
盡管早期實踐可追溯到阿波羅登月計劃,但數(shù)字孿生作為理論模型被提出的時間一般被定格在2003年:美國密歇根大學教授邁克爾·格里夫在產(chǎn)品周期管理的課程上提出了“與物理產(chǎn)品等價的虛擬數(shù)字化表達”的概念,旨在對設備的信息和數(shù)據(jù)進行更清晰地表達,并在整合所有信息后進行更高層次的分析?!? 〕該模型包含的基本要素——物理空間、虛擬空間及兩者之間的信息流動——被視為數(shù)字孿生體的核心內容?!? 〕2011年,美國空軍研究實驗室在制定遠景規(guī)劃時吸納了數(shù)字孿生的概念并提出了“機體數(shù)字孿生體”作為正在制造和維護的機體的超寫實模型, 〔7 〕并于同年推出“設計工作室”推動軍用數(shù)字孿生技術商用化的初步探索。2017年,知名咨詢機構Gartner將數(shù)字孿生列入十大戰(zhàn)略技術趨勢。隨著在研究機構、企業(yè)、軍界的曝光度不斷提高,以及其在數(shù)字化轉型中的巨大潛力,數(shù)字孿生進入各國國家戰(zhàn)略。上下游相關行業(yè)爭相與數(shù)字孿生掛鉤。
由于數(shù)字孿生是近年來的“新風口”,特定技術領域的從業(yè)者往往會對概念進行“限縮解釋”以凸顯其技藝的獨特性。研究建模和仿真技術專家認為他們所熟知的計算機輔助設計技術就是數(shù)字孿生的原型; 〔8 〕大數(shù)據(jù)專家認為數(shù)字孿生的本質是海量數(shù)據(jù)驅動下更加精準的建模分析和預測,數(shù)字孿生系統(tǒng)就是數(shù)字底座; 〔9 〕從事混合現(xiàn)實等可視化技術的公司則認為數(shù)字孿生是下一代可視化技術。
對法學研究而言,數(shù)字孿生宜被理解為:通過數(shù)字化的手段對現(xiàn)實世界中的對象在數(shù)字世界中構建對應的實體,借此來實現(xiàn)對現(xiàn)實世界的了解并以此促進決策優(yōu)化。這一廣義解釋將數(shù)字孿生與特定技術區(qū)別開來,捕捉到該理論模型的關鍵,即現(xiàn)實系統(tǒng)與虛擬系統(tǒng)的共在性以及兩者之間的孿生(或者說鏡像)關系?!?0 〕數(shù)字孿生屬于一個“解釋性概念”,其含義有待人們在生活中予以建構。對于數(shù)字孿生這一演變中的新事物不妨采取一種抽象、寬松的擴張解釋,一方面避免陷入無謂的技術概念之爭,另一方面有利于擴大法學研究的適用范圍。總之,數(shù)字孿生本身并不是某一特定技術,而是對其他如人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)等技術進行集成的體系框架。
(二)結構層次化與算法黑箱化
1.界面、數(shù)據(jù)、模型的三層結構
數(shù)字孿生的內涵及關聯(lián)技術在大眾傳播過程中勢必不斷變遷,但是從系統(tǒng)架構的角度對數(shù)字孿生相關技術進行劃分,可以為法律人提供一個穩(wěn)定的分析框架。數(shù)字孿生技術的體系結構由界面、數(shù)據(jù)、模型三個層次構成(見表1)?!?1 〕
界面層和數(shù)據(jù)層宛如數(shù)字孿生系統(tǒng)的皮膚和血肉,而算法所在的模型層給它注入了靈魂。首先,界面層是數(shù)字世界與現(xiàn)實世界接壤之處,實現(xiàn)數(shù)據(jù)收集、信息展示、指令控制的功能。其次,數(shù)據(jù)層實現(xiàn)了意義建構的功能并作為模型層的輸入和輸出。數(shù)據(jù)分析、清洗、處理、存儲等操作大多發(fā)生在數(shù)據(jù)層;現(xiàn)實中的人、事、物在數(shù)據(jù)的維度上被細致入微地重建。最后,模型層實現(xiàn)建模和決策,借助專家系統(tǒng)、人工智能、最優(yōu)化等技術進行建模優(yōu)化,發(fā)揮著統(tǒng)籌決策的功能。
當然,界面、數(shù)據(jù)和模型的三層體系是對數(shù)字孿生系統(tǒng)架構的一種概括和簡化。在具體運作過程中,系統(tǒng)層次之間往往是互滲入的,例如神經(jīng)網(wǎng)絡模型中的數(shù)據(jù)層和模型層緊密耦合在一起,因此有時難以找到層次間的絕對的邊界。此外,也有學者基于對技術進一步細分的目的提出了數(shù)字孿生的五要素(傳感器、數(shù)據(jù)、集成、分析和促動器)、五維結構(物理層、數(shù)據(jù)層、模型層、功能層和能力層)等分類方法, 〔12 〕但基本上都可被前述三層體系所涵攝。因此,對法學研究而言,數(shù)字孿生的三層體系架構已經(jīng)足夠,既為深度學習、知識圖譜、5G、物聯(lián)網(wǎng)等新技術提供了清晰的定位,又可以覆蓋智慧醫(yī)療、自動駕駛、數(shù)字政務、智慧司法等眾多應用場景。
2.算法規(guī)制與算法黑箱化
算法規(guī)制是數(shù)字孿生時代的重要法律問題。從數(shù)字孿生的體系架構來看,模型層和數(shù)據(jù)層正是數(shù)字空間的核心區(qū)域, 〔13 〕大致對應到算法規(guī)制和數(shù)據(jù)治理。數(shù)據(jù)治理無疑是近年來的一個熱點。畢竟,現(xiàn)實世界轉化到數(shù)字世界的過程中必定有一個數(shù)據(jù)化的過程,因此數(shù)據(jù)層理所當然地引起了人們的注意。此外,數(shù)據(jù)與隱私權這一頗為成熟的法律概念相關,加之近年來頻發(fā)的信息泄露事件更促進了立法的發(fā)展,相關法律體系已頗具雛形。相比之下,對于日益嵌入生活多方面的算法,目前仍沒有一個明確的法律規(guī)制方案。實際上,盡管數(shù)據(jù)治理和算法規(guī)制被劃定為兩個細分研究領域,但兩者密不可分。數(shù)據(jù)治理的規(guī)則如果要穿透界面層深入數(shù)字孿生體的核心區(qū)域,勢必依靠算法在底層邏輯上予以支撐。因此,數(shù)字孿生時代的算法規(guī)制具有基礎性的重要價值。
算法規(guī)制是技術與法律的雙重變奏。算法是用代碼編寫出的思想,是工程師發(fā)出的一系列指令,“告訴計算機該做什么”。〔14 〕算法不等于代碼但卻又同代碼密不可分?!?5 〕如同語言和文化會影響人們的思維一樣,程序語言及工具庫的特性影響著算法的設計方式。完全剝離代碼,把算法理解為一種抽象意義上的規(guī)則可能會忽略關鍵性細節(jié)。算法規(guī)制的難點在于如何避免陷入技術泥潭同時,又不至于對代碼的運作邏輯過度簡化。
數(shù)字孿生時代算法規(guī)制不能逃避的首要問題就是算法的黑箱化。界面、數(shù)據(jù)、模型的三層架構形成了一種天然的算法黑箱。數(shù)據(jù)和模型在黑箱內部,黑箱的邊界是交互界面,在物理世界和數(shù)字世界之間形成一道天然的隔閡。人們大致知曉健康碼的計算規(guī)則與所處地區(qū)的風險水平、人員接觸情況等信息有關,但具體的計算公式和參數(shù)權重是看不到的。除非穿透界面層,否則無法知曉黑箱內部的運作情況。
二、黑箱中的代碼“封裝”與規(guī)則“隔音”
在數(shù)字孿生時代,現(xiàn)實世界在數(shù)字世界里被重建,隨后數(shù)據(jù)驅動算法作出決策并借助界面層把指令傳遞到現(xiàn)實世界中。讓人焦慮的是,數(shù)字空間的運作邏輯——算法是不透明的。黑箱便是關于“不透明”的一個比喻:人們把影響自身權利義務的決策交給了算法,卻又無法理解黑箱內的邏輯或其決策機制。弗蘭克·帕斯奎爾在《黑箱社會》中將這一隱喻發(fā)揮得淋漓盡致,抨擊了美國社會正陷入被金融和科技行業(yè)的秘密算法所操控的、令人難以理解的狀態(tài)?!?6 〕算法黑箱往往與“算法獨裁”“算法壟斷”等負面評價綁定在一起,未來呈現(xiàn)出一幅頗為暗淡的圖景:人類在現(xiàn)實世界中的主體地位開始被架空,算法作為數(shù)字世界的主宰正從黑箱中伸出無形之手,控制著人們的生活。
當然,把算法黑箱等同于“暗箱操作”或極度復雜、無法理解的代碼系統(tǒng),都有失偏頗。算法黑箱本質上是一種可以減少技術復雜性的封裝手段,但同時也帶來了法律風險問題。
(一)代碼封裝與通信系統(tǒng)的復雜性化簡
在軟件工程領域,黑箱與“封裝”的概念是緊密聯(lián)系在一起的,意味著存在著內外有別的邊界?!?7 〕借用前文關于數(shù)字孿生系統(tǒng)架構中的三層框架,模型和數(shù)據(jù)隱藏于界面之后,因而對外部用戶就形成一個算法黑箱。作為一種把技術細節(jié)隱藏起來的工程實踐,算法黑箱在生活中可謂無處不在。以瀏覽網(wǎng)頁的過程為例,用戶輸入網(wǎng)址后,瀏覽器與遠程服務器建立連接并接收后者返回的網(wǎng)頁HTML代碼,渲染成最終的頁面。用戶與網(wǎng)站交互的界面就是瀏覽器,至于數(shù)據(jù)傳輸、服務器運算邏輯、網(wǎng)頁代碼如何呈現(xiàn)等過程都封裝在黑盒里。正是由于后臺的技術復雜性被隱藏起來,網(wǎng)上沖浪才得以普及化。此外,算法黑箱在復雜決策系統(tǒng)中也非常普遍。以智慧城市交通為例,借助對路況、車況、行人的歷史及實時信息進行大數(shù)據(jù)分析,后臺的智能算法分析出各路口的最佳調控方案,遠程對紅綠燈下達指令來指引司機和行人的行動。公眾只能看到紅綠燈閃爍卻并不知道智能算法如何作出決策,甚至不清楚到底是算法在控制還是值班警察手動操作。在紅綠燈界面后,交通大數(shù)據(jù)和調度算法被封裝起來。如此一來,司機和行人所需處理的復雜性得到化簡,只需關注交通燈和腳下的路。
以上分析表明,算法黑箱并不是復雜性的結果,而是減少復雜性的手段。從技術系統(tǒng)的視角來看,算法黑箱形成了一個穩(wěn)定、簡潔的界面幫助人們建立對算法系統(tǒng)的穩(wěn)定預期,使公眾不必被現(xiàn)代社會日益增加的復雜性所困擾。因此,在數(shù)字孿生時代,算法黑箱所代表的封裝模式廣泛應用于物聯(lián)網(wǎng)、信息通信、移動APP等諸多領域,推動著信息在現(xiàn)實世界與數(shù)字世界之間的雙向流通。此外,算法黑箱為保護個人隱私、商業(yè)秘密、知識產(chǎn)權提供了天然屏障。在不公開個人隱私的情況下將決策付諸實踐,可以避免公開評議對弱勢群體造成心理傷害?!?8 〕另外,軟件研發(fā)前期投入大,使模型和數(shù)據(jù)對外不可見保護了智力勞動的成果。
2.披露外部理由的有效性疑問
在回應批判的過程中,算法透明的內涵開始不斷擴張而成為一個多層次的概念?!?2 〕在所有算法透明的各項要求中,“外部解釋”(或“反事實解釋”)的方案也許是形式上最弱的要求, 〔43 〕可視之為披露外部信息的典型。例如,如果貸款申請人被算法告知:“貸款被拒絕是由于您的年收入只有X,如果您的收入是Y您的申請可能就成功了?!?〔44 〕需要指出,算法透明的初衷是解決算法黑箱的不透明問題,將外部解釋放在算法透明的名下已經(jīng)非常勉強。外部解釋的目的并非剖析算法的運作機理進而對其正確性、公正性提出挑戰(zhàn),而是將算法決策預設為合理的,只是確保人們了解“游戲規(guī)則”以便能更好地采取行動,使得受決策影響的人能規(guī)避不利后果?!?5 〕外部解釋確實可以繞開商業(yè)秘密的雷區(qū),但同時意味著穿透性太弱。在需要理解系統(tǒng)的決策邏輯并對算法決策的合理性、公平性進行檢視時,外部解釋明顯有隔靴搔癢之嫌。
此外,外部解釋是否構成一種獨立的權利或價值仍是存疑的。在沒有具體法益損害時單獨設立獲取理由解釋的請求權的性價比不高,從司法資源利用的角度似乎不宜單獨作為一項訴權。以行政處罰中的告知義務為例,無論算法是否介入,政府均應對行政處罰作出說明,此時的算法解釋權證成源自行政法規(guī)而非泛泛地獲取外部解釋的權利。因此,外部解釋的一般性法律規(guī)定容易成為形式性的倡導,似乎更適合被吸納進“為民服務”“顧客至上”等理念中,難以成為具有獨立價值的規(guī)范性要求。
3.算法透明原則內部的價值沖突
除了面臨可行性、有效性的外部質疑之外,算法透明原則還面臨著自身內部的困境——相關規(guī)制手段之間存在價值取向的沖突,難以形成一套融貫、自洽的規(guī)則體系。由于算法透明通常被視為一項法律原則,而非全有或全無的法律規(guī)則,因此對披露源碼、外部理由等特定規(guī)則進行批判似乎無法駁倒該原則整體上的可欲性。畢竟,原則較之規(guī)則更為抽象、寬泛,許多項規(guī)則可被歸入同一個原則之下?!?6 〕但是,原則作為一種最優(yōu)化指令,需在可能的范圍內以盡可能高的程度予以實現(xiàn)。〔47 〕這意味著,一項法律原則的內部組成部分之間至少應形成相互支撐的意義之網(wǎng),清楚地指向某種目標、權利或價值,才談得上與其他沖突性的原則進行平衡之后加以適用。
在究竟是披露內部信息還是外部信息的問題上,算法透明原則的內部存在著價值沖突。披露內部信息是為了對黑箱中的內部邏輯進行穿透性監(jiān)督,披露外部信息則僅僅要求對用戶應如何行為加以引導?!?8 〕借用前文的規(guī)則隔音理論,“內部信息—外部信息”大致對應“決策規(guī)則—行為規(guī)則”的區(qū)分。披露黑箱內部信息就是拒絕規(guī)則隔音,強制要求對決策規(guī)則進行公開;相反地,披露外部信息則默許規(guī)則隔音,僅僅強調對行為規(guī)則的公開。披露內部信息和披露外部信息的目的和價值取向截然不同,前者挑戰(zhàn)決策邏輯的合理性,后者則僅要求對用戶行為提供指引。
由于內部信息和外部信息在目標和價值上的沖突,無論使用“或”還是“并”的邏輯操作將兩者組合起來,都難以妥善解決。一方面,如果內部信息和外部信息二者擇一披露即可,這便是把兩組在目標和價值取向上有沖突的規(guī)制策略生硬拼湊在一起,在實踐缺乏一以貫之的標準。另一方面,如果對內部信息和外部信息全部加以披露——這無疑是一種相當激進的主張——那么來自商業(yè)秘密、國家機密、知識產(chǎn)權方面的批判又全都回來了,算法透明在實踐中將寸步難行。
總結來說,算法透明的初衷是打開算法黑箱來披露隱藏其中的內部邏輯,因而獲取內部信息是關鍵所在。但是,在與其他例如商業(yè)秘密、國家機密等法益的沖突中,算法透明原則難以成為壓倒性的“王牌”,因而逐漸妥協(xié),開始向披露黑箱外部信息退卻。由于在披露內部信息還是外部信息之間舉棋不定,算法透明本身的內容反而如墮入云霧般不透明。
四、法律系統(tǒng)與算法系統(tǒng)之間的溝通機制
對算法黑箱展開事前規(guī)制或事后問責所遇到的困境,根源在于法律系統(tǒng)與算法系統(tǒng)之間溝通不暢。規(guī)制算法黑箱的關鍵,是保持算法運作封閉性同時促成其與法律系統(tǒng)的相互溝通。從社會系統(tǒng)論的角度來說,功能系統(tǒng)彼此之間互為外部環(huán)境,無法直接相互影響。借用盧曼關于“擾動-信息”的經(jīng)典區(qū)分,對于一個特定的系統(tǒng)而言,它無法對外部環(huán)境發(fā)生的擾動作出反應,除非該擾動以某種方式被轉譯為系統(tǒng)所能理解的內部信息。〔49 〕這便是系統(tǒng)運作“封閉性”與認知“開放性”的統(tǒng)一。算法作為一個獨立功能系統(tǒng),將技術細節(jié)封裝于黑箱之中無疑是系統(tǒng)運作封閉性的體現(xiàn)。然而,如果對黑箱聽之任之,極易造成規(guī)則隔音進而形成責任盲區(qū),導致事后問責無從談起。另外,將模糊法律系統(tǒng)與算法系統(tǒng)的邊界,則會陷入技術復雜性的泥潭。實際上,算法透明原則在披露內部信息與外部信息之間的搖擺不定,就是由于法律與算法如何溝通的界限仍舊晦暗不明。
通過技術標準構建信息交換的結構性元規(guī)則,可以推動法律與算法的跨系統(tǒng)溝通,在此基礎上其他的算法規(guī)制策略方能得到有效展開。
(一)信息交換與結構性元規(guī)則
“社會設計中的一個普遍存在的問題便是如何把握支持性結構與適應性流變之間的平衡。” 〔50 〕建立與算法系統(tǒng)的溝通機制就是試圖尋找法律系統(tǒng)和算法系統(tǒng)之間的半透膜結構,既不打亂系統(tǒng)內部的自我溝通和迭代,又能實現(xiàn)系統(tǒng)間的協(xié)作和共同進化。
溝通在于信息的形成、傳達以及理解,“從話語空間的角度來考慮,要克減復雜性,就要對溝通過程中的信息進行定向選擇,排除某些因素而保留另一些因素。不言而喻,正是這種定向選擇會產(chǎn)生涵義,同時也可以增加人們對未來的預期”?!?1 〕通過考察在證券法中的信息披露這一頗為成熟的法律制度,可以為如何建立與算法系統(tǒng)的溝通機制提供啟發(fā)。以《上市公司信息披露管理辦法》(中國證監(jiān)會第182號令,2021年5月起實施)第14條有關年度報告的信息披露范圍為例,披露內容包括公司基本情況、會計和財務指標、股東總數(shù)、董監(jiān)高任職情況等。不難發(fā)現(xiàn),盡管有“其他事項”的條款兜底,年度報告的信息披露范圍仍比較明確。上市公司的組織架構受公司法、證券法約束,雖存在雙層股權結構等復雜變種,但都具有股東大會、董事會等基本要素并在議事規(guī)則上采取資本決、人頭決等方式,這些法定規(guī)則使得上市公司的信息披露有一個支撐性邊界。因此,盡管我國上市公司有數(shù)千家,信息披露規(guī)律有跡可循。這種將關注信息縮小到比較狹窄范圍內的做法,是信息披露能夠高效運作的隱性前提。
可以說,公司法、證券法關于組織結構的規(guī)定為上市公司與外部環(huán)境的溝通機制制定了一種“結構性元規(guī)則”——用來描述規(guī)則的結構、種類、信息的規(guī)則,即關于規(guī)則的規(guī)則。〔52 〕信息交換的結構性元規(guī)則,有助于對系統(tǒng)間溝通關系中的偶然性實現(xiàn)去隨機化,從而“通過對系統(tǒng)應有的必然性姿態(tài)的投射和反省而把系統(tǒng)本身從環(huán)境區(qū)別開來,并由此形成秩序”。〔53 〕公司具有相似的組織架構,這為關于公司信息披露提供了一個天然的基本結構。從這個意義上說,正是有公司法和證券法為基石,為信息披露劃定了具體、準確的范圍,信息才不會被噪聲所淹沒。
那么,關于算法信息披露的結構性元規(guī)則是什么?法律與算法的支撐性邊界何在?與上市公司不同,算法并沒有固定的內在結構。單是神經(jīng)網(wǎng)絡算法便達數(shù)十種,更不用說與其他算法結合并根據(jù)場景定制處理后所形成的千變萬化的類型。此外,機器學習模型可根據(jù)外界環(huán)境變化通過自適應學習對算法結構進行修改,隨著時間不斷進化。實際上,正是算法這種變動不居的結構特點使之能夠對千變萬化的問題域進行建模。因此,試圖依賴算法的內在結構作為與算法系統(tǒng)溝通的結構性元規(guī)則,從而為信息披露劃定清晰的邊界是非常困難的。
(二)作為溝通元規(guī)則的技術標準
算法沒有內在的固定結構僅僅說明缺乏現(xiàn)成的結構性元規(guī)則可資利用,但并不意味著無法通過自主建構的方式來制定結構性元規(guī)則。正如吉登斯所言:“結構是轉換的規(guī)則和資源……結構本身在時空中不存在,結構是通過人類的能動活動而存在?!?〔54 〕規(guī)則是系統(tǒng)的再生產(chǎn)的條件和媒介,是對行動意義的積極建構。
建立與算法系統(tǒng)溝通的結構性元規(guī)則需要滿足場景性、技術性、靈活性等特點,剛性的硬法無法滿足這種場景復雜而又靈活多變的需求。因此,應當積極探索使用軟法的應用?!坝卜嘞廾鞔_、程序規(guī)范、形式固定、效力有保障”,但硬法存在覆蓋面的局限性并且在實施中存在形式主義、靈活性不足等問題,因此“軟法基于其自身特性與硬法形成了互補,充塞填滿了硬法的空隙”?!?5 〕一般而言,與依靠國家強制力保障的硬法不同,軟法的運作不依賴強制力?!?6 〕技術標準是一種典型的軟法,由國家標準、行業(yè)標準、企業(yè)標準等構成,各類標準在場景、效力及相互關系上各不相同?!?7 〕標準作為法律規(guī)范與技術實踐的耦合,是規(guī)制與自治之間的銜接點和緩沖區(qū)?!?8 〕國家部委及地方政府等監(jiān)管機構牽頭制定的技術標準可被視為硬法的觸手,用以約束或引導生產(chǎn)生活;另有相當數(shù)量的技術標準源于對最佳實踐的總結,具有自下而上的自治色彩。因此,標準正適合用于制定算法信息披露的結構性元規(guī)則,在溝通偶然性的去隨機化中形成秩序。
技術標準在建構與算法系統(tǒng)的溝通機制上具有以下優(yōu)勢。第一,技術標準符合算法規(guī)制的場景性要求。計算機算法作為一種通用性技術,被不同主體普遍運用并嵌入不同的應用場景之中,機械使用某一種規(guī)制策略都沒有充分考慮算法應用的場景性,因此應當采取場景化規(guī)制的策略?!?9 〕針對自動駕駛、人臉識別、公共衛(wèi)生、城市交通等不同領域應制定不同標準,同一領域內的細分場景也有必要精細區(qū)分。第二,算法治理具有極強的技術性,適合技術標準發(fā)揮作用。算法規(guī)制不可避免將會出現(xiàn)大量技術術語,并在算法查驗、可解釋性、可測試性等方面需要設定技術性指標,這些正是技術標準的常見內容。第三,技術標準能根據(jù)算法技術的最新動態(tài)及時更新、靈活應變。硬法具有強制約束力,需要在相當一段時期內得到普遍遵守,保證高度的穩(wěn)定性。但是,技術的日新月異使問題的產(chǎn)生遠遠快于問題的解決。如何于迅速變化之中在穩(wěn)定性和適應性之間尋得平衡,是算法規(guī)制必須應對的棘手難題。相比法律法規(guī),標準的制定過程更加靈活簡便,且不同類型的標準可以相互轉化,能適應算法技術的變動性。
(三)以技術標準鞏固算法的法律規(guī)制
技術標準適合用來指引結構性元規(guī)則的制定,從而建立法律系統(tǒng)與算法系統(tǒng)的協(xié)作溝通機制。技術標準把法律與算法系統(tǒng)的溝通化簡為兩個子問題:第一,算法標準是否合理合法;第二,算法運作是否符合標準。類比食品、藥品的生產(chǎn),其流程、工藝、配方都因涉及商業(yè)機密而無法公開,但人們對于“黑盒”中生產(chǎn)出來的產(chǎn)品依然可以放心使用,一個重要的原因就是食品藥品標準可以作為食藥安全的檢測基準。相信算法也會經(jīng)歷類似的過程:通過將特定算法與國家標準、行業(yè)標準、團體標準進行比較,就能更快獲取有關算法的信息。換句話說,算法標準化能夠降低人們與算法系統(tǒng)進行溝通的信息成本,而降低信息成本無論對立法者還是法院而言都是一個重要的考量因素?!?0 〕此外,標準還有助于大眾逐步脫離“技術文盲”的境地。隨著算法標準體系的建立,人們將逐漸建立起諸如算法測試、算法審計、數(shù)據(jù)備份等基本概念,形成一套理解算法的基本框架,提高對數(shù)據(jù)安全、個人信息等無形權益的敏感性和關注度。
基于算法標準的法律規(guī)制體系為算法規(guī)制提供了一個新的視角,眾多算法規(guī)制的工具可以被囊括在內,并根據(jù)具體場景采取因地制宜的策略。算法審計、算法查驗、算法可解釋性和可測試性在標準層面大有用武之地。實際上,技術標準正成為踐行算法規(guī)制的重要場所。以央行最近發(fā)布的《人工智能算法金融應用評價規(guī)范》為例,其中第6部分從“安全性評價”的層面對算法的依賴庫、可追溯性、內控機制提出具體要求, 〔61 〕第7部分從“可解釋性評價”的維度涵蓋了算法模型的準備、建模、應用的全過程。因此,通過標準進行規(guī)范建構,不必打開算法黑箱同樣能為算法黑箱“立法”,而且可以針對具體場景進行精準規(guī)制。
通過技術標準開展算法規(guī)制的思想已經(jīng)在法律實踐中萌發(fā)?!?2 〕無論事前監(jiān)管或事后問責,都可以從算法的標準化中受益。技術標準既是過程控制的指引,也能為事后問責提供保障。對事前監(jiān)管而言,通過制定場景化的技術標準,能夠走出算法透明在披露內部邏輯與外部理由之間搖擺不定的困境,將算法標準作為首要披露對象。更重要的是,技術標準有助于維護事后問責機制?!澳Ч黼[藏在細節(jié)之中”,唯有通過在數(shù)據(jù)獲取時間、數(shù)據(jù)來源、采樣方法方面保證訓練數(shù)據(jù)可追溯性,在建模腳本、起止時間、迭代記錄等方面保證建模過程可追溯,在部署腳本、環(huán)境配置等方面保證部署可追溯,才能為結果問責提供扎實的事實基礎?!?3 〕
五、基于算法標準化的軟硬法混合治理圖景
前文已對技術標準在法律與算法之間的溝通功能進行了理論論證,但尚未對技術標準如何付諸實踐進行分析。在傳統(tǒng)的算法規(guī)制框架中,技術標準通常處于輔助性的邊緣地位;相比之下,本文將技術標準視為算法規(guī)制的基礎性環(huán)節(jié),因而不能回避算法標準的現(xiàn)實效力問題。由國家強力背書的硬法尚且有著“書本上的法與行動中的法”的巨大差異, 〔64 〕技術標準作為一種主要依賴自愿執(zhí)行的軟法規(guī)范,其在“紙面上”的強制力更是先天不足。因此,以下將從三個方面對算法標準如何在實踐中發(fā)揮效力提出建議,描繪一幅軟硬法混合治理的圖景。
(一)以聲明機制加強標準的約束力
從我國的現(xiàn)實情況看,算法與已有的產(chǎn)品和服務不同,并不要求在研發(fā)過程中必須符合特定的標準。這就意味著盡管國家陸續(xù)出臺了大量有關信息技術的相關標準,但究竟有多少企業(yè)在使用這些標準對公眾來說是一個未知數(shù)?,F(xiàn)實生活中,大量算法仍處于“無標生產(chǎn)”的狀態(tài)。所謂“無標”并不是指算法的研發(fā)完全由開發(fā)者自由發(fā)揮、毫無章法。畢竟,企業(yè)即便沒有使用國家標準、行業(yè)標準等外部標準,至少會實施一些涉及軟件的開發(fā)、測試、運營及維護的內部規(guī)則。目前,我國尚未建立針對算法標準的公開、聲明機制,因此互聯(lián)網(wǎng)企業(yè)極少披露其算法標準。〔65 〕
算法標準的披露應當整合進我國現(xiàn)有的標準自我聲明公開制度中去。2018年1月起實施的標準化法(修訂)第27條創(chuàng)設了企業(yè)標準自我聲明公開和監(jiān)督制度,用以替代標準備案制度。根據(jù)該規(guī)定: “企業(yè)應當公開其執(zhí)行的強制性標準、推薦性標準、團體標準或者企業(yè)標準的編號和名稱;企業(yè)執(zhí)行自行制定的企業(yè)標準的,還應當公開產(chǎn)品、服務的功能指標和產(chǎn)品的性能指標。”聲明公開后的標準與公司章程以及企業(yè)承諾書發(fā)揮效力的機制有異曲同工之妙。企業(yè)在具體執(zhí)行什么標準的問題上具有選擇的權利,但是標準一經(jīng)公開便具有法律效力,“應當按照標準組織生產(chǎn)經(jīng)營活動,其生產(chǎn)的產(chǎn)品、提供的服務應當符合企業(yè)公開標準的技術要求”?!?6 〕因此,自我聲明制度是將標準賦予約束力的紐帶。企業(yè)生產(chǎn)的產(chǎn)品和提供的服務應當符合其聲明公開的標準的技術要求,否則就要依法承擔相應責任?!?7 〕
從軟法與硬法的關系上分析,對算法標準進行聲明公開可以被視為軟法的“硬化”。〔68 〕推薦性標準本身不具備約束力,而且企業(yè)也可以選擇制定不同于國家標準的內部標準。但是,企業(yè)標準一旦公開,其實施情況就進入法律監(jiān)督范圍內,如果違反所公開的標準就要承擔法律責任。通過標準自我聲明公開機制來加強技術標準的約束力,具有以下幾方面的好處。第一,保障技術標準的多樣性。推動企業(yè)標準的規(guī)范化和公開化,進而通過自下而上、博采眾長的方式促進國家層面的標準制定。第二,減少監(jiān)管部門與企業(yè)之間的信息不對稱,有利于開展事中事后監(jiān)管,落實問責機制。第三,促進算法標準的社會監(jiān)督。公開的標準對全社會可見,從而可以調動公眾、行業(yè)組織以及研究機構的積極性,形成多元共治。
當然,算法的種類千差萬別,若對每一種算法都設定專門標準有可能過于零碎化。因此,可以將具有類似性質的算法合并歸類,適用少量的基礎性、通用性標準。例如,涉?zhèn)€人信息的算法至少需要滿足《個人信息安全規(guī)范》,涉金融個人信息時則可使用《個人金融信息保護技術規(guī)范》。此外,算法標準的聲明公開可以采取分級分類、漸次推進的方式。畢竟不同機構的算法,甚至同一機構所使用的不同算法,其影響力有明顯差異,所以法律可針對特定主體、特定場景對標準公開作出規(guī)定。
需要補充說明的是,標準化法中的自我聲明機制主要針對企業(yè),未將國家機關包括在內。盡管很多國家機關所使用的算法實際上由企業(yè)具體研發(fā),但考慮到法院、政府部門、事業(yè)單位等機構也可能有內部研發(fā)團隊從事算法研發(fā),因而應考慮將標準自我聲明機制擴展到企業(yè)以外的其他組織。
(二)以算法標簽化推動“可視正義”
日常生活中的食品、藥品外包裝標簽上大多會注明所使用的執(zhí)行標準,國家也出臺了大量關于標準信息披露的強制性規(guī)范。例如,《藥品說明書和標簽管理規(guī)定》第22條規(guī)定:“原料藥的標簽應當注明藥品名稱、貯藏、生產(chǎn)日期、產(chǎn)品批號、有效期、執(zhí)行標準、批準文號、生產(chǎn)企業(yè)……等必要內容?!眹覐娭茦藴省额A包裝食品標簽通則》(GB 7718-2011)第4.1.1款規(guī)定:“直接向消費者提供的預包裝食品標簽標示應包括食品名稱……生產(chǎn)者和(或)經(jīng)銷者的名稱、地址和聯(lián)系方式……食品生產(chǎn)許可證編號、產(chǎn)品標準代號及其他需要標示的內容。”
算法作為一種數(shù)字化革命以來的新鮮事物,并非像食品、藥品那樣看得見、摸得著的“入口之物”,因而對算法的標簽問題沒有具體規(guī)定。應當借鑒食品、藥品的相關規(guī)定,要求算法生產(chǎn)者、使用者為算法“貼標”,標示的內容應當在軟件說明或介紹界面中明確展示?!?9 〕通過算法貼標的方式,一方面可以緩解用戶與算法生產(chǎn)者、使用者之間的信息不對稱,建立起人們對算法黑箱的信任感,實現(xiàn)“可視正義”;另一方面能充分利用公共監(jiān)督、社會監(jiān)督、輿論監(jiān)督的方式,在算法使用者是否貼標、是否遵守所披露標準、使用標準是否已失效等問題上與監(jiān)管部門形成合力,降低執(zhí)法成本。
不妨設想一款智慧醫(yī)療App算法,則應在其標簽中標示以下事項:算法名稱、日期、算法分類、版本識別號、版本控制軟件、算法執(zhí)行標準號、算法生產(chǎn)方、算法控制方、數(shù)據(jù)安全分級、數(shù)據(jù)處理所在地、個人信息保護標準以及其他信息。這些內容只是初步構想因而需根據(jù)具體場景進行調整,但已能展現(xiàn)算法貼標在算法規(guī)制領域的巨大潛力。
第一,算法生產(chǎn)方和算法使用方。以人臉識別技術為例,政府所使用的安防技術大多來自企業(yè)。盡管數(shù)據(jù)仍然在政府的控制范圍內,但算法模型對政府而言是一個黑箱。在這種情況下,有必要區(qū)分算法生產(chǎn)方和算法使用方。此外,同一種算法模型可能被應用到不同的場景中,因此貼標工作應當由算法使用方承擔?!?0 〕第二,版本識別號。所謂“版本控制”是一項軟件工程中對源代碼進行管理的重要模式,其主要功能是追蹤源代碼的變更,把誰、何時、修改了什么等信息忠實地記錄下來。正如產(chǎn)品的生產(chǎn)批號有助于事后追蹤特定批次產(chǎn)品的責任,算法的版本號可以定位到某一“批次”的源代碼, 〔71 〕為事后問責提供便利。第三,算法技術標準。標準是實現(xiàn)對算法黑箱的軟法控制的關鍵手段,因此標準是算法標簽最重要的信息之一。值得注意的是,標準自我聲明機制并不要求企業(yè)的標準需要高于推薦性標準, 〔72 〕這為企業(yè)標準提供了一定的自主空間。第四,數(shù)據(jù)安全、個人信息保護相關內容。算法與數(shù)據(jù)都是數(shù)字世界的基本要素,共同構成了數(shù)字孿生時代的基礎。對于數(shù)據(jù)進行操作離不開算法,算法也難以脫離數(shù)據(jù)獨立運行。因此,關于數(shù)據(jù)、個人信息保護的相關標準也應在算法標示內容中一并列出。
(三)建立算法標準與上位法的聯(lián)動機制
推動技術標準與法律法規(guī)在法律系統(tǒng)內部形成了相互支撐的同心圓結構。剛性、穩(wěn)定的法律法規(guī)處于法律系統(tǒng)中心,柔性、靈活的技術標準處于系統(tǒng)邊沿,共同構成了剛柔并濟的“一元性多樣化混合法模式”體系?!?3 〕面對現(xiàn)代社會日益復雜、流變的現(xiàn)實狀況時,如何對不同的規(guī)制工具進行整合以取得最佳治理效果,是踐行良法善治的重要內容?!?4 〕技術標準作為法律系統(tǒng)與算法系統(tǒng)的結構耦合機制,既可以適應技術的靈活性和復雜性,同時也能接收來自法律系統(tǒng)的信息,實現(xiàn)跨系統(tǒng)溝通。
此外,從法律解釋的視角來看,技術標準對法律法規(guī)能起到解釋作用。正如卡爾·拉倫茨所指出的,“法律經(jīng)常利用的日常用語與數(shù)理邏輯及科學性語言不同,它并不是外延明確的概念,毋寧是多少具有彈性的表達方式”,因此法律的可能意義“在一定的波段寬度之間搖擺不定……即使是較為明確的概念,仍然經(jīng)常包含一些本身欠缺明確界限的要素”?!?5 〕司法解釋、立法解釋主要以法律人為受眾,而技術標準面向的是從事算法研發(fā)、撰寫代碼的科學家和工程師?!胺烧Z言不能達到像符號語言那樣的精確度,它總是需要解釋?!?〔76 〕因此,從法律語言到代碼(典型的符號語言)之間顯然有進行解釋的必要性。
技術標準作為上位法的“解釋者”的地位已在國內外初現(xiàn)端倪。以歐盟《通用數(shù)據(jù)保護條例》(GDPR)為例,這部“史上最嚴”數(shù)據(jù)保護立法極大提升了企業(yè)的合規(guī)動機,也使得與GDPR相關的周邊技術標準快速普及。實際上,盡管對GDPR所創(chuàng)設的拒絕權、數(shù)據(jù)攜帶權等內容的法教義分析具有重要理論價值,但如果把視線轉向微軟、亞馬遜、阿里等大型跨國科技企業(yè),它們的云基礎設施建設并不直接參考GDPR,而是實施了ISO針對GDPR制定的ISO/IEC 27701等標準。相比歐盟,我國擁有數(shù)量眾多的本土高科技企業(yè),并且企業(yè)參與國家標準制定也是常態(tài),標準供給頗為充足,政企合作也更為密切。例如,國家信標委在2020年11月啟動了《個人信息安全規(guī)范》試點工作,旨在推動規(guī)范中的關鍵要求在企業(yè)得到落實以形成優(yōu)秀案例在全國推廣,多家頭部企業(yè)參與試點。然而,由于缺乏上位法的支撐和巨額罰款的威懾,企業(yè)對算法標準的重視程度以及實施力度仍是一個未知數(shù)。相信等到個人信息保護、數(shù)據(jù)安全以及平臺反壟斷等領域的立法陸續(xù)出臺,技術標準在有了上位法的加持后定能發(fā)揮更強的現(xiàn)實效力。
結? 語
由數(shù)據(jù)、界面、模型構成的數(shù)字孿生體架構,讓大數(shù)據(jù)、混合現(xiàn)實、人工智能等技術得以分層協(xié)作、各司其職,同時也使得算法的黑箱化成為不可逆的趨勢。一方面,代碼封裝、接口分離的工程實踐勢必形成一個個算法黑箱;另一方面,人們的理性有限因而也不可能理解并處理有關算法的全部信息。當算法黑箱使技術復雜性得到化簡,法律系統(tǒng)卻付出了巨大代價:算法黑箱有可能遮蔽損害結果、隱藏決策規(guī)則、模糊責任判斷,使法律問責的難度陡增。然而,試圖把算法置于法律的全方位、穿透式監(jiān)管之下,將模糊法律系統(tǒng)與算法系統(tǒng)間的界限,進而把法律拽入算法的復雜性泥潭,甚至在與商業(yè)秘密、隱私保護等其他法益的沖突中影響法律系統(tǒng)本身的安定性和融貫性。解決之道在于取得算法封閉性與法律可責性之間的微妙平衡——在技術維度尊重算法的運作封閉性,在法律關系上透視算法黑箱。借助于技術標準所具有的場景性、靈活性、技術性等優(yōu)勢構建軟法硬法混合規(guī)制模式,可以走出“打開”黑箱和“避讓”黑箱的二元框架,實現(xiàn)法律與算法的跨系統(tǒng)溝通,鞏固作為法治基石的問責機制。
Abstract: China's digital transformation is entering the Era of Digital Twin, and the integration of the real world and the digital world has become inevitable. Under the hierarchical framework of the digital twin system, it is a common engineering mode to encapsulate model and data behind the interaction interface through algorithm black box. While simplifying the technical complexity, such a practice leads to the problem of "acoustic separation of rules"-the invisibility of decision rules makes it difficult to enforce ex post legal accountability. Besides, algorithm transparency, a representative ex ante regulation strategy, attempts to break the boundaries of the algorithm system, came into complex conflicts with issues such as trade secrets, state secrets, and technical feasibility, and has fallen into a crisis of coherence in constant compromise. The successful regulation of algorithm black box depends on the effective communication between the legal system and the algorithmic system. With the help of technical standards, which are more contextual, flexible, and technology-oriented than hard laws, it is possible to formulate structural meta-rules for information exchange, therefore promoting the inter-system communication between algorithms and laws. Moreover, it is necessary to establish a self-declaration mechanism for algorithm standards to promote the "hardening of soft law", to eliminate the situation that algorithms are produced without standards via algorithm labeling, and to construct a mixed regulatory framework consisting of both soft law and hard law.
Key words: digital transformation; digital twin; algorithm black box; accountability; aigorithm transparency; technical standard