蔣潔
〔摘要〕[目的]揭示人工智能(AI)迭代發(fā)展中大數(shù)據(jù)挖掘的風(fēng)險、成因與對策,為打造智能化協(xié)同創(chuàng)新生態(tài)鏈提供重要支撐。[方法]分類探討AI圖景下大數(shù)據(jù)挖掘中智能采集侵害數(shù)據(jù)產(chǎn)權(quán)、關(guān)聯(lián)勾勒突破數(shù)據(jù)匿名、黑盒疏漏打破動態(tài)平等,以及算法決策沖擊自由抉擇等風(fēng)險及其成因,提出數(shù)據(jù)挖掘的原則與策略。[結(jié)果/結(jié)論]參與者之間參差不齊的管控意識與處理能力、復(fù)雜多元的利益訴求以及缺少政策法規(guī)集中調(diào)控等導(dǎo)致上述風(fēng)險,亟待嚴(yán)格遵循平等參與、優(yōu)質(zhì)輸入、徹底拭除以及公允運轉(zhuǎn)等挖掘原則,主動采取充實數(shù)據(jù)產(chǎn)權(quán)規(guī)定、豐富數(shù)據(jù)隱私條款、明確挖掘主體資質(zhì)與公權(quán)參與標(biāo)準(zhǔn)、推動簽署數(shù)據(jù)跨境統(tǒng)一處置方案以及健全相關(guān)救濟(jì)措施等具體對策。
〔關(guān)鍵詞〕AI圖景;大數(shù)據(jù)挖掘;算法決策;風(fēng)險評估
DOI:10.3969/j.issn.1008-0821.2018.05.023
〔中圖分類號〕D92217〔文獻(xiàn)標(biāo)識碼〕A〔文章編號〕1008-0821(2018)05-0147-05
〔Abstract〕[Purpose]The paper exposed risks,causes,and countermeasures of big data mining in the iterative development of artificial intelligence.It would help to build an ecology chain of intellectualized synergistic innovation.[Methods]The article classified many risks in big data mining,which included infringing data property in the course of intellectualized data collection,changing data anonymization in drawing the outline of relevance,disrupting dynamic equality by the shortage and loss of the black box,striking the free will by algorithm decision-making mechanism,and suggested data mining principles and countermeasures.[Results]Different controlling ideas and varied management abilities of participants,complicated and diversified interest requirements,and the correspondent lagging policies and laws,brought above risks.It was necessary to abide by big data principles,such as equal participation,high quality inputs,complete deletion,and fair running;enrich provisions for data property right,improve rules of data privacy,define the mining qualification and the entrance criteria for public powers,promote the integrative international scheme about cross-border data mining,and perfect relative remedies,etc.
〔Key words〕AI picture;big data mining;algorithm decision-making;risk assessment
基于全球新一輪科技革命和產(chǎn)業(yè)變革中最先大規(guī)模應(yīng)用人工智能的國家將掌握競爭主導(dǎo)權(quán)和事務(wù)話語權(quán)的合理預(yù)期,我國從“互聯(lián)網(wǎng)+人工智能”、“新一代人工智能發(fā)展規(guī)劃”到十九大報告中強調(diào)“推動人工智能和實體經(jīng)濟(jì)深度融合”[1]以及十三屆全國人大一次會議政府工作報告提出“做大做強新興產(chǎn)業(yè)集群,實施大數(shù)據(jù)發(fā)展行動,加強新一代人工智能研發(fā)應(yīng)用”[2],愈加重視人工智能研發(fā)與應(yīng)用的戰(zhàn)略部署。龐大的網(wǎng)民基數(shù)、高速發(fā)展的基礎(chǔ)設(shè)施和萬物互聯(lián)的節(jié)點布局等為我國帶來得天獨厚的數(shù)據(jù)優(yōu)勢。執(zhí)行邏輯演算的人工智能的底層架構(gòu)是大數(shù)據(jù),通過新型計算集群深度挖掘超大規(guī)模數(shù)據(jù)資源池是人工智能迭代發(fā)展的重要支撐。在我國具有中國特色社會主義新時代中算法決策場景(如推薦引擎、預(yù)測警務(wù)、自動駕駛、智能經(jīng)營、犯罪評估)爆發(fā)式遞增之際,亟待有序化智能挖掘海量數(shù)據(jù)的特征指標(biāo)與內(nèi)外關(guān)聯(lián),推動從數(shù)據(jù)到知識再到智慧決策的普適進(jìn)程,惠及新動能培育、顛覆科創(chuàng)合作、加速產(chǎn)業(yè)轉(zhuǎn)型升級、優(yōu)化社會治理格局。
AI圖景下滲透各行各業(yè)的大數(shù)據(jù)挖掘既在降低決策成本、提高公權(quán)效率、助力供應(yīng)鏈優(yōu)化和跨界合作共贏、改進(jìn)科創(chuàng)活動的標(biāo)靶精度與包容互鑒、強化社會服務(wù)水平和生態(tài)保護(hù)績效等方面充分發(fā)揮了正向效應(yīng),亦逐漸暴露出智能采集侵害數(shù)據(jù)產(chǎn)權(quán)、關(guān)聯(lián)勾勒突破數(shù)據(jù)匿名、黑盒疏漏打破動態(tài)平等和算法決策沖擊自由抉擇等嚴(yán)重問題。亟待迅速改變相關(guān)政策法規(guī)零散落后、矛盾重重且缺少可操作性的荒原狀態(tài),高效衡平智能紀(jì)元中多方利益訴求,促進(jìn)社會和諧并提高文明程度。
1AI圖景下大數(shù)據(jù)挖掘的風(fēng)險評估
在國家重點扶持大數(shù)據(jù)和人工智能優(yōu)先發(fā)展的宏觀戰(zhàn)略之下,物聯(lián)網(wǎng)、云計算與機器學(xué)習(xí)融通共進(jìn)導(dǎo)致大數(shù)據(jù)挖掘呈現(xiàn)出對象龐雜(不斷激增的元數(shù)據(jù)以澤字節(jié)為基本單位)、流程繁瑣(多元采集、層級存儲、深度分析與復(fù)合應(yīng)用)、意義重大(精準(zhǔn)評估與有序推演助力經(jīng)濟(jì)發(fā)展、生態(tài)改善、科教進(jìn)步、國家安全與社會穩(wěn)定)等特征。外部力量難以有效探查智能挖掘的實際情狀、關(guān)聯(lián)抓取零散數(shù)據(jù)細(xì)致準(zhǔn)確以及相關(guān)政策法規(guī)空泛雜亂等使得挖掘流程充斥著諸多風(fēng)險。
11智能采集侵害數(shù)據(jù)產(chǎn)權(quán)
AI圖景下精準(zhǔn)程度日益提升的算法決策激勵了眾多主體積極參與。例如,京東、天貓、亞馬遜等在線電商通過采集實際購買數(shù)據(jù)、產(chǎn)品收藏數(shù)據(jù)和基礎(chǔ)瀏覽數(shù)據(jù),準(zhǔn)確計算用戶購物意向和具體時間,進(jìn)而自動推演和提前執(zhí)行全球貨倉調(diào)配,大幅提升物流效率并減少備貨、發(fā)貨和退換貨成本。但是,作為顛覆性創(chuàng)新原動力的自動化、即時化與持續(xù)化的數(shù)據(jù)采集聚焦遠(yuǎn)程傳感和在線軌跡多元提取的超量零散數(shù)據(jù),原初權(quán)屬模糊與相關(guān)協(xié)議偏向數(shù)據(jù)采集者導(dǎo)致侵害數(shù)據(jù)產(chǎn)權(quán)的現(xiàn)象層出不窮。
首先,具備億級存儲容量和超強處理能力的數(shù)據(jù)采集者通過協(xié)議規(guī)避責(zé)任、夸大安保需要并濫用第三方條款,以最小代價獲得海量數(shù)據(jù)并大幅降低己方保障義務(wù)。例如,支付寶將涉及用戶授權(quán)的《芝麻服務(wù)協(xié)議》作為附件內(nèi)置在年度賬單極不起眼的位置、使用小號字體、默認(rèn)勾選同意且協(xié)議內(nèi)容必須點擊才能展開,強制用戶在不知情、不經(jīng)意的情況下無條件授權(quán)芝麻信用獲取和使用個人數(shù)據(jù)。
掌握互鏈數(shù)據(jù)庫和智能挖掘技術(shù)的采集者甚至通過一體化的中心系統(tǒng)鞏固市場話語權(quán),規(guī)定數(shù)據(jù)遷移的苛刻條件、濫用優(yōu)勢地位提高準(zhǔn)入要求以便長期占據(jù)競爭優(yōu)勢[3]。其次,現(xiàn)階段自動采集的數(shù)據(jù)對象包括間接數(shù)據(jù)和其他渠道數(shù)據(jù)。這些衍生數(shù)據(jù)不僅權(quán)屬模糊,原初主體亦難以察覺滲透采集與深度控制。例如,眾多企業(yè)利用搜索競價交易提供的選取機會(購買的廣告展示次數(shù)與包含用戶智能畫像的數(shù)據(jù)供應(yīng)比例一般為1∶10),間接采集海量個人數(shù)據(jù)。最后,有關(guān)數(shù)據(jù)公權(quán)的可行性政策法規(guī)基本是授權(quán)性規(guī)范,限制權(quán)力行使的條款則大多為缺乏可操作性的宣言式或倡議式條款。不僅我國的《國家安全法》、《網(wǎng)絡(luò)安全法》、《關(guān)于電子證據(jù)收集提取判斷的規(guī)定》等寬泛模糊地授權(quán)工商稅務(wù)、紀(jì)檢司法等部門指令數(shù)據(jù)采集者進(jìn)行超大規(guī)模報送或數(shù)據(jù)協(xié)查,誘發(fā)“挖掘精確而廣泛的關(guān)于個人家庭、職業(yè)、性取向、宗教信仰、政治傾向等在內(nèi)的豐富細(xì)節(jié)”[4]的侵權(quán)行為,美國、歐盟等甚至為了實現(xiàn)人工智能時代的數(shù)據(jù)利益最大化,正在推進(jìn)允許本國公權(quán)部門憑借一紙簡單傳票跨境收集海外電子郵件和其他個人信息的立法,罔顧原初主體的數(shù)據(jù)權(quán)益。
12關(guān)聯(lián)勾勒突破數(shù)據(jù)匿名
數(shù)據(jù)匿名流轉(zhuǎn)是個體社交與群體融通中平等對話的重要基石。迅速邁向智能化的后現(xiàn)代社會卻處于日趨精密的被監(jiān)視狀態(tài)。數(shù)據(jù)實際控制者和其他挖掘者并不滿足于簡單調(diào)取原初主體自愿披露的數(shù)據(jù)和其他必要數(shù)據(jù),而是運用智能再識別技術(shù)復(fù)合勾勒零散無序的準(zhǔn)標(biāo)識符屬性值與敏感屬性值之間的特殊關(guān)聯(lián),“降低了參與者對于數(shù)據(jù)隱私匿名存取的信任與參與熱情”[5]。例如,某些數(shù)據(jù)承載量與追蹤能力卓越的互聯(lián)網(wǎng)巨頭運用微化識別技術(shù)智能獲取的己方用戶在信息檢索、在線交易與線下傳輸之中潛藏的海量零散數(shù)據(jù),在一系列復(fù)雜的目標(biāo)導(dǎo)向的關(guān)聯(lián)算法處理過程中很可能打破匿名狀態(tài)。
13黑盒疏漏打破動態(tài)平等
從雅虎錯將黑人照片標(biāo)記為“猿猴”到亞馬遜智推系統(tǒng)偏袒己方及合作方商品,AI圖景下大數(shù)據(jù)挖掘充斥著數(shù)據(jù)冗余、輸入誤差、人為誤導(dǎo)以及算法黑盒等固有疏漏,難以阻卻科技進(jìn)步助推社會分工重新整合時附隨的不平等。首先,某些原初數(shù)據(jù)主體、數(shù)據(jù)實際控制者及其他挖掘者假造挖掘內(nèi)容、篡改分析結(jié)果以控制市場活動、輿論導(dǎo)向與政治格局等等,打破整個社會的動態(tài)衡平。其次,運用迭代智能算法的大數(shù)據(jù)挖掘拉大了通曉數(shù)字工具的群體與無法參與數(shù)字系統(tǒng)的群體之間的差距,持續(xù)強化城鄉(xiāng)區(qū)域性與貧富階層性馬太效應(yīng),變相破壞平等競爭的生態(tài)環(huán)境。最后,基于自動采挖與黑盒輸出的個性化運營存在種族歧視、地區(qū)歧視、職業(yè)歧視等嚴(yán)重侵害公平交易權(quán)的問題,相應(yīng)創(chuàng)新業(yè)態(tài)導(dǎo)致勞動參與率進(jìn)一步衰落,加劇低收入與低技能人群的不平等[6]。例如,優(yōu)步(Uber)基于大數(shù)據(jù)分析的智能加價算法并未給司機群體帶來更高收入。又如,紐約教師考核的智能算法機制基于對諸多遴選變量的深入分析,使得學(xué)校里最優(yōu)秀的老師得到了最差的評價等級。
14算法決策沖擊自由抉擇
大數(shù)據(jù)挖掘的核心是把科學(xué)計算模型運用到海量資訊上來預(yù)見發(fā)生概率并做出最優(yōu)決策。在排除系統(tǒng)躍遷時的輸入瑕疵與數(shù)據(jù)冗余的理想環(huán)境中,多維度、多來源、多形式爆炸性增長的元數(shù)據(jù)集成共享與通過巨量交叉復(fù)用驗證征兆與變化規(guī)律發(fā)掘事件概率的算法決策能夠精準(zhǔn)預(yù)判金融波動、產(chǎn)銷變化、環(huán)境變遷等等,促進(jìn)信息技術(shù)與工業(yè)生產(chǎn)深度交融、實現(xiàn)智能感知與公共資源協(xié)調(diào)共享,積極構(gòu)筑數(shù)據(jù)主導(dǎo)決策的創(chuàng)新發(fā)展模式。
然而,人類千百年來一直在追求自由意志。自由選擇是實現(xiàn)個人價值、企業(yè)創(chuàng)新與政府公斷的特殊源力。AI圖景下大數(shù)據(jù)挖掘的廣泛應(yīng)用導(dǎo)致人類族群愈加依賴程式化算法決策,逐漸喪失冒險精神與創(chuàng)新意識。例如,數(shù)據(jù)掮客、數(shù)據(jù)實際控制者或其他挖掘者通過發(fā)掘海量碎片數(shù)據(jù)深層關(guān)聯(lián)完成需求和市場的全景洞察,依賴算法決策精準(zhǔn)改善產(chǎn)品服務(wù)和運營模式,在一定程度上放棄了傳統(tǒng)的試錯創(chuàng)新,嚴(yán)重沖擊自由抉擇的投資慣例。又如,基于海量基因數(shù)據(jù)與復(fù)雜環(huán)境變量智能抉擇生活、就業(yè)、社交與其他個人活動的算法模型已經(jīng)初具雛形,變相剝奪社會個體對于生存與發(fā)展的自由選擇權(quán)。極端數(shù)據(jù)主義者甚至認(rèn)為,隨著全球智能數(shù)據(jù)處理系統(tǒng)變得全知和全能,占據(jù)足夠的生物特征數(shù)據(jù)和計算能力,會比人類自己更好地理解人類,“聽從自己內(nèi)心,做真實的自己”的抉擇自由會逐漸失去。
2AI圖景下大數(shù)據(jù)挖掘風(fēng)險的對策
全球人工智能高速發(fā)展的多邊博弈中大數(shù)據(jù)挖掘?qū)τ谫Y源獲取、存留與分配的重要價值日漸凸顯?;趶V域采挖的算法決策節(jié)約成本、避免重復(fù)、加速革新,推進(jìn)科教發(fā)展、經(jīng)濟(jì)增長、環(huán)境改善并提高國家位次。缺少政策法規(guī)集中管控的大數(shù)據(jù)挖掘的盲目擴張充斥著智能采集侵害數(shù)據(jù)產(chǎn)權(quán)、關(guān)聯(lián)勾勒突破數(shù)據(jù)匿名、黑盒疏漏打破動態(tài)平等以及算法決策沖擊自由抉擇等諸多風(fēng)險。亟待尋求社會發(fā)展與權(quán)益保障之間的平衡點,切實維護(hù)原初數(shù)據(jù)主體、數(shù)據(jù)實際控制者及其他挖掘者的合法權(quán)益,推動社會主義現(xiàn)代化建設(shè)。
21明確挖掘原則
遍布全球的海量傳感節(jié)點、持續(xù)提升的智能運算能力以及風(fēng)險頻發(fā)的聚析共享等使得滿足時效性、準(zhǔn)確性與實用性的大數(shù)據(jù)挖掘成為高效益與高風(fēng)險并存的矛盾載體。亟待明確平等參與、優(yōu)質(zhì)輸入、徹底拭除以及公允運轉(zhuǎn)等挖掘原則,有效表達(dá)各方自由意志,衡平多元利益沖突。
211平等參與原則
AI圖景下大數(shù)據(jù)挖掘改變了分離數(shù)據(jù)聚析的傳統(tǒng)方式,致使數(shù)據(jù)實際控制者和其他挖掘者依據(jù)優(yōu)先協(xié)議嵌入智能區(qū)分程序,通過復(fù)合挖掘增加存儲容量與不透明傳輸比率,占據(jù)戰(zhàn)略價值鏈的較高位置,嚴(yán)重沖擊自由存取。某些別有用心的挖掘者更是通過表面普惠的缺陷性算法決策潛移默化地向廣大受眾強加己方意圖,拉低整個社會的平權(quán)指數(shù)。例如,美國加州、紐約州、威斯康辛州等使用的各種看似公允的犯罪風(fēng)險評估系統(tǒng)和智能量刑系統(tǒng)等充斥著嚴(yán)重的種族歧視。貫徹平等參與的挖掘原則,有助于原初數(shù)據(jù)主體了解挖掘目的、方法、過程及風(fēng)險收益,確保參與者獲得平等的數(shù)據(jù)表達(dá)機會。
212優(yōu)質(zhì)輸入原則
智能紀(jì)元中數(shù)據(jù)實際控制者和其他挖掘者通過多種工具無序堆積數(shù)據(jù)碎片、以最小代價再識別敏感數(shù)據(jù)的過程中,直觀可量的目的限制和數(shù)據(jù)縮小等標(biāo)準(zhǔn)是避免權(quán)力濫用、支撐匿名挖掘與維護(hù)合法權(quán)益的重要舉措。不僅需要將數(shù)據(jù)收集限制在實現(xiàn)合法目的必需的最低范圍并及時刪除無用數(shù)據(jù)(基于特定期許的數(shù)據(jù)再識別必須詳細(xì)闡明理由和內(nèi)容且透明挖掘不得超出最初聲明范疇),還需要確保優(yōu)質(zhì)輸入原初數(shù)據(jù)。經(jīng)典的谷歌流感趨勢預(yù)測失敗事件的一大原因是:眾多用戶在媒體對于谷歌首輪取得較好效果的流感預(yù)測進(jìn)行過度渲染后,出于好奇目的搜索相關(guān)關(guān)鍵詞的海量數(shù)據(jù)被誤判為關(guān)聯(lián)數(shù)據(jù)輸入了測算系統(tǒng)。
213徹底拭除原則
AI圖景下技術(shù)提升、成本下降以及數(shù)字記憶無障訪問等使得“超出傳統(tǒng)的獲取、存儲、管理與分析數(shù)據(jù)集成”的大數(shù)據(jù)挖掘能夠長久留存和有效控制巨量資訊,在一定程度上侵害社會主體享有的合法拭除過往的基本權(quán)益。有必要嚴(yán)格遵循徹底拭除的挖掘原則,完整、及時地清除未經(jīng)授權(quán)或授權(quán)超期、超范圍的數(shù)據(jù)資源并限制相關(guān)挖掘結(jié)果無序披露,實現(xiàn)個體權(quán)益保障與社會有序發(fā)展的微妙平衡。例如,神經(jīng)網(wǎng)絡(luò)模型在涉及醫(yī)學(xué)診斷、自動駕駛和智能家居等的數(shù)據(jù)采集與應(yīng)用過程中需要創(chuàng)建既能適應(yīng)新信息又不忘記已學(xué)內(nèi)容且不保留相關(guān)原始個人數(shù)據(jù)的機制。
214公允運轉(zhuǎn)原則
新時代中大數(shù)據(jù)挖掘滲透諸多領(lǐng)域的終極目標(biāo)是整個社會的和諧發(fā)展。亟待嚴(yán)格遵循公允運轉(zhuǎn)原則,避免挖掘過程中的弱勢偏見與不公平待遇,建立數(shù)據(jù)驗證、痕跡追蹤以及密鑰技術(shù)指標(biāo)體系,完善公權(quán)部門監(jiān)管職責(zé)認(rèn)定標(biāo)準(zhǔn)、違規(guī)懲處方式以及數(shù)據(jù)權(quán)益救濟(jì)機制等等,確保大數(shù)據(jù)挖掘的透明化、客觀化和有序化。
22完善具體舉措
AI圖景下構(gòu)筑合法、有序、科學(xué)的大數(shù)據(jù)挖掘機制亟待細(xì)化風(fēng)險應(yīng)對舉措,預(yù)防并懲治各參與方的違法違規(guī)行為,確保我國在新一輪大國博弈中占據(jù)優(yōu)勢地位。
221充實數(shù)據(jù)產(chǎn)權(quán)規(guī)定
有序共享是大數(shù)據(jù)挖掘科學(xué)運作的重要前提。數(shù)據(jù)資產(chǎn)的權(quán)屬認(rèn)定關(guān)系到原初數(shù)據(jù)主體、數(shù)據(jù)實際控制者和其他挖掘者的不同利益訴求。社會公眾對于大數(shù)據(jù)挖掘的排斥來自數(shù)據(jù)權(quán)屬模糊、不透明處理與結(jié)果濫用帶來的不安全感[7]。亟待在肯定數(shù)據(jù)產(chǎn)權(quán)性質(zhì)的基礎(chǔ)上,明確數(shù)據(jù)占有權(quán)、知情權(quán)、自主披露權(quán)、封鎖權(quán)、更正權(quán)、刪除權(quán)、收益權(quán)以及救濟(jì)權(quán)等等,保障原初主體能夠自主使用基礎(chǔ)通訊設(shè)備并掌控數(shù)據(jù)儲流狀況。同時,當(dāng)前的大數(shù)據(jù)挖掘內(nèi)嵌著操作主體對海量數(shù)據(jù)的主動解讀,結(jié)果可能受到人為干預(yù)。亟待明確數(shù)據(jù)實際控制者和其他挖掘者應(yīng)當(dāng)承擔(dān)的告知、保密、返還合理收益等法定義務(wù),實現(xiàn)海量數(shù)據(jù)采集、存儲、流轉(zhuǎn)與使用的透明化、有限化和合法化,避免數(shù)據(jù)實際控制者和其他挖掘者利用資源優(yōu)勢和技術(shù)領(lǐng)先肆意違法違規(guī)。
隨著多元數(shù)據(jù)資源池飛速集聚數(shù)字印跡,迫切需要保障原初主體自主加入、隨時轉(zhuǎn)移或清除數(shù)據(jù)等基本權(quán)利。挖掘活動必須取得原初主體的明示同意并向目標(biāo)對象預(yù)警違法行為且按規(guī)按需徹底并行銷毀原數(shù)據(jù)庫、備份數(shù)據(jù)庫乃至緩存信息與痕跡記錄。同時,立法構(gòu)建明確的數(shù)據(jù)使用時效機制、新技術(shù)強制適用機制、數(shù)據(jù)交易機制以及相關(guān)違法懲罰機制等等。尤其是在數(shù)據(jù)交易日益勃興、相關(guān)爭議頻繁發(fā)生的情況下(如菜鳥與順豐有關(guān)“信息安全”和“個人隱私”之爭的真實動機是用戶數(shù)據(jù)控制權(quán)),有必要迅速建立統(tǒng)一的數(shù)據(jù)產(chǎn)權(quán)登記和評估制度、交易標(biāo)準(zhǔn)、相關(guān)信息披露和跨境數(shù)據(jù)交流規(guī)則等等。
222豐富數(shù)據(jù)隱私條款
AI圖景下國家安全、經(jīng)濟(jì)發(fā)展、環(huán)境保護(hù)、公共健康及技術(shù)進(jìn)步等的實際需要使得大數(shù)據(jù)挖掘活動必須尋求各方利益的動態(tài)平衡。包括姓名生日、住址單位以及生物特征等在內(nèi)的驗證信息曾是在線數(shù)據(jù)的主要加密工具,卻不足以承擔(dān)智能挖掘活動中隱私保護(hù)的艱巨任務(wù)。智能推送原初數(shù)據(jù)創(chuàng)建人、創(chuàng)建地點和創(chuàng)建時間等痕跡記錄有可能泄露私密信息,零散數(shù)據(jù)聚合分析亦是暴露隱私的危險因素。整個社會對定制服務(wù)、個性化教育、精準(zhǔn)信用評估等的迫切需求刺激急于發(fā)掘更大消費群體或轉(zhuǎn)售分析結(jié)果的數(shù)據(jù)實際控制者及其他挖掘者肆意侵害數(shù)據(jù)隱私。日益復(fù)雜的智能算法借助晦澀的授權(quán)條款蒙蔽處于資源劣勢的社會公眾。某些原初主體甚至因為貪戀微薄的數(shù)據(jù)紅利而漠視自動定位和推送服務(wù)獲取并使用敏感數(shù)據(jù)的巨大風(fēng)險。
雖然《網(wǎng)絡(luò)安全法》中要求“明示收集、使用信息的目的、方式和范圍,并經(jīng)被收集者同意”,中央網(wǎng)信辦、工信部、公安部、國家標(biāo)準(zhǔn)委等四部門聯(lián)合啟動的“個人信息保護(hù)提升行動”對淘寶、微信、百度地圖、京東商城、滴滴出行等網(wǎng)絡(luò)產(chǎn)品和服務(wù)的“隱私條款內(nèi)容、展示方式和征得用戶同意方式”等進(jìn)行重點評審,卻長期缺乏具體、翔實、可操作的數(shù)據(jù)隱私條款。亟待“通過健全數(shù)據(jù)隱私法律規(guī)范,保護(hù)和改進(jìn)控制他人數(shù)據(jù)的模式”[8],基于數(shù)據(jù)價值高于潛在侵權(quán)可能性的風(fēng)險矩陣,明確保障數(shù)據(jù)利益最大化與數(shù)據(jù)隱私風(fēng)險最小化的基本原則、價值導(dǎo)向及必備條款,形成保護(hù)AI圖景下海量數(shù)據(jù)挖掘關(guān)涉隱私權(quán)益的長效機制。全面規(guī)定大數(shù)據(jù)資源池的安全認(rèn)證指數(shù)、隔斷式數(shù)據(jù)區(qū)與密鑰認(rèn)證標(biāo)準(zhǔn);建立透明化的敏感數(shù)據(jù)來源追溯與智能脫敏系統(tǒng),要求挖掘活動按照統(tǒng)一技術(shù)程序漂白數(shù)據(jù),積極讀取與響應(yīng)原初主體的謝絕意向;不僅避免數(shù)據(jù)實際控制者向原初數(shù)據(jù)主體強加義務(wù),還向所有參與者進(jìn)行即時的增強式告知并取得明示同意,特別是“承諾不得再識別既定數(shù)據(jù),即任一系統(tǒng)參與者未經(jīng)數(shù)據(jù)權(quán)人特別允許,必須保持?jǐn)?shù)據(jù)原有的分離狀態(tài)”[9];妥善圈定關(guān)聯(lián)分析范圍與結(jié)果分享形式,嚴(yán)格限制有效管理必需的數(shù)據(jù)挖掘并禁止未經(jīng)授權(quán)的二次傳播;廣泛應(yīng)用數(shù)據(jù)隱私影響評估制度與交互式智能監(jiān)控認(rèn)證,明確各參與者的保障義務(wù)與侵權(quán)責(zé)任,全面落實符合文明社會發(fā)展理念的大數(shù)據(jù)戰(zhàn)略與人工智能規(guī)劃。
223明確挖掘主體資質(zhì)與公權(quán)參與標(biāo)準(zhǔn)
當(dāng)前正值智能化數(shù)據(jù)挖掘模式積極探索與應(yīng)用發(fā)展的關(guān)鍵階段,難以遏止藍(lán)海市場中不斷膨脹的炒作行為與惡意牟利。商業(yè)組織以尋求合法合理與高收益之間的動態(tài)平衡為首要行為準(zhǔn)則。嚴(yán)格規(guī)定鏈網(wǎng)數(shù)據(jù)庫復(fù)合構(gòu)筑的挖掘主體資質(zhì)是避免數(shù)據(jù)實際控制者和其他挖掘者投機取巧、惡意操控數(shù)據(jù)流向并制止未經(jīng)授權(quán)的挖掘活動的重要措施。雖然建立智能數(shù)據(jù)中樞的挖掘者企圖通過緩和數(shù)據(jù)源之間的固有隔閡匯總數(shù)據(jù)湖,卻難以磨滅挖掘過程的人工痕跡。事實上,AI圖景下大數(shù)據(jù)應(yīng)用的成功要訣在于高效聚合能夠從海量數(shù)據(jù)碎片運行規(guī)律中推斷原創(chuàng)行為的諸多觸點并構(gòu)建相關(guān)算法模型的特殊人才。這些數(shù)據(jù)科學(xué)家在缺少外力監(jiān)督、執(zhí)業(yè)規(guī)則培訓(xùn)以及相關(guān)政策法規(guī)和行業(yè)自律干預(yù)之下,容易在巨大的經(jīng)濟(jì)利益與強大的精神滿足感的驅(qū)使下侵害數(shù)據(jù)權(quán)益。有必要明確挖掘主體及其從業(yè)人員的法定準(zhǔn)入標(biāo)準(zhǔn)并清晰表述特殊職業(yè)操守要求與相應(yīng)監(jiān)管機制。
雖然公權(quán)主導(dǎo)和參與大數(shù)據(jù)挖掘是保障國家安全、維持社會穩(wěn)定的重要舉措,但各級各地公權(quán)部門持續(xù)開展未經(jīng)同意的挖掘活動嚴(yán)重侵害合法權(quán)益。作為數(shù)據(jù)資源最大產(chǎn)出、收集與使用方的公權(quán)部門長期掌握居民身份、環(huán)境、經(jīng)濟(jì)與文化等統(tǒng)計數(shù)據(jù),務(wù)須盡快明確公權(quán)參與挖掘的標(biāo)準(zhǔn),確保其僅在得到合法授權(quán)且及時通知的情況下直接采集或通過數(shù)據(jù)實際控制者間接獲取數(shù)據(jù),提升公權(quán)參與的公信力。
224推動簽署數(shù)據(jù)跨境統(tǒng)一處置方案
當(dāng)前門檻低、環(huán)節(jié)少、周期短的跨境電子商務(wù)蓬勃發(fā)展導(dǎo)致海量數(shù)據(jù)在全球范圍內(nèi)大規(guī)模無序流轉(zhuǎn)。跨境數(shù)據(jù)實際控制者和其他挖掘者最初基于規(guī)避政策法規(guī)、多元備份及降低成本等考慮,往往將儲流服務(wù)器置于不同國家和地區(qū)。AI圖景下迅速提升的技術(shù)能力使得挖掘者能夠突破海內(nèi)外數(shù)據(jù)連接的防御體系,在悄然侵入傳輸信道后有選擇地獲取散落全球數(shù)據(jù)中心的優(yōu)質(zhì)信息并進(jìn)行低成本處置。主要國家和地區(qū)在數(shù)據(jù)資產(chǎn)收益、數(shù)據(jù)主權(quán)與流轉(zhuǎn)安全等綜合考量之下,基于大數(shù)據(jù)產(chǎn)業(yè)競爭實力與安全保障價值觀的不同,先后采用殊別的跨境數(shù)據(jù)挖掘調(diào)控方案。主要包括鼓勵原初數(shù)據(jù)自由流動的美式規(guī)范、主張相關(guān)數(shù)據(jù)服務(wù)器本土留存的俄式規(guī)范以及提出有限允許數(shù)據(jù)跨境處置的歐盟規(guī)范等等。妥善解決跨國數(shù)據(jù)流轉(zhuǎn)危機、安全技術(shù)障礙與相關(guān)權(quán)益風(fēng)險等迫切需要通過衡平國家安全、經(jīng)濟(jì)發(fā)展與公眾權(quán)益等的大規(guī)模國際談判,積極簽署實現(xiàn)跨境數(shù)據(jù)合法化與透明化智能協(xié)作處置的細(xì)化方案,構(gòu)建科學(xué)合理的全球數(shù)據(jù)資源共享挖掘機制。
225健全相關(guān)救濟(jì)措施
AI圖景下大數(shù)據(jù)挖掘成效的關(guān)鍵在于數(shù)據(jù)源規(guī)模。確保原初主體合法權(quán)益受到侵害并造成損失時能夠及時獲得有效補救是激發(fā)公眾參與熱情、逐步充盈數(shù)據(jù)資源池的必要條件。然而,絕大多數(shù)可采信證據(jù)往往把持在數(shù)據(jù)實際控制者和其他挖掘者手中,受害者被迫依賴數(shù)據(jù)信道重組證據(jù)鏈大幅增加舉證成本。有必要迅速健全相關(guān)救濟(jì)措施,強化數(shù)據(jù)挖掘的公權(quán)保障,建立高素質(zhì)監(jiān)督隊伍,要求違法違規(guī)主體承擔(dān)懲罰性賠償責(zé)任,發(fā)揮電商協(xié)會、互聯(lián)網(wǎng)協(xié)會、消費者協(xié)會等民間調(diào)解機構(gòu)在高效解決相關(guān)糾紛中的重要作用。
3結(jié)論
AI圖景下廣域滲透社會生活的海量數(shù)據(jù)集聚、存儲、處理與流動中充斥著侵害數(shù)據(jù)主權(quán)、數(shù)據(jù)安全、數(shù)據(jù)產(chǎn)權(quán)、數(shù)據(jù)平等與數(shù)據(jù)自由的諸多風(fēng)險。亟待構(gòu)筑衡平社會發(fā)展與權(quán)益保障的原則體系,完善合法合理且有序科學(xué)的具體對策,緩解基于大數(shù)據(jù)的智能算法決策中頻繁出現(xiàn)的黑天鵝事件,避免賽博世界演變成全景式監(jiān)獄,加快建設(shè)創(chuàng)新型國家。
參考文獻(xiàn)
[1]習(xí)近平.決勝全面建成小康社會奪取新時代中國特色社會主義偉大勝利[EB/OL].http://news.xinhuanet.com/2017-10/27/c_1121867529.htm,2018-02-02.
[2]李克強.十三屆全國人大一次會議政府工作報告[EB/OL].http://glzx.njgl.gov.cn/art/2018/3/5/art_48375_2476217.html,2018-03-18.
[3]Facebook Terms of Service[EB/OL].http://www.facebook.com/legal/terms,2018-02-02.
[4]United States vJones,132 SCt.565 US(2012)[EB/OL].http://en.wikipedia.org/wiki/United_States_v._Jones_,2018-02-02.
[5]Ann Cavoukian,Khaled Emam.Dispelling the Myths Surrounding DE-identification:Anonymization Remains a Strong Tool for Protecting Privacy[C].Springer Berlin Heidelberg,2011:141.
[6]Terry Gregory.The Risk of Automation for Jobs in OECD Countries:A Comparative Analysis[C].OECD Social,Employment and Migration Working Paper,2016:189.
[7]Lev Manovich.Trending:The Promises and the Challenges of Big Social Data[EB/OL].http://manovich.net/content/04-projects/067-trending-the-promises-and-the-challenges-of-big-social-data/64-article-2011.pdf,2018-02-02.
[8]We Believe America:Republican Platform[EB/OL].http://www.gop.com/wp-content/uploads/ 2012/08/2012GOPPlatform.pdf,2018-02-02.
[9]The Working Party on the Protection of Individuals with Regard to the Processing of Personal Data[EB/OL].http://ec.europa.eu/justice/policies/privacy/docs/wpdocs/2011/wp187_en.pdf,2018-02-02.
(責(zé)任編輯:孫國雷)