宋家璇 董金鑫
[摘要]為保護企業(yè)數(shù)據(jù)財產和公民個人信息,當前我國司法實踐將未經授權的數(shù)據(jù)爬取認定為侵權,甚至情節(jié)嚴重的認定為犯罪。對數(shù)據(jù)爬取的評價需要進行利益衡量,原因在于數(shù)據(jù)爬取存在利益沖突,此種沖突集中體現(xiàn)為平臺的數(shù)據(jù)財產利益、信息自由利益和反壟斷利益無法同時實現(xiàn)。通過對數(shù)據(jù)爬取利益和拒絕數(shù)據(jù)爬取的利益進行衡量,可以發(fā)現(xiàn)法律應當維護數(shù)據(jù)爬取利益,數(shù)據(jù)爬取并非違法行為。為糾正司法實踐對數(shù)據(jù)爬取的錯誤評價,應當通過立法確立公開數(shù)據(jù)屬于公眾、公開數(shù)據(jù)可自由流通。為了使制度能夠真正落地,還需要妥善應對數(shù)據(jù)爬取合法化帶來的一系列潛在風險。
[關鍵詞]數(shù)據(jù)爬取;利益衡量;數(shù)據(jù)歸屬;數(shù)據(jù)流通
[中圖分類號]D922? ? ? [文獻標識碼]A
[DOI]:10.20122/j.cnki.2097-0536.2024.02.004
引言
數(shù)字時代,數(shù)據(jù)成為關鍵生產要素,企業(yè)之間的競爭已經擴展到數(shù)據(jù)上的競爭,平臺有著強烈的控制自身數(shù)據(jù)的意愿,為此平臺會設置反爬取措施避免自身數(shù)據(jù)被他人爬取。由于公開數(shù)據(jù)的開放性程度較高,爬蟲總是能夠爬取到數(shù)據(jù),平臺為維護自身權益只能求助于法律,因此產生了大量的法律糾紛。當前我國立法在數(shù)據(jù)爬取問題上尚處空白,司法實踐在保護被爬取方利益的同時,阻礙了公開數(shù)據(jù)的流通,而數(shù)據(jù)流通能夠實現(xiàn)巨大的社會利益。這一現(xiàn)象向法學界提出了一個問題,數(shù)據(jù)爬取利益是否比拒絕數(shù)據(jù)爬取的利益更值得法律保護,這一問題等同于數(shù)據(jù)爬取是合法行為還是違法行為,對這一問題的解答決定著公開數(shù)據(jù)的歸屬和流通,并直接影響著立法和司法實踐。為此,本文試圖揭示出數(shù)據(jù)爬取能夠實現(xiàn)的法益,通過對爬取方和被爬取方的法益進行衡量,以解決數(shù)據(jù)爬取是否應當合法化這一問題。
一、數(shù)據(jù)爬取面臨現(xiàn)實困境
我國一概禁止數(shù)據(jù)爬取的執(zhí)法和司法,忽略了數(shù)據(jù)爬取利益,當前法律維護的是拒絕數(shù)據(jù)爬取的利益。[1]已生效的司法判決具有立法的效果,其產生的指引和預測作用,使數(shù)據(jù)爬取面臨著違法甚至犯罪的危險,嚴重阻礙了數(shù)據(jù)流通,數(shù)據(jù)爬取利益難以實現(xiàn)。具體來說,兩方面原因使數(shù)據(jù)爬取利益難以實現(xiàn)。一是法律對數(shù)據(jù)財產的保護阻礙了數(shù)據(jù)爬取,法律要求爬取方爬取公開數(shù)據(jù)需要獲得平臺同意,未經平臺授權爬取數(shù)據(jù)構成侵權。二是法律對個人信息的保護阻礙了數(shù)據(jù)爬取,法律要求爬取方爬取已公開的個人信息需要獲得個人同意,未經個人授權爬取承載著個人信息的數(shù)據(jù)構成侵權。
(一)法律對數(shù)據(jù)財產的保護阻礙了數(shù)據(jù)爬取
對于公開數(shù)據(jù)屬于誰這個問題,立法并未做出規(guī)定。而梳理現(xiàn)有的數(shù)據(jù)爬取糾紛判決,可以發(fā)現(xiàn)法院普遍認為未經授權爬取數(shù)據(jù)侵犯了平臺的數(shù)據(jù)財產利益,通過援引《反不正當競爭法》第2條判定未經授權爬取數(shù)據(jù)構成侵權。[2]此外,刑法第285條第2款規(guī)定了非法獲取計算機信息系統(tǒng)數(shù)據(jù)罪,實踐中已有未經授權爬取公開數(shù)據(jù)被定罪的先例。司法實踐承認了公開數(shù)據(jù)屬于平臺,要求爬取方爬取數(shù)據(jù)需要獲得平臺的同意。而對于很多公開數(shù)據(jù),平臺不會允許社會公眾爬取,強行爬取構成侵權,嚴重的構成犯罪,數(shù)據(jù)爬取受到極大阻礙。
(二)法律對個人信息的保護阻礙了數(shù)據(jù)爬取
信息一經分享進入公共領域即視為可自由流通,然而大數(shù)據(jù)時代使得信息流動的元規(guī)則因個人信息保護受到挑戰(zhàn)。在微博訴脈脈案中,法院明確提出了三重授權原則,即第三方通過開放平臺爬取用戶已公開的個人信息,需要用戶授權+平臺授權+用戶授權。具體而言,一是微博獲取用戶個人信息需要用戶授權;二是爬取方爬取個人信息需要微博授權;三是爬取方爬取個人信息需要用戶授權,違反該原則的數(shù)據(jù)爬取是違法的。微博訴脈脈案,給社會公眾一種指引,爬取承載著個人信息的公開數(shù)據(jù)現(xiàn)需要個人同意。爬取承載著個人信息的公開數(shù)據(jù)需要個人同意,會因為涉及海量個人信息,而難以履行告知同意義務,數(shù)據(jù)爬取受到嚴重阻礙。
二、數(shù)據(jù)爬取合法化的正當性
法律對數(shù)據(jù)爬取的評價需要進行利益衡量,原因在于,數(shù)據(jù)爬取和拒絕數(shù)據(jù)爬取所實現(xiàn)的利益都是法律保護的利益,并且一方利益的實現(xiàn)會導致另一方利益無法實現(xiàn),存在利益沖突。此種沖突集中體現(xiàn)為平臺的數(shù)據(jù)財產利益與信息自由利益和反壟斷利益無法同時實現(xiàn)。通過比較兩種利益的重要性,可以發(fā)現(xiàn)數(shù)據(jù)爬取利益大于拒絕數(shù)據(jù)爬取的利益,兩利相衡取其大,法律應當選擇維護數(shù)據(jù)爬取利益,數(shù)據(jù)爬取是一種合法行為。
(一)拒絕數(shù)據(jù)爬取的利益為平臺的數(shù)據(jù)財產利益
在數(shù)據(jù)生產活動中,平臺投入了大量的勞動和資本,平臺建立起網(wǎng)絡架構,在此架構基礎上生產了大量數(shù)據(jù),并且平臺需要一直維護網(wǎng)站的正常運行,保存并管理產生的數(shù)據(jù)。財產法的一般原理是,對于通過自身勞動創(chuàng)造出來的財產,勞動者享有處分權利。所以憑借著勞動和資本投入,平臺獲得了數(shù)據(jù)財產權利,這種權利受到法律保護。未經授權爬取數(shù)據(jù)損害的是平臺的數(shù)據(jù)財產利益,拒絕數(shù)據(jù)爬取的利益為平臺的數(shù)據(jù)財產利益。
(二)數(shù)據(jù)爬取利益為信息自由利益和反壟斷利益
數(shù)據(jù)爬取實現(xiàn)了信息自由利益。我國憲法規(guī)定公民享有言論自由權,言論自由權利的設立目的在于保障公民可以自由交流,然而言論自由權的內容卻僅保護言論可以自由發(fā)出,對言論可以自由接收的保護長期缺位。信息自由權保護的是接收言論的自由,根據(jù)言論自由權的設立目的可以發(fā)現(xiàn)信息自由權是一種隱含的權利。[3]憲法中已規(guī)定的具體的基本權利的內涵決定著人權條款中人權的外延,言論自由屬于人權,與之相對應、具有同等地位的信息自由也應當屬于人權,信息自由是憲法應當保護的基本權利。信息自由包含著獲取信息的方式和工具使用的自由,數(shù)據(jù)爬取是一種獲取信息的方式,數(shù)據(jù)爬取技術是獲取公開信息的一種工具,數(shù)據(jù)爬取自由是信息自由的應有之義,所以公民享有爬取公開數(shù)據(jù)的權利,數(shù)據(jù)爬取實現(xiàn)了信息自由利益。
數(shù)據(jù)爬取實現(xiàn)了反壟斷利益。平臺授權其他主體爬取數(shù)據(jù)的方式是通過公布robots.txt文件,robots協(xié)議本質上是授權條款,在一般禁止的情況下,其向外界宣示哪些主體可以爬取數(shù)據(jù)。在瀏覽器的網(wǎng)址搜索欄中輸入域名/robots.txt,可以查看平臺的robots協(xié)議,查看了微博、抖音、快手、好看視頻、百度知道、百度百科、百度經驗、百度貼吧、百度文庫、搜狗問問、搜狗百科、360問答、360百科、知乎、嗶哩嗶哩、小紅書的robots協(xié)議。能夠發(fā)現(xiàn)許多平臺存在差別授權的現(xiàn)象。平臺的差別授權突出體現(xiàn)在,上述平臺通過robots協(xié)議授權的主體都是當前用戶數(shù)較多的搜索引擎,而拒絕其他一切主體爬取,百度、谷歌和搜狗得到了所有平臺的授權。百度、谷歌和搜狗比通用搜索引擎市場的潛在進入者占有更多的公開數(shù)據(jù),如果沒有獲得授權的主體無法爬取到數(shù)據(jù),那么平臺的差別授權行為會在通用搜索引擎市場產生排除、限制競爭的效果,原因如下。首先,公開數(shù)據(jù)是搜索引擎提供搜索服務的基礎。其次,多占有的數(shù)據(jù)所承載的信息是用戶在使用搜索引擎時最需要的那類信息,并且多占有的這部分信息在質量和數(shù)量上,都要優(yōu)于潛在進入者占有的相應信息,多占有的這部分數(shù)據(jù)是提供更好搜索服務的基礎。最后,當數(shù)據(jù)的數(shù)量較多、質量較高,因模仿所需要的經濟成本過高以及耗費的時間過長時,實際不具備可模仿性。[4]多占有的數(shù)據(jù)所帶來的競爭優(yōu)勢能夠在通用搜索引擎市場排除、限制競爭。我國反壟斷法的調整對象是壟斷行為,排除、限制競爭的行為是壟斷行為,平臺的差別授權行為是壟斷行為。盡管這種行為不同于反壟斷法已規(guī)定的任何一種具體壟斷行為,但因為其屬于反壟斷法的調整對象,受反壟斷法調整,為調整這種壟斷行為需要使公眾能夠爬取到數(shù)據(jù)。數(shù)據(jù)爬取起到了反壟斷的效果,數(shù)據(jù)爬取實現(xiàn)了反壟斷利益。
(三)數(shù)據(jù)爬取利益重要性大于拒絕數(shù)據(jù)爬取利益
社會公共利益是指不特定的社會成員所享有的利益,數(shù)據(jù)爬取利益包括信息自由利益和反壟斷利益,數(shù)據(jù)爬取利益是社會公共利益,平臺的數(shù)據(jù)財產利益是一種個體財產利益。社會公共利益優(yōu)先于個體財產利益是基本共識,[5]所以信息自由利益和反壟斷利益都比平臺的數(shù)據(jù)財產利益更為重要,數(shù)據(jù)爬取利益的重要性大于拒絕數(shù)據(jù)爬取利益的重要性,法律應當選擇維護數(shù)據(jù)爬取利益,數(shù)據(jù)爬取并非違法行為。
三、數(shù)據(jù)爬取合法化的制度設計
(一)將數(shù)據(jù)爬取確立為合法行為
為維護數(shù)據(jù)爬取利益,擺脫當前數(shù)據(jù)爬取面臨的困境,應當通過立法的方式糾正司法實踐對數(shù)據(jù)爬取的錯誤評價。在制度設計上,應將數(shù)據(jù)爬取確立為合法行為。數(shù)據(jù)爬取合法化的關鍵在于明確的數(shù)據(jù)歸屬,明確的財產權屬能夠有效避免糾紛,對于數(shù)據(jù)的流通和利用、培育數(shù)字經濟有著重要意義,有恒產者方能有恒心。具體來說,法律應當規(guī)定公開數(shù)據(jù)屬于公眾,公開數(shù)據(jù)是一種公共財產,任何人都可以自由地復制和利用,享受該財產利益。此外,應當明確規(guī)定用戶一旦公開承載著個人信息的數(shù)據(jù)即具有同意他人爬取的意思表示,爬取承載著個人信息的公開數(shù)據(jù)無需獲得任何人的同意,公開數(shù)據(jù)可自由流通。
(二)妥善應對數(shù)據(jù)爬取合法化帶來的風險
在維護數(shù)據(jù)爬取利益的制度設計上,要妥善應對數(shù)據(jù)爬取合法化帶來的一系列潛在風險,著重預防平臺商業(yè)利益和個人知識產權利益受到損害,降低法益受損風險,以兼顧好社會各方利益,為公開數(shù)據(jù)的自由流通鋪平道路。為防止流量過載導致平臺商業(yè)利益受到損害,法律應當做出下列規(guī)定。其一是允許平臺在大多數(shù)時間里設置反爬取措施,在清晨和深夜等用戶數(shù)非常少的時間,禁止平臺設置反爬取措施,反爬取措施起到減速帶的作用。其二是允許平臺設置在不同的時間段所能夠承受的最大爬蟲流量值,當達到最大值時通過彈窗的方式警告爬取方,若爬取方繼續(xù)爬取構成侵權。其三是允許平臺規(guī)定某些時間段禁止爬取方爬取數(shù)據(jù),例如在用戶使用平臺的高峰期,可禁止爬取方爬取數(shù)據(jù),違反平臺規(guī)定爬取數(shù)據(jù)構成侵權。其四是將集中的爬蟲流量分散開來,可規(guī)定某個時間段只允許商用爬蟲爬取數(shù)據(jù),某個時間段只允許普通用戶爬蟲爬取數(shù)據(jù)。為防止用戶的知識產權利益受到損害,應當規(guī)定只要未經用戶同意,將用戶在平臺生產的內容發(fā)布在其他平臺就構成侵權。實質性替代平臺的內容或服務需要發(fā)布海量的內容,發(fā)布方實際不可能獲得那么多用戶的同意,因此這樣的規(guī)定可以有效預防用戶的知識產權利益受到損害。
四、結語
數(shù)據(jù)的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而絕大部分則隱藏在表面之下。在當前實踐中,由于爬蟲對于很多公開數(shù)據(jù)的爬取是違法的,公開數(shù)據(jù)無法自由流通,數(shù)據(jù)的大量價值尚未發(fā)掘。本文揭示出數(shù)據(jù)爬取能夠實現(xiàn)法律保護的利益,法律對數(shù)據(jù)爬取的評價需要進行利益衡量。通過利益衡量,發(fā)現(xiàn)數(shù)據(jù)爬取利益是更值得法律維護的利益,數(shù)據(jù)爬取是一種合法行為。最終得出了公開數(shù)據(jù)屬于公眾、公開數(shù)據(jù)可自由流通的結論,這一結論的意義不僅在于能夠實現(xiàn)信息自由利益和反壟斷利益,而且可以充分釋放出數(shù)據(jù)的潛在價值,有益于社會的進步和發(fā)展。
參考文獻:
[1]許可.數(shù)據(jù)爬取的正當性及其邊界[J].中國法學,2021(2):166-188.
[2]盧代富,張煜琦.從權益保護到利益衡量:數(shù)據(jù)抓取行為正當性認定的路徑優(yōu)化[J].河南財經政法大學學報,2022,37(6):59-70.
[3]敖海靜.信息自由的憲法基礎[J].華東政法大學學報,2023(2):34-52.
[4]孫晉,鐘原.大數(shù)據(jù)時代數(shù)據(jù)構成必要設施的反壟斷法分析[J].電子知識產權,2018(5):38-49.
[5]王利明.民法上的利益位階及其考量[J].法學家,2014(1):79-90+176-177.
基金項目:青島市社科規(guī)劃項目,項目名稱:新冠疫情背景下青島市涉外合同法律適用研究(項目編號:QDSKL2101048)
作者簡介:
宋家璇(1999.5-),男,漢族,山東濰坊人,碩士,研究方向:民商法學;
董金鑫(1985.9-),男,漢族,山東威海人,博士,副教授,研究方向:國際民商法。