程文杰 胡建新
(541004 桂林電子科技大學(xué)法學(xué)院 廣西 桂林)
大數(shù)據(jù)的一個(gè)巨大潛力是能夠重新組合來自不同來源的數(shù)據(jù),并對它們進(jìn)行比較和分析。這讓我們發(fā)現(xiàn)了很多新的相關(guān)性。比如,這將幫助我們了解社會是如何運(yùn)作的,以及一個(gè)現(xiàn)象如何在另一個(gè)社會中起作用。運(yùn)營大數(shù)據(jù)所產(chǎn)生的商業(yè)模式和利益都指向了兩個(gè)的事實(shí):一是大多數(shù)數(shù)據(jù)是由別人生成的,二是數(shù)據(jù)的價(jià)值是由他們的使用而增加的,而不是對他們使用的限制。這兩點(diǎn)事實(shí)對大數(shù)據(jù)的知識產(chǎn)權(quán)保護(hù)提出了新的挑戰(zhàn)。
大數(shù)據(jù)的特征常常被業(yè)界歸納為4個(gè)“V”:
第一個(gè)特征是數(shù)據(jù)量大。一組名為“互聯(lián)網(wǎng)上一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部內(nèi)容可以刻滿1.68億張DVD①。研究表明,十年前全球的數(shù)據(jù)量單位用ZB,五年前全球產(chǎn)生的紙質(zhì)材料數(shù)據(jù)量單位是PB,而所有的語言信息的數(shù)據(jù)量單位是EB(其中1PB=1024TB,1EB=1024PB,1ZB=1024EB)。
第二個(gè)特征是數(shù)據(jù)類型繁多。數(shù)據(jù)不單是常見的數(shù)字文字形式,而是變形為多種表現(xiàn)方式,如聲音、圖片、地理位置信息,瀏覽記錄等。多樣化的數(shù)據(jù)來源正是大數(shù)據(jù)的生命線,如果說互聯(lián)網(wǎng)是各種類型信息及行業(yè)在線上的橫向發(fā)展,則大數(shù)據(jù)就是將這些毫無關(guān)聯(lián)的信息和行業(yè)串連起來。
第三個(gè)特征是數(shù)據(jù)價(jià)值密度相對較低。海量的數(shù)據(jù)大爆炸式的出現(xiàn),甚至包含了方方面面,但其中的有用信息卻沒有呈爆炸式增長,其價(jià)值的低密度性促使信息的使用者對有用信息的摘取出現(xiàn)難度。然而大數(shù)據(jù)的精髓不在于其精確的表達(dá)出某種直接關(guān)系,而是通過一種相關(guān)性,預(yù)測出數(shù)據(jù)的走向,這種相關(guān)性恰恰可以基于大數(shù)據(jù)這種龐大的樣本容量顯出其特征。
第四個(gè)特征是處理速度快。大數(shù)據(jù)時(shí)代,雖然已有基數(shù)較大的數(shù)據(jù)樣本,但對于數(shù)據(jù)的處理速度較以前大幅提高,加之?dāng)?shù)據(jù)的流動性變化性也很大,對于掌握大數(shù)據(jù)的企業(yè)來說時(shí)間就是生命,迅速挖掘分析數(shù)據(jù)才能發(fā)揮數(shù)據(jù)的價(jià)值,否則數(shù)據(jù)將僅僅只是數(shù)據(jù)。
從業(yè)界和學(xué)術(shù)界對大數(shù)據(jù)的定義可以看出其價(jià)值的體現(xiàn),目前主流的定義有以下幾種:
1.數(shù)據(jù)本位論
持該觀點(diǎn)的學(xué)者大多認(rèn)為大數(shù)據(jù)的價(jià)值在于其廣闊的數(shù)據(jù)類型(Variety),屬于數(shù)據(jù)本身的價(jià)值。
2.技術(shù)本位論
技術(shù)本位強(qiáng)調(diào)其價(jià)值在于對大量數(shù)據(jù)進(jìn)行的檢索、提取和分析,雖然存儲和處理海量數(shù)據(jù)的許多技術(shù)挑戰(zhàn)已經(jīng)解決了多年,但直到最近才有能力捕捉、存儲、處理和提供跨越許多領(lǐng)域的數(shù)據(jù),并以這樣的速度完全實(shí)現(xiàn)。大數(shù)據(jù)是一種利用龐大數(shù)據(jù)中某些有用信息作出相關(guān)性判斷和預(yù)測的技術(shù),由于其數(shù)據(jù)本身價(jià)值密度低(Value),若不對數(shù)據(jù)進(jìn)行抓取和挖掘,數(shù)據(jù)背后的潛在價(jià)值將被忽略。
3.信息資產(chǎn)論
信息資產(chǎn)論的觀點(diǎn)傾向?qū)⒋髷?shù)據(jù)從狹隘的技術(shù)論中抽離出來,側(cè)重于對大數(shù)據(jù)進(jìn)行新模式的處理從而將其變成有更強(qiáng)決策力和發(fā)現(xiàn)力的經(jīng)過優(yōu)化屬于某主體的信息資產(chǎn)。將大數(shù)據(jù)看作資產(chǎn)強(qiáng)調(diào)了其權(quán)利歸屬,而產(chǎn)生信息資產(chǎn)滿足知識產(chǎn)權(quán)對客體屬于無形財(cái)產(chǎn)的要求。
1.數(shù)據(jù)共享性對知識產(chǎn)權(quán)專有性的挑戰(zhàn)
事實(shí)上,“大數(shù)據(jù)”指使用大量數(shù)據(jù)解決計(jì)算密集型問題。由于涉及的成本,大數(shù)據(jù)最初僅限于政府機(jī)構(gòu)或大型學(xué)術(shù)機(jī)構(gòu),這些機(jī)構(gòu)可以獲得最先進(jìn)的計(jì)算資源,擁有計(jì)算能力并試圖解決諸如預(yù)測天氣模式或繪制DNA測序等復(fù)雜的挑戰(zhàn)。然而,在上世紀(jì)80年代和90年代,某些消費(fèi)行業(yè),如電話公司和信用卡供應(yīng)商,學(xué)會了挖掘他們龐大的通話記錄數(shù)據(jù)庫,以找到“掘金”的信息。微妙的趨勢和匯總的統(tǒng)計(jì)數(shù)據(jù)讓市場分析人士了解到如何為他們的服務(wù)定價(jià),或者預(yù)測客戶的出行及消費(fèi)意向。
綜上,大數(shù)據(jù)的產(chǎn)生基于兩種情形,一種是基于對自然科學(xué)觀測的數(shù)據(jù),另一種是基于每個(gè)人都是數(shù)據(jù)單獨(dú)的生產(chǎn)者產(chǎn)生的數(shù)據(jù)?,F(xiàn)如今多國提出把科學(xué)數(shù)據(jù)實(shí)現(xiàn)開放與共享,避免了信息不對稱帶來的停滯,創(chuàng)造出更多的科研價(jià)值和經(jīng)濟(jì)利益。對于國家和科學(xué)機(jī)構(gòu)來說,數(shù)據(jù)的共享意味著節(jié)約成本和雙贏,單獨(dú)的數(shù)據(jù)本身并不能以公開換壟斷的方式獲得知識產(chǎn)權(quán)。
而對于后一種情形,一般是由各類主體在某一平臺完成數(shù)據(jù)的產(chǎn)生,平臺由其與主體之間的協(xié)議獲取數(shù)據(jù),這些數(shù)據(jù)不屬于公共利益的范疇,故在理論上,可以版權(quán)權(quán)益的方式對其保護(hù)。但在實(shí)踐中,使用版權(quán)方法卻是行不通的。所有用戶生成的數(shù)據(jù)、在網(wǎng)上公開發(fā)布的圖片、視頻或其他創(chuàng)作都是受版權(quán)保護(hù)的。但這種版權(quán)從未真正使用過,更重要的是,所有用戶生成內(nèi)容的價(jià)值在于使用它。用戶生成的內(nèi)容,為了有價(jià)值,必須自由地復(fù)制和粘貼,創(chuàng)建衍生品,并且,從根本上來說是共享的。這與版權(quán)試圖實(shí)現(xiàn)的一種有限的、受控的發(fā)行和復(fù)制系統(tǒng)背道而馳。
2.數(shù)據(jù)分享無國界要求對知識產(chǎn)權(quán)地域性的挑戰(zhàn)
知識產(chǎn)權(quán)具有極強(qiáng)的地域性,只能在授予其權(quán)利的國家范圍內(nèi)受到法律的保護(hù),具體體現(xiàn)在權(quán)利的取得、訴訟管轄和法律適用等方面。而如今互聯(lián)網(wǎng)已將地球變?yōu)榈厍虼?,隨著Amazon和谷歌提供的云存儲和處理服務(wù)的出現(xiàn),再加上Hadoop等大型開源數(shù)據(jù)庫,極大地降低了捕獲、存儲大量數(shù)據(jù)的成本,加快了數(shù)據(jù)的傳播,再加上數(shù)據(jù)傳播范圍廣、成本低,使得難以準(zhǔn)確界定出數(shù)據(jù)產(chǎn)生的地域歸屬、傳播的范圍、受到侵害的程度,也往往很難舉證,就更談不上后一步的法律適用問題。這些特征嚴(yán)重的動搖了知識產(chǎn)權(quán)的地域性。
3.數(shù)據(jù)更新速度快對知識產(chǎn)權(quán)時(shí)間性的挑戰(zhàn)
為了持續(xù)的有效性,大數(shù)據(jù)算法必須不斷調(diào)整,以具有相關(guān)性和業(yè)務(wù)價(jià)值。大數(shù)據(jù),顧名思義,就是不斷改變其體積、來源、速度和行為的數(shù)據(jù)。本文所說的知識產(chǎn)權(quán)時(shí)間性包括,申請保護(hù)的時(shí)間和保護(hù)的周期。大數(shù)據(jù)分析和算法的動態(tài)開發(fā)周期可能沒法受到專利法的保護(hù)。
根據(jù)《民法總則》第一百二十七條:“法律對數(shù)據(jù)、網(wǎng)絡(luò)虛擬財(cái)產(chǎn)的保護(hù)有規(guī)定的,依照其規(guī)定”。可見我國對數(shù)據(jù)保護(hù)指向性模糊,只作出了原則性規(guī)定,司法實(shí)踐中常根據(jù)案情適用其他法律。然而在具體研究時(shí)應(yīng)考慮到大數(shù)據(jù)本身的開放性和流動性,不可給予過強(qiáng)的排他權(quán),對大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展造成阻礙②。
數(shù)據(jù)是一種信息,著作權(quán)保護(hù)的是信息的編排方式。如果數(shù)據(jù)只有一種表述是可能的,那么就沒有著作權(quán)保護(hù),因?yàn)闆]有創(chuàng)造性的選擇,這就是著作權(quán)理論所闡述的。從邏輯上講,這意味著大多數(shù)數(shù)據(jù)將在著作權(quán)之外。任何由機(jī)器或傳感器產(chǎn)生的數(shù)據(jù)、任何統(tǒng)計(jì)或數(shù)學(xué)數(shù)據(jù)都不會被著作權(quán)所保護(hù)。但是大數(shù)據(jù)是復(fù)雜的,是對原始數(shù)據(jù)進(jìn)行整合、挖掘、加工后形成的,其獲取、處理和應(yīng)用都不容易被達(dá)到。
大數(shù)據(jù)的處理流程可以分為三個(gè)階段,第一階段是數(shù)據(jù)預(yù)處理,將未加工的原始數(shù)據(jù)轉(zhuǎn)化為適合處理和管理的形式,如數(shù)據(jù)庫、數(shù)據(jù)倉庫等,這一階段的數(shù)據(jù)內(nèi)容在司法實(shí)踐中常用著作權(quán)進(jìn)行保護(hù)。第二個(gè)階段是數(shù)據(jù)挖掘,分析提取數(shù)據(jù)中隱藏的過去未知的目的信息,目的信息是指進(jìn)行數(shù)據(jù)的檢索、收集、分析、挖掘時(shí)我們意欲發(fā)現(xiàn)的事實(shí)、關(guān)系等,彼此孤立的數(shù)據(jù)通過服務(wù)于同一目的信息而相互勾連成為大數(shù)據(jù)。被目的信息聚攏的大數(shù)據(jù)才具有成為法律客體的資格③。第三階段是數(shù)據(jù)后處理,將處理后的數(shù)據(jù)可視化,轉(zhuǎn)變?yōu)榉奖銖牟煌暯翘讲榈男问?,其形式可以其特殊的編排或軟件的方式體現(xiàn),通過著作權(quán)進(jìn)行保護(hù)。
傳統(tǒng)的數(shù)據(jù)庫和存儲專利通常側(cè)重于硬件(例如,高通量網(wǎng)絡(luò)存儲系統(tǒng))或用于實(shí)現(xiàn)存儲和訪問數(shù)據(jù)的事務(wù)或分析過程的數(shù)據(jù)庫管理軟件系統(tǒng)。但隨著企業(yè)轉(zhuǎn)向標(biāo)準(zhǔn)的、現(xiàn)成的(通常是開源的)平臺和云端供應(yīng)的硬件和存儲,新一代公司創(chuàng)造的知識產(chǎn)權(quán)變得更加模糊和難以識別,甚至更難獲得專利。
在“大數(shù)據(jù)”環(huán)境中識別潛在的可專利性主題的一種方法是將這個(gè)過程分解為三個(gè)階段提取整合、分析和應(yīng)用。舉例來說,一個(gè)大型超市,從其銷售點(diǎn)、供應(yīng)鏈和客戶數(shù)據(jù)庫系統(tǒng)收集內(nèi)部數(shù)據(jù),以及來自市場研究公司、社交媒體網(wǎng)站、第三方支付公司的外部數(shù)據(jù)。每天收集和整理這些數(shù)據(jù)無疑是一個(gè)挑戰(zhàn)。無論是通過自定義編程接口,專有數(shù)據(jù)服務(wù),還是其他自定義數(shù)據(jù)攝取過程,僅僅將所有數(shù)據(jù)一次性地放到一個(gè)地方,以及允許不同來源的數(shù)據(jù)一起使用一個(gè)格式,都可以成為專利的沃土。因此需要一個(gè)系統(tǒng),測量數(shù)據(jù)結(jié)構(gòu),以各種格式和使用各種分析過程生成規(guī)范化、結(jié)構(gòu)化的元數(shù)據(jù)。組織和分析數(shù)據(jù)涉及的軟件都是可能獲得專利和版權(quán)的,運(yùn)行這些程序的計(jì)算機(jī)處理器也可以獲得專利。
根據(jù)《反不正當(dāng)競爭法》,不為公眾所知悉,能為權(quán)利人帶來經(jīng)濟(jì)利益、具有實(shí)用性,并且權(quán)利人采取了保密措施,可以作為商業(yè)秘密進(jìn)行保護(hù)。但是若對于大數(shù)據(jù)沒有采取保密措施,同時(shí)又不能作為著作權(quán)來保護(hù)的已經(jīng)公開的數(shù)據(jù),可根據(jù)《反不正當(dāng)競爭法》第二條一般性的條款進(jìn)行保護(hù)。
前不久,某手機(jī)向用戶提供了諸多人工智能的服務(wù),包括根據(jù)微信聊天內(nèi)容加載顯示地址、天氣、出行等信息,微信對此舉動表示不滿,向工信部提出了投訴。這其中涉及的法律問題是:該手機(jī)收集用戶數(shù)據(jù)是否合法,有沒有構(gòu)成不正當(dāng)競爭,甚至是華為的做法是否侵犯了用戶的隱私權(quán)。
隱私權(quán)本文暫且不談,主要說說前兩個(gè)法律問題。根據(jù)《網(wǎng)絡(luò)安全法》第四十一條④,如果該手機(jī)在收集用戶數(shù)據(jù)時(shí)和用戶簽訂了用戶協(xié)議,且提取的數(shù)據(jù)是和提供的服務(wù)相關(guān)的,也沒有在用戶不允許的情況下將信息提供給第三方使用,那么就可以初步判斷出華為收集用戶數(shù)據(jù)是合法的。至于有沒有構(gòu)成不正當(dāng)競爭可以從以下方面入手:它的做法是否使微信的增值業(yè)務(wù)受到損害;是否具有正當(dāng)性。微信可以舉證華為損害了其業(yè)務(wù)的收入,使用戶本應(yīng)從微信上使用的功能下載的軟件發(fā)生了轉(zhuǎn)移。然而微信似乎沒有有力證據(jù)證明華為的侵權(quán)問題,以至于沒有起訴而是向工信部提出了投訴。
企業(yè)在通過OpenAPI模式獲取用戶信息時(shí),應(yīng)堅(jiān)持“用戶授權(quán)”+“平臺授權(quán)”+“用戶授權(quán)”的三重授權(quán)原則⑤。大數(shù)據(jù)的提取和挖掘需要投入大量人力物力,大數(shù)據(jù)的開發(fā)者為此付出高額時(shí)間成本和經(jīng)濟(jì)成本,若放任他人不經(jīng)允許無償利用這些開發(fā)成果,將會形成不良競爭,讓企業(yè)疲于開發(fā)創(chuàng)新,而是坐享其成。不過,在適用反不正當(dāng)競爭法進(jìn)行保護(hù)時(shí)應(yīng)當(dāng)注意一定的限度,不可因保護(hù)影響到大數(shù)據(jù)的交易和合理利用,阻礙整個(gè)大數(shù)據(jù)市場的迅速發(fā)展。
在數(shù)據(jù)中創(chuàng)造新的產(chǎn)權(quán)需要認(rèn)真考慮對創(chuàng)新的不利影響,如所有者和使用者的權(quán)利,這將是確保公眾對獲取和使用數(shù)據(jù)的必要條件??紤]到快速變化的數(shù)據(jù)環(huán)境,提出數(shù)據(jù)所有權(quán)可能為時(shí)過早。這樣做很可能造成不確定性,增加交易成本,并對創(chuàng)新和更廣泛的公眾利益產(chǎn)生不利影響。
“數(shù)據(jù)”是一個(gè)很難定義的概念,我國現(xiàn)今談到的“大數(shù)據(jù)”不單單是數(shù)據(jù)本身,更多應(yīng)當(dāng)將其看作一個(gè)集合性權(quán)利。通過著作權(quán)對匯編作品的定義只能保護(hù)數(shù)據(jù)匯編結(jié)構(gòu)無法保護(hù)“大數(shù)據(jù)”的內(nèi)在價(jià)值。而反不正當(dāng)競爭法和商業(yè)秘密保護(hù)“大數(shù)據(jù)”存在其固有弊端,只能起到補(bǔ)充保護(hù)數(shù)據(jù)本身價(jià)值的作用。因此針對“大數(shù)據(jù)”的特點(diǎn)應(yīng)當(dāng)更好地完善數(shù)據(jù)的知識產(chǎn)權(quán)法保護(hù)模式,在利用反不正當(dāng)競爭法和商業(yè)秘密補(bǔ)充保護(hù)“大數(shù)據(jù)”實(shí)質(zhì)內(nèi)容的情況下,明確著作權(quán)法中“大數(shù)據(jù)”匯編作品的獨(dú)創(chuàng)性標(biāo)準(zhǔn)以便充分保護(hù)“大數(shù)據(jù)”的表現(xiàn)形式,同時(shí)賦予“大數(shù)據(jù)”集合特殊權(quán)利保護(hù)有實(shí)質(zhì)性投入的“大數(shù)據(jù)”集合內(nèi)容本身⑥。
注釋:
①來自網(wǎng)絡(luò)http://www.sohu.com/a/125757548_580299.
②劉仁.《大數(shù)據(jù)呼喚知識產(chǎn)權(quán)護(hù)航》,《中國知識產(chǎn)權(quán)報(bào)》,2017年7月28日,第009版.
③王廣震.《大數(shù)據(jù)的法律性質(zhì)探析——以知識產(chǎn)權(quán)法為研究進(jìn)路》,《重慶郵電大學(xué)學(xué)報(bào)》,2017年7月,第29卷第4期.
④《網(wǎng)絡(luò)安全法》第四十一條:網(wǎng)絡(luò)運(yùn)營者收集、使用個(gè)人信息,應(yīng)當(dāng)遵循合法、正當(dāng)、必要的原則,公開收集、使用規(guī)則,明示收集、使用信息的目的、方式和范圍,并經(jīng)被收集者同意.⑤來自網(wǎng)頁http://www.sohu.com/a/124906553_608782.
⑥彭敏.《“大數(shù)據(jù)”時(shí)代的知識產(chǎn)權(quán)法保護(hù)》.《傳播與版權(quán)》,2016年第6期.
[1]劉仁.大數(shù)據(jù)呼喚知識產(chǎn)權(quán)護(hù)航.中國知識產(chǎn)權(quán)報(bào),2017(7).
[2]王廣震.大數(shù)據(jù)的法律性質(zhì)探析——以知識產(chǎn)權(quán)法為研究進(jìn)路.重慶郵電大學(xué)學(xué)報(bào),2017(7).
[3]鄧靈斌,余玲.大數(shù)據(jù)時(shí)代數(shù)據(jù)共享與知識產(chǎn)權(quán)保護(hù)的沖突與協(xié)調(diào).圖書館論壇.2015(6).
[4]彭敏.大數(shù)據(jù)時(shí)代的知識產(chǎn)權(quán)法保護(hù).傳播與版權(quán).2016(6).
[5]來自網(wǎng)頁http://www.sohu.com/a/125757548_580299.
[6]來自網(wǎng)頁http://www.sohu.com/a/124906553_608782.
作者簡介:
程文杰,桂林電子科技大學(xué)法學(xué)院,碩士研究生,研究方向:知識產(chǎn)權(quán)法。