屈一平
著名基因組專家汪建說,將一個(gè)人從懷孕第一周開始,一直到生下來的整個(gè)過程全部用基因大數(shù)據(jù)模擬記錄下來,一千年以后很容易復(fù)活。
汪建的陳述背景是,大數(shù)據(jù)背景下的基因技術(shù)。正如1970年一個(gè)美國學(xué)者安德森說過的“多帶來不同”,大數(shù)據(jù)正在成為未來稀有資源。
然而,面對海量數(shù)據(jù),應(yīng)用成了難題,就如斯坦福大學(xué)的Trevor Hastie所說,“在稻草里找一根針”。 你可知道這“稻草”何其多?光纖傳送網(wǎng)與寬帶信息網(wǎng)專家鄔賀銓院士曾經(jīng)這樣比喻,如果把2011年獲得的全世界數(shù)據(jù)量裝到iPod上的話,可裝滿575億個(gè)iPod。把這些iPod當(dāng)磚用,可壘起兩座中國長城。
據(jù)統(tǒng)計(jì),全球各個(gè)行業(yè)的數(shù)據(jù)存儲量,每年都在以59%的速度暴增。由于缺乏規(guī)范的數(shù)據(jù)共享和交易渠道,不同行業(yè)間很難形成數(shù)據(jù)互利共享,數(shù)據(jù)交易平臺乃至交易所也就成為了迫切需求。
“很多企業(yè)愿意將自己的數(shù)據(jù)納入政府的統(tǒng)計(jì)體系或納入政府的統(tǒng)計(jì)數(shù)據(jù)的發(fā)布體系。但是不太愿意提供數(shù)據(jù)的收集、方法和算法這些過程性的信息?!眹医y(tǒng)計(jì)局統(tǒng)計(jì)科學(xué)研究所副所長許亦頻坦言,政府統(tǒng)計(jì)應(yīng)用大數(shù)據(jù)面臨數(shù)據(jù)割裂化難題。
有沒有這樣一個(gè)平臺,可以提供經(jīng)過審核的“干凈”數(shù)據(jù),一方面不侵犯個(gè)人隱私和國家安全,另一方面可以合法提供各類企業(yè)個(gè)人所需要的數(shù)據(jù)呢?
“2013年中國各個(gè)行業(yè)產(chǎn)生的數(shù)據(jù)孤島,各個(gè)領(lǐng)域的數(shù)據(jù)被割裂化?!敝嘘P(guān)村大數(shù)據(jù)交易產(chǎn)業(yè)聯(lián)盟秘書長、數(shù)海科技董事長秦翯告訴本刊記者,數(shù)據(jù)割裂化體現(xiàn)在各類活動(dòng)的數(shù)據(jù)都保存在不同的領(lǐng)域:金融活動(dòng)數(shù)據(jù)在銀行,搜索數(shù)據(jù)在百度,電子商務(wù)數(shù)據(jù)在阿里巴巴,發(fā)微博微信等數(shù)據(jù)都保存在不同公司、不同企業(yè)、不同機(jī)構(gòu)手中。另外,各類數(shù)據(jù)輸出的格式五花八門,企業(yè)行業(yè)或者個(gè)人如果想應(yīng)用并不容易。
9月13日,在北京清華同方科技園,記者目睹了這一國內(nèi)首家重點(diǎn)面向大數(shù)據(jù)的數(shù)據(jù)交易服務(wù)平臺的運(yùn)行。通過數(shù)據(jù)API的錄入、檢索、調(diào)用,提供數(shù)據(jù)交易和使用的場所。自今年2月底試運(yùn)行以來,中關(guān)村數(shù)海大數(shù)據(jù)交易平臺已產(chǎn)生7532筆交易,交易額達(dá)842萬元,整合了京東、新浪、天翼等免費(fèi)數(shù)據(jù)商品千余條,收費(fèi)數(shù)據(jù)近萬條,收錄國外API數(shù)據(jù)達(dá)數(shù)千項(xiàng)。
面對這一新興事物,在相關(guān)個(gè)人隱私和國家安全法律法規(guī)欠缺的前提下,大數(shù)據(jù)如何買賣?交易機(jī)制是什么?交易的主體是誰?存在哪些機(jī)遇和挑戰(zhàn)?
買水買電買數(shù)據(jù)
“一個(gè)企業(yè)有沒有償還貸款的能力?要靠數(shù)據(jù)說話?!焙衿照餍殴臼且患宜綘I企業(yè),主要為企業(yè)、個(gè)人提供信用檔案等信用服務(wù)。董事長魯西諾告訴《小康》記者,在加盟大數(shù)據(jù)交易平臺之前,主要通過自有技術(shù)軟件在網(wǎng)上查詢,與政府部門進(jìn)行數(shù)據(jù)合作等傳統(tǒng)方式獲取企業(yè)數(shù)據(jù),從而為企業(yè)客戶出具銀行貸款所需的信用評級報(bào)告。
今年上半年,厚普征信公司從大數(shù)據(jù)交易平臺購買了數(shù)據(jù)產(chǎn)品,使用交易平臺四個(gè)月后的魯西諾儼然成了大數(shù)據(jù)半個(gè)行家,他透露,“企業(yè)在交易、經(jīng)濟(jì)生活中產(chǎn)生的金融痕跡、物流痕跡、納稅痕跡、完稅數(shù)據(jù)等各種數(shù)字痕跡,都有助于我們來判斷它是否有創(chuàng)新力和償還貸款的能力。數(shù)據(jù)越豐富,判斷結(jié)果越精準(zhǔn)。”
魯西諾預(yù)計(jì),公司的數(shù)據(jù)今后將有60%到70%來源于傳統(tǒng)的自有途徑,30%到40%將來自大數(shù)據(jù)交易平臺。
與在線交易不同的是,對于完全不懂大數(shù)據(jù)的傳統(tǒng)企業(yè)來說,平臺的托管交易服務(wù)基本是一站式,賣方只需要把數(shù)據(jù)交給平臺,具體的大數(shù)據(jù)處理分析等技術(shù)難題就全部托管了。
北京途牛國際旅行社有限公司副總裁趙越給記者描述了“托管數(shù)據(jù)”的美景:通過對企業(yè)自身數(shù)據(jù)的分析,并和平臺其他數(shù)據(jù)進(jìn)行多源融合和補(bǔ)充,形成對途牛供應(yīng)商和平臺消費(fèi)者的多達(dá)10余種的互聯(lián)網(wǎng)金融業(yè)務(wù)。
那么,目前為止大數(shù)據(jù)的買賣方都是些什么人?據(jù)秦翯介紹,目前大數(shù)據(jù)交易平臺的成員包括電信運(yùn)營商、互聯(lián)網(wǎng)金融企業(yè)、軟件企業(yè)、電子商務(wù)企業(yè)、咨詢公司、風(fēng)投等不同行業(yè)企業(yè),具體來說,天翼、用友、京東、易觀、紅嶺創(chuàng)投、聯(lián)想等公司都屬平臺成員范疇。
中關(guān)村數(shù)海大數(shù)據(jù)交易平臺,在中國最大的數(shù)據(jù)聚集地中關(guān)村數(shù)據(jù)交易平臺,引起了政府相關(guān)部門的關(guān)注。據(jù)秦翯透露,目前他們已與指導(dǎo)單位國家統(tǒng)計(jì)局簽訂戰(zhàn)略合作協(xié)議,就政府大數(shù)據(jù)平臺的建設(shè)提供技術(shù)支持。
“如今絕大多數(shù)大數(shù)據(jù)是以各種形式分散地存在于政府部門、電商企業(yè)、電信運(yùn)營商和互聯(lián)網(wǎng)公司,數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、口徑比較雜亂,數(shù)據(jù)間難以銜接,這也是限制大數(shù)據(jù)開發(fā)和共享的一個(gè)障礙。”國家統(tǒng)計(jì)局統(tǒng)計(jì)科學(xué)研究所副所長許亦頻表示,數(shù)據(jù)的權(quán)威性和數(shù)據(jù)的質(zhì)量是建立在數(shù)據(jù)的公開性基礎(chǔ)之上的。目前看數(shù)據(jù)公開性的不足是制約政府統(tǒng)計(jì)應(yīng)用大數(shù)據(jù)的主要障礙。
秦翯向記者透露,政府的大數(shù)據(jù)開放平臺系統(tǒng),包括支持多種格式的數(shù)據(jù)上傳,以API接口的形式開放,系統(tǒng)一旦建成,部署起來非常快速,基本一天之內(nèi)就可以完成整個(gè)系統(tǒng)平臺的建設(shè)。
大數(shù)據(jù)怎么買賣?
2013年4月,一位名叫Federico Zannier的美國人火了,因?yàn)樗獙?個(gè)月積攢的大約7個(gè)GB的隱私數(shù)據(jù)賣掉,而且已經(jīng)成功炒到了1100美元。
據(jù)Zannier自己統(tǒng)計(jì),7GB的數(shù)據(jù)中共有280萬行文本信息,算下來有1500本書。軟件記錄的鼠標(biāo)點(diǎn)擊次數(shù)75.5萬次,電腦攝像頭自動(dòng)拍照2.1萬張圖片,總計(jì)1.9GB容量;以及約2萬張屏幕截圖,總計(jì)1.7GB容量。
“這僅僅是個(gè)極端的個(gè)例,不過可以看出大數(shù)據(jù)的商品屬性?!鼻芈G告訴本刊記者,目前中國的數(shù)據(jù)交易現(xiàn)狀是地下交易不規(guī)范,地上交易空白,中關(guān)村大數(shù)據(jù)交易產(chǎn)業(yè)聯(lián)盟的交易平臺是在充分保證用戶隱私和國家利益安全基礎(chǔ)之上,建立起規(guī)范的數(shù)據(jù)交易市場。
那么,大數(shù)據(jù)時(shí)代如何將“數(shù)據(jù)”變成商品,如何實(shí)現(xiàn)有效的數(shù)據(jù)交換?縱觀國際市場,記者發(fā)現(xiàn)從2008年開始,大數(shù)據(jù)交易市場已經(jīng)初見端倪,“數(shù)據(jù)市場”、“數(shù)據(jù)銀行”,甚至“數(shù)據(jù)公約”,交易市場在國外并非新鮮事。endprint
在上海擁有辦事處的美國Factual公司成立于2008年,不僅向大公司提供數(shù)據(jù),同時(shí)也面向規(guī)模較小的軟件開發(fā)商,每一條信息都有17到40條的相關(guān)描述。按浮動(dòng)價(jià)格向公司和獨(dú)立軟件開發(fā)商出售數(shù)據(jù),小規(guī)模的數(shù)據(jù)提供是免費(fèi)的,大型客戶需要支付的費(fèi)用則會達(dá)到成百上千萬美元。包括Facebook、CitySearch、AT&T及其他一些公司都會使用Factual來獲取相關(guān)信息。
2013年4月,日本富士通公司也宣布建立自己的“大數(shù)據(jù)”交易市場“Data plaza”,并將交易中介服務(wù)培育為主力業(yè)務(wù)之一,計(jì)劃在2016年之前將參與企業(yè)增加至千家左右。
一提到大數(shù)據(jù)買賣,似乎個(gè)個(gè)“談隱私色變”。談及數(shù)據(jù)買賣與個(gè)人隱私的關(guān)系,作為第一個(gè)敢吃螃蟹的人,秦翯就如何充分保障個(gè)人隱私受到保護(hù),給記者展示了“法規(guī)”+“數(shù)據(jù)脫敏”組合拳。
首先,中國第一份大數(shù)據(jù)交易規(guī)則——《中關(guān)村數(shù)海大數(shù)據(jù)交易平臺規(guī)則(征求意見稿)》(以下簡稱《規(guī)則》)在6月25日中關(guān)村大數(shù)據(jù)交易產(chǎn)業(yè)聯(lián)盟專家顧問委員會宣布成立當(dāng)天同步推出?!兑?guī)則》從交易平臺、交易主體、交易對象三個(gè)方面規(guī)范交易市場行為,并對在線數(shù)據(jù)交易、離線數(shù)據(jù)交易、托管數(shù)據(jù)交易等三種數(shù)據(jù)交易模式進(jìn)行規(guī)范。
個(gè)人隱私的信息使用方面,參考了《全國人大關(guān)于加強(qiáng)網(wǎng)絡(luò)信息保護(hù)的決定》、《互聯(lián)網(wǎng)信息服務(wù)管理辦法》、《電信和互聯(lián)網(wǎng)用戶個(gè)人信息保護(hù)規(guī)定》等法律法規(guī)。其中第三節(jié)交易對象明確:禁止交易的數(shù)據(jù)包括涉及國家秘密和個(gè)人信息等法律保護(hù)的數(shù)據(jù),禁止在交易平臺交易。
那么如何從操作層面上,落實(shí)這一隱私保護(hù)的規(guī)定?
“對于數(shù)據(jù)安全方面的問題,平臺也已經(jīng)有所準(zhǔn)備?!鼻芈G從技術(shù)角度給記者演示,通過數(shù)據(jù)脫敏技術(shù),對數(shù)據(jù)源的屬性進(jìn)行描述和標(biāo)注,如果涉及到敏感數(shù)據(jù)的調(diào)用,將進(jìn)行實(shí)時(shí)的數(shù)據(jù)清洗、技術(shù)屏蔽、審核處理,最終提供給需求方的數(shù)據(jù)也將在完成安全測試之后,再行提供。即使調(diào)用成功,也會在使用次數(shù)用盡或使用期限到期之后,對權(quán)限進(jìn)行收回。這一系列流程,不僅避免了用戶敏感數(shù)據(jù)的流出,也照顧到了開發(fā)者在線交易的便捷性。
數(shù)據(jù)究竟該賣多少錢?定價(jià)也成為人們關(guān)注的熱點(diǎn)。
“第一步就是給數(shù)據(jù)定價(jià),首先是數(shù)據(jù)商品化,促進(jìn)數(shù)據(jù)的流通。”秦翯告訴記者,平臺初步采取自由定價(jià)的方式進(jìn)行交易。如果某個(gè)企業(yè)、機(jī)構(gòu)想要出售自己掌握的數(shù)據(jù),在確保數(shù)據(jù)不涉及個(gè)人隱私、不危害國家安全,同時(shí)在獲得數(shù)據(jù)所有方授權(quán)的情況下,平臺會提供參考價(jià),但并不干涉最終的成交價(jià)格。此后,通過數(shù)據(jù)購買用戶的反饋,平臺會對定價(jià)規(guī)則進(jìn)行逐步調(diào)節(jié)、探索。
在交易過程中,平臺并不存儲任何一家提供方的數(shù)據(jù),而只是扮演一個(gè)交易平臺和服務(wù)通道的角色,“當(dāng)使用時(shí)才會接通”。這不僅與“數(shù)據(jù)即資產(chǎn)”的業(yè)務(wù)出發(fā)點(diǎn)相一致,而且很好地規(guī)避了平臺方可能存在的數(shù)據(jù)監(jiān)管風(fēng)險(xiǎn)。
付費(fèi)模式包括兩種:第一種是包月,第二種是按調(diào)用次數(shù),完成付費(fèi)后即可獲得平臺和數(shù)據(jù)提供方的使用密鑰。目前,數(shù)海平臺的交易對象,僅限數(shù)據(jù)的使用權(quán)。若雙方出現(xiàn)數(shù)據(jù)質(zhì)量的爭議,經(jīng)交易平臺查證屬實(shí)的,此平臺將停止雙方數(shù)據(jù)交易服務(wù),并退還數(shù)據(jù)買方貨款,其間產(chǎn)生的其他損失由賣方承擔(dān)。
據(jù)了解,此次成立的中關(guān)村大數(shù)據(jù)交易產(chǎn)業(yè)聯(lián)盟專家顧問委員會由國家統(tǒng)計(jì)局黨組書記、局長馬建堂擔(dān)任名譽(yù)顧問,國家統(tǒng)計(jì)局總統(tǒng)計(jì)師鮮祖德、中關(guān)村管委會主任郭洪、中國科學(xué)院院士鄂維南院士、北京銀行副行長許寧躍等70余人組成。
秦翯表示“委員會將根據(jù)相關(guān)法律法規(guī),對聯(lián)盟成員在數(shù)據(jù)交易模式創(chuàng)新、隱私和數(shù)據(jù)安全保護(hù)、數(shù)據(jù)交易規(guī)則建立等方面發(fā)揮重要的指導(dǎo)作用”,這也是保證交易隱私的另一個(gè)補(bǔ)充力量。
呼吁公開度和透明度
“這個(gè)行業(yè)在國內(nèi)和國外環(huán)境不一樣,我們需要花很多精力去嘗試描述這個(gè)行業(yè)的規(guī)范,包括與政府的相關(guān)主管部門去溝通等,這將是一個(gè)不斷完善的過程。”
盡管大數(shù)據(jù)交易在國外已經(jīng)趨于成熟,然而,作為中國首家大數(shù)據(jù)交易平臺,中關(guān)村數(shù)海大數(shù)據(jù)交易平臺目前遇到了困難。秦翯表示,由于國內(nèi)的大數(shù)據(jù)交易行業(yè)還處于初級階段,且較不規(guī)范,所以他們還要承擔(dān)前期的普及推廣工作。
中國潛在的大數(shù)據(jù)資源非常豐富,從電信、金融、社保、房地產(chǎn)、醫(yī)療、政務(wù)、交通、物流、征信體系等部門,到電力、石化、氣象、教育、制造等傳統(tǒng)行業(yè),再到電子商務(wù)平臺、社交網(wǎng)站等,覆蓋廣泛。
“預(yù)計(jì)到2016年,中關(guān)村大數(shù)據(jù)對產(chǎn)業(yè)的帶動(dòng)規(guī)模將超過1萬億?!敝嘘P(guān)村管委會副主任楊建華告訴記者,“近年來中關(guān)村在個(gè)性化醫(yī)療、數(shù)字金融、智能交通、精準(zhǔn)營銷等基于大數(shù)據(jù)的新型商業(yè)模式不斷涌現(xiàn)。涵蓋了包括基礎(chǔ)設(shè)施、數(shù)據(jù)資源、數(shù)據(jù)應(yīng)用等關(guān)鍵環(huán)節(jié)的完整大數(shù)據(jù)產(chǎn)業(yè)鏈,形成了中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)集群。
政府所出臺的公開數(shù)據(jù)措施及政策等仍然有待加強(qiáng),已有的公開信息的政策僅有《中華人民共和國政府信息公開條例》,之后基本沒有在公開政府的相關(guān)信息和開放數(shù)據(jù)中有具體政策的措施。
“最大的數(shù)據(jù)不是在政府那里,數(shù)量上僅僅占7%~8%,但是僅僅這些,卻占到最有效數(shù)據(jù)的80%,政府不是不愿意拿,該拿的都拿出來了,但是管理密集度太高,越密集價(jià)值越高,挖掘的價(jià)值太高??梢韵茸鐾饷娲罅繑?shù)據(jù)的挖掘,要抓住應(yīng)用。企業(yè)數(shù)據(jù)核心資源是自身的寶貝,都不愿意拿出來。政府在管理上如果沒有主動(dòng)引導(dǎo)可能不行?!敝袊ㄐ艑W(xué)會秘書長張新生一直關(guān)注大數(shù)據(jù)交易,他告訴記者,大數(shù)據(jù)交易需要分步驟進(jìn)行。
困擾著首家大數(shù)據(jù)交易平臺的另一個(gè)難題是,他們呼吁對公眾的引導(dǎo),希望在陽光之下,用更健康、更簡明、全民都可以接受的方式來促進(jìn)這個(gè)行業(yè)的發(fā)展。
據(jù)中關(guān)村大數(shù)據(jù)交易產(chǎn)業(yè)聯(lián)盟副秘書長魏凱介紹,《規(guī)則》的頒布旨在推動(dòng)行業(yè)自律,打造完善、健康、有序的交易產(chǎn)業(yè)鏈條,從交易平臺、交易主體、交易對象三個(gè)方面規(guī)范交易市場行為,對交易市場內(nèi)的在線數(shù)據(jù)交易、離線數(shù)據(jù)交易、托管數(shù)據(jù)交易等三種數(shù)據(jù)交易模式進(jìn)行規(guī)范。
在大數(shù)據(jù)國家戰(zhàn)略缺位、法律缺失的背景下,中關(guān)村數(shù)海大數(shù)據(jù)交易平臺在探索著大數(shù)據(jù)交易的先行規(guī)則與道路,就如交易平臺頁面呈現(xiàn)的那樣,一束光在橋面上伸向遠(yuǎn)方。endprint