鄒傳偉
上海萬向區(qū)塊鏈股份公司,上海 200085
2020年4月,中共中央、國務(wù)院發(fā)布《關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》,提出加快培育數(shù)據(jù)要素市場。2021年3月,北京國際大數(shù)據(jù)交易所成立。《個人信息保護法(草案)》和《數(shù)據(jù)安全法》分別于2020年10月和2021年6月公布。數(shù)據(jù)要素的有效配置是數(shù)字經(jīng)濟發(fā)展的關(guān)鍵,也是理解個人隱私保護、互聯(lián)網(wǎng)平臺競爭、大型科技企業(yè)監(jiān)管和金融科技發(fā)展的關(guān)鍵,對于AI發(fā)展也至關(guān)重要。數(shù)據(jù)要素市場應(yīng)采取什么樣的組織形式?數(shù)據(jù)要素適用什么樣的估值框架?這是當前政府管理和行業(yè)發(fā)展中迫切需要回答的兩個重要問題。
在數(shù)據(jù)要素市場的組織形式方面,戴炳榮等人[1]提出了數(shù)據(jù)資產(chǎn)的標準化思路以及數(shù)據(jù)資產(chǎn)管理的通用過程框架;葉雅珍等人[2]研究了數(shù)據(jù)資產(chǎn)的特點和需具備的條件,提出了數(shù)據(jù)資產(chǎn)化基本框架,包括數(shù)據(jù)資源確權(quán)、數(shù)據(jù)價值確認與質(zhì)量管控、數(shù)據(jù)裝盒入庫、貨幣計價與評估、數(shù)據(jù)資產(chǎn)折舊和增值的管理5個步驟;英國開放數(shù)據(jù)研究所(Open Data Institute,ODI)[3]提出了數(shù)據(jù)信托的概念;汪靖偉等人[4]提出了基于區(qū)塊鏈的數(shù)據(jù)市場框架,基于該框架實現(xiàn)了一個數(shù)據(jù)市場測試系統(tǒng),并證實了該框架的可行性和安全性。在數(shù)據(jù)要素的估值框架方面,上海德勤資產(chǎn)評估有限公司和阿里研究院[5],以及Bennett Institute for Public Policy[6]分別綜述了數(shù)據(jù)要素估值的主要方法,包括成本法、收入法、市場法和問卷測試法等,但他們認為這些方法都有缺陷;董祥千等人[7]提出了基于利潤最大化的數(shù)據(jù)資產(chǎn)價值評估模型,為參與者進入市場提供了理論參考依據(jù)。在數(shù)據(jù)要素市場的發(fā)展政策方面,于施洋等人[8]分析了我國深化數(shù)據(jù)要素市場化配置面臨的挑戰(zhàn);國家工業(yè)信息安全發(fā)展研究中心[9]提出了數(shù)據(jù)要素及數(shù)據(jù)要素市場的邊界,梳理了國內(nèi)外數(shù)據(jù)要素市場的發(fā)展現(xiàn)狀。
產(chǎn)權(quán)是一個基本的經(jīng)濟學(xué)概念。產(chǎn)權(quán)指一種可執(zhí)行的社會架構(gòu),該架構(gòu)決定經(jīng)濟資源如何被使用或擁有,包括:第一,使用經(jīng)濟資源的權(quán)利;第二,從經(jīng)濟資源中獲得收益的權(quán)利;第三,將經(jīng)濟資源轉(zhuǎn)移給他人、改變經(jīng)濟資源、放棄經(jīng)濟資源,以及損毀經(jīng)濟資源的權(quán)利。產(chǎn)權(quán)可以細分為所有權(quán)、占有權(quán)、支配權(quán)、使用權(quán)、收益權(quán)和處置權(quán)等“權(quán)利束”。Mas-Colell A等人[10]指出,產(chǎn)權(quán)界定是任何要素有效配置的前提。
然而,因為數(shù)據(jù)要素的特殊屬性,數(shù)據(jù)要素產(chǎn)權(quán)界定的難度大于其他生產(chǎn)要素。Mas-Colell A等人[10]從兩個維度對不同產(chǎn)品提出了分類標準。第一個維度是非競爭性,指在一個人消費某種產(chǎn)品時,不會減少其他人對該產(chǎn)品的消費。第二個維度是非排他性,指在一個人付費消費某種產(chǎn)品時,不能排除其他沒有付費的人消費這一產(chǎn)品,或者排除成本很高。按照這個分類,很多數(shù)據(jù)具有非競爭性和非排他性,屬于公共產(chǎn)品,可以由任何人為任何目的而自由使用、改造和分享。一些數(shù)據(jù)具有非競爭性和排他性,屬于準公共產(chǎn)品,比如收費媒體信息終端。只有很少的數(shù)據(jù)像一般產(chǎn)品那樣具有競爭性和排他性。
在實踐中,產(chǎn)權(quán)界定是法律和技術(shù)共同作用下的產(chǎn)物,一般先由法律確定產(chǎn)權(quán)的制度框架,再由技術(shù)來保證這些制度框架的可執(zhí)行性。例如,股東權(quán)益由公司法保障,在執(zhí)行中則離不開股權(quán)登記、托管、交易、結(jié)算和信息披露等方面的技術(shù)。數(shù)據(jù)要素也是如此。歐盟的《通用數(shù)據(jù)保護條例》(general data protection regulation,GDPR)引入了個人數(shù)據(jù)產(chǎn)權(quán)的精細維度,包括訪問權(quán)利、修改權(quán)利、刪除或被遺忘權(quán)利、可攜帶權(quán)利、有限授權(quán)和最小化采集原則、個人數(shù)據(jù)跨境傳輸條件以及數(shù)據(jù)控制者的告知義務(wù)等。我國的《數(shù)據(jù)安全法》和《個人信息保護法(草案)》的發(fā)布也出于類似目的。密碼學(xué)技術(shù)是數(shù)據(jù)安全的重要保障,基于可驗證計算、同態(tài)加密和安全多方計算等使數(shù)據(jù)“可用不可見”。
不同產(chǎn)權(quán)特征的數(shù)據(jù)要素適用不同的配置機制。例如,作為公共產(chǎn)品的數(shù)據(jù)一般由政府部門提供。再如,在互聯(lián)網(wǎng)平臺經(jīng)濟中,如果數(shù)據(jù)來自互聯(lián)網(wǎng)平臺對用戶特征和行為的觀察和記錄,那么其所有權(quán)就很難界定。用戶實際上用自己的注意力和個人數(shù)據(jù)來換取互聯(lián)網(wǎng)平臺提供的資訊和社交服務(wù)(很多時候看似免費提供,實際上卻不是)。這一模式在全球正面臨越來越大的爭議。2020年12月,歐盟委員會發(fā)布《數(shù)字市場法案》草案,要求數(shù)字經(jīng)濟“守門人”不得基于“核心平臺服務(wù)”整合個人數(shù)據(jù)。又如,在專利保護制度下,專利所有權(quán)是清晰的,既可以對外授權(quán)使用,也可以交易轉(zhuǎn)讓。
針對數(shù)據(jù)要素配置機制,需要避免兩個認識誤區(qū)。第一個認識誤區(qū)為,數(shù)據(jù)要素的市場化配置等同于數(shù)據(jù)要素像股票那樣進行市場交易。后文將指出,數(shù)據(jù)要素有多種市場化配置機制,市場交易只是其中的一種,而且很多數(shù)據(jù)要素不適合進行市場交易。第二個認識誤區(qū)為,只有所有權(quán)清晰的數(shù)據(jù)要素才能參與市場配置。前文已指出,很多數(shù)據(jù)要素(特別是個人數(shù)據(jù))難以清晰地界定所有權(quán)。根據(jù)產(chǎn)權(quán)的定義,數(shù)據(jù)要素的產(chǎn)權(quán)最終體現(xiàn)為對數(shù)據(jù)要素的有效控制,也就是控制誰(who)能在何種條件下(what)以何種方式(how)使用數(shù)據(jù)要素,這也是數(shù)據(jù)要素有效配置的前提。
下面先討論數(shù)據(jù)要素市場與金融系統(tǒng)之間的同構(gòu)關(guān)系,再根據(jù)金融系統(tǒng)的組織形式推測數(shù)據(jù)要素市場的組織形式。
金融系統(tǒng)的基本功能是融通資金[11]。在任何社會和任何時間點,都存在兩類經(jīng)濟主體。第一類經(jīng)濟主體由于支出少于收入而積累了盈余資金,被稱為資金提供者。第二類經(jīng)濟主體由于支出超過收入而面臨資金短缺,被稱為資金需求者。資金需求者往往擁有生產(chǎn)性投資機會,但缺乏實施投資計劃所需的資金。金融系統(tǒng)將資金從資金提供者引導(dǎo)到資金需求者,幫助后者實施投資計劃,有助于合理配置資本,提高經(jīng)濟社會效率。金融系統(tǒng)也會幫助消費者合理安排購買時機,改善消費者的生活福利。金融系統(tǒng)有兩種融資模式。第一種是直接融資模式,體現(xiàn)為以股票和債券市場為代表的金融市場。通過金融市場,資金提供者自己決定將資金配置給哪些資金需求者,資金提供者直接享有收益并承擔(dān)風(fēng)險。第二種是間接融資模式,體現(xiàn)為以商業(yè)銀行為代表的金融機構(gòu)。金融機構(gòu)從資金提供者處歸集資金后,決定將資金配置給哪些資金需求者,再將相關(guān)收益和風(fēng)險返還給資金提供者。
與金融系統(tǒng)類似,數(shù)據(jù)要素市場也存在兩類經(jīng)濟主體,一類是數(shù)據(jù)提供者,另一類是數(shù)據(jù)需求者。數(shù)據(jù)要素市場的基本功能是促進數(shù)據(jù)要素從數(shù)據(jù)提供者流向數(shù)據(jù)需求者,以實現(xiàn)數(shù)據(jù)要素的有效配置。資金具有競爭性和排他性,能清晰界定產(chǎn)權(quán),金融交易往往伴隨著資金所有權(quán)的變更,在產(chǎn)權(quán)特征上與數(shù)據(jù)要素有很大差異。盡管如此,數(shù)據(jù)要素與資金在若干關(guān)鍵特征上相似:第一,都可以在流通和使用中產(chǎn)生價值;第二,都可以積累,在物理上不會消減或腐化;第三,大部分數(shù)據(jù)要素和大部分資金以數(shù)字形態(tài)存在。
數(shù)據(jù)提供者存在3種可能的類別。第一,數(shù)據(jù)主體(data subject),指數(shù)據(jù)描述的對象。數(shù)據(jù)主體可以是個人,這就涉及隱私保護問題。隱私保護問題不是排斥共享個人信息,而是要有效控制共享過程,在保護和共享個人數(shù)據(jù)之間做好平衡[12]。數(shù)據(jù)主體也可以是非人格化的,比如來自工業(yè)領(lǐng)域、物聯(lián)網(wǎng)設(shè)備、市政網(wǎng)絡(luò)和交通網(wǎng)絡(luò)等的數(shù)據(jù)。第二,數(shù)據(jù)所有者(data owner),這主要針對所有權(quán)清晰的數(shù)據(jù)。第三,數(shù)據(jù)控制者(data controller),數(shù)據(jù)控制者決定誰能使用數(shù)據(jù),在什么條件下使用,以及如何使用等。一般而言,數(shù)據(jù)要素市場上的數(shù)據(jù)提供者主要是數(shù)據(jù)控制者,數(shù)據(jù)所有者可以被視為一類特殊的數(shù)據(jù)控制者。但對于個人數(shù)據(jù),還要考慮數(shù)據(jù)主體的制約。在這些制約下,數(shù)據(jù)需求者對數(shù)據(jù)的使用往往要遵循附加條件,數(shù)據(jù)提供者也不一定要向數(shù)據(jù)需求者讓渡自己對數(shù)據(jù)的控制權(quán)。例如,數(shù)據(jù)可以一直由數(shù)據(jù)提供者保存在本地,數(shù)據(jù)需求者給出數(shù)據(jù)分析工具,數(shù)據(jù)提供者按要求運行分析工具后,再把結(jié)果返還給數(shù)據(jù)需求者。
基于以上討論,數(shù)據(jù)要素市場與金融系統(tǒng)之間的同構(gòu)關(guān)系見表1。因此,將金融系統(tǒng)的融資模式“遷移”到數(shù)據(jù)要素市場,有助于理解數(shù)據(jù)要素市場的組織形式。
表1 數(shù)據(jù)要素市場與金融系統(tǒng)之間的同構(gòu)關(guān)系
前文已指出,只有小部分所有權(quán)清晰的數(shù)據(jù)要素才適合進行市場交易,大部分數(shù)據(jù)要素需要經(jīng)過中介機構(gòu)的聚合、加工和集中管理后,才能更好地從最終的提供者流向最終的需求者。因此,數(shù)據(jù)要素市場在整體架構(gòu)上將是分布式的,本質(zhì)上是一個分散的、非標準化的并能適應(yīng)多樣化需求的場外市場,只有小部分標準化程度高的數(shù)據(jù)要素才適合進行集中化交易。這個分布式市場會將中介機構(gòu)作為核心節(jié)點,如數(shù)據(jù)銀行和數(shù)據(jù)信托。但是不管數(shù)據(jù)要素市場演化出何種組織形式,都可以借鑒金融系統(tǒng)的融資模式來理解。
3.2.1 數(shù)據(jù)交易市場
數(shù)據(jù)交易市場類似金融領(lǐng)域的直接融資模式。數(shù)據(jù)需求者直接從數(shù)據(jù)提供者處獲得數(shù)據(jù),兩者之間具有直接經(jīng)濟關(guān)系。數(shù)據(jù)提供者有較強的自主性,可自行決定把數(shù)據(jù)提供給哪些數(shù)據(jù)需求者。
與金融市場存在集中化市場和場外市場一樣,數(shù)據(jù)交易市場也有集中化市場和場外市場之分,前者適用于標準化程度較高的數(shù)據(jù)交易,后者適用于個性化、點對點的數(shù)據(jù)交易。由于數(shù)據(jù)類型和特征的多樣性,以及數(shù)據(jù)價值缺乏客觀的計量標準,目前并不存在一個集中化、流動性好的數(shù)據(jù)交易市場。另類數(shù)據(jù)市場(alternative data market)可被視為場外的數(shù)據(jù)交易市場。在這個市場中存在大量的另類數(shù)據(jù)提供商,已發(fā)展出咨詢中介、數(shù)據(jù)聚合商和技術(shù)支持中介等作為連接數(shù)據(jù)需求者(主要是投資基金)和數(shù)據(jù)提供者之間的橋梁。
3.2.2 數(shù)據(jù)銀行
在開放銀行生態(tài)中,銀行持有客戶數(shù)據(jù),并在客戶授權(quán)下通過應(yīng)用程序接口(application programming interface,API)對外共享;不同銀行的客戶數(shù)據(jù)不同,但同一客戶的數(shù)據(jù)可以通過API匯總。因為不同銀行介入個人數(shù)據(jù)市場的程度和管理能力不同,個人數(shù)據(jù)在銀行之間通過API流動,在市場機制的作用下最終流向能最大化數(shù)據(jù)價值并保證數(shù)據(jù)安全的銀行。這些銀行將在開放銀行生態(tài)中居于樞紐地位——從其他銀行、金融機構(gòu)和互聯(lián)網(wǎng)平臺等處匯集個人數(shù)據(jù),并對外提供數(shù)據(jù)產(chǎn)品。這就是數(shù)據(jù)銀行的概念。
數(shù)據(jù)銀行有助于解決數(shù)據(jù)要素供需匹配中的兩大問題。第一,數(shù)據(jù)銀行被作為分散的數(shù)據(jù)提供者和數(shù)據(jù)產(chǎn)品的最終消費者之間的橋梁。數(shù)據(jù)銀行可聚合從各個渠道得到的原始數(shù)據(jù),處理和分析后以數(shù)據(jù)產(chǎn)品的形式提供給數(shù)據(jù)需求者。第二,數(shù)據(jù)銀行代表數(shù)據(jù)提供者與數(shù)據(jù)需求者進行交易,能發(fā)揮專業(yè)優(yōu)勢,實現(xiàn)規(guī)模效應(yīng)。數(shù)據(jù)銀行可獲取數(shù)據(jù)經(jīng)營收益,但也要承擔(dān)相關(guān)風(fēng)險。
3.2.3 數(shù)據(jù)信托
數(shù)據(jù)信托是一個在歐盟和英國很受重視的概念。英國開放數(shù)據(jù)研究所[3]提出數(shù)據(jù)保管人(data steward)的概念。數(shù)據(jù)保管人決定誰在何種條件下可以使用數(shù)據(jù),以及誰能從對數(shù)據(jù)的使用中獲益。一般情況下,收集并持有數(shù)據(jù)的機構(gòu)承擔(dān)數(shù)據(jù)保管人角色。在數(shù)據(jù)信托下,收集并持有數(shù)據(jù)的機構(gòu)(即委托人)允許一個獨立機構(gòu)(即受托人)來決定如何為一個事先確定的目標(這里包含受益人的利益)而使用和分享數(shù)據(jù)。因此,數(shù)據(jù)信托扮演數(shù)據(jù)保管人角色。數(shù)據(jù)信托中的受托人一方面有權(quán)決定如何使用和分享數(shù)據(jù),以釋放數(shù)據(jù)中蘊含的價值,另一方面要確保其決定符合數(shù)據(jù)信托的設(shè)立目標以及受益人的利益。
ODI[3]認為,數(shù)據(jù)信托具有以下好處。第一,作為一個獨立機構(gòu),數(shù)據(jù)信托的受托人能平衡不同委托人在誰能使用數(shù)據(jù)以及如何使用數(shù)據(jù)等方面相互沖突的觀點和經(jīng)濟激勵;第二,數(shù)據(jù)信托可以幫助多個委托人更好地開放、共享和使用數(shù)據(jù);第三,數(shù)據(jù)信托有助于降低數(shù)據(jù)保管和分享等方面的成本以及對專業(yè)技能的要求;第四,數(shù)據(jù)信托為初創(chuàng)公司和其他商業(yè)機構(gòu)使用數(shù)據(jù)并開展創(chuàng)新工作提供了新機會;第五,數(shù)據(jù)信托能“民主化”數(shù)據(jù)使用和分享方面的決策權(quán),使人們對自身數(shù)據(jù)有更大話語權(quán);第六,數(shù)據(jù)信托有助于數(shù)據(jù)收益的分配更廣泛、更平等且符合倫理道德。
數(shù)據(jù)要素價值在微觀層面體現(xiàn)為,滿足好奇心,提高認知能力和決策水平,最終體現(xiàn)為福利提升;在宏觀層面體現(xiàn)為,提高全要素生產(chǎn)率,發(fā)揮乘數(shù)效應(yīng)。但數(shù)據(jù)要素價值的以下特征使數(shù)據(jù)要素估值面臨很大挑戰(zhàn)。第一,主觀性。同樣的數(shù)據(jù)對于不同人的價值大相徑庭,主要原因包括分析方法不同、面對的場景和問題不同,以及所處的政策和制度框架不同。第二,時變性。一些數(shù)據(jù)具有時效性,數(shù)據(jù)折舊是一個普遍現(xiàn)象,即數(shù)據(jù)會隨時間流逝而貶值。一些數(shù)據(jù)有期權(quán)價值,盡管現(xiàn)在價值不大,但以后可能價值很大。第三,外部性。同一數(shù)據(jù)對個人和社會的價值可以不同。數(shù)據(jù)與數(shù)據(jù)結(jié)合的價值可以不同于它們各自的價值之和。數(shù)據(jù)要素估值框架應(yīng)考慮上述特征。為此,筆者提出了DataRank估值框架。
DataRank估值框架的基本思路如下。第一,數(shù)據(jù)要素價值有很多影響維度,需要一個綜合指標以起到類似充分統(tǒng)計量的作用,并作為數(shù)據(jù)要素估值的基準點;第二,鑒于數(shù)據(jù)要素價值的主觀性,綜合指標最好基于客觀的、可觀察的數(shù)據(jù)要素特征以及數(shù)據(jù)流通和使用情況;第三,綜合指標應(yīng)該沒有量綱,有助于按統(tǒng)一尺度評估不同數(shù)據(jù)要素的價值,但又應(yīng)該與經(jīng)市場評估或交易形成的數(shù)據(jù)要素的貨幣價值有強關(guān)聯(lián);第四,鑒于數(shù)據(jù)要素價值的時變性,綜合指標要動態(tài)反映數(shù)據(jù)要素特征以及流動和使用情況的變化,其與貨幣價值之間的關(guān)系還要反映數(shù)據(jù)要素市場的供需情況和成交價格的變化;第五,鑒于數(shù)據(jù)要素價值的外部性,綜合指標應(yīng)該反映不同數(shù)據(jù)要素組合使用的情況。
DataRank估值框架借鑒了谷歌PageRank算法的做法[13]。不管數(shù)據(jù)要素市場采取何種組織形式,站在數(shù)據(jù)需求者的角度,其面臨的問題都是如何從多個可選的數(shù)據(jù)要素中挑出最適合自己的。這個問題與互聯(lián)網(wǎng)用戶在網(wǎng)上檢索信息是類似的。在一定意義上,可以將數(shù)據(jù)要素市場比照為互聯(lián)網(wǎng),將DataRank估值框架比照為搜索引擎。數(shù)據(jù)需求者說明自己想要的數(shù)據(jù)要素特征后(可被比照為互聯(lián)網(wǎng)用戶提交搜索查詢),DataRank估值框架會篩選出符合要求的數(shù)據(jù)要素及相關(guān)的綜合指標。
對于數(shù)據(jù)要素單元,DataRank估值框架根據(jù)以下維度提取影響數(shù)據(jù)要素價值的主要因素,這些因素被稱為數(shù)據(jù)要素標簽。第一,數(shù)據(jù)類型,如衣食住行等方面的行為數(shù)據(jù),以及金融資產(chǎn)和交易數(shù)據(jù);第二,數(shù)據(jù)涉及的樣本分布、時間范圍和變量類型等;第三,數(shù)據(jù)容量,如樣本數(shù)、變量數(shù)、時間序列長度和占用的存儲空間等;第四,數(shù)據(jù)質(zhì)量,如樣本是否有代表性,數(shù)據(jù)是否符合事先定義的規(guī)范和標準,觀察的顆粒度、精度和誤差,以及數(shù)據(jù)完整性(如數(shù)據(jù)是否缺失)等;第五,數(shù)據(jù)的時效性;第六,數(shù)據(jù)來源,有些數(shù)據(jù)來自第一手觀察,有些數(shù)據(jù)屬于第二手數(shù)據(jù),還有些數(shù)據(jù)從其他數(shù)據(jù)推導(dǎo)而來。數(shù)據(jù)可以來自受控實驗和抽樣調(diào)查,也可以來自互聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)和工業(yè)互聯(lián)網(wǎng)等。數(shù)據(jù)可以由人產(chǎn)生,也可以由機器產(chǎn)生。數(shù)據(jù)可以來自線上,也可以來自線下。
假設(shè)共提煉出p個標簽。對于每個數(shù)據(jù)要素單元,用表示它在每個標簽上的得分。這些得分是從價值維度較為客觀地對數(shù)據(jù)要素單元的概括。不管是數(shù)據(jù)要素標簽的數(shù)量和類型,還是每個數(shù)據(jù)要素單元在每個標簽上的得分,都可以根據(jù)數(shù)據(jù)要素市場的發(fā)展情況動態(tài)調(diào)整。在數(shù)據(jù)要素市場上,這些標簽也被數(shù)據(jù)需求者用于說明自己的需求,并檢索數(shù)據(jù)要素單元。
DataRank估值框架的核心特點是,數(shù)據(jù)要素單元被調(diào)用的情況將反映為其DataRank值的動態(tài)調(diào)整。在其他條件相同的情況下,某一數(shù)據(jù)要素單元被調(diào)用得越多,其DataRank值上調(diào)得也越多。在多個數(shù)據(jù)要素單元被一起調(diào)用時,DataRank估值框架能考慮數(shù)據(jù)要素單元之間的協(xié)同效應(yīng)。在其他條件相同的情況下,一個數(shù)據(jù)要素單元與另一個DataRank值高的數(shù)據(jù)要素單元一起調(diào)用,能提高自身的DataRank值。因此,DataRank估值框架不是試圖一勞永逸地給出數(shù)據(jù)要素單元的估值,而是在一個動態(tài)過程中不斷評估,并充分考慮數(shù)據(jù)要素單元在數(shù)據(jù)要素市場上的表現(xiàn)。接下來討論兩種DataRank值動態(tài)調(diào)整機制。
4.4.1 按數(shù)據(jù)調(diào)用情況調(diào)整
其中,λ表示調(diào)用獎勵系數(shù)。
用戶每次調(diào)用數(shù)據(jù)都要參考DataRank值進行付費,通過調(diào)用“刷單”來提高某一數(shù)據(jù)要素單元的DataRank值,會付出比較高的成本。這樣能保障DataRank估值框架不會被操縱。
4.4.2 按數(shù)據(jù)要素單元之間的聯(lián)系調(diào)整
借鑒PageRank算法[13],把每個數(shù)據(jù)要素單元視為一個節(jié)點。如果兩個數(shù)據(jù)要素單元曾被一起調(diào)用過,就認為它們之間存在一條邊,并且這條邊有權(quán)重。比如,考慮某一數(shù)據(jù)要素單元a,它與數(shù)據(jù)要素單元b、c和d分別一起調(diào)用過5次、2次和3次。那么,從a到b、c和d的有向邊的權(quán)重就分別是0.5、0.2和0.3。這樣,數(shù)據(jù)要素單元之間的聯(lián)系就構(gòu)成了一個有向圖。如果賦予有向邊的權(quán)重以概率含義,那么數(shù)據(jù)要素單元之間的調(diào)用關(guān)系就可以用馬爾可夫過程來描述,而有向邊的權(quán)重就是轉(zhuǎn)移概率。按照與PageRank算法類似的方法,分析這個馬爾可夫過程的穩(wěn)態(tài)分布,就能得到各數(shù)據(jù)要素單元的DataRank值。
可以根據(jù)數(shù)據(jù)要素市場的成交記錄,擬合DataRank值與貨幣價值之間的函數(shù)關(guān)系,作為接下來數(shù)據(jù)要素市場化配置的價格參考。成交記錄也可以用于DataRank值動態(tài)調(diào)整。比如,在式(3)中,可以將調(diào)用獎勵系數(shù)λ與成交金額關(guān)聯(lián),成交金額越高,λ越大;在有向圖中,可以根據(jù)成交金額加權(quán)確定有向邊的權(quán)重。
本文研究了數(shù)據(jù)要素市場的組織形式和估值框架這兩個影響當前數(shù)據(jù)要素市場發(fā)展的重要問題,核心結(jié)論如下。
第一,并非只有所有權(quán)清晰的數(shù)據(jù)要素才能參與市場配置,很多數(shù)據(jù)要素(特別是個人數(shù)據(jù))雖然難以清晰界定所有權(quán),但也可以參與市場配置。實際上,數(shù)據(jù)要素的控制權(quán)更重要,它是數(shù)據(jù)要素有效配置的前提。對數(shù)據(jù)要素的控制是通過法律和技術(shù)的結(jié)合來實現(xiàn)的。數(shù)據(jù)要素有多種市場化配置機制,市場交易只是其中的一種,而且很多數(shù)據(jù)要素不適合進行市場交易。數(shù)據(jù)要素市場與金融系統(tǒng)之間存在同構(gòu)關(guān)系,可以從金融系統(tǒng)的組織形式推測數(shù)據(jù)要素市場的組織形式。數(shù)據(jù)要素市場在整體架構(gòu)上將是分布式的,但會有一些中介機構(gòu)作為核心節(jié)點,包括數(shù)據(jù)銀行和數(shù)據(jù)信托等。這些中介機構(gòu)會聚合、加工并集中管理數(shù)據(jù),使數(shù)據(jù)更好地從最終的提供者流向最終的需求者。
第二,數(shù)據(jù)要素估值需要考慮數(shù)據(jù)要素價值的主觀性、時變性和外部性等特點。現(xiàn)有的成本法、收入法、市場法和問卷調(diào)查法等都存在局限。本文參考谷歌的PageRank算法,提出了數(shù)據(jù)要素估值框架DataRank。在DataRank估值框架下,先提煉出影響數(shù)據(jù)要素價值的主要標簽,再結(jié)合數(shù)據(jù)要素單元的標簽得分和當前標簽權(quán)重,對數(shù)據(jù)要素單元賦予DataRank值,然后根據(jù)數(shù)據(jù)要素單元被調(diào)用的情況動態(tài)調(diào)整DataRank值,這反過來又能促成標簽權(quán)重的更新,從而形成一個自適應(yīng)、不斷更新迭代的過程。DataRank值基于客觀的、可觀察的數(shù)據(jù)要素特征以及數(shù)據(jù)流通和使用情況計算,有助于按照統(tǒng)一尺度評估不同數(shù)據(jù)要素的價值,并且可以作為基準點,幫助數(shù)據(jù)要素市場參與者評估數(shù)據(jù)要素單元的貨幣價值。