(清華大學社會科學學院,北京100084)
數(shù)據(jù)交易以及相關的產(chǎn)權問題,是現(xiàn)在大數(shù)據(jù)產(chǎn)業(yè)的熱點話題。對這一問題進行分析,有助于形成業(yè)界慣例和社會共識,為制定相關法律法規(guī)提供參考和依據(jù)。數(shù)據(jù),就是事物和行為的顯現(xiàn),并且是被記錄的、有待分析的顯現(xiàn)。當前,數(shù)據(jù)的重要性日益凸顯。一方面,人們進行科學研究,處理復雜的經(jīng)濟、社會和政治事務,都需要大量數(shù)據(jù)支持,數(shù)據(jù)需求不斷增加;另一方面,計算機技術的發(fā)展、自然科學和社會科學知識的積累,以及社交網(wǎng)絡、云計算、移動終端的發(fā)展等因素,使得數(shù)據(jù)的價值能夠被人們所認識和利用。對于現(xiàn)在流行的大數(shù)據(jù)這一概念,人們已經(jīng)從各個角度描述了它的特點,其中有兩點值得注意:一是大數(shù)據(jù)突破了以往人們對數(shù)據(jù)的認知,以前不被人們當成是數(shù)據(jù)的資料,現(xiàn)在也可以以量化方式進行處理,以前被人們認為無法分析的數(shù)據(jù)(大多是非結構數(shù)據(jù)),現(xiàn)在也可以用來分析。二是與大數(shù)據(jù)相關的數(shù)據(jù)挖掘技術呈現(xiàn)了事物之間一些以前從未想象過的深層次聯(lián)系,這使得人們產(chǎn)生了更大的興趣去收集、分析數(shù)據(jù),從而發(fā)現(xiàn)并利用這些隱秘的聯(lián)系。
大數(shù)據(jù)在商務智能、社會治理等領域的應用不斷擴展,并且在逐漸改變原有的產(chǎn)業(yè)結構和經(jīng)濟結構。與此相伴隨的是,大數(shù)據(jù)相關產(chǎn)業(yè)也在快速發(fā)展,并且得到了許多國家公共部門的關注和支持。數(shù)據(jù)的重要地位使得越來越多的人將數(shù)據(jù)看作是繼土地、資本和勞動力之后的第四種生產(chǎn)要素。數(shù)據(jù)作為一種生產(chǎn)要素,理應像其他生產(chǎn)要素一樣得到合理配置,從而對生產(chǎn)發(fā)揮最大效用,而這就涉及到了數(shù)據(jù)交易問題。從市面上不斷增加的與數(shù)據(jù)相關的產(chǎn)品(如電子導航地圖、人臉識別設備)以及與數(shù)據(jù)交易相關的企業(yè)不斷擴展的業(yè)務看來,數(shù)據(jù)交易數(shù)量在快速增長,數(shù)據(jù)市場潛力巨大。
然而,當前數(shù)據(jù)交易的發(fā)展還面臨諸多困難。除了很多企業(yè)經(jīng)營者對計算機技術缺乏了解、缺少資金、經(jīng)營理念等因素外,人們不愿購買和使用數(shù)據(jù)的一個重要原因就是高昂的交易費用——而其他因素或多或少都與這一點有關。數(shù)據(jù)交易的本質,就是對數(shù)據(jù)的產(chǎn)權,即數(shù)據(jù)的擁有權、使用權、收益權等權利的轉讓。而轉讓數(shù)據(jù)產(chǎn)權的前提,當然是界定產(chǎn)權,但目前數(shù)據(jù)產(chǎn)權界定的狀況并不盡如人意。一方面,事物越是有價值,人們越是傾向于清晰地界定其產(chǎn)權歸屬。數(shù)據(jù)的價值不斷顯現(xiàn),使得人們?yōu)榱嗽黾邮找婊虮苊鈸p失,而迫切要求明確產(chǎn)權。另一方面,由于數(shù)據(jù)與其他產(chǎn)品相比又有一些比較突出的特點,使得與產(chǎn)權相關的交易費用較高,從而阻礙了產(chǎn)權的界定。這些特點體現(xiàn)在以下幾個方面。
第一,數(shù)據(jù)同時具有絕對的非排他性和相對的排他性。絕對的非排他性是指數(shù)據(jù)能被無數(shù)次復制和使用,一個人的使用并不會使數(shù)據(jù)有所減少。相對的排他性是指以下幾種情況:首先,有些數(shù)據(jù)如果被多個使用者使用,它對每個人的價值會比個人單獨使用時要少。比如,多個電商掌握同一套數(shù)據(jù),得出了相近的分析結果,并據(jù)此進行商品推送,結果每個電商都沒有達到預想的效果。其次,對一些公開數(shù)據(jù),可能會有企業(yè)設法讓它暫時無法公開,在短時間內(nèi)占有它,從而使自己基于數(shù)據(jù)的產(chǎn)品或服務能在短時間內(nèi)獲得壟斷利潤。
第二,數(shù)據(jù)交易涉及的主體多,包括數(shù)據(jù)擁有者、數(shù)據(jù)采集者、數(shù)據(jù)中介、數(shù)據(jù)使用者等。在法律法規(guī)不完善的情況下,每一方都有理由主張對數(shù)據(jù)的某項權利,引發(fā)糾紛的可能性較大。
第三,存在數(shù)據(jù)造假的可能性,保障數(shù)據(jù)真實性和進行鑒別的成本較大。至于造假的原因,可能是彌補統(tǒng)計上的疏忽、降低提供數(shù)據(jù)的成本,或是有意擾亂客戶的研究分析。
第四,一些數(shù)據(jù)的有用性無法事先確定。多數(shù)商品的了解過程和使用過程是分離的。比如,在購買冰箱之前,雖然我還沒有用它,但我了解它將給我?guī)砗锰帯σ环媮碚f,了解過程和使用過程最初會重合:在評價它并最終下決心買下它的過程中,我同時也得到了美的愉悅——如果沒有得到這種享受,我根本不會購買它;但是了解和使用過程仍然會分離,因為我更多地是在購買之后反復欣賞的過程中得到愉悅的。然而,數(shù)據(jù)就不同了。一方面,有些數(shù)據(jù)的了解和使用過程確實是分離的,比如,在我確信男女比例會對產(chǎn)品的銷售有影響時,購買各地的男女比例數(shù)據(jù),并據(jù)此安排銷售工作。在另外一些情況下,通過了解和分析數(shù)據(jù)樣例,買方也能判斷數(shù)據(jù)的有用性。另一方面,對有些數(shù)據(jù)分析工作——特別是研究設計工作——來說,了解數(shù)據(jù)的過程就是使用過程。比如,我猜測某商品的銷售量與當?shù)貍€人手機話費有關,并希望據(jù)此優(yōu)化營銷行為。如果兩個變量間的關聯(lián)程度達到了我設定的標準,那就證明這套數(shù)據(jù)對我是有用的,否則這套數(shù)據(jù)對我來說就沒有意義了。矛盾在于,只有當我擁有并分析了這套數(shù)據(jù)之后,我才能了解它的有用性的大小,才能決定是否購買它;但也只有在我了解它的有用性的情況下,才能決定它是否值得購買和擁有。此時,了解過程和使用過程是重疊的。
正是這些特點,使得數(shù)據(jù)交易者在產(chǎn)權問題上發(fā)生矛盾的可能性較高,使得交易費用無法降低,進而,使得原本能成功的交易,由于金錢、時間等成本太高而無法發(fā)生。這造成的后果是:首先,數(shù)據(jù)交易的低效率會影響數(shù)據(jù)資源的優(yōu)化配置,阻礙數(shù)據(jù)資源發(fā)揮應有的作用,特別是會導致許多企業(yè),尤其是中小企業(yè)不想、不敢使用數(shù)據(jù),從而無法從數(shù)據(jù)中獲益,無法跟上大數(shù)據(jù)時代的步伐;其次,如果數(shù)據(jù)交易的不暢導致數(shù)據(jù)的利用難以擴大的話,數(shù)據(jù)平臺和與數(shù)據(jù)相關的基礎設施也難以更好地實現(xiàn)規(guī)模效益。
數(shù)據(jù)交易成本高,還可以從一個現(xiàn)象看出來:目前在國內(nèi),在數(shù)據(jù)研發(fā)和應用方面遠遠走在前邊的是百度、阿里和騰訊。為什么?首先,不可否認的是,三個IT巨頭本身擁有海量數(shù)據(jù)和雄厚的資本,在相關領域具有絕對優(yōu)勢。但是,交易費用恐怕也是一個重要因素。數(shù)據(jù)買方(即依靠數(shù)據(jù)產(chǎn)出商品或服務的人)需要集合數(shù)據(jù)資源、算法、交易中介以及數(shù)據(jù)基礎設施等要素,才能有效利用數(shù)據(jù)資源。在交易不順暢的情況下,光是買方和賣方的互動就會產(chǎn)生很高的交易費用,更別提與其他資源的協(xié)調(diào)配合了。而如果通過市場機制整合資源的交易成本較高,那就只能轉向企業(yè)機制了,因為在企業(yè)內(nèi)部,可以通過命令的形式強制幾種資源相互配合并為各團隊規(guī)定收益分配方式。與上述這三個大企業(yè)不同的是,多數(shù)企業(yè)只擁有少量,或是完全沒有與數(shù)據(jù)相關的資源,如果有心利用數(shù)據(jù),也只能通過市場機制配置資源,因而,受制于較高的交易費用。
由此可見,我們有必要分析數(shù)據(jù)交易中的產(chǎn)權和交易費用問題,從而為優(yōu)化交易機制和制定相關法律法規(guī)提供參考。
我們分析數(shù)據(jù)交易的工具是新制度經(jīng)濟學中的交易費用理論和產(chǎn)權理論。在新制度經(jīng)濟學看來,具有稀缺性和價值的,不僅有被交易的商品或服務,而且還有交易本身。交易的類型,除了有市場型(利用價值機制)、管理型(利用企業(yè)內(nèi)部機制)和政治型(利用政治權力)這三類外,還有諸多形式。從權利的角度講,交易就是對于商品或服務的產(chǎn)權,即擁有權、使用權、收益權、讓渡權等權利的轉讓。至于交易成本或交易費用,就是“與轉讓、獲取和保護產(chǎn)權有關的成本”。[1]3交易成本包括為促成交易而產(chǎn)生的各種花在搜尋信息、溝通、談判、監(jiān)督等行為上的金錢、精力和時間成本——當然,實施這些行為本質上都是為了在轉讓產(chǎn)權過程中界定和保護產(chǎn)權。新古典經(jīng)濟學假定交易信息是對稱的,產(chǎn)權要么不用界定要么是被完美地界定了的,價格機制可以在瞬間使市場自動達到均衡,因此,不存在交易費用。但是在新制度經(jīng)濟學看來,一個事物的多種屬性意味著有多個產(chǎn)權。由于界定產(chǎn)權需要交易費用,而這些產(chǎn)權中有一些是沒被界定的,因此,可能會導致鉆空子、過度使用等行為。
在進行數(shù)據(jù)交易的過程中,采集、存儲數(shù)據(jù)固然是有成本的,但數(shù)據(jù)交易本身的成本也不容忽視——包括買方花在了解數(shù)據(jù)、尋找數(shù)據(jù)、評估數(shù)據(jù)質量、賣方尋找和說服買方、進行廣告宣傳的成本,以及雙方談判、討價還價、履約等所需要的各種成本?;谝陨蠈?shù)據(jù)特殊性的分析,我們可以進一步探究影響數(shù)據(jù)交易的交易費用的因素主要有哪些,以及這些因素又會相應地產(chǎn)生哪些不利影響。
第一,鑒于數(shù)據(jù)的信息價值、質量和成本具有高度不確定性,買賣雙方都需要在收集信息、定價、調(diào)整估價等方面付出大量成本。首先,數(shù)據(jù)的質量如何?所購數(shù)據(jù)能帶來多少有用信息?不同賣方的同類數(shù)據(jù)有哪些實質差異?與質量較低的數(shù)據(jù)相比,質量較高的數(shù)據(jù)能使精確性提高多少?……對于這些問題,數(shù)據(jù)購買者在完成交易并實際使用數(shù)據(jù)之前,是難以得到準確答案的。其次,由于技術手段和相關政策的不斷變化,數(shù)據(jù)收集工作的成本在不同時期是有差異的,雙方在簽訂合同時難以對此進行準確預估。企業(yè)要了解自己需要什么數(shù)據(jù),要能找到這些數(shù)據(jù),要從采集方法、完整性、有用性等方面評價數(shù)據(jù)質量,要比較各賣方的出價,要了解賣方的信譽。在這一過程中,買方掌握的信息可能少于賣方,因此要努力防止被欺騙。又比如,賣方也要摸清買方購買數(shù)據(jù)的用途。如果賣方了解到買方借這套數(shù)據(jù)能夠獲得較大收益,賣家就會抬高出價。買方既要向賣方傳達需求,又要努力隱瞞自己購買數(shù)據(jù)的意圖,以便壓低價格。這樣復雜的過程當然會耗費大量時間精力。
第二,履約和監(jiān)督的難度是推高交易成本的重要因素。首先,數(shù)據(jù)質量與設備儀器的質量、抽樣的科學性、企業(yè)的執(zhí)行能力和誠信水平等因素高度相關。其次,如果涉及的是需在較長時間內(nèi)進行多次交付的交易,那么交易雙方還需處理與突發(fā)事件、技術標準的變化等相關的問題。再次,賣方可以在合同中限定買方使用數(shù)據(jù)的方式,買方也可以對賣方未來銷售同一套數(shù)據(jù)的行為進行限制。以上三點意味著買賣雙方都希望對對方進行適當監(jiān)督,在發(fā)現(xiàn)問題矛盾時能夠順利溝通或訴諸法律手段,而這些行為都會產(chǎn)生交易成本。
第三,數(shù)據(jù)使用者要解決數(shù)據(jù)與算法的相互對接、相互協(xié)調(diào)的問題。數(shù)據(jù)買方不僅要與賣方溝通,而且要與數(shù)據(jù)分析或算法提供者(其他公司或科研機構)打交道,后者自然也會從技術的角度對數(shù)據(jù)提出要求。另外,買方還要考慮數(shù)據(jù)和算法的要素價格和邊際產(chǎn)品,找到一個均衡點并不容易。因此,買方要在各方之間周旋。如果數(shù)據(jù)使用者要組建自己的算法團隊,也是要花組織成本的,這一成本屬于管理型交易費用的范疇。
第四,數(shù)據(jù)提供者希望通過與公共部門打交道來獲得聲望。為了確保能獲得較高質量的數(shù)據(jù)并減少受到欺騙和產(chǎn)生糾紛的可能,數(shù)據(jù)買方更愿意與口碑好、值得信賴的企業(yè)進行交易。而數(shù)據(jù)提供者也了解這一情況,并渴望借助宣傳、獲取資質等方式獲得或維持聲譽。這其中一個重要方式是與公共部門打交道。首先,企業(yè)為了展示自己的實力和可信性,會爭取與公共部門進行交易或開展合作,即使這些交易或合作并不能為其帶來較大收益,而由此產(chǎn)生的部分機會成本應算作交易成本。其次,企業(yè)可能會不惜利用違法、違規(guī)手段獲取與公共部門合作的機會,或某種認可和資質,這些行為的成本也應算作交易成本。
值得注意的是,交易費用較高的一個后果就是,目前數(shù)據(jù)交易中的人際成本比較高,交易雙方經(jīng)常是朋友、熟人、老客戶,或至少是信息技術領域的“圈兒里人”。熟識的人之間相互信任,能夠進行充分交流,只要談得差不多就能做出決定了。然而,首先,維持良好的人際關系也要花費不少成本;其次,這種情況限制了其他組織對數(shù)據(jù)的購買,這些組織要么因缺少關系而無法得到數(shù)據(jù),要么不得不為了買到放心的數(shù)據(jù)而付出成本建立這種關系。要想擴大數(shù)據(jù)市場的規(guī)模,降低整體交易費用,就必須更多地依靠機制,而非人際關系。
什么樣的數(shù)據(jù)交易機制好?回答這個問題需認清兩點:首先,存在不同類型的數(shù)據(jù)和不同類型的產(chǎn)權,比如,有時買方一次性購買一套數(shù)據(jù),有時則需供應方在較長時間內(nèi)提供實時數(shù)據(jù);有的數(shù)據(jù)容易采集,有的數(shù)據(jù)采集則難度較大,等等。數(shù)據(jù)和產(chǎn)權類型不同,交易中的收益分配以及監(jiān)督、履約方式也會有所不同。因此,要發(fā)展出多種不同的數(shù)據(jù)交易形式與之相適應。
其次,不同的人對什么樣的交易形式是好的有不同看法。經(jīng)濟學家當然會強調(diào)數(shù)據(jù)資源配置的高效率;管理部門強調(diào)數(shù)據(jù)安全;交易平臺組織者集中關注能夠盈利的商業(yè)模式;重要數(shù)據(jù)的擁有者希望有設租空間。不過,對那些在業(yè)務中需要數(shù)據(jù)的機構,特別是中小企業(yè)來說,以下幾點是必不可少的。
第一,能夠及時、便捷地尋找并了解所需要的數(shù)據(jù),對多種可選擇的數(shù)據(jù)的質量和價格進行對比。
第二,數(shù)據(jù)的真實質量有保證,沒有造假現(xiàn)象。人們能夠根據(jù)需要長期、有保障地得到數(shù)據(jù),不會被“敲竹杠”。被“敲竹杠”的可能來自資產(chǎn)專用性。資產(chǎn)專用性就是“在不犧牲生產(chǎn)價值的條件下,資產(chǎn)可用于不同用途和由不同使用者利用的程度”。[2]比如,A公司花巨資開發(fā)了一款用途單一的APP產(chǎn)品,這個產(chǎn)品依賴于B公司連續(xù)不斷提供的數(shù)據(jù)。在這種情況下,A的資產(chǎn)專用性較高,如果B違約或威脅提高數(shù)據(jù)的價格,那么A的風險就較大。
第三,從購買的數(shù)據(jù)中洞察到有價值的信息,在一定程度上像是賭博,因為很有可能從數(shù)據(jù)中挖掘不出任何有價值的信息。因此,買方當然希望降低風險,即使最終發(fā)現(xiàn)數(shù)據(jù)沒有價值,也不會損失太多。
第四,交易機制盡可能規(guī)范、簡潔、程序化,減少人為因素。
下面我們對已存在或可能產(chǎn)生的數(shù)據(jù)交易形式進行分類,并分析它們各自的優(yōu)缺點。
(1)按產(chǎn)權占有程度分類。在很多數(shù)據(jù)交易中,買方獲得了數(shù)據(jù)的所有權、使用權和收益權。此時買方能最大程度地獨享數(shù)據(jù)的價值,但缺點是數(shù)據(jù)的要價會很高,而且為了避免買下不合適的數(shù)據(jù),買方必然要把大量成本花在了解數(shù)據(jù)上。在另外一些交易中,數(shù)據(jù)的版權仍留在賣方手中,買方只擁有無限的使用權。此時,數(shù)據(jù)的價格較低,且能滿足買方的使用需要,這有助于擴大數(shù)據(jù)市場的整體規(guī)模。而且,賣方在保留版權的同時壓低價格,意味著必須把數(shù)據(jù)賣給許多人,而買方越多,數(shù)據(jù)中的錯誤越可能被發(fā)現(xiàn),這實際上就是在督促賣方自覺提高數(shù)據(jù)質量,因而是為買方減少了監(jiān)督成本。但買方的代價是,不能阻止數(shù)據(jù)被賣給其他人,包括競爭對手。
進一步降低數(shù)據(jù)價格的方法,是只買賣有限的使用權。比如,買方利用少量資金獲取對一套數(shù)據(jù)中的所選字段進行五次操作的機會。這種交易方式對于資金有限的買方來說可謂是福音,因為這就避免了買到無用數(shù)據(jù)的可能,在沒有產(chǎn)生期望的分析結果的情況下,也不會損失太多。另一種方法是限制買方分析數(shù)據(jù)的算法。賣方只允許買方用有限的幾種算法來分析數(shù)據(jù),按算法的種類和使用次數(shù)收費,并且越是可能產(chǎn)生有價值洞察的算法,收費越高。這種做法對賣方有利,因為大數(shù)據(jù)的特點就是可能揭示出意想不到的隱秘聯(lián)系,而能否發(fā)現(xiàn)這些聯(lián)系,在較大程度上依賴算法。如果對數(shù)據(jù)的所有使用者收取相同的價格的話,那么那些有能力使用更高級算法,并且本來愿意接受更高價格的人,就會獲得超出平均水平的收益,實際上就是占有了未被界定的產(chǎn)權。另一方面,有些買方需要的本來就只是簡單的計算結果而已,對他們收取較低的費用,也是合理的。
目前,提供大型數(shù)據(jù)集的有限使用權的方式有兩種:第一種是像數(shù)據(jù)堂、阿里的數(shù)據(jù)魔方等數(shù)據(jù)服務平臺一樣提供不同權限的數(shù)據(jù)接口,收費越高,權限越高。權限較高的接口通常會有更高的每日訪問次數(shù)和更大帶寬,支持更多數(shù)據(jù)格式。由于接口有有效期,所以這本質上是在提供有限使用權。第二種方式是,數(shù)據(jù)可以免費使用,但要對服務收費。付費用戶可以建立自己的話題頁面,獲得技術支持,使用更高級的分析和可視化工具,要求系統(tǒng)根據(jù)分析結果自動生成幻燈片和分析報告。以提供服務的方式盈利,可以看作是間接地提供有限的數(shù)據(jù)使用權。這兩種方式都不是按使用數(shù)據(jù)的套數(shù)或次數(shù)收費,而是根據(jù)功能收費。它們的局限是,為了吸引用戶付費使用高端功能,數(shù)據(jù)平臺必須擁有豐富的數(shù)據(jù),要么是能以低成本收集數(shù)據(jù),要么是有大量數(shù)據(jù)擁有者愿意分享數(shù)據(jù)。
(2)按長期、短期合同分類。有時,賣方只要一次性交付數(shù)據(jù)即可;有時,賣方需要在很長一段時間內(nèi)不斷為買方更新數(shù)據(jù)。長期合同可能在兩方面提高履約成本:首先,如果在履約過程中買方需要調(diào)整所需數(shù)據(jù)的類型、精度等,就要與賣方協(xié)商,甚至需要重訂合同,而賣方有拒絕的可能。其次,賣方可能以降低數(shù)據(jù)質量來要挾買方出更多的錢,這可能是因為買方的資產(chǎn)專用性較高,給了賣方“敲竹杠”的機會,也可能是因為收集數(shù)據(jù)的成本增加了。同時,買方也可能以減少購買量來要挾賣方降價,這要么是因為賣方在收集數(shù)據(jù)方面資產(chǎn)專用性較高,要么是因為買方認為賣方應該采取成本更低的收集方法。
(3)按哪一方有業(yè)務需要分類。數(shù)據(jù)擁有者可以單純把數(shù)據(jù)賣給有業(yè)務需要的一方,但數(shù)據(jù)擁有者也可能希望自己發(fā)展業(yè)務或推出產(chǎn)品,此時又分成三種情況。假設數(shù)據(jù)擁有者要與使用數(shù)據(jù)的算法設計者合作:第一,他可以向算法設計者收取固定金額的“租金”,而產(chǎn)品的收益在扣除了這筆錢之后全部歸算法設計者;第二,賣方與買方商定一個比例,當買方開發(fā)的產(chǎn)品產(chǎn)生收益時,雙方按比例分配收益,這是目前一些數(shù)據(jù)公司經(jīng)常采用的方式;第三,數(shù)據(jù)擁有者付給算法設計者工資,同時享受扣除了工資成本之外的產(chǎn)品收益。這三種形式,哪一種形式最可能使收益最大化?不同資源對于產(chǎn)出變化的影響是不同的,“隨著一方對產(chǎn)出價值的影響上升,如果該方承擔更大部分的產(chǎn)出變化性,那么權利就將更好地界定?!盵1]76如果這個產(chǎn)品的收益更多地取決于算法的優(yōu)劣,而與數(shù)據(jù)關系不大的話——也就是說,數(shù)據(jù)的準確性、相關性對產(chǎn)品所需要的數(shù)據(jù)處理結果沒有太大影響的話,那么第一種形式就是合理的。這是因為,算法設計者能獲得除上交金額以外的全部收入,他越是努力,自己留下的收益就越多,因此更有動力工作,而數(shù)據(jù)擁有者也就省去了監(jiān)督他努力工作的成本。相反,如果數(shù)據(jù)處理結果的好壞更多地取決于數(shù)據(jù),而各種可用的算法差別并不大的話,第三種形式就是最好的,因為只要數(shù)據(jù)擁有者積極提高數(shù)據(jù)質量,就能獲得更多剩余收益,此時算法設計者也無需督促數(shù)據(jù)擁有者完善數(shù)據(jù)了。第二種形式是第一和第三種形式的折中,能使雙方都有積極做好工作的動力,減少了互相監(jiān)督的成本。另外,如果數(shù)據(jù)擁有者不滿足一次了斷的交易,而是認為這套數(shù)據(jù)能長期不斷帶來收益,也可以采用第二種形式;與此同時,由于開始時要付的資金相對較少,買方也能夠承受。
(4)按是否應要求收集數(shù)據(jù)分類。有時,賣方提供定制服務,在接到買方對數(shù)據(jù)內(nèi)容和規(guī)格的要求后,才去收集數(shù)據(jù)。但有時,賣方會事先花一定成本采集數(shù)據(jù),再拿出來銷售。這后一種形式有兩個不利因素,首先,有的數(shù)據(jù)是有時效性的,賣方必須花大量成本,在短時間內(nèi)找到盡可能多的買方,只有這樣才能盈利;而數(shù)據(jù)無法賣出的風險自然也會抬高其價格。其次,事先尋找數(shù)據(jù)還需要有既能洞察數(shù)據(jù)的潛在價值又了解市場的商務拓展人員,但這樣的人才比較稀缺。有時僅僅是發(fā)現(xiàn)一套以前沒被人們意識到其存在的數(shù)據(jù),就已經(jīng)算是有功勞了。
筆者認為未來以下幾個方面的發(fā)展變化會在一定程度上降低數(shù)據(jù)交易成本。
(1)數(shù)據(jù)交易機制的完善。在新制度經(jīng)濟學中,機制變遷是促使交易費用降低的重要途徑。從進化博弈論的角度看,促使數(shù)據(jù)交易機制發(fā)生改變的至少有三種因素:社會中的創(chuàng)意和實驗,與具有不同文化的社會的交流,以及政府的政策性介入。[3]
第一是社會中的創(chuàng)意和實驗,即交易主體根據(jù)數(shù)據(jù)特點和自身業(yè)務模式,打破現(xiàn)有的交易理念和習慣,創(chuàng)造性地引入新的交易方式并在應用這些方式中不斷加以完善。機制創(chuàng)新的一個重要方面是如何更好地利用社會嵌入。所謂社會嵌入,是指“社會交換域‘嵌入’到其他域,使得某些在關聯(lián)發(fā)生前不可能的策略組合成為可能”。[4]在數(shù)據(jù)交易中,與數(shù)據(jù)交易行為相關的其他方面包括,對以數(shù)據(jù)為基礎而開展的具體業(yè)務的收益進行分配、交易雙方在其他方面的合作、行業(yè)內(nèi)的信譽和聲望、技術和信息的共享,等等。與對方在其他領域形成利益關系或互動關系,對交易主體具有激勵或約束作用,而數(shù)據(jù)交易機制創(chuàng)新的關鍵就是如何將這些不同領域進行合理有效搭配,使各種機制能夠形成互補性,[5]從而相互作用,彼此協(xié)調(diào)。
第二是與具有不同文化的社會的交流。與數(shù)據(jù)交易市場更加成熟的國家的企業(yè)或科研機構開展的數(shù)據(jù)交易或合作,會促使相關國家企業(yè)的交易理念、習慣、流程等發(fā)生積極變化,進而有助于形成更優(yōu)的交易機制。
第三是政府的政策性介入。政府介入的一個典型方式是為數(shù)據(jù)交易中介機構授予交易平臺資質。交易平臺的主要作用,其一是提供買賣信息,為賣方提供展示平臺,讓買方更方便地尋找、評價和比較不同數(shù)據(jù);其二是發(fā)揮最基本的規(guī)范監(jiān)督作用,落實相關法律法規(guī),并督促交易雙方履約。交易平臺發(fā)展的一個可能方向是,國家可為符合條件的平臺發(fā)放資質,增加其作為第三方的公信力,進而減少交易雙方在信息、建立信任和履約方面付出的成本。然而,發(fā)放國家資質的做法也有一定局限性:如果給許多平臺發(fā)放資質,相關部門再管理、監(jiān)督這些平臺也需要花費成本。如果只有少數(shù)平臺得到資質,又會形成壟斷。另外,發(fā)放資質還可能引起尋租,其一是交易平臺為得到國家資質而尋租,其二是數(shù)據(jù)擁有者用各種手段與有資質的交易平臺打交道,以便得到來自后者的更好評價。有鑒于此,必須允許有政府資質的平臺和沒有得到資質的平臺共同健康發(fā)展。另外需要注意的是,除了資質問題外,交易平臺的發(fā)展還體現(xiàn)在軟硬件設施的整合上。平臺要滿足存儲、使用數(shù)據(jù)的效率和安全性等方面的要求,因此,需要云計算等數(shù)據(jù)基礎設施的配合。如果在市場中配置資源成本過高的話,平臺組織者就會兼并或自己發(fā)展基礎設施;另一方面,基礎設施供應者也將積極向交易平臺模式發(fā)展。不過,這種資源整合在降低市場交易成本的同時,也有形成壟斷的可能。
(2)數(shù)據(jù)質量評價指標的完善和可操作性。為了評價一套數(shù)據(jù)的質量,可以先選定完整性、顆粒度、準確性、可用性、樣本量等指標,為每個指標賦予權重,從而為這個數(shù)據(jù)打出總分。但是應注意的是,這樣的指標體系并不是用來評估所有數(shù)據(jù)的:一套數(shù)據(jù)對不同的買方來說具有不同的價值和可用性;不同的研究目的對顆粒度、樣本量的要求也不一樣;有人要求某個字段的完整性很高,但有人則能容忍較多缺失值,……一系列原因使得一個通用的評價標準不可能存在。而且,目前也缺少具有較高科學性的評價。如果用客戶打分法來評價,主觀性過強,比如分析者因缺少合適的算法而未得出理想的結果,但他卻可能認為這是數(shù)據(jù)質量不好造成的,因而打低分。也不可能用專家打分法,因為大數(shù)據(jù)的特點在于幫助人們發(fā)現(xiàn)隱秘關系,因此,即使是某個領域的專家也不可能完全了解數(shù)據(jù)的價值。如果是系統(tǒng)自動打分,則很難對可用性、準確性等指標打分,而只能根據(jù)設定好的程序對完整性、邏輯關系等最基本的方面打分。因此,評價指標的真正作用,在于允許需求者列出要比較的幾套數(shù)據(jù),然后根據(jù)自己選定的標準打分,分數(shù)只具有相對意義,不具有絕對意義。評價的大致過程舉例如下:用戶首先選出要比較的數(shù)據(jù)及關注的字段,并為每個字段選定評價所用的指標,為指標賦予權重;然后對每個字段設定標準,如理想值(或平均水平)、可接受值和相對最小值等;對于收集方法的科學性、及時性等指標,用戶要為每套數(shù)據(jù)賦予一個主觀分值。這樣,用戶就可以根據(jù)總分對多套數(shù)據(jù)進行評價了。
(3)充分的市場競爭。在很多情況下,買方需要用數(shù)據(jù)來滿足復雜特殊的研發(fā)需要,對數(shù)據(jù)的規(guī)格要求較嚴格,數(shù)據(jù)采集和清洗難度較大。此時,買方通常需要在與賣方充分協(xié)商后才能完成交易。可以預測,大數(shù)據(jù)所涉及的領域越多,對這種數(shù)據(jù)的需要也會越多。此時買方之所以不會去利用數(shù)據(jù)平臺,一是因為這些數(shù)據(jù)在交易平臺無法找到;二是因為買方不愿意輕意透露自己需要哪些數(shù)據(jù),以免他人借此信息研判其使用意圖;三是因為這種交易必定需要較長的了解、溝通和談判過程,而交易平臺幫不上什么忙。也就是說,這類交易必然會有較高的交易費用?,F(xiàn)在,不斷有新的組織進入到數(shù)據(jù)產(chǎn)業(yè)中。在這種情況下,激烈的市場競爭能確保數(shù)據(jù)提供者改變自身運營機制,簡化程序,提高傳達信息和收集信息的有效性,進而降低交易成本。
(4)與外國企業(yè)進行交易。一方面,外國企業(yè)開發(fā)或推廣適應中國市場的產(chǎn)品,必然需要相關數(shù)據(jù)。另一方面,中國與其他國家或地區(qū)的服務貿(mào)易機制正在逐步完善,這給了企業(yè)“走出去”提供數(shù)據(jù)或與數(shù)據(jù)相關的服務的良好機會。這兩個方面的發(fā)展能夠產(chǎn)生規(guī)模效應,從而降低單筆數(shù)據(jù)交易的交易成本。這里特別要強調(diào)的是與東盟國家的合作:首先,雙方在服務貿(mào)易方面的政策為數(shù)據(jù)擁有者、數(shù)據(jù)交易中介在東盟地區(qū)開展數(shù)據(jù)交易業(yè)務提供了便利;其次,數(shù)據(jù)提供者可以在東盟地區(qū)開展基于數(shù)據(jù)的電子商務、咨詢、研發(fā)等高端業(yè)務,使手中的數(shù)據(jù)發(fā)揮更大價值;再次,與東盟一些國家相比,中國的數(shù)據(jù)產(chǎn)業(yè)在機制建設、商業(yè)模式和技術方面具有優(yōu)勢。
(5)公共部門數(shù)據(jù)意識的增強。這主要是指相互聯(lián)系的三個方面:一是公共部門更加重視采集、整理本部門自有數(shù)據(jù);二是公共部門加強統(tǒng)計能力,完善統(tǒng)計部門建設和相關法律法規(guī),改進統(tǒng)計技術和方法,增加統(tǒng)計數(shù)據(jù)的準確性和及時性;三是公共部門應增加透明性,擴大應公開數(shù)據(jù)的范圍,落實數(shù)據(jù)公開方面的各項規(guī)定。這樣不但能使數(shù)據(jù)需求者減少購買數(shù)據(jù)的成本,而且可以減少交易本身的成本;更重要的是,能避免一些公共部門利用關鍵數(shù)據(jù)設租。
[1] Y.巴澤爾.產(chǎn)權的經(jīng)濟分析[M].費方域,段毅才,譯.上海:上海人民出版社,2008.
[2] 奧利弗·威廉姆森.經(jīng)濟組織的邏輯[C]//陳郁.企業(yè)制度與市場組織.上海:三聯(lián)書店上海分店,1996:64-109.
[3] 青木昌彥,奧野正寬.經(jīng)濟體制的比較制度分析[M].魏加寧,譯.北京:中國發(fā)展出版社,2005:272.
[4] 青木昌彥.比較制度分析[M].周黎安,譯.上海:上海遠東出版社,2001:212.
[5] 盧現(xiàn)祥.新制度經(jīng)濟學[M].武漢:武漢大學出版社,2004:280.