/程夢(mèng)瑤
大數(shù)據(jù)將打開(kāi)各行各業(yè)的數(shù)據(jù)“潘多拉魔盒”。無(wú)論你是否認(rèn)同,海量數(shù)據(jù)正撲面而來(lái),蔚為壯觀(guān)的數(shù)字來(lái)自電信運(yùn)營(yíng)商、金融、醫(yī)療、教育等,乃至政府部門(mén),這些主體或主動(dòng)探尋,或被動(dòng)接受。
信息資產(chǎn)公司LLC的創(chuàng)始人和執(zhí)行合伙人桑尼爾·索雷斯,在他的暢銷(xiāo)書(shū)《大數(shù)據(jù)治理》中談及自己的切身體會(huì):“作為一家大公司的資深I(lǐng)T專(zhuān)家,我本人在面對(duì)數(shù)據(jù)窘境時(shí),感覺(jué)不知所措。對(duì)數(shù)據(jù)領(lǐng)域的從業(yè)人員來(lái)說(shuō),面臨的問(wèn)題多過(guò)答案。我所在的組織是南非的主導(dǎo)電信運(yùn)營(yíng)商,我們擁有海量的電話(huà)詳單、位置數(shù)據(jù)和社交媒體生成的數(shù)據(jù)。要明智地使用數(shù)據(jù),就必須管理所有數(shù)據(jù)?!?/p>
元數(shù)據(jù)管理是重點(diǎn)
“在企業(yè)數(shù)字化轉(zhuǎn)型過(guò)程中,數(shù)據(jù)治理應(yīng)該是企業(yè)數(shù)字化轉(zhuǎn)型的一個(gè)先決條件。要讓數(shù)據(jù)有意義,首先必須有高質(zhì)量的數(shù)據(jù)。”普元信息技術(shù)股份有限公司(以下簡(jiǎn)稱(chēng)普元信息)大數(shù)據(jù)產(chǎn)品線(xiàn)總經(jīng)理王軒,分享了他對(duì)于大數(shù)據(jù)治理的認(rèn)知。很多企業(yè)在做數(shù)據(jù)治理時(shí),往往只集中在數(shù)據(jù)應(yīng)用環(huán)節(jié),范圍過(guò)窄,而普元信息在大數(shù)據(jù)治理中,側(cè)重于對(duì)大數(shù)據(jù)實(shí)施全過(guò)程、全方位的管理,這種宏觀(guān)導(dǎo)向具有一定的先發(fā)優(yōu)勢(shì)。
實(shí)際上,大數(shù)據(jù)環(huán)境下的數(shù)據(jù)治理不再只是元數(shù)據(jù)、大數(shù)據(jù)標(biāo)準(zhǔn)與大數(shù)據(jù)質(zhì)量,企業(yè)應(yīng)該以元數(shù)據(jù)為基礎(chǔ),配合大數(shù)據(jù)標(biāo)準(zhǔn)、大數(shù)據(jù)交換集成、主數(shù)據(jù)管理、大數(shù)據(jù)質(zhì)量、大數(shù)據(jù)資產(chǎn)化、大數(shù)據(jù)共享等,共同完成整個(gè)企業(yè)層面的大數(shù)據(jù)治理。層層保障之下,使得堪比黃金般貴重的高質(zhì)量數(shù)據(jù),能夠發(fā)揮其獨(dú)特價(jià)值。
書(shū)同文 車(chē)同軌 數(shù)據(jù)標(biāo)準(zhǔn)須先行
以SOA(服務(wù)導(dǎo)向架構(gòu))系列產(chǎn)品見(jiàn)長(zhǎng)的普元信息,在2010年開(kāi)始涉足大數(shù)據(jù)領(lǐng)域,作為SOA國(guó)際標(biāo)準(zhǔn)SCA/SDO的主要參與制定者,對(duì)于數(shù)據(jù)質(zhì)量的關(guān)切,伴隨著企業(yè)業(yè)務(wù)的不斷延展而上升到企業(yè)戰(zhàn)略層面。
“在數(shù)字化轉(zhuǎn)型過(guò)程中,很多傳統(tǒng)行業(yè)希望把出售數(shù)據(jù)作為其利潤(rùn)的增長(zhǎng)點(diǎn)。但是,如果想把數(shù)據(jù)當(dāng)作商品出售,至少需要其數(shù)據(jù)是有質(zhì)量保障的。但目前情況下,這些數(shù)據(jù)存在非常多的問(wèn)題。雖然很多企業(yè)經(jīng)過(guò)多年的IT建設(shè),但數(shù)據(jù)模型并不統(tǒng)一,沒(méi)有統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),也沒(méi)有數(shù)據(jù)質(zhì)量的檢測(cè)體系。沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),就沒(méi)有質(zhì)量控制能力,高質(zhì)量數(shù)據(jù)就無(wú)從談起?!痹谕踯幙磥?lái),獲取高質(zhì)量數(shù)據(jù)的當(dāng)務(wù)之急是要建立完善的數(shù)據(jù)標(biāo)準(zhǔn)體系,只有數(shù)據(jù)標(biāo)準(zhǔn)逐步完善,才有可能進(jìn)行準(zhǔn)確的大數(shù)據(jù)治理,對(duì)大數(shù)據(jù)實(shí)施全過(guò)程、全方位的管理。
2013年,普元信息加入OASIS國(guó)際標(biāo)準(zhǔn)組織KVDB TC(鍵值數(shù)據(jù)庫(kù)應(yīng)用接口技術(shù)委員會(huì))積極參與大數(shù)據(jù)國(guó)際標(biāo)準(zhǔn)制訂工作。2014年12月,全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)(簡(jiǎn)稱(chēng)全國(guó)新標(biāo)委)大數(shù)據(jù)標(biāo)準(zhǔn)工作組宣告成立,由于大數(shù)據(jù)領(lǐng)域涉及的領(lǐng)域非常廣泛,工作組設(shè)立相關(guān)的專(zhuān)題組,包括整體組、國(guó)際組、基層組、產(chǎn)品和平臺(tái)、安全工業(yè)大數(shù)據(jù)、電子商務(wù)等方面。
作為全國(guó)信標(biāo)委SOA分技術(shù)委員會(huì)SOA與Web服務(wù)工作組副組長(zhǎng)單位,普元信息也正在不斷推動(dòng)數(shù)據(jù)標(biāo)準(zhǔn)化的完善。在王軒看來(lái),數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)該通過(guò)各種手段、方法、渠道建立,并且根據(jù)企業(yè)狀況不斷完善。在此過(guò)程中,企業(yè)應(yīng)以元數(shù)據(jù)管理為基礎(chǔ),推動(dòng)數(shù)據(jù)標(biāo)準(zhǔn)在各應(yīng)用系統(tǒng)中的執(zhí)行,逐步形成常態(tài)化的、閉環(huán)的標(biāo)準(zhǔn)體系應(yīng)用機(jī)制,從整體上提升企業(yè)的數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理水平,為實(shí)現(xiàn)企業(yè)數(shù)據(jù)流的暢通和全系統(tǒng)信息資源的共享奠定基礎(chǔ)。
解決數(shù)據(jù)質(zhì)量問(wèn)題是大數(shù)據(jù)應(yīng)用的關(guān)鍵
縱觀(guān)當(dāng)今的大數(shù)據(jù)技術(shù)、平臺(tái)和解決方案,海外廠(chǎng)商仍占據(jù)絕對(duì)主流地位,但這并不妨礙中國(guó)將在大數(shù)據(jù)的時(shí)代異軍突起。從大數(shù)據(jù)的體量看,中國(guó)在大數(shù)據(jù)領(lǐng)域的發(fā)展?jié)摿τ心抗捕谩?/p>
寬帶資本董事長(zhǎng)田溯寧在桑尼爾的《大數(shù)據(jù)治理》一書(shū)的序言中說(shuō):“若要到達(dá)風(fēng)光無(wú)限的大數(shù)據(jù)彼岸,大數(shù)據(jù)治理一定是必修課之一?!?/p>
毋庸置疑,大數(shù)據(jù)治理是傳統(tǒng)信息治理的延續(xù)和擴(kuò)展,它體現(xiàn)了信息治理準(zhǔn)則的一脈相承。 大數(shù)據(jù)治理的本質(zhì)是什么?王軒認(rèn)為,是提高數(shù)據(jù)質(zhì)量。
更好的數(shù)據(jù)意味著更好的決策,而解決數(shù)據(jù)質(zhì)量問(wèn)題是大數(shù)據(jù)應(yīng)用的關(guān)鍵。王軒用實(shí)戰(zhàn)經(jīng)驗(yàn)不斷驗(yàn)證這種觀(guān)點(diǎn),“在我們接觸的眾多銀行案例中,經(jīng)常會(huì)遇到一種情況,做完一個(gè)數(shù)據(jù)倉(cāng)庫(kù),客戶(hù)重名信息往往達(dá)到上萬(wàn)個(gè),一個(gè)人1000多個(gè)賬戶(hù),這都是數(shù)據(jù)質(zhì)量問(wèn)題。為什么會(huì)出現(xiàn)這種數(shù)據(jù)問(wèn)題呢?數(shù)據(jù)治理是一個(gè)復(fù)雜過(guò)程,其中有很多環(huán)節(jié),從前期的數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)集成到數(shù)據(jù)治理等等,任何一個(gè)環(huán)節(jié)出錯(cuò)都可能導(dǎo)致數(shù)據(jù)質(zhì)量問(wèn)題,其中數(shù)據(jù)治理是清洗數(shù)據(jù)和規(guī)避數(shù)據(jù)風(fēng)險(xiǎn)的重要環(huán)節(jié)?!蓖踯幷J(rèn)為,如何在交易錯(cuò)誤時(shí)即時(shí)阻斷數(shù)據(jù)錯(cuò)誤,是保障數(shù)據(jù)質(zhì)量的重要手段,而此項(xiàng)技術(shù)手段,普元信息現(xiàn)如今已完全掌握。
普元的大數(shù)據(jù)治理實(shí)踐
十多年來(lái),普元信息在金融、電信、電力、能源等行業(yè)積累了豐富的數(shù)據(jù)管理經(jīng)驗(yàn)。在王軒看來(lái),普元數(shù)據(jù)治理呈現(xiàn)出三大特色:
首先,普元信息的數(shù)據(jù)治理解決方案可以覆蓋全行業(yè)。普元能幫助各行各業(yè)的客戶(hù),將其數(shù)據(jù)質(zhì)量提升。同時(shí),能完成其數(shù)據(jù)現(xiàn)階段最復(fù)雜、最重要的任務(wù)。
其次,普元解決方案是全體系的。通過(guò)平臺(tái)、服務(wù)、規(guī)劃等各個(gè)方面的完整規(guī)劃,能夠幫助企業(yè)把數(shù)據(jù)治理落地。普元并非做單獨(dú)一個(gè)產(chǎn)品,而是在數(shù)據(jù)的整個(gè)生命周期,每一階段都能幫助企業(yè)控制它的數(shù)據(jù)質(zhì)量,達(dá)到企業(yè)的數(shù)據(jù)治理需求,實(shí)現(xiàn)數(shù)據(jù)價(jià)值。
再次,普元信息的全部平臺(tái)都是自主研發(fā)。通過(guò)基于業(yè)務(wù)目標(biāo)的量化研發(fā)管理體系,產(chǎn)品家族擴(kuò)展到4大系列10余個(gè)品類(lèi),其專(zhuān)注于軟件基礎(chǔ)平臺(tái)領(lǐng)域,具有分布式計(jì)算、服務(wù)構(gòu)件技術(shù)、可視化技術(shù)、業(yè)務(wù)流程管理、內(nèi)存計(jì)算、企業(yè)移動(dòng)計(jì)算、數(shù)據(jù)治理等核心技術(shù)。
普元信息元數(shù)據(jù)管理在2014年底被定位為聯(lián)通大數(shù)據(jù)平臺(tái)的數(shù)據(jù)管理解決方案,幫助客戶(hù)的維護(hù)人員快速理解大數(shù)據(jù)系統(tǒng)內(nèi)的數(shù)據(jù)組織,以及數(shù)據(jù)間的影響和依賴(lài),減少修改、維護(hù)、升級(jí)時(shí)間,以減少大數(shù)據(jù)帶來(lái)的管理維護(hù)成本。
由于華為負(fù)責(zé)上海聯(lián)通大數(shù)據(jù)平臺(tái)的建設(shè),借此機(jī)會(huì)華為與普元信息達(dá)成了戰(zhàn)略性目標(biāo)。依托普元元數(shù)據(jù)產(chǎn)品的優(yōu)勢(shì),抓取大數(shù)據(jù)平臺(tái)內(nèi)部的元數(shù)據(jù),為大數(shù)據(jù)平臺(tái)的運(yùn)營(yíng)維護(hù)提供全局的、完整的元數(shù)據(jù)管理。
該方案為大數(shù)據(jù)平臺(tái)異構(gòu)的元數(shù)據(jù)提供智能整合和儲(chǔ)存能力,為大數(shù)據(jù)平臺(tái)設(shè)計(jì)的不同源的元數(shù)據(jù)在同一元模型的規(guī)范體系下實(shí)現(xiàn)整合存儲(chǔ),整合主要包括元數(shù)據(jù)對(duì)象整合組件和元數(shù)據(jù)關(guān)系整合組件,以及元模型設(shè)計(jì)器、元數(shù)據(jù)抓取配置組件等。此后,普元信息的元數(shù)據(jù)管理能力,在業(yè)內(nèi)得到了廣泛認(rèn)可。
在金融行業(yè),普元先后幫助國(guó)家開(kāi)發(fā)銀行、華夏銀行、中國(guó)銀聯(lián)、興業(yè)銀行、北京銀行等完成了大數(shù)據(jù)治理項(xiàng)目建設(shè),其中,國(guó)家開(kāi)發(fā)銀行在2009年8月開(kāi)始建設(shè)數(shù)據(jù)管理項(xiàng)目,通過(guò)普元元數(shù)據(jù)管理產(chǎn)品支持源系統(tǒng)、ODS、數(shù)據(jù)倉(cāng)庫(kù)及下游部分應(yīng)用對(duì)元數(shù)據(jù)的應(yīng)用需求。
增加采集適配器,定時(shí)自動(dòng)的采集元數(shù)據(jù)保證元數(shù)據(jù)的及時(shí)更新;同時(shí)保證真實(shí)數(shù)據(jù)關(guān)系的建立,推進(jìn)全行數(shù)據(jù)地圖的建設(shè),深化元數(shù)據(jù)管理系統(tǒng)的核心功能,強(qiáng)化元數(shù)據(jù)管理系統(tǒng)對(duì)外的接口服務(wù),輔助數(shù)據(jù)標(biāo)準(zhǔn)的落地實(shí)施。
在電力行業(yè),普元幫助江西省電力公司建立了全公司的企業(yè)級(jí)數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)標(biāo)準(zhǔn)促進(jìn)了業(yè)務(wù)部門(mén)之間的數(shù)據(jù)共享,界定業(yè)務(wù)數(shù)據(jù)范圍,起到了重要作用,并將企業(yè)級(jí)的全面元數(shù)據(jù)管理納入了全公司的元數(shù)據(jù)信息,全面共享元數(shù)據(jù),梳理了系統(tǒng)之間的元數(shù)據(jù)接口,使得系統(tǒng)之間的來(lái)龍去脈一目了然。
在電信行業(yè),普元幫助上海移動(dòng)做了包括服務(wù)治理、能力開(kāi)放、大數(shù)據(jù)治理、大數(shù)據(jù)共享在內(nèi)的一系列項(xiàng)目,陪伴上海移動(dòng)完成了數(shù)字化轉(zhuǎn)型的整個(gè)歷程。
在能源行業(yè),普元先后幫助國(guó)家電網(wǎng)、新奧能源等完成了數(shù)據(jù)治理的相關(guān)建設(shè),為其提升管理效率和拓展業(yè)務(wù)邊界,提供了前所未有的可能性,通過(guò)大數(shù)據(jù)治理流程,明晰大數(shù)據(jù)血脈,提升大數(shù)據(jù)質(zhì)量,實(shí)現(xiàn)了能源行業(yè)對(duì)大數(shù)據(jù)的全面管控,為上層應(yīng)用提供安全可用的數(shù)據(jù)基礎(chǔ),確保了大數(shù)據(jù)平臺(tái)分析與預(yù)測(cè)的準(zhǔn)確性。
作為一種具有戰(zhàn)略意義的新資源,將大數(shù)據(jù)比作石油或黃金,如今,世人并不覺(jué)得有夸大其詞之嫌。大數(shù)據(jù)的自生性和可持續(xù)性,卻又是石油或黃金所望塵莫及的。
大數(shù)據(jù)治理必將成為一項(xiàng)系統(tǒng)工程,以孜孜以求的進(jìn)取心去挖掘高質(zhì)量數(shù)據(jù)背后的價(jià)值,普元信息正在做,未來(lái)也將會(huì)有更多企業(yè)參與其中,而大數(shù)據(jù)變現(xiàn)之暢想也將不再遙不可及。