印象中,大數(shù)據(jù)分析剛興起沒(méi)多久,“人人都是數(shù)據(jù)科學(xué)家”的呼聲已經(jīng)不絕于耳。大數(shù)據(jù)分析不應(yīng)該成為極少數(shù)數(shù)據(jù)科學(xué)家的專利,而應(yīng)該成為所有業(yè)務(wù)人員最有力的工具!
人們寄希望于圖數(shù)據(jù)庫(kù),因?yàn)樗梢酝瓿稍S多關(guān)系型數(shù)據(jù)庫(kù)幾乎不可能完成的任務(wù),讓企業(yè)更輕松地執(zhí)行更具豐富意涵的實(shí)時(shí)分析,以及從數(shù)據(jù)中發(fā)掘可以真正改變?nèi)藗兩畹亩床?,并使所有人都可以使用可擴(kuò)展的圖分析,從關(guān)聯(lián)數(shù)據(jù)中釋放真正的價(jià)值。
圖分析領(lǐng)域的佼佼者TigerGraph 已經(jīng)成立8年,其主打產(chǎn)品也演進(jìn)到3.0 版本,但是圖分析總讓人有種“叫好不叫座”的感覺(jué)。這是因?yàn)閳D分析的高門檻讓企業(yè)用戶望而卻步嗎?
TigerGraph 中國(guó)區(qū)總經(jīng)理 烏明捷
其實(shí),圖分析本身并不想拒人于千里之外,它可以適用于各種規(guī)模的企業(yè)。從新興的初創(chuàng)公司到全球財(cái)富1000 強(qiáng)企業(yè),它們都在使用TigerGraph的高級(jí)圖分析構(gòu)建前瞻性應(yīng)用程序就是最有力的證明。比如,全球前五大銀行中有四家在使用TigerGraph 進(jìn)行實(shí)時(shí)欺詐檢測(cè);同時(shí),依托TigerGraph,全球超過(guò)3 億消費(fèi)者獲得了實(shí)時(shí)個(gè)性化服務(wù),5000 萬(wàn)醫(yī)療保健患者受益于量身定制的護(hù)理路徑建議。那么,到底是什么壓抑了圖分析潛在的巨大能量的釋放呢?
從圖分析使用者的角度也許可以找到蛛絲馬跡。圖分析的使用人群大致可以分成三類:IT 運(yùn)維人員、應(yīng)用開(kāi)發(fā)人員,以及非技術(shù)專業(yè)的企業(yè)業(yè)務(wù)人員。一些圖分析廠商一開(kāi)始就將IT 運(yùn)維人員和應(yīng)用開(kāi)發(fā)人員作為主要的服務(wù)對(duì)象,圖分析成了“陽(yáng)春白雪”,動(dòng)輒就要寫(xiě)腳本、寫(xiě)代碼,需要數(shù)據(jù)科學(xué)家這樣的高端專業(yè)人才才能完成部署和分析。而普通的業(yè)務(wù)人員對(duì)于圖分析只能仰望,卻不能親自動(dòng)手參與其中。
TigerGraph 中國(guó)區(qū)總經(jīng)理烏明捷談到了一種比較普遍的情況,在初步搭建圖分析系統(tǒng),進(jìn)行簡(jiǎn)單嘗試之后,甚至還沒(méi)有看到圖分析帶來(lái)的改變,很多用戶便放棄了。這說(shuō)明,圖分析確實(shí)存在入門的門檻,比如用戶要對(duì)圖數(shù)據(jù)庫(kù)的相關(guān)概念有一定了解,而且要掌握基本的圖分析方法和工具等。
TigerGraph 中國(guó)區(qū)總經(jīng)理烏明捷表示,圖分析一定要平民化,讓圖數(shù)據(jù)庫(kù)物盡其用。圖分析并不限于固定的行業(yè)或場(chǎng)景,而應(yīng)該讓所有人受益!
2 0 2 0年 3月,TigerGraph 正式發(fā)布了TigerGraph 3.0,其最有意義的一項(xiàng)演進(jìn)是無(wú)需寫(xiě)代碼,只通過(guò)拖拽的方式就能讓用戶完成基本的圖分析工作。在筆者看來(lái),這是一項(xiàng)雖平凡但又影響深遠(yuǎn)的改變。說(shuō)它平凡,因?yàn)椤癗o Code”這項(xiàng)工作本身的技術(shù)門檻并不高,圖分析廠商如果想做都可以實(shí)現(xiàn);說(shuō)它影響深遠(yuǎn),是因?yàn)榇蠹叶寄茏龅墓ぷ?,但是很多“技術(shù)范兒”的廠商并沒(méi)有將它提到日程上來(lái),仍然圍繞專業(yè)人員作文章,只有TigerGraph在用戶實(shí)實(shí)在在需求的推動(dòng)下,第一個(gè)將它落地實(shí)現(xiàn),或許這樣一項(xiàng)小小的創(chuàng)舉,就可能打開(kāi)圖分析普及化的閘門。
以TigerGraph 3.0 為新開(kāi)端,它可以讓企業(yè)用戶在圖分析方面快速入門,先有圖才談得上用好圖。從低成本的試用開(kāi)始,先做一些簡(jiǎn)單的探索,不用了解相關(guān)算法,只需通過(guò)鼠標(biāo)拖拽,就能在短時(shí)間內(nèi)看到最直接的結(jié)果,待有持續(xù)深入探索的需求后,企業(yè)再加大投入,采用更加專業(yè)的工具和方 法,在TigerGraph 平臺(tái)之上完成專業(yè)的圖分析。從少量場(chǎng)景的探索入手,循序漸進(jìn),逐步將圖查詢等遷移到更大規(guī)模的集群中,直至進(jìn)入生產(chǎn)環(huán)境,這才是圖分析貼近用戶、深入行業(yè)的正確姿勢(shì)。
按照Gartner的說(shuō)法,圖數(shù)據(jù)存儲(chǔ)可以跨數(shù)據(jù)孤島有效地建模、探索和查詢具有復(fù)雜關(guān)聯(lián)關(guān)系的數(shù)據(jù),但是目前需要專門技能才能實(shí)現(xiàn),實(shí)際上限制了其應(yīng)用。這就可以理解為什么TigerGraph 將圖可視化提升到如此重要的地位。這有點(diǎn)像把略顯晦澀的文言文轉(zhuǎn)成通俗易懂的白話文,不是技術(shù)上的問(wèn)題,而是思路上的轉(zhuǎn)變,最終目的是擴(kuò)大對(duì)知識(shí)的探索,將圖思維和工具普及化、平民化。
TigerGraph 究竟是如何實(shí)現(xiàn)圖可視化的呢?以TigerGraph 3.0 為例,它增強(qiáng)了包括使用直觀的拖放功能運(yùn)行圖查詢的能力。
TigerGraph 3.0 在 提供核心平臺(tái)功能的同時(shí),提供易用的“No code”高級(jí)圖分析:通過(guò)提供No code方式進(jìn)行模式(Schema)轉(zhuǎn)換,并把數(shù)據(jù)加載到圖中,實(shí)現(xiàn)從關(guān)系型數(shù)據(jù)庫(kù)No code 遷 移;使 用Visual Query Builder(可視化查詢構(gòu)建器)的No code 圖分析,類似于可視化數(shù)據(jù)建模,非技術(shù)人員通過(guò)繪制所需的模式即可生成和運(yùn)行圖查詢;在分布式環(huán)境中實(shí)現(xiàn)簡(jiǎn)單和快速的部署,更方便地在TigerGraph 平臺(tái)中導(dǎo)入更龐大的數(shù)據(jù)集并進(jìn)行分析;用戶定義的索引允許用戶提高特定查詢的數(shù)據(jù)庫(kù)性能,支持點(diǎn)和范圍查詢,以及高性能的時(shí)間序列和地理空間應(yīng)用。
無(wú)論用戶的專業(yè)技術(shù)能力如何,借助TigerGraph的No code 圖分析功能,都可以通過(guò)圖方便地實(shí)現(xiàn)高級(jí)分析應(yīng)用。
眾所周知,標(biāo)準(zhǔn)化是降低產(chǎn)品使用門檻,加速新技術(shù)普及的重要驅(qū)動(dòng)力。專屬圖查詢的國(guó)際標(biāo)準(zhǔn)化語(yǔ)言GQL 可能在2021年發(fā)布,烏明捷認(rèn)為這將對(duì)圖分析的應(yīng)用起到重要促進(jìn)作用。采用圖分析,用戶必須翻越的“成本關(guān)”有二:一是機(jī)器的成本;二是人力成本,其中就包括學(xué)習(xí)成本。烏明捷不止一次聽(tīng)到客戶的擔(dān)憂:“我選擇一個(gè)分析平臺(tái),就像在做一道單選題,如果技術(shù)人員學(xué)習(xí)了一門開(kāi)發(fā)語(yǔ)言,在投入大量學(xué)習(xí)成本后,將來(lái)又要轉(zhuǎn)換到另一個(gè)產(chǎn)品或平臺(tái),必須重頭再學(xué)一門新的語(yǔ)言,這讓我們?cè)谶x擇平臺(tái)時(shí)非常糾結(jié)?!?/p>
TigerGraph 以身作則,自主開(kāi)發(fā)的GSQL 語(yǔ)言將完整支持GQL 圖查詢語(yǔ)言國(guó)際標(biāo)準(zhǔn)。烏明捷相信,此語(yǔ)言國(guó)際標(biāo)準(zhǔn)的誕生將大大降低客戶學(xué)習(xí)和使用的成本,就像現(xiàn)在的關(guān)系型數(shù)據(jù)庫(kù)一樣,只要掌握了標(biāo)準(zhǔn)的SQL,再學(xué)其他語(yǔ)言時(shí),只要學(xué)習(xí)額外新增的功能即可,而基本的語(yǔ)法不會(huì)有太大變化。無(wú)論是No code 還是GQL 國(guó)際標(biāo)準(zhǔn),都可以進(jìn)一步打消用戶對(duì)使用圖分析的顧慮,對(duì)整個(gè)圖分析市場(chǎng)的發(fā)展十分有利。
“我們現(xiàn)在的一項(xiàng)重要工作就是與企業(yè)的科技創(chuàng)新部門、大數(shù)據(jù)分析部門一起,教育企業(yè)的業(yè)務(wù)部門,讓他們能夠真正了解圖分析的價(jià)值所在。”烏明捷分析說(shuō),“讓業(yè)務(wù)部門接納一項(xiàng)新技術(shù),除了必須考慮技術(shù)的成熟度和易用程度以外,最重要的其實(shí)并不是科技本身,而是如何利用科技為業(yè)務(wù)帶來(lái)價(jià)值,這才是推動(dòng)圖分析走向深入的關(guān)鍵?!?/p>
特別值得一提的是,云的興起對(duì)于圖分析來(lái)說(shuō)也是一個(gè)助力。越來(lái)越受到客戶歡迎的TigerGraph Cloud 提供了20 多種模板,用戶選擇其中一個(gè)行業(yè)模板,在幾分鐘內(nèi)便可搭建一個(gè)圖環(huán)境并使用。據(jù)烏明捷透露,TigerGraph 已 經(jīng)在和國(guó)內(nèi)的云服務(wù)商洽談合作的可能。
“TigerGraph 平 臺(tái)的演進(jìn)聚焦使用簡(jiǎn)單、更好融合、最佳的容量和性能支持?!盩igerGraph 解決方案工程師李憓松介紹說(shuō),TigerGraph 3.0 可以更好地與分析平臺(tái)和數(shù)據(jù)進(jìn)行融合,具備企業(yè)級(jí)用戶所需的大容量和領(lǐng)先業(yè)內(nèi)的高性能,可以進(jìn)行真正的圖分片、分布式存儲(chǔ)和分布式運(yùn)算。
針對(duì)開(kāi)發(fā)者,TigerGraph 3.0 提供了屬性索引、算法、從關(guān)系型數(shù)據(jù)庫(kù)遷移到圖等先進(jìn)技術(shù),旨在提高開(kāi)發(fā)效率;提升GSQL 語(yǔ)言,比新增GSQL 聯(lián)合模式匹配(Conjunctive Pattern Matching),新 推出的Per 子句主要是在聯(lián)合模式匹配下,方便進(jìn)行多步遍歷,靈活高效進(jìn)行聚合運(yùn)算;提供更加靈活的查詢模式等。針對(duì)IT 運(yùn)維人員,TigerGraph 3.0 通過(guò)平臺(tái)管理、漢化的用戶界面、Studio 中的多圖等,大幅提升運(yùn)維效率。針對(duì)普通的業(yè)務(wù)人員,尤其是無(wú)基礎(chǔ)的圖分析新人,TigerGraph 3.0 提供了無(wú)代碼分析工具,可以快速完成圖探索和圖查詢,降低了應(yīng)用的入門門檻。李憓松特別提到了新增的直譯查詢功能。以往,用戶在對(duì)查詢進(jìn)行修改或調(diào)試后,還要再經(jīng)過(guò)編譯才能進(jìn)行下一次查詢,連貫性體驗(yàn)不佳,而直譯查詢則提升了查詢效率。
“相對(duì)于以前的版本,TigerGraph 3.0 實(shí)現(xiàn)了全面的提升,包括系統(tǒng)的穩(wěn)定性、運(yùn)維的易用性,以及支持PB 級(jí)的數(shù)據(jù)量等,為管理員提供了一套完整的界面,包含數(shù)據(jù)備份、安全等都有了較大改進(jìn),提高了工作效率。另外,我們開(kāi)源了GSQL 算法庫(kù),提供中文界面和更好的本地服務(wù)支持。”烏明捷表示,通過(guò)不斷演進(jìn),TigerGraph 將變更加成熟、穩(wěn)定,支持更大的數(shù)據(jù)量,幫助更多用戶將圖技術(shù)應(yīng)用到日常工作中。
談到未來(lái)圖分析領(lǐng)域的技術(shù)和應(yīng)用發(fā)展趨勢(shì),李憓松總結(jié)了以下幾點(diǎn)。
首先,企業(yè)用戶越來(lái)越看重對(duì)于單個(gè)用戶的行為分析,這就要求參數(shù)的靈活化,以及數(shù)據(jù)不同的遍歷結(jié)構(gòu)的靈活化,同時(shí)對(duì)于多并發(fā)情況下的性能要求非常高,通常是毫秒級(jí)的,而這些正好是圖分析比較擅長(zhǎng)的。其次,將圖分析和傳統(tǒng)BI 相結(jié)合,構(gòu)建更靈活的即席探索平臺(tái),進(jìn)行不止建模,預(yù)測(cè),最優(yōu)化的高級(jí)分析。再次,傳統(tǒng)的機(jī)器學(xué)習(xí)是一個(gè)“黑盒”,而圖分析可以進(jìn)行更好地進(jìn)行解釋,有助于提升機(jī)器學(xué)習(xí)的準(zhǔn)確性和可解釋性。最后,批量的圖分析也是一個(gè)需求方向。
再回到文章一開(kāi)始提到的圖分析“叫好不叫座”這個(gè)問(wèn)題,歸根結(jié)底,廣大的企業(yè)用戶還沒(méi)有建立起一種新的“圖思維”,仍然比較依賴傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù),或者在關(guān)系型數(shù)據(jù)庫(kù)遇到瓶頸時(shí)才想到圖分析。其實(shí),圖分析的應(yīng)用場(chǎng)景更豐富。TigerGraph 就歸納了圖分析的七大場(chǎng)景,比如路徑的發(fā)現(xiàn)、模式的匹配、子圖的發(fā)現(xiàn)等。目前,我們看到圖分析在金融、電信、醫(yī)療等領(lǐng)域比較火,而實(shí)際上,工業(yè)、能源、電商、制造業(yè)、物流等千行百業(yè)都是圖分析的用武之地。在抗擊疫情的過(guò)程中,也有TigerGraph的身影。
如果說(shuō)利用傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行的數(shù)據(jù)探索是平面的,那么圖分析就是立體的,可以進(jìn)行更深入、更多維、更準(zhǔn)確的分析。如果用戶從一開(kāi)始就將自身的業(yè)務(wù)與圖之間建立對(duì)應(yīng)關(guān)系,也許可以更快地達(dá)到探索的彼岸。TigerGraph的價(jià)值在于,為客戶提供一個(gè)快捷、簡(jiǎn)便的圖分析工具,讓用戶可以在很短的時(shí)間內(nèi)先建立圖,初步嘗試之后很快判定是否可行,然后再?zèng)Q定是否繼續(xù)更深入的探索。
“讓我們的客戶真正從圖和圖分析工具中受益。這是TigerGraph 做所有事情的出發(fā)點(diǎn)。”烏明捷如是說(shuō)。