趙艷秋
技術(shù)變革正在讓這家公司變得“既熟悉又陌生”。
一家中國(guó)手機(jī)大公司,要從社交平臺(tái)的海量數(shù)據(jù)中傾聽(tīng)“客戶(hù)的聲音”。于是,帶有機(jī)器學(xué)習(xí)技術(shù)的大數(shù)據(jù)分析系統(tǒng)被采用,每天從300多個(gè)網(wǎng)站抓取2000萬(wàn)條原始社交數(shù)據(jù),從中辨識(shí)出100個(gè)危機(jī)預(yù)警,5萬(wàn)個(gè)客戶(hù)問(wèn)題。這些問(wèn)題被立刻輸送到產(chǎn)品維修、客戶(hù)服務(wù)、產(chǎn)品設(shè)計(jì)部門(mén)……得到主動(dòng)解決。而在過(guò)去,采用人工處理方式,每人每天只能看800條信息。自動(dòng)化系統(tǒng)讓分析能力和效率提升100倍!
一家中國(guó)金融公司,要在海量交易中實(shí)時(shí)辨識(shí)欺詐交易。這可不是件容易事。要知道,在2016年,使用移動(dòng)支付的中國(guó)用戶(hù)已達(dá)4.7億人,這個(gè)數(shù)字甚至是美國(guó)總?cè)丝诘?.5倍以上,每天創(chuàng)造天量級(jí)金融零售交易數(shù)據(jù),而交易欺詐規(guī)模也龐大得驚人,僅信用卡欺詐一項(xiàng)就讓銀行業(yè)每年損失幾百億元。但現(xiàn)在,通過(guò)采用具備機(jī)器學(xué)習(xí)技術(shù)的高級(jí)分析系統(tǒng),這家金融公司每秒可處理10萬(wàn)筆+交易量,成功阻絕90%的欺詐犯罪。
在這兩個(gè)典型的案例中,企業(yè)都采用了大數(shù)據(jù)分析企業(yè)SAS的新技術(shù)。
SAS可不是一家新公司,它已有41年歷史,源自美國(guó)北卡羅來(lái)納州立大學(xué)的一個(gè)數(shù)據(jù)分析軟件研究項(xiàng)目。雖然根據(jù)市場(chǎng)調(diào)研公司IDC的統(tǒng)計(jì),SAS目前在全球高級(jí)和預(yù)測(cè)分析市場(chǎng)占有31.6%的份額,但這家老牌數(shù)據(jù)分析企業(yè)卻面臨前所未有的挑戰(zhàn)。
SAS起步的時(shí)候,數(shù)據(jù)分析還是一個(gè)很小很專(zhuān)的市場(chǎng)。但現(xiàn)在,數(shù)據(jù)分析世界已發(fā)生翻天覆地的變化,成為全球最廣袤的技術(shù)市場(chǎng)之一?;ヂ?lián)網(wǎng)、物聯(lián)網(wǎng)帶來(lái)了海量實(shí)時(shí)數(shù)據(jù)分析需求,“人人都是數(shù)據(jù)分析師”的理念被越來(lái)越的企業(yè)接納,機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)加速了智能化的腳步,開(kāi)源技術(shù)對(duì)傳統(tǒng)商業(yè)模式發(fā)起沖擊……SAS的變化就是在這樣的背景下發(fā)生的——如何在一個(gè)越來(lái)越熱鬧、競(jìng)爭(zhēng)越來(lái)越白熱化的市場(chǎng)“不被后浪拍在沙灘上?”
“行業(yè)變遷已經(jīng)迫使我們?nèi)プ龀鲎兓!盨AS首席技術(shù)官Oliver Schabenberger說(shuō),“分析將無(wú)所不在,分析將被自動(dòng)化,將結(jié)合強(qiáng)大的現(xiàn)代機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和認(rèn)知分析技術(shù)。同時(shí),物聯(lián)網(wǎng)引發(fā)的邊緣分析、流數(shù)據(jù)分析將加速我們將分析能力帶入網(wǎng)絡(luò)和移動(dòng)設(shè)備中。”
Oliver從去年起擔(dān)任SAS首席技術(shù)官,目前正努力帶領(lǐng)全球的研發(fā)團(tuán)隊(duì),通過(guò)技術(shù)變革塑造一個(gè)我們“既熟悉又陌生”的SAS。
小設(shè)備中的數(shù)據(jù)分析
“物聯(lián)網(wǎng)正在改變數(shù)據(jù)科學(xué)。”O(jiān)liver說(shuō)。被業(yè)界廣為引用的數(shù)字是,思科預(yù)計(jì),到2020年全球?qū)⒂?00億臺(tái)設(shè)備連聯(lián);到2030年,這一數(shù)字將增長(zhǎng)10倍。
在物聯(lián)網(wǎng)環(huán)境中,數(shù)據(jù)流動(dòng)在前端移動(dòng)設(shè)備和后端服務(wù)器里?!拔覀儾荒苤豢紤]在云中處理數(shù)據(jù),也必須考慮邊緣分析,也就是最前沿設(shè)備上的事件流處理(ESP,Event Stream Processing),這是物聯(lián)網(wǎng)非常重要的部分?!監(jiān)liver說(shuō)。
這讓SAS考慮將高性能“事件流處理軟件”從云端拿下來(lái),不斷精簡(jiǎn),放到各種小設(shè)備、車(chē)輛甚至網(wǎng)絡(luò)路由器上運(yùn)行。
“物聯(lián)網(wǎng)不僅僅關(guān)乎軟件,我們也要與網(wǎng)絡(luò)設(shè)備公司合作?!苯衲?月,SAS與思科聯(lián)合推出了業(yè)內(nèi)首個(gè)從邊緣到企業(yè)的物聯(lián)網(wǎng)分析平臺(tái)?!斑@是重要的一大步?!監(jiān)liver說(shuō)。SAS的事件流處理軟件運(yùn)行在思科物聯(lián)網(wǎng)網(wǎng)關(guān)上,在傳感器和那些產(chǎn)生數(shù)據(jù)的設(shè)備附近,在亞秒級(jí)時(shí)間內(nèi)就地處理數(shù)據(jù)。經(jīng)過(guò)過(guò)濾、處理的數(shù)據(jù)集,再被傳輸?shù)綌?shù)據(jù)中心或云端,與更多企業(yè)數(shù)據(jù)組合,應(yīng)用機(jī)器學(xué)習(xí)等先進(jìn)分析技術(shù),來(lái)獲得新洞察。
“我們注意到事件流處理可以處理圖形,這是即將推出的新技術(shù),令人激動(dòng)。”O(jiān)liver補(bǔ)充說(shuō)。
Oliver了解到中國(guó)制造2025?!拔覀兿M盐锫?lián)網(wǎng)分析平臺(tái)部署到工廠(chǎng)中,給工廠(chǎng)的運(yùn)營(yíng)帶來(lái)大不同。”
分析的未來(lái)是自動(dòng)化
不久前,海爾數(shù)據(jù)科學(xué)家表示,智能制造面臨的巨大挑戰(zhàn)是源源不斷流入的數(shù)據(jù)是人工方式所清洗、治理和分析不了的。
數(shù)據(jù)科學(xué)家現(xiàn)在大概花80%的時(shí)間來(lái)清洗和治理數(shù)據(jù),而業(yè)界希望他們能把更多時(shí)間用于針對(duì)數(shù)據(jù)建?;蛟u(píng)估工作上。
“分析的未來(lái)將更加自動(dòng)化,但它將以巧妙的方式自動(dòng)化?!監(jiān)liver說(shuō)。傳統(tǒng)上,人們針對(duì)某類(lèi)數(shù)據(jù),選擇一種他們認(rèn)為最適合的統(tǒng)計(jì)模型?,F(xiàn)在,這將被數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)所取代。但業(yè)界有兩類(lèi)機(jī)器學(xué)習(xí)——經(jīng)典和現(xiàn)代。
“經(jīng)典機(jī)器學(xué)習(xí)并不是純粹意義上的自學(xué)習(xí),而是訓(xùn)練一個(gè)系統(tǒng)來(lái)形成和分類(lèi)數(shù)據(jù)?!監(jiān)liver說(shuō),“真正令我感興趣的是現(xiàn)代機(jī)器學(xué)習(xí),其中的算法沒(méi)有明確程序去做任何事情。但它讓你不用深入了解某個(gè)領(lǐng)域,不需要研究信用卡詐騙,也能開(kāi)發(fā)反欺詐模型——你只需要擁有足夠的交易數(shù)據(jù),讓人工智能網(wǎng)絡(luò)學(xué)習(xí)如何對(duì)其進(jìn)行分類(lèi)。”
“同時(shí),單一技術(shù)不足以解決問(wèn)題,我們要提供工具、技術(shù)的組合,如數(shù)據(jù)建模、機(jī)器學(xué)習(xí)、人工智能的有效結(jié)合?!監(jiān)liver說(shuō)。
Oliver提醒,不能盲從自動(dòng)化。他希望自動(dòng)化能在大規(guī)模上幫助人們?nèi)ソ鉀Q問(wèn)題,去建立一些系統(tǒng)或具體機(jī)制,搞清楚不同領(lǐng)域之間的邊界在哪里,這樣的自動(dòng)化才是最有效的方式。
談到目前的人工智能時(shí),Oliver說(shuō)它具備兩個(gè)特點(diǎn):屬于弱人工智能,和基于深度學(xué)習(xí)。他補(bǔ)充說(shuō),分析軟件正在快速轉(zhuǎn)變?yōu)椤罢J(rèn)知空間”,其中感知、聽(tīng)力和手勢(shì)將成為常見(jiàn)的投入形式,而具備人類(lèi)反應(yīng)的讀和寫(xiě)將成為常見(jiàn)的輸出形式。
SAS在人工智能領(lǐng)域有超過(guò)15年經(jīng)驗(yàn)。SAS深度學(xué)習(xí)和認(rèn)知分析將有3個(gè)主要目標(biāo),一是添加到經(jīng)典方法中,實(shí)現(xiàn)更多自動(dòng)化,讓人們具備更少專(zhuān)業(yè)領(lǐng)域知識(shí)也能解決問(wèn)題。二是為客戶(hù)提供深入的學(xué)習(xí)工具,使他們?cè)谄鋽?shù)據(jù)上訓(xùn)練現(xiàn)代機(jī)器學(xué)習(xí)模型。三是將認(rèn)知計(jì)算和深度學(xué)習(xí)輸入到產(chǎn)品中,讓用戶(hù)與軟件的交互更人性化,支持更多個(gè)性化和更多動(dòng)態(tài)行為。
業(yè)界知名企業(yè)都在強(qiáng)化人工智能技術(shù)?!拔覀儏^(qū)分于其他公司的最重要元素是,我們能在單一平臺(tái)上提供所有技術(shù),如預(yù)測(cè)性分析、可視化分析、機(jī)器學(xué)習(xí)、人工智能等,包括影像識(shí)別、語(yǔ)音識(shí)別、情感識(shí)別等。這是其他公司一時(shí)很難具備的?!?
擁抱眾人的力量
谷歌將機(jī)器學(xué)習(xí)、人工智能等技術(shù)開(kāi)源,目的是結(jié)合眾人的智慧,把AI技術(shù)應(yīng)用于各種場(chǎng)景中。傳統(tǒng)軟件企業(yè)該怎么改變?SAS提出了開(kāi)放。Oliver稱(chēng),開(kāi)放的含義是擁抱開(kāi)源,有更強(qiáng)包容性,讓客戶(hù)使用不同開(kāi)源技術(shù)開(kāi)發(fā)的軟件,都能與SAS平臺(tái)整合起來(lái)。“這樣的架構(gòu),擁抱了所有力量”。
“開(kāi)放理念還體現(xiàn)在云技術(shù)的延展上?!監(jiān)liver補(bǔ)充說(shuō)。SAS在去年推出名為Viya的新平臺(tái),這是一個(gè)云就緒(Cloud Ready)產(chǎn)品。41年前,當(dāng)SAS開(kāi)始進(jìn)行高性能分析時(shí),一直開(kāi)發(fā)針對(duì)大數(shù)據(jù)量、高性能的算法。2009年,隨著業(yè)界向分布式計(jì)算轉(zhuǎn)移的速度加快,SAS也學(xué)習(xí)如何將高級(jí)分析和數(shù)據(jù)管理從單臺(tái)計(jì)算機(jī)擴(kuò)展到多臺(tái)機(jī)器的環(huán)境中。SAS Viya是這項(xiàng)努力的成果。
“云是一個(gè)概念,而不是某個(gè)地方?!監(jiān)liver強(qiáng)調(diào)說(shuō)??蛻?hù)不用擔(dān)心是哪一種云,他們可以在私有云、公有云或者混合云靈活運(yùn)用數(shù)據(jù)分析平臺(tái)。SAS大中華區(qū)總裁吳輔世先生透露,在中國(guó),在公有云市場(chǎng),SAS也正與阿里云、騰訊云、華為云探討不同的合作。
跨公司的抗癌藥數(shù)據(jù)平臺(tái)
開(kāi)發(fā)也意味數(shù)據(jù)能力的開(kāi)發(fā),這讓數(shù)據(jù)能發(fā)揮價(jià)值。
“現(xiàn)在業(yè)界比較糾結(jié)的是,他們不知道怎樣將數(shù)據(jù)正確結(jié)合起來(lái)。比如,僅僅在一家公司內(nèi)部,一個(gè)系統(tǒng)和另外一個(gè)系統(tǒng)有沒(méi)有連接性,能不能兼容,就是公司面臨的挑戰(zhàn)?!監(jiān)liver說(shuō),“我們當(dāng)然希望看到數(shù)據(jù)在不影響安全隱私的情況下,在更大范圍中得到共享和傳輸,因?yàn)楂@得的數(shù)據(jù)越多,就越有助于分析?!?/p>
“SAS有這樣的數(shù)據(jù)管理產(chǎn)品,幫助跨平臺(tái)的數(shù)據(jù)共享。”吳輔世說(shuō)。SAS倡導(dǎo)數(shù)據(jù)為善(Data for Good), 參與公益組織獨(dú)立非營(yíng)利性行動(dòng)計(jì)劃Project Data Sphere項(xiàng)目。PDS平臺(tái)為全球研究群體提供可以廣泛共享、整合并分析過(guò)往病患層次第三階段癌癥對(duì)照組數(shù)據(jù)的空間,目標(biāo)是推動(dòng)未來(lái)研究,改善全球癌癥患者及其家人的生活。SAS將利用預(yù)測(cè)建模、網(wǎng)格計(jì)算、高性能分析和數(shù)據(jù)可視化等技術(shù)對(duì)巨量數(shù)據(jù)進(jìn)行處理,幫助研究者產(chǎn)生新的發(fā)現(xiàn)和信息。
人人都是數(shù)據(jù)分析師
在過(guò)去多年,如果說(shuō)數(shù)據(jù)分析是少數(shù)專(zhuān)業(yè)人士的“練武之地”的話(huà),今天越來(lái)越多的企業(yè)開(kāi)始接受“人人都是數(shù)據(jù)分析師”的理念。海爾首席數(shù)據(jù)官表示,10年后,海爾將實(shí)現(xiàn)每位員工都是數(shù)據(jù)分析師的愿景。
這也是為什么市場(chǎng)研究公司Gartner在其商業(yè)智能魔力四象限的最新評(píng)價(jià)體系中,更強(qiáng)調(diào)自助服務(wù)、自助數(shù)據(jù)準(zhǔn)備和單用戶(hù)應(yīng)用環(huán)境。這也讓SAS和其他一些老牌企業(yè)級(jí)數(shù)據(jù)分析企業(yè)離開(kāi)了領(lǐng)導(dǎo)者象限。
不過(guò),SAS也很快做出改變?!拔曳浅Y澇伞巳硕际菙?shù)據(jù)分析師的理念,因?yàn)槲覀兲幵谝粋€(gè)‘分析經(jīng)濟(jì)中,要營(yíng)造一個(gè)以數(shù)據(jù)為中心,關(guān)注數(shù)據(jù)分析的氛圍或文化。到今年秋季,這樣的自助服務(wù)也會(huì)出現(xiàn)在我們的可視化分析平臺(tái)上?!監(jiān)liver說(shuō),“這是一個(gè)逐漸演變的過(guò)程。我個(gè)人覺(jué)得還可以開(kāi)發(fā)一些認(rèn)知指導(dǎo)工具,來(lái)輔助數(shù)據(jù)分析師。它結(jié)合了認(rèn)知計(jì)算、人工智能,效果更好?!?/p>
在不久前的數(shù)博會(huì)期間,SAS與貴陽(yáng)政府簽訂戰(zhàn)略合作協(xié)議,成立大數(shù)據(jù)分析實(shí)訓(xùn)基地以及大數(shù)據(jù)金融量化實(shí)驗(yàn)室,將針對(duì)最新金融風(fēng)險(xiǎn)管理、整合型大金融風(fēng)險(xiǎn)管理的計(jì)量模型、預(yù)測(cè)模型做更多研究。
伴隨中國(guó)更多領(lǐng)域嘗試數(shù)據(jù)分析,SAS在中國(guó)的業(yè)務(wù)重心也從銀行、保險(xiǎn)和電信進(jìn)一步擴(kuò)展到制造和政府市場(chǎng)?!拔覀冋哟笪覀兊耐顿Y力度?!眳禽o世先生說(shuō)。