劉佳
公司介紹:
第四范式是國際領(lǐng)先的人工智能技術(shù)與服務提供商。具備國際頂尖的機器學習技術(shù),能夠?qū)?shù)據(jù)進行精準挖掘與預測,幫助企業(yè)實現(xiàn)智能變革、提升運營績效、創(chuàng)造商業(yè)價值。團隊已為金融、電信、互聯(lián)網(wǎng)等100多個企業(yè)成功打造人工智能解決方案,是人工智能工業(yè)應用的引領(lǐng)者與踐行者。創(chuàng)始人戴文淵兼任CEO,聯(lián)合創(chuàng)始人楊強為首席科學家。
挑戰(zhàn)AlphaGo 下無人走過的棋
“要想戰(zhàn)勝AlphaGo,必須控制好自己的‘心魔?!?/p>
兩年間,人工智能系統(tǒng)AlphaGo騰空出世,先以4:1狂虐韓國九段高手李世石,次年又將排名世界第一的中國棋手柯潔直落三局挑落馬下,一時間名聲大噪。面對人工智能的咄咄逼人,有人贊嘆,有人擔憂??聺嵣踔猎谫惡篦鋈粶I下,直言AlphaGo就像神一般的存在,貌似無懈可擊。
然而,在人工智能領(lǐng)域已經(jīng)浸染十余年的戴文淵卻并不這么認為?!癆lphaGo所基于的人工智能技術(shù),強項不在于推演,而是借鑒過去的棋譜。所以,如果要擊敗AlphaGo,需要盡可能把局面導向歷史上沒人下過的棋?!贝魑臏Y所說的“棋譜”,對于人工智能而言,就是“大數(shù)據(jù)”。正如人類會經(jīng)歷很多的事情,得出一些知識和經(jīng)驗,幫助未來做的更好。人工智能就是從數(shù)據(jù)中總結(jié)出有價值的信息,以預測未來發(fā)生的事情。
同時戴文淵還提到了人與人工智能的另一個區(qū)別——情緒。人在進退得失之間便會生出各種情緒,或焦慮、或緊張、或自滿,而人工智能卻完全不具有人類的情緒弱點。戴文淵曾經(jīng)在網(wǎng)上撰文表示:“要想戰(zhàn)勝AlphaGo,必須控制好自己的‘心魔。”
在A I領(lǐng)域已經(jīng)是頂尖專家的戴文淵,其實在3年前創(chuàng)建第四范式并擔任公司CEO的時候也只有30歲出頭。在外人眼中,這不過是一個戴黑邊框眼鏡,愛鉆研算法和編程的標準理工男創(chuàng)業(yè)的故事罷了,但是當他坐在記者面前彬彬有禮地講述人工智能的發(fā)展和未來時,你會發(fā)現(xiàn)事實上遠沒那么簡單——你完全跟不上戴文淵的思路。這是一個邏輯縝密、判斷力強并且不按套路出牌的年輕科學家。
以終為始 一切順理成章
“先判斷趨勢,建立目標,然后以終為始,將目標拆解成一層層的任務,逐步實現(xiàn),所以我覺得一切都是順理成章的。”
戴文淵曾就讀于上海交通大學計算機系的一個實驗班。在2005年,他獲得了由美國計算機協(xié)會(ACM)主辦的ACM國際大學生程序設(shè)計競賽世界冠軍,這個被譽為“計算機界奧林匹克”的比賽云集了全球智商最高的人,戴文淵是為數(shù)不多的華人冠軍。
頭頂世界冠軍頭銜的戴文淵,在研究生階段卻毅然選擇了當時被世人冷落的人工智能方向?!?0多年前,正是人工智能發(fā)展的低潮期,幾乎沒有畢業(yè)生主動選擇這個方向。如果那時候你跟誰說AI能做起來,一定會被質(zhì)疑的?!贝魑臏Y回憶起最初選擇時的情景,“但根據(jù)我的判斷,人工智能一定會大有作為?!?/p>
戴文淵的不按常理出牌還體現(xiàn)在學術(shù)前程將一片光明的他,主動放棄了讀博的機會,而是選擇去了百度。當時百度還沒現(xiàn)在這么火,只是一家發(fā)展中的公司,很多人難以理解他的選擇。對此,戴文淵解釋道:“我在人工智能的研究路上,必須要通過海量的數(shù)據(jù)不斷驗證自己的算法是否正確,當時在國內(nèi),只有百度能夠滿足我的需求?!?/p>
戴文淵將百度視為一座開放的大實驗室,繼續(xù)著他在人工智能方面的深入鉆研。他與當時同在百度,現(xiàn)第四范式聯(lián)合創(chuàng)始人、首席研究科學家陳雨強一起,成功搭建了世界上首個商用深度學習系統(tǒng),也就是百度的“鳳巢”廣告系統(tǒng)——同時,這也是世界上最大的商用深度學習系統(tǒng)。“鳳巢”系統(tǒng)的成功驗證了在超大規(guī)模數(shù)據(jù)中人工智能確實能給業(yè)務帶來正向效果,百度的變現(xiàn)能力也一下子4年提升了8倍。這讓戴文淵的團隊獲得了百萬美金的“百度最高獎”,同時他也成為了百度歷史上最年輕的高級科學家(T10級)。
就當人們在推測戴文淵升入百度更高一級的管理層只是時間問題時,他卻再一次出人意料地跳槽去了華為,擔任起諾亞方舟實驗室的主任科學家。對此,他的解釋是:“在百度,我實現(xiàn)了作為一名科學家的夢想,就是看到AI能夠在產(chǎn)業(yè)界落地。去華為,則是為了驗證這種技術(shù)能給一家公司創(chuàng)造價值后,能否給更多公司創(chuàng)造價值。”
戴文淵在華為嘗試用企業(yè)服務的方式做AI,為客戶提供AI解決方案,讓AI幫助不同企業(yè)獲得效益和效率的提升。當他在百度和華為都獲得成功之后,戴文淵不再滿足于讓AI服務僅僅局限于為一家或幾家企業(yè),他認為AI應該遍地開花,造福全社會,希望找到一家能夠服務各行各業(yè)的公司。然而,當時創(chuàng)業(yè)的風口以及投資的熱點都在做O2O上,人工智能的概念還沒有被普遍接受,所以戴文淵并沒有找到理想中的公司。于是,他決定自己創(chuàng)業(yè),成立“第四范式”,致力于降低AI的應用門檻,讓人工智能變得觸手可及。
在各大互聯(lián)網(wǎng)的論壇和群里,戴文淵被年輕的IT學子們稱呼為“戴神”,因為戴文淵總能做出令人意料不到,但事后證明非常正確的選擇。從十幾年前選擇了不被看好的人工智能方向,到率先走進AI商業(yè)落地實踐,再到獨立創(chuàng)業(yè)、立志要讓AI觸手可及,他的每一步都走在了時代的前面。
對此,戴文淵很淡然:“我是一個偏目標導向的人,先判斷趨勢,建立目標,然后以終為始,將目標拆解成一層層的任務,逐步實現(xiàn),所以我覺得一切都是順理成章的?!鼻兄泻诵模靼鬃约阂裁?,之后全力以赴,用簡單的方法化解復雜的問題,戴文淵深得“重劍無鋒,大巧不工”的精髓。
一路以來,戴文淵身邊還有一位同樣頗具傳奇色彩的人物,那就是他的導師——首位華人國際人工智能聯(lián)合會議(IJCAI)理事會主席,國際人工智能協(xié)會(AAAI)唯一的華人Councilor楊強教授。楊強學習天文出身,曾在美國馬里蘭大學學習天體物理,后來轉(zhuǎn)行進入人工智能領(lǐng)域,很多人無法理解他這么大的轉(zhuǎn)變,認為完全是兩個不同的世界。然而在楊強看來,兩者卻有著相通的地方,那就是都需要建模型,從給宇宙建模,轉(zhuǎn)向給機器建模,“想通過編程的手段實現(xiàn)機器的智能”,這個理想一堅持就是30年。endprint
楊強與戴文淵相識于人工智能式微之時,戴文淵作為訪問學者來到香港科技大學,成為楊強教授的門下弟子。那是2006年的秋天,當時人們談論AI的時候都很小心翼翼,擔心被誤認為是忽悠人的騙子。在這種背景下,這兩個堅信人工智能必將騰飛的人就更加“惺惺相惜”。在沒有經(jīng)費支持的情況下,楊強帶著戴文淵投入其中,潛心鉆研,做了很多開創(chuàng)性的工作,一直堅持到人工智能的破曉時分,直到今天的天光大亮。
“有時候也會迷茫、會動搖,或者爭強好勝,想把步子邁得再大一點。但是身旁有楊老師時刻在指導著、督促著、寬慰著,我就能夠冷靜下來處理各種困局?!贝魑臏Y坦言,楊強不僅是自己學業(yè)上的導師,更是精神上的燈塔,“這一路走來,只要抬頭看到那束光,心里就特別踏實?!?/p>
有境無界 讓“AI for everyone”
“我們的目標就是讓一個完全不懂技術(shù)的‘小白經(jīng)過大概2周到1個月的時間,可以成為一名合格的AI應用專家?!?/p>
2015年,戴文淵與導師楊強,以及一批志同道合的行業(yè)深耕者們創(chuàng)立了一家人工智能技術(shù)與服務提供商,取名“第四范式”。這個名字的由來,是取自圖靈獎得主、關(guān)系數(shù)據(jù)庫的鼻祖Jim Gray生前的最后一次演講。他將人類科學的發(fā)展定義成為四個“范式”,其中“第四范式”是指通過收集大量的數(shù)據(jù),讓計算機去總結(jié)規(guī)律,即人工智能階段。從這個頗為新穎但寓意深遠的名字中,也能體現(xiàn)戴文淵和范式創(chuàng)業(yè)者們身上追求卓越的極客精神。
兩年前,戴文淵將公司從深圳福田的公寓樓搬到了有“中國硅谷”之稱的北京上地,員工人數(shù)也從最初不到十人壯大到數(shù)百人,公司發(fā)展態(tài)勢迅猛,但始終沒變的是戴文淵創(chuàng)業(yè)的初衷,即要降低AI工業(yè)落地的門檻。
2017年7月5日,在“百度AI開發(fā)者大會”上,百度宣布將開放60項AI核心能力,為每一位開發(fā)者消除障礙,創(chuàng)造共贏機會。對于這個舉措,楊強教授表示贊賞,但同時覺得還遠遠不夠:“百度的做法是為程序員降低門檻,而第四范式要做的,是為所有領(lǐng)域的企業(yè)降低門檻。”
在戴文淵看來,雖然人工智能已經(jīng)引燃了全球科技圈,但目前仍是一項應用難度頗高的技術(shù),很多企業(yè)都在門外徘徊,因為成本和人才的門檻高昂,很難順利完成自有AI系統(tǒng)的構(gòu)建。第四范式希望每個企業(yè)都能用上人工智能,擁有自己的人工智能策略,真正實現(xiàn)AI for everyone,并一直在為此努力。2017年12月3日,在舉世矚目的第四屆世界互聯(lián)網(wǎng)大會上,第四范式正式發(fā)布了“第四范式·先知”3.0版“企業(yè)人工智能核心系統(tǒng)”,助力企業(yè)快速構(gòu)建以AI為中心的組織架構(gòu),通過智變贏得AI時代。戴文淵在發(fā)布現(xiàn)場談到,“企業(yè)人工智能核心系統(tǒng)”將大大降低人工智能的應用創(chuàng)新門檻。該系統(tǒng)包含數(shù)據(jù)核心、算法核心和生產(chǎn)核心三大模塊,覆蓋了機器學習工業(yè)落地全流程。數(shù)據(jù)核心通過對數(shù)據(jù)規(guī)范及標準化,讓業(yè)務之間的數(shù)據(jù)在系統(tǒng)內(nèi)互相受益、互相貢獻;算法核心通過封裝前沿算法,降低模型建立門檻,快速訓練出高維、閉環(huán)、實時的AI模型;生產(chǎn)核心簡化了AI模型從線下訓練到線上生成的流程,將數(shù)據(jù)價值轉(zhuǎn)變?yōu)锳I的預判能力。未來,企業(yè)可根據(jù)業(yè)務需要,自主選擇相應組件或模塊進行配置,依托系統(tǒng)的自動整合能力,靈活設(shè)計出AI解決方案。與此同時,隨著創(chuàng)新模式的簡化升級,企業(yè)生產(chǎn)經(jīng)營重心還將從“跑馬圈地的鋪量競爭”進入“技術(shù)驅(qū)動的精細化競爭”,人工智能的策略價值凸顯。未來,在“企業(yè)人工智能核心系統(tǒng)”中,大多數(shù)的一線決策行為會由效率更高的人工智能來完成,企業(yè)可以在投入最少人力、財力的成本下,獲得強大生產(chǎn)力。
其實,早在一年前,第四范式發(fā)布的“第四范式?先知”1.0版,就是當時全球首個面向開發(fā)者的商用AI全流程平臺,通過自動化機器學習程序,首次歷史性地降低了機器學習建模過程中的人工參與程度,解決了怎樣讓更多開發(fā)者參與到AI研發(fā)的問題。第四范式憑借“先知”平臺,在“第六屆吳文俊人工智能科學技術(shù)獎”的評選中榮獲一等獎。這是中國智能科技領(lǐng)域的最高獎,歷年來只授予高校、實驗室和科研機構(gòu),這次授予企業(yè),實屬首例。
“為什么人工智能的問題只有少數(shù)專家能解決?就是因為太復雜了,要調(diào)各種參數(shù),要做各種設(shè)置。我們要做的就是將AI難度最高的部分封裝成自動化程序,使其更易用,讓更多人邁進門來。”楊強做了一個形象的比喻,“以前玩攝影拍照片,使用的是單反相機,很專業(yè)。你需要明白什么叫光圈、快門、ISO,不是內(nèi)行的人根本拍不出理想的照片。而你看現(xiàn)在,一部智能手機就解決了,你根本不用懂成像原理,參數(shù)設(shè)置什么的也不用你去管,只需要你把想要的畫面收入框內(nèi),點一下按鍵就行了,這就是門檻降低了,‘先知平臺要做的就是這個事情?!?/p>
“從企業(yè)客戶的角度看,使用‘企業(yè)人工智能核心系統(tǒng)完成企業(yè)智能升級僅需三步。第一步,明確業(yè)務目標;第二步,收集在完成這個目標過程中的數(shù)據(jù);第三步,‘企業(yè)人工智能核心系統(tǒng)自動化解決機器學習問題,并推動企業(yè)優(yōu)化業(yè)務模式,提高生產(chǎn)運營效率。”戴文淵解釋著,第四范式的目標就是要把一個專業(yè)級人士才能做到的事情變成一個類似傻瓜相機式的核心系統(tǒng)。
2016年的年底,第四范式內(nèi)部進行了一場“特殊”的競賽——全世界首個面向非專業(yè)人士的建模大賽。公司里面的AI專家們這次成了觀眾,參加比賽的都是做銷售、公關(guān)、行政、人力等非專業(yè)出身的AI“小白”。比賽結(jié)果令人振奮,這些非專業(yè)人士基于“先知”平臺,有超過70%的參賽組合AUC成績跨過0.8大關(guān)(AUC是衡量模型效果的專業(yè)指標,取值在0到1之間)。要知道,在實際業(yè)務中,凡是AUC高于0.8的模型就已經(jīng)達到工業(yè)水準。而在整個行業(yè)中,只有極少數(shù)深耕機器學習多年、擁有豐富大規(guī)模數(shù)據(jù)處理經(jīng)驗的數(shù)據(jù)“大神們”才能搭建出A U C0.8以上的模型。對于這個比賽結(jié)果,戴文淵談到,“我們的目標就是讓一個完全不懂技術(shù)的‘小白經(jīng)過大概2周到1個月的時間,可以成為一名合格的AI應用專家。現(xiàn)在,我們離目標又近了一步?!眅ndprint
商業(yè)化階段,降低了門檻的人工智能技術(shù)會滲透到每一個場景、每一種服務中。目前第四范式主要聚焦在金融和互聯(lián)網(wǎng)領(lǐng)域,幫助這些行業(yè)充分挖掘蘊藏在數(shù)據(jù)背后的潛在價值。“通俗點講,我們其實在做一件事,讓機器看業(yè)務數(shù)據(jù),然后寫業(yè)務規(guī)則,從而替代原來由業(yè)務專家主導的總結(jié)規(guī)律、寫業(yè)務規(guī)則的過程,比如,讓機器看金融欺詐的數(shù)據(jù),總結(jié)反欺詐的規(guī)則;看醫(yī)療的數(shù)據(jù),總結(jié)診斷的規(guī)則;看廣告轉(zhuǎn)化率的數(shù)據(jù),總結(jié)廣告投放的規(guī)則等。最終通過人工智能幫助這個行業(yè)的企業(yè)提升運營效益?!?/p>
以金融領(lǐng)域為例,在與某股份制銀行合作反欺詐解決方案中,第四范式就利用超高維AI技術(shù),僅基于一年的交易數(shù)據(jù),就幫助該銀行寫出25億條反欺詐規(guī)則,不僅包含傳統(tǒng)專家規(guī)則無法覆蓋的“非典型區(qū)域”的“非典型特征”,而且對于不斷更新中的欺詐方式也都一網(wǎng)打盡。最終,第四范式反欺詐系統(tǒng)的實際上線效果較傳統(tǒng)專家規(guī)則提升數(shù)倍,同時大幅降低銀行的人力成本和運營成本。
據(jù)了解,第四范式的高維度的機器學習技術(shù),已經(jīng)完整覆蓋了精準識別客戶貸前、貸中、貸后的需求及風險,提供包括精準獲客、個性化推薦、申請評分卡、申請反欺詐、交易反欺詐、逾期/流失預警、流動性管理、智能催收、不良資產(chǎn)處置等一體化整體解決方案。
目前第四范式已與數(shù)十家大中型銀行展開深度合作,幫助合作伙伴快速構(gòu)建人工智能的數(shù)據(jù)智能核心系統(tǒng),完成從數(shù)據(jù)到價值的升級轉(zhuǎn)化。在其他領(lǐng)域,第四范式技術(shù)還涵蓋了更多的行業(yè)應用場景,例如醫(yī)療、制造、零售等。
戴文淵總結(jié)說,這就是“有境無界”,即在適應行業(yè)規(guī)則的環(huán)境下,創(chuàng)造出沒有邊界的使用價值。
憧憬未來 做一家偉大的公司
“華人一定要發(fā)展、創(chuàng)新和引領(lǐng)一些前沿的理論,不能光跟著別人走。我們要做別人跟著我們走的東西,比如遷移學習就是?!?/p>
毋容置疑,人工智能技術(shù)的影響程度將是一次跨時代的科技革命,甚至未來整個社會形態(tài)都會發(fā)生根本性變革。但就在人工智能的高光時刻,戴文淵和楊強卻保持著足夠的冷靜,他們深知目前的人工智能并不是無所不能,其中最大的弱點之一就是缺少遷移學習的能力。
遷移學習是人類智慧的一種特質(zhì),我們可以利用一個環(huán)境中學到的知識,舉一反三、觸類旁通地來完成新環(huán)境中的學習任務,這對人類來說是非常自然的,但是人工智能還做不到。
AlphaGo在戰(zhàn)勝李世石的3個月后,它的幕后主腦Deepmind的創(chuàng)始人在接受采訪時稱,他們已經(jīng)在開始探尋一種更新更強的技術(shù),這種技術(shù)能讓強化學習系統(tǒng)把基礎(chǔ)建立在已習得的知識上,而不用每一次都從頭學起。他們說的便是“遷移學習”(transfer learning)。
這一次,第四范式又一次成為AI前沿領(lǐng)域的先行者。戴文淵和楊強早在10年前,就把關(guān)注的目光投向了遷移學習。楊強早就指出:“深度學習是過去,強化學習是現(xiàn)在,而遷移學習是未來!”
戴文淵介紹,遷移學習可以解決目前機器學習中必須要依賴海量數(shù)據(jù)的困局。雖然互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)催生數(shù)據(jù)爆炸式增長,但在很多傳統(tǒng)企業(yè)和非互聯(lián)網(wǎng)領(lǐng)域仍然存在數(shù)據(jù)量小的問題,小數(shù)據(jù)上如何能夠?qū)崿F(xiàn)人工智能,這就需要遷移學習。醫(yī)療領(lǐng)域就是一個典型,有一些發(fā)病率較低的疾病樣本數(shù)量很少,但會存在與它相關(guān)聯(lián)的疾病和治療方法,我們就可以通過已有的模型進行遷移,從而對疑難雜癥進行數(shù)據(jù)分析從而得出有效的診療方案。
“華人一定要發(fā)展、創(chuàng)新和引領(lǐng)一些前沿的理論,不能光跟著別人走。別人做深度學習,我們也做深度學習。別人做強化學習,我也跟著做強化學習。我們要做別人跟著我們走的東西,比如遷移學習就是?!睏顝娙缡钦f。
如今,在遷移學習領(lǐng)域,戴文淵憑借10年前發(fā)表的一篇論文(Boosting for Transfer Learning),單篇論文引用至今排名世界第三。排在第一的,正是他的導師楊強。同時,第四范式已經(jīng)在金融領(lǐng)域成功驗證了遷移學習的工業(yè)可行性與積極作用。為了解決銀行大額貸款業(yè)務數(shù)據(jù)量不足,無法滿足人工智能應用的難題,第四范式利用基于遷移學習技術(shù)的“先知”平臺,將小額貸款的模型遷移到上億級的大額貸款業(yè)務中,準確預判出了客戶的辦理需求,最終實現(xiàn)客戶營銷響應率提升200%。
第四范式已經(jīng)走在了人工智能的國際前列,作為掌門人的戴文淵考慮的問題也越來越多。盡管人工智能現(xiàn)在“熱得發(fā)燙”,但在戴文淵眼中,現(xiàn)在的AI距離多領(lǐng)域、多場景的廣泛爆發(fā)和便捷的商業(yè)化落地還有一段漫長的路要走。“再好的技術(shù),如果不能形成產(chǎn)業(yè)化,不能為國民服務,也只是一個看上去很漂亮的泡泡而已?!贝魑臏Y從不否認這個行業(yè)里存在著泡沫。AI也是江湖,里面有實打?qū)嵉捻敿飧呤?,也不乏渾水摸魚的投機者。勢必要經(jīng)過一場華山論劍之后,依然能夠屹立不倒的方顯英雄本色。
當記者追問第四范式能否在AI領(lǐng)域“笑傲江湖”的時候,戴文淵答道:“人工智能這個市場足夠大,大到能夠出現(xiàn)下一個IBM和BAT的市場,但我只想不忘初心,不忘我們的理想,去做一家偉大的公司?!眅ndprint