沈玉姍
AlphaGo擊敗柯潔,令人工智能的商業(yè)化命題再度引發(fā)熱議。計(jì)算機(jī)視覺(jué)作為國(guó)內(nèi)人工智能最先成熟的工業(yè)級(jí)賽道,更被外界長(zhǎng)期視為坐擁“四個(gè)獨(dú)角獸”的巨型角斗場(chǎng)。其中,商湯科技并非最早成立的一家,卻后發(fā)制人,先后獲得來(lái)自IDG資本、Star VC、鼎暉投資、萬(wàn)達(dá)投資、賽領(lǐng)資本在內(nèi)的多輪投資,估值超過(guò)10億美元。商湯科技聯(lián)合創(chuàng)始人、CEO徐立博士告訴《21CBR》記者,公司已經(jīng)在多個(gè)行業(yè)實(shí)現(xiàn)規(guī)模變現(xiàn)。
徐立有著典型的人工智能科學(xué)家背景,在香港中文大學(xué)就讀博士期間,其與導(dǎo)師賈佳亞教授研發(fā)的圖像去模糊技術(shù)將圖像清晰度提升了100倍,被視為是全球圖像處理的一大突破。以研發(fā)實(shí)力聞名的商湯也一度被“學(xué)術(shù)氣息”所標(biāo)簽化。徐立認(rèn)為,人工智能還遠(yuǎn)未走向技術(shù)同質(zhì)化的時(shí)代,若技術(shù)上不構(gòu)成領(lǐng)先性和差異化,將難以跟上行業(yè)變化。對(duì)于人工智能的商業(yè)落地,商湯則自有一套驅(qū)動(dòng)行業(yè)的經(jīng)營(yíng)哲學(xué)。
21CBR:智能視頻目前是“人工智能+安防”的行業(yè)熱點(diǎn),你在去年也提過(guò)類(lèi)似觀點(diǎn),這塊的市場(chǎng)存量有多大?
徐立:安防一直是國(guó)家大力發(fā)展的領(lǐng)域,也是十三五規(guī)劃的重點(diǎn)行業(yè)。從政府投入來(lái)看,今年也要投入2000-3000億。傳統(tǒng)安防領(lǐng)域的最大廠商,去年?duì)I業(yè)額在300多億。所以,這塊目前有足夠的市場(chǎng)空間。
今年的視頻業(yè)務(wù)和去年的人臉識(shí)別有些類(lèi)似。去年,業(yè)內(nèi)都在嘗試和落地人臉識(shí)別的具體應(yīng)用,到今年進(jìn)入相對(duì)成熟期,業(yè)務(wù)增長(zhǎng)很快。今年,智能視頻業(yè)務(wù)也在各地展開(kāi)試點(diǎn),整體發(fā)展正處在一個(gè)大的行業(yè)機(jī)會(huì)點(diǎn)上。
視頻業(yè)務(wù)何時(shí)落地,核心問(wèn)題在于明確產(chǎn)品的商用標(biāo)準(zhǔn)。工業(yè)界的一個(gè)標(biāo)準(zhǔn)紅線是評(píng)估產(chǎn)品是否超過(guò)所謂人眼的準(zhǔn)確率,這也是人臉識(shí)別逐漸商用化的原因。但是視頻內(nèi)容的分析和人相比效果上還有差距。目前全球每天有2.5億只安防攝像頭在記錄,視頻數(shù)據(jù)輸入達(dá)到一定規(guī)模,但在智能處理上還很欠缺,而核心算法的突破將成為最關(guān)鍵的落地因素之一。
21CBR:商湯切入安防領(lǐng)域有哪些布局,如何構(gòu)建自己的智能視頻生態(tài)鏈?
徐立:商湯在安防領(lǐng)域的產(chǎn)品體系分為兩類(lèi):一類(lèi)是成熟的業(yè)務(wù)系統(tǒng),需要基于客戶方的具體業(yè)務(wù)邏輯進(jìn)行設(shè)計(jì),比如怎樣做多視頻協(xié)調(diào),如何做人像處理等,代表產(chǎn)品是SenseFace人臉布控系統(tǒng)和SenseVideo視頻結(jié)構(gòu)化系統(tǒng),另一類(lèi)是業(yè)務(wù)系統(tǒng)中的核心算法模塊,包括動(dòng)靜態(tài)比對(duì)服務(wù)器、人群分析服務(wù)器和結(jié)構(gòu)化服務(wù)器等,屬于相對(duì)標(biāo)準(zhǔn)化的產(chǎn)品。
舉例來(lái)說(shuō),我們?cè)谝曨l結(jié)構(gòu)化系統(tǒng)上做了很大突破。以往的視頻結(jié)構(gòu)化系統(tǒng)只能通過(guò)身高、性別等屬性來(lái)查詢(xún)視頻信息,SenseVideo實(shí)現(xiàn)了自然語(yǔ)言的信息查詢(xún)。我們做了1.3萬(wàn)人的案例測(cè)試,總共生成了9000多個(gè)自然語(yǔ)言構(gòu)成的關(guān)鍵詞。對(duì)于辦案人員來(lái)說(shuō),通過(guò)自然語(yǔ)言來(lái)描述罪犯、完成案件信息的視頻檢索是更常見(jiàn)的業(yè)務(wù)邏輯,也比根據(jù)屬性搜索來(lái)得更加精準(zhǔn),未來(lái)將是一個(gè)新的業(yè)務(wù)形態(tài)。
目前商湯在安防市場(chǎng)相較領(lǐng)先,前十大安防廠商一半以上是我們客戶,商湯為其提供標(biāo)準(zhǔn)化模塊和業(yè)務(wù)子系統(tǒng)。同時(shí),我們也在國(guó)內(nèi)重點(diǎn)城市建立本地化業(yè)務(wù)。去年,商湯的智能視頻業(yè)務(wù)(Intelligent Video Analytics)已占公司整體業(yè)務(wù)的40%,今年這一勢(shì)頭依舊良好。
21CBR:比起發(fā)展客戶,商湯似乎更擅長(zhǎng)行業(yè)聯(lián)盟,商湯的市場(chǎng)開(kāi)拓邏輯怎樣的?
徐立:首先,無(wú)論賣(mài)什么產(chǎn)品,最后都要接觸到甲方。但是,我一直認(rèn)為,B2B企業(yè)如果要起量、要規(guī)?;a(chǎn)品一定是相對(duì)標(biāo)準(zhǔn)化的。如果每次銷(xiāo)售的方案都是定制化服務(wù),企業(yè)的ROI(投資回報(bào)率)就會(huì)比較低。相反,集成商則可以將商湯與電信方、施工方等等連接起來(lái),在各地做出標(biāo)桿性的項(xiàng)目,再用標(biāo)準(zhǔn)化的形式去鋪開(kāi)。
這里的標(biāo)準(zhǔn)化不是一蹴而就的,而是來(lái)自產(chǎn)品和項(xiàng)目的逐次迭代。比如前面提到的比對(duì)服務(wù)器,再往上可能是一套帶著攝像頭的子系統(tǒng),最后則是一整套的訓(xùn)練部署平臺(tái)。通過(guò)深入行業(yè)、做細(xì)項(xiàng)目,商湯不斷把標(biāo)準(zhǔn)化的范圍擴(kuò)大,并聚合客戶的需求從而形成共有需求,最終完成標(biāo)準(zhǔn)化產(chǎn)品的打磨過(guò)程。
因此,商湯一直把自己定位成一個(gè)技術(shù)公司,而不是集成商公司。商湯能做的是集中力量攻破核心算法和技術(shù)。這個(gè)技術(shù)不是單點(diǎn)的、閉門(mén)造車(chē)的技術(shù),而是以打通上下游的客戶需求、構(gòu)建產(chǎn)業(yè)鏈條來(lái)實(shí)現(xiàn)的。就像英特爾不直接向終端用戶銷(xiāo)售芯片,而是通過(guò)上下游的合作伙伴,比如主板廠商、主機(jī)廠商等實(shí)現(xiàn)筆記本電腦的銷(xiāo)售,但用戶仍然了解產(chǎn)品背后有英特爾領(lǐng)先的芯片技術(shù),這也是商湯所追求的:做行業(yè)的賦能者。
21CBR:業(yè)界普遍在談AI同行業(yè)的深度結(jié)合,各家公司從技術(shù)表現(xiàn)來(lái)看也大致相當(dāng)。對(duì)此你怎么看?
徐立:很多人覺(jué)得,深度學(xué)習(xí)已經(jīng)形成開(kāi)源生態(tài),技術(shù)沒(méi)那么重要了,打通行業(yè)才是關(guān)鍵。這里面有一個(gè)重要前提:深度學(xué)習(xí)是否已經(jīng)成熟、不會(huì)再變化了。然而,學(xué)術(shù)界目前有關(guān)深度學(xué)習(xí)的文章大部分都是工程實(shí)踐型的,新的實(shí)驗(yàn)結(jié)果不斷推翻前人做出的理論解釋?zhuān)笇?dǎo)下一代工業(yè)級(jí)應(yīng)用的技術(shù)原理有待被歸納總結(jié),人工智能距離成熟的“黑盒”還差得很遠(yuǎn)。
例如,從近年來(lái)物體識(shí)別競(jìng)賽的結(jié)果看,識(shí)別準(zhǔn)確率在2013-2017年之間提升了300%,基本與摩爾定律吻合。也就是說(shuō),在某些垂直領(lǐng)域,算法的演進(jìn)已經(jīng)進(jìn)入摩爾定律時(shí)代,不是既有算法的變化,本質(zhì)上是重新設(shè)計(jì)出一套新的引擎算法,從而形成巨大的提升空間。未來(lái)三五年間,深度學(xué)習(xí)還將迎來(lái)革命性的變化,現(xiàn)有的算法如果不趕上,就會(huì)被淘汰。
至于人臉識(shí)別技術(shù)的同質(zhì)化,也是有待商榷的。以抓逃為例,1:1的人像比對(duì)準(zhǔn)確率已經(jīng)遠(yuǎn)遠(yuǎn)超出人眼,但如果要在全國(guó)14億人像庫(kù)中進(jìn)行1:N的實(shí)時(shí)動(dòng)態(tài)比對(duì),目前沒(méi)有一家公司能夠做到,更多只能在細(xì)分場(chǎng)景中使用,比如在某個(gè)小區(qū)里識(shí)別出外來(lái)可疑人員。而這不能算做是最優(yōu)化的應(yīng)用。
因此,怎樣拓展技術(shù)邊界、把精度推向下一個(gè)極限,是人工智能算法迭代的核心關(guān)鍵。我覺(jué)得技術(shù)創(chuàng)業(yè)有兩種可能性:第一類(lèi)是通過(guò)技術(shù)上大的領(lǐng)先性和差異化,帶來(lái)時(shí)間窗口和強(qiáng)壁壘。第二類(lèi)則是對(duì)技術(shù)的應(yīng)用看得非常準(zhǔn),知道在什么地方能夠快速落地變現(xiàn),從而走在行業(yè)前面。這兩方面商湯都在努力,也有信心,最終能夠在市場(chǎng)上形成比較大的差異化。