孟醒
一個(gè)創(chuàng)建剛剛?cè)甑墓?,不僅獲得了大量投資,而且引來(lái)世界一流公司的合作。其開(kāi)發(fā)的無(wú)人駕駛處理器芯片更為領(lǐng)先世界的美國(guó)公司所用,它的啟示在于找到了創(chuàng)新領(lǐng)域的突破點(diǎn),并推出領(lǐng)先的產(chǎn)品。
地平線發(fā)展航路
2015 正式成立于北京,同期成立深圳子公司
2015 獲晨興資本、高瓴資本、紅杉資本、金沙江創(chuàng)投、 線性資本、創(chuàng)新工場(chǎng)和真格基金投資
2016 ADAS原型系統(tǒng)亮相智車優(yōu)行發(fā)布會(huì)
2017 聯(lián)合英特爾于CES聯(lián)合發(fā)布ADAS系統(tǒng)
2017 登榜2017年世界經(jīng)濟(jì)論壇“技術(shù)先鋒”成為中國(guó)唯 一當(dāng)選企業(yè)
2018 地平線智能駕駛方案、智能攝像頭方案全面亮相 2018CES
2018 地平線自動(dòng)駕駛計(jì)算平臺(tái)Matrix及征程2.0架構(gòu)亮 相北京車展
北京地平線機(jī)器人科技有限公司成立于2015年6月8日。僅僅三個(gè)月之后,即當(dāng)年9月,地平線就完成了首輪融資。2016年更獲得風(fēng)險(xiǎn)投資家Yuri Milner的投資。
之所以有如此成績(jī),其創(chuàng)辦人余凱曾說(shuō),地平線創(chuàng)辦之前已有一些根基。余凱是百度深度學(xué)習(xí)研究院的創(chuàng)立者,成功地以FPGA打造深度神經(jīng)網(wǎng)絡(luò)硬件,并領(lǐng)導(dǎo)語(yǔ)音識(shí)別、圖像搜索、百度大腦、百度無(wú)人駕駛等項(xiàng)目建設(shè)。
幾位聯(lián)合創(chuàng)始人都頗具實(shí)力。地平線軟件副總裁楊銘博士,是Facebook人工智能研究院的創(chuàng)始成員之一,曾主持DeepFace項(xiàng)目;地平線算法副總裁黃暢博士,曾擔(dān)任百度主任架構(gòu)師,是計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)、模式識(shí)別和信息檢索等方面的算法研發(fā)專家;地平線硬件副總裁方懿女士,曾任諾基亞大中華區(qū)研發(fā)副總裁,并帶領(lǐng)團(tuán)隊(duì)推出諾基亞智能手機(jī)Lumia520。
我刊上一期的“創(chuàng)業(yè)故事”寫(xiě)的是“寒武紀(jì)”,本期所寫(xiě)為“地平線”,之后可能會(huì)再寫(xiě)到“深鑒”。將這幾家芯片創(chuàng)業(yè)公司進(jìn)行比較,會(huì)是很有意義也很有趣味的。從背景來(lái)說(shuō),“寒武紀(jì)”源自中科院計(jì)算所,相同背景者有聯(lián)想和龍芯。公司成立前已基本成型,從社會(huì)上招聘了一些人來(lái)做產(chǎn)品。深鑒是清華電子+斯坦福的學(xué)術(shù)背景,股東基本為清華系。“寒武紀(jì)”與“深鑒”都是將科技轉(zhuǎn)化為生產(chǎn)力的典型。與上述二者不同,“地平線”不是出自研究所與高校,而是從百度挪移出來(lái)的。但“地平線”不是只做芯片,它還有一個(gè)目標(biāo):“嵌入式人工智能”解決方案,將算法與芯片結(jié)合用在端上。從機(jī)器學(xué)習(xí)鏈條來(lái)說(shuō),“寒武紀(jì)”選取的是最通用的方向,涵蓋所有機(jī)器學(xué)習(xí)的訓(xùn)練和應(yīng)用;“地平線”選擇的是另一端,即最專用的方向,聚焦在算法固化的ASIC芯片;而“深鑒”則是在兩者的中間選了一個(gè)點(diǎn),專做深度學(xué)習(xí)的應(yīng)用處理器。
目標(biāo):AI制高點(diǎn)
今年5月30日,在美國(guó)加州舉辦的Code大會(huì)上,“互聯(lián)網(wǎng)女皇”瑪麗·米克爾發(fā)布了《2018年度互聯(lián)網(wǎng)趨勢(shì)報(bào)告》。該報(bào)告在談到人工智能賦能傳統(tǒng)零售行業(yè)時(shí),舉了“地平線”對(duì)百麗(BELLE)進(jìn)行線下改造的例子。BELLE應(yīng)用地平線芯片對(duì)收集到的用戶數(shù)據(jù)進(jìn)行分析,提升了生產(chǎn)效率,完善了用戶定制化場(chǎng)景等。
以上實(shí)例,只是地平線AI芯片的一個(gè)方向。地平線的目標(biāo)是AI制高點(diǎn)——AI芯片。在余凱看來(lái),在AI芯片領(lǐng)域,中國(guó)的創(chuàng)業(yè)團(tuán)隊(duì)并不落后:“AI芯片由場(chǎng)景和算法驅(qū)動(dòng),需要對(duì)場(chǎng)景、算法、芯片設(shè)計(jì)都有深入的理解、整合、優(yōu)化;目前在AI領(lǐng)域,中國(guó)和世界處在同一水平線上,中國(guó)公司在開(kāi)發(fā)AI應(yīng)用的時(shí)候,應(yīng)該盡量不去依賴別人的算法和處理器,進(jìn)而讓中國(guó)AI產(chǎn)業(yè)贏得最終的競(jìng)爭(zhēng)。”余凱的話是在總結(jié)中國(guó)AI領(lǐng)域現(xiàn)狀的同時(shí),也表達(dá)“地平線”的進(jìn)取心。
而雄心必須落實(shí)到實(shí)際應(yīng)用。地平線的應(yīng)用主要在無(wú)人駕駛和智能攝像頭兩個(gè)領(lǐng)域。在2017年底,地平線推出了首款兩個(gè)版本的嵌入式人工智能芯片。一個(gè)是征程(Journey)1.0處理器,應(yīng)用于智能駕駛;一個(gè)是旭日(Sunrise)1.0處理器,應(yīng)用于智能攝像頭。
征程1.0可同時(shí)對(duì)行人、機(jī)動(dòng)車、非機(jī)動(dòng)車、車道線、交通標(biāo)志牌、紅綠燈等12類目標(biāo)進(jìn)行精準(zhǔn)的實(shí)時(shí)監(jiān)測(cè)與識(shí)別,同時(shí)滿足車輛多種行駛環(huán)境的要求以及不同環(huán)境下的視覺(jué)感知需求;旭日1.0處理器則能夠在本地進(jìn)行大規(guī)模人臉抓拍與識(shí)別、視頻結(jié)構(gòu)化處理等,可廣泛用于商業(yè)、安防等多場(chǎng)景。
兩個(gè)1.0版本是完全由地平線自主研發(fā)的AI芯片,它所采用的是地平線第一代BPU架構(gòu),其性能全球領(lǐng)先:可實(shí)時(shí)處理1080p 30(全高清每秒30幀)視頻,每幀中可同時(shí)對(duì)200個(gè)目標(biāo)進(jìn)行檢測(cè)、跟蹤、識(shí)別,典型功耗1.5W,每幀延時(shí)小于30ms。
不僅如此,地平線還同步發(fā)布了針對(duì)中國(guó)實(shí)際的智能駕駛、智能城市和智能商業(yè)三大應(yīng)用場(chǎng)景的AI解決方案。
在今年4月的北京車展上,地平線發(fā)布征程2.0處理器架構(gòu),以及高級(jí)別自動(dòng)駕駛計(jì)算平臺(tái)Matrix 1.0。
AI解決方案重在產(chǎn)業(yè)化。
智能駕駛解決方案對(duì)駕駛場(chǎng)景中的目標(biāo)進(jìn)行精確定位,形成自動(dòng)駕駛大腦,實(shí)現(xiàn)車道偏離、車輛及行人碰撞預(yù)警等高級(jí)輔助駕駛(ADAS)功能。在地平線搭建的模擬交通場(chǎng)景里,對(duì)行人檢測(cè)的精準(zhǔn)度可以達(dá)到100%。據(jù)說(shuō),在實(shí)際道路上,基于征程1.0的ADAS對(duì)車輛、行人、車道線、交通標(biāo)志的檢測(cè)準(zhǔn)確率已大于99%。
智能城市解決方案可進(jìn)行高性能、低功耗的人臉抓拍、識(shí)別與相關(guān)屬性分析、視頻結(jié)構(gòu)化解析,可廣泛運(yùn)用于車站、學(xué)校、商業(yè)、樓宇等安防及泛安防領(lǐng)域。基于旭日1.0處理器的攝像頭,可以從幾百人中準(zhǔn)確抓取并識(shí)別特定人物,且能夠同時(shí)抓拍百人以上。
智能商業(yè)解決方案以顧客為中心進(jìn)行線下商業(yè)運(yùn)營(yíng)數(shù)據(jù)的結(jié)構(gòu)化,實(shí)現(xiàn)客流分析、人員ID管理、客戶與商品分析等,更好地促進(jìn)商業(yè)營(yíng)銷,提升商業(yè)運(yùn)營(yíng)效率,增強(qiáng)消費(fèi)者的購(gòu)物體驗(yàn)。通過(guò)攝像頭可以實(shí)時(shí)識(shí)別顧客身份、興趣喜好和在商店內(nèi)的行動(dòng)軌跡。
三套解決方案需要打造多家相關(guān)合作方的生態(tài)圈。生態(tài)圈建設(shè)基于嵌入式AI芯片和相應(yīng)解決方案,最終解決AI在更多產(chǎn)業(yè)領(lǐng)域的實(shí)際應(yīng)用。
令人振奮的是,世界上最領(lǐng)先的美國(guó)自動(dòng)駕駛領(lǐng)域的公司,實(shí)現(xiàn)四級(jí)自動(dòng)駕駛所使用的處理器,不是美國(guó)產(chǎn)的,而是地平線的處理器。這在中興被制裁及中美貿(mào)易戰(zhàn)的大背景下,無(wú)疑具有鼓舞作用。
由此,地平線的中期目標(biāo)值得期待:到2025年,實(shí)現(xiàn)3000萬(wàn)輛汽車搭載地平線自動(dòng)駕駛BPU(Brain Processor Unit),自動(dòng)駕駛“中國(guó)芯”時(shí)代將會(huì)來(lái)臨。
在余凱看來(lái),比造芯片更難的,是圍繞芯片搭建軟件生態(tài)。在PC時(shí)代與移動(dòng)互聯(lián)網(wǎng)時(shí)代,Wintel聯(lián)盟與ARM+Android聯(lián)盟已經(jīng)相繼搭建起了一個(gè)統(tǒng)治性的軟硬件生態(tài),座次已定。在此情形下,中國(guó)半導(dǎo)體的突破點(diǎn),只能是一個(gè)新領(lǐng)域,而AI芯片就是其中的最大機(jī)會(huì)。
路徑:嵌入式人工智能
“嵌入式人工智能”是與當(dāng)前通行的互聯(lián)網(wǎng)連接人工智能相對(duì)而言的。與通過(guò)互聯(lián)網(wǎng)和數(shù)據(jù)中心進(jìn)行數(shù)據(jù)計(jì)算來(lái)實(shí)現(xiàn)人工智能不同, “嵌入式人工智能”則是在工作現(xiàn)場(chǎng)實(shí)時(shí)搭建一個(gè)環(huán)境感知、人機(jī)交互與決策控制的人工智能平臺(tái)。所要解決的是目前存在于互聯(lián)網(wǎng)人工智能中的決策延遲問(wèn)題。余凱曾就嵌入式人工智能在無(wú)人駕駛上的應(yīng)用舉例說(shuō),當(dāng)孩子橫穿馬路,如果自動(dòng)駕駛系統(tǒng)感知到后,需要把信號(hào)傳送到云端再做決策,已經(jīng)比現(xiàn)場(chǎng)計(jì)算出現(xiàn)極短的延遲,一旦遇到實(shí)時(shí)網(wǎng)絡(luò)不穩(wěn)定的情況,后果將不可設(shè)想。起碼在交通領(lǐng)域,嵌入式人工智能提供的獨(dú)立解決方案,具有安全性方面的優(yōu)勢(shì)。
地平線在嵌入式人工智能上的規(guī)劃是:提供不斷升級(jí)的“處理器+算法”的嵌入式人工智能解決方案,包含算法、軟件、芯片整體優(yōu)化打包。同時(shí)搭配深度學(xué)習(xí)處理器(BPU)IP。因?yàn)槿斯ぶ悄鼙仨氂杏?jì)算資源做基礎(chǔ),深度學(xué)習(xí)在對(duì)硬件性能提出更高要求的同時(shí),算法優(yōu)化也極為關(guān)鍵。也就是說(shuō)軟硬件的優(yōu)化匹配才能得到性能提升,并非單純的軟硬件配置高,就會(huì)自動(dòng)有出色的性能。從手機(jī)性能上可以很輕松地體會(huì)到這一點(diǎn)。
地平線嵌入式人工智能一直在快速迭代中。地平線第一代嵌入式人工智能處理器架構(gòu)IP為高斯架構(gòu),第二代為伯努利架構(gòu),第三代為貝葉斯架構(gòu)。不同代際架構(gòu)對(duì)應(yīng)不同的自動(dòng)駕駛分級(jí),提供不斷升級(jí)的解決方案。去年1月,地平線聯(lián)合英特爾推出的ADAS系統(tǒng),基于高斯架構(gòu)進(jìn)行研發(fā)。同時(shí),地平線自建的嵌入式人工智能處理器架構(gòu)IP平臺(tái)“雨果1.0”,也是基于高斯架構(gòu)的。 同樣,雨果平臺(tái)也會(huì)回應(yīng)自動(dòng)駕駛分級(jí)進(jìn)行迭代更新。最初的側(cè)重點(diǎn)在感知認(rèn)知,隨后走向三維建模功能,未來(lái)會(huì)完成自主的強(qiáng)大決策能力。同時(shí),處理器架構(gòu)也會(huì)循著這樣的軌跡前進(jìn),由深度神經(jīng)處理居于主導(dǎo)地位,升級(jí)到自主決策做主導(dǎo),也就是從高斯架構(gòu),到伯努利架構(gòu),再到貝葉斯架構(gòu)。
與三個(gè)架構(gòu)相適應(yīng),其技術(shù)路線基本可分為感知、建模、路徑規(guī)劃三個(gè)步驟。
從感知來(lái)說(shuō),地平線研發(fā)的算法具有特異性,即單網(wǎng)絡(luò)多輸出特性,只要輸入單一數(shù)據(jù)源,就可以在同一個(gè)網(wǎng)絡(luò)中獲得不同的輸出。比如,輸入一張包含多個(gè)要素特征的實(shí)時(shí)圖象,只要通過(guò)神經(jīng)網(wǎng)絡(luò)架構(gòu)計(jì)算,就能發(fā)出車道線、車輛和行人等分類信息。這一點(diǎn)在以前的算法和神經(jīng)網(wǎng)絡(luò)中是難以做到的。也就是說(shuō),在傳統(tǒng)計(jì)算機(jī)視覺(jué)中,識(shí)別車輛的算法卻無(wú)法識(shí)別行人。因此,單網(wǎng)絡(luò)多輸出的優(yōu)勢(shì)就是資源利用率高,運(yùn)算速度大幅提升,協(xié)同處理能力增強(qiáng)。
從建模上說(shuō),自動(dòng)駕駛汽車所使用的攝像頭、激光雷達(dá)、毫米波雷達(dá)等,配合探知車輛周圍的環(huán)境。它們同時(shí)會(huì)采集到相同的信息,也會(huì)按照不同的分工采到獨(dú)有的信息。比如,紅綠燈信息就基本歸于攝像頭。
地平線嵌入式人工智能將多個(gè)傳感器的信息融合進(jìn)行環(huán)境建模,可以定義不同類型數(shù)據(jù)的接口,如行駛速度、車輛距離、信號(hào)燈狀態(tài)等。攝像頭獲得的4類數(shù)據(jù)、激光雷達(dá)取得的4類數(shù)據(jù)以及毫米波雷達(dá)捕獲的3類數(shù)據(jù),通過(guò)傳感器輸入對(duì)應(yīng)信息,在信息篩選后做出統(tǒng)一決策。
從決策和路徑規(guī)劃方面來(lái)說(shuō),地平線嵌入式人工智能就是要把信息“黑箱”透明化。所謂“黑箱”,是指深度學(xué)習(xí)過(guò)程中端到端直接輸出了結(jié)果。中間沒(méi)有了人工介入,這個(gè)過(guò)程就看不到了,因此被稱為“黑箱”。具體到自動(dòng)駕駛上,如果應(yīng)用了深度學(xué)習(xí)算法的車輛發(fā)生了事故,查找原因就會(huì)出現(xiàn)困難,安全隱患不易排除。
為了解決這個(gè)問(wèn)題,地平線嵌入式人工智能就把信息“黑箱”透明化。貝葉斯架構(gòu)將神經(jīng)網(wǎng)絡(luò)布設(shè)到各個(gè)節(jié)點(diǎn)上,清晰顯示中間過(guò)程與結(jié)果,隨時(shí)可以進(jìn)行有針對(duì)性地調(diào)整,使問(wèn)題可追溯并解決。
對(duì)于未來(lái),根據(jù)地平線自動(dòng)駕駛平臺(tái)的規(guī)劃,雨果1.0是面向自動(dòng)駕駛L2的技術(shù),預(yù)計(jì)會(huì)與車企和Tier 1在2019年左右量產(chǎn)。雨果2.0是面向限定場(chǎng)景下自動(dòng)駕駛L4的技術(shù),而雨果3.0則是完全面向自動(dòng)駕駛L4的技術(shù)。
布局:智慧城市
目前,地平線智慧城市的落地場(chǎng)景包括了機(jī)場(chǎng)、車站、智慧園區(qū)、酒店、旅游景點(diǎn)、社區(qū)、智能交通、邊檢等八大場(chǎng)景。每一個(gè)場(chǎng)景,地平線都推出了示范應(yīng)用案例。
安防是多場(chǎng)景應(yīng)用的重點(diǎn)方向。這樣的選擇,很大程度上是市場(chǎng)規(guī)模決定的,而不是盈利壓力所致。從市場(chǎng)規(guī)模來(lái)看,2017年的安防產(chǎn)業(yè)產(chǎn)值已過(guò)6000億元,地平線在AI上的特長(zhǎng)大有用武之地。比如,城市里布置的數(shù)量龐大的攝像頭,所積聚的數(shù)據(jù)不可能僅靠后臺(tái)服務(wù)器來(lái)處理,由此產(chǎn)生了對(duì)大帶寬以及強(qiáng)計(jì)算力服務(wù)器的需求。僅以公安系統(tǒng)為例,大約有超過(guò)半數(shù)的公安系統(tǒng)客戶對(duì)地平線前端AI處理感興趣。這為地平線的解決方案落地提供了巨大的機(jī)會(huì)。當(dāng)然,對(duì)地平線前端AI感興趣的不只是公安系統(tǒng),還有大型國(guó)有企業(yè),在園區(qū)及辦公區(qū)智能管理上有相關(guān)需求。
基于旭日1.0芯片打造的智能攝像頭,能以每秒30幀的速度實(shí)時(shí)處理1080P的視頻,在5萬(wàn)人臉數(shù)量級(jí)的數(shù)據(jù)庫(kù)中可進(jìn)行快速比對(duì)。那么,基于旭日2.0芯片的智能攝像頭的性能將大幅度提高,其計(jì)算力將提升4~8倍。
這其中系統(tǒng)的匹配仍存在待解決的問(wèn)題。地平線AI系統(tǒng)與各行業(yè)既有的系統(tǒng)如何融合,不僅是地平線的問(wèn)題,而且是整個(gè)業(yè)界的問(wèn)題,目前還沒(méi)有標(biāo)準(zhǔn)答案。沒(méi)有答案并沒(méi)有讓地平線停下腳步,關(guān)鍵在于搭建出一個(gè)合理的架構(gòu),以最小的代價(jià)發(fā)揮地平線的既有能力,與已有管理系統(tǒng)相融合,并在不斷迭代升級(jí)。
對(duì)于智慧城市布局,地平線明確將自己定位在AI圖像識(shí)別核心解決方案的提供者,包括硬件(主要是芯片與搭載地平線芯片的下游硬件產(chǎn)品)、算法、開(kāi)發(fā)工具以及部分云服務(wù)。
地平線智慧城市布局,并不提供上下游開(kāi)發(fā)與運(yùn)營(yíng)一條龍服務(wù),而是更加聚焦于技術(shù)。對(duì)于下游客戶,地平線會(huì)提供封裝算法的智能攝像頭硬件,但仍需要將數(shù)據(jù)存儲(chǔ)、系統(tǒng)運(yùn)營(yíng)等交給專業(yè)公司去做。用流行的說(shuō)法,地平線所做的就是“賦能”,將AI芯片、算法打包為一個(gè)模塊,并將智能識(shí)別能力賦予運(yùn)營(yíng)系統(tǒng)。地平線的工作方式是與產(chǎn)業(yè)鏈中終端客戶合作,提供整套智能識(shí)別的解決方案,匹配與運(yùn)營(yíng)交給別人去解決。當(dāng)然,智慧城市布局的落地仍然是一個(gè)長(zhǎng)期的過(guò)程。
目前,地平線與各方合作伙伴打造的智慧城市示范應(yīng)用,發(fā)揮了兩個(gè)作用,一是展示并驗(yàn)證了地平線智慧城市解決方案的強(qiáng)大能力,二是以實(shí)際案例直觀告訴客戶,讓客戶易于接受創(chuàng)新的解決方案,從而形成良性的智慧城市生態(tài)。
對(duì)于智慧城市中的智能交通,地平線有一個(gè)“五道口計(jì)劃”討論群,余凱將之類比于“曼哈頓計(jì)劃”。五道口特指位于清華大學(xué)東南角的一個(gè)路口。這里的交通狀況極為復(fù)雜,有行人,有各種車輛,包括火車。且多條道路交叉,在一平方公里區(qū)域內(nèi),有三處交叉路口。什么時(shí)候自動(dòng)駕駛車輛能夠安全穿越五道口的話,無(wú)人駕駛就可以說(shuō)不僅在中國(guó)成功了,而且是在全世界成功了。同時(shí),因?yàn)榈仄骄€公司里有很多清華畢業(yè)生,所以地平線內(nèi)部的自動(dòng)駕駛討論群就順理成章地被命名為“五道口計(jì)劃”。
地平線的創(chuàng)業(yè)基因與未來(lái)都可以在這里找到發(fā)端。
地平線永遠(yuǎn)在前方,創(chuàng)業(yè)者不會(huì)停下腳步。也難怪余凱說(shuō),創(chuàng)業(yè)并不浪漫。