王杰夫
左一為Covariant CEO Peter、左二為首席科學(xué)家PieterAbbeel,左三為聯(lián)合創(chuàng)始人Rocky Duan。
無論以ChatGPT為代表的各種聊天機器人在2023年有多么火熱,這一切都還局限在比特世界里,哪怕ChatGPT的分析推理再嚴(yán)謹(jǐn),代碼寫得再精妙,它依然無法拿起一個蘋果。想要讓AI從比特世界進入原子世界,就必須給它一副身體,并且教會它如何去控制,這就是具身智能(EmbodiedArtificialIntelligence)的概念。
在2023年涌現(xiàn)的AI獨角獸名單里,Covariant是其中少有的專注具身智能的公司,它采取了與波士頓動力等傳統(tǒng)機器人公司迥異的技術(shù)路線。相較于后者在精密硬件平臺上細(xì)致打磨運動控制算法以實現(xiàn)機器人運動,Covariant力圖開發(fā)一個能夠適應(yīng)多種場景的通用機器人大腦,避免為特定場景定制特定機器人,而是讓不同機器人共享同一智能核心。
這與OpenAI的思路相同。其實在GPT-3.5(ChatGPT背后的模型)這樣的大語言模型出現(xiàn)之前,AI是個大門類,下面有自然語言處理、計算機視覺、語音識別等細(xì)分領(lǐng)域。最初的GPT只是一個探索性的技術(shù)路線,但科學(xué)家們發(fā)現(xiàn),隨著投喂的數(shù)據(jù)增多,參數(shù)的規(guī)模增大,模型出現(xiàn)了一些智能的跡象,它可以理解語言、生成文本,甚至把圖像數(shù)據(jù)投喂進去,這個模型也開始理解圖像的內(nèi)容。
當(dāng)然,現(xiàn)實中科學(xué)家遇到的困難遠比上述流程復(fù)雜得多,但這并不能否認(rèn)“大力出奇跡”就是推動這一輪AI浪潮到來的重要原因。那么何不去訓(xùn)練一個用于機器人的模型呢?
Covariant和OpenAI淵源頗深,4位創(chuàng)始人里有3位都在OpenAI工作過。那時OpenAI尚處于早期階段,整個團隊只有10名成員,他們伴隨這家初創(chuàng)公司一路成長,直到團隊規(guī)模擴大到一百多人。
最年長的皮特·阿貝爾(PieterAbbeel)現(xiàn)在是Covariant的首席科學(xué)家,他曾是加州大學(xué)伯克利分校電氣工程與計算機科學(xué)系教授,是將深度強化學(xué)習(xí)應(yīng)用在機器人方面的先驅(qū)。他率先教會機器人從人類演示中學(xué)習(xí),為下一代機器人技術(shù)奠定了基礎(chǔ)。早在2016年,也就是OpenAI成立的第二年,阿貝爾就加入了這個后來發(fā)布ChatGPT的公司,成為其機器人團隊的一員。當(dāng)時與阿貝爾一起在OpenAI工作的還有他的兩個學(xué)生,即如今Covariant的CEO陳曦(Peter)和CTO段巖(Rocky)。
有一天,陳曦和段巖兩人在唐人街的中餐館里聊合作發(fā)表的新論文—用強化學(xué)習(xí)教會機器人像人類一樣在短時間里掌握新技巧??蒲腥〉眠M展固然可喜,如果想要進一步研究,OpenAI實驗室所能提供的資源和數(shù)據(jù)都遠遠不夠了?!叭绻覀兿胗脭?shù)據(jù)和計算驅(qū)動的AI解決機器人方面的問題,在實驗室永遠得不到足夠數(shù)據(jù),我們必須進入實際環(huán)境里求解問題,別無他法?!?022年,陳曦曾在播客節(jié)目里回憶創(chuàng)業(yè)初期的討論。
意識到學(xué)術(shù)研究與解決實際問題間的差距,正是Covariant創(chuàng)立的關(guān)鍵時刻。2017年,Covariant在硅谷成立,它最初的名稱是EmbodiedIntelligence。阿貝爾興趣廣泛,擔(dān)任了風(fēng)投公司AIXVentures的投資合伙人,還在YouTube經(jīng)營著自己的同名播客節(jié)目,于是Covariant的CEO由陳曦?fù)?dān)任。得益于阿貝爾的背書,Covariant在種子輪就獲得700萬美元的融資,投資人列表里有著一眾AI領(lǐng)域的知名學(xué)者:深度學(xué)習(xí)之父杰弗里·辛頓(GeoffreyHinton)、卷積神經(jīng)網(wǎng)絡(luò)之父楊立昆(YannLeCun)、GoogleBrain創(chuàng)建人杰夫·迪恩(JeffDean)、ImageNet創(chuàng)建者李飛飛等。
另一邊,OpenAI由于機器人團隊的核心成員跳槽創(chuàng)業(yè),加上想要把重心放在基礎(chǔ)模型GPT的研發(fā)上,最終在2021年7月解散了整個機器人團隊。Covariant則延續(xù)了AI機器人的研究路線,一路發(fā)展至今。
Covariant的核心產(chǎn)品并不是人形機器人。創(chuàng)立之初,創(chuàng)始人就沒有把應(yīng)用場景錨定在C端,而是試圖把AI技術(shù)應(yīng)用在工業(yè)化領(lǐng)域,為B端客戶提供AI分揀機器人。陳曦的理由是倉庫和配送中心是機器人行業(yè)最先發(fā)生質(zhì)變的地方。這并不難理解,只有傳統(tǒng)機器人已經(jīng)廣泛落地的B端場景能提供足夠的訓(xùn)練數(shù)據(jù)。
對比來看,傳統(tǒng)的機器人系統(tǒng)是剛性的,人類不管取得多少操作數(shù)據(jù),都不會改變機器人對三維空間的理解和感知能力。這類機器人不需要AI的支持,它們只是用標(biāo)準(zhǔn)化算法移動的集裝箱,一旦涉及到識別并分揀不同種類的物品,就需要人類手動完成。而Covariant關(guān)注的重點是“搬運”,通過AI讓機器人在不同環(huán)境下識別不同種類的物品。在陳曦看來,Covariant努力的方向就是使用一個AI系統(tǒng)解決所有應(yīng)用場景的問題。
Covariant給機器人裝載了一個AI大腦“CovariantBrain”,段巖領(lǐng)導(dǎo)了公司核心平臺的開發(fā)。簡言之,CovariantBrain就是在所有物品類型的基礎(chǔ)上訓(xùn)練一個通用AI,實現(xiàn)人類級別的自主性,讓機器人能挑選最廣泛的SKU,而不局限于特定的行業(yè)和產(chǎn)品。
商業(yè)化應(yīng)用無法一蹴而就,現(xiàn)實世界的場景變化多樣,比實驗室復(fù)雜得多,Covariant團隊做的第一件事,是對機器人展開預(yù)訓(xùn)練。他們收集客戶倉庫里海量的SKU數(shù)據(jù)訓(xùn)練CovariantBrain,使其能以通用方式理解所有對象。
Covariant團隊采取了集群學(xué)習(xí)的方法來訓(xùn)練模型。集群學(xué)習(xí)屬于機器學(xué)習(xí)的一種,通常用于分布式系統(tǒng),由多個機器學(xué)習(xí)模型,或由智能體共同學(xué)習(xí)和協(xié)作,以提高整體性能。它的亮點在于,多個智能體可以分布在不同的物理位置甚至不同的數(shù)據(jù)中心,各個智能體之間能共享知識,加速學(xué)習(xí)進程。這意味著天南海北的客戶數(shù)據(jù)都能用于CovariantBrain的訓(xùn)練。反過來,客戶可以從CovariantBrain驅(qū)動的每個機器人的學(xué)習(xí)中受益,機器人在一個地方學(xué)習(xí),熟悉拾取物品的新情境,分布全球各地的整個機器人集群都會受益。
如今,CovariantBrain每天都同時接受來自全球各地倉庫數(shù)百萬個物品的訓(xùn)練,從小型化妝品到服裝塑料袋再到生鮮雜貨。在一家德國倉庫內(nèi),CovariantBrain控制的機器人可以對1萬多種不同的物品完成揀選和分類,準(zhǔn)確率超過99%。
阿貝爾對機器人與人類的工作效率做過對比:人工分揀站的效率大約在每小時300次到2000次之間。假如以每小時300次的人工最低值作為基準(zhǔn),AI機器人分揀準(zhǔn)確率達到90%意味著每小時會出現(xiàn)30次失敗,額外花費的修復(fù)時間就超過一個小時;假如分揀準(zhǔn)確率達到99%,意味著每小時只出現(xiàn)3次失敗,這樣修復(fù)時間就只需要幾分鐘。
終于,當(dāng)CovariantBrain的準(zhǔn)確性超過99%時,一個工程師便能輕松管理10個機器人揀選站,這標(biāo)志著AI機器人在成本效益上與人類勞動力達到了同等水平。
有了前期的科研積累后,Covariant還需要一個在業(yè)界嶄露頭角的機會。
2019年,瑞士的工業(yè)自動化公司ABB發(fā)起了一項全球范圍內(nèi)的機器人揀選競賽。作為全球三大工業(yè)機器人制造商之一,ABB希望通過揀選比賽評估AI技術(shù)是否成熟,能否應(yīng)用到機器人自動化領(lǐng)域,進而選出潛在的合作伙伴。參賽者是20家全球領(lǐng)先的AI初創(chuàng)公司,10家來自美國,10家來自歐洲,其中就包括成立時間僅兩年的Covariant。
這場競賽涵蓋了26種不同場景,能全面測試參賽機器人的自主水平。主辦方保密了一半的挑戰(zhàn)項目,參賽者事先不知道具體的物品和場景,無法提前準(zhǔn)備,需要當(dāng)場測試系統(tǒng),一天之后再測,觀察系統(tǒng)通過訓(xùn)練后有哪些改進。
大多數(shù)公司都未能通過測試。少部分公司可以解決大多數(shù)任務(wù),但無法處理更棘手的情況。測試的物品有水彩筆、袋裝軟糖、塑料瓶裝藥、方塊紙盒、膠水、洗面奶、按壓式洗手液、蘋果、袋裝膨化食品、玩具小黃鴨等等……它們的包裝、重量、形狀都不一樣。在零散放置、品類混合、整齊排列的多種狀態(tài)下,Covariant的AI機器人搭載著機械臂和吸盤,沒有遲疑,準(zhǔn)確完成分揀,成功率達成100%。它完全不需要人工干預(yù),卻像人類一樣快速高效地處理每項任務(wù)。ABB的機器人業(yè)務(wù)總經(jīng)理馬克·塞古拉(MarcSegura)表示,“在這些測試中達到一定水平很容易,但不表現(xiàn)出任何弱點是非常困難的。”
出色的表現(xiàn)讓Covariant成了ABB的合作伙伴。雙方的首個合作方案部署在比利時郵政(Bpost)旗下的電商履約公司ActiveAnts。
成功拿下ABB這個大客戶后,Covariant迎來了更多商業(yè)機會。2022年3月,奧地利的自動化技術(shù)與物流解決提供商KNAPP與Covariant展開合作。KNAPP的揀選機器人Pick-it-EasyRobot由CovariantBrain系統(tǒng)提供支持,機器人實現(xiàn)了全天候工作,能全自動處理訂單?!拔以谖锪餍袠I(yè)工作了16年,從未見過這樣的事?!盞NAPP副總裁彼得·普切溫(PeterPuchwein)說。美國的藥品批發(fā)商McKesson、德國電氣公司Obeta都應(yīng)用了KNAPP與Covariant合作開發(fā)的機器人。
同一個系統(tǒng)解決所有場景問題。
大型公司應(yīng)用AI機器人的好處顯而易見,首先是效率的提升。在Obeta,一臺AI機器人能完成3個工人分揀零件的工作。在這之前,Obeta經(jīng)常招不到分揀員,即使招來也經(jīng)常干不滿半年。因為分揀工作太無聊,每天8小時,每小時工人需要處理170個訂單,夏天倉庫的溫度還經(jīng)常超過37℃,悶熱、勞累、重復(fù)的工作讓工人難以忍受。其次,工業(yè)自動化能幫助公司降低成本。KNAPP面向客戶收取的費用始終低于雇用人工的費用,KNAPP副總裁普切溫舉了一個例子:如果一家公司每年雇用一名工人的費用是4萬美元,那么KNAPP收取的AI機器人費用就是每年3萬美元。這樣的性價比讓客戶無法拒絕。
目前看來,Covariant最主要的商業(yè)模式,就是面向企業(yè)客戶,與全球先進的工業(yè)機器人制造商合作,用AI技術(shù)為傳統(tǒng)機器人升級換代。
商業(yè)模式得到驗證的Covariant吸引了眾多投資機構(gòu)加碼投資。2019年,Covariant完成2000萬美元的A輪融資;2020年,完成4000萬美元的B輪融資;2021年,完成8000萬美元的C輪融資;2023年4月它又獲得了7500萬美元的補充C輪融資。截至目前,公司的融資總額達到2.22億美元。每隔兩年,Covariant就會設(shè)立一個新的全球辦公室,2019年深圳辦公室成立,2021年倫敦辦公室成立?;蛟S因為創(chuàng)始人團隊中有3位具有華裔背景,Covariant也成了為數(shù)不多在中國設(shè)立分公司的硅谷AI獨角獸。
目前,全球約有300萬臺工業(yè)機器人,每年約有40萬臺新機器人進入市場。預(yù)計到2023年,全球市場收入將達到近438億美元,僅北美地區(qū)的復(fù)合年增長率到2029年就將增長10%。
隨著Covariant邁入規(guī)?;l(fā)展階段,此前與ABB等傳統(tǒng)機器人制造商的合作模式暴露出了一些問題。首先,上游的機械臂廠商已經(jīng)意識到AI浪潮勢不可擋,BershireGrey、RightHandRobotics、AmbiRobotics等機械臂廠商正在加速AI研發(fā)。
其次,下游的機器人集成商例如ABB、Dematic、AutoStore、FANUC、KUKA也在擔(dān)心來自Covariant的競爭。由于長期的合作關(guān)系,客戶更信任這些傳統(tǒng)的集成商,更樂意和它們談采購方案,Covariant只是扮演二級供應(yīng)商的角色,議價權(quán)和品牌影響力都會受到影響。
機器人技術(shù)屬于資本密集型領(lǐng)域,需要大量資本投入來建造設(shè)施、購買設(shè)備、維持運營,因此Covariant最開始選擇與自動化機器人公司合作,其實是很取巧的做法。以ABB為例,ABB有成熟的工業(yè)機器人系統(tǒng),Covariant無需自研硬件;ABB的業(yè)務(wù)遍及全球一百多個國家和地區(qū),在中國的線上和線下渠道就覆蓋了約700座城市,Covariant依托ABB的渠道,無需自己開拓B端客戶資源,就能迎來廣闊市場。
可是將其放在整個產(chǎn)業(yè)鏈中看,Covariant僅有AI技術(shù)還不夠,也不能只依賴工業(yè)機器人巨頭去獲得硬件和渠道支持,不同維度的競爭對手正迫使Covariant同時向上下游去拓展自己的業(yè)務(wù)范圍。
OpenAI當(dāng)年放棄AI機器人業(yè)務(wù)的決定就暗示了,對于創(chuàng)業(yè)公司來說這條路并不好走。在2021年7月解散機器人團隊時,OpenAI聯(lián)合創(chuàng)始人沃伊切赫·扎倫巴(WojciechZaremba)在回復(fù)媒體時表示,“可悲的是,如果我們是一家機器人公司,公司使命就會不同,我們會繼續(xù)研究。我們非常相信機器人團隊的研發(fā)方向與方法,但從想要實現(xiàn)目標(biāo)(即構(gòu)建通用人工智能)的角度來看,我們還缺少一些組件。”扎倫巴并沒有明確提到究竟缺少了哪些組件,可能是資金、人力、數(shù)據(jù),等等,這些也都是Covariant不斷在面對的問題。