在未來的藥店、超市里,為人類提供服務(wù)的,可能是機(jī)器人。
8月下旬,世界機(jī)器人大會上,人形機(jī)器人Galbot G1用雙手完成藥品上架、零食取送等任務(wù)。
接到搬運任務(wù)后,Galbot G1先精準(zhǔn)地識別出藥品,再確定需要擺放的位置,伸出右臂,取出藥盒,平穩(wěn)地放至貨架上。
Galbot G1由北京銀河通用推出,公司創(chuàng)始人為北大博導(dǎo)王鶴,成立僅16個月,接連斬獲高額融資。
6月,其完成天使輪融資,拿到7億元資金。美團(tuán)戰(zhàn)投、北汽產(chǎn)投、商湯國香基金等競相參投,啟明、藍(lán)馳、經(jīng)緯創(chuàng)投亦有出手。
1個月后,銀河通用又獲得有“港版淡馬錫”之稱的香港投資管理公司的青睞。業(yè)內(nèi)人士預(yù)計,公司最新估值約30億元。
具身智能是典型的多學(xué)科交叉行業(yè),需要產(chǎn)業(yè)和研究雙輪驅(qū)動。銀河通用的兩位創(chuàng)始人,能力互補(bǔ),一位是學(xué)者,另一位擁有豐富的制造業(yè)經(jīng)驗。
CEO王鶴,今年32歲,擔(dān)任北京大學(xué)計算機(jī)學(xué)院前沿計算研究中心(CFCS)助理教授、博士生導(dǎo)師。
從清華大學(xué)畢業(yè)后,他師從美國兩院院士Leonidas J.Guibas教授,在斯坦福大學(xué)拿到電子工程系博士學(xué)位。
“美國制造業(yè)(的條件)不允許快速做出具身智能的完整demo,當(dāng)?shù)亓悴考?yīng)不全,很多東西都得進(jìn)口,匱乏硬件工程師?!蓖斛Q在接受采訪時表示,在中國做硬件,能做到成本最低、可靠性最高。
2021年9月,王鶴回國,赴北京大學(xué)任教,創(chuàng)立具身感知與交互實驗室。在具身智能領(lǐng)域,他發(fā)表近40篇論文,多次獲得best paper等獎項。
“具身智能,是把大模型通用的感知和決策能力,和機(jī)器人身體執(zhí)行的能力,結(jié)合到一起?!蓖斛Q稱,這將帶來無限的機(jī)會。
聯(lián)合創(chuàng)始人姚騰洲,擁有豐富的智能硬件產(chǎn)品量產(chǎn)經(jīng)驗,曾就職于ABB機(jī)器人研發(fā)中心。
兩人聯(lián)手,2023年5月,銀河通用成立。
目前,公司在北京、深圳和蘇州三地設(shè)有研發(fā)中心,與北大、北京智源人工智能研究院,分別合作成立了具身智能聯(lián)合實驗室和研究中心。其研發(fā)團(tuán)隊,超80人。
抓一杯水,對人類而言,是一個無須思索的習(xí)慣性動作。對機(jī)器人來說,杯子的形態(tài)、材質(zhì)不同,抓取動作不同。
機(jī)器人若要具備人類的抓取能力,需接受大量數(shù)據(jù)訓(xùn)練。
讀博期間,王鶴就開始研究具身智能,在數(shù)據(jù)處理方面,獲得重要進(jìn)展。
特斯拉Optimus機(jī)器人,使用的是傳統(tǒng)數(shù)據(jù)處理方式。王鶴解釋道,為了把電池放到紅盒子里,特斯拉調(diào)用40人團(tuán)隊,通過VR眼鏡遙控特斯拉人形機(jī)器人Optimus采集數(shù)據(jù)。
在數(shù)據(jù)采集環(huán)節(jié),王鶴直言,要完成把電池放到紅盒子里這類事情,在商業(yè)模式上,行不通。
“只有合成數(shù)據(jù),才能實現(xiàn)規(guī)模化量產(chǎn)?!蓖斛Q一直在研究,怎么把合成數(shù)據(jù)的訓(xùn)練效果,無縫遷移至真實世界。
銀河通用打破陳規(guī),以合成仿真技術(shù),為每個物體合成200條視頻,再從一個物體到一類物體,通過成規(guī)模注入數(shù)據(jù),訓(xùn)練機(jī)器人的抓取能力。
“我們是國內(nèi)較早做到泛化物體抓取的企業(yè)。用物理仿真器生產(chǎn)的數(shù)據(jù),訓(xùn)練機(jī)器人學(xué)習(xí)抓取、放置等技能,是我們獨到的能力?!蓖斛Q說。
據(jù)他透露,2023年,銀河通用合成了100萬條數(shù)據(jù),今年一口氣合成了10億條。依托億級數(shù)據(jù)體量,靈巧手可以抓取各種各樣的東西。
Galbot G1甚至可以抓取由透明塑料皮包裹的半透明物體。公司透露,其抓取透明、高光物體的成功率,超95%。
“靠合成數(shù)據(jù),具身智能完成從0到1的突破?!蓖斛Q說。
數(shù)據(jù)之外,具身智能機(jī)器人還需配備本體、大腦、小腦。
本體,即機(jī)器人的“身體”。王鶴稱,未來會有各類形態(tài)的通用機(jī)器人,只有跟人類干活需求相匹配的,才能得到最大的市場份額。
Galbot G1的下半身只有一條腿,裝配在一個移動底盤上。
王鶴解釋,相較于兩條腿,這樣的設(shè)計,成本低廉,在貨架場景下,其工作效率接近人類。
他認(rèn)為,雙手在場景落地上更有價值,大量應(yīng)用場景,不需要雙足運動能力,比如巡檢、巡邏,機(jī)器狗和車一樣能做。
Galbot G1機(jī)器人的身高為173cm,臂展為190cm,需要抓取地面物體時,會切換到“跪姿”模式。而在需要拿高度超兩米的物品時,又能轉(zhuǎn)換為“站立”模式。其操作范圍,涵蓋0至2.4米。
團(tuán)隊還將負(fù)責(zé)行動的小腦和負(fù)責(zé)感知理解的大腦,放在一起。王鶴舉例說,搭配GPT-4大模型,機(jī)器人可以做到“言出法隨”。
比如,把一個瓶子立起來放到紅色碗里,傳統(tǒng)機(jī)器人需要先采集數(shù)據(jù),才能完成動作。銀河通用團(tuán)隊依靠大腦、小腦大模型的聯(lián)動,實現(xiàn)在開放語義狀態(tài)下,抓取和放置物體。
今年四季度,售價約30萬元一臺的Galbot G1,將現(xiàn)身零售場景中。
公司計劃與投資方美團(tuán)合作,打造24小時無人藥店。未來兩三年,藥店里會出現(xiàn)更多銀河通用機(jī)器人。
“把這個場景做好,公司就實現(xiàn)了從0到1的突破,憑借通用、泛化的技能,將輻射到更多行業(yè)?!蓖斛Q堅信,從1到100,是“沿途下蛋”,一步步實現(xiàn)的事情。