極客公園
2月底,Way m o首席科學家D rag o Anguelov在MIT(麻省理工學院)首次開講,他分享的內(nèi)容主題為“解決自動駕駛中的長尾問題”(Taming The Long Tail of Autonomous Driving Challenges),這應該是外界對Waymo自動駕駛研發(fā)目前能夠了解到的最深度、最詳細的內(nèi)容了。
近些年,使用大量標注過的數(shù)據(jù)對深度學習網(wǎng)絡(luò)進行監(jiān)督訓練,使得物體感知和行為預測能力有了大幅提升,這些技術(shù)在Waymo自動駕駛開發(fā)過程中得到了大規(guī)模應用。我們也從 Drago Anguelov口中第一次知道了Waymo在使用“模仿學習(imitation learning)”,這里先“科普”一下。
模仿學習屬于機器學習的一種,它的神經(jīng)網(wǎng)絡(luò)能夠通過“觀察”人類的行為將某些特定的動作和場景進行匹配。如果使用不同類型的“人類行為”作為數(shù)據(jù)源來訓練,最終神經(jīng)網(wǎng)絡(luò)就能夠根據(jù)感知的結(jié)果輸出相對應的決策動作。例如,“如果你看到停車標志,馬上停車”以及“如果前方有輛停著的車擋路了,繞開它”等。
隨著商業(yè)化試運營的推進,谷歌(Waymo為谷歌旗下的子公司)能夠采集數(shù)據(jù)的場景更多了,模仿學習算法也就有了更頻繁的用處。但Drago Anguelov也指出,人類駕駛行為存在著很多不確定性,一些罕見的場景(所謂的“長尾”問題),Waymo的數(shù)據(jù)集中并沒有足夠的案例來訓練算法應對。出現(xiàn)這種情況就只能依靠開發(fā)人員手動編寫算法。Drago Anguelov認為這種“折中”的做法遲早是會被機器學習代替的。
根據(jù)Waymo官方披露的數(shù)據(jù)顯示,Waymo目前已經(jīng)累積了約1 500萬英里的行駛里程。按照平均每3 000萬英里才會出現(xiàn)一起事故的概率來計算的話,Waymo可能到現(xiàn)在都沒有得到一個特定的“長尾”案例。假設(shè)行駛每100萬英里會發(fā)生一起事故,Waymo也不過積累了15個數(shù)據(jù)而已。按照普通機器學習神經(jīng)網(wǎng)絡(luò)需要的數(shù)據(jù)量(每個圖像分類需要至少1 000個樣本)的標準來看,Waymo似乎還差得有些遠。
盡管Drago Anguelov表示希望通過采集盡可能多的人類駕駛行為(包括“長尾”案例)來進行模仿學習,但“數(shù)據(jù)量的缺失”是個很大的問題。
而為了彌補這方面的缺陷,Waymo已經(jīng)構(gòu)建出了一套仿真模型,仿真出盡可能多的場景來進行測試。因為有時會得出截然相反的結(jié)果,所以要加強系統(tǒng)的魯棒性,做出足夠多的仿真模型,確保系統(tǒng)的準確性。
不過仿真模型的建立依然需要真實世界數(shù)據(jù)的支持,解決“長尾”問題也需要對人類駕駛行為進行大量的模仿學習。所以這就又回到了問題的原點,Waymo還需要更大量級“數(shù)據(jù)”的支持。
對比之下,似乎“差生”特斯拉在“數(shù)據(jù)”問題上還真是不發(fā)愁。
特斯拉目前預計有超過40萬輛搭載了Autopilot系統(tǒng)的車輛在道路上行駛,單日行駛里程超過了1 300萬英里。如果未來這個車隊的規(guī)模增加至超過100萬輛,那么每月產(chǎn)生的有效行駛里程將到達10億英里的量級。對一家已經(jīng)有成熟產(chǎn)品落地的車企而言,這種真實世界產(chǎn)生的“數(shù)據(jù)”根本不是問題。
至于特斯拉在自動駕駛研發(fā)上的獨特性,根據(jù)外媒The Information曾經(jīng)透露的信息,特斯拉同樣在利用“里程累積”上的優(yōu)勢進行模仿學習。據(jù)熟悉特斯拉這套系統(tǒng)的知情人士爆料稱,特斯拉的車輛在行駛過程中會將攝像頭及其他傳感器的數(shù)據(jù)搜集起來,Autopilot是否運行并沒有關(guān)系。之后工程師可以將這些數(shù)據(jù)中人類的駕駛行為與不同的場景進行匹配,此后遇到類似的場景機器就可以模仿人類去執(zhí)行—比如怎樣拐彎或躲避障礙物等。
當然這種被叫做“行為克隆”的方法也有局限性,但特斯拉的工程師認為只要有足夠的數(shù)據(jù)支撐,神經(jīng)網(wǎng)絡(luò)就能夠給出正確的決策結(jié)果,例如在絕大多數(shù)場景中如何轉(zhuǎn)向、剎車以及加速。在特斯拉看來,未來不再需要人類手動編程控制無人車應對特定場景。
事實上,特斯拉的軟件工程師提到的“行為克隆”和Waymo的“模仿學習”是一個意思,等同于大家都在講的“端到端學習”的方案,即使用一個巨大的神經(jīng)網(wǎng)絡(luò),輸入傳感器數(shù)據(jù)后得到關(guān)于轉(zhuǎn)向、加速和剎車的整體執(zhí)行策略。
假設(shè)特斯拉采用的是“端到端學習”方案,那它肯定是不需要對圖像進行標記的。唯一需要“標記”的是人類駕駛員的行為,比如轉(zhuǎn)向角是多少、加減速的力度等。將整個傳感器數(shù)據(jù)輸入到一個巨大的神經(jīng)網(wǎng)絡(luò)后,系統(tǒng)會學習如何將傳感器數(shù)據(jù)與人類駕駛員的行為進行匹配。但我們知道特斯拉是在做圖片標記的,所以從這一點出發(fā)考慮,它采用的就不大可能是和Waymo一樣的“端到端學習”的策略。
針對自動駕駛感知的算法差異,Mobileye創(chuàng)始人Amnon Shashua曾經(jīng)對“端到端學習 (End-to-End Learning)”和“語義抽象(Semantic Abstraction)”這兩個概念做過詳細的講解。
而根據(jù)外媒The Information報道的內(nèi)容來推斷,特斯拉可能是在開發(fā)一套用于路徑規(guī)劃或執(zhí)行控制的神經(jīng)網(wǎng)絡(luò)。而用來訓練這套神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)并非來自傳感器,而是由感知神經(jīng)網(wǎng)絡(luò)輸出的元數(shù)據(jù)。這樣人類駕駛員的直接行為—轉(zhuǎn)向、加速和剎車可以對元數(shù)據(jù)進行“標記”,類似端到端學習中,駕駛行為與傳感器數(shù)據(jù)的匹配。
這種將感知層和執(zhí)行層神經(jīng)網(wǎng)絡(luò)分開的做法能夠規(guī)避Amnon Shashua教授提到的端到端學習可能產(chǎn)生的一系列問題:如“不常見場景”出現(xiàn)的幾率會大幅下降;對先備知識(Prior Knowledge)的要求提高,深度神經(jīng)網(wǎng)絡(luò)在解決一些簡單問題上可能會“慘敗”。
假設(shè)特斯拉用于訓練的數(shù)據(jù)來自特斯拉車主,通過人工的方式將一些“壞的”行為去掉,這樣可以避開人工編碼算法的局限和模擬測試的不真實。當然特斯拉還可以使用強化學習或監(jiān)督學習來進一步優(yōu)化??梢园崖窂揭?guī)劃或執(zhí)行控制的神經(jīng)網(wǎng)絡(luò)放在運行Autopilot或其他駕駛輔助功能的車輛上,一旦出現(xiàn)系統(tǒng)脫離、失效或碰撞等情況,工程師就可以通過BUG報告來定位原因。這些“錯誤”之后還可以用來訓練新的神經(jīng)網(wǎng)絡(luò)。
如果上面猜測正確的話,這種方法可以用相當快的速度來解決路徑規(guī)劃和執(zhí)行控制方面的問題??紤]到目前搭載硬件2.0版本的特斯拉車型每個月可以獲得近10億英里的行駛里程,獲得的數(shù)據(jù)量之大是Waymo無法企及的。之后硬件3.0版本上線后,搭載了AI芯片的這套系統(tǒng)會更有利于特斯拉算法的迭代。
盡管Waymo深受“數(shù)據(jù)”的困擾,但光憑對這個維度的考量自然是沒辦法斷言什么的。只不過Waymo要解決自動駕駛中的“長尾”問題,自然需要更多的數(shù)據(jù)支持。Waymo近日宣布將在亞利桑那州的梅薩市開設(shè)新的技術(shù)服務中心,進一步擴大無人車出行服務的規(guī)模。顯然Waymo是奔著搜集更多“數(shù)據(jù)”的目的來的。
也有人認為,Waymo可以效仿特斯拉開發(fā)一套類似Autopilot的駕駛輔助系統(tǒng),僅使用成本低廉可量產(chǎn)的傳感器。一旦在市場鋪開后,搜集真實場景的駕駛數(shù)據(jù)也就不是什么難事了。當然,Waymo自己要完成這件事比較困難,肯定需要來自主機廠領(lǐng)域的合作伙伴。
不久前有消息稱,“Waymo正在尋求外部投資人”,這其實是意料之中的計劃。如果有車企成為Waymo的股東,要獲得海量的駕駛數(shù)據(jù)自然容易得多。而且Waymo作為自動駕駛解決方案的供應商,始終只有借助OEM的平臺才能最終獲得商業(yè)化成功。不管是手中的全棧自動駕駛技術(shù),還是正在進行的移動出行業(yè)務,Waymo對很多車企而言,都是有十足吸引力的合作伙伴。Cruise和通用、福特與Argo.AI,這些都是比較成功的先例。
對特斯拉而言,之前因為Model 3陷入“量產(chǎn)地獄”,Autopilot的研發(fā)進程似乎出現(xiàn)了停滯,硬件3.0也遲遲沒有發(fā)布。盡管在“數(shù)據(jù)”容量上有先天優(yōu)勢,但率先量產(chǎn)以及頻發(fā)的幾次事故使其屢陷輿論風波。所以,特斯拉在自動駕駛上到底能有怎樣的成就,還在還很難說。
不過筆者個人倒是蠻欣賞之前馬斯克說過的一段話。他說,“我不認為哪家企業(yè)能在特斯拉之前打造出一套綜合性的自動駕駛解決方案。除非它們保密工作做得太好了,到時候要拿出驚人的成果來。我覺得這種可能性不大,對特斯拉而言,任何車企都不是我們的競爭對手”。
希望這種“目中無人”的狂妄自大,可以給特斯拉帶來點好運氣。
寫在最后
預計到2030年自動駕駛市場規(guī)模將達到8 000億美元,自動駕駛行業(yè)的競爭也會越來越激烈。如果將自動駕駛比作一顆樹,算法算力就是它的種子,決定了它成長潛質(zhì);數(shù)據(jù)就是它的土壤養(yǎng)分,決定了它成長速度。特斯拉和Waymo在數(shù)據(jù)量以及算法算力的競爭就是未來整個自動駕駛行業(yè)的縮影。