賀乾明
2014 年底,Uber 董事會(huì)召開(kāi),重要議題需要討論:優(yōu)步與滴滴的大戰(zhàn)剛剛開(kāi)始,每月超過(guò)5億元的補(bǔ)貼投向中國(guó),許多股東對(duì)此感到懷疑。
會(huì)剛開(kāi)始,代表大投資方Google的董事大衛(wèi)·德拉蒙德(David Drummond)要求回避,他直截了當(dāng):Google將以無(wú)人駕駛汽車進(jìn)入網(wǎng)約車市場(chǎng)。競(jìng)爭(zhēng)很快會(huì)變成現(xiàn)實(shí),他已經(jīng)不適合再參加討論。
八年之后,網(wǎng)約車行業(yè)大起大落,燒掉數(shù)百億美元,便利了人們的生活、留下無(wú)數(shù)精彩的商戰(zhàn)故事。而無(wú)人駕駛投入更大。
按照麥肯錫去年的統(tǒng)計(jì),公司、風(fēng)險(xiǎn)資本自2010年以來(lái)在無(wú)人駕駛相關(guān)技術(shù)的投入超過(guò)1000億美元。但無(wú)人車依然極不可靠。去年Google(Waymo)的一輛測(cè)試無(wú)人出租車在路上遇到幾個(gè)交通錐,就停了下來(lái)拒絕行駛。通用汽車的無(wú)人出租車因?yàn)闆](méi)看懂路況被撞。
無(wú)人駕駛最激進(jìn)的鼓吹者、特斯拉首席執(zhí)行官埃隆·馬斯克(Elon Musk)現(xiàn)在承認(rèn)低估了開(kāi)發(fā)無(wú)人駕駛系統(tǒng)的難度。福特技術(shù)負(fù)責(zé)人道格·菲爾德(Doug Field)說(shuō),無(wú)人車是 “我們這個(gè)時(shí)代最困難的技術(shù)問(wèn)題,比把人送上月球更難”。
大公司和資本市場(chǎng)已近絕望。福特、亞馬遜、聯(lián)邦快遞各自關(guān)閉了無(wú)人駕駛項(xiàng)目,有的已經(jīng)投入數(shù)十億美元。上市的無(wú)人車公司,不論是研發(fā)無(wú)人出租車的、運(yùn)營(yíng)無(wú)人貨車的、賣激光雷達(dá)的,市值與高峰期相比都跌掉90%。Mobileye情況好一些,因?yàn)樗u的產(chǎn)品還不是無(wú)人駕駛,主要是幫助司機(jī)減輕一些駕駛工作。
馬斯克說(shuō)過(guò),人類開(kāi)車就是用兩個(gè)攝像頭,加上生物神經(jīng)網(wǎng)絡(luò)。兩只眼睛分辨率很不錯(cuò),但看運(yùn)動(dòng)物體時(shí)也就800萬(wàn)像素左右;大腦厲害一些,但全速運(yùn)轉(zhuǎn)起來(lái),功率也就20W,不到英偉達(dá)上一代游戲顯卡的10%。
2012年,加拿大多倫多大學(xué)的教授杰弗里·辛頓(Geoffrey Hinton)和學(xué)生們帶來(lái)了AlexNet模型,證明計(jì)算機(jī)已經(jīng)可以用簡(jiǎn)單模仿人腦的多層神經(jīng)網(wǎng)絡(luò)模型獲得類似人的視覺(jué)認(rèn)知:看過(guò)大量圖片之后,計(jì)算機(jī)可以掌握不同物體的特征,識(shí)別出同類物體。自然,計(jì)算機(jī)也可以“看懂”路。“看懂”之后,在城市里開(kāi)車,基本是在2D平面移動(dòng)物體,毫無(wú)難度。
無(wú)人車認(rèn)路的設(shè)備比人眼強(qiáng)得多。Google目前的無(wú)人車安裝了29個(gè)攝像頭、百度RT-6用了12個(gè)攝像頭。它們還額外配置了多個(gè)激光雷達(dá)、毫米波雷達(dá)、超聲波雷達(dá)。
過(guò)去十年,科技公司一邊組建了昂貴的專業(yè)團(tuán)隊(duì)研究算法,一邊雇傭或外包數(shù)千、上萬(wàn)人的團(tuán)隊(duì)。每天24小時(shí),南極以外的每個(gè)大洲,都有數(shù)以萬(wàn)計(jì)的人坐在格子間或家中用鼠標(biāo)和鍵盤,把一張張圖片中的所有物體圈出來(lái),標(biāo)注清它們是什么、處于什么狀態(tài),教無(wú)人車認(rèn)路。
為了理解這事為什么做十年也不成,我試著從計(jì)算機(jī)的眼睛去看道路,當(dāng)了幾天無(wú)人駕駛數(shù)據(jù)標(biāo)注員。
美國(guó)無(wú)人車數(shù)據(jù)標(biāo)注平臺(tái)Remotasks提供了豐富的需求。一個(gè)典型工作是標(biāo)記夜間街道上的出租車。
標(biāo)注也不是簡(jiǎn)單點(diǎn)一下,需要一個(gè)像素一個(gè)像素,沿著輪廓圈出來(lái)。多數(shù)情況,出租車在圖片里并不顯眼,我得把圖片放大、慢慢畫(huà)。如果出租車的一部分被其他車擋住,得腦補(bǔ)畫(huà)出弧度。
一個(gè)人要對(duì)出租車有概念,看幾遍就行了。無(wú)人車不行,攝像頭收集來(lái)的圖像,對(duì)它來(lái)說(shuō)是一串代表色塊的字符,只有反復(fù)看上萬(wàn)張有標(biāo)簽的圖像,它才能總結(jié)規(guī)律,搞清楚色塊怎么排列是出租車。
2018年4月25日,在德國(guó)漢諾威,工程師雙手離開(kāi)方向盤,測(cè)試德國(guó)大陸集團(tuán)生產(chǎn)的無(wú)人駕駛汽車。圖/新華
要是想讓無(wú)人車更精確地認(rèn)路,還得靠人把圖像中每一個(gè)像素用不同的顏色標(biāo)記好,區(qū)分出什么是天空、什么是樹(shù)干、什么是樹(shù)冠、什么是建筑、什么是車、什么是人、什么是可行駛的道路、什么是車道線等等。
今年4月,特斯拉的自動(dòng)駕駛輔助系統(tǒng)(Autopilot)把騎馬的人識(shí)別成人和狗。顯然特斯拉沒(méi)有教過(guò)系統(tǒng)如何識(shí)別馬。雖然無(wú)人駕駛系統(tǒng)也不會(huì)直接撞上狗,但它需要預(yù)判面前的物體會(huì)如何行動(dòng),再?zèng)Q定自己怎么開(kāi)。這就意味著風(fēng)險(xiǎn),馬和狗行動(dòng)的速度大不相同。
標(biāo)注無(wú)人車更依賴的激光雷達(dá)數(shù)據(jù)會(huì)麻煩許多,標(biāo)注員面前是360度全景圖,密集的白點(diǎn)一圈圈暈開(kāi),碰到物體時(shí)會(huì)聚在一堆,組成車或人的形狀。標(biāo)注員得用矩形框圈出畫(huà)面中車或人的大小、高度、方向,標(biāo)清楚它們是什么車或什么狀態(tài)的人,給機(jī)器學(xué)習(xí)。
為了讓無(wú)人車更安全,無(wú)人車公司提出了“傳感器融合”的方法,即把激光雷達(dá)、攝像頭等收集的數(shù)據(jù)結(jié)合在一起識(shí)別物體和周圍的環(huán)境。
新方法傳遞到數(shù)據(jù)標(biāo)注環(huán)節(jié),代表著更多要求。標(biāo)注員得配合不同視角的攝像頭圖像,校正激光雷達(dá)標(biāo)注框,然后增加更多信息,方便算法做判斷。比如框里是什么車?小汽車還是貨車?車是否被遮擋?遮擋了多少?車的轉(zhuǎn)向燈是否亮著?剎車燈是否亮著?尾燈是否亮著?等等。有些任務(wù)要備注清楚20多個(gè)不同的狀態(tài),操作手冊(cè)都有60多頁(yè)。
標(biāo)注員拿到的激光雷達(dá)數(shù)據(jù)通常是40張連續(xù)的畫(huà)面。不同的時(shí)刻道路上物體的狀態(tài)并不一樣,比如這一幀剎車燈亮了,另一幀不亮;這一幀遮擋80%,另一幀不遮擋了,每一幀都需要反復(fù)確認(rèn),這些狀態(tài)都得重新填一遍。
Remotasks在官方教程中建議,為了避免出錯(cuò),最好先標(biāo)一個(gè)物體,跟著它過(guò)完40幀,然后再回到第一幀標(biāo)注另一個(gè)物體,一個(gè)個(gè)標(biāo)完,然后再整體過(guò)一遍,查漏補(bǔ)缺。
為了提高效率,培訓(xùn)教程里專門有一個(gè)環(huán)節(jié)教標(biāo)注員怎么用鍵盤上的快捷鍵加速標(biāo)注,而不是鼠標(biāo)點(diǎn)來(lái)點(diǎn)去。但標(biāo)注激光雷達(dá)數(shù)據(jù)還是會(huì)消耗大量時(shí)間,40張的數(shù)據(jù)通常需要3個(gè)-6個(gè)小時(shí)。
專業(yè)人士也快不了。一位數(shù)據(jù)標(biāo)注公司的技術(shù)人員自己試了試,一個(gè)下午四五個(gè)小時(shí),也就標(biāo)注50張。
深圳一家自動(dòng)駕駛公司技術(shù)負(fù)責(zé)人劉峰(化名)已經(jīng)研究六年無(wú)人駕駛,他告訴《財(cái)經(jīng)》,一個(gè)無(wú)人車系統(tǒng)經(jīng)過(guò)上萬(wàn)幀的數(shù)據(jù)訓(xùn)練,能應(yīng)對(duì)成千上萬(wàn)個(gè)場(chǎng)景,通常就能平穩(wěn)上路。
《財(cái)經(jīng)》了解到,現(xiàn)在標(biāo)注一幀激光雷達(dá)數(shù)據(jù),平均成本約10元人民幣。不只是數(shù)據(jù)標(biāo)注本身花錢,保證標(biāo)注正確也需要投入——你不能保證一個(gè)人的標(biāo)注絕對(duì)準(zhǔn)確。
解決辦法是讓多個(gè)人標(biāo)注同一張圖,讓一個(gè)人重復(fù)標(biāo)注一張圖,只要結(jié)果不一樣,就得重新做。人得標(biāo)幾萬(wàn)張圖,無(wú)人車公司才能得到1萬(wàn)張可用的圖。而且數(shù)據(jù)標(biāo)注公司、客戶都會(huì)有專門的人審查數(shù)據(jù)標(biāo)注質(zhì)量。
在眾包平臺(tái)Remotasks上,嚴(yán)格的審查更明顯。每次標(biāo)注結(jié)束后,系統(tǒng)會(huì)自動(dòng)打分,如果低于60,警告橫幅就會(huì)出現(xiàn)在工作區(qū)域正上方,寫著“我們已經(jīng)注意到你最近的工作質(zhì)量很低,請(qǐng)仔細(xì)按要求完成,否則你可能就沒(méi)法繼續(xù)干了”。
加上審核環(huán)節(jié)投入的人力成本,用數(shù)萬(wàn)幀標(biāo)注過(guò)的數(shù)據(jù)訓(xùn)練無(wú)人車系統(tǒng),大約需要近百萬(wàn)元人民幣。不過(guò)這樣的無(wú)人車只能應(yīng)對(duì)有限的場(chǎng)景,比如路況簡(jiǎn)單的高速公路。
盡管無(wú)人車公司不會(huì)在單個(gè)場(chǎng)景無(wú)止境標(biāo)注數(shù)據(jù)訓(xùn)練系統(tǒng),識(shí)別準(zhǔn)確率或處理能力到一個(gè)程度就會(huì)停下來(lái)。但無(wú)人車消耗資金的漫長(zhǎng)過(guò)程才剛剛開(kāi)始。
為了讓無(wú)人車適應(yīng)更多環(huán)境,無(wú)人車公司得花錢買車,裝上激光雷達(dá)、攝像頭等傳感器,去真實(shí)的道路上測(cè)試,這本身就意味著成本——早期的無(wú)人車單輛僅硬件成本就超過(guò)10萬(wàn)美元。只靠一輛車采集數(shù)據(jù)遠(yuǎn)遠(yuǎn)不夠。
行業(yè)普遍認(rèn)為,研發(fā)大規(guī)模可用的無(wú)人車,至少需要百億公里路測(cè)數(shù)據(jù)。這意味著1萬(wàn)輛裝著激光雷達(dá)、計(jì)算芯片的車每天載著安全員,以40公里-50公里的時(shí)速開(kāi)十個(gè)小時(shí),連續(xù)開(kāi)十年。
它們的任務(wù)主要是發(fā)現(xiàn)系統(tǒng)不能處理的場(chǎng)景,然后無(wú)人車公司自己或通過(guò)外包收集大量同類數(shù)據(jù),交給人標(biāo)注,給模型學(xué)習(xí),又得花近百萬(wàn)元。這意味著,無(wú)人車想要應(yīng)對(duì)成千上萬(wàn)個(gè)不同的場(chǎng)景,要在數(shù)據(jù)標(biāo)注上花數(shù)十億元。
多數(shù)無(wú)人車公司都開(kāi)發(fā)了自動(dòng)標(biāo)注工具,以節(jié)省標(biāo)注成本,提高效率。但這些工具不夠準(zhǔn)確,只能替代小部分人力。
和訓(xùn)練好的無(wú)人車一樣,自動(dòng)標(biāo)注系統(tǒng)只能處理人類標(biāo)注員反復(fù)標(biāo)注過(guò)的場(chǎng)景或物體,而這些物體對(duì)提升一個(gè)無(wú)人駕駛系統(tǒng)的能力已經(jīng)不太重要。如果無(wú)人車遇到的新物體或場(chǎng)景,還是需要大量的人標(biāo)注、審核。
“多數(shù)客戶不會(huì)完全結(jié)束數(shù)據(jù)標(biāo)注。” 倍賽科技的人士說(shuō),“場(chǎng)景實(shí)在太多了,不同的地區(qū)、不同的天氣、不同的環(huán)境都不一樣。”
而且訓(xùn)練好的無(wú)人車系統(tǒng),裝到不同的車上或在不同城市行駛,效果會(huì)打折扣。加州車管局2021年無(wú)人車接管報(bào)告中,Waymo的無(wú)人車遇到問(wèn)題,需要安全員介入的情況比上一年多了4倍。
原因是Waymo調(diào)整了測(cè)試地點(diǎn),不再在山景城測(cè)試,增加了舊金山測(cè)試的車輛,并且將測(cè)試的主力車型從克萊斯勒的Pacifica換成了捷豹iPace。
舊金山的坡更多,于是攝像頭看物體的角度變了。原先能認(rèn)出來(lái)的物體現(xiàn)在可能就認(rèn)不出來(lái)。
新車型也有影響。車身矮了20厘米,這意味著車身的攝像頭、激光雷達(dá)看世界的高度降低20厘米,角度發(fā)生變化。
舊金山遠(yuǎn)不是什么復(fù)雜的大都市,市區(qū)面積只有121平方公里、常住人口不到90萬(wàn)——面積和人口不到北京朝陽(yáng)區(qū)的四分之一。全球汽車品牌還有超過(guò)300個(gè),車型更是數(shù)以千計(jì)。
想要讓無(wú)人駕駛系統(tǒng)適應(yīng)更多城市、更多車型,處理更多場(chǎng)景,得有更多測(cè)試,發(fā)現(xiàn)更多問(wèn)題,收集更多數(shù)據(jù),做更多標(biāo)注,交給系統(tǒng)學(xué)習(xí)。
一位數(shù)據(jù)標(biāo)注行業(yè)人士告訴《財(cái)經(jīng)》,她了解到一家2019年成立的無(wú)人車公司,今年花在數(shù)據(jù)標(biāo)注上的費(fèi)用達(dá)到1億元人民幣,接下來(lái)還會(huì)花更多,“無(wú)人車公司的估值跟數(shù)據(jù)掛鉤,高質(zhì)量數(shù)據(jù)越多,估值越高”。
去年5月,Waymo在鳳凰城運(yùn)營(yíng)的無(wú)人出租車要右轉(zhuǎn)時(shí)忽然停下,附近沒(méi)車和行人,只有幾個(gè)交通錐。
后排的乘客無(wú)能為力,只能等待救援。救援人員還在路上,無(wú)人車忽然動(dòng)了起來(lái),右轉(zhuǎn),沒(méi)走多遠(yuǎn)又在交通錐旁停了下來(lái)。就在救援人員追上的時(shí)候,施工隊(duì)把附近的交通錐取走,無(wú)人車又開(kāi)走了。它沒(méi)有恢復(fù)正常。過(guò)了一會(huì)兒,它又停在了交通錐旁,堵住車道。
道路上隨處可見(jiàn)的交通錐,是無(wú)人車系統(tǒng)必須要學(xué)習(xí)識(shí)別的物體。無(wú)法準(zhǔn)確識(shí)別交通錐曾是特斯拉自動(dòng)駕駛輔助系統(tǒng)的弱點(diǎn),出過(guò)多次事故。2019年特斯拉在一次自動(dòng)駕駛輔助系統(tǒng)升級(jí)時(shí)特別強(qiáng)調(diào),可以準(zhǔn)確識(shí)別交通錐。
Wyamo的無(wú)人車認(rèn)出了車旁的每一個(gè)交通錐,但沒(méi)能作出像人類司機(jī)一樣的反應(yīng)。Waymo沒(méi)公布事故原因,只是說(shuō)“檢測(cè)到異常情況”,將改進(jìn)運(yùn)營(yíng)流程。
“可能他們也不清楚為什么會(huì)這樣。”長(zhǎng)期從事無(wú)人駕駛安全研究的加州大學(xué)爾灣分校助理教授陳齊(Alfred Chen)說(shuō)。建立在人工智能技術(shù)上的無(wú)人駕駛系統(tǒng)是一個(gè) “黑盒子”,沒(méi)人能搞清楚它如何把一堆數(shù)據(jù)變成結(jié)果。人們能做的,是給它大量標(biāo)注好的數(shù)據(jù),讓算法自己提煉規(guī)律,并依此處理新的數(shù)據(jù)。但工程師并不能看懂算法的邏輯。
這不是自動(dòng)駕駛獨(dú)有的問(wèn)題,任何使用深度學(xué)習(xí)的應(yīng)用都一樣。只是人們不那么在意抖音的算法有時(shí)推給你推薦幾個(gè)不感興趣的視頻,但人們非常在意一輛一噸多重的汽車失常。
無(wú)人駕駛系統(tǒng)相關(guān)的致死事故已經(jīng)有一些。Uber的無(wú)人車在測(cè)試時(shí)撞死行人。根據(jù)Tesla Deaths統(tǒng)計(jì),全球至少有15個(gè)人的死亡與特斯拉的自動(dòng)駕駛輔助系統(tǒng)有關(guān)。中國(guó)的汽車廠也有,蔚來(lái)、小鵬都出現(xiàn)過(guò)類似的死亡事件。
公司往往將問(wèn)題歸咎到人身上,比如安全員不認(rèn)真看路,駕駛員不應(yīng)該輕信所謂的“無(wú)人駕駛系統(tǒng)”。但歸根結(jié)底,還是目前的自動(dòng)駕駛系統(tǒng)沒(méi)看明白道路上的物體,需要人干預(yù)。
無(wú)人車可以針對(duì)特定的問(wèn)題改進(jìn)軟件,但又得回到數(shù)據(jù)上。“不需要理解中間到底為什么出錯(cuò),只要知道哪塊做的不好,用大量的數(shù)據(jù)訓(xùn)練系統(tǒng),讓它回歸到正常情況(Ground Truth)就OK了?!?劉峰說(shuō)。
他舉例,無(wú)人車系統(tǒng)預(yù)測(cè)其他人或車未來(lái)幾秒的行動(dòng)不準(zhǔn)確沒(méi)關(guān)系,只要有足夠多高質(zhì)量的數(shù)據(jù)訓(xùn)練,就可以有更好的效果。
以上還沒(méi)算無(wú)人車被攻擊的情況。2019年,騰訊科恩實(shí)驗(yàn)室的研究人員在路上放了三張小紙片,一輛開(kāi)著自動(dòng)駕駛輔助系統(tǒng)的特斯拉Model S識(shí)別后突然變道。
加上激光雷達(dá)也不能解決問(wèn)題。陳齊等人2021年的一項(xiàng)研究發(fā)現(xiàn),經(jīng)過(guò)特殊設(shè)計(jì)的表面坑坑洼洼的交通錐,可以騙過(guò)百度開(kāi)源的無(wú)人駕駛系統(tǒng)Apollo。模擬測(cè)試中,同時(shí)使用激光雷達(dá)和攝像頭的Apollo能100%識(shí)別正常的交通錐,但面對(duì)特殊錐桶,識(shí)別率為0。
對(duì)無(wú)人車的攻擊也會(huì)以正常的情況出現(xiàn)。陳齊說(shuō),他們正在進(jìn)行的一項(xiàng)研究發(fā)現(xiàn),無(wú)人車旁邊的車行駛路線稍微奇怪一點(diǎn),一些無(wú)人車系統(tǒng)就很難正確預(yù)測(cè)它會(huì)怎么行動(dòng)了。而預(yù)測(cè)周圍車輛如何行駛是它規(guī)劃行駛路徑的前提。
無(wú)人車公司想了許多辦法避免極端情況,最主要的是加裝更多的傳感器。Waymo最新的無(wú)人車上有5顆激光雷達(dá)、6顆毫米波雷達(dá)、29個(gè)攝像頭。2014年,Google高管覺(jué)得很快就能讓無(wú)人出租車上路接客的時(shí)候,Waymo的車只有5個(gè)激光雷達(dá)、4個(gè)毫米波雷達(dá)和1個(gè)攝像頭。
更多傳感器、更多數(shù)據(jù),也意味著需要更多人力去標(biāo)注圖片,幫助機(jī)器理解每一個(gè)畫(huà)面。這些還只是無(wú)人車平穩(wěn)上路的前半截,它能夠識(shí)別路上的所有物體,并搞清楚它們?nèi)绾涡袆?dòng)后,還要規(guī)劃自己怎么開(kāi)并付諸行動(dòng),一樣有許多問(wèn)題需要解決。
今年9月,圖靈獎(jiǎng)得主、計(jì)算機(jī)科學(xué)家楊立昆(Yann LeCun)接受時(shí)采訪說(shuō),無(wú)人車公司一直過(guò)于樂(lè)觀,覺(jué)得將數(shù)據(jù)扔進(jìn)大型神經(jīng)網(wǎng)絡(luò)就能讓它學(xué)到一切。事實(shí)上,“我們可能只是擁有一個(gè)沒(méi)有常識(shí)、十分脆弱的系統(tǒng)”。
劉峰說(shuō),無(wú)人車行業(yè)普遍認(rèn)為,如果行駛大量里程后,無(wú)人車沒(méi)有出現(xiàn)安全問(wèn)題,就會(huì)被認(rèn)為是安全的。無(wú)人車不可能百分百安全,就像航空業(yè)一樣,“大家都說(shuō)坐飛機(jī)是最安全的交通工具,但飛機(jī)也不是百分百安全”。
這將是一個(gè)漫長(zhǎng)的過(guò)程。萊特兄弟發(fā)明的飛機(jī)試飛成功30年后,道格拉斯DC-3讓短途飛行變得更安全,航空業(yè)才開(kāi)始走向商業(yè)化。
現(xiàn)在全球大約有2000輛無(wú)人車載客運(yùn)營(yíng),占汽車總數(shù)的0.00014%。算上接下來(lái)要進(jìn)入的洛杉磯,已經(jīng)商業(yè)化運(yùn)營(yíng)四年的無(wú)人車優(yōu)等生Waymo進(jìn)入了四個(gè)城市,收入都不夠支付車的成本,更別提收回長(zhǎng)期研發(fā)投入。
大多數(shù)公司不再相信短時(shí)間能讓無(wú)人車商用,開(kāi)始轉(zhuǎn)向研發(fā)輔助駕駛技術(shù),讓汽車行駛時(shí)會(huì)主動(dòng)控制車速與車距,必要時(shí)刻提醒司機(jī)接管車輛甚至緊急剎停。
更多的人把目光放到了汽車行業(yè)外,想用無(wú)人車一樣的方式改造機(jī)器人行業(yè)。與無(wú)人車相比,讓機(jī)器人自動(dòng)運(yùn)行可能會(huì)簡(jiǎn)單些,它們所處的環(huán)境更封閉。工廠或者辦公室里的環(huán)境不會(huì)像道路一樣多變。
所有這些探索都需要更多人來(lái)當(dāng)勞動(dòng)力。11月初,已經(jīng)推出機(jī)器人的特斯拉將舉行公開(kāi)招聘日,招募人為機(jī)器人做圖片標(biāo)注。
如今估值最高的人工智能創(chuàng)業(yè)公司,不再是研究算法的公司,而是找人給圖片打標(biāo)簽的公司Scale,美國(guó)大多數(shù)無(wú)人車或機(jī)器人公司都是它的客戶。Scale和它跨越數(shù)十個(gè)國(guó)家的眾包團(tuán)隊(duì),每個(gè)月在Remotasks等平臺(tái)上給不同種類的數(shù)據(jù)打上數(shù)十億個(gè)標(biāo)簽。去年4月,它完成融資后估值73億美元,不到半年就翻了一番。
中國(guó)的標(biāo)注公司生意也變得更好。百度在臨汾等城市成立數(shù)據(jù)標(biāo)注公司,不僅給自己標(biāo)注數(shù)據(jù),還對(duì)外提供服務(wù)。今年前九個(gè)月,數(shù)據(jù)公司海天瑞聲“智能駕駛”相關(guān)業(yè)務(wù)同比增長(zhǎng)了200%。
市場(chǎng)研究機(jī)構(gòu)Research and Markets預(yù)測(cè),到2030年,全球數(shù)據(jù)標(biāo)注市場(chǎng)規(guī)模將比現(xiàn)在擴(kuò)大6倍,從21億美元增長(zhǎng)到127.5億美元。
做標(biāo)注的公司估值高,但真正標(biāo)注數(shù)據(jù)的人工資低。我在Remotasks上標(biāo)注一張出租車圖片,最后只賺到2分錢人民幣(0.003美元)。標(biāo)注激光雷達(dá)數(shù)據(jù)更貴一些,熟練的標(biāo)注員每個(gè)小時(shí)能賺7.5美元。在Remotasks工作的人大都來(lái)自委內(nèi)瑞拉、肯尼亞等落后國(guó)家。
《麻省理工科技評(píng)論》曾批評(píng)這是 “人工智能殖民”:發(fā)達(dá)國(guó)家的公司享受人工智能帶來(lái)的利潤(rùn)和便捷,落后國(guó)家的勞動(dòng)力被剝削。但到目前為止,這句話的前半截還沒(méi)能成立。