吳洋洋
“請(qǐng)看鏡頭,再眨眨眼?!?/p>
只要一兩秒鐘,攝像頭就能判斷出你是不是登記信息上記錄的那個(gè)人。哪怕你在鏡頭前不小心晃了一下,聰明的鏡頭還是會(huì)認(rèn)出你。至于人類常常出現(xiàn)的那種“臉盲癥”—尤其在面對(duì)其他種族的時(shí)候,放心,只要你提前把各種面孔的圖片放進(jìn)機(jī)器的數(shù)據(jù)庫(kù),訓(xùn)練它,它就極少會(huì)認(rèn)錯(cuò)人。
讓機(jī)器具有這種能力的是數(shù)據(jù)和算法—數(shù)萬(wàn)張打好標(biāo)簽的人臉照片,以及人類賦予它或者它根據(jù)對(duì)數(shù)萬(wàn)張照片的識(shí)別、自己總結(jié)出來(lái)的認(rèn)知規(guī)律。
就數(shù)據(jù)而言,人類產(chǎn)生的數(shù)據(jù)在指數(shù)級(jí)增加。根據(jù)IBM公司估算,人類有史以來(lái)至2003年所創(chuàng)造的信息量為5EB(編注:EB是指Exabyte,計(jì)算機(jī)存儲(chǔ)單位。如果從大家還比較熟悉的較小的信息存儲(chǔ)單位介紹起—1TB=1024GB,1PB=1024TB,而1EB=1024PB),到2011年,人類每?jī)商炀湍墚a(chǎn)生5EB的信息量。而到2018年,人類產(chǎn)生這樣的信息量大概只要一個(gè)小時(shí)。
面對(duì)信息數(shù)據(jù)爆炸,技術(shù)公司最先解決的是歷史數(shù)據(jù)的存儲(chǔ)問(wèn)題,然后是提升處理當(dāng)下“高并發(fā)”數(shù)據(jù)運(yùn)營(yíng)的能力,而第三步,它們就開(kāi)始思考如何把已經(jīng)累積的這些數(shù)據(jù)復(fù)用—如果把數(shù)據(jù)的采集、傳輸、存儲(chǔ)、計(jì)算和應(yīng)用看作一個(gè)產(chǎn)業(yè)鏈,計(jì)算和應(yīng)用就是其中最有價(jià)值的環(huán)節(jié)。
騰訊的人工智能團(tuán)隊(duì)看上的是醫(yī)生“頭腦”中的數(shù)據(jù)。他們把一些老醫(yī)生根據(jù)CT圖片判斷疾病的經(jīng)驗(yàn)量化成指標(biāo),訓(xùn)練出可以幫經(jīng)驗(yàn)不足的醫(yī)生判斷醫(yī)學(xué)影像的人工智能產(chǎn)品,提高診斷的正確率。
像高德地圖這樣的移動(dòng)地圖應(yīng)用,則早已經(jīng)可以根據(jù)用戶在路上前進(jìn)時(shí)實(shí)時(shí)使用高德地圖的數(shù)據(jù),基于用戶的地理位置信息,分析出某一路段大多數(shù)用戶的車行速度,從而推算出那條道路是否存在擁堵。
“比如一條路正面時(shí)速應(yīng)該是40公里,突然發(fā)現(xiàn)有一段區(qū)間的用戶的時(shí)速都變成0了,就說(shuō)明堵了。”阿里巴巴合伙人、高德地圖總裁劉振飛對(duì)《第一財(cái)經(jīng)》雜志說(shuō)。他拿“冰山”圖形做比喻,稱高德地圖其實(shí)有兩個(gè):一個(gè)是手機(jī)上和車載的高德地圖,“這是大家看到的高德地圖”;另一個(gè)則是看不見(jiàn)的高德—中國(guó)市場(chǎng)有超過(guò)30萬(wàn)款A(yù)pp,包括今日頭條、美團(tuán)、微博、網(wǎng)約車……它們所使用的定位功能,都是由高德開(kāi)放平臺(tái)提供的。這兩部分共同匯集成海量的人地關(guān)系大數(shù)據(jù)。加上交警部門的事故接警數(shù)據(jù)和用戶主動(dòng)分享的路況、事件數(shù)據(jù),高德甚至能區(qū)分出哪些擁堵是車輛聚集引起的,而哪些來(lái)自交通事故。
劉振飛團(tuán)隊(duì)的最新嘗試,是與公安部交通管理科學(xué)研究所合作,打通一整座城市的智慧紅綠燈系統(tǒng),結(jié)合各方面搜集到的實(shí)時(shí)路況數(shù)據(jù),通過(guò)一套算法幫助交管部門實(shí)現(xiàn)在云端更加動(dòng)態(tài)智能地調(diào)度所有的紅綠燈,配置更合理的時(shí)長(zhǎng)。使用高德地圖導(dǎo)航的司機(jī),也能獲知沿途紅綠燈的實(shí)時(shí)數(shù)據(jù),這可以幫助他們更合理地控制車速,盡量避開(kāi)紅 燈。
上述智能紅綠燈試驗(yàn)已經(jīng)在無(wú)錫測(cè)試成功。不過(guò)這種二維“活地圖”不是地圖公司的最終目標(biāo)?!拔磥?lái)自動(dòng)駕駛需要的是高精地圖,它必須能分辨出來(lái)走一車道還是四車道,某個(gè)地方的欄桿有多高、紅綠燈在什么位置,路旁邊是不是有兩棵樹(shù)。”劉振飛說(shuō)。
地圖公司嘗試把地圖從二維變成三維的時(shí)候,汽車制造廠商也想在自己的汽車上裝滿傳感器和攝像頭。
商湯科技是為汽車公司提供視覺(jué)方案的供應(yīng)商之一。它正在測(cè)試通過(guò)攝像頭傳輸?shù)囊曨l圖片識(shí)別周邊車型和物體,并通過(guò)物體長(zhǎng)度和鏡頭之間的距離計(jì)算車間距,為自動(dòng)駕駛提供決策依據(jù)。為完成識(shí)別,它也像識(shí)別人臉那樣給數(shù)萬(wàn)張車輛和交通標(biāo)識(shí)打過(guò)標(biāo)簽。
“人90%以上的信息輸入來(lái)自眼睛,圖像和視頻是人跟這個(gè)世界交互信息的最大路徑?!鄙虦萍几笨偛脳罘珜?duì)《第一財(cái)經(jīng)》雜志說(shuō),有價(jià)值的數(shù)據(jù)就是信息,當(dāng)信息的載體從0、1的二進(jìn)制碼演進(jìn)到數(shù)字、文本、語(yǔ)音、圖像和視頻,數(shù)據(jù)和信息承載的形態(tài)會(huì)朝著越來(lái)越擬人化的方向發(fā)展,即未來(lái)社會(huì)生活的溝通,對(duì)人的要求會(huì)越來(lái)越低,但對(duì)機(jī)器的要求會(huì)越來(lái)越高。2014年,商湯的DeepID算法第一次讓機(jī)器的人臉識(shí)別準(zhǔn)確率超過(guò)了人眼識(shí)別率。
當(dāng)騰訊、高德、商湯這樣的技術(shù)公司把數(shù)據(jù)“喂”給機(jī)器,讓機(jī)器開(kāi)始“懂得”人的思路—賦予它規(guī)律,或者讓它自己總結(jié)規(guī)律、建立認(rèn)知模型(兩種模式的相關(guān)技術(shù)都被稱作“人工智能”,其實(shí)后者更準(zhǔn)確的說(shuō)法是“機(jī)器智能”),數(shù)據(jù)的應(yīng)用場(chǎng)景就被進(jìn)一步擴(kuò)展了。
只有通過(guò)不斷升級(jí)深度學(xué)習(xí)訓(xùn)練體系,推進(jìn)算法生產(chǎn)環(huán)節(jié)的標(biāo)準(zhǔn)化,降低產(chǎn)品開(kāi)發(fā)成本,才能讓數(shù)據(jù)應(yīng)用場(chǎng)景進(jìn)入更多零散小量、個(gè)性化的“長(zhǎng)尾”場(chǎng)景。但技術(shù)不可被神話,我們要接受它階段性不足。
早期,這些由互聯(lián)網(wǎng)公司捕捉的用戶足跡還只是被用來(lái)做所謂“精準(zhǔn)營(yíng)銷”,比如你購(gòu)買過(guò)啤酒,它很可能就會(huì)向你推薦紙尿褲,或者你閱讀過(guò)一篇講述小鎮(zhèn)青年的新聞,接下來(lái)閱讀軟件很可能會(huì)給你推送一篇工人的車間生活—根據(jù)的都是人類認(rèn)知模型中的“相關(guān)性”。現(xiàn)在,新的數(shù)據(jù)應(yīng)用場(chǎng)景已不限于這些現(xiàn)成“01”數(shù)據(jù)形態(tài)的領(lǐng)域了,從實(shí)體零售到交通、無(wú)人駕駛、智能制造、智慧醫(yī)療以及網(wǎng)絡(luò)游戲和直播,每個(gè)尚未被數(shù)字化的傳統(tǒng)市場(chǎng)也開(kāi)始對(duì)數(shù)據(jù)感到興奮。
在這些新興場(chǎng)景中,數(shù)據(jù)的形態(tài)以語(yǔ)音和圖像為主,而且數(shù)據(jù)的生產(chǎn)(即采集)和應(yīng)用是同步進(jìn)行的。以無(wú)人駕駛為例,通過(guò)攝像頭或傳感器收集的物理世界數(shù)據(jù)進(jìn)入無(wú)人車的計(jì)算系統(tǒng)后,有關(guān)需要拐彎或者避讓的決策要立即作出。歷史數(shù)據(jù)對(duì)這些場(chǎng)景而言只有訓(xùn)練機(jī)器建模的功能。
新興場(chǎng)景看起來(lái)已經(jīng)有很多,不過(guò)這個(gè)階段,技術(shù)公司在這些細(xì)分市場(chǎng)的商業(yè)化速度并不算很可觀。2018年6月,凱迪拉克發(fā)布了和高德地圖合作的智能駕駛系統(tǒng),高德地圖提供了導(dǎo)航中需要的“高精地圖”。這套系統(tǒng)達(dá)到L3級(jí)別—司機(jī)可以在駕駛過(guò)程中放開(kāi)雙手,但行駛范圍僅限于一段30公里的高速公路。想讓這輛車在L3的狀態(tài)下駛?cè)氡本?、上海這樣的大都市,還要再等幾年,因?yàn)殡S著路況變復(fù)雜,制作高精地圖的成本和難度也迅速上升,可能還需要發(fā)射衛(wèi)星。目前對(duì)高精地圖的繪制,還處于早期實(shí)驗(yàn)階段。
Google于2019年1月2日獲批的一款基于雷達(dá)的動(dòng)作感應(yīng)設(shè)備—Soli傳感器也面臨同樣的問(wèn)題,Soli傳感器可以使用雷達(dá)波束捕捉三維空間里的動(dòng)作,讓用戶按壓拇指和食指指尖上的虛擬按鈕,或者通過(guò)拇指和食指之間的摩擦來(lái)完成虛擬撥號(hào)。
做技術(shù)出身的劉振飛表示,盡管現(xiàn)在計(jì)算能力大幅提升、機(jī)器設(shè)備越來(lái)越智能,但我們應(yīng)該正視理念與現(xiàn)實(shí)之間存大的巨大差距:“你做一個(gè)樣片、一個(gè)局部的演示可以,但是如果做成你能用、我能用、家里父母都能用的東西,就需要巨大成本,那是一個(gè)工程技術(shù)。我們?cè)谝徊揭徊教剿?。?/p>
就自動(dòng)駕駛而言,所有計(jì)算都必須要在毫秒級(jí)時(shí)長(zhǎng)內(nèi)完成,才對(duì)自動(dòng)駕駛決策有意義。這既有賴于5G商用,也需要終端設(shè)備完成從功能機(jī)到智能機(jī)的硬件革命—不僅車要夠智能,路也要夠智能。實(shí)際情況是,國(guó)內(nèi)的紅綠燈和交通部門使用的絕大部分?jǐn)z像頭都是不聯(lián)網(wǎng)的。有些紅綠燈甚至還需要人工做手動(dòng)控制,每過(guò)30秒或1分鐘,由專門管理信號(hào)燈的人士去扳一次開(kāi)關(guān)。
醫(yī)療數(shù)據(jù)的用戶隱私性和醫(yī)療安全問(wèn)題,令“騰訊覓影”這樣的醫(yī)療影像識(shí)別產(chǎn)品至今沒(méi)能拿到可以商用的醫(yī)療器械牌照。因?yàn)閲?guó)內(nèi)的商業(yè)保險(xiǎn)并不發(fā)達(dá),國(guó)內(nèi)的影像識(shí)別公司也還沒(méi)找到愿意為其技術(shù)買單的對(duì)象。
按照商業(yè)化的難易度,楊帆把結(jié)合了人工智能技術(shù)的數(shù)據(jù)應(yīng)用場(chǎng)景分為“頭部場(chǎng)景”和“長(zhǎng)尾場(chǎng)景”兩類。自動(dòng)駕駛、醫(yī)療影像識(shí)別、智慧城市項(xiàng)目,在他看來(lái)都算得上是“頭部”場(chǎng)景—它們也是各大公司在人工智能領(lǐng)域投資同質(zhì)化的主要原因之一。而更多場(chǎng)景其實(shí)存在于“長(zhǎng)尾”部分。
“我們?cè)缒昕春糜靡曈X(jué)識(shí)別做工業(yè)4.0,但后來(lái)發(fā)現(xiàn)這個(gè)領(lǐng)域沒(méi)有我們一開(kāi)始想象的那么好,關(guān)鍵原因是它里面的場(chǎng)景特別地細(xì)分。每個(gè)生產(chǎn)線面臨的問(wèn)題,泛泛來(lái)說(shuō)都可以叫‘視頻分析,但每種算法要解決的問(wèn)題都不一樣。”楊帆解釋說(shuō),如果要為每一個(gè)細(xì)分場(chǎng)景都開(kāi)發(fā)一套算法,前提必須是場(chǎng)景經(jīng)過(guò)算法優(yōu)化所帶來(lái)的商業(yè)回報(bào),要能支撐技術(shù)成本。所以,只有通過(guò)不斷升級(jí)深度學(xué)習(xí)訓(xùn)練體系,推進(jìn)算法生產(chǎn)環(huán)節(jié)的標(biāo)準(zhǔn)化,打通不同場(chǎng)景的技術(shù)壁壘,降低產(chǎn)品開(kāi)發(fā)成本,才能讓技術(shù)有機(jī)會(huì)進(jìn)入更多零散小量、個(gè)性化的“長(zhǎng)尾”場(chǎng)景。
某個(gè)城市的治安部門曾提出要在河邊設(shè)置一個(gè)攝像頭,一旦有人跳河就能自動(dòng)報(bào)警。這件事從技術(shù)上可行,挑戰(zhàn)是至少需要上萬(wàn)張的人跳湖影像—根據(jù)楊帆的經(jīng)驗(yàn),“萬(wàn)級(jí)”的數(shù)據(jù)是訓(xùn)練機(jī)器的基數(shù)—才能訓(xùn)練出一個(gè)跳湖提示算法,而這個(gè)算法可能“只適應(yīng)某個(gè)地方跳湖,換一個(gè)地方就不行了”。這是個(gè)極端的場(chǎng)景需求,但它也反映出數(shù)據(jù)產(chǎn)品化的過(guò)程會(huì)遇到原生數(shù)據(jù)不足的問(wèn)題。
模擬訓(xùn)練是解決原生數(shù)據(jù)不足的一種辦法。商湯利用真實(shí)渣土車標(biāo)注數(shù)據(jù),以及將渣土車圖像嵌入視頻的模擬訓(xùn)練等技術(shù),實(shí)現(xiàn)了當(dāng)城市攝像頭拍到違規(guī)進(jìn)城的渣土車,立即觸發(fā)實(shí)時(shí)報(bào)警的功能。
Google云前AI首席科學(xué)家、斯坦福大學(xué)教授李飛飛曾提及她帶領(lǐng)團(tuán)隊(duì)開(kāi)發(fā)一款老人監(jiān)護(hù)產(chǎn)品—在老人摔倒時(shí),機(jī)器能夠報(bào)警。但是要實(shí)現(xiàn)這個(gè)功能,前提是要有上萬(wàn)張老人摔倒的行為影像數(shù)據(jù)。最后,他們通過(guò)讓人模擬老人摔倒解決了這個(gè)問(wèn)題。在硅谷,因此還誕生了一些專門生產(chǎn)模擬數(shù)據(jù)的機(jī)構(gòu)。
模擬數(shù)據(jù)能解決數(shù)據(jù)量不足的問(wèn)題,但仍面臨數(shù)據(jù)多樣性的挑戰(zhàn)。很多場(chǎng)景的原始數(shù)據(jù)如果連最基本的多樣性覆蓋都保證不了,就沒(méi)辦法模擬。“模擬什么樣的人跳河是真的跳河,什么樣是假的呢?如果你模擬的東西不夠真,你不知道機(jī)器會(huì)學(xué)出來(lái)什么?!睏罘@樣解釋其中的復(fù)雜性。
數(shù)據(jù)不僅是一種資產(chǎn),更是一種資源。從商業(yè)價(jià)值上看,數(shù)據(jù)只有以用戶為中心建構(gòu)才能獲得最大的變現(xiàn)價(jià)值。高德地圖的母公司阿里巴巴目前有三大數(shù)據(jù)池—淘寶、支付寶和高德地圖,它們分別意味著人與商品、人與資產(chǎn)、人與位置。假如將這三類數(shù)據(jù)打通,阿里巴巴能做的生意就不會(huì)僅僅是讓高德幫助盒馬鮮生決定選在哪里開(kāi)店最好,它將實(shí)現(xiàn)真正的線上線下打通。但阿里巴巴迄今還沒(méi)有打通這三者之間的底層數(shù)據(jù)。因?yàn)樯頌榧夹g(shù)公司必須要兼顧商業(yè)效率與數(shù)據(jù)安全的問(wèn)題。數(shù)據(jù)安全,在很大程度上指的是對(duì)用戶個(gè)人隱私的保護(hù)。
在為開(kāi)發(fā)一套還原真實(shí)物理世界的“高精地圖”感到興奮的同時(shí),劉振飛也在思考:數(shù)據(jù)能解決所有的問(wèn)題嗎?
2016年,他的團(tuán)隊(duì)和公安部合作了一個(gè)尋找丟失兒童的公益項(xiàng)目。整個(gè)過(guò)程中并沒(méi)有用到攝像頭和人臉識(shí)別,而是靠高德的定位能力和釘釘為公安打拐系統(tǒng)的六千多名專門負(fù)責(zé)(找孩子)的警察開(kāi)發(fā)了協(xié)同辦公插件。當(dāng)有兒童丟失時(shí),當(dāng)?shù)孛窬ㄟ^(guò)釘釘發(fā)布尋人信息,借助高德的地理圍欄和基于位置的推送(LBP)技術(shù)和接口,直接向指定范圍內(nèi)的高德用戶推送這條消息。當(dāng)有用戶自愿提供線索時(shí),專職民警會(huì)負(fù)責(zé)核實(shí)—這種找法和傳統(tǒng)流程沒(méi)有什么不同,但辦事效率極大提升。這個(gè)名為“團(tuán)圓”的項(xiàng)目,在兩年內(nèi)發(fā)布了3419條兒童丟失信息,而找回率高達(dá)到98.4%。
“后來(lái)我們想再做個(gè)尋找丟失老人的項(xiàng)目就很難。倒不是技術(shù)和錢的問(wèn)題,而是缺乏明確的政府部門去管這件事,目前沒(méi)有像找孩子那樣的專職找老人的團(tuán)隊(duì)?!边@件事讓劉振飛意識(shí)到不是所有的問(wèn)題都能用技術(shù)來(lái)解決,“一開(kāi)始我們也想過(guò)在火車站、汽車站搞攝像頭,后來(lái)發(fā)現(xiàn)這件事光靠技術(shù)還是不夠的。所以,有時(shí)候我們也不能過(guò)于理想化地夸大技術(shù)的能力。”