特朗普政府稱其總統(tǒng)就職典禮觀看人數(shù)“史上最多”。這極富爭(zhēng)議,但無意中強(qiáng)調(diào)了人群計(jì)數(shù)仍然是一門困難且不精確的科學(xué)。人工智能的興起將很快將科學(xué)家從手動(dòng)計(jì)算人數(shù)中解放出來。
人工智能(AI)統(tǒng)計(jì)人數(shù)的技術(shù)最早出現(xiàn)于2013年。中佛羅里達(dá)大學(xué)研究人員表明,基于機(jī)器學(xué)習(xí)的計(jì)算機(jī)軟件可以迅速提供數(shù)量達(dá)幾十萬的自動(dòng)人群估值。這樣的AI工具在根據(jù)圖像進(jìn)行準(zhǔn)確人數(shù)統(tǒng)計(jì)方面仍有改進(jìn)的余地,但只需半小時(shí)就能完成研究人員一周的工作。
“在準(zhǔn)確性方面[大群體計(jì)數(shù)],我們將誤差控制在(和人工,主要是本科生計(jì)數(shù)相比)30%以內(nèi)。但是我們無法確保它比專業(yè)計(jì)數(shù)器好,”計(jì)算機(jī)科學(xué)教授和中佛羅里達(dá)大學(xué)計(jì)算機(jī)視覺研究中心主任Mubarak Shah說。“但是就效率而言,人類不可能達(dá)到這樣的速度。”Shah還指出,計(jì)算機(jī)軟件的計(jì)數(shù)更“客觀”,因?yàn)樗缓祟惼姟?/p>
政治事件如示威游行或總統(tǒng)開幕式的人群計(jì)數(shù)有時(shí)會(huì)引發(fā)爭(zhēng)議。最近的例子包括特朗普總統(tǒng)就職典禮和第二天華盛頓特區(qū)的婦女游行。全球許多城鎮(zhèn)也同時(shí)進(jìn)行著相關(guān)婦女游行。類似地,西班牙加泰羅尼亞省獨(dú)立示威是自動(dòng)人群計(jì)數(shù)軟件的開端。
當(dāng)然,人群科學(xué)家通常不會(huì)花一個(gè)星期費(fèi)盡心血計(jì)算一張照片里的人數(shù),而是對(duì)圖像中某一區(qū)域的人數(shù)進(jìn)行統(tǒng)計(jì)。他們知道該區(qū)域的大小,然后推斷出更大區(qū)域的總?cè)藬?shù)。
今天,基于機(jī)器學(xué)習(xí)的計(jì)算機(jī)軟件可以快速計(jì)算人群人數(shù),但計(jì)算機(jī)視覺技術(shù)有其自身的不準(zhǔn)確性。為了提高準(zhǔn)確性,中佛羅里達(dá)大學(xué)的軟件將給定的人群圖像劃分區(qū)塊,然后基于人群密度的假設(shè)計(jì)算平均值,以降低不準(zhǔn)確性。
這一軟件的效率已被證明對(duì)真實(shí)世界有用。沙特阿拉伯官員已經(jīng)授權(quán)該軟件計(jì)算每年麥加伊斯蘭圣地的朝圣者的數(shù)量??ㄋ栆操Y助Shah團(tuán)隊(duì)改進(jìn)該軟件,用于計(jì)算2022年卡塔爾世界杯賽事參與人數(shù)。
新的AI方法如深度學(xué)習(xí)將很快提高計(jì)算機(jī)視覺的準(zhǔn)確性。中佛羅里達(dá)大學(xué)團(tuán)隊(duì)已經(jīng)將研究轉(zhuǎn)向深度學(xué)習(xí)AI,一種可以充分利用神經(jīng)網(wǎng)絡(luò)多層處理,過濾相關(guān)數(shù)據(jù)的自動(dòng)學(xué)習(xí)軟件。研究人員還沒有公開發(fā)表新的深度學(xué)習(xí)方式和舊軟件之間的比較基準(zhǔn),但他們有一個(gè)相關(guān)研究論文?!拔覀兤谕疃葘W(xué)習(xí)會(huì)更好,”Shah說。
但即便是深度學(xué)習(xí)AI也會(huì)面臨人類科學(xué)家今天面臨的挑戰(zhàn),Shah解釋說。計(jì)數(shù)人群的理想圖像由無人機(jī),飛機(jī)或衛(wèi)星拍攝獲得,由于華盛頓的空域限制和缺乏適當(dāng)?shù)男l(wèi)星圖像,這在統(tǒng)計(jì)參加就職典禮和婦女游行的人數(shù)時(shí)面臨著一個(gè)特殊挑戰(zhàn)。從傾斜角度拍得的圖像對(duì)計(jì)算機(jī)造成了更大的計(jì)數(shù)困難,因?yàn)樗麄冞€需要考慮透視和規(guī)模(靠近鏡頭的人會(huì)顯得有些大)。
低分辨率圖像也可能帶來挑戰(zhàn),因?yàn)橛?jì)算機(jī)軟件必須依靠每人更小的像素識(shí)別相關(guān)特征。但通過對(duì)不同人群圖像進(jìn)行測(cè)驗(yàn),深度學(xué)習(xí),AI可以提高計(jì)數(shù)準(zhǔn)確性,即使是低分辨率圖像。
也許自動(dòng)人群計(jì)數(shù)深度學(xué)習(xí)方法的最大挑戰(zhàn)是需要大量訓(xùn)練數(shù)據(jù)。理想情況下,Shah的團(tuán)隊(duì)想要獲得同一群體活動(dòng)的不同圖像,所以他們可以訓(xùn)練深度學(xué)習(xí)軟件在各種各樣的情況下識(shí)別和計(jì)數(shù)人類。
但即使訓(xùn)練也不僅僅是將人群活動(dòng)的在線圖像傳送到軟件中那么簡(jiǎn)單。為了學(xué)習(xí)如何準(zhǔn)確識(shí)別人群圖像中的人類,AI需要精確注釋的圖像,顯示人群中的個(gè)體和總體人數(shù)。這意味著研究人員仍然需要手動(dòng)計(jì)算某些圖像的人數(shù),為他們的軟件提供訓(xùn)練數(shù)據(jù)集。
中佛羅里達(dá)大學(xué)團(tuán)隊(duì)計(jì)劃使用在線眾包服務(wù),如亞馬遜的Mechanical Turk,手動(dòng)創(chuàng)建這樣的培訓(xùn)數(shù)據(jù)集。如果他們成功提高計(jì)算機(jī)視覺準(zhǔn)確性,自動(dòng)人群計(jì)數(shù)將可能適用于從購物中心到音樂會(huì)等的眾多場(chǎng)景。如果某些美國(guó)總統(tǒng)喜歡談?wù)擙嫶蟮娜巳?,人群?jì)數(shù)可能在可預(yù)見的未來還具有政治相關(guān)性。