隨著技術(shù)的迭代,人工智能正在快速?gòu)慕鉀Q“具體問(wèn)題”的弱人工智能向解決“通用問(wèn)題”的強(qiáng)人工智能演進(jìn)。
在這個(gè)過(guò)程之中,人工智能想要獲得同人類一樣的解決問(wèn)題的能力,必須具備與人類相似的“知識(shí)架構(gòu)”。有了這個(gè)基礎(chǔ),人工智能不僅可以做到“共情”,甚至可以對(duì)人類行為或事態(tài)的發(fā)展進(jìn)行一定程度的“預(yù)判”。
2020年10月15日,來(lái)自北卡羅來(lái)納大學(xué)教堂山分校的博士生雷杰在arXiv上傳了一篇名為“What is More Likely to Happen Next?Video-and-Language Future Event Prediction”(接下來(lái)可能會(huì)有什么發(fā)生?視頻語(yǔ)言能預(yù)測(cè)未來(lái)事件)的預(yù)印本論文,這篇論文的內(nèi)容提出并初步實(shí)現(xiàn)了讓AI預(yù)測(cè)事態(tài)未來(lái),目前該論文已經(jīng)被EMNLP2020接收。
雷杰表示,前幾年業(yè)內(nèi)關(guān)注的研究重點(diǎn)都在于機(jī)器如何“理解”視頻的內(nèi)容,而他們的工作對(duì)于業(yè)內(nèi)來(lái)說(shuō)算是在新領(lǐng)域進(jìn)行了些許拓荒,為加強(qiáng)和測(cè)試模型的事件預(yù)測(cè)能力及常識(shí)認(rèn)知能力提供了一個(gè)新的方向。
他們的項(xiàng)目名為“Video Language Future Prediction”(視頻語(yǔ)言未來(lái)預(yù)測(cè)),其中Video指視頻,而Language指視頻中對(duì)話的文本,可以理解為“字幕”。一次完整的預(yù)測(cè)流程大概是這樣:
將視頻+字幕+兩種人類給出的未來(lái)可能方向A和B,輸入模型,模型將輸出它的判斷結(jié)果,即A和B各白發(fā)生的概率。通過(guò)這種做“選擇題”的方式實(shí)現(xiàn)一定程度的“預(yù)測(cè)”。
雷杰補(bǔ)充道,這是一種比較初步的解決方案,未來(lái)AI將能夠做“閱讀理解”,即直接從給定的視頻和字幕之中自己生成對(duì)未來(lái)的預(yù)測(cè)。當(dāng)然,不管是“選擇題”還是“閱讀理解”,都需要AI具備一定的理解能力。
同時(shí),雷杰和同事也暫未加入讓AI給出決策理由的功能。他說(shuō),這項(xiàng)能力可以單獨(dú)作為一個(gè)比較復(fù)雜的研究課題,所以他們暫時(shí)聚焦于“預(yù)測(cè)”這件事。
一個(gè)AI預(yù)測(cè)未來(lái)的案例,食物當(dāng)然要是被吃掉,而不是投入到火里。為了訓(xùn)練這個(gè)模型,雷杰和同事準(zhǔn)備了2.8萬(wàn)個(gè)用例,并將其命名為“VLEP”
Video Language Future Prediction數(shù)據(jù)流程圖
視頻素材統(tǒng)計(jì)
這批視頻數(shù)據(jù)分成兩類,電視節(jié)目以及來(lái)自YouTube的Vlog。
他們首先將這些視頻進(jìn)行預(yù)處理,最終它們被切割為一個(gè)個(gè)60秒~90秒的片段。之后將這批素材提交到數(shù)據(jù)標(biāo)注平臺(tái)進(jìn)行人工標(biāo)注。人類將標(biāo)注短視頻內(nèi)“事件”的起止時(shí)間,并且給出兩個(gè)預(yù)測(cè)結(jié)果——未來(lái)較大可能發(fā)生的和較小可能發(fā)生的。
雷杰
雷杰說(shuō),假如視頻中顯示一個(gè)人拿起杯子,那么按照常理推斷,他更可能要喝水,而不是將杯子摔碎?!斑@種人類非常容易完成的事情,對(duì)機(jī)器來(lái)說(shuō)并不簡(jiǎn)單?!?/p>
未來(lái),他們將嘗試結(jié)合大規(guī)模視頻數(shù)據(jù)進(jìn)行一些無(wú)監(jiān)督學(xué)習(xí),讓模型能夠加深對(duì)視頻和字幕的理解,并建立像人類一樣的“關(guān)聯(lián)”。
談及應(yīng)用,雷杰坦言,目前他們的研究仍然處于比較早期的階段,但他認(rèn)為未來(lái)人工智能必將具備同人類一樣的“知識(shí)架構(gòu)”,它們將更加懂得人類的想法,同人類的合作也會(huì)更加“心有靈犀”。
雷杰2013年考入坐落于成都的電子科技大學(xué),大學(xué)二年級(jí)他憑借優(yōu)異成績(jī)?nèi)雵藘H接收年級(jí)前5%學(xué)生的“英才實(shí)驗(yàn)學(xué)院”,在這里,雷杰接受了較同齡人更為全面、系統(tǒng)性的計(jì)算機(jī)教育。
雖然他現(xiàn)在的研究方向?qū)9ァ叭斯ぶ悄堋?,但其?shí)雷杰最早報(bào)考的是微電子專業(yè),入學(xué)之后才轉(zhuǎn)到了計(jì)算機(jī)。
對(duì)此他解釋道,“小的時(shí)候我非常喜歡鼓搗電子元器件,所以高考選擇了這個(gè)專業(yè),但當(dāng)我設(shè)計(jì)的正確電路因?yàn)榇植诘墓に嚩r(shí),我的內(nèi)心動(dòng)搖了?!苯?jīng)過(guò)一段時(shí)間的自我審視,他發(fā)現(xiàn)自己更加傾向于“1+1=2”這類嚴(yán)格規(guī)整、且確定性的東西,便義無(wú)反顧地投身到計(jì)算機(jī)科學(xué)之中。
大一結(jié)束時(shí),雷杰在同一位博士學(xué)長(zhǎng)交流的過(guò)程中第一次聽(tīng)到了“機(jī)器學(xué)習(xí)”這個(gè)概念,這讓他感到非常震驚。是的,機(jī)器為什么不能“學(xué)習(xí)”呢?
在好奇心的驅(qū)使下,他開(kāi)始孜孜不倦地學(xué)習(xí)相關(guān)知識(shí),并最終選擇留學(xué)攻讀相關(guān)領(lǐng)域的博士學(xué)位。(摘自美《深科技》)(編輯/諾伊克)