當(dāng)前,我國(guó)人工智能技術(shù)研究已進(jìn)入新階段,在自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、數(shù)據(jù)挖掘等領(lǐng)域取得了巨大的成功。在此發(fā)展背景下,作為新一代人工智能技術(shù)之一的跨媒體感知與分析技術(shù)應(yīng)運(yùn)而生,以提高人類智力活動(dòng)能力為主要目標(biāo),為經(jīng)濟(jì)社會(huì)發(fā)展的方方面面提供技術(shù)引領(lǐng)和支撐。跨媒體感知與分析技術(shù)將各類應(yīng)用場(chǎng)景中產(chǎn)生的大量數(shù)據(jù),通過(guò)多源、互補(bǔ)、多模態(tài)方式記錄網(wǎng)絡(luò)世界與物理世界,進(jìn)行學(xué)習(xí)、推理、理解和認(rèn)知。在這一過(guò)程中,對(duì)各類信息進(jìn)行精準(zhǔn)定位與理解并將其轉(zhuǎn)化為自然語(yǔ)言來(lái)實(shí)現(xiàn)語(yǔ)義表達(dá),已成為跨媒體感知與分析技術(shù)當(dāng)下亟需突破的瓶頸之一。自然語(yǔ)言處理技術(shù)作為人工智能技術(shù)之一,在其較為漫長(zhǎng)的發(fā)展過(guò)程中,不斷融入其他技術(shù),實(shí)現(xiàn)自身的成長(zhǎng)。近年來(lái),自然語(yǔ)言處理技術(shù)結(jié)合深度學(xué)習(xí),提升處理數(shù)據(jù)、分析、表達(dá)語(yǔ)義的精準(zhǔn)度,對(duì)分析處理多態(tài)信息的準(zhǔn)確性也有所提高。因此,基于自然語(yǔ)言處理技術(shù)的精準(zhǔn)性,跨媒體感知與分析技術(shù)也能進(jìn)一步使人工智能的語(yǔ)義理解與表達(dá)更精確。由此可見(jiàn),基于自然語(yǔ)言處理技術(shù)的跨媒體感知與分析技術(shù)實(shí)施路徑研究,極具現(xiàn)實(shí)意義。
自然語(yǔ)言處理技術(shù)是指同計(jì)算機(jī)對(duì)感知和獲取到的自然語(yǔ)言各型態(tài)信息進(jìn)行處理,主要運(yùn)用于機(jī)器翻譯、語(yǔ)音合成、語(yǔ)音識(shí)別等人工智能功能領(lǐng)域。具體來(lái)講,自然語(yǔ)言處理技術(shù)能夠使計(jì)算機(jī)獲取、理解、學(xué)習(xí)自然語(yǔ)言的特征,再根據(jù)指令對(duì)語(yǔ)言進(jìn)行再處理,從而實(shí)現(xiàn)人機(jī)間的信息交流。
多年來(lái),自然語(yǔ)言處理技術(shù)不斷發(fā)展,在機(jī)器學(xué)習(xí)、大數(shù)據(jù)和人工智能等領(lǐng)域的應(yīng)用越來(lái)越廣泛。例如,在機(jī)器學(xué)習(xí)領(lǐng)域,大數(shù)據(jù)領(lǐng)域、人工智能領(lǐng)域等。而在這些領(lǐng)域智能化發(fā)展過(guò)程中,需要通過(guò)跨媒體感知與分析技術(shù)搜集并分析圖片、語(yǔ)音等非文本數(shù)據(jù),并通過(guò)自然語(yǔ)言處理技術(shù)進(jìn)行處理與解釋,實(shí)現(xiàn)各行業(yè)的智能化應(yīng)用與學(xué)習(xí)。綜上所述,自然語(yǔ)言處理技術(shù)作為一項(xiàng)非常重要和前沿的科技發(fā)展,可以協(xié)助跨媒體感知與分析技術(shù)處理數(shù)據(jù),為各行業(yè)發(fā)展賦能。
(一)自然語(yǔ)言處理技術(shù)推動(dòng)跨媒體感知技術(shù)精準(zhǔn)采集語(yǔ)言信息
在開(kāi)放式網(wǎng)絡(luò)環(huán)境下,跨媒體感知技術(shù)需在分析研究數(shù)據(jù)前面對(duì)大量低價(jià)值的數(shù)據(jù)。為過(guò)濾低價(jià)值信息、使信息緊致化,自然語(yǔ)言處理技術(shù)可以利用自身精準(zhǔn)搜索關(guān)鍵數(shù)據(jù)的能力,短時(shí)間內(nèi)利用以關(guān)鍵信息索引找到目標(biāo)信息,使跨媒體感知技術(shù)準(zhǔn)確搜集到有效數(shù)據(jù)。同時(shí),因果推理技術(shù)作為自然語(yǔ)言處理技術(shù)重要組成部分之一,能夠甄別數(shù)據(jù)關(guān)聯(lián)中數(shù)據(jù)偏差問(wèn)題,從而減少數(shù)據(jù)的虛假關(guān)聯(lián),促進(jìn)跨媒體感知技術(shù)實(shí)現(xiàn)特征提取和表達(dá)的無(wú)偏性、穩(wěn)定性和可解釋性。
(二)自然語(yǔ)言處理技術(shù)推動(dòng)跨媒體分析技術(shù)解析語(yǔ)言信息
跨媒體感知與分析技術(shù)能夠?qū)Σ煌悇e的媒體數(shù)據(jù)進(jìn)行跨模態(tài)分析與理解,從而對(duì)多種媒體形態(tài)所表達(dá)的相同或相似語(yǔ)義進(jìn)行識(shí)別與整合,充分建立不同模態(tài)間的語(yǔ)義關(guān)聯(lián)。自然語(yǔ)言處理技術(shù)作為一項(xiàng)處理語(yǔ)義信息的技術(shù),能發(fā)揮自身解析語(yǔ)義的能力,助力跨媒體分析技術(shù)更好的理解與分析多模態(tài)的語(yǔ)言信息。
(三)自然語(yǔ)言處理技術(shù)助力多模態(tài)統(tǒng)一表達(dá)整合語(yǔ)言信息
多模態(tài)數(shù)據(jù)的統(tǒng)一表達(dá)是對(duì)跨媒體信息進(jìn)行分析推理的先決條件,能夠融合不同模態(tài)的語(yǔ)義信息,更全面分析及利用不同形態(tài)的信息理解與表達(dá),優(yōu)于單個(gè)模態(tài)信息的方法。這一過(guò)程中,自然語(yǔ)言處理技術(shù)能夠通過(guò)自身語(yǔ)言分析整合能力,剔除多模態(tài)信息間的冗余信息,以跨媒體感知與分析技術(shù)的跨模態(tài)轉(zhuǎn)化能力來(lái)實(shí)現(xiàn)多模態(tài)信息統(tǒng)一表達(dá),從而獲取更全面的語(yǔ)義特征。
首先,加強(qiáng)智能芯片創(chuàng)新研發(fā)力度??缑襟w感知與分析技術(shù)能夠促使計(jì)算機(jī)對(duì)外界的感知與信息進(jìn)行轉(zhuǎn)化分析,形成對(duì)信息的內(nèi)部整合與統(tǒng)一理解,從而將所理解內(nèi)容進(jìn)行統(tǒng)一表征,使各類信息系統(tǒng)能夠?qū)崿F(xiàn)智能化對(duì)答。為實(shí)現(xiàn)這一技術(shù)在現(xiàn)有計(jì)算平臺(tái)上的應(yīng)用,科研人員應(yīng)以跨媒體感知與分析技術(shù)的能力為模型,構(gòu)造模擬和超越生物感知的智能芯片和系統(tǒng),進(jìn)一步推動(dòng)人工智能實(shí)現(xiàn)機(jī)器感知。
其次,構(gòu)建應(yīng)用跨媒體感知與分析技術(shù)的智能引擎。為實(shí)現(xiàn)人工智能的高效表達(dá),研究人員可以構(gòu)建獨(dú)特感知機(jī)制跨媒體智能引擎,建立從視頻、圖像等復(fù)雜數(shù)據(jù)中快速搜索興趣目標(biāo)的理論、模型和算法,實(shí)現(xiàn)具備自適應(yīng)、自學(xué)習(xí)能力的智能感知系統(tǒng)。例如,研究超越人類感知能力的視覺(jué)、聽(tīng)覺(jué)感知系統(tǒng),以及突破真實(shí)自然交互環(huán)境中的言語(yǔ)感知系統(tǒng)。
最后,推動(dòng)跨媒體感知與分析技術(shù)在各行業(yè)的應(yīng)用??缑襟w感知與分析技術(shù)能推進(jìn)企業(yè)智能制造轉(zhuǎn)型,推動(dòng)中國(guó)制造業(yè)核心競(jìng)爭(zhēng)力發(fā)生著前所未有的變化,促進(jìn)我國(guó)智能產(chǎn)業(yè)沿著 “共融機(jī)器人”的路徑演進(jìn)?!肮踩跈C(jī)器人”基于跨媒體感知與分析技術(shù)產(chǎn)生,可用于構(gòu)建能適應(yīng)不同環(huán)境,且能夠更好地理解人行為意圖,在一定的規(guī)則下實(shí)現(xiàn)人機(jī)、機(jī)器人群體間的自然交互與協(xié)同。隨著智能科技不斷發(fā)展并滲透至各行各業(yè),跨媒體感知與分析技術(shù)的應(yīng)用在醫(yī)療、教育、智能家居等行業(yè)已獲得卓越成果,在未來(lái)將逐漸參與更多行業(yè)的發(fā)展,為我國(guó)經(jīng)濟(jì)社會(huì)發(fā)展提供動(dòng)力。
作者單位:廣州鐵路職業(yè)技術(shù)學(xué)院 信息工程學(xué)院
基金項(xiàng)目:廣東省部級(jí)教育部高校學(xué)生司供需對(duì)接就業(yè)育人項(xiàng)目“數(shù)字媒體與虛擬現(xiàn)實(shí)技術(shù)校內(nèi)就業(yè)實(shí)習(xí)基地”(項(xiàng)目編號(hào):20230106263)。