国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

圖像數(shù)據(jù)受限下的處理與分析

2022-10-21 01:55劉怡光
關(guān)鍵詞:機(jī)理維度樣本

劉怡光

四川大學(xué),成都 610065

1 受限圖像數(shù)據(jù)及其難點(diǎn)與挑戰(zhàn)

受限下的圖像數(shù)據(jù),是相對(duì)于不受限的圖像大數(shù)據(jù)而言的,一般由兩個(gè)方面的因素構(gòu)成:1)目標(biāo)因素;2)成像因素。目標(biāo)因素構(gòu)成的受限有多種情況,例如目標(biāo)不常出現(xiàn)、目標(biāo)高機(jī)動(dòng)等,導(dǎo)致關(guān)于該目標(biāo)的圖像數(shù)據(jù)相對(duì)較少。成像因素導(dǎo)致的受限較多,一種是成像成本太高或成像環(huán)境惡劣,導(dǎo)致某類目標(biāo)的圖像數(shù)據(jù)受限;另一種情況是由于成像設(shè)備本身的不確定性導(dǎo)致的圖像數(shù)據(jù)的不確定性。因此,受限下的圖像數(shù)據(jù)大致可分為兩個(gè)方面:一方面指圖像數(shù)據(jù)較少,尤其是關(guān)于某一個(gè)目標(biāo)或者某一類目標(biāo)的圖像數(shù)據(jù)較少(He等,2021;Mukherjee和Awadallah,2020);另一方面指關(guān)于某類目標(biāo)的圖像數(shù)據(jù)中有很多的不確定性,如圖像數(shù)據(jù)的噪音嚴(yán)重、圖像數(shù)據(jù)的不完整性等(Gull和Daniell,1978)。不完整性通常指圖像目標(biāo)的信息不完整,也常指圖像中目標(biāo)的輪廓信息沒有得到完全呈現(xiàn),具體表現(xiàn)為:由于遮擋、雨、雪、霧和霾等因素導(dǎo)致圖像中某些目標(biāo)的圖像信息不完整。所以受限下的圖像數(shù)據(jù),通常具有不確定性、不完整性以及小樣本特性。受限下的圖像數(shù)據(jù)也包含小目標(biāo)特性,小目標(biāo)特性不同于小樣本特性:小目標(biāo)特性是指目標(biāo)在圖像當(dāng)中的像素占比過(guò)低,達(dá)不到平常認(rèn)知至少需要的像素?cái)?shù)量,也就是說(shuō),像素?cái)?shù)量達(dá)不到區(qū)分目標(biāo)形態(tài)的程度,無(wú)法對(duì)目標(biāo)進(jìn)行比較準(zhǔn)確的分類??傮w而言,圖像數(shù)據(jù)如果本身不完整、不確定、小樣本、小目標(biāo),具有這樣特性的數(shù)據(jù),就認(rèn)為是受限下的圖像數(shù)據(jù)。

受限情況下的圖像數(shù)據(jù)分析,相對(duì)于不受限的圖像數(shù)據(jù)而言,具有比較突出的難點(diǎn)與挑戰(zhàn)。首先,挑戰(zhàn)來(lái)自于圖像數(shù)據(jù)本身的不確定性和不完整性。不確定性是由復(fù)雜的光環(huán)境或者電磁環(huán)境所導(dǎo)致的。如在復(fù)雜光環(huán)境下,圖像目標(biāo)紋理信息往往非常復(fù)雜,這種紋理既受到目標(biāo)本身表面紋理的影響,同時(shí)又受到復(fù)雜的光或者電磁環(huán)境的影響,例如合成孔徑雷達(dá)(synthetic aperture radar,SAR)成像時(shí)電磁環(huán)境的影響。這樣的不確定性對(duì)于圖像數(shù)據(jù)的分析處理帶來(lái)了很大的挑戰(zhàn)。另外,顯而易見的挑戰(zhàn)來(lái)自于各種遮擋。尤其是在雨、雪、霧、霾和塵等環(huán)境下對(duì)密集目標(biāo)跟蹤與分析時(shí),目標(biāo)遮擋常常比較嚴(yán)重(Lan等,2022)。以上挑戰(zhàn)基本來(lái)自常規(guī)目標(biāo),或者來(lái)自環(huán)境因素的影響。實(shí)際上,需要探測(cè)成像及智能感知的目標(biāo),往往是非合作的,甚至是主動(dòng)對(duì)抗的,目標(biāo)會(huì)想方設(shè)法抵抗成像、抵抗感知和抵抗識(shí)別。例如,通過(guò)煙霧彌漫、擬態(tài)偽裝等,掩蓋目標(biāo)本身真實(shí)表面紋理信息。這種情況帶來(lái)的不確定性和不完整性會(huì)進(jìn)一步加劇目標(biāo)識(shí)別分析的難度。此外,還有一方面的挑戰(zhàn)來(lái)自探測(cè)機(jī)理局限和探測(cè)感知設(shè)備本身,導(dǎo)致圖像數(shù)據(jù)的不完整性和不確定性。探測(cè)成像與智能感知需要一定光照或一定電磁強(qiáng)度,遠(yuǎn)距離及弱光暗光環(huán)境下的探測(cè)成像常常具有比較突出的小目標(biāo)和噪音特點(diǎn),從而導(dǎo)致圖像(或信號(hào))處理與分析時(shí)比較突出的不確定性和不完整性(Dempster等,1977)。

2 方法梳理及其問題和缺點(diǎn)

目前,受限情況下圖像數(shù)據(jù)處理的方法手段遠(yuǎn)遠(yuǎn)少于不受限的圖像數(shù)據(jù)。如圖1所示,歸納起來(lái),受限圖像數(shù)據(jù)的處理方法中,對(duì)不完整數(shù)據(jù)的處理,從數(shù)學(xué)上講一般有兩種:一種是補(bǔ)全法(Yang等,2022;Yoo等,2019),即在補(bǔ)全不完整數(shù)據(jù)的基礎(chǔ)上進(jìn)行處理和分析;另一種是對(duì)不完整圖像數(shù)據(jù)直接進(jìn)行分析(Gu等,2020)。這兩種方法也可歸結(jié)為一種,就是基于先驗(yàn)知識(shí)生成經(jīng)驗(yàn)知識(shí),再對(duì)不完整數(shù)據(jù)進(jìn)行處理。只是處理的兩種手段中,一種方法中間有白盒過(guò)程,另一種方法是端到端。對(duì)于補(bǔ)全的方法,在補(bǔ)全過(guò)程中可添加人為的合理性判定(Liu等,2021),其可信性一般而言較高;對(duì)于端到端的方法,由于沒有中間過(guò)程,它的可靠性要低于補(bǔ)全法,但是端到端方法的優(yōu)勢(shì)在于方便、簡(jiǎn)單易行,尤其是采用目前的深度方法之后,這種方法更為流行。對(duì)于不確定性的處理,實(shí)際上目前尚無(wú)性能、精度及可靠性都很好的方法,都是在可能的概率空間當(dāng)中進(jìn)行廣泛的搜索。目前的一系列方法僅僅是聚焦于如何加速搜索,如何縮減搜索空間,如何組織數(shù)據(jù)等(Hwang等,2019),這樣的方法都不能掩蓋一個(gè)本質(zhì)——為了減少不確定性的影響,在不確定性所導(dǎo)致的可能性空間中進(jìn)行廣泛的搜索,從而導(dǎo)致計(jì)算復(fù)雜度劇烈提高。

圖1 受限圖像數(shù)據(jù)的處理方法

至于小樣本數(shù)據(jù)的處理方法,大致可分為兩類:一類是在人為先驗(yàn)知識(shí)基礎(chǔ)上,豐富小樣本張成空間中的數(shù)據(jù)點(diǎn),實(shí)際上,樣本過(guò)少時(shí),其張成的空間本身就具有嚴(yán)重缺陷,在張成的子空間中豐富樣本并不能帶來(lái)處理與分析的另外信息維度,此時(shí),如何依據(jù)先驗(yàn)知識(shí)提高小樣本張成空間的維度比豐富訓(xùn)練樣本本身更為重要;另一類是直接在小樣本的基礎(chǔ)上進(jìn)行識(shí)別(Davari等,2019;Li等,2021),如生成式對(duì)抗網(wǎng)絡(luò)(generative adversarial network,GAN)等,但該模型也需要大量訓(xùn)練數(shù)據(jù),如果訓(xùn)練數(shù)據(jù)少,尤其是小樣本特性過(guò)于突出的時(shí)候,導(dǎo)致樣本空間中的已知訓(xùn)練樣本錨點(diǎn)過(guò)于少,則無(wú)論采用什么樣的模型,小樣本訓(xùn)練出來(lái)的可信性都會(huì)大打折扣。至于小目標(biāo)導(dǎo)致目標(biāo)分析的不確定性,目前沒有較好的辦法,都是在提高硬件性能、成像分辨率以及成像質(zhì)量的基礎(chǔ)上,增加識(shí)別可信度和處理分析的可信度??傮w而言,受限圖像數(shù)據(jù)的分析和處理可參見表1,基本上都是軟硬協(xié)同的啟發(fā)式、廣搜索等(Robbeloth和Bourbakis,2016),尚未形成很好的方法和技術(shù)。

表1 受限圖像數(shù)據(jù)分析與處理方法總結(jié)

對(duì)于受限情況下的圖像數(shù)據(jù)處理與分析,目前尚未形成一套行之有效的理論和方法,現(xiàn)有的一些方法和技術(shù)都受限并聚焦于一個(gè)本質(zhì)的核心問題,在數(shù)學(xué)上等效為如何在欠秩情況下判定一個(gè)解的合理性。在圖像數(shù)據(jù)受限情況下,其處理與分析的結(jié)果通常為一個(gè)解空間。解空間的連續(xù)性、緊致性等都不一定滿足,要在這樣一個(gè)復(fù)雜、不連續(xù)、非緊致的空間中,在事先都不知道合理性如何判斷的情況下,找出一組接近合理甚至真實(shí)的解,實(shí)際上是一個(gè)偽命題。受限圖像數(shù)據(jù)處理中碰到的大量問題都是不可逆的逆問題(Hansen,1998),不可逆的逆問題求解,必須添加另外的約束條件才能實(shí)現(xiàn)可逆過(guò)程。如對(duì)于小目標(biāo)的識(shí)別,當(dāng)像素的數(shù)量不足以體現(xiàn)目標(biāo)的獨(dú)特性質(zhì),而又需對(duì)小目標(biāo)進(jìn)行精確細(xì)分和識(shí)別的時(shí)候,通常條件下是不可能實(shí)現(xiàn)的,但在特殊領(lǐng)域內(nèi)也是可能的。所以在現(xiàn)實(shí)生活當(dāng)中,對(duì)于一些受限情況,尤其是對(duì)于高空、高速目標(biāo)等一些特殊目標(biāo)的識(shí)別,必須具有確定的先驗(yàn)領(lǐng)域知識(shí)(Zhou等,2012),才可能達(dá)到一定的識(shí)別率和可信度,所以對(duì)不可逆的逆問題添加另外的約束維度,對(duì)于求解受限情況下的圖像數(shù)據(jù)分析問題至關(guān)重要。因此首先需要解決的問題,就是判定添加另外的維度時(shí),該維度的合理性,這實(shí)際上也是受限圖像數(shù)據(jù)分析領(lǐng)域中沒有解決的問題。當(dāng)然通常情況下,這個(gè)領(lǐng)域知識(shí)是合理的,但在對(duì)抗情況下,所監(jiān)視探測(cè)的目標(biāo)往往具有主動(dòng)對(duì)抗的能力,如何添加另外的約束維度,實(shí)現(xiàn)不可逆的逆問題求解具有更高的難度和復(fù)雜性,其牽涉對(duì)抗雙方先驗(yàn)知識(shí)、當(dāng)下策略和短長(zhǎng)期決策等多方面的博弈。有時(shí),由于添加的約束不夠合理,或者犯了經(jīng)驗(yàn)主義錯(cuò)誤,導(dǎo)致獲得的不可逆逆問題的解與合理值/最優(yōu)值/真實(shí)值差距甚遠(yuǎn),甚至南轅北撤。

3 反思人工智能在數(shù)據(jù)受限下的挑戰(zhàn)

受限圖像數(shù)據(jù)的分析與目前大數(shù)據(jù)驅(qū)動(dòng)下的智能分析,形成了較鮮明的對(duì)比。后者已有的手段和方法,對(duì)于前者很難得到魯棒性和可信性都較高的結(jié)果。而對(duì)于后者的研究,由于有大量的數(shù)據(jù),涉及的問題在數(shù)學(xué)上不但可逆,且經(jīng)常超定。對(duì)于超定問題,通過(guò)增加節(jié)點(diǎn)數(shù)以及增加開口參數(shù)的數(shù)目,是可以得到通用性與經(jīng)驗(yàn)風(fēng)險(xiǎn)兩者折中最優(yōu)的模型和方法。這一點(diǎn),在Vapnik(2013)的《統(tǒng)計(jì)學(xué)習(xí)本質(zhì)》一書中有詳細(xì)且深入的論述,并建立了結(jié)構(gòu)風(fēng)險(xiǎn)最小(structural risk minimization, SRM)和經(jīng)驗(yàn)風(fēng)險(xiǎn)最小(empirical risk minimization, ERM)的優(yōu)化范式。所以在大數(shù)據(jù)驅(qū)動(dòng)下的人工智能研究甚眾,成果豐碩,在實(shí)際應(yīng)用當(dāng)中也取得了比較突出的效果。這一點(diǎn)在生物特征識(shí)別當(dāng)中得到比較突出的體現(xiàn),如說(shuō)人臉識(shí)別、掌紋識(shí)別和虹膜識(shí)別等(Jingade和Kunte,2022;Trabelsi等,2022;Jayavadivel和Prabaharan,2021)。

大數(shù)據(jù)驅(qū)動(dòng)下的人工智能,其可靠性和魯棒性是有一定保障,這個(gè)保障的基礎(chǔ)數(shù)學(xué)原理來(lái)自于統(tǒng)計(jì)學(xué)習(xí)中的中心極限定理。數(shù)據(jù)達(dá)到一定規(guī)模時(shí),其分布都符合正態(tài)分布,根據(jù)正態(tài)分布的理論,3σ范圍之內(nèi)就可以達(dá)到99.7%的正確率和可靠性。這也正是大數(shù)據(jù)分析能夠取得成功的重要原因之一。實(shí)際上,只要數(shù)據(jù)達(dá)到一定規(guī)模,一個(gè)模型有跟數(shù)據(jù)規(guī)模相適應(yīng)的開口參數(shù),且適應(yīng)性訓(xùn)練能突出數(shù)據(jù)分布的3σ原則,就可以預(yù)想該模型和該數(shù)據(jù)的耦合能夠達(dá)到較好的識(shí)別和分類效果,也就具有一定的智能分析能力。反觀受限情況下的圖像數(shù)據(jù),不但數(shù)據(jù)量少,而且噪音嚴(yán)重,且有一定的缺失,所以其統(tǒng)計(jì)特性或統(tǒng)計(jì)分布的一致性,都遠(yuǎn)遠(yuǎn)達(dá)不到在大數(shù)據(jù)下才能體現(xiàn)的數(shù)據(jù)一致性要求。因此,用大數(shù)據(jù)下的統(tǒng)計(jì)方法來(lái)應(yīng)對(duì)受限情況下的圖像數(shù)據(jù)分析,本身就有機(jī)理上的缺陷。亟需理論上建立適于受限圖像數(shù)據(jù)分析的理論和方法。

另外,大數(shù)據(jù)分析時(shí),統(tǒng)計(jì)推斷分析的域一般是封閉的,其原因是大數(shù)據(jù)能表現(xiàn)目標(biāo)樣本的各個(gè)方面,所碰到的新樣本都位于監(jiān)督樣本張成的空間中(待分析樣本并不一定在訓(xùn)練樣本集中出現(xiàn)過(guò),只要位于其空間,也就是待分析樣本能用訓(xùn)練樣本進(jìn)行表達(dá)),此時(shí)貝葉斯分析能得到從概率意義上最優(yōu)的結(jié)果。但在受限圖像數(shù)據(jù)分析時(shí),由于先驗(yàn)數(shù)據(jù)少,待分析樣本有可能不位于先驗(yàn)樣本張成的空間,此時(shí)適合閉域統(tǒng)計(jì)推斷的貝葉斯分析會(huì)出現(xiàn)有意思的結(jié)論。譬如,如果承認(rèn)“人是由男性與女性構(gòu)成”的論斷,并認(rèn)可從第1性征和第2性征能明確推斷一個(gè)人是男性還是女性,并且屬于兩類人的概率和為1的前提條件,則碰到缺少第1性征的人時(shí)(如太監(jiān)),貝葉斯分析會(huì)出現(xiàn)屬于男性和女性的概率和小于1的問題,而遇到同時(shí)具有男性與女性第2性征的人(如人妖)又會(huì)出現(xiàn)概率和大于1的問題,出現(xiàn)這些有意思結(jié)論的根源在于,論斷本身的封閉性并不適合所示兩類人的分析。因此受限圖像數(shù)據(jù)分析的統(tǒng)計(jì)推斷模型尚需突破,也許D-S(Dempster-Shafer)證據(jù)理論是可能的替代(Shafer,1976),雖然最近有這方面的一些嘗試,考慮了非確定性的影響(Zhang等,2021),但非確定性度量一直是減小非確定性影響的關(guān)鍵環(huán)節(jié)。在計(jì)算機(jī)視覺、醫(yī)學(xué)圖像處理和生物信息等領(lǐng)域,建立了大量以貝葉斯逼近和集成學(xué)習(xí)為代表的用于度量非確定性的方法(Abdar等,2021),但準(zhǔn)確可靠的非確定性度量一直是挑戰(zhàn)性的問題。況且,即使得到非確定性度量,目前的D-S證據(jù)理論本身是對(duì)貝葉斯分析進(jìn)行的擴(kuò)展,并不是針對(duì)受限圖像數(shù)據(jù)分析提出的。

4 未來(lái)發(fā)展和應(yīng)對(duì)措施思考

對(duì)受限情況下的圖像數(shù)據(jù)進(jìn)行分析,建立一個(gè)通用的分析框架和系統(tǒng),目前而言,似乎還沒有露出端倪。即使是當(dāng)前的深度識(shí)別模型,對(duì)于受限情況下的圖像數(shù)據(jù)分析,也非常容易過(guò)擬合,很容易陷于過(guò)分強(qiáng)調(diào)ERM的窘境。實(shí)際上,深度模型對(duì)受限圖像數(shù)據(jù),難以找到強(qiáng)調(diào)SRM的優(yōu)化方向和途徑。這就讓我們不得不思考受限情況下的圖像數(shù)據(jù)分析,其未來(lái)的發(fā)展和應(yīng)對(duì)的措施到底在哪里。目前,在數(shù)據(jù)受限的情況下,大致有兩類方法,一類是基于數(shù)據(jù)驅(qū)動(dòng)的方法,其正確性和可靠性是不能保證的;另一類是基于機(jī)理的辦法,但由于機(jī)理不清,在數(shù)據(jù)受限的情況下也很難反推其理,在機(jī)理不清的情況下,建立的模型方法也很難達(dá)到較高的可信度和魯棒性。在第1類方法中,近年來(lái)值得關(guān)注的技術(shù)是GAN的左右互搏(Goodfellow等,2014),用已有的樣本產(chǎn)生更多的樣本。實(shí)際上,最優(yōu)傳輸理論以及幾何深度學(xué)習(xí)理論都認(rèn)為,GAN也并沒有從信息熵的角度增加學(xué)習(xí)樣本的維度和信息量,僅是根據(jù)先驗(yàn)知識(shí),在先驗(yàn)知識(shí)的引導(dǎo)下豐富訓(xùn)練樣本。GAN的唯一作用是突出了原來(lái)不甚突出的現(xiàn)象,原來(lái)不甚明顯的一些優(yōu)勢(shì),也就是說(shuō)讓突出更加突出。所以用GAN發(fā)現(xiàn)數(shù)據(jù)當(dāng)中的小樣本、小目標(biāo)現(xiàn)象,或者是不完整、不確定現(xiàn)象也是不太現(xiàn)實(shí)的,或者說(shuō)尚需進(jìn)一步的發(fā)展。

對(duì)受限情況下圖像數(shù)據(jù)的分析,未來(lái)發(fā)展和應(yīng)對(duì)措施,可能在以下幾個(gè)方面:

1)處理和分析前移。由于產(chǎn)生受限情況下的圖像數(shù)據(jù)時(shí),實(shí)際上經(jīng)過(guò)采樣和模數(shù)轉(zhuǎn)換(analog to digital,AD),導(dǎo)致信息喪失。根據(jù)奈奎斯特(Nyquist)采樣定理,當(dāng)采樣頻率較低時(shí),存在混疊而難以解耦出完整確定的目標(biāo),從而導(dǎo)致不完整和小目標(biāo)特性。當(dāng)采樣頻率達(dá)到目標(biāo)分析需求的上限時(shí),小樣本現(xiàn)象通常不顯現(xiàn),因此分析前移,突破采樣影響及傳輸帶寬限制,有可能對(duì)受限圖像分析帶來(lái)一些積極進(jìn)步;另外,需要更加積極地借鑒生物群落體對(duì)不完整不確定信息處理的辦法(Kephart,2011)。譬如蒼蠅的復(fù)眼結(jié)構(gòu)到底是如何處理不完整不確定信息的?蒼蠅躲避天敵的能力遠(yuǎn)遠(yuǎn)大于蚊子,那么它真正的深層次的生物運(yùn)行機(jī)能是如何實(shí)現(xiàn)的?到底能給人工智能領(lǐng)域的不完整、不確定、小樣本、小目標(biāo)的處理帶來(lái)什么樣的啟示?這是非常值得探索的一個(gè)方向。總之,現(xiàn)有的系統(tǒng)框架或方法的不足,催生學(xué)者必須從其他角度考慮如何解決不完整、不確定、小樣本、小目標(biāo)帶來(lái)的影響(Chadès和Nicol,2016)。

2)在建立受限圖像數(shù)據(jù)分析的理論和方法之前,需要從數(shù)學(xué)上明確幾個(gè)基本概念。圖像數(shù)據(jù)的不確定性,不僅僅是噪聲所致,且相對(duì)噪聲來(lái)講,有用信號(hào)是不是真實(shí)反映了目標(biāo)的客觀特性,也是待定的,有一定的概率屬性。不完整性體現(xiàn)圖像數(shù)據(jù)對(duì)目標(biāo)表達(dá)的局部性,也就是說(shuō),只有目標(biāo)的部分特征、部分屬性得到了顯現(xiàn)。小目標(biāo)特性顯示,只有目標(biāo)的低頻特征得到了體現(xiàn),而更加細(xì)節(jié)的一些高頻信息并沒有顯示。至于小樣本特性,則是跟樣本的特征空間維數(shù)有密切關(guān)系,當(dāng)樣本的維數(shù)遠(yuǎn)遠(yuǎn)大于樣本的數(shù)量時(shí),就是小樣本特性。譬如,一個(gè)樣本空間的維數(shù)為1 024,若樣本數(shù)量小于1 024,對(duì)樣本分類等就是欠秩的逆問題,也是不可逆的逆問題,便產(chǎn)生了小樣本特性(Raudys和Jain,1991)。當(dāng)不完整、不確定、小樣本、小目標(biāo)幾個(gè)特性相互耦合的時(shí)候,常規(guī)的基于大數(shù)據(jù)的分析方法和理論已經(jīng)不太適合。勉強(qiáng)得到的樣本分布特性,也很難真正反映樣本的真實(shí)分布,因?yàn)槠湓肼暫筒煌暾缘挠绊?,樣本分布呈現(xiàn)發(fā)散性,沒有概率統(tǒng)計(jì)上的一致性。因此,受限情況下的圖像數(shù)據(jù)分析亟需基礎(chǔ)理論和方法的進(jìn)一步突破,也會(huì)是下一個(gè)研究的熱點(diǎn)與難點(diǎn)。受限情況下的圖像數(shù)據(jù)分析將會(huì)與其他各個(gè)相關(guān)學(xué)科的發(fā)展緊密耦合,隨著相關(guān)學(xué)科的發(fā)展而發(fā)展。譬如對(duì)高空高速非常見目標(biāo)的探測(cè)和識(shí)別,其探測(cè)感知的精度和魯棒性將會(huì)隨著探測(cè)機(jī)理的突破得到本質(zhì)的提升,而不會(huì)隨著常規(guī)探測(cè)后,數(shù)據(jù)分析方法的改變而得到本質(zhì)的提高。成像維度的提升和成像機(jī)理的改變,將會(huì)對(duì)后續(xù)數(shù)據(jù)圖像的處理帶來(lái)本質(zhì)的躍遷。

5 催生研發(fā)范式改變

相對(duì)數(shù)據(jù)驅(qū)動(dòng)的、以深度學(xué)習(xí)為代表的大數(shù)據(jù)智能分析的研究范式而言,受限圖像數(shù)據(jù)的分析將會(huì)更加關(guān)注和聚焦于機(jī)理的突破和建立。這也是不得已而為之,當(dāng)數(shù)據(jù)樣本的維度和統(tǒng)計(jì)特征不足以對(duì)數(shù)據(jù)進(jìn)行精確魯棒及可信分析時(shí),尋求智能分析的機(jī)理突破或者另外的探測(cè)識(shí)別維度,也許是艱難但有效的途徑和方法。譬如,把量子的一些觀念和方法引入到探測(cè)識(shí)別中,也許會(huì)產(chǎn)生一些意想不到的成果,量子探測(cè)等的初步研究似已顯示一定效果(Altmann等,2018)。也許下一代人工智能的研究范式將會(huì)從數(shù)據(jù)驅(qū)動(dòng)的研究范式轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)與機(jī)理驅(qū)動(dòng)相互耦合,并且在數(shù)據(jù)受限的情況下以機(jī)理驅(qū)動(dòng)為主的研究范式。機(jī)理的突破需要相關(guān)基礎(chǔ)理論的突破和關(guān)鍵技術(shù)的進(jìn)步,未來(lái)的路還很漫長(zhǎng)。

隨著探測(cè)機(jī)理的多樣化、探測(cè)時(shí)空需求的壓縮、探測(cè)精細(xì)程度和探測(cè)實(shí)時(shí)性的提高,隨機(jī)性干擾與探測(cè)信號(hào)的交疊將成為常態(tài),大海撈針?biāo)频匕l(fā)現(xiàn)、檢測(cè)和感知有用信號(hào)將可能是下一代受限圖像數(shù)據(jù)分析乃至下一代人工智能需要突破的關(guān)鍵需求。

圖像數(shù)據(jù)不受限時(shí),尤其是采集的圖像數(shù)據(jù)滿足采樣定理需求時(shí),可直接從圖像數(shù)據(jù)進(jìn)行準(zhǔn)確可靠(但不一定實(shí)時(shí))地分析。圖2的左邊流程為目前的大數(shù)據(jù)智能基本遵循的研究范式,如果把圖像數(shù)據(jù)表示為空間D,則其處理與分析過(guò)程是泛函空間F中尋找建立一個(gè)泛函f(·),使其滿足

圖2 圖像數(shù)據(jù)的研究范式

ti=f(di),f∈F,di∈D

(1)

學(xué)習(xí)的過(guò)程就是用已知的(ti,di)確定f(·),ti為與di對(duì)應(yīng)的標(biāo)簽。顯然,通常只有足夠的(ti,di)對(duì)才能唯一或者超定地確定f(·),當(dāng)圖像數(shù)據(jù)不受限時(shí),此條件滿足。相反,當(dāng)圖像數(shù)據(jù)受限時(shí),其處理與分析不僅需要圖像數(shù)據(jù)本身,且需要與成像機(jī)理與成像干擾的耦合分析,如圖2右邊的流程所示,計(jì)算為

ti=g(di,Idi,hdi)

(2)

式中,Idi,hdi分別表示產(chǎn)生di圖像的機(jī)理和相應(yīng)的測(cè)量擾動(dòng)。顯然,g(·)所在的泛函空間G?F,即考慮成像機(jī)理和成像干擾的映射模型空間大于僅考慮圖像的映射模型空間。比較式(2)和式(1),可以發(fā)現(xiàn),g(·)的輸入需求多于f(·)的輸入需求,且輸出結(jié)果都是ti。因此,式(2)和式(1)中,在圖像數(shù)據(jù)di的質(zhì)量和數(shù)量一致情況下,通常式(2)推斷魯棒性和準(zhǔn)確性高于式(1)。但是,正是由于式(2)中圖像數(shù)據(jù)di的質(zhì)量和數(shù)量低于式(1)中的圖像數(shù)據(jù)di,需要用Idi,hdi進(jìn)行補(bǔ)充,以提高推斷ti的質(zhì)量。很多情況下,視為干擾的因素hdi,有時(shí)結(jié)合機(jī)理的分析,反而可以促進(jìn)ti的推斷,如超聲圖像TRUS(transrectal ultrasound)數(shù)據(jù)的分析中,斑點(diǎn)噪聲利用得當(dāng)時(shí),可以提高前列腺分隔的準(zhǔn)確性(Wu等, 2015)。雖然式(2)中di的數(shù)量和質(zhì)量低于式(1)中di,并不意味確定g(·)的效率會(huì)高于確定f(·),這是因?yàn)镚?F,確定g(·)需要在更大的空間考慮,且Idi,hdi的不確定性會(huì)進(jìn)一步降低確定g(·)的效率。

總之,圖像數(shù)據(jù)受限情況下的處理與分析,需要對(duì)時(shí)—空—探測(cè)器—數(shù)據(jù)等多維度的整體耦合分析,時(shí)—空維度主要用于建立多個(gè)維度的配準(zhǔn),探測(cè)器與時(shí)空的耦合空間是圖像數(shù)據(jù)的產(chǎn)生空間,任何圖像的分析與處理都是時(shí)—空—數(shù)據(jù)空間的聯(lián)絡(luò)分析。其與大數(shù)據(jù)分析僅關(guān)注的研究范式(如式(1)所示)有典型不同。在式(2)中,需要考慮的因素除di,Idi,hdi外,可能還有其他因素,更多的考慮因素以及相應(yīng)的小現(xiàn)象推斷,也許將會(huì)催生與大數(shù)據(jù)時(shí)代不同的研究范式。

6 結(jié) 語(yǔ)

相對(duì)以深度學(xué)習(xí)為代表的圖像大數(shù)據(jù)研究,受限圖像數(shù)據(jù)的研究在研究深度、實(shí)用性方面均有距離,即使GAN網(wǎng)絡(luò),也對(duì)訓(xùn)練數(shù)據(jù)具有較高需求。不完整、非確定、小樣本、小目標(biāo)特性是復(fù)雜惡劣對(duì)抗環(huán)境下圖像數(shù)據(jù)的典型特點(diǎn),其處理和分析通常牽涉不可逆的逆問題處理。欠秩的本質(zhì)缺陷通常需要基于先驗(yàn)知識(shí)的啟發(fā)式手段處理,環(huán)境的復(fù)雜時(shí)變性與先驗(yàn)知識(shí)的矛盾、欠秩導(dǎo)致海量可能解引起的模糊計(jì)算與實(shí)時(shí)性的矛盾、不完整非確定性等導(dǎo)致受限圖像數(shù)據(jù)處理和分析的可信性和魯棒性等都面臨巨大難點(diǎn)和挑戰(zhàn)。因此采用圖像大數(shù)據(jù)的現(xiàn)有處理和分析方法,難以適應(yīng)受限圖像數(shù)據(jù)分析的需要,研究范式的改變和理論的突破,以及更進(jìn)一步借鑒生物群落的感知,也許能催生受限圖像數(shù)據(jù)分析的突破。在分析梳理現(xiàn)有方法對(duì)受限圖像分析數(shù)據(jù)不足的基礎(chǔ)上,以求拋磚引玉,希望可以吸引更多科研工作者重視并參與這方面的研究。

猜你喜歡
機(jī)理維度樣本
理解“第三次理論飛躍”的三個(gè)維度
SUV側(cè)翻機(jī)理及主動(dòng)防側(cè)翻控制理論研究
認(rèn)識(shí)黨性的五個(gè)重要維度
周禮與儒學(xué)的機(jī)理
淺論詩(shī)中“史”識(shí)的四個(gè)維度
金屬切削中切屑的形成機(jī)理
金屬切削中切屑的形成機(jī)理
規(guī)劃·樣本
套管磨損機(jī)理研究
套管磨損機(jī)理研究
大竹县| 尤溪县| 泽库县| 青田县| 长岭县| 舟曲县| 页游| 威海市| 东宁县| 志丹县| 乐陵市| 白河县| 长海县| 郴州市| 司法| 枣庄市| 三穗县| 大名县| 延吉市| 辉县市| 澄江县| 元氏县| 台南县| 延长县| 巧家县| 汕头市| 东宁县| 汾阳市| 拉萨市| 冕宁县| 鲁山县| 鄂温| 随州市| 沭阳县| 略阳县| 潢川县| 廊坊市| 德安县| 屏南县| 郯城县| 遂溪县|