包研科,汪培莊,郭嗣琮
(遼寧工程技術(shù)大學(xué) 智能工程與數(shù)學(xué)研究院,遼寧 阜新 123000)
自1982年汪培莊[1]提出因素空間(factors space,F(xiàn)S)理論,時至今日,35年來理論與應(yīng)用的發(fā)展,充分展示了FS理論在解釋隨機(jī)性根源和概率規(guī)律的數(shù)學(xué)實質(zhì),融合隨機(jī)數(shù)學(xué)與模糊數(shù)學(xué)的技術(shù)方面思想的深刻性,奠定了FS理論作為知識工程的思想框架的地位。
FS理論的早期成果可見汪培莊文集[2]。1994年汪培莊、李洪興合著[3]《知識表示的數(shù)學(xué)理論》一書系統(tǒng)地論述了FS理論在知識獲取、知識表示、知識管理和知識利用方面的數(shù)學(xué)思想與原理?!赌:嬎阆到y(tǒng)與模糊計算機(jī)》[4]及其相關(guān)的工程實踐標(biāo)志著FS理論與智能工程設(shè)計理念的完美結(jié)合,其中給出的概念內(nèi)涵和外延相互轉(zhuǎn)換的可操作方法,實現(xiàn)了決策樹算法和粗糙集算法沒有實現(xiàn)的“雙向轉(zhuǎn)換的目的”。其后,李洪興[5]關(guān)于《因素空間理論與知識表示的數(shù)學(xué)框架》長達(dá)5年的系列討論,不僅推進(jìn)了FS理論的發(fā)展,也奠定了FS理論在知識發(fā)現(xiàn)與智能工程領(lǐng)域廣泛應(yīng)用的基礎(chǔ)。袁學(xué)海[6-8]從范疇論的角度對FS的結(jié)構(gòu)問題進(jìn)行了深入討論;在FS理論的應(yīng)用方面,劉增良[9-13]在因素神經(jīng)網(wǎng)絡(luò)技術(shù),軍事信息戰(zhàn)與網(wǎng)絡(luò)戰(zhàn)領(lǐng)域的研究成績斐然。此外,基于FS理論的專家系統(tǒng)[14-15]、多傳感器決策融合[16]、控制仿真[17-19]、模式識別[20-21]、安全科學(xué)[22-24]等應(yīng)用領(lǐng)域的研究,體現(xiàn)了FS作為智能科學(xué)的數(shù)學(xué)空間理論的價值和發(fā)展前景。
在KDD問題的研究中,1998年何清[25]討論了基于FS和模糊聚類的概念形成方法,2013年汪培莊發(fā)表《因素空間與因素庫》一文[26],推動FS理論在KDD領(lǐng)域的應(yīng)用。近年來,關(guān)于FS與數(shù)據(jù)科學(xué)的關(guān)系[27],基于FS理論的分類算法[28-29]、文本挖掘方法[30-31]等相關(guān)研究也有一定的進(jìn)展。
FS理論生根于數(shù)學(xué),反映認(rèn)識論特點(diǎn),是KDD和概念格生成的一種自然有效的數(shù)學(xué)方法。然而,早期奠基性工作建立在模糊數(shù)學(xué)的基礎(chǔ)上,融合了隨機(jī)數(shù)學(xué)和抽象代數(shù)的思想、方法和語言;FS理論的高起點(diǎn)在保證數(shù)學(xué)嚴(yán)謹(jǐn)性的同時,也為其普及推廣樹立了一道屏障。FS的經(jīng)典定義可見文獻(xiàn)[3],此后的理論與應(yīng)用研究基本上遵循了這一定義的思想和描述。近年來,隨著FS領(lǐng)域應(yīng)用和教學(xué)的深入,出現(xiàn)了對FS定義的領(lǐng)域適應(yīng)性描述和擴(kuò)展[32-33]。2013年汪培莊在討論FS在數(shù)據(jù)科學(xué)中的應(yīng)用問題時,對FS的定義進(jìn)行了修正[26]。
為能夠相對通俗地詮釋FS理論的基本思想和原理,2015年包研科[34]基于認(rèn)知本體論原理,梳理了FS理論中的基本概念和術(shù)語,給出了有別于FS經(jīng)典定義的描述。這一描述充分體現(xiàn)了汪培莊“因素是分析的維度,是變異的指標(biāo)和變量名稱,是矛盾的編碼,是事物形成和描述的基因。以因素為軸所張成的坐標(biāo)空間就是因素空間,它為事物描述和思維形式提供了普適性的坐標(biāo)框架”[27]的論述精神。文獻(xiàn)[34]對FS的定義,最大的變化是對因素的順序關(guān)系、算符的意義給出了符合認(rèn)知本體論原理的描述,形式上同經(jīng)典定義有所不同,并再次觸發(fā)了對FS結(jié)構(gòu)問題的思考。
本文的工作是文獻(xiàn)[34]的延續(xù),進(jìn)一步討論FS的結(jié)構(gòu)問題。
為方便對本文工作的理解,作為預(yù)備知識,簡要介紹文獻(xiàn)[34]中給出的原理、概念與術(shù)語、公理和關(guān)鍵命題,部分內(nèi)容筆者根據(jù)近期研究予以必要的重述。復(fù)述與重述不做標(biāo)識,有需要了解期間變化的讀者可同文獻(xiàn)[34]進(jìn)行比對。
因素是認(rèn)知工具,因素分析應(yīng)遵循認(rèn)知本體論原理,因素空間的結(jié)構(gòu)應(yīng)體現(xiàn)和摹寫人類自身的認(rèn)知結(jié)構(gòu)與思維運(yùn)動規(guī)律。
認(rèn)知由概念表達(dá),概念是人類思維體系中最基本的構(gòu)筑單位。概念通常由內(nèi)涵與外延兩個邏輯術(shù)語表達(dá)。內(nèi)涵往往采用“上位概念+本位屬性”的邏輯形式描述,而外延則是概念所描述的事項的集合。
認(rèn)知形成的標(biāo)志是概念的形成,其間的思維運(yùn)動,主要由分析和綜合兩種思維方法構(gòu)成。分析的信息加工與處理技術(shù)是解析,實現(xiàn)方式是將事物拆分為更小的單元進(jìn)行管理和研究,或者表述為“發(fā)現(xiàn)事物的個性特征”。綜合的信息加工與處理技術(shù)是概括,實現(xiàn)方式是將一些具有相同屬性的事物歸納為更大的單元進(jìn)行管理和研究,或者表述為“對事物的一類屬性進(jìn)行綜合”。
對一個概念的解析稱為概念分化,是下位學(xué)習(xí)。對一些事物的共有屬性進(jìn)行概括,利用學(xué)習(xí)者已有的認(rèn)知結(jié)構(gòu)形成新的概念稱為概念同化,是上位學(xué)習(xí)。
在認(rèn)知科學(xué)的基本概念與原理的基礎(chǔ)上,關(guān)于FS的認(rèn)知本體論原理,本文吸收了馮嘉禮[35]關(guān)于《思維與智能科學(xué)中的性質(zhì)論方法》的一些思想原理,參考了文獻(xiàn)[36]的討論。后續(xù)關(guān)于FS數(shù)學(xué)結(jié)構(gòu)的討論遵循下列認(rèn)知本體論原理:
1) 一個因素總是特定論域上的因素,離開論域談?wù)撘蛩厥菦]有意義的。更進(jìn)一步,一個因素總是特定論域上特定問題的因素,離開問題無從討論因素的認(rèn)知功能。論域、因素和由因素形成的關(guān)于問題的認(rèn)知結(jié)果構(gòu)成一個特定的思維空間。
2) 概念的分化與同化動態(tài)平衡。在概念形成過程中,思維在解析與概括的交替運(yùn)用中發(fā)展。解析強(qiáng)化內(nèi)涵知識,促進(jìn)概念分化;概括豐富外延認(rèn)知,促進(jìn)概念同化。在這個過程中,內(nèi)涵與外延存在反變關(guān)系,即內(nèi)涵擴(kuò)張必然減小外延,反之內(nèi)涵縮減將導(dǎo)致外延擴(kuò)張。一個概念的形成,是一定認(rèn)知階段上分化與同化的暫時平衡。
3) 概念的內(nèi)涵與外延對合,即內(nèi)涵與外延所描述的事項一致。在概念形成過程中,解析與概括之間的差異是思維的技術(shù)性差異,不同技術(shù)產(chǎn)生的信息在思維運(yùn)動中以概念的內(nèi)涵與外延對合為目標(biāo)糾纏運(yùn)動,辯證統(tǒng)一。
基于認(rèn)知本體論原理的FS的基本概念、術(shù)語和符號約定如下:
1) 論域是一個關(guān)于問題的本體論研究對象的非空可列集合,記為。因素是定義在論域上的一個滿映射,記為式中:集合稱為的相空間(寓意必須考慮映射像的分布特征),描述論域上的一類本體論性態(tài)。
約定兩個特殊因素:
差運(yùn)算的目的是“從一個因素中排除另一個因素的干涉效應(yīng)”,記為,定義為
約定如下兩個公理:
在前述概念(定義)和兩個公理的基礎(chǔ)上,可以證明下列命題:
在不引起誤會的場合,不必刻意區(qū)分FS和CIS的不同,即一個因素空間既是一個完備信息系統(tǒng)。
引進(jìn)CFS的目的是方便描述結(jié)構(gòu)化數(shù)據(jù)分析問題。文獻(xiàn)[34]中討論了因素概念的外延,隨機(jī)變量是基本的數(shù)量化因素。若有限個二階矩隨機(jī)變量各自有不同的概率分布,則BF,于是就是一個結(jié)構(gòu)化信息系統(tǒng)。CFS在結(jié)構(gòu)化數(shù)據(jù)分析的應(yīng)用中,只需將樣本空間理解為論域,而代數(shù)等價于(S),相應(yīng)概念的對應(yīng)關(guān)系可作如下約定:
相應(yīng)的,信息系統(tǒng)
CFS的概念有助于FS分析方法與技術(shù)體系的建構(gòu),有助于理解因素空間同概率空間、希爾伯特空間和張量空間的關(guān)系。
前述討論是對因素空間宏觀結(jié)構(gòu)的一種公理化詮釋,其意義在于為信息系統(tǒng)分析提供了一個統(tǒng)一的語境場。
通常認(rèn)為,格是認(rèn)知描述與形式概念分析理想的代數(shù)系統(tǒng)[2,36]。
本文引進(jìn)格上的交錯自同構(gòu)變換和回旋格的概念,然后給出FS對偶回旋定理,構(gòu)成對FS代數(shù)結(jié)構(gòu)的新認(rèn)知。
下面詮釋格上交錯自同構(gòu)變換的幾何意義。
若將式(1)理解為一條定寬的紙帶,從左到右摹寫式(1)中的格層與偏序關(guān)系,最左端為0,最右端為1。
記為
圖 1 回旋格的幾何構(gòu)型Fig. 1 The geometry of convolution lattice
上述結(jié)論的建立,數(shù)學(xué)原理基于認(rèn)知原理,遵循概念內(nèi)涵與外延的對合性與反變關(guān)系原理,因素解析能力的大小主導(dǎo)因素的序關(guān)系,偏序格受順序公理、對合定理、反變關(guān)系定理和排序定理的影響,同數(shù)學(xué)上經(jīng)典的偏序格不盡相同。因此,在代數(shù)格中,雖然形式運(yùn)算性質(zhì)同數(shù)學(xué)經(jīng)典的代數(shù)格描述一致,但內(nèi)在運(yùn)算機(jī)理有所不同。
1) 將因素大小的定義
變異為
2) 將順序公理
變異為
在上述3個約定下,需要系統(tǒng)的修改、重述1.3節(jié)涉及序關(guān)系的命題,其他命題形式不變。修改后的相關(guān)命題如下:
認(rèn)知本體論的解釋:命題2’由命題2描述概念內(nèi)涵與外延的反變關(guān)系轉(zhuǎn)變?yōu)槊枋鰧ν庋拥南拗啤?/p>
認(rèn)知本體論的解釋:命題7’和命題8’修改了序關(guān)系與代數(shù)運(yùn)算的聯(lián)系規(guī)則,將因素固有的概括功能從“隱性”表達(dá)轉(zhuǎn)變?yōu)椤帮@性”表達(dá)。
綜上所述,得到下面的定理1。
因素是認(rèn)知工具,F(xiàn)S是認(rèn)知科學(xué)的數(shù)學(xué)模型。有別于Boole代數(shù),F(xiàn)S的本質(zhì)在于其回旋性,反映了概念形成過程中分化與同化的雙向統(tǒng)一性,具體地講:
1) FS的回旋性反映概念內(nèi)涵與外延的對合性。在論域上,最小元形成完全概括性認(rèn)知,最大元形成徹底的個性化認(rèn)知。因此,在對論域形成的終極認(rèn)知即“論域中的每一個對象都是不同的個體,同時所有對象又是一個整體”的意義上,因素和是等效的。在解析過程中,零因素是析運(yùn)算的單位元,也是合運(yùn)算的零元。反過來,在概括過程中,全因素是析運(yùn)算的零元,也是合運(yùn)算的單位元。當(dāng)終極認(rèn)知形成之時,必有。
2) FS的回旋性反映概念內(nèi)涵與外延的反變關(guān)系。這種反變關(guān)系在實際的認(rèn)知過程中,往往表現(xiàn)為概念的分化與同化的糾纏,對于理解一個事物而言,究竟是概念分化多一些好,還是同化多一些好?概念的分化與同化的糾纏,反映概念形成過程中因素的解析力和概括力交互作用的過程。從論域為一個整體的角度,解析導(dǎo)致“論域劃分”,破壞整體性;從論域中對象的個體性出發(fā),概括是在論域劃分的基礎(chǔ)上重構(gòu)整體性。同理,從“屬性限定”揭示一類事物共同特征的角度講是概括;而從概念的結(jié)構(gòu)、即“屬性限定”為概念分化技術(shù)的角度講是解析。在認(rèn)知過程中,概括與解析各具所長,往往交互作用,殊途同歸。由因素認(rèn)知一個概念不外乎借助因素的解析力和概括力,辨識概念的內(nèi)涵(屬性限定),界定概念的外延(論域劃分),并使兩種過程形成同一認(rèn)知。
在FS中,因素運(yùn)算的認(rèn)知性質(zhì)由解析力主導(dǎo),準(zhǔn)確地揭示了概念的內(nèi)涵與外延的反變關(guān)系。但是,概括力的隱化導(dǎo)致因素操作的代數(shù)性質(zhì)同經(jīng)典Boole代數(shù)理論中的部分運(yùn)算性質(zhì)形式不同。這種情況恰是FS的價值所在。由因素描述的認(rèn)知過程中,概括和解析不是兩種截然分開的過程,僅僅是間或性的哪個表現(xiàn)更強(qiáng)勢一些,解析能力的提升(降低)導(dǎo)致概括能力的降低(提升),總合覺察力不變。
本文工作對文獻(xiàn)[34]的核心概念進(jìn)行梳理,簡化了公理性約定,凝練并重述核心命題,承接前期工作的理論與思想。著眼因素空間的理論與方法在信息科學(xué)領(lǐng)域的應(yīng)用,重述因素空間的定義,提出了自為因素、可基因素族、完備因素空間和正則因素空間的概念,初步地、明確勾勒出因素空間與信息系統(tǒng)之間的關(guān)系。
本文對FS理論的貢獻(xiàn)在于交錯自同構(gòu)變換、回旋格和對偶回旋定理,突破了經(jīng)典論述關(guān)于FS結(jié)構(gòu)的認(rèn)知,為認(rèn)知科學(xué)討論若干基本概念之間關(guān)系和思維運(yùn)動的問題給出了可借鑒數(shù)學(xué)模型,為FS理論在人工智能領(lǐng)域的研究與應(yīng)用提供了新的切入點(diǎn)。
據(jù)此,本文對FS理論與應(yīng)用研究的展望如下:
1) 進(jìn)一步構(gòu)建FS理論“四位一體”的思想框架。在本文的討論中,一個中心思想就是“人工智能是人類認(rèn)知模式的數(shù)學(xué)重構(gòu)”,在這個過程中,關(guān)于人工智能的數(shù)學(xué)思想、原理與算法必須同人的認(rèn)知模式高度契合,理論研究的思想框架必須同人類問題解決過程中的思維場高度契合,并同機(jī)器實現(xiàn)的技術(shù)特征高度契合。這一思想暗涵于本文之中,可以想象在以(U)為頂點(diǎn)的四面體中,底面(U))表示因素分析理論,側(cè)面(U))表示商空間理論,側(cè)面(U))表示張量分析理論,側(cè)面表示數(shù)據(jù)分析理論,每個棱表示兩個頂點(diǎn)之間的雙向信息通道。這個四面體構(gòu)成完整的FS理論的思想框架。
2) 發(fā)展基于FS對偶回旋定理的因素分析技術(shù)體系。本文發(fā)現(xiàn)的FS對偶回旋定理,明確了因素空間中信息的運(yùn)動過程存在麥比烏斯環(huán)特征。佩捷、王蘭新在《從麥比烏斯到陳省身——麥比烏斯變換與麥比烏斯帶》一書中,較為系統(tǒng)地介紹了在代數(shù)幾何、拓?fù)鋵W(xué)的研究中發(fā)現(xiàn)的麥比烏斯帶有趣的性質(zhì)。麥比烏斯帶的存在源自實數(shù)域R的乘法群R*的不連通性,這一性質(zhì)更深刻的等價描述如下[37]:
另外,格代數(shù)與麥比烏斯代數(shù)存在天然的聯(lián)系[37-40]。
這表明,從純數(shù)學(xué)的角度看,F(xiàn)S對偶回旋定理所描述的數(shù)學(xué)性質(zhì)以不同的形式存在已久。但是,本文再發(fā)現(xiàn)的過程卻貫通了認(rèn)知科學(xué)與數(shù)學(xué)深刻的內(nèi)在聯(lián)系,鞏固了FS理論作為人工智能研究的思想框架和認(rèn)知科學(xué)研究的數(shù)學(xué)模型的地位。眾多的文獻(xiàn)給出了麥比烏斯變換群在其他數(shù)學(xué)分支,如數(shù)論、組合數(shù)學(xué)、微分幾何、黎曼幾何、羅巴切夫斯基幾何、模與叢論中的應(yīng)用,以及在圖像處理領(lǐng)域、通信科學(xué)、密碼學(xué)、量子物理學(xué)、遺傳生物學(xué)、有機(jī)化學(xué)、乃至機(jī)械與工程領(lǐng)域中的應(yīng)用,無不昭示著FS對偶回旋定理潛在的理論與應(yīng)用價值。