汪培莊,周紅軍,何華燦,鐘義信
(1. 遼寧工程技術大學 智能工程與數(shù)學研究院,遼寧 阜新 123000; 2. 陜西師范大學 數(shù)學學院,陜西 西安710062; 3. 西北工業(yè)大學 計算機學院,陜西 西安 710072; 4. 北京郵電大學 智能科學技術中心,北京 100876)
機制主義的人工智能理論抓住并提升了目前三大流派的共性,為人工智能理論的發(fā)展構建了一個統(tǒng)一的平臺[1]。泛邏輯理論要在不確定性演化環(huán)境下對各種非經典邏輯進行統(tǒng)一的柔性歸納[2]。Lukasiewiez[3]提出的多值邏輯和Zadeh[4]提出的模糊邏輯先后突破了布爾的二值邏輯,所引起反響至今還是方興未艾。特別是,王國俊[5]提出的計量邏輯、Schweizer等[6]提出的概率邏輯、周紅軍[7]提升出的概率計量邏輯以及王國俊學派[8-11]和徐揚[12]在格值邏輯方面的工作。這些工作和何華燦的泛邏輯都與概率論有密切的聯(lián)系,不妨統(tǒng)稱為廣義概率邏輯。概率論的出現(xiàn)改變了數(shù)學,廣義概率邏輯的出現(xiàn)對邏輯發(fā)展有重要意義。
信息不同于物質,它在物理空間中不占位置,不具有不可入性。但是,“有這樣一種學說:在物質世界與信息世界的對立統(tǒng)一中,物質在物理空間中具有不可入性和慣性,信息在可能性空間中也具有不可入性和慣性。這應當成為柔性邏輯的公理”[2]。這里提出了一個非常重要的概念“可能性空間”,究竟什么是可能性空間,它與概率論和模糊數(shù)學所提的可能性空間有什么聯(lián)系與區(qū)別?什么是廣義概率邏輯?廣義概率邏輯的發(fā)展將面臨什么問題?這些問題的深入探討,將會對人工智能的發(fā)展帶來重大的影響。本文就是要用因素空間的數(shù)學理論來把這些問題說清楚。
在前面曾提到,就像物質在物理空間中具有不可入性和慣性一樣,信息在可能性空間中也具有不可入性和慣性。這兩句話意義重大。信息是要占“地方”的,需要有空間,這個空間不在物質世界里,在認識主體的處理架構之中。
可能性空間在概率論和模糊數(shù)學中分別出現(xiàn)過兩次。第一次,Kolmogorov 在1936年用公理化定義把概率定義成為像面積、體積和重量一樣的測度,可加性測度是不可入性的產物,測度測量“占有”這位數(shù)學家第一次把信息概念與物質概念等同起來,在可能性空間中為事件爭奪地盤。三十多年以后,模糊集的創(chuàng)始人 Zadeh[13]也要把模糊概念放到可能性空間中來爭奪地盤。
Kolmogorov的可能性空間就是他所定義的基本空間。這個空間對現(xiàn)代概率論來說具有特殊的重要性。Kolmogorov把隨機變量定義成為一個從到實直線的可測映射,它把中的概率傳遞到直線上形成各種類型的概率分布列、分布密度和分布函數(shù),使古典概率突變成為現(xiàn)代概率論。問題是,隨機變量所描述的是像降雨量和命中率這樣一些不確定的現(xiàn)象,而映射卻是一個非常嚴格的數(shù)學概念,對于中的每一個點,必須有唯一確定的實數(shù)值與之對應,怎樣才能把隨機的現(xiàn)象和嚴格的映射連在一起呢?關鍵就在基本空間的建立。Kolmogorov的基本空間就是作者所提出的一個因素空間[14],把所有對結果有影響的因素全部考慮進來,所考慮的因素越多,結果就越確定,作為一種數(shù)學抽象隨機變量在中最終會變成一個必然的映射。我們姑且不在哲學上對此進行評價,數(shù)學家就需要有這種魄力和手段。汪培莊[15]明確地把基本空間當作因素空間來研究,提出了因素概率論的思想。天下事物說來說去,就是因果二字,因果出理性,因果生邏輯。若則,就是因,就是果,邏輯就是因果。概率就是廣義的因果律。概率都是相對于一定條件而言的。條件概率就是推理句“若則”的真值:。
用因素空間描述概率論叫做因素概率論。每個可描述的發(fā)生因素都規(guī)定了一個相域。例如,投擲一枚骰子,因素是出現(xiàn)的點數(shù),它的相域是。由于骰子具有6面對稱性,我們把這樣的發(fā)生因素叫做對稱性因素。包含6個相,6稱為可能結果數(shù)。古典概率中有這樣一條公理,即對稱性公理。
對稱性公理具有可能結果數(shù)為的對稱性因素,在它與其他發(fā)生因素獨立的情況下,種結果的發(fā)生都具有等可能性。若,則。
現(xiàn)代概率論的發(fā)展要歸功于中心極限定理和各種概率分布的推導,但其根源是來自古典概率和樣本平權公理:
樣本平權公理設是關于隨機變量的一組獨立觀察的樣本點,如無特殊聲明,則每個樣本點都是平權的,亦即1/m;每個樣本各自平權地把的概率搬到因素空間中去爭奪地盤,就形成了各種各樣的概率分布。根據(jù)這一公理,被視為一組相互獨立的與同分布的隨機變量。
模糊數(shù)學也強調可能性空間,這種可能性空間與概率論不同,所有主觀性測度都是非可加的。如果把不可入性狹義地理解為測度的可加性,那么非可加的測度是可入的。但是,非可加的測度照樣是要占“地方”的,汪培莊把模糊集定義所在的論域當作可能性空間,研究了模糊性與隨機性的區(qū)別和聯(lián)系,發(fā)現(xiàn)論域上的模糊性可以轉化為冪上的隨機性,提出了模糊落影理論[15]。證明了主觀性測度與概率測度之間的同構對應定理,說明模糊信息在因素空間中也具有不可入性。
總之,概率論與模糊數(shù)學都特別強調可能性空間。在英文中概率與可能性是一個字probability,為了與概率相區(qū)別,Zadeh把模糊分布的可能性改稱為possibility[13],不幸的是,這個詞的中文翻譯也是可能性。西方人對probability和possibility的理解是有分別的,probability是預測中某種結果出現(xiàn)的可能性,而possibility是識別中某種類別出現(xiàn)的可能性。隨機性出現(xiàn)在預測過程中,當事件還沒有發(fā)生的時候,大家要猜測將會是什么結果,這時就要用到概率,事情一旦發(fā)生,所占的位置馬上騰空,可能性空間馬上關閉而轉換成另一個可能性空間。面對一個已經發(fā)生的事情,要去判斷這是什么的時候,如果說不清楚,這就出現(xiàn)了模糊性,有多種possibility等我們去選擇,這些possibility也要在這個新的可能性空間中來爭奪地盤。為了避免文字上的混淆,我們最好把可能性空間改稱為信息空間。概率論的可能性空間是以發(fā)生因素所組成的信息空間,模糊數(shù)學的可能性空間是由識別因素所組成的信息空間。在信息科學領域里,因素的相域就是信息域,因素空間也就是信息空間。
概率論的產生是數(shù)學上的重大事件,相應的廣義概率邏輯的發(fā)展將是邏輯學中的一個重大事件。為了促進這一發(fā)展,我們需要在廣義概率邏輯中引用因素表現(xiàn)論域。
在這一章里,我們需要對經典邏輯作一點反思,弄清Stone拓撲表示定理的思想實質,強調謂詞變元的因素特質,用因素空間的思想對數(shù)理邏輯開拓一種新的思路。
這個系統(tǒng)對經典邏輯來說是自給自足的了。但是,命題演算在語言上存在著一個大問題:語言學上的每一句話都有主語和謂語,一個判斷句的謂語是“be”, 賓語是be所連接的一個名詞、代名詞或形容詞,它表示一個概念。要問主語是否符合這個概念,便形成一個判斷。有人主張把be+概念合稱為一個謂詞,我們贊同并采用此說法。概念是命題的核心,主語是命題的立足點。主語不同,無法進行推理,我是中國人推不出安倍晉三是亞洲人。繞了一個大圈子,人們發(fā)現(xiàn),如果把主語事先規(guī)定死了的話,則命題演算就是概念演算。在進行推理的時候,如無特別聲明,參加演算的命題必須是同一個對象,不能有變!命題演算的局限性是很大的。
謂詞演算的樸素思想本來是很簡單的(絕不像一階謂詞邏輯定義得那么煩瑣):將命題改寫成,是”,它是可以判斷真?zhèn)蔚囊痪湓?,叫做一個謂詞。叫做概念,叫做對象,或叫變元。就像代數(shù)是帶變元的算術一樣,謂詞是帶變元的命題。這是布爾邏輯的一大進步。
謂詞演算帶給邏輯學的一項最重要的啟迪就是:邏輯蘊涵的本質就是集合的被包含,三段論法就是包含關系的傳遞。邏輯從數(shù)學中找到了堅固的理論基礎。
道理非常簡單,概念的內涵與外延是逆向對合的:概念甲的內涵蘊涵乙的內涵,當且僅當概念乙的外延包含概念甲的外延。但是,直到Stone拓撲表示定理的出現(xiàn),這條簡單的道理才從數(shù)學上得到嚴格的證明。
Stone拓撲表示定理告訴我們,任何一個布爾代數(shù)都同構于由其全體極大濾子所形成的緊零維Hausdorff空間的開閉集代數(shù)[16]。簡單地說,就是布爾邏輯與集合論是同構的。但要問怎樣同構法,就復雜化了。為了簡單,我們不妨提出一個Stone簡化定理。需要介紹濾子的2種不同的定義,我們把一般格論中定義的濾子叫做強濾子。權威的格論著作[17]給出:在一個爾代數(shù)B = (B,中,按常規(guī)定義了偏序:
定義1在布爾代數(shù)中,叫做一個強濾子,如果滿足:1)滿性,即(且);2)尾斂性,即對任意,都有。是一個平凡的強濾子。非平凡的強濾子叫做真強濾子。一個強濾子叫做極大強濾子,如果它不被不同于它的強濾子所包含的話。
在某些格論的文獻中所定義的濾子只滿足第一個條件。于是,濾子與強濾子是兩個不同的概念,按強濾子敘述更好。稱只含有限個原子命題集的布爾代數(shù)為有限布爾代數(shù)或元布爾代數(shù),元指的是原始公式的個數(shù)。
命題1在元布爾代數(shù)中,每個強濾子必有一個最小元,使對任意,都有。
定義2強濾子的最小元叫做它的濾尾。
命題2元布爾代數(shù)中真強濾子是極大的充分必要條件是:它的濾尾是中的次小元。
證明下面將提到的與分別是真濾子和的濾尾。顯然與都不是最小元0。
定義3記為元布爾代數(shù)中次小元的集合,叫做布爾代數(shù)的表現(xiàn)論域。
表現(xiàn)論域是按照強濾子來定義的。強濾子所具有的尾斂性是拓撲學中鄰域系的典型特征。在有限情形下,它保證了濾尾的存在,在無限情形下保證了強濾子向一點的收縮。它始終保證強濾子像一顆炮彈,在有限情形下有彈尖(濾尾),在無限情形下有尖口(極限點)。非強濾子由于沒有尾斂性,它就不是一個彈頭而是多彈頭的并。不難證明,中全體濾子所成的集合乃是強濾子所成集合的冪:。
證明命題2說明與是一一對應的。所以,根據(jù)Stone表示定理,與、、之間也都是一一對應的。中公式的析取、合取、否定運算顯然與中集合的并、交、余運算同態(tài)。證畢。
證明給定, 若有公式則必有比小的公式,使有。
從二值邏輯到多值邏輯,所有新的理論都要推廣Stone拓撲表現(xiàn)定理,這是考驗新邏輯理論的一塊試金石。我們需要做什么工作呢?首先,要去掉有限布爾代數(shù)的限制,使Stone簡化定理的面擴大,然后,要證明一個普適性的廣義Stone簡化定理。若有一個能夠一勞永逸地解決Stone簡化定理推廣的理論,就可以加速新理論的發(fā)展。比如,抓住,當時Stone簡化定理成立,要證對任意(三值、多值、連續(xù)值)Stone簡化定理都成立。對于模態(tài)邏輯,量詞邏輯類似。
在命題演算中我們曾經強調過,由我是中國人推不出安倍是亞洲人。推理句中的前后兩個命題必須是同一個對象。在謂詞邏輯中也應該堅持同對象推理的原則,毫無聯(lián)系的兩個對象之間是不能推理的。
常會遇見下面的推理句:若氣溫高則降雨量大
我們希望搞辯證邏輯,辯證法的核心是要具體問題具體分析,什么是具體分析呢?就是要對問題的內在和外在的因素進行分析。在謂詞邏輯中把變元進一步寫成因素是邏輯發(fā)展的新機。
邏輯是對事物的性質進行是非判斷的科學,它要離開具體事物的性質而抽象出是非判斷的一般規(guī)律,但抽象離不開現(xiàn)實,要想使邏輯更加有效地解決實際問題,需要開辟邏輯返回世界的接口。表現(xiàn)論域就是這個接口, 它是變元活動的空間。若把變元看作因素,就是因素空間,以因素空間做表現(xiàn)論域的邏輯就是因素邏輯。
定義4在上的二值因素邏輯系統(tǒng)是這樣來規(guī)定的:
4) 真值集是二值布爾代數(shù)W2:
為什么會有虛的信息組態(tài)呢?因為因素之間存在著相互聯(lián)系與制約。譬如,氣溫與降雨量這兩個因素在平面的聯(lián)合分布就形成一個背景集,顯示一種正變關系,極低氣溫不可能接受高降雨量。所以,(極低溫,高降雨量)就是虛搭配,就不能容許虛搭配在其中出現(xiàn),它只能包含像(低溫,低降雨量)、(中溫,中降雨量)、(高溫,高降雨量)等這樣一類信息組態(tài)。此時,的幾何形狀就被想象為一個泡脹了的上升曲線,反映氣溫與降雨量之間呈一種正變的關系。
圖1 因素推理的直觀模型Fig. 1 Illustration of factorial reasoning
布爾邏輯可以用電路來表現(xiàn),每個字代表一個電器開關。每一個元公式都代表一個開關的電路。等效的電路與布爾代數(shù)之間形成一種同構對應。這種對應叫作結構-功能對應。結構指的是開關的線路結構,功能指的是邏輯的判別功能。等效的公式有很多,等效的線路也有很多,經典的邏輯理論要研究最小化問題,就是根據(jù)一張賦值表,從中找出一個公式使所對應的線路最簡單。
定義5若則稱是的蘊涵式。若是的蘊涵式且在中不存在的任何其他蘊涵式,則稱是的素蘊涵式。
命題4公式的最小化是與它等效的一個析取范式,式中的每一項都是它的素蘊涵式。
最小化理論將語法的結構和邏輯的語義功能有效地聯(lián)系起來,意義重大。但是這種聯(lián)系有一個前提,表現(xiàn)邏輯的電路開關必須相互獨立。如果開關之間存在著關聯(lián),或者,由于系統(tǒng)受到侵蝕,兩個開關在開時連通,在變元非獨立的情況下,邏輯的結構功能關系應當如何進行呢?例如,給出下面一張三變元公式的賦值表(見表1)。
表1 公式 在 上的賦值表Table 1 The assignment table of formula p on
表1 公式 在 上的賦值表Table 1 The assignment table of formula p on
images/BZ_11_302_862_336_891.pngimages/BZ_11_302_936_336_966.png0 0 0 0 1 1 1 1images/BZ_11_302_1011_336_1040.png0 0 1 1 0 0 1 1images/BZ_11_306_1084_331_1113.png0 1 0 1 0 1 0 1 0 0 0 1 1 1 1 1
3個開關,每個開關有2種狀態(tài),搭配出8種組態(tài),形成表現(xiàn)論域,由于這3個開關都是獨立的。中8種搭配都用上了?,F(xiàn)在,設想這3個開關不是獨立的,譬如:和是等效的:。在這種限制下,第二、三、六、七列的組態(tài)是不可能出現(xiàn)的,背景只包含4種組態(tài):
注意,為了簡單,我們在符號上有下列等價的表示方法:
命題5若字組蘊涵字組,則的字長必大于的字長。
證明若字組蘊涵字組,則存在字組使, 且不包含中的字。于是的字長是與的字長之和。證畢。
命題6若字組是蘊含的最短字組。若它不在蘊含的任何字組中出現(xiàn),則是的素蘊涵式。
證明若字組不在蘊含的任何字組中出現(xiàn), 則的有效真集必在的真集之內,從而有,故是的蘊涵式。若有蘊含,由于是蘊含的最短字組,故不可能蘊涵,故是的素蘊涵式。證畢。
極小化方法(新):
命題7用極小化方法所得到的是的一個極小析取范式。
證明首先要證明算法一定有停止的時候,亦即,正字類一定會被刪盡。設是的一點。它一定不屬于。以它為真集的公式就是字組。 假設這一點沒有在以前的比對中被刪除,那么就對此字進行檢查,因為它不會在負類字組中出現(xiàn),所以這個字組一定在正類的某個字組中出現(xiàn),因而它就是的一個蘊涵式,從而這個點就可被刪除。這說明,任何正字都可在算法執(zhí)行的過程中被刪除。
表2 表1在R上的子表Table 2 The sub-table of table 1 on R
這個例子引自文獻[18], 該文最早把因素邏輯的思想應用于故障檢測,說明在變化的環(huán)境中布爾邏輯是如何被辯證化地發(fā)揮其推理功能的。
機制主義人工智能強調語法、語用和語義的全信息。全信息的核心是語義,而語義是語法和語用的結合體。所以,邏輯的結構-功能分析不僅是電路實現(xiàn)的實踐問題,更是人工智能理論的一個關鍵點。語法-語用的結合都是在場景多變的非獨立信息系統(tǒng)中來實現(xiàn)的。沒有因素邏輯的思想和框架,是很難面對這種挑戰(zhàn)的[19]。
機制主義人工智能突出目標驅動,為智能服務的邏輯也應該是目標驅動的。邏輯以推理的后件為目標。我們希望生活快樂,怎樣才能得到快樂呢?我們要尋找一個事態(tài)p使成立。在理論上,這是逆向推理的核心,在實踐上這是神經網絡的本事。因素空間可以在這里做出貢獻。
定義6如果,則稱在背景下包含,記作。
在圖2 中,那個帶陰影的月亮是我們的關注點。它是所有滿足前件而不滿足目標的點所成之集。換句話說,所有推翻推理句的點全在其中,所以這個月亮叫做推理的雷區(qū)。只要背景關系不與雷區(qū)相交,則推理就恒真了。
圖2 在背景 下包含 :Fig. 2 B containing A under background R:
泛邏輯把模糊數(shù)學出現(xiàn)以來所出現(xiàn)的多種連續(xù)并、交算子對的定義用帶參數(shù)的方式統(tǒng)一歸納成為一套單一的運算。歸納的根基是4種極端的連續(xù)算子對, 其中前3對算子為:
1) Zadeh算子:
2) 概率算子:
3) 有界和積算子:
這3種算子在什么情形下適用,泛邏輯都有明文規(guī)定。這3套算子的選擇,是需要數(shù)學來證明的。
所謂模糊性,就是概念外延的不確定性,以年輕這一概念為例,不同人或同一人在不同場景下所報的年輕區(qū)間是不一樣的。設有份調查問卷,每份問卷上都答有一個區(qū)間。根據(jù)因素空間的理論,論域上的模糊性可以轉化為冪上的隨機性,因而這些區(qū)間可被視為一個隨機集的樣本。如圖3所示,這組樣本像是天上的云,云左端的豎線段就是基本空間,其中的每一個點對應一個問卷,個點均勻地分布在中。在不改變均勻分布的情況下,調換的位置,再做點拆拼,讓隨機云從天上落下來變成年輕的隸屬函數(shù)曲線:(是覆蓋年齡的區(qū)間數(shù)目)。這就是模糊落影理論,它把隸屬度定義為隨機集的覆蓋率。這樣,我們就可把圖3的下半部看成是隨機落影的簡單模型。
圖3 模糊集是隨機云的落影Fig. 3 A fuzzy set is the falling shadow of a random cloud
模糊集A和B分別是截集At和Bs的落影,其中(t,s)是上的 2 維隨機變量,具有均勻的邊緣分布。圖4左下方是,其對角線還是,表示年齡域。對于中的任意一點,向右交的隸屬曲線于其高度,向上交的隸屬曲線于其高度 t ,這樣在方塊中就確定了一點。由這一點作十字架將U分成四塊,左下方的矩形叫做交區(qū),挖掉右上方的矩形后剩下的三塊矩形之并叫做并區(qū)。假設讀者已經知道如何把因素空間背景集的概念隨機化為背景分布,為節(jié)省篇幅,不在此贅述。
圖4 模糊集的并、交運算Fig. 4 Union and intersection of fuzzy sets
證明是隨機集對的覆蓋概率,它等于矩形所占有的概率。是隨機集對的覆蓋概率,等于矩形所占有的概率。應當?shù)扔趦删匦尾^(qū)中的聯(lián)合背景概率。證畢。
定理1的直觀意思見圖4。
定理2 當兩個概念的表現(xiàn)因素是完全正相關時,它們之間的并、交運算必須取最大、最小概率:
當兩個概念的表現(xiàn)因素相互獨立時,它們之間的并、交運算必須取概率和與概率積:
當兩個概念的表現(xiàn)因素是完全負相關時,它們之間的并、交運算必須取有界和與有界積:
定理2是因素空間對泛邏輯前3個連續(xù)邏輯算子對的證明,所敘述的條件完全符合泛邏輯的要求。定理2的證明見文獻[20],這一結果曾在1991橫濱國際模糊系統(tǒng)協(xié)會議上宣讀。定理2的證明是最早也是最嚴格的數(shù)學證明。定理1也給出了在一般情況下隸屬度的計算方法。其運算可由因素背景分布唯一確定。明確指明了解決隸屬度運算的選擇性困難的關鍵在于模糊概念背后的因素背景分布。
因素空間是泛邏輯表現(xiàn)的空間和舞臺,因素空間為泛邏輯連續(xù)算子對的選擇提供數(shù)學依據(jù)。泛邏輯是因素空間表現(xiàn)的內核與指引。泛邏輯與因素空間是邏輯與數(shù)學之間互相依靠的伙伴。
機制主義人工智能-泛邏輯-因素空間三者的結合,可以為人工智能的統(tǒng)一機制從邏輯與數(shù)學方面提供比較全面的研究。本文著重闡述了泛邏輯與因素空間之間存在著天然的聯(lián)系,這樣就保證了三結合理論的內在和諧與統(tǒng)一。