魏玲 趙思雨
摘要:三支概念分析是將三支決策思想引入形式概念分析產(chǎn)生的進(jìn)行數(shù)據(jù)分析與知識發(fā)現(xiàn)的新工具。文中用三支決策思想從知識內(nèi)涵角度闡述三支概念分析中的基本概念,進(jìn)而用粒計算思想分別從對象和屬性兩個角度刻畫三支概念分析的知識結(jié)構(gòu),最后將DIKW體系用于三支概念分析,給出三支概念分析的D-I-K/W漏斗模型。
關(guān)鍵詞:三支概念分析;形式概念分析;三支決策;粒計算;DIKW體系
中圖分類號:O29;TP18
DOI:10.16152/j.cnki.xdxbzr.2020-04-004開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
Granules and knowledge structure in three-way concept analysis
WEI Ling1,3, ZHAO Siyu1,2,3
(1.School of Mathematics, Northwest University, Xi′an 710127, China;
2.College of Mathematics and information Science, Xianyang Normal University, Xianyang 712000, China;
3.Institute of Concepts, Cognition and Intelligence, Northwest University, Xi′an 710127, China)
Abstract: Three-way concept analysis is a new tool for data analysis and knowledge discovery by introducing three-way decision into formal concept analysis. This paper expounds the basic concepts of 3WCA with 3WD thought from the perspective of knowledge intension. Then it describes the knowledge structure of 3WCA with granular computing from two perspectives of object and attribute. Finally, the DIKW hierarchy is applied to 3WCA, and the D-I-K/W funnel model of 3WCA is given.
Key words: three-way concept analysis; formal concept analysis; three-way decision; granular computing; DIKW hierarchy
形式概念分析理論(formal concept analysis,F(xiàn)CA)由德國數(shù)學(xué)家Wille于1982年提出[1]。FCA以包含對象集、屬性集及二者二元關(guān)系的形式背景為基礎(chǔ),刻畫了對象子集與屬性子集間“共同具有”的關(guān)系,進(jìn)而形成內(nèi)涵與外延,形式化的完美表達(dá)了哲學(xué)中的正概念[2]。目前,形式概念分析在屬性約簡、規(guī)則獲取、決策分析、數(shù)據(jù)挖掘等方面有很好的研究成果和應(yīng)用[3-6]。
將三支決策理論(three-way decisions,3WD)[7]中的三分思想引入形式概念分析,Qi等提出了三支概念分析(three-way concept analysis,3WCA)[8]。Qi等在形式背景上定義負(fù)算子,并構(gòu)造三支算子,將對象集或?qū)傩约?,形成三支概念與三支概念格。負(fù)算子刻畫了對象子集與屬性子集間“共同不具有”的關(guān)系,其語義及運算方式與FCA中補背景的正算子吻合,同時也形式化的表達(dá)了哲學(xué)中的負(fù)概念。三支概念分析自2014年提出以來,得到了廣泛認(rèn)可,在基礎(chǔ)理論研究[9-12]、三支概念格構(gòu)造[13-15]、規(guī)則提取[16]、概念學(xué)習(xí)[17-18]、模糊三支概念分析[19]、不完備三支概念獲取[20]及實際應(yīng)用[21]等方面取得了諸多研究成果。
粒計算(granular computing,GrC)是由Zadeh于1979年提出的模糊信息粒發(fā)展而來的理論[22],強調(diào)研究背景與問題的?;c層次分析,并在此基礎(chǔ)上解決問題。目前許多學(xué)者將粒計算與形式概念分析結(jié)合,得到了豐富的研究成果[23-26]。Qi等基于形式背景從不同角度提出了5種粒,并研究了5種粒之間的關(guān)系,進(jìn)而給出形式概念分析中的粒鏈條與粒層級[27]。這些粒在層次角度和語義角度都有所不同。這種研究方法對于從粒計算的角度解讀三支概念分析很有借鑒意義。
數(shù)據(jù)-信息-知識-智慧(DIKW)體系是信息科學(xué)、計算機科學(xué)、管理科學(xué)、心理學(xué)、認(rèn)知科學(xué)、哲學(xué)等諸多學(xué)科的基本概念之一[28-31]。數(shù)據(jù)、信息、知識、智慧之間的關(guān)系微妙而緊密,沒有明確的界限。Yao結(jié)合三支決策的思想,將信息作為弱知識,給DIKW體系一個三層解釋:D-I/K-W模型[32]。在三支概念分析中,形式背景是數(shù)據(jù)的一種載體,以數(shù)據(jù)為基礎(chǔ),可以從DIKW體系的角度對三支概念分析進(jìn)行認(rèn)知學(xué)習(xí)。
本文主要從三種不同的角度對三支概念分析進(jìn)行認(rèn)識學(xué)習(xí)。首先是三支決策的角度,用三分的思想解讀三支概念分析;其次是粒計算的角度,從不同語義出發(fā)提出5種粒并研究其關(guān)系;最后是DIKW體系角度,利用DIKW模型分析三支概念分析,并給出適于3WCA的D-I-K/W模型。
4 認(rèn)知漏斗——知識獲取角度
根據(jù)現(xiàn)代知識體系形成的相關(guān)理論,數(shù)據(jù)經(jīng)過整理成為信息,信息經(jīng)過系統(tǒng)化成為知識,而知識是智慧的源泉。這就是著名的DIKW(Data-to-Information-to-Knowledge-to-Wisdom)理論。這一體系關(guān)于數(shù)據(jù)、信息、知識、智慧之間的層次遞進(jìn)在信息科學(xué)、計算機科學(xué)、認(rèn)知科學(xué)、哲學(xué)等諸多學(xué)科中得到了普遍認(rèn)可[28-31]。
在DIKW體系中,數(shù)據(jù)作為一些事實的集合,本身并不能表現(xiàn)出任何意義,只有當(dāng)通過某種方式對數(shù)據(jù)進(jìn)行組織和分析時,才成為有意義的信息。信息經(jīng)過篩選、綜合等系統(tǒng)化處理,上升為可以解決較為復(fù)雜問題的知識。而智慧是對知識的有效利用,關(guān)注的是事物發(fā)展的未來。
DIKW體系一般以如圖8所示的金字塔模型呈現(xiàn)。最底層的數(shù)據(jù)是金字塔龐大的基石,而智慧則是其頂端相當(dāng)小的一部分。自下而上看金字塔,體現(xiàn)的是復(fù)雜性、抽象性、意義與價值的提升。
Rowley將金字塔模型顛倒,給出了DIKW體系的漏斗模型[28]。漏斗模型可以更加生動的體現(xiàn)數(shù)據(jù)逐漸集中、提煉、凝縮,成為有價值的智慧的過程。
然而,在人們的認(rèn)知當(dāng)中,由于數(shù)據(jù)、信息、知識及智慧四個層次中任何兩個相鄰級別之間可能不存在明確的邊界,故其定義或解釋并沒有絕對一致的看法。至于DIKW 體系分為幾層合適,也沒有固定的說法。比如,有數(shù)據(jù)-信息-知識的三層結(jié)構(gòu)DIK模型[28],也有數(shù)據(jù)-信息-知識-理解-智慧這樣的五層結(jié)構(gòu)[30]。但是,復(fù)雜的結(jié)構(gòu)雖然會提供更為詳細(xì)的信息或更為細(xì)節(jié)化的描述,卻也會增加理解的難度。數(shù)據(jù)、信息及知識、智慧之間的分離是存在一致性的,而信息在某種角度可以被看作是一種弱知識[31]。因此,Yao基于三支決策理論認(rèn)為,三層是最基本的結(jié)構(gòu),他將信息與知識合并,給出了如圖9所示的DIKW的三層解釋:D-I/K-W模型[32]。
在3WCA中,形式背景、三支概念(格)及規(guī)則(決策)是三個基本概念。將原始數(shù)據(jù)以二維表的形式儲存在形式背景中,包括一些具體的對象、屬性及二者之間的二元關(guān)系,是數(shù)據(jù)層面。通過對形式背景的學(xué)習(xí),可得到具體的三支概念及由三支概念構(gòu)建的三支概念格,這是對原始數(shù)據(jù)進(jìn)行了挖掘和提煉,獲得的初步認(rèn)識,是信息層面。最終由這些概念,可學(xué)習(xí)出規(guī)則、決策,是可以應(yīng)用的知識和智慧層面。
由此,研究認(rèn)為,在3WCA框架下,知識與智慧之間的區(qū)別難以界定,D-I-K-W漏斗模型更接近D-I-K/W漏斗模型。從這一角度來說,DIKW體系可被理解為如圖10所示的D-I-K/W三層結(jié)構(gòu)。雖然這種理解不同于Yao的D-I/K-W漏斗模型呈現(xiàn)的語義,但這種三層結(jié)構(gòu)其本質(zhì)仍是三支決策理論在3WCA認(rèn)知層次上的一種呈現(xiàn)。
針對3WCA的D-I-K/W漏斗模型可具體表達(dá)為如圖11所示的形式。圖12則給出一般D-I-K/W模型與3WCA框架下具體模型之間的對應(yīng)關(guān)系。
5 結(jié) 語
三支概念分析將三支決策的思想引入形式概念分析,是對形式概念分析的擴(kuò)展,也是三支決策理論的一個具體模型。本文首先基于三支決策,從知識內(nèi)涵的角度闡述三支概念格中的三分;其次基于粒計算,從知識結(jié)構(gòu)的角度提出3WCA上的五種粒,研究其關(guān)系;最后基于DIKW體系,從知識獲取的角度對3WCA進(jìn)一步認(rèn)知,給出3WCA自身的D-I-K/W漏斗模型。
3WCA的產(chǎn)生,隱含了大量的研究課題。如,如何更進(jìn)一步將3WCA與三支決策理論、粒計算、認(rèn)知科學(xué)等進(jìn)行交叉研究,都是3WCA研究領(lǐng)域內(nèi)富含理論意義與研究價值的新問題。
3WCA的研究尚在起步階段,期待對這一研究方向感興趣的同行學(xué)者提出并解決更多的新問題,共同推動了3WCA的研究。
參考文獻(xiàn):
[1] WILLE R. Restructuring lattice theory: An approach based on hierarchies of concepts [C]∥RIVAL I.Ordered Sets.Dordrecht-Boston:Reidel,1982: 445-470.
[2] 金岳霖. 形式邏輯[M]. 北京: 人民出版社, 1979.
[3] 張文修, 魏玲, 祁建軍. 概念格的屬性約簡理論與方法 [J].中國科學(xué)E輯: 信息科學(xué), 2005, 35(6): 628-639.
ZHANG W X,WEI L,QI J J.Attribute reduction theory and approach to concept lattice[J].Science in China Series F:Information Science,2005,48(6):713-726.
[4] SHAO M W, LEUNG Y, WU W Z. Rule acquisition and complexity reduction in formal decision contexts [J]. International Journal of Approximate Reasoning, 2014, 55(1): 259-274.
[5] LI J H, REN Y, MEI C L, et al. A comparative study of multigranulation rough sets and concept lattices via rule acquisition [J]. Knowledge-Based Systems, 2016, 91: 152-164.
[6] LI W, WEI L. Data dimension reduction based on concept lattices in image mining [C]∥Proceedings of the 6th International Conference on Fuzzy Systems and Knowledge Discovery, 2009: 369-373.
[7] YAO Y Y. Three-way decision: An interpretation of rules in rough set theory [C]∥WEN P, LI Y, POLKOWSKI L, et al.Rough Sets and Knowledge Technology (Lecture Notes in Computer Science, 5589).Gold Coast, Australia, 2009: 642-649.
[8] QI J J, WEI L, YAO Y Y. Three-way formal concept analysis[C]∥MIAO D Q, PEDRYCZ W, SLEZAK D, et al.Rough Sets and Knowledge Technology (Lecture Notes in Computer Science, 8818).Shanghai, China, 2014: 732-741.
[9] QI J J, QIAN T, WEI L. The connections between three-way and classical concept lattices [J]. Knowledge-Based Systems, 2016, 91: 143-151.
[10]REN R S, WEI L. The attribute reductions of three-way concept lattices [J]. Knowledge-Based Systems, 2016, 99: 92-102.
[11]YU H Y, LI Q G, CAI M J. Characteristics of three-way concept lattices and three-way rough concept lattices [J]. Knowledge-Based Systems, 2018, 146: 181-189.
[12]魏玲, 高樂, 祁建軍. 三支概念分析研究現(xiàn)狀與展望[J]. 西北大學(xué)學(xué)報(自然科學(xué)版), 2019, 49(4): 527-537.
WEI L, GAO L, QI J J. Review and outlooks of three-way concept analysis [J].Journal of Northwest University (Natural Science Edition), 2019, 49(4): 527-537.
[13]祁建軍, 汪文威. 多線程并行構(gòu)建三支概念 [J].西安交通大學(xué)學(xué)報, 2017, 51(3): 116-121.
QI J J, WANG W W. A multithreaded parallel algorithm for constructing three-way concepts[J].Journal of Xi′an Jiaotong University, 2017, 51(3): 116-121.
[14]QIAN T, WEI L, QI J J. Constructing three-way concept lattices based on apposition and subposition of formal contexts [J].Knowledge-Based Systems, 2017, 116: 39-48.
[15]王明, 魏玲. 基于K-Modes聚類的OE-概念格壓縮 [J]. 模式識別與人工智能, 2018, 31(8): 704-714.
WANG M, WEI L. OE-concept lattice compression based on K-modes clustering [J].Pattern Recognition and Artificial Intelligence, 2018, 31(8): 704-714.
[16]WEI L, LIU L, QI J J, et al. Rules acquisition of formal decision contexts based on three-way concept lattices[J]. Information Sciences, 2020, 516: 529-544.
[17]LI J H, HUANG C C, QI J J, et al. Three-way cognitive concept learning via multi-granularity [J]. Information Sciences, 2017, 378(1): 244-263.
[18]HUANG C C, LI J H, MEI C L, et al. Three-way concept learning based on cognitive operators: An information fusion viewpoint [J]. International Journal of Approximate Reasoning, 2017, 83:218-242.
[19]HE X L, WEI L, SHE Y H. L-fuzzy concept analysis for three-way decisions:Basic definitions and fuzzy inference mechanisms [J]. International Journal of Machine Learning and Cybernetics, 2018, 9(11): 1857-1867.
[20]YAO Y Y. Interval sets and three-way concept analysis in incomplete contexts [J]. International Journal of Machine Learning and Cybernetics, 2017, 8(1): 3-20.
[21]YAO Y Y. Three-way conflict analysis: Reformulations and extensions of the Pawlak model [J]. Knowledge-Based Systems, 2019, 180: 26-37.
[22]ZADEH L A. Toward a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic [J]. Fuzzy Sets and Systems,1997,90(2):111-127.
[23]苗奪謙,王國胤,劉清等. 粒計算: 過去、現(xiàn)在與展望[M]. 北京: 科學(xué)出版社,2007.
[24]智慧來, 李金海. 基于必然屬性分析的粒描述[J].計算機學(xué)報, 2018, 41(12): 68-85.
ZHI H L, LI J H. Granule description based on necessary attribute analysis[J].Chinese Journal of Computers, 2018, 41(12): 68-85.
[25]WU W Z, LEUNG Y, MI J S. Granular computing and knowledge reduction in formal contexts [J]. IEEE Transactions on Knowledge and Data Engineering, 2009, 21(10): 1461-1474.
[26]李金海, 吳偉志. 形式概念分析的粒計算方法及其研究展望[J].山東大學(xué)學(xué)報(理學(xué)版), 2017(7): 1-12.
LI J H, WU W Z. Granular computing approach for formal concept analysis and its research outlooks[J].Journal of Shandong University(Natural Science), 2017(7): 1-12.
[27]QI J J, WEI L, WAN Q. Multi-level granularity in formal concept analysis[J]. Granular Computing, 2019, 4 (3): 351-362.
[28]ROWLEY J. The wisdom hierarchy:Representations of the DIKW hierarchy[J].Journal of Information Science, 2007, 33(2):163-180.
[29]ZELENY M. Management support systems:Towards integrated knowledge management[J]. Human Systems Management, 1987,7(1):59-70.
[30]ACKOFF R L. From data to wisdom[J]. Journal of Applied Systems Analysis, 1989, 16:3-9.
[31]FRICK M. The knowledge pyramid:A critique of the DIKW hierarchy[J].Journal of Information Science, 2009, 35(2):131-142.
[32]YAO Y Y. Tri-level thinking: Models of three-way decision[J]. International Journal of Machine Learning and Cybernetics, 2020, 11(5): 947-959.
[33]DAVEY B A, PRIESTLEY H A. Introduction to lattices and order[M].Cambridge:Cambridge University Press, 2002.
(編 輯 張 歡)
作者簡介:
魏玲,西北大學(xué)數(shù)學(xué)學(xué)院三級教授,博士生導(dǎo)師。西北大學(xué)概念、認(rèn)知與智能研究中心主任,中國人工智能學(xué)會粒計算與知識發(fā)現(xiàn)專業(yè)委員會常務(wù)委員、知識工程與分布智能專業(yè)委員會委員。曾在香港中文大學(xué)、加拿大里賈那大學(xué)進(jìn)行訪問研究。主要從事形式概念分析、粗糙集理論、三支決策理論等方面的研究與教學(xué)工作。先后主持國家自然科學(xué)基金青年項目與面上項目4項,獲陜西高等學(xué)??茖W(xué)技術(shù)一等獎1項,合作出版著作兩部。在《中國科學(xué)》,IEEE Transactions on Cybernetics等國內(nèi)外期刊和國際會議發(fā)表論文70余篇,其中ESI高被引論文2篇,論文曾獲2007 年“中國百篇最具影響國內(nèi)學(xué)術(shù)論文”及2016 年中國科學(xué)雜志社“十年經(jīng)典文章”。