陳學(xué)昌
[摘 要] 思維導(dǎo)向數(shù)據(jù)挖掘的對象是管理過程中的歷史決策數(shù)據(jù)。思維導(dǎo)向數(shù)據(jù)挖掘所依賴的拓?fù)浣Y(jié)構(gòu)是心智概念圖。思維導(dǎo)向數(shù)據(jù)挖掘分為兩個階段:計算關(guān)聯(lián)主題簇群和計算最頻繁思維路徑。本文在心智圖和概念圖的基礎(chǔ)上構(gòu)造了心智概念圖,并根據(jù)心智概念圖提出了思維導(dǎo)向數(shù)據(jù)挖掘的算法。
[關(guān)鍵詞] 思維導(dǎo)向數(shù)據(jù)挖掘;心智圖;概念圖;思維路徑
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2009 . 21 . 005
[中圖分類號]TP393 [文獻標(biāo)識碼]A[文章編號]1673 - 0194(2009)21 - 0016- 04
1引 言
在生產(chǎn)管理過程中,人的主觀因素對決策過程有決定性的影響。挖掘決策過程中決策主體的思維方式和主體已有的知識和經(jīng)驗對管理過程優(yōu)化有重大的意義。思維導(dǎo)向數(shù)據(jù)挖掘針對管理過程中的歷史決策數(shù)據(jù)進行計算分析,以最頻繁思維路徑表示主體所傾向的思維方式,以概念知識集表示主體已有的知識和經(jīng)驗,為判斷決策主體在管理過程中所傾向的分析問題的觀點角度和評價方式提供直觀的依據(jù)。思維導(dǎo)向數(shù)據(jù)挖掘的基礎(chǔ)是心智概念圖。心智概念圖由心智圖和概念圖發(fā)展而來。
2心智圖
心智圖(Mind Map),又稱思維導(dǎo)圖,最初是20世紀(jì)60年代英國人托尼·巴贊(Tony Buzan)創(chuàng)造的一種改進筆記的方法。心智圖是一種輻射狀的思維表達方式,現(xiàn)已發(fā)展為一種高級思維的認(rèn)知工具。托尼·巴贊認(rèn)為思維導(dǎo)圖是對發(fā)散性思維的形象表達,符合人類思維的自然功能狀態(tài),有利于人們記憶和對未來事業(yè)的規(guī)劃。心智圖是一種非常有用的圖形技術(shù),將對發(fā)掘人類大腦潛力起到巨大的作用。
心智圖采用了以中心主題為“輻射中心”,用“樹狀”知識結(jié)構(gòu)圖標(biāo)明放射性思考的表現(xiàn)形式,運用線條、符號、詞匯和圖像,把一長串枯燥的信息變成彩色的、容易記憶的、有高度組織性的圖,幫助人們改善思維,提高學(xué)習(xí)效率。心智圖直觀形象地表達了人腦的思維特征,同時也是一個打開大腦潛能的強有力的圖解工具。
心智圖有4個基本特征[1]:①注意的焦點清晰地集中在中央圖形上。②主題的主干作為分枝從中央圖形向四周放射。③分枝由一個關(guān)鍵的圖形或?qū)懺诋a(chǎn)生聯(lián)想的線條上面的關(guān)鍵詞構(gòu)成。不重要的話題也以分枝的形式表現(xiàn)出來,附在較高層次的分枝上。④各分枝形成一個連接的節(jié)點結(jié)構(gòu)。
心智圖勾畫出了一個大腦的主題或領(lǐng)域的全景圖,合理地將大量的數(shù)據(jù)集中在一起,展示了構(gòu)建者的思維路線和思維方式,幫助構(gòu)建者記憶、選擇和決策。而在構(gòu)建心智圖的過程中,構(gòu)建者的想象和聯(lián)想成為各級主題連接的紐帶,成為勾畫心智圖的關(guān)鍵。這種想象和聯(lián)想的方式和路線因人而異,導(dǎo)致每個人的心智圖各不相同。心智圖有高度的擴展性,容易隨著個體的思維方式變化而變化,穩(wěn)定性差。心智圖體現(xiàn)了人類個體不同的思維方式,展現(xiàn)了不同的思維路線,是一種思維路線的形象描述。
3概念圖
概念圖(Concept Map)是康乃爾大學(xué)的諾瓦克(J.D. Novak)博士根據(jù)奧蘇貝爾(David P.Ausubel)的有意義學(xué)習(xí)理論提出的,是用來組織和表征知識的工具。它通常將有關(guān)某一主題的概念置于圓圈或方框之中,用連線連接相關(guān)的概念和命題,連線上標(biāo)明二者的關(guān)系。
概念圖有4個圖表特征[2]:概念——感知到的事物的規(guī)則屬性,通常用專有名詞或符號標(biāo)記;命題——兩個概念之間通過某個連接詞而形成的關(guān)系;交叉連接——表示不同知識領(lǐng)域概念之間的相互關(guān)系;層級結(jié)構(gòu)——同一知識領(lǐng)域內(nèi)或不同領(lǐng)域間的結(jié)構(gòu)。
概念圖不同于心智圖,它由概念、命題、交叉連接和層級結(jié)構(gòu)組成,表述個體的知識結(jié)構(gòu)系統(tǒng)。概念圖的主要組成是抽象的概念及概念之間的聯(lián)系,沒有形象的圖片、鮮明的色彩。概念圖較之心智圖更具抽象性,適用于描述個體的知識體系結(jié)構(gòu)。
概念圖相對于心智圖更趨近于結(jié)構(gòu)平面化。心智圖表述個體思維路線,具有明顯的層次性;概念圖表示的是知識網(wǎng)絡(luò),包含概念節(jié)點及概念節(jié)點之間的關(guān)系,具有網(wǎng)狀結(jié)構(gòu)。
概念圖各節(jié)點之間的聯(lián)系帶有連接詞,明顯地表示了概念節(jié)點之間的邏輯關(guān)系,具有較強的嚴(yán)謹(jǐn)性;心智圖主題節(jié)點之間沒有嚴(yán)格的連接詞,聯(lián)系的形成來自聯(lián)想和想象,動態(tài)性高。
4思維導(dǎo)向數(shù)據(jù)挖掘
當(dāng)前,數(shù)據(jù)挖掘越來越多地借鑒心理學(xué)中關(guān)于認(rèn)知心理學(xué)的觀點,使得計算機挖掘數(shù)據(jù)、學(xué)習(xí)知識的過程更貼近人類的認(rèn)識、學(xué)習(xí)和思維過程。原有的數(shù)據(jù)挖掘算法從數(shù)據(jù)本身出發(fā),研究數(shù)據(jù)結(jié)構(gòu)特點,極少考慮人的主觀因素,挖掘結(jié)果客觀性強,缺乏個性化特征。在目前個性化定制逐漸成為一種趨勢的情況下,挖掘主體的主觀思維特征和知識體系結(jié)構(gòu)逐漸成為數(shù)據(jù)挖掘所要考慮的重要因素。心智圖和概念圖是刻畫人類個體思維路線和知識體系結(jié)構(gòu)的有力工具。基于心智圖和概念圖的數(shù)據(jù)挖掘?qū)⒔鉀Q數(shù)據(jù)挖掘算法缺乏個性化特征的問題。思維導(dǎo)向的數(shù)據(jù)挖掘是在基于心智圖和概念圖所構(gòu)成的拓?fù)浣Y(jié)構(gòu)基礎(chǔ)上,對歷史決策數(shù)據(jù)計算分析,描述決策主體對某一問題進行思考時所傾向的思維方式和相關(guān)知識經(jīng)驗的分析方法。
4.1 思維導(dǎo)向數(shù)據(jù)挖掘相關(guān)概念
(1)心智概念圖
心智概念圖是具有層次性的有向圖,它以主題為節(jié)點,以表示主體聯(lián)想和想象的弧連接下一級主題節(jié)點。心智概念圖是思維導(dǎo)向數(shù)據(jù)挖掘所依賴的拓?fù)浣Y(jié)構(gòu),是整個挖掘過程的基礎(chǔ)。
(2)主題節(jié)點
主題節(jié)點在心智概念圖中表示與某一活動相關(guān)的主題。主題節(jié)點根據(jù)主題粒度的不同分為不同的級別。主題節(jié)點包含兩方面信息:主題自身信息(主題名稱、類型和級別等)和相關(guān)概念知識集。
(3)主題關(guān)聯(lián)度
主題關(guān)聯(lián)度指上級主題與下級主題之間的關(guān)聯(lián)程度,用以計算最大思維路徑。
(4)主題相似度
主題相似度指同級主題之間的相似程度,用以計算相似主題簇群。
(5)思維路徑
思維路徑是指從最高級主題節(jié)點到最低級主題節(jié)點所遍歷的各個節(jié)點,表示主體的思維路線。
(6)最頻繁思維路徑
最頻繁思維路徑是指所有的思維路徑中,總的主題關(guān)聯(lián)度最大的思維路徑,表示主體最習(xí)慣的思維路線,即主體對某一問題最可能的思維方式。
(7)相關(guān)概念
相關(guān)概念是指每一條思維路徑上所有主題節(jié)點的概念知識集中所有概念知識的集合。這個集合稱為該思維路徑的相關(guān)概念。
(8)最大相關(guān)概念
最大相關(guān)概念是指最大思維路徑上所有主題節(jié)點的概念知識集中頻繁出現(xiàn)的概念知識的集合。這個集合稱為最大相關(guān)概念。
4.2 心智概念圖的構(gòu)成
基于心智圖和概念圖的心智概念圖為有層次的有向圖。節(jié)點為主題節(jié)點,包含主題信息和相關(guān)概念知識信息。主題節(jié)點根據(jù)所表示的主題粒度分為多級。上下級主題節(jié)點之間的弧表示主題間主體的想象和聯(lián)系,以主題關(guān)聯(lián)度表示。主題關(guān)聯(lián)度越大,表示主體越容易由上級主題聯(lián)想到下級主題,即表示主體所傾向的思維方式。隨著主題粒度的不斷細(xì)分,心智概念圖的層級不斷深入,相關(guān)主題構(gòu)成了思維路徑。心智概念圖是以主題為節(jié)點,以上下級主題之間的關(guān)聯(lián)關(guān)系和同級主題之間的相似關(guān)系為邊,表示人類對某一問題思維的全息圖景。
心智概念圖的構(gòu)成算法如下:
輸入:主題列表Z、概念列表G,距離閾值δ
輸出:心智概念圖
算法:
Step 1:定義主題節(jié)點集B={bj},j = 1,2,…,m;bj包含主題信息和主題相關(guān)概念列表兩個屬性。
Step 2:取主題列表Z中主題zi,將其賦給bj的主題屬性;遍歷概念知識列表G,找出與zi相關(guān)的概念,將其放入bj的主題相關(guān)概念列表;j + 1,重復(fù)此步,直至主題列表中全部主題放入主題節(jié)點集中。
Step 3:計算主題節(jié)點集中同級兩兩主題節(jié)點間的距離。
Step 4: 計算得到距離與距離閾值δ相比較。如果距離大于距離閾值δ,主題節(jié)點集中相應(yīng)同級兩個主題節(jié)點的距離置為空;如果距離小于距離閾值δ,主題節(jié)點集中相應(yīng)同級兩個主題節(jié)點的距離置為計算得出的距離。
Step 5: 計算主題節(jié)點集中相鄰兩級兩兩主題節(jié)點間的關(guān)聯(lián)度。
Step 6: 重復(fù)步驟3、4、5,直至所有主題節(jié)點放入心智概念圖。
4.3 思維導(dǎo)向數(shù)據(jù)挖掘算法
心智概念圖形成后,思維導(dǎo)向數(shù)據(jù)挖掘方法根據(jù)此種拓?fù)浣Y(jié)構(gòu)計算分析主體對問題的思維方式和思維過程中所關(guān)聯(lián)的概念知識和已有經(jīng)驗。挖掘過程分為兩個部分:計算關(guān)聯(lián)主題簇群和計算最頻繁思維路徑。
(1)計算關(guān)聯(lián)主題簇群
首先,對最高級主題進行聚類,聚合成概念強相關(guān)的主題簇群,然后,求取聚類后某一主題簇群中的主題與下一級主題之間的關(guān)聯(lián)度,得出下一級的相關(guān)主題集。對相關(guān)主題集進行聚類,上級主題類與下級主題類之間的關(guān)聯(lián)度為類內(nèi)關(guān)聯(lián)度的最大值。重復(fù)以上過程,直至主題節(jié)點粒度最小。
(2)計算最頻繁思維路徑
采用尋徑算法找出主題簇群間的最短路徑。
計算最頻繁思維路徑后,合并最頻繁思維路徑上主題節(jié)點的概念知識集,形成新的概念知識集合。
思維導(dǎo)向數(shù)據(jù)挖掘算法如下:
輸入:心智概念圖,主題粒度;
輸出:最頻繁思維路徑P和概念知識集G。
算法:
Step 1:根據(jù)輸入的主題粒度確定主題節(jié)點級別L;
Step 2:將所有級別為L的主題節(jié)點放入節(jié)點集G中;
Step 3:對節(jié)點G中的主題節(jié)點進行聚類,將相似的主題節(jié)點聚成主題簇群ci;
Step 4:將主題簇群放入簇群集C中;
Step 5:計算每一主題簇群ci中的所有主題節(jié)點在級別L + 1的主題節(jié)點的相關(guān)主題節(jié)點集ti;
Step 6:將相關(guān)主題節(jié)點集ti進行聚類,將相似的主題節(jié)點聚成主題簇群cj,ci與cj的關(guān)聯(lián)度取類內(nèi)關(guān)聯(lián)度最大值;
Step 7:將主題簇群cj放入簇群集C中;
Step 8:L = L+1;
重復(fù)步驟5、6、7、8,直至達到主題節(jié)點最低層。
Step 9:計算簇群集C中總的主題節(jié)點關(guān)聯(lián)度最大的路徑作為最頻繁思維路徑P,計算最頻繁思維路徑P上所有主題節(jié)點的概念知識集中頻繁出現(xiàn)的概念知識的并集D。
Step 10:輸出最頻繁思維路徑P和概念知識集D。
5實 驗
實驗通過如表1主題節(jié)點表和表2主題節(jié)點間相關(guān)度表所示的模擬數(shù)據(jù)對上述算法加以說明。經(jīng)過計算,最終得出兩條最頻繁思維路徑{1,3,5}→{10,13}→{20}和{2,4,6,7}→{12,13}→{18},其中,{1,3,5}→{10,13}→{20}思維路徑中,{1,3,5}、{10,13}和{20}表示主題簇群,在實際中代表相似的主題集合,整個思維路徑表示由主題簇群{1,3,5}最容易聯(lián)想到主題簇群{10,13}進而聯(lián)想到主題簇群{20},其概念知識集為{1,2,3,6,7,8,11,12,15,16,17,
18,22,25}。思維路徑{2,4,6,7}→{12,13}→{18}代表含義同上,其概念知識集為{4,6,9,10,11,12,14,15,
17,18,20,22,24,25}。
6小 結(jié)
思維導(dǎo)向數(shù)據(jù)挖掘以心智概念圖為拓?fù)浣Y(jié)構(gòu),計算分析主體對某些問題的決策過程數(shù)據(jù),得出主體的思維方式和分析問題時常用的概念知識和經(jīng)驗,對知識管理和評價標(biāo)準(zhǔn)的制定具有重大意義。思維導(dǎo)向數(shù)據(jù)挖掘的關(guān)鍵在于心智概念圖的建立。只有正確建立心智概念圖,準(zhǔn)確表示主體對問題的思維方式,才能使思維導(dǎo)向數(shù)據(jù)挖掘具有現(xiàn)實意義。
主要參考文獻
[1]車偉堅,徐曉東.概念圖與思維導(dǎo)圖及其應(yīng)用中的異同辨析[C]//第五屆教育技術(shù)國際論壇論文集——教育技術(shù)的創(chuàng)新發(fā)展與服務(wù).武漢:華中師范大學(xué)出版社,2006:357-361.
[2]沈建強.概念圖與思維導(dǎo)圖的比較[J].浙江現(xiàn)代教育技術(shù),2007(4).
Thinking-oriented Data Mining Method
CHEN Xue-chang
( School of Economics and Management, University of Science and Technology Beijing, Beijing 100083,China)
Abstract: The object of thinking-oriented data mining is the decision-making data in the management process before. The thinking-oriented data mining relies on the topology which is called the mind-concept map. There are two phases in the thinking-oriented data mining: computing the clusters of related subjects and calculating the most frequent thinking path. In this paper, the mind-concept map is structured based on the mind map and the concept map, and according to the mind-concept map, the thinking-oriented data mining algorithms is put forward.
Key words: Thinking-oriented Data Mining; Mind Map; Concept Map; Thinking Path