国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于粒度原理的知識(shí)組織模型構(gòu)建*

2013-08-11 03:51徐緒堪鄭昌興
圖書與情報(bào) 2013年6期
關(guān)鍵詞:粒度聚類關(guān)聯(lián)

徐緒堪 鄭昌興 蔣 勛

(1.南京大學(xué)信息管理學(xué)院 江蘇南京 210093)

(2.河海大學(xué)信息管理系 江蘇常州 213022)

1 引言

隨著信息技術(shù)飛速發(fā)展,產(chǎn)生的各類信息爆炸式增長(zhǎng),形成海量信息或者大數(shù)據(jù),然而,人們要從海量數(shù)據(jù)中獲取所需要的信息顯得更加困難,特別是用戶在解決實(shí)際問題時(shí),收集來的信息雖與待解決問題相關(guān),但無法直接形成問題解答,由于這些信息分散、混沌和無序的狀態(tài),導(dǎo)致可利用的知識(shí)增加不多,用戶解決問題感到費(fèi)時(shí),無法得到滿意解答,信息爆炸與問題的解答相對(duì)匱乏的矛盾日益突出,如何有效解決這一矛盾是提供知識(shí)服務(wù)質(zhì)量和效率的關(guān)鍵。要解決這一矛盾,需要從海量數(shù)據(jù)中獲取有價(jià)值的信息后,對(duì)獲取的信息進(jìn)行知識(shí)點(diǎn)提取和知識(shí)關(guān)聯(lián),并對(duì)各類知識(shí)進(jìn)行分類和聚類,按照不同粒度大小的知識(shí)對(duì)象進(jìn)行探討,且在不同粒度上進(jìn)行問題的求解。

粒度的思想無處不在,粒度原理是一種看待客觀世界的世界觀和方法論,利用粒度原理的思想思考問題,提供問題解決的質(zhì)量和效率,從不同側(cè)面、不同角度分析問題現(xiàn)狀、關(guān)聯(lián)、推理,從而有利于問題的求解。首先需要獲取所需數(shù)據(jù)和信息,并經(jīng)過科學(xué)處理、整理、關(guān)聯(lián)形成靜態(tài)知識(shí)網(wǎng),以不同粒度大小的知識(shí)體現(xiàn),實(shí)現(xiàn)數(shù)據(jù)知識(shí)化;其次根據(jù)用戶提出的問題進(jìn)行靜態(tài)知識(shí)用戶問題的動(dòng)態(tài)關(guān)聯(lián)和分析,結(jié)合知識(shí)粒度大小動(dòng)態(tài)形成支撐問題解決的知識(shí)網(wǎng),實(shí)現(xiàn)知識(shí)有序化,最終為用戶提供高效的知識(shí)服務(wù),并促進(jìn)知識(shí)利用、共享、傳播和增值。

總之,在用戶問題的驅(qū)動(dòng)下,在知識(shí)組織的框架下,在粒度原理的支撐下,為解決用戶問題、實(shí)現(xiàn)高效知識(shí)服務(wù)為目標(biāo),知識(shí)組織是基礎(chǔ),粒度原理是手段,如何對(duì)知識(shí)組織實(shí)現(xiàn)數(shù)據(jù)知識(shí)化、知識(shí)有序化以及知識(shí)服務(wù)化。

2 相關(guān)文獻(xiàn)評(píng)述

美國數(shù)學(xué)家Zadeh在模糊集合論的基礎(chǔ)上,首次提出模糊信息?;驮~計(jì)算理論,明確人類認(rèn)知的三個(gè)基本概念:?;?、組織和因果,粒化指將整體分解為部分,組織指從部分合并為整體,因果則指原因和結(jié)果的關(guān)聯(lián),推動(dòng)了模糊邏輯理論及其應(yīng)用的發(fā)展,但在當(dāng)時(shí)未引起普遍的重視。1985年,Hobbs提出一種粒度理論,在人工智能中將一個(gè)表示待求解問題的邏輯公式用粒度理論方法分解成若干個(gè)小問題或子公式,并分別對(duì)這些小問題或子公式求解,最后得到問題的整體求解,并構(gòu)建相應(yīng)模型,不僅實(shí)現(xiàn)把較大的整體粒度拆成較小的局部粒度,也可以從較小的粒度合并成整體粒度解。

J.R.Hobbs從概念與知識(shí)的關(guān)系角度揭示了知識(shí)的粒度特性,說明抽象程度不同的知識(shí)之間存在聯(lián)系,但沒有具體給出表示這種聯(lián)系的方法,所以無法應(yīng)用于問題解決。卜東波、白碩、李國杰從信息粒度的角度來剖析聚類和分類技術(shù),利用信息粒度原理的框架來統(tǒng)一聚類和分類,在一個(gè)統(tǒng)一的粒度下進(jìn)行聚類計(jì)算,而在不同的粒度下進(jìn)行分類計(jì)算。王國胤、張清華對(duì)不同粒度知識(shí)不確定性的探討,發(fā)現(xiàn)在分層遞階的知識(shí)粒度下部分已有研究成果中的規(guī)律不一定符合人們的認(rèn)識(shí)規(guī)律。從信息熵的角度提出了一種粗糙集不確定性的模糊度度量方法,證明了這種模糊度隨知識(shí)粒度的減小而單調(diào)遞減,彌補(bǔ)了現(xiàn)有粗糙熵和模糊度度量粗糙集不確定性的不足,分析了在不同知識(shí)粒度下粗糙度和模糊度的變化關(guān)系,其側(cè)重點(diǎn)探討的是知識(shí)粒度下的特征變化,與知識(shí)組織融合沒有涉及,所以無法直接為用戶解決問題。馮琴榮、苗奪謙、程昳等對(duì)知識(shí)粒度定量劃分和表示進(jìn)行研究,提出一種知識(shí)表示法劃分粒度表示法,利用劃分粒度可定量表示知識(shí)的分類能力,首先分析粗糙集理論中知識(shí)的代數(shù)表示,其次定義知識(shí)的劃分粒度并研究它的性質(zhì),最后證明知識(shí)的代數(shù)表示和粒度劃分是等價(jià)的,為知識(shí)的粒度表示提供借鑒和參考,但局限于知識(shí)粒度化本身的研究,缺乏與知識(shí)組織其他過程關(guān)聯(lián)。

蔣黎黎、梁坤、葉爽為了解決分布和多源知識(shí)的融合與創(chuàng)新問題,提出受控分眾分類法,分類結(jié)果提高了知識(shí)資源的標(biāo)注精度,降低了知識(shí)組織成本。此外,為了消除本體模塊間的異構(gòu),構(gòu)建語義一致的領(lǐng)域本體,將粒度計(jì)算理論引入知識(shí)融合領(lǐng)域,提出微商空間法,對(duì)本體模塊進(jìn)行分解與重構(gòu),結(jié)果使得構(gòu)建的領(lǐng)域本體更加簡(jiǎn)潔和語義一致,這些過程中運(yùn)用的粒度思想模仿人類思考問題的方式。 趙昌葆以工程知識(shí)為背景,以問題求解為目的,建立基于粒度知識(shí)的綜合求解方法,提出概念模型、應(yīng)用模型與解釋模型三層次集成的工程知識(shí)管理模型,并在工藝設(shè)計(jì)方面進(jìn)行實(shí)踐應(yīng)用,但知識(shí)管理模型主要側(cè)重顯性工程知識(shí)組織和推理,對(duì)于特定工程領(lǐng)域有待融入情景和專家經(jīng)驗(yàn)知識(shí),跨領(lǐng)域知識(shí)集成和運(yùn)用,解決工程問題的求解有待進(jìn)一步優(yōu)化。楊人子、嚴(yán)洪森針對(duì)知識(shí)化制造系統(tǒng)自重構(gòu)中知識(shí)網(wǎng)檢索方法過于主觀以及重復(fù)檢索和運(yùn)算等問題,提出基于信息粒度的知識(shí)網(wǎng)的模糊分類和檢索方法,解決了自重構(gòu)運(yùn)算導(dǎo)致的知識(shí)網(wǎng)存在多樣性的問題,考慮知識(shí)網(wǎng)在“質(zhì)”、“量”和復(fù)雜性等方面的差異,按照用戶需求,將知識(shí)網(wǎng)庫中的知識(shí)網(wǎng)進(jìn)行聚類,使得最終新知識(shí)網(wǎng)的復(fù)雜性降低,而且可以得到目標(biāo)知識(shí)網(wǎng)滿意度的排序,有效提高分類的正確率,消除聚類結(jié)果和先驗(yàn)知識(shí)之間的主客觀不諧調(diào)性,但聚類模型中相似性測(cè)度函數(shù)的不同影響聚類結(jié)果的唯一性,對(duì)知識(shí)網(wǎng)間的完善度和匹配度的獲得科學(xué)性有待進(jìn)一步改善。

國內(nèi)外學(xué)者對(duì)知識(shí)組織理論和體系也進(jìn)行大量研究,DAHLBERG在 ISKO20 年紀(jì)念大會(huì)上提出了知識(shí)組織迫切需要解決的10個(gè)問題。特別強(qiáng)調(diào)注意概念(知識(shí)單元),概念層(詞,術(shù)語,編碼)以及詞句層的識(shí)別和表示。張文亮、徐躍權(quán)從微觀、中觀和宏觀三個(gè)層次全面系統(tǒng)地理解和解釋知識(shí)組織的概念和理論體系,通過知識(shí)發(fā)現(xiàn)、知識(shí)描述最終實(shí)現(xiàn)知識(shí)的表達(dá)、共享與創(chuàng)新。賀德方從知識(shí)組織體系的構(gòu)建和應(yīng)用角度,對(duì)知識(shí)組織體系之間的轉(zhuǎn)化、映射以及標(biāo)準(zhǔn)化等方面研究成果進(jìn)行梳理和總結(jié),認(rèn)為用戶參與和用戶使用優(yōu)先是知識(shí)組織的趨勢(shì)。畢強(qiáng)分析知識(shí)組織系統(tǒng)的相關(guān)研究成果并揭示知識(shí)組織系統(tǒng)構(gòu)建從機(jī)器可讀到機(jī)器可理解的發(fā)展趨勢(shì)。王曰芬等研究了面向個(gè)性化服務(wù)的知識(shí)組織機(jī)制,將用戶需求和用戶隱性知識(shí)納入其中,形成了個(gè)性化服務(wù)的知識(shí)組織的過程和方法。夏立新等從行為學(xué)角度研究政務(wù)門戶知識(shí)組織,對(duì)不同類型的信息用戶提供相應(yīng)類型的個(gè)性化服務(wù),形成面向用戶特征信息服務(wù)和知識(shí)門戶相結(jié)合的政務(wù)門戶系統(tǒng)。

通過以上分析可以看出,國外內(nèi)學(xué)者對(duì)粒度原理的研究主要集中在粒度概念、理論、粒度計(jì)算、信息粒度化、粒度聚類/分類等方面,對(duì)知識(shí)組織的研究則集中在知識(shí)組織的概念和理論研究,雖有利用粒度原理來組織知識(shí),但大多集中在詞計(jì)算、具體工程領(lǐng)域知識(shí)的粒度化等方面,缺乏借助粒度原理在知識(shí)組織全過程中分析知識(shí)的粒度變化規(guī)律,雖有基于粒度的知識(shí)融合等成果中提出宏觀的組織體系,但缺乏對(duì)知識(shí)組織的實(shí)踐指導(dǎo)。因此,本文在知識(shí)組織理論和方法基礎(chǔ)上,借助粒度原理對(duì)知識(shí)組織宏觀構(gòu)架,以解決用戶問題為出發(fā)點(diǎn),將粒度原理思想貫穿于知識(shí)組織全過程,規(guī)范知識(shí)粒度化,探討知識(shí)組織各個(gè)環(huán)節(jié)上知識(shí)的粒度變化規(guī)律,構(gòu)建知識(shí)粒度模型,形成靜態(tài)知識(shí)組織和動(dòng)態(tài)知識(shí)組織兩級(jí)知識(shí)組織模式,為用戶問題解決提供有效解決路徑,從而實(shí)現(xiàn)知識(shí)服務(wù)的目的。

3 粒度化分類和聚類準(zhǔn)備

粒度本來是物理學(xué)中的概念,國內(nèi)學(xué)者運(yùn)用粒度原理模仿人思考的不確定性優(yōu)勢(shì),已經(jīng)應(yīng)用到知識(shí)管理中,把問題?;螅?jīng)過粗細(xì)粒度的反復(fù)迭代,用低成本的、足夠滿意的近似解替代精確解,從而更好地認(rèn)識(shí)和刻畫世界。在數(shù)據(jù)知識(shí)化、知識(shí)有序化以及知識(shí)服務(wù)化等過程中都面臨不同顆粒度知識(shí)之間分類和聚類的不確定性問題,因此對(duì)知識(shí)進(jìn)行顆?;m用于面向知識(shí)服務(wù)的知識(shí)組織,選擇一種合適的知識(shí)粒度劃分算法影響著知識(shí)重用、檢索、推理、共享等應(yīng)用效果,所以有必要在進(jìn)行知識(shí)組織之前,對(duì)知識(shí)的粒度化進(jìn)行充分準(zhǔn)備。

對(duì)于采集各類信息或者知識(shí),為了有效地管理和運(yùn)用,需要對(duì)知識(shí)進(jìn)行預(yù)處理和分析,由于知識(shí)本身具有不確定性和不規(guī)范性等特點(diǎn),而在實(shí)際應(yīng)用過程中需要具備智能化檢索和分析,采用粒度的方法對(duì)知識(shí)進(jìn)行分類等預(yù)處理,將知識(shí)逐步顆?;瑒澐譃椴煌笮〉念w粒,并通過知識(shí)粒度度來度量,知識(shí)粒度即是是對(duì)信息和知識(shí)細(xì)化的不同層次的度量,通過知識(shí)粒度有助于非結(jié)構(gòu)化知識(shí)形式化,由于不同粒度的知識(shí)是具有推理的、類似性和相似性的數(shù)據(jù)集合,攜帶有充分的概念性句子,可以幫助人們了解數(shù)據(jù)中存在的有意義的聯(lián)系,其中粒度較大的知識(shí)轉(zhuǎn)化成粒度較小的知識(shí)的過程即為 “加細(xì)”,可以幫助用戶得到更加具體和詳細(xì)的檢索結(jié)果;粒度較小的知識(shí)轉(zhuǎn)化成粒度較大的知識(shí)的過程稱為 “加粗”,可以提高檢索效率。

3.1 知識(shí)粒度概念界定

任一粒度大小的知識(shí)都由內(nèi)部屬性、外部屬性以及情景屬性三部分構(gòu)成,其中內(nèi)部屬性主要是該粒度知識(shí)內(nèi)部關(guān)聯(lián)的描述,外部屬性是該粒度知識(shí)與其他知識(shí)關(guān)聯(lián)的描述,情景屬性是在特定環(huán)境下與外部情景關(guān)聯(lián)的描述。以下結(jié)合粒度原理給出知識(shí)粒度相關(guān)定義。

定義2(粒度知識(shí)的構(gòu)成):任一粒度的知識(shí)主要包括粒度知識(shí)的概念與屬性、功能和關(guān)聯(lián)三個(gè)方面。其中概念與屬性主要是描述粒度知識(shí)的定義和具有屬性特征,功能是粒度知識(shí)所能解決問題的描述,關(guān)聯(lián)包括粒度知識(shí)內(nèi)部、不同粒度知識(shí)之間以及特定情景粒度知識(shí)的關(guān)聯(lián)的描述。

定義3(粒度知識(shí)的粗細(xì)):設(shè)R表示由論域U上一切等價(jià)關(guān)系組成的集合,設(shè)R,R∈R,如果對(duì)于任意的x,y∈U,都有 xRy?xRy,那么就稱 R比 R細(xì),記作 R≤R。

3.2 知識(shí)粒度規(guī)范

知識(shí)粒度化是與所解決問題或子問題相關(guān)聯(lián)或相伴隨的,其目的在于保證知識(shí)粒度能夠適應(yīng)問題解答。因此,知識(shí)粒度的劃分是與待解決問題或子問題的粒度相關(guān)的,知識(shí)粒度的劃分須以能夠向用戶提供所需知識(shí)為準(zhǔn)則,并以正確支撐問題解答為目標(biāo),根據(jù)粒度原理進(jìn)行知識(shí)的粒度表示。在解答用戶問題過程中,根據(jù)知識(shí)粒度將問題分解,從不同粒度層次和不同角度來分析和解決問題,不需要再將所組織的知識(shí)進(jìn)行分解或重構(gòu),知識(shí)的大小(粒度)能恰當(dāng)?shù)亟獯甬?dāng)前問題。欲實(shí)現(xiàn)這些目標(biāo),需要為知識(shí)粒度的劃分和知識(shí)粒度化制定規(guī)范,這些規(guī)范主要包括文獻(xiàn)著錄規(guī)范、文獻(xiàn)標(biāo)引規(guī)范、知識(shí)表示規(guī)范以及知識(shí)融合規(guī)范四部分。文獻(xiàn)著錄規(guī)范是對(duì)文獻(xiàn)著錄的原則、內(nèi)容、格式等方面進(jìn)行統(tǒng)一科學(xué)的規(guī)范,實(shí)現(xiàn)文獻(xiàn)著錄標(biāo)準(zhǔn)化;文獻(xiàn)標(biāo)引規(guī)范是為了方便文獻(xiàn)檢索和引用,對(duì)文獻(xiàn)的引用制定統(tǒng)一的分類標(biāo)引和主題標(biāo)引等標(biāo)引規(guī)范;知識(shí)表示規(guī)范是對(duì)知識(shí)的屬性、關(guān)系以及使用過程等按照統(tǒng)一規(guī)范進(jìn)行編碼或表示,主要包括敘述性和過程性表示;知識(shí)融合規(guī)范是對(duì)異構(gòu)知識(shí)按照一定規(guī)范進(jìn)行知識(shí)轉(zhuǎn)換、重新、共享和集成,并按照統(tǒng)一規(guī)范表示產(chǎn)生的新知識(shí)。

4 基于粒度原理的知識(shí)組織過程

為了滿足新形勢(shì)下用戶對(duì)知識(shí)組織的需求,提高知識(shí)服務(wù)質(zhì)量,有必要分析傳統(tǒng)知識(shí)組織方式存在問題和不足,首先在傳統(tǒng)知識(shí)組織中采用統(tǒng)一知識(shí)粒度大小進(jìn)行分類和聚類,由于解答問題中需要不同粗細(xì)粒度的知識(shí)進(jìn)行支撐,所以用戶無法快速獲取個(gè)性化問題的滿意解答,其次各類知識(shí)的語義關(guān)聯(lián)不足,導(dǎo)致對(duì)用戶需求針對(duì)性不強(qiáng),檢索結(jié)果滿意度低,顯然傳統(tǒng)知識(shí)組織無法滿足用戶日益復(fù)雜和全面的需求,同時(shí)急需以用戶為導(dǎo)向的知識(shí)組織來提供高效的知識(shí)服務(wù)。

基于粒度原理的知識(shí)組織過程以服務(wù)用戶為目的,有效解決問題解答過程中相互矛盾的要求,一種是要支持以積累的實(shí)驗(yàn)證據(jù)為基礎(chǔ)而構(gòu)成的細(xì)粒度知識(shí),一種是要滿足粗粒度知識(shí)的較高的特異性,因此為了有效解決知識(shí)組織各階段對(duì)知識(shí)認(rèn)知規(guī)律不確定的問題,系統(tǒng)角度組織各階段的知識(shí),借助粒度原理構(gòu)建知識(shí)粒度模型,知識(shí)組織過程中知識(shí)粒度聚類模型(見圖1),將各類知識(shí)分為知識(shí)元、知識(shí)單元以及源文獻(xiàn)三種主要粒度知識(shí)。最低一層是知識(shí)粒度最細(xì)的知識(shí)元層,主要包括通過采集和獲取形成粒度較多知識(shí),根據(jù)各個(gè)知識(shí)之間關(guān)聯(lián)程度分成粒度群 D-1、D-2、......、D-p,涵蓋用戶知識(shí)需求、情景最基本概念、公式以及事件等,該層次只能解決比較單一的問題。為了解決稍微復(fù)雜的問題需要對(duì)各個(gè)粒度群進(jìn)行聚類形成知識(shí)粒度較楚的知識(shí)單元層,根據(jù)用戶知識(shí)需求不同,通過閾值α來進(jìn)行聚類算法,粒度群D-1、D-2、......、D-p 分別經(jīng)過 FM-1、FM-2、......、FM-p 聚類后形成各類知識(shí)對(duì)應(yīng)的知識(shí)單元 B-1、B-2、......、B-p,包括顯性和隱性知識(shí),通過歸納、選擇、整理和排序形成各個(gè)知識(shí)單元B-i之間的橫向關(guān)聯(lián),從而形成如索引、文摘、題錄等形式的知識(shí),該過程是一個(gè)優(yōu)化組合的過程,知識(shí)元之間的關(guān)聯(lián)并未改變,沒有產(chǎn)生新的知識(shí),將知識(shí)元該層次上的知識(shí)粒度稱為I型知識(shí)粒度。隨著用戶知識(shí)需求日益復(fù)雜化,通過知識(shí)單元無法提供有效地解決用戶問題,需要對(duì)大量知識(shí)單元進(jìn)行分類、推理、挖掘、語義關(guān)聯(lián)等過程形成粒度更大的知識(shí),該過程改變了知識(shí)單元原有聯(lián)系,產(chǎn)生新的知識(shí),形成綜述、百科全書、主題庫、年鑒等形式的知識(shí),即源文獻(xiàn),同時(shí)源文獻(xiàn)也可以向知識(shí)單元反饋各個(gè)知識(shí)單元使用情況,以便為調(diào)節(jié)知識(shí)的顆粒度閾值提供依據(jù),優(yōu)化知識(shí)粒度模型,該層稱為II型知識(shí)粒度。在知識(shí)組織過程中,通過知識(shí)粒度模型,針對(duì)用戶的要求,選擇適應(yīng)的層次和大小的粒度知識(shí)進(jìn)行挖掘和推理,最終形成用戶問題的最優(yōu)解,有助于知識(shí)組織實(shí)現(xiàn)數(shù)據(jù)知識(shí)化、知識(shí)有序化以及知識(shí)服務(wù)化的目標(biāo)。

圖1 知識(shí)組織過程中知識(shí)粒度聚類模型

4.1 靜態(tài)知識(shí)組織

在細(xì)粒度知識(shí)元中通過基本的詞分析和計(jì)算后經(jīng)過若干個(gè)知識(shí)節(jié)點(diǎn),結(jié)合用戶需求和已有各類知識(shí),將獲取的信息和數(shù)據(jù)按照不同類別分成策略知識(shí)、描述知識(shí)和控制知識(shí),這些知識(shí)全部映射為知識(shí)元、知識(shí)單元以及源文獻(xiàn),結(jié)合用戶需求形成靜態(tài)知識(shí)網(wǎng)(見圖2),靜態(tài)知識(shí)網(wǎng)絡(luò)對(duì)已有知識(shí)、文檔材料、經(jīng)驗(yàn)知識(shí)、網(wǎng)絡(luò)資料以及用戶需求等信息通過粒度化形成知識(shí)元、知識(shí)單元以及源文獻(xiàn)等不同粒度知識(shí),這些粒度知識(shí)根據(jù)用戶需求按照不同類知識(shí)提取后形成策略知識(shí)、描述知識(shí)和控制知識(shí)等三類知識(shí)。

4.2 問題分解

用戶問題求解是一個(gè)由問題空間向解空間映射的過程,由于問題的復(fù)雜性及知識(shí)的有限性,無法通過一次映射直接得到問題的解,最常用的方法是“分解法”,即將一個(gè)困難的問題分解為若干個(gè)相對(duì)容易的小問題。具體分解方法如下:

根據(jù)問題的性質(zhì)和本身的層次,將整個(gè)問題逐級(jí)分解的方式分類,分類過程可以按照非均勻粒度標(biāo)準(zhǔn)進(jìn)行,問題域?yàn)镼,則可以分為{Q,Q,....,Q}n各等價(jià)類,這n各等價(jià)類可以根據(jù)需要進(jìn)一步分類,上一級(jí)是下一級(jí)的抽象,下一級(jí)是上一級(jí)的細(xì)化,自底向上逐級(jí)綜合得到整個(gè)問題的解。在工程問題求解中,一般按照功能、過程或結(jié)構(gòu)用經(jīng)驗(yàn)方法分解,本質(zhì)上與人工智能中的 “問題規(guī)約法”一樣,都遵循“分而治之”的策略,是復(fù)雜問題求解的常用方法,但與“問題規(guī)約法”不同,工程問題一般屬于病態(tài)結(jié)構(gòu)問題,不但問題空間與解空間難以確切描述,而且層次之間及同一層次內(nèi)存在大量的、程度不同的耦合關(guān)系,因此需要根據(jù)問題自身的特點(diǎn)確定有效的求解策略。

圖2 靜態(tài)知識(shí)網(wǎng)

4.3 動(dòng)態(tài)知識(shí)優(yōu)化組合

對(duì)于單個(gè)最小粒度的知識(shí)元和不同粒度知識(shí)點(diǎn)無法有效解決用戶的問題,為了達(dá)到這個(gè)目的有必要分析各知識(shí)點(diǎn)之間關(guān)聯(lián)程度和關(guān)聯(lián)性,以便于對(duì)粒度知識(shí)優(yōu)化組合與推理后形成較大粒度的知識(shí),逐步實(shí)現(xiàn)解決用戶的問題的目標(biāo)。粒度知識(shí)優(yōu)化組合主要包括知識(shí)聚類、知識(shí)聚合度量化以及連通性分析等部分。

知識(shí)聚類對(duì)于粒度較小的知識(shí)元按照統(tǒng)一和均勻粒度方式進(jìn)行聚類,使得聚類知識(shí)與先驗(yàn)知識(shí)協(xié)調(diào)起來,通過知識(shí)聚合度來量化知識(shí)之間的關(guān)聯(lián)程度,為了動(dòng)態(tài)優(yōu)化這些知識(shí)提供可供參考的依據(jù)。

粒度知識(shí)聚合度主要描述知識(shí)之間關(guān)聯(lián)程度,即知識(shí)點(diǎn)聚合度:假定對(duì)知識(shí)點(diǎn)M使用的活動(dòng)(Activity)數(shù)目為A(M),同時(shí)使用知識(shí)元M和知識(shí)點(diǎn)M?;顒?dòng)數(shù)目記為A(M,M),則M和 M的聚合度為I(M,M);如果是多個(gè)知識(shí)點(diǎn) M,M,……,M,則聚合度為 I(M,M,……M)。 其中

多個(gè)知識(shí)點(diǎn)的的聚合度表示如下,

一般情況下,從認(rèn)知理論分析同一時(shí)間被使用或激活的知識(shí)點(diǎn)或粒度知識(shí)數(shù)據(jù)不得大于9,粒度知識(shí)之間可以通過活動(dòng)相互作用,是一個(gè)并發(fā)的、自組織的系統(tǒng),按照粒度大小不同分別獲取知識(shí)的聚合度,可以對(duì)用戶不精確的概念給出較清晰的表示,從而更準(zhǔn)確、有效地解決實(shí)際問題。知識(shí)元聚合度主要功能是在大數(shù)據(jù)環(huán)境下實(shí)現(xiàn)知識(shí)共享和運(yùn)用提供關(guān)聯(lián)基礎(chǔ),保持知識(shí)元長(zhǎng)期性、穩(wěn)定性和適合應(yīng)用的多變性,在知識(shí)組織過程中可以動(dòng)態(tài)修改和設(shè)置知識(shí)元的聚合度,并根據(jù)用戶問題進(jìn)行自適應(yīng)聚類和連通,形成粒度大小不同的動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)W{m_,m_,...m_}。

5 結(jié)語

綜上所述,本文以解決用戶問題的目的進(jìn)行知識(shí)組織,借助粒度原理對(duì)知識(shí)粒度概念界定、知識(shí)粒度規(guī)范化等知識(shí)組織準(zhǔn)備,設(shè)計(jì)知識(shí)粒度編碼和映射,并構(gòu)建知識(shí)組織中的知識(shí)粒度模型,將客體知識(shí)通過分類和聚類形成知識(shí)元、知識(shí)單元、文獻(xiàn)源等不同粒度大小的知識(shí),在知識(shí)組織過程中,首先對(duì)靜態(tài)知識(shí)進(jìn)行初步整理、關(guān)聯(lián),其次,結(jié)合對(duì)用戶問題以及分解的若干個(gè)子問題基礎(chǔ)上,對(duì)這些知識(shí)進(jìn)行動(dòng)態(tài)關(guān)聯(lián)、分析和推理等優(yōu)化組合,下一步重點(diǎn)研究將問題解答通過知識(shí)地圖等形式展現(xiàn)給用戶,最終解決用戶的問題,實(shí)現(xiàn)數(shù)據(jù)知識(shí)化、知識(shí)有序化和知識(shí)服務(wù)化目標(biāo)。

[1]Zadeh,L.A.Towards a theory of fuzzy information granu lation and its centrality in human reasoning and fuzzy logic [J].Fuzzy Sets and Systems,1997,(19):111-127.

[2]Hobbs,J.R.Granularity.In:Proc off IJCAI[Z].Los Angeles,1985:432-435.

[3]卜東波,白碩,李國杰.聚類/分類中的粒度原理[J].計(jì)算機(jī)學(xué)報(bào),2002,25(8):810-816.

[4]王國胤,張清華.不同知識(shí)粒度下粗糙集的不確定性研究[J].計(jì)算機(jī)學(xué)報(bào),2008,31(9):1588-1598.

[5]馮琴榮,苗奪謙,程昳等.知識(shí)的劃分粒度表示法[J].模式識(shí)別與人工智能,2009,22(1):64-69.

[6]蔣黎黎,梁坤,葉爽.基于粒度計(jì)算理論的知識(shí)融合模型研究[J].計(jì)算機(jī)應(yīng)用研究,2012,29(10):3697-3700.

[7]徐麗,丁世飛.粒度聚類算法研究[J].計(jì)算機(jī)科學(xué),2011,38(8):25-28.

[8]趙昌葆.工程知識(shí)粒度化技術(shù)及其應(yīng)用研究[D].西安:西北工業(yè)大學(xué),2006.

[9]楊人子,嚴(yán)洪森.基于信息粒度的知識(shí)網(wǎng)的模糊分類與檢索方法[J].自動(dòng)化學(xué)報(bào),2011,37(5):585-595.

[10]DAHLBERG,Brief Communication:How to Improve ISKO's Standing:Ten Desiderata for Knowledge Orga nization[J].Knowledge organization 2011,38(1):68-74.

[11]張文亮,徐躍權(quán).論知識(shí)組織的三個(gè)層次[J].圖書情報(bào)工作,2011,(1):41-45.

[12]賀德方.國內(nèi)外知識(shí)組織體系的研究進(jìn)展及應(yīng)對(duì)策略[J].情報(bào)學(xué)報(bào),2010,29(6):963-972.

[13]畢強(qiáng).數(shù)字圖書館知識(shí)組織系統(tǒng)建構(gòu)的發(fā)展趨勢(shì)——從機(jī)器可讀到機(jī)器可理解[J].國家圖書館學(xué)刊,2010,19(1):12-19.

[14]王曰芬,熊銘輝,吳鵬.面向個(gè)性化服務(wù)的知識(shí)組織機(jī)制研究[J].情報(bào)理論與實(shí)踐,2008,(1):7-11.

[15]夏立新,葉飛.行為學(xué)角度的政務(wù)門戶知識(shí)組織與整合研究[J].情報(bào)學(xué)報(bào),2011,28(3):331-336.

[16]劉晨,殷國富,龍紅能.制造工藝知識(shí)粒度描述方法與獲取算法研究[J].計(jì)算機(jī)集成制造系統(tǒng),2008,14(10):1966-1973.

[17]Witold Pedrycz BR,Giancarlo Succi.Knowledge trans fer in system modeling and its realization through an optimal allocation of information granularity[J].Applied Soft Computing,2012,(12):1985-1995.

[18]徐毅.粗細(xì)粒度雙知識(shí)網(wǎng)映射的零部件設(shè)計(jì)重用方法[D].大連:大連理工大學(xué),2012.

[19]王秀珍,鐘寧,劉椿年,等.基于信息粒度和連通強(qiáng)度的優(yōu)化學(xué)習(xí)[J].計(jì)算機(jī)工程與科學(xué),2010,32(5):45-47.

猜你喜歡
粒度聚類關(guān)聯(lián)
基于數(shù)據(jù)降維與聚類的車聯(lián)網(wǎng)數(shù)據(jù)分析應(yīng)用
基于模糊聚類和支持向量回歸的成績(jī)預(yù)測(cè)
基于屬性特性算法的商品推薦系統(tǒng)模型
奇趣搭配
拼一拼
情感粒度
基于密度的自適應(yīng)搜索增量聚類法
智趣
油田碎屑巖粒度分布情況測(cè)定中激光粒度分析儀應(yīng)用的價(jià)值
試論棋例裁決難點(diǎn)——無關(guān)聯(lián)①