国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Agent技術(shù)的數(shù)據(jù)挖掘系統(tǒng)

2009-02-11 10:02
新媒體研究 2009年1期
關(guān)鍵詞:異質(zhì)子系統(tǒng)分布式

鄧 悅

[摘要]針對已有的數(shù)據(jù)挖掘系統(tǒng)缺乏智能性,分析基于Agent的數(shù)據(jù)挖掘技術(shù)的優(yōu)勢,提出基于Agent的智能數(shù)據(jù)挖掘系統(tǒng)。把Agent本身的特點自然地引入到數(shù)據(jù)挖掘中,使整個挖掘過程具有智能性。

[關(guān)鍵詞]Agent 數(shù)據(jù)挖掘

中圖分類號:TP3 文獻標(biāo)識碼:A 文章編號:1671-7597(2009)01101062-01

一、引言

近幾年來,信息在社會發(fā)展中的關(guān)鍵地位得到越來越多的關(guān)注。而在復(fù)雜的網(wǎng)絡(luò)中蘊涵著巨大潛在價值的知識,為使人們獲取信息,一種從大量數(shù)據(jù)中自動獲取顯式知識的技術(shù) 數(shù)據(jù)挖掘技術(shù)日漸發(fā)展,并在很多領(lǐng)域得到了廣泛應(yīng)用。

二、基于Agent的數(shù)據(jù)挖掘的優(yōu)勢

WWW的規(guī)模越來越大,其增長并無組織秩序,使得數(shù)據(jù)趨向于分布在不同地域的、異構(gòu)異質(zhì)的數(shù)據(jù)庫和Web網(wǎng)頁中。要從不同地域、不同結(jié)構(gòu)的數(shù)據(jù)庫中挖掘出有用信息(知識),如果只是簡單地把異構(gòu)異質(zhì)的數(shù)據(jù)庫進行集中挖掘是不妥當(dāng)?shù)模驗檫@種集中式的數(shù)據(jù)挖掘要求所有被挖掘的數(shù)據(jù)必須存放在一個單一的、集中的數(shù)據(jù)倉庫中。因此,即使是在數(shù)據(jù)分布式存儲的情況下,也要求把這些數(shù)據(jù)收集到一個集中的地方。這導(dǎo)致網(wǎng)絡(luò)無法負載大量的數(shù)據(jù),而使網(wǎng)絡(luò)的響應(yīng)時間延長,數(shù)據(jù)的私有性和安全性被破壞。Agent是由分布式人工智能發(fā)展而來的一種新型計算機模型,具有獨立的智能性,在構(gòu)造分布式系統(tǒng)方面具有獨特的,較常規(guī)的數(shù)據(jù)挖掘過程無法比擬的優(yōu)勢。考慮到數(shù)據(jù)的安全性、私有性及自治性,如果將Agent(特別是移動多Agent)和分布式數(shù)據(jù)挖掘結(jié)合起來,則解決了一些常規(guī)數(shù)據(jù)挖掘的局限。

(一)Agent具有智能性和代理能力。智能性是指Agent對所接觸的對象能用推理、學(xué)習(xí)以及其他技術(shù)進行分析和解釋的能力;代理能力是Agent能感知外界發(fā)生的消息,并根據(jù)自己所具有的知識自動地做出反應(yīng)的能力。

(二)對網(wǎng)絡(luò)的依賴性小。移動Agent可以根據(jù)需要,動態(tài)地遷移到數(shù)據(jù)源處執(zhí)行而不是將數(shù)據(jù)移往主機,沒有了傳統(tǒng)數(shù)據(jù)挖掘中數(shù)據(jù)的移動與復(fù)制,避免了大量原始數(shù)據(jù)在網(wǎng)絡(luò)中的流動,節(jié)約了網(wǎng)絡(luò)帶寬,減少了對網(wǎng)絡(luò)的信賴性,同時也降低了數(shù)據(jù)一致性維護的代價。

(三)具有與環(huán)境的交互能力。移動Agent能自動地監(jiān)測、感知環(huán)境。環(huán)境發(fā)生變化時能自動地做出反應(yīng),并與外部環(huán)境交換信息或知識。如主動地通知用戶誰能夠提供其所需的信息,或主動地通知信息提供者誰目前需要其能提供的信息,也就是說可實現(xiàn)“信息找人”的功能,改變一貫地“人找信息”的局面。

(四)具有異步自主執(zhí)行的能力。移動Agent被創(chuàng)建之后,被派遣到網(wǎng)絡(luò)上,獨立于其創(chuàng)建進程,異步自主地完成所肩負的任務(wù)。移動Agent到達目的地工作時可以與網(wǎng)絡(luò)斷開,完成任務(wù)之后再與網(wǎng)絡(luò)相連。

(五)對異構(gòu)平臺的適應(yīng)性。由于數(shù)據(jù)的劇增,數(shù)據(jù)源趨向于分布在不同的計算環(huán)境,不同的硬件和軟件環(huán)境中,這也就造成了數(shù)據(jù)的異質(zhì)平臺環(huán)境。移動Agent獨立特定的主機和傳輸協(xié)議,只信賴于它們的執(zhí)行環(huán)境,不為平臺的異質(zhì)所影響。

(六)并行處理能力。在數(shù)據(jù)庫分布式的環(huán)境下,可以對異地獨立的數(shù)據(jù)進行并行挖掘,通過多Agent之間的協(xié)商與合作進行并行處理,這樣不僅可以提高數(shù)據(jù)挖掘的效率,而且可以增強知識發(fā)現(xiàn)系統(tǒng)的靈活性。

三、基于Agent的數(shù)據(jù)挖掘系統(tǒng)的構(gòu)建

(一)系統(tǒng)構(gòu)建中Agent技術(shù)應(yīng)用原理。多Agent系統(tǒng)是由多個Agent組成的集合,在多Agent系統(tǒng)中,Agent之間以及與環(huán)境之間,通過通信、協(xié)商和協(xié)作來共同完成常規(guī)數(shù)據(jù)挖掘不能解決的問題。在分布式的數(shù)據(jù)源中進行知識的抽取,可以將整個分散的抽取對象看作是一個分布式的系統(tǒng)。而分布式系統(tǒng)的特點是待解決的問題分解為一些子任務(wù),并為每一個子系統(tǒng)設(shè)計一個問題求解的任務(wù)執(zhí)行子系統(tǒng)。 通過交互作用策略,把系統(tǒng)設(shè)計集成為一個統(tǒng)一的整體,每一個子系統(tǒng)并不是在環(huán)境中單獨存在,而是要與其他子系統(tǒng)在同一環(huán)境下協(xié)同工作,協(xié)同的手段是互相通信。由于在從分布式的數(shù)據(jù)庫(源)中發(fā)現(xiàn)知識需要建立一個由多個信息發(fā)現(xiàn)子系統(tǒng)構(gòu)成的協(xié)作系統(tǒng),各子系統(tǒng)之間協(xié)同工作。結(jié)合多Agent技術(shù)的特點,該技術(shù)用于數(shù)據(jù)挖掘系統(tǒng)中,能夠解決傳統(tǒng)數(shù)據(jù)挖掘過程的不足,能較完美地從異構(gòu)、異質(zhì)、異地數(shù)據(jù)庫(源)進行知識抽取。

(二)基于Agent的數(shù)據(jù)挖掘系統(tǒng)?;贏gent技術(shù)的智能數(shù)據(jù)挖掘系統(tǒng)模型,其總體邏輯結(jié)構(gòu)如圖1所示。

1.?dāng)?shù)據(jù)預(yù)處理Agent的功能是完成任務(wù)確定、模型設(shè)計、數(shù)據(jù)分析及數(shù)據(jù)抽取、數(shù)據(jù)處理、數(shù)據(jù)變換。數(shù)據(jù)處理部分一般包括消除無用數(shù)據(jù)、推導(dǎo)缺值數(shù)據(jù)、消除重復(fù)記錄等清洗操作;數(shù)據(jù)變換過程一般包括特征選擇過程和與具體實現(xiàn)有關(guān)的數(shù)據(jù)格式變換過程。

2.人機界面Agent的功能是發(fā)揮人的智能Agent的作用,人為地參與數(shù)據(jù)挖掘過程,高速和加速數(shù)據(jù)挖掘的,而且強調(diào)人機之間的雙向友好交互,不只是人告訴機器去做什么,還要求機器與人通信,告訴人它知道了什么,幫助人去更好地決策。當(dāng)數(shù)據(jù)挖掘Agent發(fā)現(xiàn)了新的知識時,人機界面Agent就會以可視化或自然語言的方式通知人,這不僅要有概念來支持,而且還要有豐富的語法和語義來支持。

3.?dāng)?shù)據(jù)挖掘Agent。數(shù)據(jù)挖掘Agent的功能是完成數(shù)據(jù)模式的識別,即發(fā)現(xiàn)新的模式或規(guī)則。挖掘Agent使用各種挖掘方法分析數(shù)據(jù)庫中的數(shù)據(jù),來為決策Agent提供決策所需的信息。

4.決策Agent。決策Agent利用挖掘 Agent獲得的各種信息進行評價和驗證,進而對證實的結(jié)論和模式進行應(yīng)用。

基于Agent的智能數(shù)據(jù)挖掘系統(tǒng),利用Agent實現(xiàn)信息的收集、預(yù)處理、查詢,知識的自動提取、挖掘等功能,使整個挖掘過程具有知識性、智能性。

參考文獻:

[1]范明、孟小峰等譯,數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機械工業(yè)出版社,2001.

[2]祝玉華、甑彤,基于Agent的分布式空間數(shù)據(jù)挖掘研究[J].微電子學(xué)與計算機,2005.22(6).

[3]王長纓、陳文偉,多Agent的分布協(xié)同強化學(xué)習(xí)算法SE-MACOL及其應(yīng)用[J].廣西師范大學(xué)學(xué)報:自然科學(xué)版,2006.24(4).

作者簡介:

鄧悅,女,河北遵化人,遼工大職業(yè)技術(shù)學(xué)院,講師。

猜你喜歡
異質(zhì)子系統(tǒng)分布式
基于異質(zhì)分組的信息技術(shù)差異化教學(xué)
居民分布式儲能系統(tǒng)對電網(wǎng)削峰填谷效果分析
晉能科技半導(dǎo)體尖端技術(shù)喜獲突破
碳排放對綠色全要素生產(chǎn)率的影響與地區(qū)異質(zhì)效應(yīng)
基于Paxos的分布式一致性算法的實現(xiàn)與優(yōu)化
基于CuO/ZnO異質(zhì)結(jié)納米花的薄膜型丙酮傳感器研究
網(wǎng)絡(luò)空間供應(yīng)鏈中入侵檢測及防御子系統(tǒng)的投資機制研究
網(wǎng)絡(luò)空間供應(yīng)鏈中入侵檢測及防御子系統(tǒng)的投資機制研究
團隊與知識管理的關(guān)系研究
淺談中職學(xué)校新型模塊化機房建設(shè)