国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能在信息檢索中的應(yīng)用

2008-12-29 00:00:00梁滌塵
中國集體經(jīng)濟(jì) 2008年3期


  摘要:文章通過介紹信息檢索領(lǐng)域的基本范式以及人工智能的有關(guān)特點,著重討論了信息檢索領(lǐng)域中的人工智能。
  關(guān)鍵詞:信息檢索;人工智能;基于知識工智能技術(shù)應(yīng)用
  
  一、信息檢索機制及其發(fā)展
  
  信息檢索Information Retrieval(IR)是一門致力于如何對大容量信息進(jìn)行有效地存儲與獲取的科學(xué)。廣義的IR通常是指在一定的技術(shù)設(shè)備環(huán)境條件下,對以某種方式組織的信息資源按其表達(dá)方式,依據(jù)特定用戶的需求,制訂構(gòu)造策略,構(gòu)造檢索表達(dá)方式以實現(xiàn)檢索目標(biāo)過程的總稱。而Information Retrieval System(IRS)則是借助計算機技術(shù)手段來存儲信息以滿足日后信息查詢需要的一種檢索工具。這里的信息可以是文本的、視頻或音頻的,但現(xiàn)行的大多數(shù)的信息檢索系統(tǒng)仍只能以存儲與檢索文本的信息和文獻(xiàn)為主。雖然IR 技術(shù)日新月異,但I(xiàn)R的本質(zhì)自始自終都沒有變,變動的只是信息媒體形式、信息檢索系統(tǒng)IRS的吞吐能力以及IRS存儲與匹配的方法而已。
  
  二、人工智能
  
  近30年來因特網(wǎng)規(guī)模呈幾何級數(shù)飛速發(fā)展,人們迫切需要適合于網(wǎng)絡(luò)時代的先進(jìn)的信息檢索技術(shù)。適應(yīng)快速、準(zhǔn)確地檢索有關(guān)信息,并且能夠從大量的網(wǎng)上數(shù)據(jù)中發(fā)現(xiàn)隱含的、有價值的信息,各種智能檢索技術(shù)、尤其是人工智能技術(shù)浮出水面。人工智能學(xué)科是涉及數(shù)學(xué)、計算機科學(xué)、控制論、心理學(xué)、哲學(xué)等學(xué)科的交叉學(xué)科和邊緣學(xué)科,其應(yīng)用領(lǐng)域包括問題求解、專家系統(tǒng)、機器學(xué)習(xí)、模式識別、自動定理證明、自然語言理解、人工神經(jīng)網(wǎng)絡(luò)和智能檢索等。人工智能用于信息檢索主要有基于本體論、神經(jīng)網(wǎng)絡(luò)、遺傳算法、自然語言理解和ID3算法等的智能檢索方法。
  
  三、人工智能技術(shù)在信息檢索中的應(yīng)用
  
  人工智能研究機器模擬人腦所從事的感覺、認(rèn)知、記憶、學(xué)習(xí)、聯(lián)想、計算、推理、判斷、決策、抽象、概括等思維活動,解決人類專家才能處理的復(fù)雜問題。它的研究和應(yīng)用領(lǐng)域包括問題求解、邏輯推理與定理證明、自然語言理解、自動程序設(shè)計、專家系統(tǒng)、機器學(xué)習(xí)、模式識別、機器視覺、智能控制、智能檢索,以及智能調(diào)度與指揮等。
 ?。ㄒ唬┬畔⑦^濾技術(shù)
  過濾包括兩方面的含義:一是信息檢索技術(shù)中的過濾,一般稱為信息過濾,如搜索引擎過濾,數(shù)據(jù)挖掘等。二是網(wǎng)絡(luò)安全方面的過濾。傳統(tǒng)的過濾主要有基于包的過濾、基于應(yīng)用的過濾和基于文本的過濾等幾種?;谖谋镜倪^濾實現(xiàn)簡單,但缺少靈活性,只能對達(dá)到匹配的文本一刀切,無法對文章的語義進(jìn)行分析。引入了人工智能技術(shù)的智能過濾技術(shù)能夠識別文檔內(nèi)容實現(xiàn)智能化的過濾,同時能減少網(wǎng)絡(luò)管理員維護(hù)過濾系統(tǒng)的負(fù)擔(dān)。神經(jīng)網(wǎng)絡(luò)是人工智能范疇中機器學(xué)習(xí)的一種應(yīng)用,在許多技術(shù)中都有應(yīng)用。
 ?。ǘ┊悩?gòu)信息整合與全息檢索
  異構(gòu)信息檢索技術(shù)發(fā)展的特點包括支持各種格式化文件,如TBXT、HTML、XML、RTF、MS Office、PDF、PS2/PS、MARC、ISO2709等處理和檢索;支持多語種信息的檢索;支持結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一處理;和關(guān)系數(shù)據(jù)庫檢索的無縫集成以及其他開放檢索接口的集成等。所謂“全息檢索”的概念就是支持一切格式和方式的檢索,從目前實踐來講,發(fā)展到異構(gòu)信息整合檢索的層面,基于自然語言理解的人機交互以及多媒體信息檢索整合等方面尚有待取得進(jìn)一步突破。
  
  四、應(yīng)用人工智能算法的視頻圖像檢索系統(tǒng)
  
  目前存在一個新的實現(xiàn)視頻圖像檢索系統(tǒng)的方法。在這個系統(tǒng)中,成熟的人工智能算法將被應(yīng)用到視頻圖像的分類、索引與檢索中。在本系統(tǒng)中,視頻圖像的特征選取包括了顏色直方圖的計算、紋理的分析及應(yīng)用運動跟蹤算法KLT對局部視頻數(shù)據(jù)進(jìn)行運動跟蹤,這些特征構(gòu)成了圖像特征向量。人工智能算法,包括反饋式人工智能神經(jīng)網(wǎng)及自適應(yīng)匹配算法,將會根據(jù)這些特征向量對視頻片斷進(jìn)行分類和檢索。系統(tǒng)的工作區(qū)域是一個二維平面,各種視頻片斷將會根據(jù)特征向量的不同,被人工智能系統(tǒng)聚類到不同的區(qū)域, 從而實現(xiàn)視頻片斷的分類和聚集。用戶在查詢的時候,只要在特定的區(qū)域進(jìn)行放大操作,就可以把視頻檢索限定在一個較小的區(qū)域,從而快速的實現(xiàn)視頻片斷的檢索查詢。具體的工作流程可以分為五個階段:
 ?。ㄒ唬┫到y(tǒng)訓(xùn)練階段
  在這個階段中,系統(tǒng)的人工神經(jīng)系統(tǒng)將被初始化,并且在系統(tǒng)與用戶的交互操作中進(jìn)行訓(xùn)練,使之適應(yīng)具體的圖像特征向量,更好地實現(xiàn)視頻片斷的分類與聚集。
 ?。ǘ┮曨l片斷的聚集操作
  經(jīng)過訓(xùn)練的人工神經(jīng)系統(tǒng)將被應(yīng)用到視頻片斷的聚集分類操作中,具有相似的特征向量的視頻片斷將會被聚集到相近的區(qū)域中,不同的片斷將會被區(qū)域的遠(yuǎn)近程度來區(qū)分開來。
 ?。ㄈ┮曨l片斷的檢索操作
  因為視頻片斷在上一階段已經(jīng)進(jìn)行了分類和聚集,用戶只要在局部區(qū)域進(jìn)行放大檢索操作就可以查詢到所需的視頻片斷。從以上的工作流程可以得知,系統(tǒng)對視頻的分類與檢索有兩個核心的環(huán)節(jié):第一是特征的提取,即如何選取合適的特征用于表征視頻圖像;第二是分類使用的人工智能算法,即根據(jù)提取的視頻特征快速準(zhǔn)確地對視頻圖像進(jìn)行分類和檢索。
 ?。ㄋ模┨卣魈崛∷惴?br/>  本系統(tǒng)應(yīng)用的特征提取算法包括顏色直方圖,用于分析圖像的基本顏色信息,獲得圖像的顏色分布狀況;紋理分析算法,用于圖像模式的分析; 然后對于局部聚集的圖像應(yīng)用運動跟蹤算法KLT,進(jìn)一步提高圖像的分類準(zhǔn)確率。
  (五)用于分類和檢索的人工智能算法
  本系統(tǒng)采用了兩種成熟的人工智能算法:反饋式人工神經(jīng)網(wǎng),利用分類結(jié)果的準(zhǔn)確程度對系統(tǒng)的參數(shù)進(jìn)行反饋式調(diào)節(jié);自適應(yīng)匹配算法,利用輸入向量對最相似的系統(tǒng)向量進(jìn)行調(diào)節(jié)。實驗表明自適應(yīng)匹配算法具有高速準(zhǔn)確的效用。
  
  五、人工智能在網(wǎng)絡(luò)信息檢索中的應(yīng)用
  
  人工智能在網(wǎng)絡(luò)信息檢索中的應(yīng)用,主要表現(xiàn)在:如何利用計算機軟硬件系統(tǒng)模仿、延伸與擴展人類智能的理論、方法和技術(shù)。目前,人工智能在網(wǎng)絡(luò)信息檢索領(lǐng)域的應(yīng)用主要是在以下兩個方面:
  (一)網(wǎng)絡(luò)智能知識服務(wù)系統(tǒng)
  網(wǎng)絡(luò)智能知識服務(wù)系統(tǒng)的設(shè)計開發(fā)是專門為了解決目前網(wǎng)絡(luò)信息資源浩瀚而獲取難的矛盾。網(wǎng)絡(luò)智能知識服務(wù)系統(tǒng)可分為知識采集系統(tǒng)、智能知識處理系統(tǒng)、智能知識服務(wù)系統(tǒng)和知識庫四部分。
  1、知識采集系統(tǒng)。知識采集系統(tǒng)的主要任務(wù)是完成資源的加工整理,完成信息到知識之間的轉(zhuǎn)換功能。
  2、智能知識處理系統(tǒng)。該系統(tǒng)是將采集來的知識與知識庫中已有的知識進(jìn)行智能的分類和匹配操作,然后將符合入庫條件的知識傳入庫中。
  3、智能知識庫存儲系統(tǒng)。這是知識庫建設(shè)的最主要組成部分,同時也關(guān)系到知識服務(wù)的效果和質(zhì)量。
 ?。ǘ┲悄艽砑夹g(shù)
  智能代理(Intelligent Agent,IA)技術(shù),起始于20世紀(jì)80年代,是人工智能技術(shù)的一個重要研究領(lǐng)域目前,國外從事智能代理技術(shù)研究的不僅有大學(xué)、研究機構(gòu)和諸多信息技術(shù)公司。并且有些智能代理產(chǎn)品或嵌入智能代理技術(shù)的產(chǎn)品已經(jīng)投入使用,這些情況表明發(fā)展智能代理技術(shù)是一個趨勢,它將是克服現(xiàn)有網(wǎng)絡(luò)檢索問題的有效手段。
  1、定義。智能代理是一種軟件程序,它使用戶通過代理通信協(xié)議進(jìn)行信息交換,以實現(xiàn)問題的自動解決。一般來說,智能代理具有如下特點:智能性、代理性、自治性、主動性、移動性、協(xié)作性。
  2、智能代理的作用。智能代理有著強大的功能,用途也是十分廣泛的,通常可分為網(wǎng)絡(luò)管理、信息管理和優(yōu)化用戶界面。
 ?。ㄈ┲悄芩阉鞔淼脑?br/>  智能搜索代理是智能代理在信息檢索中的一種應(yīng)用,它以用戶需求為先導(dǎo)來進(jìn)行信息搜集和信息加工,根據(jù)用戶特定的需求以及在一段時期內(nèi)的偏好為衡量標(biāo)準(zhǔn)來篩選信息。用戶界面提供友好的自然語言查詢,當(dāng)用戶的查詢請求不明確時,智能搜索代理會利用知識庫中的推理機制推斷用戶的潛在要求,選擇與用戶習(xí)慣最相近的需求進(jìn)行檢索。
  
  六、結(jié)束語
  
  人工智能技術(shù)的發(fā)展是時代對社會智能化需求的體現(xiàn),而人工智能與信息檢索的結(jié)合則是人們對信息獲取智能化的有益嘗試。在信息檢索系統(tǒng)中納入人工智能技術(shù)將使傳統(tǒng)的信息檢索系統(tǒng)具有更好的用戶界面、更高的檢索效率和更豐富的檢索手段。人工智能技術(shù)的引入正在使傳統(tǒng)的信息檢索系統(tǒng)發(fā)生了巨大的變化。以兩者作為結(jié)合點的智能信息檢索系統(tǒng),也將隨著這兩方面研究的不斷發(fā)展而更加完善、強大。
  
  參考文獻(xiàn):
  1、王娟琴.現(xiàn)代信息檢索方法研究[D].武

十堰市| 平邑县| 措美县| 二手房| 石渠县| 铜川市| 巢湖市| 台湾省| 惠州市| 桓仁| 赤壁市| 静宁县| 寻乌县| 贡觉县| 苏尼特右旗| 体育| 竹山县| 札达县| 乌什县| 临泽县| 磴口县| 香河县| 永平县| 秀山| 惠水县| 南澳县| 永吉县| 达孜县| 舒兰市| 正安县| 山东省| 前郭尔| 津市市| 黔西| 江都市| 西和县| 林州市| 琼海市| 陕西省| 当雄县| 布尔津县|