国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種信息倉庫檢索系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)

2008-12-29 00:00:00趙慶龍
中國集體經(jīng)濟(jì) 2008年12期


  摘要:文章設(shè)計(jì)了一個(gè)信息倉庫的檢索系統(tǒng),對企業(yè)各種信息進(jìn)行有效分類和統(tǒng)一規(guī)劃,并提供全文檢索、類別瀏覽、組合條件查詢等多種搜索機(jī)制,使得信息可以方便地組織起來并按照使用權(quán)限展現(xiàn)給用戶,最大限度地提高信息利用率。經(jīng)過實(shí)際使用,該檢索系統(tǒng)基本達(dá)到設(shè)計(jì)的要求。
  關(guān)鍵詞:信息倉庫;信息檢索
  
  一、引言
  
  當(dāng)代社會(huì)是一個(gè)信息高度發(fā)達(dá)的社會(huì),信息是否被合理利用往往會(huì)決定一個(gè)企業(yè)的發(fā)展成敗。如果不對信息管理加以足夠的重視,會(huì)導(dǎo)致企業(yè)在市場競爭中處于不利的位置。要想贏得市場競爭的主動(dòng),就要求各個(gè)企業(yè)必須加強(qiáng)對企業(yè)相關(guān)的各種信息的管理和使用,就是企業(yè)要實(shí)現(xiàn)“信息化”。
  企業(yè)信息化是企業(yè)應(yīng)用信息技術(shù),使企業(yè)的生產(chǎn)、經(jīng)營、管理等各個(gè)層次、各個(gè)環(huán)節(jié)和各個(gè)方面水平得以提高,不斷提高企業(yè)的決策能力和競爭力的過程。
  在企業(yè)實(shí)際運(yùn)作過程中,會(huì)產(chǎn)生大量的非結(jié)構(gòu)化的文檔信息。企業(yè)需要對這些信息進(jìn)行處理。因?yàn)?,如果不加以處理,一方面?huì)浪費(fèi)有用的信息資源;另一方面,也會(huì)對企業(yè)的信息處理造成負(fù)擔(dān),影響工作效率。這就需要建設(shè)一個(gè)信息倉庫系統(tǒng)。
  
  二、信息倉庫系統(tǒng)介紹
  
  計(jì)算機(jī)與信息技術(shù)經(jīng)歷了半個(gè)世紀(jì)的發(fā)展,給人類社會(huì)帶來了巨大的變化與影響?,F(xiàn)在,人們正逐漸受到“信息爆炸”、“混沌信息空間”和“數(shù)據(jù)過?!钡木薮髩毫ΑS?jì)算機(jī)與信息技術(shù)的發(fā)展,雖然加速了獲取知識的過程,但當(dāng)數(shù)據(jù)量極度增長時(shí),如果沒有有效的方法,也會(huì)感到像大海撈針一樣束手無策。據(jù)估計(jì),在一個(gè)大型企業(yè)數(shù)據(jù)庫中,只有7%的數(shù)據(jù)得到了很好的利用,相對于“數(shù)據(jù)過?!焙汀靶畔⒈ā保藗冇指械健靶畔⒇毞Α?。
  早期人們用來支持決策的信息系統(tǒng)大多數(shù)是以關(guān)系數(shù)據(jù)庫為基礎(chǔ)的。關(guān)系數(shù)據(jù)庫以關(guān)系模型為基礎(chǔ),關(guān)系模型由關(guān)系數(shù)據(jù)結(jié)構(gòu)、關(guān)系操作集合和關(guān)系完整性約束3部分組成。由于不能訪問或以快速方式訪問大型數(shù)據(jù)存儲器或有高度標(biāo)準(zhǔn)結(jié)構(gòu)的數(shù)據(jù);而且傳統(tǒng)的數(shù)據(jù)庫數(shù)據(jù)缺乏組織性;同時(shí)數(shù)據(jù)庫中存放的大多是原始數(shù)據(jù),難以轉(zhuǎn)化為有用的信息,效率低下,對分析處理的支持不能令人滿意。以往的多數(shù)決策支持系統(tǒng)只能停留在演示階段,靈活性和可用性差,不實(shí)用。
  因此,人們開始嘗試對數(shù)據(jù)庫中的原始數(shù)據(jù)進(jìn)行再加工,形成一個(gè)綜合的、面向分析的環(huán)境以支持決策的產(chǎn)生,從而產(chǎn)生了數(shù)據(jù)倉庫。
  數(shù)據(jù)倉庫(Data Warehouse)是指從多個(gè)數(shù)據(jù)源收集的信息,以一個(gè)一致的模式存儲起來所得到的數(shù)據(jù)集合。它是面向主題的、集成的、穩(wěn)定的數(shù)據(jù)集合,支持管理部門的決策過程。
  但是,數(shù)據(jù)倉庫本身固有的特點(diǎn):應(yīng)用建立在數(shù)據(jù)的基礎(chǔ)上的,會(huì)帶來忽略經(jīng)過挖掘的數(shù)據(jù)的管理和利用不足的問題。于是,信息倉庫應(yīng)運(yùn)而生。
  信息倉庫的產(chǎn)生,順應(yīng)時(shí)代的發(fā)展和科技的進(jìn)步,是科學(xué)技術(shù)要滿足人們需要的必然結(jié)果。
  信息倉庫系統(tǒng)是企業(yè)信息管理體系建設(shè)的一部分。此系統(tǒng)側(cè)重點(diǎn)是非結(jié)構(gòu)化信息的采集、管理和展現(xiàn)。它是一種能夠?yàn)槠髽I(yè)中高層管理決策者提供輔助決策的信息管理系統(tǒng)。
  利用該系統(tǒng),企業(yè)用戶把這些文檔信息分門別類組織存放起來,根據(jù)信息的實(shí)際用途和決策支持的具體需要,對企業(yè)各種信息進(jìn)行有效分類和統(tǒng)一規(guī)劃,并提供全文檢索、類別瀏覽、組合條件查詢等多種搜索機(jī)制,使得信息可以方便地組織起來并按照使用權(quán)限展現(xiàn)給用戶,以實(shí)現(xiàn)信息的分級共享,最大限度地提高信息利用率。信息倉庫的文件資料與其之上的查詢應(yīng)用相結(jié)合,以構(gòu)成較為完善的知識發(fā)現(xiàn)與管理體系。
  
  三、信息倉庫中檢索功能概述
  
  信息倉庫系統(tǒng)建立后,可以想象每天都有大量的各類信息加載到系統(tǒng)中,如何快速、準(zhǔn)確的查詢到最關(guān)心的信息,就成為系統(tǒng)重點(diǎn)解決的問題。系統(tǒng)提供多種檢索方式,如全文檢索、分類瀏覽、高級檢索、熱門檢索,可以幫助用戶很方便地查找到符合各自需要的信息。搜索引擎子系統(tǒng)的主要目的是在信息倉庫系統(tǒng)中提供對信息的多種查詢功能(見圖1)。
  
 ?。ㄒ唬┤臋z索
  用戶輸入任意詞語,系統(tǒng)都可以搜索出包含這些詞語的文檔信息。在信息倉庫系統(tǒng)中,提供按標(biāo)題檢索和按內(nèi)容檢索兩種方式。
  按標(biāo)題檢索:檢索出文檔標(biāo)題中包含所輸入詞語的所有文檔信息。
  按內(nèi)容檢索:檢索出文檔內(nèi)容中包含所輸入詞語的所有文檔信息。
  全文檢索的主要目的是讓用戶查找想要的任何信息。對所要查詢的信息,用戶只知有代表性的詞語、基本概念等。
  系統(tǒng)提供一個(gè)檢索引擎,用戶只要輸入有代表性的詞語、基本概念(順序信息),在信息庫中全文搜索包含該詞或詞組(順序信息)的相關(guān)信息。
  可操作的對象:Word文檔、Excel文檔、PDF文檔、HTML文檔、Tiff文檔等文檔型文件。針對音/視頻文件、流媒體文件、圖形、圖片文件等非文檔文件,提供針對文件屬性(作者、編檔時(shí)間、關(guān)鍵字、描述、摘要等)的檢索。
  檢索條件:用戶通過輸入檢索條件,完成對授權(quán)文檔、文件的訪問。檢索條件可以是多種類型的數(shù)據(jù),如字、詞、詞組、語句、時(shí)間、文件名等。系統(tǒng)還允許用戶輸入基于運(yùn)算表達(dá)式的復(fù)合型條件,如時(shí)間+文件名、字+字、詞組+語句等。
 ?。ǘ┓诸悪z索
  將信息按照系統(tǒng)定義好的類別展示給用戶,可以采用樹型結(jié)構(gòu)或者層級結(jié)構(gòu)等展現(xiàn)形式,方便用戶查看,同時(shí)可以只在某一類別下再進(jìn)行全文檢索,縮小搜索范圍,提高搜索的速度和準(zhǔn)確度。
  當(dāng)用戶明確知道要查的某一分類的信息時(shí),通過信息分類逐級目錄導(dǎo)航的方式細(xì)化信息分類以查找到用戶想查找的信息是一種更為高效的查找方式。分類檢索的界面與實(shí)現(xiàn)方式可以參考各大搜索引擎的目錄檢索方式。
 ?。ㄈ└呒墮z索
  系統(tǒng)提供若干更為具體的檢索條件,如采集人姓名、所在部門、采集時(shí)間等,讓用戶更準(zhǔn)確的定位信息,提高信息查詢的工作效率。
  高級檢索的主要目的是查詢格式固定但條件多樣的信息。為節(jié)省查詢定義的時(shí)間和數(shù)據(jù)庫檢索的時(shí)間、提高查詢效率、提高查詢信息的準(zhǔn)確性,可將信息的多種查詢條件按類分成幾個(gè)條件集合,集合之間的關(guān)系分成兩種:同時(shí)滿足(并)、只要一個(gè)滿足(與)。在查詢信息時(shí),用戶只需在條件集合中選擇相應(yīng)的條件以及集合之間的關(guān)系(只要一個(gè)滿足、同時(shí)滿足)即可查詢出相關(guān)的信息。
  在系統(tǒng)中可供檢索的條件主要有:文檔標(biāo)題;采集人姓名、所在部門、采集時(shí)間;發(fā)布人姓名、所在部門、發(fā)布時(shí)間;審核人姓名、所在部門、審核時(shí)間。
 ?。ㄋ模衢T檢索
  對系統(tǒng)用戶輸入的全文查詢條件保存下來,通過系統(tǒng)比較,找到10條最經(jīng)常使用的查詢用語,作為熱門檢索的常用查詢條件,當(dāng)以后再次查詢此類內(nèi)容時(shí),即可直接點(diǎn)擊進(jìn)入,而無需重新輸入查詢條件了,方便用戶使用。
  
  四、總結(jié)
  
  本文的總體目標(biāo)是為了解決在信息倉庫中,面對大量的非結(jié)構(gòu)化的信息,如何最快、最好、最準(zhǔn)確地找到用戶權(quán)限以內(nèi)的信息,為用戶節(jié)省時(shí)間,提高企業(yè)的工作效率!
  本文設(shè)計(jì)的系統(tǒng),能完成的搜索功能有:全文搜索、高級搜索、分類搜索、熱門搜索。通過本系統(tǒng),企業(yè)信息管理可以做到:一方面雖然信息過多,但能夠做到便于使用者找到最需要的文件。另一方面,幫助每個(gè)部門分類和屏蔽對于一些部門無用的信息,提高了工作效率。
  
  參考文獻(xiàn):
  1、宜達(dá)婧.基元信息倉庫的研究及其在流程工業(yè)中的應(yīng)用[D].北京化

上高县| 濉溪县| 罗江县| 周至县| 黄梅县| 鱼台县| 巴里| 遂宁市| 十堰市| 平谷区| 临澧县| 平乐县| 宽城| 进贤县| 嘉禾县| 长宁县| 高台县| 尖扎县| 都江堰市| 肥乡县| 鸡泽县| 边坝县| 万源市| 余姚市| 白朗县| 缙云县| 潜山县| 泾阳县| 天台县| 丹江口市| 宁城县| 南丹县| 青铜峡市| 德格县| 扎兰屯市| 万山特区| 苏尼特右旗| 天全县| 略阳县| 尼勒克县| 淮安市|