国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

搜索:非結(jié)構(gòu)化信息管理的核心

2008-11-17 01:09:26孟凡強(qiáng)朱洪濤
AMT前沿論叢 2008年9期
關(guān)鍵詞:結(jié)構(gòu)化文檔分類

孟凡強(qiáng) 朱洪濤

從異構(gòu)、繁雜、豐富的數(shù)據(jù)中。準(zhǔn)確、快速地找到自己所需要的信息,減少信息搜尋時(shí)間,是知識(shí)工作者面臨的巨大挑戰(zhàn)。

過(guò)去的10年,我們經(jīng)過(guò)了由信息匱乏到信息過(guò)量的轉(zhuǎn)變。在銷售額過(guò)30億的企業(yè),或市級(jí)以上主要政府機(jī)構(gòu),擁有的IT系統(tǒng)數(shù)量一般會(huì)超過(guò)10個(gè)。這些系統(tǒng)中的信息,包括結(jié)構(gòu)化數(shù)據(jù),也包括非結(jié)構(gòu)化信息,如多格式的文檔、郵件、網(wǎng)頁(yè)等。根據(jù)調(diào)查,85%的信息是非結(jié)構(gòu)化的,每三個(gè)月增加一倍。

知識(shí)工作者,面臨著尋找信息的挑戰(zhàn)。根據(jù)調(diào)查,知識(shí)工作者每天30%的工作時(shí)間,用于收集信息;72%的管理者認(rèn)為,知識(shí)沒(méi)有在他們的組織中得到重復(fù)利用。從這些異構(gòu)、繁雜、豐富的內(nèi)容中,準(zhǔn)確、快速地找到自己所需要的信息,減少信息搜尋時(shí)間,能夠創(chuàng)造巨大的價(jià)值。

非結(jié)構(gòu)化信息管理的應(yīng)用熱點(diǎn)

知識(shí)管理,有不同的應(yīng)用點(diǎn)。這些應(yīng)用點(diǎn)的設(shè)計(jì)開(kāi)發(fā),已經(jīng)考慮了怎么幫助企業(yè)用戶更好地獲取他所需要的知識(shí)。

1)門戶。門戶應(yīng)用的核心在于展現(xiàn)和集成。企業(yè)內(nèi)部所擁有的信息系統(tǒng)的數(shù)量在增多,導(dǎo)致用戶需要登錄和瀏覽多個(gè)系統(tǒng),門戶可以將多個(gè)系統(tǒng)的應(yīng)用點(diǎn)集中在一個(gè)界面上。第二個(gè)應(yīng)用重點(diǎn)是:怎么能夠高效、快捷、多樣、美觀地對(duì)內(nèi)容進(jìn)行展現(xiàn),減少程序設(shè)計(jì)量和改版工作量。

2)文檔管理。文檔的價(jià)值,重在重用。無(wú)論是記載了既往的經(jīng)驗(yàn)、訣竅、心得、數(shù)據(jù)的工作文檔,還是承載了規(guī)范、方法、工具的工作模版,如果能夠供后來(lái)者使用,都能帶來(lái)效益和效率的提高。

3)協(xié)同。要點(diǎn)在知識(shí)與業(yè)務(wù)過(guò)程結(jié)合。無(wú)論是辦公自動(dòng)化系統(tǒng)中的文檔,或是營(yíng)銷系統(tǒng)中的文檔管理,還是產(chǎn)品數(shù)據(jù)管理中的文檔管理,都是將文檔與業(yè)務(wù)的運(yùn)作結(jié)合起來(lái),在具體業(yè)務(wù)的經(jīng)營(yíng)管理中,同步進(jìn)行知識(shí)管理。

4)社區(qū)。重在隱性知識(shí)向顯性知識(shí)的轉(zhuǎn)化。隨著Web 2.0應(yīng)用的普及化,博客、論壇、問(wèn)題庫(kù)、圈子、人脈網(wǎng)絡(luò)等在大型企業(yè)內(nèi)部的應(yīng)用,亦逐步增多。由此,企業(yè)的社區(qū)不僅僅是論壇這一個(gè)應(yīng)用。社區(qū),促進(jìn)了隱性知識(shí)向顯性知識(shí)的轉(zhuǎn)化。

5)E-learning系統(tǒng)。也是企業(yè)知識(shí)管理的應(yīng)用重點(diǎn)之一,使得受制于講師、空間、時(shí)間的面授培訓(xùn),變成用戶來(lái)點(diǎn)播使用的基于網(wǎng)絡(luò)的培訓(xùn)。對(duì)于知識(shí)性的培訓(xùn)來(lái)說(shuō),這不僅有品質(zhì)的保障,而且大大降低了成本。

上述這些不同的應(yīng)用,外加企業(yè)內(nèi)部建設(shè)的業(yè)務(wù)類、管理類系統(tǒng),帶來(lái)了信息量的膨脹,異構(gòu)的數(shù)據(jù)。用戶如何從這些系統(tǒng)中獲取所需的信息,所費(fèi)的時(shí)間越來(lái)越多。

搜索:信息展現(xiàn)的核心應(yīng)用

與企業(yè)內(nèi)部應(yīng)用相比,互聯(lián)網(wǎng)站在內(nèi)容的展現(xiàn)方面積累了諸多經(jīng)驗(yàn),形成了系列規(guī)則和約定俗成的規(guī)范,值得企業(yè)內(nèi)部知識(shí)管理系統(tǒng)學(xué)習(xí)借鑒:屬性的廣泛應(yīng)用使得前臺(tái)展現(xiàn)的緯度更加多元化,也使得計(jì)算能力得到節(jié)約;Tag的應(yīng)用使得信息分類的顆粒度變得更小、更個(gè)性化、更長(zhǎng)尾化;關(guān)聯(lián)性的應(yīng)用可以有效地幫助用戶獲取他所需要的信息,可以增加用戶訪問(wèn)某一網(wǎng)站或應(yīng)用系統(tǒng)的點(diǎn)擊量;信息展現(xiàn)方式的改進(jìn)使得頁(yè)面的樣式改變不需要重寫程序,效率大大提高;用戶自定義使得系統(tǒng)界面及內(nèi)容能夠個(gè)性化。

上述方法可以幫助系統(tǒng)管理員,方便地從業(yè)務(wù)的視角,來(lái)幫助用戶獲取知識(shí)。

而對(duì)用戶來(lái)說(shuō),企業(yè)級(jí)搜索所提供的服務(wù),與公眾類搜索引擎類似。在企業(yè)內(nèi)部部署后,其提供的核心價(jià)值在于:

搜索的準(zhǔn)確性。專業(yè)的企業(yè)級(jí)搜索軟件基于自己的算法,可幫助用戶更準(zhǔn)確地找到與其關(guān)心的關(guān)鍵詞相匹配的內(nèi)容。當(dāng)搜索用戶并不熟悉的專業(yè)內(nèi)容時(shí),軟件所提供的搜索結(jié)果,比目錄、屬性甚至人工推薦更值得信賴。搜索準(zhǔn)確性,除依賴于搜索算法外,也依賴于分詞技術(shù)。比如搜索“制造業(yè)商業(yè)智能”,搜索軟件能夠根據(jù)專業(yè)的詞庫(kù)將其分解為制造業(yè)和商業(yè)智能兩個(gè)詞對(duì)內(nèi)容進(jìn)行精確搜索。搜索準(zhǔn)確性,也依賴于附件搜索技術(shù),即對(duì)常見(jiàn)的文本處理文檔,能夠進(jìn)行索引和搜索。

內(nèi)容自動(dòng)分類、摘要和關(guān)鍵詞的自動(dòng)提取。如果人工對(duì)大量的內(nèi)容進(jìn)行入庫(kù)處理,如標(biāo)注分類、屬性、Tag、提取摘要,質(zhì)量依賴人工監(jiān)控,不穩(wěn)定。每個(gè)編輯人員,每天處理的內(nèi)容在250篇。隨著信息量的增多,內(nèi)容入庫(kù)的成本也在增加。用技術(shù)實(shí)現(xiàn)內(nèi)容自動(dòng)分類,關(guān)鍵詞和摘要的自動(dòng)提取,使得編輯人員的工作從人工入庫(kù)變?yōu)閷?duì)機(jī)器分類結(jié)果的審核。這樣,既可以兼具機(jī)器分類和人T分類的優(yōu)勢(shì),又可以幫助提高效率節(jié)約入庫(kù)成本。

依賴于上述兩個(gè)核心應(yīng)用點(diǎn),面向用戶端,在門戶系統(tǒng)、文檔管理系統(tǒng)、業(yè)務(wù)系統(tǒng)、社區(qū)系統(tǒng)、在線培訓(xùn)系統(tǒng)等知識(shí)管理系統(tǒng)中,靈活地使用屬性、Tag、關(guān)聯(lián)性、信息展現(xiàn)方式、用戶自定義等,可以使得用戶獲取信息的效率和質(zhì)量得到非常大的提高。

1)搜索結(jié)果展現(xiàn)方式的多樣化??砂磿r(shí)間、相關(guān)度等排序;用戶或管理員可配置搜索選項(xiàng)。從而將豐富內(nèi)容的威力,充分地發(fā)揮出來(lái)。

2)推出高質(zhì)量的推送服務(wù)。根據(jù)用戶的特點(diǎn),如性別、區(qū)域、行業(yè)、職業(yè)、興趣、愛(ài)好等,向用戶提供推送服務(wù)。如暢享網(wǎng)所經(jīng)營(yíng)的、面向機(jī)構(gòu)用戶的商務(wù)資訊庫(kù)KNET中,就提供“我所關(guān)注的競(jìng)爭(zhēng)對(duì)手”、“我所關(guān)注的客戶”“我所關(guān)注的行業(yè)”、“我關(guān)注的管理知識(shí)”、“我所關(guān)注的信息化知識(shí)”等推送服務(wù)。

3)提高單用戶的訪問(wèn)量。搜索結(jié)果頁(yè),可以實(shí)現(xiàn)實(shí)時(shí)的推送,即用戶在瀏覽某一內(nèi)容時(shí),系統(tǒng)自動(dòng)匹配及推送他可能關(guān)心的其他內(nèi)容。亦可以提供動(dòng)態(tài)的相關(guān)分類或關(guān)鍵詞,為用戶動(dòng)態(tài)提供相關(guān)的數(shù)據(jù)、文章、人員、應(yīng)用系統(tǒng)等。這可以大大提高單用戶訪川單一系統(tǒng)的點(diǎn)擊量。在很多情況下,這可以幫助用戶更迅速、更準(zhǔn)確地定位他所需要的內(nèi)容。

4)結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化信息的關(guān)聯(lián)。將非結(jié)構(gòu)化信息與結(jié)構(gòu)化數(shù)據(jù),關(guān)聯(lián)起來(lái)。在用戶搜索非結(jié)構(gòu)的文章時(shí),可以將結(jié)構(gòu)化的相關(guān)數(shù)據(jù)、人員、訂單等展示給用戶。當(dāng)用戶搜索結(jié)構(gòu)化的數(shù)據(jù)、人員、訂單、財(cái)務(wù)、材料等信息時(shí),可將非結(jié)構(gòu)化的文件展示給用戶。

建立高質(zhì)量搜索系統(tǒng)的難點(diǎn)

從當(dāng)前的實(shí)踐來(lái)看,建立高質(zhì)量的企業(yè)級(jí)搜索系統(tǒng),有如下值得關(guān)注的難點(diǎn):

軟件的選擇或開(kāi)發(fā)。搜索軟件是高質(zhì)量搜索系統(tǒng)的基礎(chǔ)所在。從技術(shù)來(lái)源上說(shuō),自己開(kāi)發(fā)搜索軟件,因?yàn)槊媾R算法、性能等技術(shù)難題,可行性小。采用商品化的搜索軟件,是可行辦法。需要從市場(chǎng)上不多的專業(yè)搜索軟件中,選擇合適的搜索軟件。

專業(yè)詞庫(kù)的建立。建立企業(yè)級(jí)搜索系統(tǒng)的機(jī)構(gòu),對(duì)搜索的準(zhǔn)確性比一般機(jī)構(gòu)有更高的要求。搜索引擎自帶的詞庫(kù),不足以勝任對(duì)搜索準(zhǔn)確性的高要求。根據(jù)自身機(jī)構(gòu)的專業(yè)特點(diǎn),建立分級(jí)、分類的專業(yè)詞庫(kù),是基礎(chǔ)的、繁雜的、高價(jià)值的工作。

搜索軟件的實(shí)施。搜索軟件提供的是搜索和分類兩個(gè)核心應(yīng)用點(diǎn)。如何充分地應(yīng)用兩個(gè)核心應(yīng)用點(diǎn),進(jìn)行用戶搜索頁(yè)、搜索結(jié)果頁(yè)、文章閱讀頁(yè)的設(shè)計(jì)?如何提供與用戶自身個(gè)性化特點(diǎn)相匹配的內(nèi)容的推送服務(wù),從而提高用戶獲取信息的效率和主動(dòng)性?從而使得搜索在非結(jié)構(gòu)化信息的應(yīng)用系統(tǒng)中無(wú)處不在,大大提高系統(tǒng)的用戶友好性。這都依賴于對(duì)搜索軟件的有效實(shí)施。

猜你喜歡
結(jié)構(gòu)化文檔分類
有人一聲不吭向你扔了個(gè)文檔
分類算一算
促進(jìn)知識(shí)結(jié)構(gòu)化的主題式復(fù)習(xí)初探
結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
基于RI碼計(jì)算的Word復(fù)制文檔鑒別
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
荃湾区| 花莲县| 四平市| 中超| 通山县| 阳泉市| 高要市| 石阡县| 阳原县| 深圳市| 峨眉山市| 土默特左旗| 涪陵区| 洛浦县| 襄汾县| 桐柏县| 五华县| 诏安县| 泉州市| 军事| 丹江口市| 邹平县| 闽侯县| 深泽县| 图木舒克市| 红桥区| 连南| 苍南县| 乃东县| 高邮市| 马龙县| 库伦旗| 黄梅县| 满洲里市| 弋阳县| 米易县| 甘泉县| 崇左市| 原阳县| 舞钢市| 舒城县|