国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于企業(yè)搜索引擎平臺的探究

2018-04-16 08:56:32鐘炳志劉琦陳昌平
中國科技縱橫 2018年5期
關(guān)鍵詞:搜索引擎

鐘炳志 劉琦 陳昌平

摘 要:伴隨著互聯(lián)網(wǎng)技術(shù)的興起,企業(yè)的信息技術(shù)建設(shè)也發(fā)展的朝氣蓬勃。有些企業(yè)的規(guī)模非常龐大,諸如多區(qū)域分公司或全球跨國企業(yè)等,企業(yè)內(nèi)部的數(shù)據(jù)是非常龐大的,在如此眾多的信息中,如何能快速、有效的獲得所需要的信息,是一個(gè)非常重要的課題。企業(yè)搜索引擎就如日程生活中所使用的那些引擎一樣,能很好的解決這個(gè)問題。

關(guān)鍵詞:一站式搜索引擎;關(guān)聯(lián)性檢索;跨地域全網(wǎng)檢索;搜索引擎

中圖分類號:TP391.3 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-2064(2018)05-0045-01

1 引言

依托于互聯(lián)網(wǎng)技術(shù),企業(yè)的信息技術(shù)也得到了前所未有的發(fā)展。以一個(gè)電力系統(tǒng)企業(yè)為例,技術(shù)資料、工藝參數(shù)、銷售相關(guān)的數(shù)據(jù)非常之多,它們均以文件、郵件、照片等各種形式被保存在企業(yè)的計(jì)算機(jī)系衡量統(tǒng)中。一旦要被查詢,需要企業(yè)人員能準(zhǔn)確、快速、無誤的進(jìn)行查詢并識別出來。這也是一個(gè)企業(yè)是否高度信息化建設(shè)與否的主要指標(biāo)。

2 企業(yè)一站式搜索引擎的開發(fā)背景

目前有些企業(yè),雖然經(jīng)過信息化的管理,也實(shí)現(xiàn)了對IRS、知識管理、協(xié)同辦公等系統(tǒng)進(jìn)行全過程的搜索,但是,有些仍然存在以下問題:

(1)系統(tǒng)的接入量偏少,只接入了內(nèi)網(wǎng)辦公門戶2.0、統(tǒng)一權(quán)限、協(xié)調(diào)辦公、知識管理、IRS這幾個(gè)系統(tǒng);(2)企業(yè)的所有格式的辦公文檔、圖片資料、各類報(bào)表、圖像和各種格式的音頻及視頻信息等業(yè)務(wù)元數(shù)據(jù)并不能自動錄入系統(tǒng),而是仍然需要手動錄入,缺少智能化、自動化的技術(shù)手段來支撐;(3)缺少多業(yè)務(wù)場景,無法進(jìn)行多元化的業(yè)務(wù)進(jìn)行應(yīng)用;(4)與門戶2.0統(tǒng)一權(quán)限的集成不能實(shí)現(xiàn);(5)系統(tǒng)的數(shù)據(jù),由于更新難度大或者更新不及時(shí),導(dǎo)致數(shù)據(jù)陳舊,無法滿足企業(yè)的正常的搜索需求;(6)不支持模糊搜索,需要高精度的搜索關(guān)鍵詞,且有可能需要多次搜索,企業(yè)無法達(dá)到快速查找的效果,搜索難度大。在這樣的背景下,企業(yè)門戶一站式搜索服務(wù)的實(shí)現(xiàn)就顯得非常有意義。

3 企業(yè)一站式搜索引擎的工作原理

企業(yè)的各種信息數(shù)據(jù)采集機(jī)制按照某種固定的規(guī)則進(jìn)行信息資源的歸類,并保存至企業(yè)的數(shù)據(jù)庫中。同時(shí),采用數(shù)據(jù)分類索引機(jī)制對數(shù)據(jù)庫中的頁面信息進(jìn)行索引,經(jīng)過整理形成各種倒排文檔,并在系統(tǒng)中建立起相應(yīng)的索引數(shù)據(jù)庫。在查詢界面中,只要根據(jù)查詢者的查詢?nèi)蝿?wù),并接受所提交的訪問相應(yīng)的索引數(shù)據(jù)庫,結(jié)果搜索引擎的查詢,最終將負(fù)荷要求的全部結(jié)果按照某種規(guī)則排列出,便于查詢者的確認(rèn)。

4 企業(yè)一站式搜索引擎設(shè)計(jì)的方案

(1)面向業(yè)務(wù)場景的搜索:針對企業(yè)的典型業(yè)務(wù)模型設(shè)計(jì)等進(jìn)行搜索結(jié)果的全景視圖展現(xiàn),集成基建管控系統(tǒng)、政工管理系統(tǒng)、科技管理系統(tǒng)、紀(jì)檢監(jiān)察系統(tǒng)、國際合作系統(tǒng)、規(guī)劃計(jì)劃管理系統(tǒng)、工會班組系統(tǒng)、標(biāo)準(zhǔn)化管理系統(tǒng)8個(gè)業(yè)務(wù)系統(tǒng)進(jìn)行接入,全面擴(kuò)大了接入的范圍,實(shí)現(xiàn)了企業(yè)的業(yè)務(wù)全覆蓋、信息數(shù)據(jù)與模型設(shè)計(jì)自動關(guān)聯(lián)以及全景視圖的展示。(2)關(guān)聯(lián)性檢索:陳舊的檢索工具會直接影響到搜索的質(zhì)量,以及檢索內(nèi)容的妥當(dāng)性,因此,對企業(yè)的元數(shù)據(jù)進(jìn)行歸類,構(gòu)建各信息點(diǎn)的關(guān)系圖譜,包括業(yè)務(wù)的模型,關(guān)系圖譜模型,數(shù)據(jù)提取規(guī)則,識別命名實(shí)體、建立涵蓋新增加各業(yè)務(wù)系統(tǒng)所涉及的業(yè)務(wù)規(guī)則庫,將非結(jié)構(gòu)化文檔中的命名實(shí)體提取出來,作為該文檔元數(shù)據(jù)的一部分,從而提高搜索的質(zhì)量。(3)跨地域全網(wǎng)檢索:企業(yè)的數(shù)據(jù)往往僅僅被保存在本地,無法進(jìn)行系統(tǒng)內(nèi)的跨地域的檢索,這就使得有些數(shù)據(jù)不能共享使用。為了解決這一問題,通過對索引文件的數(shù)據(jù)增加的同步與合并,將索引生效,并將其應(yīng)運(yùn)到全網(wǎng)系統(tǒng)中的索引,以此實(shí)現(xiàn)跨地域的全網(wǎng)檢索。這在同一集團(tuán)不同區(qū)域的子企業(yè)之間業(yè)務(wù)的關(guān)聯(lián)上起到了非常重要的作用。

5 企業(yè)一站式搜索引擎的技術(shù)架構(gòu)

基于企業(yè)自主可管控的軟件基礎(chǔ)設(shè)施,將搜索的引擎,數(shù)據(jù)分析、全景視圖的應(yīng)運(yùn)和展示等主要構(gòu)建進(jìn)行系統(tǒng)的管理,通過這些各組件的協(xié)作統(tǒng)一對外提供基于非結(jié)構(gòu)化數(shù)據(jù)的一站式搜索服務(wù),支撐帶權(quán)限的跨地域檢索功能,實(shí)現(xiàn)各數(shù)據(jù)的動態(tài)關(guān)聯(lián)檢索,為了更好的支撐一站式的引擎搜索,將圍繞著基礎(chǔ)數(shù)據(jù)的集成、數(shù)據(jù)庫的權(quán)限控制、搜索過程等內(nèi)容進(jìn)行方案設(shè)計(jì)的展開。具體包括以下:

(1)數(shù)據(jù)級權(quán)限設(shè)計(jì)方案。企業(yè)用戶者通過被授權(quán)的身份進(jìn)入系統(tǒng),在搜索引擎的檢索欄中輸入相關(guān)的搜索條件,由于系統(tǒng)會識別用戶的權(quán)限,因此,搜索的過程會根據(jù)用戶的權(quán)限信息向搜索引擎發(fā)出搜索請求,用以提高檢索的效率。(2)語義搜索方案。首先,通過企業(yè)對網(wǎng)頁、電子文件、文本、音頻、視頻等多媒體資料等的數(shù)據(jù)采集,進(jìn)行數(shù)據(jù)的編排和整理;其次,對采集的數(shù)據(jù)根據(jù)其特征或者表述內(nèi)容進(jìn)行初步的處理,并采用關(guān)聯(lián)圖譜或者全視角景模型,為用戶檢索提供更多全面的信息支撐。(3)對應(yīng)企業(yè)用戶輸入的請求,當(dāng)企業(yè)用戶通過引擎搜索窗口輸入關(guān)健詞或則短句時(shí),相關(guān)被查詢信息,以及用戶權(quán)限等的信息一同被帶入搜索引擎中進(jìn)行查詢。(4)搜索引擎根據(jù)用戶權(quán)限的設(shè)定,將符合該權(quán)限的索引結(jié)果展現(xiàn)出來,查詢的結(jié)果可能會有很多內(nèi)容,一般會按照與查詢關(guān)健詞接近程度高低進(jìn)行排列,除了相關(guān)的文字或圖片信息,被編排的關(guān)聯(lián)業(yè)務(wù)圖譜等也一同被可視化體現(xiàn)出來。

6 企業(yè)搜索引擎關(guān)聯(lián)用戶角色的定義

(1)普通的用戶,這也是最常見的角色,它是指系統(tǒng)普通的使用用戶,一般是通過企業(yè)搜索引擎查詢相關(guān)的信息,促進(jìn)工作上的完善。(2)相關(guān)業(yè)務(wù)的管理員,這類人員一般都要肩負(fù)著業(yè)務(wù)分析、系統(tǒng)基礎(chǔ)配置、權(quán)限同步、數(shù)據(jù)集成等的工作職責(zé)。一般都屬于得通信公司人員。(3)審計(jì)管理員,這類人員主要負(fù)責(zé)系統(tǒng)的日志管理、審核創(chuàng)建普通用戶是否通過等職責(zé)。(4)系統(tǒng)運(yùn)營維護(hù)人員,主要負(fù)責(zé)系統(tǒng)的運(yùn)行和維護(hù),可以查看系統(tǒng)的日志,以及對系統(tǒng)進(jìn)行故障恢復(fù)等。

7 應(yīng)當(dāng)注意的應(yīng)運(yùn)安全問題

(1)用戶的身份認(rèn)證??紤]到信息的保密性、以及對引擎使用者信息的追蹤和把握,對登陸驗(yàn)證設(shè)置獨(dú)立的個(gè)人賬號和密碼,且為了提高密碼的精度,使用數(shù)字和字母互組合的方式進(jìn)行。當(dāng)密碼連續(xù)三次登陸驗(yàn)證錯誤是,賬號將被鎖定,最終只能通過企業(yè)系統(tǒng)的維護(hù)人員或者事先預(yù)留的身份驗(yàn)證等方式進(jìn)行解鎖。另外,通過配置方式啟用禁止同一賬號同時(shí)在不同的IP上登陸。(2)授權(quán)。基于不同的賬號,進(jìn)行適當(dāng)?shù)馁Y源配置,當(dāng)訪問到某些關(guān)鍵核心信息是,需要進(jìn)行授權(quán)認(rèn)證。(3)異常時(shí)的管理。當(dāng)界面顯示頁面出錯的異常信息時(shí),應(yīng)該被記入日志,以便系統(tǒng)維護(hù)人員的確認(rèn)和問題的排查。

8 企業(yè)搜索引擎未來發(fā)展的一些建議

(1)從用戶輸入的關(guān)鍵詞或短句中能快速匹配到相關(guān)信息,提高索引的效率以及內(nèi)容的有效性。很多用戶都有這樣的體會,企業(yè)搜索引擎中輸入關(guān)鍵詞后,顯示出來的結(jié)果非常多,但是,與自己實(shí)際所需要的內(nèi)容相符合的信息,卻就沒有那么多了,這就需要用戶進(jìn)行新的的再次篩選,甚至需要花費(fèi)大量的時(shí)間逐條確認(rèn)。如果搜索引擎能獲得用戶沒有在查詢條件中表達(dá)出來的真正用途,那么最終顯示出來的查詢結(jié)果將會刪減很多,用戶最終確認(rèn)也變得簡單。這就需要使用智能跟蹤用戶的索引行為,通過用戶的多次交互查詢,讓搜索引擎真正意義上明白那些索引的結(jié)果和查詢者的需求有關(guān)。(2)信息過濾技術(shù)利用信息智能代理,使用自動獲得的用戶模型進(jìn)行信息搜集,從所有信息中自動過濾,將用戶感興趣的、或?qū)τ脩粲袑?shí)質(zhì)幫助的內(nèi)容保留下來,達(dá)到個(gè)性化的服務(wù)。(3)面對系統(tǒng)規(guī)模的日益擴(kuò)大,采用分布式體系結(jié)構(gòu),提高系統(tǒng)的性能和使用感官。當(dāng)前的企業(yè)搜索引擎一般有集中式體系結(jié)構(gòu)和分布式體系結(jié)構(gòu)這兩種。這兩種方法面對不同的系統(tǒng)規(guī)模時(shí),也是各有千秋。一般來說,當(dāng)系統(tǒng)的規(guī)模擴(kuò)大時(shí),會采用分布式體系結(jié)構(gòu),即,搜索引擎一旦被下達(dá)任務(wù)后,將在多臺的機(jī)器上進(jìn)行并行索引,以提高檢索的速度。增加用戶的使用感官。(4)重視信息的交叉檢索的研究。被保存至企業(yè)信息數(shù)據(jù)庫中的信息形式是多種多樣的額,甚至是多種語言的。因此,搜索引擎如果能夠?qū)⒂脩舻乃阉麝P(guān)鍵詞轉(zhuǎn)換成其他形式的各種語言,再由搜索引擎下達(dá)搜索任務(wù),這樣,就更能全面的將所有有用的信息全部展現(xiàn)出來。但是,這個(gè)技術(shù)要實(shí)現(xiàn)它,存在的難處是語言之間的準(zhǔn)確表達(dá)以及精準(zhǔn)位的定義。不過,隨著現(xiàn)在網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,相信智能的檢索機(jī)制很快就能攻克各種技術(shù)難題,讓企業(yè)體驗(yàn)到不同的搜索方式。

猜你喜歡
搜索引擎
Chrome 99 Canary恢復(fù)可移除預(yù)置搜索引擎選項(xiàng)
網(wǎng)絡(luò)搜索引擎亟待規(guī)范
Nutch搜索引擎在網(wǎng)絡(luò)輿情管控中的應(yīng)用
基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
廣告主與搜索引擎的雙向博弈分析
基于Lucene搜索引擎的研究
知識漫畫
百科知識(2012年11期)2012-04-29 08:30:15
一種自反饋式元搜索系統(tǒng)的設(shè)計(jì)
搜索引擎,不止有百度與谷歌
搜索,也要“深搜熟濾”
民县| 和平区| 郧西县| 赞皇县| 惠水县| 类乌齐县| 宁波市| 颍上县| 玛沁县| 安仁县| 唐河县| 洛川县| 家居| 甘德县| 深泽县| 鄂托克前旗| 万山特区| 弥渡县| 西藏| 明溪县| 珲春市| 蒙城县| 山阴县| 宿州市| 中阳县| 二连浩特市| 满城县| 凭祥市| 南汇区| 和静县| 盐亭县| 封开县| 石台县| 贞丰县| 巢湖市| 贡嘎县| 武清区| 辉南县| 临安市| 高唐县| 济南市|