国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)時代人工智能在網(wǎng)絡(luò)信息檢索中的應(yīng)用

2023-03-10 14:03:57馮燕青
科技創(chuàng)新與應(yīng)用 2023年3期
關(guān)鍵詞:資料庫信息檢索使用者

馮燕青

(南京市水利規(guī)劃設(shè)計院股份有限公司,南京 210000)

當前,隨著我國進入了新型社會發(fā)展階段,人們可以通過網(wǎng)絡(luò)進行檢索,獲得自己需要的信息。盡管與傳統(tǒng)的紙質(zhì)信息檢索方式相比,網(wǎng)絡(luò)信息檢索有著巨大的優(yōu)越性,但仍然存在著信息分類缺陷、部分信息無效、信息量巨大、真假難辨等問題。在此基礎(chǔ)上,利用人工智能進行信息分類,可以根據(jù)使用者的習(xí)慣提供真實、準確的信息,從而促進信息的檢索。

1 網(wǎng)絡(luò)信息檢索和人工智能綜述

1.1 網(wǎng)絡(luò)信息檢索概況

網(wǎng)絡(luò)信息檢索,其實就是以網(wǎng)絡(luò)為平臺,讓用戶利用網(wǎng)絡(luò)搜索引擎搜尋有關(guān)資訊。通過分配存儲技術(shù),可以將海量的數(shù)據(jù)信息分散到相應(yīng)的服務(wù)器上。而對于使用者來說,可以利用終端來查詢和查看事先存儲的資料。因此,所有的信息都可以在互聯(lián)網(wǎng)上被檢索和利用,而為網(wǎng)絡(luò)使用者提供資訊搜尋的方式或手段,就可以稱之為網(wǎng)絡(luò)信息檢索。

1.2 人工智能的概況

人工智能是一種可以通過機械來模擬和感知人在做事情的過程中的感覺,然后做出正確的決定,從而讓機器人擁有一種專門的技術(shù)來解決問題。因此,人工智能的實質(zhì)也是圍繞人類的頭腦進行的。其最大的特征就是基于對問題的正確理解,以一個相對完善的邏輯體系來進行知識的重構(gòu)和應(yīng)用。目前的人工智能可以分成以下流派:分布學(xué)派、認知學(xué)派、連接學(xué)派、邏輯學(xué)派和知識工程學(xué)派。雖然各個流派的研究不同,但在人工智能的構(gòu)造和作用上,目標都是相同的,那就是人工智能要由中間數(shù)據(jù)庫、解釋器、知識收集器、用戶界面、知識庫和推理引擎組成。

首先以知識庫為例,其是人工智能體系中的重要組成部分,是一項重要的存儲技術(shù)。知識庫里面有事實,有信息,有普通的常識和法則。有些特定的系統(tǒng)還包含了資料庫。其次是推理引擎,又稱推理機,它包含了控制策略和各種類型的任務(wù)搜索。作為一個特殊的數(shù)據(jù)庫,其在提供查詢的支持層面上扮演了非常重要的角色。用戶接口的內(nèi)容包括了系統(tǒng)和有關(guān)信息的傳輸。推理引擎是一座連接外部信息和內(nèi)部信息的橋梁,既能向使用者展示最后的加工效果,又能把使用者的意愿傳遞到計算機。而在這種情況下,利用的非自然語言可以減輕使用者的心理壓力,在進行工作和邏輯運算時,起到了存儲中間結(jié)果和數(shù)據(jù)的作用。在實際的使用中,系統(tǒng)會將問題顯示在黑板上并將問題的初始狀況呈現(xiàn)出來。然后,專家系統(tǒng)會按照知識庫中的信息進行分析,并對黑板上的信息進行分析。在需要的情況下,還會向客戶請教,以補充和解決知識上的不足。因此,從某種意義上來說,黑板也可以看作是一個動態(tài)的知識基礎(chǔ),在操作過程中發(fā)揮著至關(guān)重要的作用。最后是知識采集器,其主要作用是通過對知識庫的實際操作進行更新,以確保整個系統(tǒng)的穩(wěn)定運轉(zhuǎn)。解析儀的任務(wù)是解答使用者的問題,并為使用者提供相關(guān)該系統(tǒng)結(jié)果的操作路徑??傊?,人工智能就是用科學(xué)、虛擬的方式來解決人類的問題。

2 人工智能系統(tǒng)的構(gòu)成

人工智能系統(tǒng)包含:界面、資料庫、推理機、黑板、知識收集器和知識轉(zhuǎn)換解釋器等。

2.1 界面

界面,也就是UI 使用者界面。使用者通過使用者界面,設(shè)定關(guān)鍵字或搜尋法則讓邏輯推理搜尋,最后呈現(xiàn)出使用者所需的文字資訊、音頻或影像。界面是一個輸入和輸出的媒介,可以讓數(shù)據(jù)變得直觀,讓使用者可以更好地利用信息檢索。

2.2 資料庫

知識資料庫,是人工智能在內(nèi)部儲存知識的場所。將知識進行科學(xué)分類,儲存各種知識,方便讀者查詢。

2.3 推理機

推理機是具備邏輯性的程序組,其任務(wù)是把人的口頭表達轉(zhuǎn)化為電腦的語言,并建立查詢的規(guī)則來滿足使用者的需求。

2.4 黑板

中間資料庫與知識資料庫不同,中間資料庫是在進行推算的時候,將某些資料存儲起來。系統(tǒng)中的推理組織設(shè)定了某種特定的計算機語言,在黑板上呈現(xiàn)出初始問題的狀況。通過對該資料庫的問題進行二次開發(fā),對資料庫中的內(nèi)容進行匹配搜索,由專家輔助人員對資料庫的內(nèi)容進行及時升級,彌補缺乏的知識點。其是一個對整個智能系統(tǒng)進行全面控制的動態(tài)資料庫。

2.5 知識收集器

知識收集器的作用類似于前面提到的黑板后臺進行的人工的數(shù)據(jù)填充更新,但是采用了一種新的方法,即對缺少的知識進行了界定,并利用互聯(lián)網(wǎng)自動更新知識數(shù)據(jù)的信息。

2.6 知識轉(zhuǎn)換解釋器

知識轉(zhuǎn)換解釋器就是通過對使用者查詢到的問題進行分析,然后將計算機語言轉(zhuǎn)化為人類語言,為使用者提供信息,搜索推斷過程也可以提供給檢索使用者。

3 網(wǎng)絡(luò)信息檢索工具的類別

3.1 FTP 類

FTP 類是一種在線即時查詢的檢索方法。用戶要登陸電腦系統(tǒng)進行操作,才能完成對信息資料的檢索。同時,利用FTP 的查詢功能,還能進行各種數(shù)據(jù)的傳輸。比如常用的Archie,是一種基于文檔的自動檢索程序,通過對文檔相關(guān)知識進行分析,能夠?qū)ξ臋n的訪問和對其所屬的系統(tǒng)進行查詢。

3.2 菜單檢索

基于菜單式的檢索工具,其本質(zhì)是一種呈分布式的信息查詢工具。此類檢索工具能夠根據(jù)用戶的實際需求,選擇對應(yīng)的數(shù)據(jù)。對于一些不太熟悉的內(nèi)容,用戶也能應(yīng)付自如。

3.3 關(guān)鍵字檢索

基于關(guān)鍵字的檢索,則是在使用者的操作時可以不管該信息到底存在于哪個特定的電腦中。以廣域信息查詢系統(tǒng)(WAIS)為實例,利用WAIS 檢索系統(tǒng),從相應(yīng)的數(shù)據(jù)庫中獲取需要的文檔,然后在預(yù)先設(shè)置的檢索區(qū)域中進行查詢。因為這個系統(tǒng)可以有效地進行遠程搜索,在完成上述搜索之后,WAIS 軟件不但可以顯示出更多的內(nèi)容,而且還可以很好地體現(xiàn)出重點信息。

4 人工智能的優(yōu)點

與傳統(tǒng)的人工檢索相比,人工智能的信息檢索有很大的優(yōu)越性,特別是在海量數(shù)據(jù)中。第一,其具有高精度。因為其機械電路是以電腦為基礎(chǔ)的,一般來講,人工智能信息檢索不會像人工那樣粗心大意。第二,人工智能永遠不會感到疲勞。有些大公司隨時都要搜索,如果是純粹的人工采集,則需要多名數(shù)據(jù)采集者輪換檢索,而使用人工智能進行信息檢索,則只需要一個智能系統(tǒng)。第三,其擁有龐大的信息庫??梢愿_地按照問題搜索關(guān)鍵字,并且隨著使用的年限而不斷改進,還可以通過特殊的標準,來過濾所獲得的數(shù)據(jù)。

5 人工智能在計算機網(wǎng)絡(luò)技術(shù)中應(yīng)用的必要性

進入新世紀,計算機技術(shù)取得了空前的突破。目前,世界各國對網(wǎng)絡(luò)信息安全的認識不斷深化,越來越重視網(wǎng)絡(luò)信息安全問題,并不斷強化網(wǎng)絡(luò)監(jiān)測和網(wǎng)絡(luò)管理。通過對數(shù)據(jù)的采集,可以確定網(wǎng)絡(luò)監(jiān)控和網(wǎng)絡(luò)的控制是否符合要求。在電腦剛剛出現(xiàn)的時候,因為網(wǎng)絡(luò)上的數(shù)據(jù)并不穩(wěn)定,缺乏連續(xù)性和規(guī)律性,所以要讓電腦對數(shù)據(jù)進行自動的分析和判斷比較困難,因此必須融合智能技術(shù)。隨著電腦的普及,電腦越來越多地成為人們休閑、工作的便捷工具,同時也帶來了大量的信息風險。當今世界上因互聯(lián)網(wǎng)資訊而引發(fā)的犯罪事件層出不窮,若要讓資訊更安全、更可靠,必須更新電腦,提升電腦效能,因此必須建立一個智能化的系統(tǒng)型管理平臺,并具有對信息的自動識別能力。比如,對信息有無高風險的信息泄露、對網(wǎng)絡(luò)有無故障進行判定,從而保障了用戶的個人信息安全。計算機網(wǎng)絡(luò)技術(shù)的發(fā)展離不開人工智能技術(shù)的發(fā)展,而計算機網(wǎng)絡(luò)中的數(shù)據(jù)又是由人工智能來處理的,在遇到不確定信息時,其能迅速地解決問題,并迅速地跟蹤和定位具有動態(tài)變化的信息,使使用者獲得技術(shù)處理的相關(guān)信息。人工智能增強了信息集成的能力,改善了網(wǎng)絡(luò)管理的問題,提高了管理的效率,使網(wǎng)絡(luò)的技術(shù)水平得到了進一步的提高。

6 大數(shù)據(jù)時代人工智能在網(wǎng)絡(luò)信息檢索中的應(yīng)用

6.1 網(wǎng)絡(luò)智能知識庫

將人工智能用于網(wǎng)絡(luò)信息檢索,可以將其劃分成類。第一類是智能化的信息處理,主要功能是對網(wǎng)上所收集到的信息進行合理的歸類,再按照關(guān)鍵詞進行相似性的比對,最終將經(jīng)過篩選和審查的信息輸入到資料庫。其主要過程是將所獲取的資料的類別與內(nèi)容,依照一定的原則與方式進行適當?shù)臍w類,然后進行智能配對;其次,通過對信息庫中的信息進行對比和過濾,可以避免信息重復(fù)、占用計算機內(nèi)存等問題,從而實現(xiàn)對信息的智能化升級;根據(jù)比對的結(jié)果,將數(shù)據(jù)存儲到數(shù)據(jù)庫中,替代原來的數(shù)據(jù),也可以將新的數(shù)據(jù)和原來的數(shù)據(jù)進行融合,形成一個比較完備的數(shù)據(jù)庫;最終,通過對這些數(shù)據(jù)進行定時的整理與升級,有效防止數(shù)據(jù)的重復(fù)性,并能夠在一定程度上保證系統(tǒng)正常工作。

第二類是信息收集,需要有大量的信息資源來支撐,因此,信息收集是指收集、整理、更新和補充等。一般的信息收集系統(tǒng)包含印本信息收集和數(shù)字信息收集。印本信息收集主要是通過對紙質(zhì)書籍的知識進行掃描、輸入、完成數(shù)據(jù)的轉(zhuǎn)化,轉(zhuǎn)化的工作需要通過人工智能來完成。而數(shù)字信息收集則是指通過站點鏡像、智能信息監(jiān)控、智能資源發(fā)現(xiàn)和智能信息資源轉(zhuǎn)化4大模塊來實現(xiàn)的,站點鏡像就是將整個站點的信息全部拷貝到系統(tǒng)的后臺,從而加快采集的效率。智能信息監(jiān)控是指對網(wǎng)上搜索到的信息數(shù)據(jù)進行監(jiān)控,如果有變化或升級,那么其所存儲的信息就會隨之更新。智能資源發(fā)現(xiàn)主要是為目標門戶站點提供信息的智能搜索,當有與網(wǎng)上搜索相符的內(nèi)容時,將會進行自動采集。智能信息資源轉(zhuǎn)化是將數(shù)據(jù)信息進行收集、歸類,形成一種全新的信息、知識觀念。

第三類是智能信息存儲,其是網(wǎng)絡(luò)信息知識庫的一個主要內(nèi)容,可以保證網(wǎng)絡(luò)信息檢索的效能與質(zhì)量。通常來說,智能信息存儲系統(tǒng)分為軟件、硬件和檢索3大模塊,軟件即網(wǎng)絡(luò)數(shù)據(jù)訪問與存儲系統(tǒng),保證系統(tǒng)的閱讀和歸檔工作,硬件指可以存儲海量數(shù)據(jù)的物理裝置,檢索系統(tǒng)則是軟硬件的組合,利用人工智能提升網(wǎng)絡(luò)中的信息檢索速度,并且還可以利用人工智能來完善信息存儲,以提升網(wǎng)絡(luò)資訊查詢的效能。

6.2 智能代理技術(shù)

在大數(shù)據(jù)環(huán)境下,以互聯(lián)網(wǎng)為基礎(chǔ)的人工智能已被大量地運用在網(wǎng)絡(luò)信息檢索中。其利用一套軟件程序,在獲得使用者的授權(quán)后,產(chǎn)生一個軟件的代理通訊協(xié)定,方便了軟件和使用者之間的數(shù)據(jù)交流,并為使用者的網(wǎng)頁資訊找到一個比較精確的方法。比如,當使用者需要查找某一項特定的信息時,因為該位置的關(guān)鍵詞不能被識別,所以會給出一個模糊不清的關(guān)鍵詞,然后通過智能代理技術(shù),可以對該詞的檢索痕跡、偏好、習(xí)慣等進行分析,并對該信息進行跟蹤,剔除無效的、無用的信息,最后得到自己需要的資料。該技術(shù)更多地被用于普通的搜索引擎如百度、谷歌和搜狗。但是,智能代理技術(shù)歸類的所有資料也不可能都是精確的,往往會有很多與使用者所要尋找的主題背道而馳的內(nèi)容。但是,因使用方便及精化模糊信息的功能,其仍然是目前最普遍的一種技術(shù)。

在使用智能代理技術(shù)的時候,主要就是將其運用到人工智能中去。例如,它可以幫助使用者在互聯(lián)網(wǎng)上找到合適的網(wǎng)站或者用網(wǎng)站來進行數(shù)據(jù)的下載,而對網(wǎng)上的資源點,可以進行實時的計算和監(jiān)測,如果信息出現(xiàn)了問題,要及時地進行維修和匯報。同時,智能網(wǎng)管可以更好地選擇資源較多、服務(wù)器較寬松的網(wǎng)站,減少了網(wǎng)絡(luò)擁堵的沖擊,從而提升了搜索與下載的速度;同時,在智能信息的處理中,可以讓使用者對網(wǎng)絡(luò)信息進行全面地分析,讓使用者能夠更精確地設(shè)定檢索關(guān)鍵詞,然后利用人工智能來進行搜索,并按照使用者的喜好來選擇合適的信息。

6.3 代理檢索技術(shù)

智能代理技術(shù)在網(wǎng)絡(luò)信息檢索中的運用,可以根據(jù)用戶的喜好來確定適合于不同客戶的搜索服務(wù)。利用人工智能搜索代理技術(shù),可以根據(jù)已有的數(shù)據(jù),對信息進行分析,并根據(jù)不同的數(shù)據(jù)類別,設(shè)計出一套較為科學(xué)的搜索策略。

7 基于人工智能的網(wǎng)絡(luò)信息檢索

在網(wǎng)絡(luò)信息檢索領(lǐng)域,人工智能的具體運用包括:信息篩選、語音識別、圖像識別和視頻檢索等。其可以對信息進行篩選、查詢,并對網(wǎng)絡(luò)信息進行有效的控制,防止垃圾信息和病毒的傳播。而自然語言的處理技術(shù)可以通過將復(fù)雜的語言法則融入到網(wǎng)頁的信息提取中來識別垃圾信息;而語音辨識技術(shù)主要是從使用者的聲音中抽取出信息,利用某種特定的語言法則來進行信息檢索,從而促進網(wǎng)絡(luò)信息的重新排列與整合;影像辨識與影像檢索技術(shù),就是利用電腦或手機上的影像采集裝置,將所檢索的信息轉(zhuǎn)換成影像訊號,并在影像信息中比較所檢索之物的特性與型式等,以選取最精確的信息。

8 結(jié)束語

總之,對網(wǎng)絡(luò)信息檢索的需求在大數(shù)據(jù)時代越來越高。所以,運用人工智能技術(shù)開發(fā)網(wǎng)絡(luò)信息檢索,能夠有效地保證網(wǎng)絡(luò)檢索的有效性和質(zhì)量。將人工智能運用到目前的網(wǎng)絡(luò)信息檢索中,將極大地提高用戶的網(wǎng)絡(luò)信息檢索質(zhì)量和使用效率。

猜你喜歡
資料庫信息檢索使用者
“法定許可”情況下使用者是否需要付費
基于內(nèi)容與協(xié)同過濾的GitHub學(xué)習(xí)資料庫推薦
國家社科基金重大項目“‘古今字’資料庫建設(shè)與相關(guān)專題研究”成果鑒定會順利召開
施工企業(yè)技術(shù)資料庫的建立與完善
天津科技(2020年5期)2020-01-08 12:27:35
新型拼插休閑椅,讓人與人的距離更近
好日子(2018年5期)2018-05-30 16:24:04
抓拍神器
醫(yī)學(xué)期刊編輯中文獻信息檢索的應(yīng)用
新聞傳播(2016年18期)2016-07-19 10:12:06
基于神經(jīng)網(wǎng)絡(luò)的個性化信息檢索模型研究
教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計與實施
河南科技(2014年11期)2014-02-27 14:10:19
公共圖書館信息檢索服務(wù)的實踐探索——以上海浦東圖書館為例
圖書館界(2013年5期)2013-03-11 18:50:29
永兴县| 临汾市| 广元市| 通渭县| 信丰县| 平陆县| 尼勒克县| 巴楚县| 海伦市| 东兴市| 六盘水市| 香河县| 石台县| 泾阳县| 灌南县| 怀远县| 桃江县| 平远县| 东方市| 县级市| 上林县| 应城市| 大丰市| 盐池县| 孝义市| 眉山市| 丰城市| 枞阳县| 历史| 邓州市| 昔阳县| 修文县| 吉安县| 华阴市| 昌平区| 北碚区| 乃东县| 台南市| 桃园市| 沙田区| 台东县|