国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于文本信息分析的情報(bào)技術(shù)研究

2020-09-10 15:56:01胡堯強(qiáng)
看世界·學(xué)術(shù)下半月 2020年11期
關(guān)鍵詞:研究

胡堯強(qiáng)

摘要:文本信息作為情報(bào)分析的重要載體,對(duì)我國(guó)情報(bào)技術(shù)的發(fā)展具有非常重要的影響?;诖耍疚木歪槍?duì)情報(bào)技術(shù)中文本信息分析的相關(guān)內(nèi)容進(jìn)行了深入的探究,旨在推動(dòng)我國(guó)情報(bào)學(xué)的全面發(fā)展。

關(guān)鍵詞:文本信息;情報(bào)技術(shù);研究

一、簡(jiǎn)述文本信息分析的概念及重要意義

文本信息分析的具體含義,主要是指運(yùn)用模型理論對(duì)文本信息實(shí)施統(tǒng)計(jì)、分析、理解、轉(zhuǎn)換與生成的過(guò)程?!?】通過(guò)對(duì)情報(bào)信息來(lái)源的具體分析,我們可以從中了解到情報(bào)來(lái)源的主要渠道是通過(guò)十大文獻(xiàn)源及其他相關(guān)資料來(lái)獲取的,這其中包含期刊論文、會(huì)議論文、政府出版物以及產(chǎn)品樣本等,這些文獻(xiàn)資料中蘊(yùn)含著情報(bào)工作所需要的大量信息資料。

文獻(xiàn)信息作為情報(bào)研究工作中極為重要的處理對(duì)象,其通常是以文本形式呈現(xiàn)出來(lái)的,對(duì)文本信息分析的處理流程主要是以檢索為基礎(chǔ)的序化以及信息、知識(shí)和情報(bào)之間的轉(zhuǎn)化,文本信息分析的主要目標(biāo)是能夠更方便快捷的找出情報(bào)工作所需的信息資料,并運(yùn)用相關(guān)知識(shí)對(duì)信息實(shí)施分析處理,由此得出最終的情報(bào)信息。

伴隨科技水平的不斷發(fā)展,推動(dòng)了文本信息分析工作的信息化管理,同時(shí)也對(duì)情報(bào)專(zhuān)家提出了更為嚴(yán)格的要求,如何靈活的運(yùn)用現(xiàn)代化信息技術(shù)來(lái)對(duì)文本信息進(jìn)行收集與整合,從而準(zhǔn)確快速的找出文本信息中有價(jià)值的情報(bào)資料,是每個(gè)情報(bào)專(zhuān)家需要迫切解決的一大問(wèn)題。

二、基于本文信息分析的情報(bào)技術(shù)探究

從語(yǔ)言層面探究文本信息分析的處理過(guò)程

文本信息主要是借助自然語(yǔ)言來(lái)描述與展現(xiàn)的,而文本信息分析從處理單位的層面出發(fā),可以分為詞語(yǔ)分析、句子分析、語(yǔ)段分析以及篇章分析,從分析的層面出發(fā),文本信息則可以劃分為語(yǔ)音分析、語(yǔ)法分析、語(yǔ)形分析、語(yǔ)用分析以及語(yǔ)義分析。對(duì)此,我們可以從以下幾點(diǎn)進(jìn)行詳細(xì)研究:

(一)語(yǔ)法角度探究

通過(guò)對(duì)文字信息語(yǔ)法實(shí)施研究分析后,就可以進(jìn)行針對(duì)性的信息抽取,通過(guò)對(duì)信息抽取技術(shù)的靈活運(yùn)用,就可以順利的展開(kāi)后續(xù)工作,如信息庫(kù)的建設(shè)、列表式搜索、跨語(yǔ)言信息檢索以及輔助審稿等。語(yǔ)法分析主要是針對(duì)句子進(jìn)行分析,其主要包含句子內(nèi)部結(jié)構(gòu)分析和句子相似度匹配分析。針對(duì)相似句子的判斷依據(jù)主要是從詞形相似度、句型結(jié)構(gòu)相似度以及詞序相似度等方面進(jìn)行考量的,并以此為基礎(chǔ),構(gòu)建出相關(guān)的向量空間法、依存結(jié)構(gòu)法以及編輯距離法。

(二)語(yǔ)義角度探究

通過(guò)對(duì)文字信息語(yǔ)義實(shí)施研究分析后,就可以進(jìn)行針對(duì)性的知識(shí)抽取,知識(shí)抽取是以知識(shí)工程實(shí)施的,在構(gòu)建具體的知識(shí)庫(kù)后,便可以進(jìn)行后續(xù)的精細(xì)式知識(shí)組織、知識(shí)推理以及知識(shí)連接等具體工作。語(yǔ)義分析的相關(guān)概念主要體現(xiàn)在以詞法分析和語(yǔ)法分析為前提標(biāo)準(zhǔn),通過(guò)對(duì)知識(shí)庫(kù)中語(yǔ)義知識(shí)的合理運(yùn)用,將語(yǔ)法結(jié)構(gòu)描述轉(zhuǎn)化為以邏輯和概念等知識(shí)表示為基礎(chǔ)的語(yǔ)義表示,通過(guò)對(duì)領(lǐng)域知識(shí)的靈活運(yùn)用將句子的語(yǔ)義加以分析整理,并在此基礎(chǔ)上用過(guò)判斷及推理的方式,展開(kāi)后續(xù)的知識(shí)抽取與發(fā)現(xiàn)、觀點(diǎn)與流派搜索等實(shí)際工作?!?】

(三)語(yǔ)用角度探究

在經(jīng)過(guò)具體的語(yǔ)用研究分析之后,就可以展開(kāi)后續(xù)的風(fēng)格型搜索、學(xué)者自動(dòng)評(píng)價(jià)以及意見(jiàn)挖掘等高級(jí)處理。就目前而言,大部分科學(xué)評(píng)價(jià)都是通過(guò)論文、項(xiàng)目、著作以及專(zhuān)利等信息資料實(shí)施統(tǒng)計(jì)的。而學(xué)位論文的網(wǎng)絡(luò)評(píng)價(jià),則是從學(xué)術(shù)作風(fēng)及學(xué)術(shù)品德等角度來(lái)進(jìn)行具體的評(píng)價(jià)工作的。

(四)詞法角度探究

文本信息的詞法主要包體現(xiàn)在自動(dòng)分詞、詞性標(biāo)注以及詞頻統(tǒng)計(jì)等方面,通過(guò)對(duì)數(shù)據(jù)適時(shí)預(yù)處理后,盡可以進(jìn)行抽取特征詞構(gòu)建矩陣向量,借助向量空間模型、支持向量機(jī)以及潛在語(yǔ)義標(biāo)引等模型加以計(jì)算,從而實(shí)現(xiàn)分類(lèi)、聚類(lèi)與共詞分析等目的。

三、從智能層面探究文本信息分析的處理方法

在進(jìn)行具體的文本信息處理工作時(shí),我們不能忽視情報(bào)與智能之間存在的關(guān)聯(lián)性,處理的過(guò)程離不開(kāi)智能,而處理的目標(biāo)則是為了獲取有價(jià)值的情報(bào)信息,情報(bào)學(xué)的核心目的在于如何加強(qiáng)對(duì)智能的科學(xué)運(yùn)用。因此,情報(bào)學(xué)的發(fā)展進(jìn)步是無(wú)法脫離智能而獨(dú)立進(jìn)行的。人工智能與計(jì)算機(jī)定性相關(guān)的較為常見(jiàn)的處理方法主要包括神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、模糊決策樹(shù)、潛在語(yǔ)義分析等。下面我們就針對(duì)文本信息分析的幾種智能處理方法進(jìn)行了詳細(xì)的研究。

(一)決策樹(shù)

決策樹(shù)是以實(shí)例為基點(diǎn)的歸納學(xué)習(xí)算法,它可以針對(duì)一組無(wú)規(guī)則、無(wú)次序的事例推理出決策樹(shù)表示方式的分類(lèi)規(guī)則。通過(guò)自頂向下的遞歸方式,將決策樹(shù)內(nèi)部節(jié)點(diǎn)的屬性值進(jìn)行比較,并依據(jù)不同的屬性值來(lái)對(duì)該節(jié)點(diǎn)向下的分支加以判斷,在決策樹(shù)的葉節(jié)點(diǎn)得出最終結(jié)論。決策樹(shù)被廣泛運(yùn)用于文本分類(lèi)、數(shù)據(jù)挖掘、機(jī)器翻譯和知識(shí)發(fā)現(xiàn)等技術(shù)領(lǐng)域。

(二)支持向量機(jī)

支持向量機(jī)主要是由貝爾實(shí)驗(yàn)室研究小組所提出的一個(gè)技術(shù)理論,它是以計(jì)算學(xué)習(xí)理論的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則為基礎(chǔ)的,可以有效的解決線性不可分的問(wèn)題。在實(shí)際的分類(lèi)問(wèn)題中,支持向量機(jī)技術(shù)原理主要體現(xiàn)在通過(guò)在高維空間中尋找一個(gè)超平面作為兩類(lèi)的分割,以此來(lái)保障錯(cuò)誤分割率控制在最小值。支持向量機(jī)主要應(yīng)用于文本分類(lèi)和數(shù)據(jù)挖掘等技術(shù)領(lǐng)域。

(三)貝葉斯網(wǎng)絡(luò)

貝葉斯網(wǎng)絡(luò)作為一種圖形模式,其主要作用是用來(lái)表示變量間的連接概率的,它能夠準(zhǔn)確的發(fā)現(xiàn)數(shù)據(jù)之間的內(nèi)部關(guān)系。貝葉斯理論明確了信任函數(shù)在數(shù)學(xué)中的計(jì)算方法,其具備相對(duì)穩(wěn)定的數(shù)學(xué)基礎(chǔ),與此同時(shí)它還展現(xiàn)了信任度跟隨證據(jù)而變化的增量學(xué)習(xí)特征。貝葉斯可應(yīng)用于文本分類(lèi)、態(tài)勢(shì)估計(jì)以及熱點(diǎn)監(jiān)測(cè)等技術(shù)領(lǐng)域?!?】

(四)遺傳算法

遺傳算法,主要是基于某一隨機(jī)而生的抑或特定的初識(shí)群體出發(fā),依據(jù)一定的操作準(zhǔn)則,如選擇、復(fù)制、變異以及交叉等,在逐步的迭代計(jì)算后,依據(jù)不同個(gè)體的適應(yīng)度值,實(shí)現(xiàn)優(yōu)勝劣汰。遺傳算法的特點(diǎn)主要體現(xiàn)在直接對(duì)結(jié)構(gòu)對(duì)象實(shí)施操作,不存在求導(dǎo)與函數(shù)連續(xù)性的具體限定,具備內(nèi)在的隱并行性及良好的全局尋優(yōu)性能,通過(guò)對(duì)概率化尋優(yōu)方式的巧妙運(yùn)用,可以自動(dòng)獲取搜索環(huán)節(jié)中的相關(guān)知識(shí)并以此來(lái)對(duì)優(yōu)化過(guò)程進(jìn)行指導(dǎo)。遺傳算法從數(shù)學(xué)層面來(lái)看,屬于一種概率性搜索算法,而從工程學(xué)層面來(lái)看,則屬于一種自適應(yīng)的迭代尋優(yōu)過(guò)程。遺傳算法主要被應(yīng)用于情報(bào)采集、文獻(xiàn)聚類(lèi)、知識(shí)工程以及信息抽取等技術(shù)領(lǐng)域。

(五)神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)的技術(shù)原理主要是模仿人腦神經(jīng)網(wǎng)絡(luò)的具體結(jié)構(gòu)和某部分工作機(jī)制,運(yùn)用多種神經(jīng)元構(gòu)建網(wǎng)絡(luò),最終實(shí)現(xiàn)大規(guī)模并行計(jì)算的求解方法。每個(gè)神經(jīng)元的輸出都連接著另一個(gè)神經(jīng)元的輸入。神經(jīng)元的輸出值是通過(guò)神經(jīng)元輸入與閾值的加權(quán)函數(shù)來(lái)共同計(jì)算得出的。神經(jīng)網(wǎng)絡(luò)主要應(yīng)用于文本分類(lèi)、智能檢索、文本聚類(lèi)、自動(dòng)分詞以及數(shù)據(jù)挖掘等技術(shù)領(lǐng)域。

結(jié)語(yǔ):

綜上所述,文本信息作為情報(bào)分析的重要來(lái)源,對(duì)情報(bào)學(xué)的整體發(fā)展具有非常重要的價(jià)值。因此,相關(guān)部門(mén)應(yīng)具備與時(shí)俱進(jìn)的發(fā)展眼光,結(jié)合先進(jìn)的現(xiàn)代化技術(shù),來(lái)不斷完善與創(chuàng)新情報(bào)分析的相關(guān)技術(shù),實(shí)現(xiàn)情報(bào)技術(shù)領(lǐng)域的不斷突破。

參考文獻(xiàn):

[1]遲玉琢.2018年我國(guó)情報(bào)學(xué)研究進(jìn)展[J].山東圖書(shū)館學(xué)刊,2019(04):24-31+54.

[2]張?jiān)?,楊建?從學(xué)科交叉視角看國(guó)內(nèi)情報(bào)學(xué)的學(xué)科地位與發(fā)展思考[J].情報(bào)理論與實(shí)踐,2019,42(04):18-23.

[3]王鵬.“互聯(lián)網(wǎng)+”環(huán)境下的科技情報(bào)發(fā)展趨勢(shì)及團(tuán)隊(duì)建設(shè)[J].競(jìng)爭(zhēng)情報(bào),2018,14(03):23-28.

猜你喜歡
研究
FMS與YBT相關(guān)性的實(shí)證研究
2020年國(guó)內(nèi)翻譯研究述評(píng)
遼代千人邑研究述論
視錯(cuò)覺(jué)在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
關(guān)于遼朝“一國(guó)兩制”研究的回顧與思考
EMA伺服控制系統(tǒng)研究
基于聲、光、磁、觸摸多功能控制的研究
電子制作(2018年11期)2018-08-04 03:26:04
新版C-NCAP側(cè)面碰撞假人損傷研究
關(guān)于反傾銷(xiāo)會(huì)計(jì)研究的思考
焊接膜層脫落的攻關(guān)研究
電子制作(2017年23期)2017-02-02 07:17:19
台北市| 武鸣县| 唐山市| 长沙市| 临清市| 乌兰浩特市| 平邑县| 河东区| 新兴县| 天峻县| 遂平县| 北宁市| 肃北| 沙洋县| 封开县| 尼玛县| 囊谦县| 沁源县| 乌拉特中旗| 绥江县| 潞城市| 侯马市| 原阳县| 洛川县| 喀喇| 黔东| 梧州市| 兰西县| 饶阳县| 保靖县| 同江市| 华坪县| 海淀区| 章丘市| 和平县| 华阴市| 阿坝| 拜城县| 富宁县| 修文县| 乐山市|