李卓 顏少偉 符樹雄 余加喜 黎值源
摘 要:針對(duì)傳統(tǒng)搜索引擎在電力專業(yè)領(lǐng)域中對(duì)查詢條件搜索耗時(shí)較長(zhǎng)的問(wèn)題,開展對(duì)電力調(diào)控智能搜索引擎關(guān)鍵技術(shù)研究。通過(guò)基于自然語(yǔ)言處理的電力調(diào)控語(yǔ)言處理和智能搜索引擎推理控制策略,設(shè)計(jì)一種基于自然語(yǔ)言處理的電力調(diào)控智能搜索引擎。通過(guò)實(shí)驗(yàn)證明,該引擎與傳統(tǒng)引擎相比可有效縮短搜索耗時(shí),進(jìn)一步提高搜索引擎的效率。
關(guān)鍵詞:自然語(yǔ)言處理;電力調(diào)控;智能搜索引擎;關(guān)鍵技術(shù)
中圖分類號(hào):TP391.3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1001-5922(2021)05-0085-03
Research on Key Technologies of Power Control Intelligent Search Engine Based on Natural Language Processing
Li Zhuo,Yan Shaowei,F(xiàn)u Shuxiong,Yu Jiaxi,Li Zhiyuan
(Power Dispatching Control Center of Hainan Power Grid Co., Ltd., Haikou 570000, China)
Abstract:Aiming at the problem that traditional search engines take a long time to search for query conditions in the field of electric power, the research on key technologies of electric search and control intelligent search engines is conducted. Through the power control language processing based on natural language processing and intelligent search engine reasoning control strategy, a power control intelligent search engine based on natural language processing is designed. Experiments have proved that this engine can effectively reduce the search time and improve the efficiency of search engines compared with traditional engines.
Key words:natural language processing; power control; intelligent search engine; key technologies;
0 引言
現(xiàn)代化科技的快速發(fā)展促進(jìn)著搜索引擎技術(shù)的不斷進(jìn)步,針對(duì)各種問(wèn)題類型的搜索引擎層出不窮,但目前針對(duì)電力企業(yè)中的相關(guān)專業(yè)性質(zhì)更強(qiáng)的搜索引擎較少,造成了電力知識(shí)的利用率被嚴(yán)重制約。目前傳統(tǒng)搜索引擎的構(gòu)成主要包括上位機(jī)中的人機(jī)交互界面、全球廣域網(wǎng)服務(wù)器以及網(wǎng)絡(luò)瀏覽器[1]。當(dāng)用戶在人機(jī)交互界面中,通過(guò)瀏覽器輸入相應(yīng)的檢索內(nèi)容,再通過(guò)全球廣域網(wǎng)服務(wù)器在數(shù)據(jù)庫(kù)中搜索相應(yīng)的內(nèi)容,最后將搜索結(jié)果返回給用戶。這種搜索引擎應(yīng)用到電力領(lǐng)域中,一方面會(huì)造成搜索結(jié)果與用戶所需存在較大差異,主要原因是由于搜索結(jié)果的數(shù)量過(guò)多,且結(jié)果精準(zhǔn)度不高,冗余結(jié)果信息過(guò)多;另一方面,會(huì)出現(xiàn)電力知識(shí)量少、效率低等問(wèn)題。當(dāng)前,自然語(yǔ)言的處理是人工智能領(lǐng)域研究學(xué)者們重點(diǎn)研究的內(nèi)容之一,利用自然語(yǔ)言處理可以有效地實(shí)現(xiàn)人與計(jì)算機(jī)之間利用自然語(yǔ)言進(jìn)行通信。自然語(yǔ)言處理涉及計(jì)算機(jī)科學(xué)領(lǐng)域、人工智能領(lǐng)域、語(yǔ)言學(xué)領(lǐng)域等多個(gè)學(xué)科領(lǐng)域的綜合處理方法。對(duì)此,本文利用自然語(yǔ)言處理的優(yōu)勢(shì),開展基于自然語(yǔ)言處理的電力調(diào)控智能搜索引擎關(guān)鍵技術(shù)研究。
1 基于自然語(yǔ)言處理的電力調(diào)控智能搜索引擎
1.1 自然語(yǔ)言處理
在文章中提出的電力調(diào)控智能搜索引擎總體框架結(jié)構(gòu)中,對(duì)電力調(diào)控語(yǔ)言的處理主要包括查詢內(nèi)容概念提取、查詢擴(kuò)展以及自動(dòng)文摘。概念提取主要是利用自然語(yǔ)言處理技術(shù)中的漢語(yǔ)分詞實(shí)現(xiàn),查詢擴(kuò)展主要利用自然語(yǔ)言處理技術(shù)中的短語(yǔ)識(shí)別及同義詞處理實(shí)現(xiàn)。
漢語(yǔ)分詞是將由用戶端發(fā)送的初始查詢條件劃分為多個(gè)不同的關(guān)鍵詞,對(duì)于英文而言,一個(gè)單獨(dú)的詞語(yǔ)即可作為一個(gè)關(guān)鍵詞。而對(duì)于漢語(yǔ)而言大量電力調(diào)控語(yǔ)言存在著不同的含義,對(duì)于某些特殊的漢字,分詞可能存在較多的結(jié)果差異。例如,用戶端發(fā)送的初始查詢?yōu)椤半娏ο到y(tǒng)”,則通過(guò)分詞處理后,可能產(chǎn)生“電力系統(tǒng)”、“電力”、“系統(tǒng)”三種不同的關(guān)鍵詞分詞結(jié)果。因此在用戶搜索時(shí)會(huì)產(chǎn)生與上述三種關(guān)鍵詞相關(guān)的大量與用戶主觀搜索內(nèi)容不相關(guān)冗余結(jié)果。對(duì)于上述這一問(wèn)題的產(chǎn)生,可通過(guò)在知識(shí)庫(kù)中對(duì)上述類似漢字進(jìn)行總結(jié)、分析,并計(jì)算出每個(gè)漢字組成出現(xiàn)的概率以及相關(guān)詞語(yǔ)之間的關(guān)聯(lián)信息,從而在最大程度上排除容易產(chǎn)生歧義的搜索結(jié)果,準(zhǔn)確地表達(dá)出用戶所需的查詢請(qǐng)求及相應(yīng)的文檔信息。
查詢擴(kuò)展中的短語(yǔ)識(shí)別是將用戶輸入的初始查詢內(nèi)容概念提取后,根據(jù)相應(yīng)的語(yǔ)法結(jié)構(gòu)從知識(shí)庫(kù)中搜索相應(yīng)的知識(shí)。由于漢語(yǔ)語(yǔ)法存在一定的復(fù)雜性,因此當(dāng)用戶使用漢語(yǔ)在電力調(diào)控智能搜索引擎中查詢時(shí),需要對(duì)漢語(yǔ)短語(yǔ)中的語(yǔ)法結(jié)構(gòu)進(jìn)行適當(dāng)?shù)姆纸M。例如,當(dāng)查詢內(nèi)容為“電力的運(yùn)營(yíng)”時(shí),短語(yǔ)中的“電力”與“運(yùn)營(yíng)”是存在一定的關(guān)聯(lián)性的,因此,若不將二者聯(lián)系在一起則會(huì)出現(xiàn)分別與“電力”和“運(yùn)營(yíng)”相關(guān)的冗余知識(shí),降低搜索結(jié)果的精準(zhǔn)度。
查詢擴(kuò)展中的同義詞處理是將用戶輸入的初始查詢內(nèi)容概念提取后,電力調(diào)控智能搜索引擎自動(dòng)根據(jù)概念中的內(nèi)容去查詢同義詞典,并加入新的概念。擴(kuò)展出的概念是整個(gè)概念集中各個(gè)概念的同義詞,因此,用戶端發(fā)出的最終的查詢請(qǐng)求是由概念集中各個(gè)概念以及其相互之間的同義詞構(gòu)成。假設(shè)概念集為A={a1,a2,a3,…,an},經(jīng)過(guò)同義詞處理后將得到:B={A(a1),A(a2),A(a3),…,A(an)},其中A(a1)表示為同義詞典中與a1有相同語(yǔ)義的概念集。同義詞處理的一種方法是通過(guò)人工構(gòu)造同義詞表。由于本文設(shè)計(jì)的電力調(diào)控智能搜索引擎是針對(duì)電力企業(yè)這一專業(yè)領(lǐng)域而提出的,因此利用人工構(gòu)造的方式可以有效提高構(gòu)建同義詞表的效率。
自動(dòng)文摘是在搜索引擎將搜索知識(shí)返回到文檔中的簡(jiǎn)要概述,是語(yǔ)言理解和語(yǔ)言生成的綜合結(jié)果。語(yǔ)言理解是對(duì)文檔中的每個(gè)語(yǔ)句進(jìn)行語(yǔ)義及語(yǔ)法上的分析,當(dāng)完成對(duì)全篇所有內(nèi)容分析后,準(zhǔn)確地將文章所要表達(dá)的意思理解。語(yǔ)言生成則是利用符合文章語(yǔ)義的恰當(dāng)詞匯及語(yǔ)句表達(dá)文章的總體內(nèi)容。本文提出一種更加有效的文摘構(gòu)建方法,將被提取出的搜索結(jié)果文檔中權(quán)值最高的概念作為返回到用戶端的文摘,用戶可通過(guò)各個(gè)獨(dú)立的概念推理出文章的中心現(xiàn)象,以及找出自己所需的知識(shí)。
1.2 電力調(diào)控智能搜索引擎及引擎推理控制策略
基于自然語(yǔ)言處理的優(yōu)勢(shì),該搜索引擎的總體框架結(jié)構(gòu)是由知識(shí)庫(kù)、用戶端、自然語(yǔ)言處理以及相關(guān)的推理控制策略構(gòu)成,如圖1所示。
由于在電力調(diào)控智能搜索引擎中用戶端的用戶具備一定的語(yǔ)言知識(shí)以及對(duì)現(xiàn)實(shí)世界的認(rèn)知,因此選用自然語(yǔ)言處理實(shí)現(xiàn)人機(jī)交互對(duì)于用戶端而言十分簡(jiǎn)單,而智能搜索引擎內(nèi)部的知識(shí)庫(kù)結(jié)構(gòu)應(yīng)當(dāng)根據(jù)自然語(yǔ)言習(xí)慣,將電力調(diào)控語(yǔ)言進(jìn)行相應(yīng)的推理組成[2]。下面將針對(duì)本文提出的智能搜索引擎中基于自然語(yǔ)言處理的電力調(diào)控語(yǔ)言處理及智能搜索引擎推理控制策略進(jìn)行詳細(xì)的設(shè)計(jì)說(shuō)明。
智能搜索引擎推理控制策略主要可分為沖突消除策略和推理方向策略。沖突消除策略主要針對(duì),在推理過(guò)程中,智能搜索引擎會(huì)根據(jù)當(dāng)前用戶端所有的搜索內(nèi)容,對(duì)知識(shí)[3]庫(kù)中的知識(shí)進(jìn)行檢索。從而找到與實(shí)際內(nèi)容匹配的知識(shí)。當(dāng)找到的匹配知識(shí)為多條時(shí),需要根據(jù)沖突消除策略從眾多知識(shí)中進(jìn)行推理,從而將最貼近初始查詢的知識(shí)返回到用戶端。將沖突消除策略中的排序方式分為:優(yōu)先度排序、詳細(xì)度排序以及電力專業(yè)領(lǐng)域特點(diǎn)排序3種。優(yōu)先度排序是將存儲(chǔ)在知識(shí)庫(kù)中的每項(xiàng)知識(shí)設(shè)定對(duì)應(yīng)的優(yōu)先度參數(shù),優(yōu)先度更高的知識(shí)首先進(jìn)行執(zhí)行;詳細(xì)度排序是針對(duì)初始查詢內(nèi)容中條件較多、較為詳細(xì)的搜索內(nèi)容制定的排序規(guī)則,將與用戶搜索的內(nèi)容更接近、更詳細(xì)的結(jié)果返回到用戶端;電力專業(yè)領(lǐng)域特點(diǎn)排序是根據(jù)電力專業(yè)的特點(diǎn),在這眾多檢索結(jié)果中挑選出與電力專業(yè)相關(guān)的內(nèi)容返回到用戶端。
推理方向策略可分為正向推理控制策略和反向推理控制策略。正向推理控制策略的具體流程為:用戶端發(fā)出初始查詢;電力調(diào)控智能搜索引擎根據(jù)搜索內(nèi)容在知識(shí)庫(kù)中找到相應(yīng)匹配可用的知識(shí);利用沖突消除策略選出最優(yōu)化的搜索目標(biāo);在對(duì)應(yīng)數(shù)據(jù)庫(kù)中檢索;獲取檢索結(jié)果;判斷結(jié)果是否符合查詢要求,符合則將查詢結(jié)果顯示在用戶端界面中。反省推理控制策略的具體流程為:用戶端發(fā)出初始查詢;電力調(diào)控智能搜索引擎根據(jù)搜索內(nèi)容在知識(shí)庫(kù)中找到較多匹配可用的信息;再次檢索可用信息當(dāng)中的相關(guān)知識(shí),并判斷相關(guān)知識(shí)中所包含的條件是否完全滿足用戶會(huì)話,若滿足則將該知識(shí)的搜索目標(biāo)發(fā)送到當(dāng)前的數(shù)據(jù)庫(kù)中進(jìn)行檢索,若不滿足則將該知識(shí)作為條件,重新檢索目標(biāo),直到各個(gè)子搜索目標(biāo)全部出現(xiàn)為止,得到搜索結(jié)果;最后將搜索結(jié)果顯示在用戶端界面中。
2 實(shí)驗(yàn)論證分析
為了驗(yàn)證本文設(shè)計(jì)的基于自然語(yǔ)言處理的電力調(diào)控智能搜索引擎對(duì)電力調(diào)控語(yǔ)言查詢的有效性,設(shè)計(jì)了如下對(duì)比實(shí)驗(yàn):
為了保證實(shí)驗(yàn)結(jié)果的客觀性,將電力專業(yè)領(lǐng)域的相關(guān)內(nèi)容構(gòu)建兩種引擎統(tǒng)一的知識(shí)庫(kù),在用戶端提出5個(gè)與電力專業(yè)相關(guān)的查詢內(nèi)容,并對(duì)應(yīng)查詢內(nèi)容設(shè)置標(biāo)準(zhǔn)的5個(gè)查詢結(jié)果,在查詢的過(guò)程中分別利用本文設(shè)計(jì)的引擎和傳統(tǒng)引擎對(duì)初始查詢條件進(jìn)行查詢?cè)O(shè)置本文引擎搜索為實(shí)驗(yàn)組,傳統(tǒng)引擎搜索為對(duì)照組,記錄兩種方法獲取到最終標(biāo)準(zhǔn)搜索結(jié)果的用時(shí),如表1所示。
根據(jù)表1中的實(shí)驗(yàn)結(jié)果可以看出,實(shí)驗(yàn)組在對(duì)5個(gè)不同的初始查詢條件搜索時(shí)消耗的時(shí)間明顯小于對(duì)照組的消耗時(shí)間。其主要原因是在兩種引擎搜索的過(guò)程中,本文引擎可利用自然語(yǔ)言處理及推理控制策略,在知識(shí)庫(kù)中眾多的知識(shí)內(nèi)容中篩選出更加符合初始查詢條件的知識(shí)內(nèi)容,而傳統(tǒng)引擎則是將與初始查詢條件相關(guān)的所有知識(shí)全部檢索,造成了大量冗余知識(shí)產(chǎn)生,嚴(yán)重制約著其搜索速度。因此,通過(guò)對(duì)比實(shí)驗(yàn)證明,本文設(shè)計(jì)的基于自然語(yǔ)言處理的電力調(diào)控智能搜索引擎可有效提高傳統(tǒng)搜索引擎的搜索速度,進(jìn)一步提高引擎整體運(yùn)行的效率。
3 結(jié)語(yǔ)
智能搜索引擎也將不斷地完善和提高。文章在對(duì)電力調(diào)控智能搜索引擎關(guān)鍵技術(shù)進(jìn)行研究的同時(shí),利用自然語(yǔ)言處理提出了一種全新的基于自然語(yǔ)言處理的電力調(diào)控智能搜索引擎,將自然語(yǔ)言處理中的漢語(yǔ)分詞、語(yǔ)句識(shí)別和同義詞處理等技術(shù)應(yīng)用到搜索引擎中,是實(shí)現(xiàn)電力專業(yè)領(lǐng)域信息時(shí)代對(duì)搜索引擎智能化挑戰(zhàn)的有效手段。
參考文獻(xiàn)
[1] 閃鑫,陸曉,翟明玉,等.人工智能應(yīng)用于電網(wǎng)調(diào)控的關(guān)鍵技術(shù)分析[J].電力系統(tǒng)自動(dòng)化,2019,43(01):49-57.
[2]薛蕾,井天軍,陳義,等.基于相似搜索與多開端重組的配電網(wǎng)兩時(shí)間尺度無(wú)功協(xié)調(diào)控制[J].電網(wǎng)與清潔能源,2019,35(05):10-19.
[3]蘇適,李康平,嚴(yán)玉廷,等.基于密度空間聚類和引力搜索算法的居民負(fù)荷用電模式分類模型[J].電力自動(dòng)化設(shè)備,2018,38(01):129-136.
[4]李功新.基于可拓推演方法的調(diào)控一體防誤操作系統(tǒng)研究與應(yīng)用[D].武漢:武漢大學(xué),2014.
[5]辛耀中,米為民,蔣國(guó)棟,等.基于CIM/E的電網(wǎng)調(diào)度中心應(yīng)用模型信息共享方案[J].電力系統(tǒng)自動(dòng)化,2013,37(08):1-5.
[6]蔣宏圖,袁越,程偉.智能變電站站控層在線防誤的設(shè)計(jì)與實(shí)現(xiàn)[J].電力自動(dòng)化設(shè)備,2013,33(08):147-151.
[7]盧君波,李小敏.基于人工智能的電網(wǎng)調(diào)控技術(shù)研究與分析[J].粘接,2019(11):178-181.
[8] 郝杰.智能電網(wǎng)調(diào)度控制系統(tǒng)安全技術(shù)基本框架研究[J].粘接,2020(07):104-107.
[9] 李陽(yáng),朱伯濤,胡志亮,等.物聯(lián)網(wǎng)技術(shù)在電力智能監(jiān)控系統(tǒng)中的應(yīng)用探究[J].微型電腦應(yīng)用,2020(11):154-156+167