国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于知識圖譜的軟件工程數據庫設計

2022-05-27 06:56:42陳永芳
智能計算機與應用 2022年5期
關鍵詞:術語分析法圖譜

陳永芳

(茂名職業(yè)技術學院 計算機工程系,廣東 茂名 525000)

0 引 言

根據國家“十四五”規(guī)劃工程實施提案規(guī)定,中國在2020年底將加快工業(yè)軟件的發(fā)展,以實現(xiàn)國家軟件安全和工業(yè)、制造業(yè)的合理轉型,這不僅是軟件工程領域發(fā)展的機遇,也是在實踐過程中面臨的重大挑戰(zhàn)。目前,在軟件工程領域中,通過數據庫構建進行軟件管理,而在數據庫建立過程中,主要通過構建工程知識圖譜進行軟件工程數據庫的研發(fā)、分配、工作推進、故障消除、檢索、推送等,一方面增加了軟件工程數據庫的智能化和管理優(yōu)質,另一方面顯著提升了軟件開發(fā)的質量和效率,使用戶在獲取軟件知識時更便捷、高效。

知識圖譜是指對軟件工程的概念和功能進行多層次、全方位的匯總,進而構建類似思維領域的思維導圖,再通過圖形可視化、應用模型、數學統(tǒng)計和科學統(tǒng)計等手段構建智能化推薦框架,實現(xiàn)對軟件工程資源細致化描述,使各軟件知識在軟件數據庫中獲得快速響應。當前,構建的知識圖譜主要功能是快速檢索、獲取信息資源深度和信息獲取效率提升等,不僅是金融、科學教育、軟件工程和培訓中的重要技術支持,而且是知識圖譜數據源中的重要組成部分之一。

為實現(xiàn)智能化、科技化、合理化且準確化的軟件工程數據庫構建,本文基于軟件工程基礎數據,以知識圖譜為技術手段構建軟件工程數據庫,該數據庫具備全面性、可擴展性、多樣性和經濟性等基礎特征,并通過術語表示、數學模型構建等方法實現(xiàn)對軟件工程數據庫的獲取、查詢和優(yōu)質管理。隨后,通過對軟件工程數據庫知識圖譜數據進行性能、功能雙測試,進而優(yōu)化基于知識圖譜的智慧化信息資源調度系統(tǒng),充分發(fā)揮軟件工程數據庫的綜合經濟效益,實現(xiàn)軟件工程資源信息的可持續(xù)發(fā)展戰(zhàn)略。

1 軟件工程數據庫知識圖譜構建理論及技術

1.1 軟件工程數據庫體系構成

本文為詳細掌握基于知識圖譜的軟件工程數據庫,便于用戶和機構高效、多方面地獲取軟件信息資源,構建軟件工程知識圖譜體系示意圖(見圖1)。通過圖1可知,研究構建體系主要由數據獲取/導入、知識建模和知識融合構成。其中,數據獲取/導入主要通過外部關系數據庫、半結構數據庫和網絡數據庫導入軟件工程信息資源,從而擴展軟件工程知識圖譜的知識素材,實現(xiàn)數據的多元化。知識建模主要分為關系型數據建模和文本關鍵要素識別,是知識圖譜技術的核心內容,其主要功能是通過術語表示、知識抽取和實體建模等過程進行軟件工程資源知識獲取、識別等。知識融合則主要分為知識對齊、圖譜更新內容,這里的知識對齊具體分為實體對齊、屬性對齊和實體關系學習,以此為基礎,通過軟件知識資源的獲取、識別、對齊后實現(xiàn)軟件工程資源數據的更新和融合,進而構建基于知識圖譜可視化、智能化的軟件工程數據庫。

圖1 軟件工程數據庫知識圖譜示意圖Fig.1 Schematic diagram of knowledge map of software engineering database

1.2 知識圖譜架構研究方法

本文通過知識圖譜方法對軟件工程數據庫進行研究。研究中在構建知識圖譜時,主要通過詞頻分析法、關聯(lián)詞分析法和社會網絡分析法等研究方法實現(xiàn)知識圖譜架構。其中,詞頻分析法,通過軟件工程中的關鍵詞,如軟件、科學工程、信息技術等進行索引,將具備相關軟件知識資源的內容匯聚在一起,同時通過關鍵詞頻獲悉詞頻關注度,進而分析關鍵詞探析軟件工程結構、研究熱點等內容,實現(xiàn)知識匯總。關聯(lián)詞分析法,主要通過同類中的相關性,揭示研究對象與對象間的特征關系,進而將有關詞頻加入知識圖譜信息庫,實現(xiàn)軟件工程數據庫的建立。社會網絡分析法,將軟件信息資源擴展到社會各領域中,通過社會分析法,揭示相關領域間的關系和發(fā)展狀態(tài),以量化研究構建社會網絡個體關系模型,通過網絡屬性,探析不同成員間網絡結構特征和社會屬性特征,用于實現(xiàn)軟件工程知識的索引獲取,將知識資源通過知識圖譜技術展示給用戶,使用戶獲取的信息精度和信息量皆為最優(yōu),實現(xiàn)知識圖譜架構體系的優(yōu)質性。

2 軟件工程數據庫知識圖譜設計

2.1 設計原理

2.1.1 數據庫全面性

本文基于知識圖譜技術構建軟件工程數據庫,應用圖像(可視化)和資源數據(數據表示)理論,通過定性、定量化分析應用對關系型數據、半結構型數據和網絡型數據進行匯總,并以軟件工程學科知識和相近管理學科知識作為數據源,實現(xiàn)軟件工程數據的全方位、多層次定位分析,以保障數據信息的安全性和全面性,達到用戶高效獲取信息資源的目的。

2.1.2 數據庫可擴展性

在軟件工程知識圖譜體系構建后,軟件工程專業(yè)知識的內容將更為透徹,但知識在學習中是不斷挖掘和拓展的過程,在不同用戶獲取軟件工程知識、學習知識的過程中,對知識的解譯程度不一,因此,新的軟件知識將不斷涌現(xiàn),并不斷被知識圖譜體系收錄,以此實現(xiàn)了軟件工程數據庫的擴展,知識存儲量也隨即得以提高。

2.1.3 數據庫多樣性和經濟性

本文基于知識圖譜理論和技術所構建的軟件工程數據庫,主要包括軟件工程基礎知識、熱點知識、前言理論知識、前言知識圖譜知識、多層次軟件知識、全方位軟件工程理論等,實現(xiàn)了軟件工程數據庫的多樣化,同時,在一定程度上也為軟件工程理論研究提供了技術支持。在經濟性方面,一方面降低了軟件工程學科和數據庫在知識獲取方面的花銷和周期,另一方面通過相關聯(lián)系知識,提高了用戶的使用概率,發(fā)揮了知識圖譜工具的優(yōu)勢,經濟發(fā)展能力得到提升。

2.2 設計思路

本文通過對軟件工程數據庫知識圖譜進行開發(fā)設計,以利于便捷信息資源的管理和獲取。首先將其主要分為分層次、步驟和模塊三個方面。在分層次中,每層間具有本身的特征屬性,但每層之間又存在著相互管理,通過分析數據資源原理、分層設計后有助于實現(xiàn)軟件工程數據庫知識圖譜的安全、科學管理過程。其次,分步驟中,通過軟件工程知識主體、研究熱點、前沿知識匯總、存儲、特征關聯(lián)和獲取等,將數據庫設計為科學、高效、有管理制度的發(fā)展趨勢,不僅有利于知識圖譜軟件工程數據庫的良性發(fā)展,而且確定了知識的集中性和研究熱點原則。在模塊方面,通過構建知識實體獲取、表示模塊、數據庫構建實現(xiàn)和數據庫功能測試等模塊,不同模塊間相互關聯(lián),遵循數據資源共享、共建原則,以此,有利于知識圖譜技術的可持續(xù)發(fā)展。

2.3 設計構架

圖2為知識圖譜設計框架示意圖。通過圖2可知,軟件工程數據庫知識圖譜設計構架在圖1軟件工程數據庫總體體系上,將其進一步細化為5部分,包括數據庫、數據庫整合、知識表示、圖譜構建和應用服務等。其中,知識表示是主體研究內容,其實體對齊和質量評估是知識圖譜建成的關鍵點,其功能一方面保證了數據獲取過程中的準確性和有效性,另一方面軟件工程數據經對齊特征,將關聯(lián)數據匯總進數據庫,實現(xiàn)了不同層面、不同方位上的知識解讀,知識圖譜研究框架的構建,有利于軟件工程數據庫的可視化數據展示,進一步有效避免了在數據分析、知識資源分析和知識屬性特征認證中的錯誤性和重復性問題。

圖2 知識圖譜設計構架Fig.2 Design framework of knowledge map

2.3.1 術語表示

在知識圖譜架構體系中,術語表示是極為關鍵的,這不僅是知識圖譜中學習概念、實體構建、數據資源和屬性特征語言上的表現(xiàn)形式,而且是相關術語或者數據庫存儲標記的集合體。在構架體系中,術語常有單個字或者多個字、詞組成,在特定的環(huán)境、特定的背景和領域中表達各不同的含義,對同種特征關系的知識圖譜軟件工程數據庫的數據資源解譯是極為重要的。術語表示中,術語抽取是核心內容,主要通過語言規(guī)則和統(tǒng)計學方法進行抽取表示,在統(tǒng)計方法中,統(tǒng)計基準值主要為TF-IDF(Term Frequency-Inverse Document Frequency)、卡方分布和互信息分布等,不僅有效解譯了術語表示信息,而且提高了用戶對軟件工程專業(yè)知識的認知效率。其中,術語表示統(tǒng)計學表達式可分別寫為:

其中,表示最常用的屬于分布特征權重基準;()表示詞頻,即詞匯在文檔中的總次數;()表示文檔頻率,即詞匯在文檔中的數目;表示總文檔數目。

2.3.2 知識表示

在知識圖譜構架體系中,知識表示是指將收集、存儲、轉化和解譯的信息直觀清晰地展示在用戶界面上。在軟件工程數據庫設計中,通過編碼知識、行為、目標、偏好等,給出多個維度評價知識圖譜知識表示,實現(xiàn)知識表示過程中具有足夠多的細節(jié)知識,以及易理解、易傳輸和易提取等。同時為更好地實現(xiàn)知識圖譜數據資源知識表示,本文通過距離模型和單層神經網絡進行數據庫信息知識表示,對此擬做研究分述如下。

(1)距離模型。結構表示方法將頭實體和尾實體通過關系的2個矩陣投影到同一空間,投影向量之間的距離體現(xiàn)了2個實體在關系下的語義相關度。對于每個三元組(,,),損失函數為:

其中,M M 是關系對于頭實體和尾實體投影矩陣。

(2)單層神經網絡。此處涉及的數學公式可寫為:

單層神經網絡模型是結構表示的改進版本,利用神經網絡的非線性減輕結構表示協(xié)同性差的問題。

3 知識圖譜構建系統(tǒng)實現(xiàn)與測試

3.1 數據采集模式庫實現(xiàn)

由于知識圖譜是屬于結構化的詞義知識網絡庫,選取知識概念和相互關系用于知識抽取,進行大量知識的積累,因此,通過知識圖譜可實現(xiàn)數據資源的快速響應。目前,在軟件工程領域中,通過可視化將數據采集的項目、風險等級預測、質量因素等相關信息資源清晰地展示出來,對問題發(fā)現(xiàn)、數據匯總和高效查閱提供了優(yōu)質手段。其次,知識圖譜技術將相同特征信息進行聚類分析處理,很大程度上提高了用戶在海量信息中獲取關鍵術語、概念的精準效率。目前,在軟件工程領域中(常見的百度搜索、天眼系統(tǒng)等),因行業(yè)區(qū)域知識相差較大,為符合實際應用需求,需構建知識圖譜網狀體系進行軟件工程數據庫的設計,從多方面、多層次內為用戶資料獲取提供強力支持。

3.2 系統(tǒng)功能模塊測試

本文為保證知識圖譜系統(tǒng)的各個模塊能進行正常運轉,通過不同測試方法對用戶登錄管理模塊、知識表示模塊、模型模塊等方面進行測試,以探尋可能出現(xiàn)的系統(tǒng)問題,期待預期結果和測試方法見表1。

表1 系統(tǒng)功能測試內容Tab.1 System functional test content

4 結束語

本文通過知識圖譜技術的優(yōu)點特征設計了一類軟件工程數據庫,通過掌握知識圖譜的構架過程及詞頻分析法、關聯(lián)詞分析法和社會網絡分析法等研究方法,首先,深入分析了知識圖譜數據庫的全面性、可擴展性、經濟性等優(yōu)點,其特點是通過軟件工程數據庫實現(xiàn)用戶的信息資源的精準獲取目的。其次,通過對設計構架的知識表示、術語表示等的探討來深入解析知識圖譜原理,以便于軟件工程數據庫的設計、開發(fā)和應用。最后,通過知識圖譜軟件工程數據庫的實現(xiàn)和測評,驗證其資源獲取性能和效率。本文通過知識圖譜軟件工程數據庫的構建,極大提升了用戶項目開發(fā)、軟件工程信息資源調查時的工作效率。

猜你喜歡
術語分析法圖譜
異步機傳統(tǒng)分析法之困難及其克服
防爆電機(2022年4期)2022-08-17 05:59:06
繪一張成長圖譜
基于時間重疊分析法的同車倒卡逃費探析
補腎強身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
主動對接你思維的知識圖譜
層次分析法在SWOT分析法中的應用
AHP和SWOT分析法在規(guī)劃編制中的應用
雜草圖譜
雜草學報(2012年1期)2012-11-06 07:08:33
有感于幾個術語的定名與應用
從術語學基本模型的演變看術語學的發(fā)展趨勢
玉溪市| 汤原县| 涞源县| 大连市| 华容县| 焦作市| 榆中县| 山东省| 弥渡县| 商南县| 甘德县| 鸡泽县| 辽源市| 靖宇县| 宁化县| 丹棱县| 吉木萨尔县| 临沭县| 赣榆县| 威海市| 宁城县| 永昌县| 县级市| 右玉县| 武隆县| 同江市| 永善县| 瓦房店市| 柳州市| 西乌珠穆沁旗| 遵义县| 平乡县| 霍山县| 壤塘县| 东辽县| 镇巴县| 张家口市| 辽阳市| 抚顺县| 聂荣县| 申扎县|