劉冰 惠泉 譚笑 曹燕 張栩赫 孫大微 樊建春
摘 要:闡述了油氣管道標準數(shù)字化應(yīng)用研究工作以及機器可讀標準研究的重要意義,提出了制程一體的油氣管網(wǎng)標準機器可讀標準實現(xiàn)的總體思路和實施路徑,建立了油氣管道機器可讀標準標簽集,開展了機器可讀標準輔助工具設(shè)計與開發(fā),研制了標準智能編寫與分析工具并進行了驗證與應(yīng)用,同時結(jié)合國際和國內(nèi)標準數(shù)字化技術(shù)發(fā)展趨勢對油氣管道機器標準的未來研究方向進行了展望。
關(guān)鍵詞:標準,數(shù)字化,油氣管道,機器可讀標準,人工智能
0 引 言
數(shù)字經(jīng)濟已經(jīng)成為全球經(jīng)濟發(fā)展的主線,在推動數(shù)字經(jīng)濟發(fā)展過程中,數(shù)字化轉(zhuǎn)型強力推進了各大行業(yè)實現(xiàn)顛覆性創(chuàng)新,需充分利用數(shù)字化技術(shù),利用新流程和架構(gòu),研究以數(shù)據(jù)、模型、程序、軟件工具等為重點的新標準形態(tài),從而促進數(shù)字經(jīng)濟和傳統(tǒng)經(jīng)濟深度融合。標準數(shù)字化不僅關(guān)乎各行業(yè)數(shù)字化轉(zhuǎn)型能力和效力,也決定數(shù)字經(jīng)濟發(fā)展動力和潛力,更決定未來參與國際合作的實力、融入國際貿(mào)易體系的競爭力、引領(lǐng)國際發(fā)展的領(lǐng)導(dǎo)力。黨的十八大以來,以習(xí)近平同志為核心的黨中央高度重視數(shù)字化發(fā)展,明確提出“十四五”時期要加快數(shù)字經(jīng)濟發(fā)展,以數(shù)字化轉(zhuǎn)型整體驅(qū)動生產(chǎn)方式、生活方式和治理方式變革。2018年,習(xí)近平總書記在中國科學(xué)院第十九次院士大會等會上的講話中提出,要把握數(shù)字化、網(wǎng)絡(luò)化、智能化融合發(fā)展的契機,推動互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實體經(jīng)濟深度融合[1]。
2021年3月,《中華人民共和國國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》中將加快數(shù)字化發(fā)展建設(shè)數(shù)字中國作為獨立篇章提出,其中標準數(shù)字化是數(shù)字經(jīng)濟、數(shù)字社會、數(shù)字政府建設(shè)的標準化基礎(chǔ)。2021年10月發(fā)布的《國家標準化發(fā)展綱要》中明確要求,發(fā)展機器可讀標準、開源標準,推動標準化工作向數(shù)字化、網(wǎng)絡(luò)化、智能化轉(zhuǎn)型[2]。為落實國家戰(zhàn)略和黨中央數(shù)字化戰(zhàn)略決策部署,滿足國家管網(wǎng)集團公司標準化管理和研究的迫切需要,有必要整合和升級原有標準信息化技術(shù),并應(yīng)用先進的數(shù)字化技術(shù)與智能化技術(shù),逐漸形成油氣管網(wǎng)領(lǐng)域特色的標準數(shù)字化系列技術(shù),為集團公司標準化業(yè)務(wù)高質(zhì)量發(fā)展提供支撐。
1 研究意義
1.1 開展油氣管道標準數(shù)字化研究工作的意義
(1)落實國家戰(zhàn)略和黨中央數(shù)字化戰(zhàn)略決策部署的最重要舉措
國家管網(wǎng)集團堅決貫徹黨中央決策部署,把數(shù)字化戰(zhàn)略作為公司發(fā)展的“四大戰(zhàn)略”之一,把數(shù)字化轉(zhuǎn)型作為事關(guān)全局的系統(tǒng)性變革、事關(guān)長遠發(fā)展的關(guān)鍵舉措、事關(guān)員工福祉的重點任務(wù)來謀劃和推動,以數(shù)字化轉(zhuǎn)型,也包括充分發(fā)揮標準數(shù)字化基礎(chǔ)支撐作用,支撐國家管網(wǎng)集團建設(shè)中國特色世界一流能源基礎(chǔ)設(shè)施運營商。
(2) 集團公司標準化管理和研究的迫切需要
《國家管網(wǎng)集團標準化業(yè)務(wù)“十四五”發(fā)展規(guī)劃》提出的“123456”的總體思路明確指出“高質(zhì)量開展標準數(shù)字化和標準管理工作”,要求實現(xiàn)標準全生命周期數(shù)字化研編、管理和應(yīng)用,促進標準與業(yè)務(wù)的深度融合,全面提升標準數(shù)字化水平。在《國家管網(wǎng)集團標準化業(yè)務(wù)“十四五”發(fā)展規(guī)劃》的指引下,需要研究最新的標準數(shù)字化技術(shù),實現(xiàn)集團公司標準管理和標準研究全過程數(shù)字化。
(3)原有標準信息化技術(shù)迭代更新的需要
自2009年以來,科技中心逐步研發(fā)形成了標準內(nèi)容揭示技術(shù)、標準可視化技術(shù)、移動檢索技術(shù)等技術(shù)[3],這些技術(shù)為管網(wǎng)標準化領(lǐng)域的發(fā)展提供了重要支撐,特別是標準信息的快速查詢和標準內(nèi)容與指標對比等檢索技術(shù),處于國內(nèi)標準化領(lǐng)域的領(lǐng)先地位。但隨著近年信息化、數(shù)字化技術(shù)的飛速發(fā)展,原有技術(shù)急需迭代升級、更新?lián)Q代。
1.2 機器可讀標準是標準數(shù)字化轉(zhuǎn)型的核心內(nèi)容和關(guān)鍵難點
機器可讀標準是標準數(shù)字化轉(zhuǎn)型的核心內(nèi)容和關(guān)鍵難點,這種新型數(shù)字化標準以機器作為標準的直接使用對象,具有標準文本模塊化、內(nèi)容語義化、互操作化、訪問交互智能化等特征,可實現(xiàn)“標準即軟件”“標準即數(shù)據(jù)”“標準即服務(wù)”等新型標準應(yīng)用模式[4-6]。
《國家標準化發(fā)展綱要》中明確提出“發(fā)展機器可讀標準、開源標準,推動標準化工作向數(shù)字化、網(wǎng)絡(luò)化、智能化轉(zhuǎn)型”?!吨袊鴺藴?035》《全國標準化工作要點》等我國標準化頂層規(guī)劃文件中均提出推進標準數(shù)字化轉(zhuǎn)型,油氣管網(wǎng)領(lǐng)域開展機器可讀標準研究和試點工作,探索國家、行業(yè)、團體、企業(yè)各級標準新形式和新模式[4-6]。
2 油氣管網(wǎng)標準機器可讀標準實現(xiàn)的總體思路和實施路徑
該項研究與實踐的最終目標就是用科技和數(shù)字化推動轉(zhuǎn)型發(fā)展,圍繞打造智慧生態(tài)管網(wǎng),推進管道設(shè)計、建設(shè)、運維、服務(wù)、管理等與大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算融合發(fā)展,實現(xiàn)服務(wù)方、資源方、客戶方、輸送方和消費者數(shù)據(jù)共享、生態(tài)共融、產(chǎn)業(yè)升級。在此基礎(chǔ)上應(yīng)用先進的標準數(shù)字化技術(shù),給整個行業(yè)帶來全新的模式和體驗,總體技術(shù)框架和思路如圖1所示。
總體技術(shù)路徑和思路是以實現(xiàn)制程融合“三位一體”為最終目標,統(tǒng)一規(guī)劃,分步實施(如圖2所示),具體包括制程“管理機制”一體、制程“管理文件”一體和制程“管理平臺”一體。
2.1 制程“管理機制”一體的實現(xiàn)
通過梳理制程管理的組織架構(gòu)與職責(zé)分工詳細情況,將其整合為一套組織保障機制。全面梳理包括立項、起草、審核、審議與發(fā)布、實施、評價、監(jiān)督與考核等環(huán)節(jié)在內(nèi)的制程管理的運行機制,將其整合為一套運營管理機制。以制程管理為載體,并進一步明確與其他所有體系的關(guān)系。對全集團制程管理要求進行整合,形成一套工作規(guī)劃與實施路徑。
2.2 制程“管理文件”一體的實現(xiàn)
制程“管理文件”一體是對制程管理文件進行三方面的梳理和整合,即梳理制程架構(gòu),將其整合為一套文件架構(gòu);梳理授權(quán)要求,將其整合為一套授權(quán)機制;梳理制程成果,將其整合為一套管理文件。
2.3 制程“管理平臺”一體的實現(xiàn)
全面梳理整合制度流程管理的系統(tǒng)需求,將其統(tǒng)一到國家管網(wǎng)唯一的一個管理平臺上,同時將制度流程系統(tǒng)規(guī)劃路徑進行全面梳理、整合,實現(xiàn)集團制程系統(tǒng)規(guī)劃及實施路徑的統(tǒng)一。
制程融合過程可以分為4個階段:初步匹配階段、初級融合階段、中級融合階段以及高級融合階段,最終目標是要達到高級融合階段,實現(xiàn)制程融合一體。
3 機器可讀標準輔助工具設(shè)計與開發(fā)
標準機器可讀研究主要工作是為標準的數(shù)字化編輯和處理、標準信息單元的存儲和交換、標準文檔內(nèi)容的重組構(gòu)建本體庫,對標準架構(gòu)和元素的數(shù)字化表達,便于機器讀取、解析和執(zhí)行標準,為后續(xù)數(shù)字化應(yīng)用奠定基礎(chǔ)。
3.1 油氣管道標準標簽集的建立
為了使機器能夠自主理解和處理標準,需對標準進行數(shù)字化表示,即標準的形式數(shù)字化。分析標準結(jié)構(gòu)和內(nèi)容要素,應(yīng)用XML等標記語言定義標準結(jié)構(gòu)層次、前文、主體和后文結(jié)構(gòu),以及標準章節(jié)條、段落、列項、圖、表、公式、注等標準要素的標簽及屬性定義,構(gòu)建通用標準信息模型。在此基礎(chǔ)上,分析管道領(lǐng)域典型標準整體結(jié)構(gòu)(各章節(jié)目錄)、主要技術(shù)內(nèi)容、標準應(yīng)用場景等特征,構(gòu)建管道領(lǐng)域拓展標簽集?;诿嫦虮倔w的建模與表達方法,面向特定標準化對象的類和關(guān)系,拓展通用標準標簽集及屬性定義,形成標準框架和主要元素的結(jié)構(gòu)化表達。為標準的數(shù)字化編輯和處理、標準文檔內(nèi)容的存儲和交換、標準文檔內(nèi)容的重組構(gòu)建本體庫,為整體標準數(shù)字化奠定基礎(chǔ)。
標準標簽集可分為兩大類,即通用標簽集和擴展標簽集。
3.1.1 通用標簽集
基于ISO STS標準標簽集、GB/T 37967-2019《基于X M L的國家標準結(jié)構(gòu)化置標框架》、GB/ T42093.1-2022《標準文檔結(jié)構(gòu)化 元模型 第1部分:全文》、GB/T 42093.2-2022《標準文檔結(jié)構(gòu)化 元模型第2部分:技術(shù)指標》,構(gòu)建通用標準標簽集。通用標簽集可分為全文結(jié)構(gòu)化標簽和技術(shù)指標標簽。
全文結(jié)構(gòu)化標簽:對標準結(jié)構(gòu)進行拆解,基于標準結(jié)構(gòu)元素進行標準信息單元劃分(例如:章、節(jié)、術(shù)語、縮略語、圖、表等),應(yīng)用(如:檢索、重組等)可以根據(jù)標準結(jié)構(gòu)信息單元執(zhí)行。技術(shù)指標標簽:技術(shù)指標在結(jié)構(gòu)化單元基礎(chǔ)上進行更細顆粒度的識別,標準信息單元細化到標準指標對象(如:指標屬性、屬性值、屬性類型等),應(yīng)用(如:檢索、重組等)可以根據(jù)技術(shù)指標單元的語義執(zhí)行。標簽集架構(gòu)如圖3所示。
3.1.2 管網(wǎng)領(lǐng)域擴展標準標簽集
機器可讀標準拓展標簽集按對象和業(yè)務(wù)兩個維度構(gòu)建,通過自上而下和自下而上相結(jié)合,采用4級標簽架構(gòu),具體對象和業(yè)務(wù)兩個維度層級數(shù)可不同,具體架構(gòu)如圖4所示。
機器可讀標準的對象應(yīng)結(jié)合油氣管道相關(guān)標準體系,并符合Q/GGW 01002-2022《油氣儲運工程項目結(jié)構(gòu)(EPS)編碼規(guī)范》、Q/GGW 01006.2-2022《油氣儲運工程實體分解結(jié)構(gòu)(PBS)編碼規(guī)范 第2部分:液化天然氣接收站》。
機器可讀標準的業(yè)務(wù)按設(shè)計施工、驗收、運營維護、安全健康、環(huán)保、數(shù)字化、綜合管理、其他進行劃分,據(jù)此細化進行業(yè)務(wù)標簽集的構(gòu)建。
3.2 油氣管道機器可讀標準輔助工具設(shè)計與開發(fā)
3.2.1 軟件總體架構(gòu)
圍繞油氣管道領(lǐng)域標準數(shù)字化轉(zhuǎn)型工作,面向國家管網(wǎng)集團相關(guān)設(shè)計、施工、科研等標準使用方,依據(jù)標準結(jié)構(gòu)化、技術(shù)要素元模型設(shè)計,采用B/S體系架構(gòu),并基于Web應(yīng)用開發(fā)主流的Java語言,形成了面向油氣管道領(lǐng)域的機器可讀標準輔助工具的設(shè)計方案,以實現(xiàn)機器可讀標準制修訂過程的數(shù)字化技術(shù)支撐和基于標準要素提取的智能化應(yīng)用服務(wù)。
工具軟件系統(tǒng)包括標準結(jié)構(gòu)化加工、數(shù)據(jù)管理等核心功能模塊,以及機器可讀標準數(shù)據(jù)庫,并支撐機器可讀標準服務(wù)的實現(xiàn)。其中,機器可讀標準服務(wù)支持標準內(nèi)容結(jié)構(gòu)和內(nèi)容元素的起草、分解、編輯、維護,標準內(nèi)容細顆粒度檢索、關(guān)鍵指標識別等功能,有效促進油氣管道領(lǐng)域標準數(shù)字化轉(zhuǎn)型工作的推進(如圖5所示)。
3.2.2 標準輔助工具軟件功能模塊
(1)標準結(jié)構(gòu)化加工
標準結(jié)構(gòu)化加工模塊用于實現(xiàn)標準原始資料管理、內(nèi)容碎片化、內(nèi)容校對、內(nèi)容預(yù)覽等功能,將原始標準文本中的結(jié)構(gòu)化、半結(jié)構(gòu)化和部分非結(jié)構(gòu)化內(nèi)容映射至語義標簽集,為標準的機器可讀和進一步的智能應(yīng)用奠定基礎(chǔ)。
原始資料管理:操作人員可通過原始資料管理功能進行標準原始資料的管理,相關(guān)操作包含:查看、搜索、上傳資源;原始資料列表可顯示文件名、備注、導(dǎo)入方式、文件格式、文件大小、版本號、創(chuàng)建者、創(chuàng)建時間等資料相關(guān)信息;支持通過文件名、日期等關(guān)鍵字進行原始資料的查詢檢索;在上傳資料時,選中需要上傳的文件,輸入需要的資源信息。若文件不存在完成上傳操作,若文件存在確認是否需要覆蓋,選擇確定覆蓋,更新相關(guān)數(shù)據(jù)并完成上傳操作,選擇不覆蓋則不進行任何操作。
標準內(nèi)容碎片化:操作人員可通過標準內(nèi)容碎片化功能,對標準進行碎片化生成、查看和預(yù)覽;碎片化生成可處理Word、PDF等格式的標準原始資料,依據(jù)預(yù)定義的標準文件結(jié)構(gòu)與語義元模型標簽,生成標準相關(guān)的XML、圖片等文件,并提取數(shù)據(jù),持久化到系統(tǒng)中;標準碎片化列表信息包含:文件名、標準號、標準名稱、發(fā)布日期、實施日期;相關(guān)操作包含:獲取碎片化文件、碎片化、重新提取、PDF閱讀、預(yù)覽;支持通過文件名+標簽名進行標準要素的查詢檢索;支持加載碎片化標準數(shù)據(jù),查看標準文件的目錄、指標、圖片索引,并可以快速定位。
標準內(nèi)容校對:操作人員可通過標準校對功能對標準信息進行校對與編輯修改;支持通過標準號、標準名稱等關(guān)鍵字獲取符合條件的標準信息;加載標準信息后,章條信息、圖片信息、引用信息、術(shù)語信息、技術(shù)要素信息等均可通過軟件在線進行校對與編輯,從而有效提高標準機構(gòu)化數(shù)據(jù)庫的準確性。
標準內(nèi)容預(yù)覽:軟件支持對結(jié)構(gòu)化標準內(nèi)容的在線預(yù)覽,并可通過標準文件的目錄、指標、圖片索引對標準內(nèi)容進行快速定位,并支持標準間引用關(guān)系的可視化展示。
(2)標準數(shù)據(jù)管理
標準數(shù)據(jù)管理模塊用于實現(xiàn)標準標簽定義、標簽管理、XML轉(zhuǎn)換和流程管理等功能,在對標準通用結(jié)構(gòu)與編寫特點,以及油氣管道領(lǐng)域標準內(nèi)容的提煉抽象基礎(chǔ)上實現(xiàn)對語義標簽集的定義、標簽與流程管理,實現(xiàn)標準內(nèi)容的知識化。
標簽定義:操作人員可通過標簽定義功能,對標準語義標簽進行定義、查看和檢索;加載標準相關(guān)數(shù)據(jù)后,可對油氣管道領(lǐng)域各類標準進行通用語義和領(lǐng)域語義標簽進行新增和編輯操作;標簽定義列表信息包含:標準號、標準名稱;支持通過關(guān)鍵字進行標簽的模糊查詢和組合查詢。
標簽管理:操作人員可通過標簽管理功能對標準語義標簽進行修改與刪除操作;支持在選中標準后加載相應(yīng)的標簽信息,生成標簽信息列表,并對標簽信息進行修改與刪除;支持在選中標簽后顯示所有標記為該標簽的標準條款。
流程管理:流程管理信息包含:流程編號、流程節(jié)點名稱、備注;相關(guān)操作包含:搜索、詳細;支持通過流程名稱、流程編號等查詢項,獲取符合條件的流程樹信息。
4 標準智能編寫與分析工具研制、驗證與應(yīng)用
智能編寫工具利用標準結(jié)構(gòu)化技術(shù)及標準內(nèi)容揭示技術(shù),在標準編制過程中,同步完成元數(shù)據(jù)標引、碎片化處理、指標抽取等數(shù)字化工作,提取題錄、段落、表格、圖片、標準化對象、指標項等特征,完成標準內(nèi)容和指標的揭示組織等相關(guān)加工工作,輸出結(jié)果為數(shù)字化文檔,機器可讀的標準庫,從源頭上實現(xiàn)機器可讀的標準知識庫動態(tài)更新。
標準編輯技術(shù)服務(wù)工具通過AI在線標準編寫的方式,幫助完成標準的編寫。標準編寫嚴格遵循文件表述的一致性原則、協(xié)調(diào)性原則、易用性原則,保證產(chǎn)出標準的智能性、便捷性、正確性、完整性。
4.1 油氣管道企業(yè)標準協(xié)同編寫的實現(xiàn)
在編寫過程中,自動提示補全引用標準信息、術(shù)語信息、單位信息,以及相關(guān)其他標準的指標內(nèi)容,或者文字描述,有效避免在編標準與已有標準的交叉矛盾或不協(xié)調(diào)。
4.2 面向油氣管網(wǎng)標準科技前沿、發(fā)展趨勢分析的實現(xiàn)
標準及標準化應(yīng)用場景分析輔助工具可量化分析標準起草單位對標準研制的貢獻,從多個維度進行現(xiàn)狀、趨勢、熱詞等分析,并以圖表等形式可視化顯示分析結(jié)果?;谥匾W(wǎng)站、新聞、微信公眾號、知乎等來源的數(shù)據(jù),顯示了標準被論文、新聞、知乎、微信、博客等引用情況。
4.3 標準查重分析的實現(xiàn)
油氣管網(wǎng)標準內(nèi)容查重輔助工具借鑒科技論文查重技術(shù),應(yīng)用標準內(nèi)容揭示技術(shù)和機器可讀關(guān)鍵技術(shù),可進行標準段落的相似度計算,給出相似標準段落相識度分值。
5 油氣管道機器標準研究方向展望
標準機器可讀的技術(shù)發(fā)展迅速,雖然實現(xiàn)機器可執(zhí)行挑戰(zhàn)依然存在。
(1)繼續(xù)扎實推進油氣管網(wǎng)領(lǐng)域標準機器可讀研究
在實現(xiàn)機器可讀標準文件的基礎(chǔ)上,繼續(xù)開展更高層級機器可讀標準:機器可讀可執(zhí)行內(nèi)容(3級)、完全機器可解析標準(4級)。
(2)強力推進標準機器可讀標準應(yīng)用
通過示范工程加速推進標準機器可讀標準應(yīng)用,提升油氣管道標準數(shù)字化應(yīng)用水平。
(3)同步加快開展標準機器可讀標準化工作
總結(jié)標準數(shù)字化實踐,研制編寫油氣管網(wǎng)標準數(shù)字化系列技術(shù)標準,依托機器可讀標準國際合作組開展國際合作,積極參加國際標準化工作。
參考文獻
劉曦澤, 王益誼, 杜曉燕,等. 標準數(shù)字化發(fā)展現(xiàn)狀及趨勢研究[J]. 中國工程科學(xué), 2021(8):023-006.
肖英萍, 劉悅, 何世新,等. 企業(yè)標準數(shù)字化實現(xiàn)路徑初探[J]. 中國標準化,2022:6-10.
馬曉寧.油氣管道標準信息化跨入“微時代”[J]. 中國標準化,2015(11):36-37 .
張程,龔慶,姚波,等.機器可讀標準實現(xiàn)方法研究[J].中國標準化, 2022(21):56-61.
汪爍,盧鐵林,尚羽佳.機器可讀標準——標準數(shù)字化轉(zhuǎn)型的核心[J].標準科學(xué),2021(S1):6-16.
陳家賓, 趙鑫, 王琮, 等. 機器可讀標準表達方式探討[J].信息技術(shù)與標準化, 2022(10):43-46.