国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多源通用數(shù)據(jù)標(biāo)準(zhǔn)管理平臺(tái)的設(shè)計(jì)和應(yīng)用

2018-05-22 07:18李雪凝劉豐源李明航
關(guān)鍵詞:詞素分詞用語(yǔ)

李雪凝 劉豐源 王 凌 李明航

(上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心 上海 201112)

0 引 言

隨著各行業(yè)的信息化進(jìn)程急速推進(jìn),導(dǎo)致底層數(shù)據(jù)源多樣且復(fù)雜、分散而異構(gòu)。而目前海量的數(shù)據(jù)缺乏統(tǒng)一的標(biāo)準(zhǔn),導(dǎo)致數(shù)據(jù)標(biāo)準(zhǔn)的共享性十分低下。單企業(yè)內(nèi)部分系統(tǒng)由不同開發(fā)商開發(fā)都會(huì)導(dǎo)致數(shù)據(jù)標(biāo)準(zhǔn)的不統(tǒng)一,行業(yè)內(nèi)更是沒(méi)有統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),數(shù)據(jù)標(biāo)準(zhǔn)的管理是實(shí)現(xiàn)新共享時(shí)代的必經(jīng)之路。

現(xiàn)在國(guó)內(nèi)外絕大多數(shù)的工具和管理方法都是針對(duì)單個(gè)企業(yè)、單個(gè)數(shù)據(jù)源或者單個(gè)行業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)的管理。目前比較成熟的管理行業(yè)是金融行業(yè),針對(duì)金融業(yè)的管理工具和方法相對(duì)較多[2],但是仍然缺少跨越多種數(shù)據(jù)源、面向各行各業(yè)通用的統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)管理工具和方法論。

本文提出完整的數(shù)據(jù)標(biāo)準(zhǔn)制定、管理、維護(hù)的理論體系,并采用模板采集或元數(shù)據(jù)采集雙線采集模式,為使用者提供更豐富的選擇。利用與元數(shù)據(jù)的交互提升數(shù)據(jù)采集的自動(dòng)化程度,同時(shí)提供合理的數(shù)據(jù)標(biāo)準(zhǔn)全生命周期管理流程,使數(shù)據(jù)的共享程度大大增加[3]。

1 數(shù)據(jù)標(biāo)準(zhǔn)管理理論體系

1.1 數(shù)據(jù)標(biāo)準(zhǔn)管理要素

數(shù)據(jù)標(biāo)準(zhǔn)化是對(duì)分散在各系統(tǒng)中的數(shù)據(jù)提供一套統(tǒng)一的數(shù)據(jù)命名、數(shù)據(jù)定義、數(shù)據(jù)類型、賦值規(guī)則等的定義基準(zhǔn)[4]。數(shù)據(jù)標(biāo)準(zhǔn)管理的基本要素包括:

(1) 詞素。詞素是數(shù)據(jù)標(biāo)準(zhǔn)管理理論體系中的最小組成元素,也是單詞的過(guò)渡階段,是尚未申請(qǐng)成為標(biāo)準(zhǔn)單詞的備選單詞,其余所有元素都由多個(gè)詞素組合而成,通常由用語(yǔ)分割而來(lái)。

(2) 單詞。詞素申請(qǐng)成為標(biāo)準(zhǔn)單詞后成為單詞,也是數(shù)據(jù)標(biāo)準(zhǔn)管理要素的最小單位,與詞素同級(jí)。將詞素中含義模糊、重復(fù)、無(wú)用的個(gè)體剔除掉以后,剩余的詞素經(jīng)過(guò)申請(qǐng)即可成為單詞。

(3) 用語(yǔ)。用語(yǔ)時(shí)業(yè)務(wù)系統(tǒng)中采集而來(lái)的最原始的個(gè)體,是多個(gè)單詞按照一定的規(guī)則組合而成的,經(jīng)過(guò)分割可以獲得多個(gè)詞素的個(gè)體。

(4) 域。域是單詞的一部分特殊的可以表示實(shí)體特征和定義的個(gè)體。用語(yǔ)被分割為詞素并申請(qǐng)成為單詞后,該組單詞中最后一個(gè)單詞就是域,其余的單詞都是普通單詞。域區(qū)別于其他普通單詞的屬性在于數(shù)據(jù)類型和長(zhǎng)度,用語(yǔ)的數(shù)據(jù)類型和長(zhǎng)度應(yīng)當(dāng)遵從對(duì)應(yīng)域的并保持一致。

1.2 數(shù)據(jù)標(biāo)準(zhǔn)管理流程

依據(jù)國(guó)內(nèi)外現(xiàn)有的數(shù)據(jù)標(biāo)準(zhǔn)管理方法,可以歸納出通用的流程如圖1所示。數(shù)據(jù)標(biāo)準(zhǔn)管理的流程可以分為四大部分,涵蓋了四大管理要素在內(nèi),按照順序分別是:標(biāo)準(zhǔn)化對(duì)象選定、單詞標(biāo)準(zhǔn)化、域標(biāo)準(zhǔn)化、用語(yǔ)標(biāo)準(zhǔn)化[5]。

圖1 數(shù)據(jù)標(biāo)準(zhǔn)管理流程圖

標(biāo)準(zhǔn)化對(duì)象選定主要是對(duì)若干企業(yè)底層系統(tǒng)進(jìn)行范圍的選定以及標(biāo)準(zhǔn)化原則的制定,并進(jìn)行跨越多源底層數(shù)據(jù)源的采集。其次是對(duì)采集的數(shù)據(jù)進(jìn)行單詞的標(biāo)準(zhǔn)化,即按照采集的數(shù)據(jù)分類選取已有的數(shù)據(jù)標(biāo)準(zhǔn)單詞詞典作為基準(zhǔn),并進(jìn)行詞素分析,判斷是否為域。對(duì)于普通的單詞在與基準(zhǔn)詞典比對(duì)后,對(duì)于不存在的單詞進(jìn)行補(bǔ)全定義,包括補(bǔ)全邏輯名、英文名、注釋等,并經(jīng)過(guò)申請(qǐng)與審核的流程成為新的標(biāo)準(zhǔn)單詞。對(duì)于判斷為域的單詞應(yīng)當(dāng)按照域詞典制作流程進(jìn)行標(biāo)準(zhǔn),域標(biāo)準(zhǔn)的定義相較于單詞定義需要額外增加數(shù)據(jù)類型與數(shù)據(jù)長(zhǎng)度等內(nèi)容。最后,對(duì)判斷為用語(yǔ)的數(shù)據(jù)進(jìn)行詞素分割,分割后的內(nèi)容與域詞典和單詞詞典進(jìn)行比對(duì)判斷是否標(biāo)準(zhǔn),對(duì)不標(biāo)準(zhǔn)的進(jìn)行修改并申請(qǐng)成為新用語(yǔ)。在經(jīng)過(guò)以上四步操作后,最終獲得單詞、域、用語(yǔ)三大詞典,其中標(biāo)準(zhǔn)用語(yǔ)詞典最為重要。

1.3 標(biāo)準(zhǔn)數(shù)據(jù)定義原則

數(shù)據(jù)標(biāo)準(zhǔn)化的過(guò)程核心在于如何定制數(shù)據(jù)標(biāo)準(zhǔn),如何最大限度地符合行業(yè)標(biāo)準(zhǔn)的通用性和規(guī)范性,以及如何通過(guò)規(guī)范定義原則來(lái)最大程度優(yōu)化數(shù)據(jù)的質(zhì)量。因此數(shù)據(jù)標(biāo)準(zhǔn)的定義過(guò)程需要遵循一定的通用原則,這也是實(shí)現(xiàn)共享統(tǒng)一的必經(jīng)之路。標(biāo)準(zhǔn)數(shù)據(jù)定義的原則應(yīng)當(dāng)包括通用性、實(shí)用性及適用性三大原則[6]。

1) 通用性。為保證通用性,應(yīng)當(dāng)在標(biāo)準(zhǔn)化過(guò)程中優(yōu)先使用國(guó)際通用單詞和用語(yǔ),保證與國(guó)際標(biāo)準(zhǔn)不沖突;優(yōu)先選用該行業(yè)內(nèi)各企業(yè)和組織慣用的業(yè)務(wù)用語(yǔ);在同等用語(yǔ)條件下應(yīng)當(dāng)優(yōu)先選用國(guó)內(nèi)語(yǔ)境慣用語(yǔ);針對(duì)不同行業(yè)應(yīng)當(dāng)使用適當(dāng)?shù)膶I(yè)用語(yǔ);應(yīng)當(dāng)結(jié)合企業(yè)與外部機(jī)構(gòu)合作的情況,考慮到外部合作方企業(yè)內(nèi)部的標(biāo)準(zhǔn)情況,最大化雙方數(shù)據(jù)標(biāo)準(zhǔn)重合點(diǎn),便于數(shù)據(jù)的共享和調(diào)用。

2) 實(shí)用性。為保證實(shí)用性,應(yīng)當(dāng)在標(biāo)準(zhǔn)化過(guò)程中對(duì)實(shí)際現(xiàn)行系統(tǒng)進(jìn)行充分的調(diào)研,保證一切標(biāo)準(zhǔn)化工作都是基于現(xiàn)有系統(tǒng)而非理論上的可行性,且保證一切標(biāo)準(zhǔn)化工作在后續(xù)系統(tǒng)的持續(xù)改進(jìn)中確實(shí)可用;在標(biāo)準(zhǔn)化過(guò)程中應(yīng)當(dāng)規(guī)避一切難以理解、語(yǔ)義模糊、存在歧義的用語(yǔ)成為標(biāo)準(zhǔn)用語(yǔ);在選定成為標(biāo)準(zhǔn)用語(yǔ)的審核過(guò)程中,需要由審核專員審核用語(yǔ),保證標(biāo)準(zhǔn)用語(yǔ)的直觀可理解,避免出現(xiàn)需要猜測(cè)語(yǔ)義的用語(yǔ)。

3) 便利性。為保證實(shí)用性,應(yīng)當(dāng)在標(biāo)準(zhǔn)化過(guò)程中做好已有標(biāo)準(zhǔn)化成果的調(diào)研和采集,盡可能直接利用企業(yè)現(xiàn)有的運(yùn)標(biāo)準(zhǔn)化規(guī)章制度、方法體系和成果物,因?yàn)樯鲜鍪亲钸m合于企業(yè)或組織現(xiàn)有系統(tǒng)運(yùn)行環(huán)境的標(biāo)準(zhǔn)化原則。

2 主要技術(shù)原理

基于當(dāng)前主流技術(shù)和框架,本平臺(tái)的主要實(shí)現(xiàn)技術(shù)如下:

1) IKAnalyzer。IK Analyzer是基于java語(yǔ)言開發(fā)的輕量級(jí)的中文分詞工具包,是結(jié)合詞典分詞和文法分析算法的中文分詞組件[7]。它在平臺(tái)中主要用于詞素分割,目前最新版的IK Analyze已經(jīng)獨(dú)立的作為了單獨(dú)完善的組件面向java使用,由于該組件可以實(shí)現(xiàn)160萬(wàn)字/秒(3 000 KB/s)的效率,因此在追求時(shí)效的情況下適合使用。目前的平臺(tái)中只單獨(dú)應(yīng)用到了中文分詞功能,而IK Analyzer還支持包含英文字母、數(shù)字、韓文、日文在內(nèi)的多語(yǔ)言的分詞功能,并支持多語(yǔ)言混合分詞。它采用了多子處理器分析模式,實(shí)現(xiàn)了簡(jiǎn)單的分詞歧義排除算法,采用了特有的正向迭代最細(xì)粒度切分算法[8],支持細(xì)粒度和智能分詞兩種切分模式[9]。

2) SSM框架。SSM是Spring+SpringMVC+Mybatis的縮寫,是當(dāng)前Web開發(fā)中常用的基礎(chǔ)框架之一。第一部分是Spring,輔助開發(fā)人員集合各個(gè)層次,進(jìn)行事務(wù)的托管和持久化工作。SpringMVC續(xù)寫了Spring,將C、V、M分隔開,即隔離控制器、視圖與業(yè)務(wù)三大模塊[8]。Mybatis的存在避免了設(shè)置參數(shù),跳過(guò)JDBC代碼實(shí)現(xiàn),僅通過(guò)配置文件的映射實(shí)現(xiàn)數(shù)據(jù)庫(kù)的更新。

3) Extjs。Extjs是當(dāng)前比較流行且效果豐富的Ajax框架,用于客戶端Web應(yīng)用程序界面的開發(fā),適用于現(xiàn)在多數(shù)主流開發(fā)語(yǔ)言。Extjs有著良好的互動(dòng)界面和異常處理機(jī)制,且對(duì)于跨瀏覽器處理有著極大的優(yōu)勢(shì),因此在平臺(tái)開發(fā)的實(shí)現(xiàn)上成為首選前端開發(fā)框架。

3 數(shù)據(jù)標(biāo)準(zhǔn)管理平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)

3.1 功能流程設(shè)計(jì)

平臺(tái)功能流程的設(shè)計(jì)符合完整的數(shù)據(jù)標(biāo)準(zhǔn)管理生命周期,全過(guò)程分為兩條支路,一條起源于元數(shù)據(jù)采集,另一條起源于Excel模板采集。在用Excel模板采集的過(guò)程中,先進(jìn)行詞素分割,以紅黑顏色作為驗(yàn)證通過(guò)與否的標(biāo)識(shí),若標(biāo)紅則需要申請(qǐng)成為新的標(biāo)準(zhǔn)用語(yǔ)。申請(qǐng)時(shí)需要先驗(yàn)證是否已經(jīng)在標(biāo)準(zhǔn)詞典中存在,驗(yàn)證后自動(dòng)將驗(yàn)證反饋信息填入備注欄中,由審核專員手動(dòng)點(diǎn)擊通過(guò)或者不通過(guò),申請(qǐng)者可以在申請(qǐng)頁(yè)面刷新查看。元數(shù)據(jù)采集的支路與上述流程類似,只在采集過(guò)后增加補(bǔ)全信息的過(guò)程。功能流程設(shè)計(jì)如圖2所示。

圖2 功能流程設(shè)計(jì)圖

此平臺(tái)系統(tǒng)功能統(tǒng)分為七個(gè)模塊,具體如下:

3.1.1 采集信息管理

(1) 從元數(shù)據(jù)導(dǎo)入。與元數(shù)據(jù)管理系統(tǒng)交互,可以直接從現(xiàn)有的元數(shù)據(jù)庫(kù)中導(dǎo)入元數(shù)據(jù)作為原始的備選用語(yǔ)[10]。

(2) 從Excel文件中導(dǎo)入。對(duì)于沒(méi)有整理完善的Excel文件中,往往只有用語(yǔ)名,可以從采集信息管理模塊導(dǎo)入后手動(dòng)選擇需要申請(qǐng)成為標(biāo)準(zhǔn)用語(yǔ)的部分。

3.1.2 用語(yǔ)管理

(1) 從Excel文件導(dǎo)入。從整理完整的文件中直接導(dǎo)入成為備選用語(yǔ)。

(2) 從采集信息導(dǎo)入。從采集信息管理模塊中的篩選出來(lái)的備選用語(yǔ)導(dǎo)入后,需要在本模塊進(jìn)行信息補(bǔ)全。

(3) 詞素分割。將已經(jīng)是信息完整的備選用語(yǔ)選中進(jìn)行詞素分割,后臺(tái)會(huì)自動(dòng)驗(yàn)證各詞素是否已經(jīng)在標(biāo)準(zhǔn)單詞詞典中存在,若存在則為黑色,否則標(biāo)紅,對(duì)紅色的可以申請(qǐng)成為新的標(biāo)準(zhǔn)單詞。

(4) 申請(qǐng)成為標(biāo)準(zhǔn)用語(yǔ)。對(duì)于分割的各個(gè)詞素都是黑色的備選用語(yǔ)可以申請(qǐng)成為標(biāo)準(zhǔn)用語(yǔ),進(jìn)入待審核狀態(tài)。

3.1.3 標(biāo)準(zhǔn)用語(yǔ)審核

(1) 驗(yàn)證。待審核用語(yǔ)需要驗(yàn)證是否已在標(biāo)準(zhǔn)用語(yǔ)中存在,并再次驗(yàn)證是否每個(gè)詞素都是標(biāo)準(zhǔn)單詞,驗(yàn)證結(jié)果會(huì)以備注的形式填充。

(2) 通過(guò)/不通過(guò)。依據(jù)驗(yàn)證結(jié)果手動(dòng)選擇。通過(guò)的單詞存儲(chǔ)入標(biāo)準(zhǔn)用語(yǔ)庫(kù),不通過(guò)的用語(yǔ)會(huì)連帶駁回原因反饋會(huì)用語(yǔ)管理頁(yè)面。

3.1.4 單詞管理

(1) 單詞定義補(bǔ)全。對(duì)于申請(qǐng)成為標(biāo)準(zhǔn)單詞的個(gè)體需要將短語(yǔ)名、物理意義、物理名、同義詞等信息補(bǔ)全然后方可提交申請(qǐng)。

(2) 申請(qǐng)成為標(biāo)準(zhǔn)單詞。選中完整的備選單詞進(jìn)行申請(qǐng),申請(qǐng)的單詞會(huì)轉(zhuǎn)入待審核狀態(tài)。

3.1.5 標(biāo)準(zhǔn)單詞審核

(1) 驗(yàn)證。待審核單詞需要驗(yàn)證是否已在標(biāo)準(zhǔn)詞典中存在,驗(yàn)證結(jié)果會(huì)以備注的形式填充。

(2) 通過(guò)/不通過(guò)。依據(jù)驗(yàn)證結(jié)果手動(dòng)選擇。通過(guò)的單詞存儲(chǔ)入標(biāo)準(zhǔn)單詞庫(kù),不通過(guò)的單詞會(huì)連帶駁回原因反饋回單詞管理頁(yè)面。

3.1.6 標(biāo)準(zhǔn)體系管理

對(duì)于標(biāo)準(zhǔn)分類需要一個(gè)單獨(dú)的模塊進(jìn)行管理,標(biāo)準(zhǔn)體系包括行業(yè)、企業(yè)、公用/專用等分類標(biāo)準(zhǔn)。

3.1.7 標(biāo)準(zhǔn)數(shù)據(jù)查詢

通過(guò)對(duì)短語(yǔ)名、物理名、英文名、同義詞、中文名、備注等多種條件的篩選,并輸入關(guān)鍵詞和標(biāo)準(zhǔn)分類,進(jìn)行全局模糊查詢。

3.2 架構(gòu)設(shè)計(jì)

多源通用數(shù)據(jù)標(biāo)準(zhǔn)管理平臺(tái)系統(tǒng)架構(gòu)設(shè)計(jì)如圖3所示。

圖3 系統(tǒng)架構(gòu)圖

技術(shù)架構(gòu)分為五個(gè)層面,分別是數(shù)據(jù)源層、數(shù)據(jù)采集層、數(shù)據(jù)存儲(chǔ)和管理層、應(yīng)用服務(wù)層和門戶管理與用戶層[11]。其中數(shù)據(jù)源層主要包括各個(gè)數(shù)據(jù)來(lái)源,分別來(lái)源于不同的層面,包括業(yè)務(wù)系統(tǒng)、外部數(shù)據(jù)、手工補(bǔ)錄三個(gè)來(lái)源。從這三個(gè)來(lái)源中,我們主要由兩條途徑可以采集信息,一條是直接從元數(shù)據(jù)管理系統(tǒng)各種導(dǎo)入現(xiàn)有的元數(shù)據(jù)作為備選標(biāo)準(zhǔn),另一條途徑是通過(guò)業(yè)務(wù)人員手工整理以Excel模板的形式采集。然后進(jìn)入到存儲(chǔ)和管理層,此處的存儲(chǔ)主要是基于DBMS存儲(chǔ),并合理進(jìn)行標(biāo)準(zhǔn)的分類管理,在此層主要涵蓋了標(biāo)準(zhǔn)分類信息。應(yīng)用服務(wù)層基于Web服務(wù)器和內(nèi)部服務(wù)器,將標(biāo)準(zhǔn)數(shù)據(jù)檢索信息和審批狀態(tài)信息等同步更新到平臺(tái)中,提供便捷友好的應(yīng)用服務(wù)[12]。最后通過(guò)門戶管理與用戶層將包含安全認(rèn)證、訪問(wèn)控制、幫助文檔在內(nèi)的多種服務(wù)部署在門戶服務(wù)器上,便于統(tǒng)一把控訪問(wèn)數(shù)據(jù)的角色權(quán)限信息,并對(duì)用戶輔以安全訪問(wèn)的幫助。

3.3 平臺(tái)效果展示

圖4 excel模板導(dǎo)入用語(yǔ)頁(yè)面

圖5 數(shù)據(jù)標(biāo)準(zhǔn)檢索

圖6 元數(shù)據(jù)導(dǎo)入用語(yǔ)頁(yè)面

圖7 標(biāo)準(zhǔn)用語(yǔ)詞典

4 應(yīng)用案例及分析

在金融行業(yè)中數(shù)據(jù)的共享性和精確性要求較高,而國(guó)內(nèi)的證券金融公司由于數(shù)據(jù)治理的概念發(fā)展較晚,因此缺乏數(shù)據(jù)標(biāo)準(zhǔn)統(tǒng)一的意識(shí)。2017年,上海計(jì)算機(jī)軟件技術(shù)開發(fā)中心將數(shù)據(jù)標(biāo)準(zhǔn)管理平臺(tái)應(yīng)用于某大型證券公司的合作中,通過(guò)由該公司按照固定的Excel模板進(jìn)行備選標(biāo)準(zhǔn)數(shù)據(jù)的采集,并依據(jù)業(yè)務(wù)經(jīng)驗(yàn)進(jìn)行相應(yīng)信息的補(bǔ)全。利用本平臺(tái)將采集的超過(guò)400張的Excel表單后臺(tái)調(diào)度自動(dòng)導(dǎo)入系統(tǒng)中,由該公司的業(yè)務(wù)人員和技術(shù)人員共同合作在本平臺(tái)上完成數(shù)據(jù)信息補(bǔ)全,并申請(qǐng)成為數(shù)據(jù)標(biāo)準(zhǔn)。經(jīng)過(guò)該公司業(yè)務(wù)專家和技術(shù)部門負(fù)責(zé)人在平臺(tái)上在線審核后,形成超過(guò)4 000條數(shù)據(jù)的標(biāo)準(zhǔn)詞典,同時(shí)實(shí)現(xiàn)了利用本平臺(tái)對(duì)這4 000余條數(shù)據(jù)的全局檢索,為該公司日后的新系統(tǒng)的開發(fā)工作提供了完整的參考體系,也為同行業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)的制定起到了一定的參考作用。

5 結(jié) 語(yǔ)

數(shù)據(jù)共享是新時(shí)代行業(yè)發(fā)展的必經(jīng)之路,雖然目前大多數(shù)企業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)尚未形成,但是統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)、提升數(shù)據(jù)的共享能力已成為大數(shù)據(jù)時(shí)代數(shù)據(jù)管理能力提升的不可回避的問(wèn)題。多源通用數(shù)據(jù)標(biāo)準(zhǔn)管理平臺(tái)旨在幫助尚未開展數(shù)據(jù)治理的企業(yè)實(shí)現(xiàn)治理的根基,即實(shí)現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化建設(shè)。這將為后續(xù)的數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全等一系列數(shù)據(jù)治理的工作打下良好的基礎(chǔ),同時(shí)也為新的業(yè)務(wù)系統(tǒng)的開發(fā)和擴(kuò)展提供了統(tǒng)一的入口和模板規(guī)范,對(duì)于提高數(shù)據(jù)共享能力意義非凡。本文通過(guò)對(duì)數(shù)據(jù)標(biāo)準(zhǔn)管理的理論體系和技術(shù)原理進(jìn)行了分析,開發(fā)了多源通用數(shù)據(jù)標(biāo)準(zhǔn)管理工具,通過(guò)提供統(tǒng)一的管理方法和流程管控,利用分詞技術(shù)和表單技術(shù),使得用戶可以與傳統(tǒng)人工梳理工作相結(jié)合,大大提高了數(shù)據(jù)標(biāo)準(zhǔn)制定的規(guī)范性和合理性,使標(biāo)準(zhǔn)制定工作從線下轉(zhuǎn)為線上,從釘在墻上的規(guī)章制度轉(zhuǎn)化為切實(shí)可查的標(biāo)準(zhǔn)詞典。對(duì)各行業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)管理打開了通用的通道,并為同類產(chǎn)品的設(shè)計(jì)和實(shí)現(xiàn)提供了借鑒。

參考文獻(xiàn)

[1] 朱紅磊.基于節(jié)能降耗系統(tǒng)平臺(tái)的數(shù)據(jù)處理中間件的研究[D].河南理工大學(xué),2010.

[2] 陳恒有.中國(guó)金融業(yè)行政管理制度研究[D].首都經(jīng)濟(jì)貿(mào)易大學(xué),2012.

[3] 蔣東興,郭大勇,羅念龍,等.清華大學(xué)新一代數(shù)字校園建設(shè)規(guī)劃與實(shí)踐[J].廈門大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,81(S2):173-178.

[4] 白麗銳,楊友朋,王春新.數(shù)據(jù)標(biāo)準(zhǔn)化在電力物聯(lián)網(wǎng)綜合業(yè)務(wù)平臺(tái)的應(yīng)用[J].物聯(lián)網(wǎng)技術(shù),2013,3(8):41-45.

[5] 萬(wàn)文琪.裝飾工程施工工藝管理流程標(biāo)準(zhǔn)化研究及其設(shè)計(jì)[D].東南大學(xué),2014.

[6] 郭曙綸.漢語(yǔ)語(yǔ)料庫(kù)應(yīng)用教程[M].上海:上海交通大學(xué)出版社,2013.

[7] 朱潛,吳辰鈮,朱志良,等.Hadoop云平臺(tái)下Nutch中文分詞的研究與實(shí)現(xiàn)[J].小型微型計(jì)算機(jī)系統(tǒng),2013,34(12):2772-2776.

[8] 彭婧.一種用戶交互的智能答疑系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].湖南大學(xué),2012.

[9] 黃翼彪.實(shí)現(xiàn)Lucene接口的中文分詞器的比較研究[J].科技信息,2012,28(12):246-247.

[10] 朱麗娟.基于空間數(shù)據(jù)集成共享技術(shù)的土地勘測(cè)成果管理應(yīng)用與研究[D].電子科技大學(xué),2012.

[11] 黃小華.基于數(shù)據(jù)倉(cāng)庫(kù)的稅務(wù)風(fēng)險(xiǎn)預(yù)警系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].電子科技大學(xué),2007.

[12] 賀艷偉.基于WebGIS的城鎮(zhèn)地籍管理信息系統(tǒng)的研究與實(shí)現(xiàn)[D].河北工程大學(xué),2010.

猜你喜歡
詞素分詞用語(yǔ)
深度思考之常用邏輯用語(yǔ)
分詞在英語(yǔ)教學(xué)中的妙用
常用邏輯用語(yǔ)的八個(gè)易錯(cuò)點(diǎn)
基于詞素解構(gòu)的高中英語(yǔ)詞匯擴(kuò)充方法分析
結(jié)巴分詞在詞云中的應(yīng)用
結(jié)巴分詞在詞云中的應(yīng)用
詞素配價(jià)理論與應(yīng)用
從詞素來(lái)源看現(xiàn)代漢語(yǔ)詞素同一性問(wèn)題
化學(xué)用語(yǔ)及常用物理量
禮貌用語(yǔ)大家學(xué)!