国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

電子公文制發(fā)中的工作流與數(shù)據(jù)挖掘技術(shù)的普及應(yīng)用

2010-08-15 00:48:41王東海
辦公自動化 2010年18期
關(guān)鍵詞:表單數(shù)據(jù)挖掘工具

王 楠 王東海

(煙臺高新區(qū)中等職業(yè)學(xué)校 煙臺 264670)1

(山東煙臺魯東大學(xué)文學(xué)院 煙臺 264025)2

計(jì)算機(jī)技術(shù)的基礎(chǔ)是電子文件,一切資源和信息都以電子文件的方式存在或運(yùn)作,以此推理,電子政務(wù)的核心是電子公文?!半娮庸闹傅氖菑V泛應(yīng)用于黨政機(jī)關(guān)、企事業(yè)單位、公共團(tuán)體的,運(yùn)用現(xiàn)代計(jì)算機(jī)技術(shù)制發(fā)的,與傳統(tǒng)紙質(zhì)公文具有同等效力的電子文書?!盵1]它是電子政務(wù)的樞紐,它的高效和諧運(yùn)作依靠電子公文制發(fā)技術(shù)。電子公文制發(fā)技術(shù)近些年發(fā)展比較快,比較前沿的是工作流技術(shù),而數(shù)據(jù)挖掘技術(shù)在工作流末端環(huán)節(jié)上的應(yīng)用更能深入挖掘電子公文的附加值,使整個(gè)工作流系統(tǒng)高效運(yùn)作。我們主要探討這兩種技術(shù)的普及應(yīng)用。

一、 新技術(shù)推廣中的過渡性、漸進(jìn)性意識

新技術(shù)的最大特點(diǎn)是功能全面、智能化高,能很好地提高工作效率或解決傳統(tǒng)公文無法解決的問題,但電子公文的操作者是計(jì)算機(jī)水平不一的普通辦公人員,這些新技術(shù)對于他們來講是相對陌生和復(fù)雜,易使他們產(chǎn)生畏難情緒。所以新技術(shù)的應(yīng)用和推廣不能一蹴而就,需要針對操作人員不同的情況,循序漸進(jìn)地展開,特別要重視過渡階段的推廣策略--重點(diǎn)貫徹新技術(shù)的應(yīng)用理念,立足于普及應(yīng)用基礎(chǔ)上進(jìn)行提高,組合一套易用、好用、夠用的過渡性集成工具,推動辦公人員的電子公文制發(fā)技術(shù)集體向新技術(shù)平臺遷移。

二、 滿足電子公文的制發(fā)的六個(gè)基本要求

過渡性的集成工具組合并非無原則、無底線地降低技術(shù)含量,最起碼要滿足電子公文制發(fā)的六個(gè)基本要求:

1、 專業(yè)

電子公文的版面制作效果應(yīng)高于傳統(tǒng)紙媒公文,在文本的基礎(chǔ)上可以添加如多媒體信息,特別是智能交互表單功能,體現(xiàn)其在資料集成性、展示動態(tài)性、應(yīng)用智能性方面超越傳統(tǒng)紙媒公文的明顯優(yōu)越性。

2、 完善

電子公文制發(fā)技術(shù)功能要求完善,能體現(xiàn)電子公文在電子政務(wù)運(yùn)作系統(tǒng)中的核心位置,保證電子公文制發(fā)與電子政務(wù)其他環(huán)節(jié)的無縫對接,將電子公文的審閱批注、發(fā)文登記、督辦監(jiān)控、信息反饋、實(shí)時(shí)溝通、收文匯總、反饋數(shù)據(jù)分析等方面全面實(shí)現(xiàn)電子化、自動化,從而表現(xiàn)無紙化辦公的節(jié)約性與方便性等優(yōu)點(diǎn)。

3、 流暢

這一要求是針對電子公文制發(fā)傳輸?shù)墓ぷ髁鞫?,要求能定義清楚其工作環(huán)節(jié)、工作任務(wù)、工作關(guān)系,有機(jī)協(xié)調(diào)工作流各環(huán)節(jié)的參與者,將整個(gè)工作流進(jìn)行有效貫通。

4、 穩(wěn)定

要求電子公文制作、制發(fā)的網(wǎng)絡(luò)環(huán)境與軟件環(huán)境穩(wěn)定可靠,不會因?yàn)檐浻布牟患嫒?、軟件的技術(shù)Bug或操作人員的誤操作而產(chǎn)生難以挽回的損失,如系統(tǒng)癱瘓、文件傳輸丟失、機(jī)要公文被黑客竊取等。

5、 高效

這要求電子公文制發(fā)人員不但要掌握必要的計(jì)算機(jī)操作技術(shù),而且要達(dá)到熟練程度,另外要有一定綜合利用各種常規(guī)軟件解決操作難題或操作故障的能力,這是高效處理電子公文的必要保證。

6、 實(shí)時(shí)

任何開發(fā)后的電子公文終端產(chǎn)品都是被動型的,不能自動應(yīng)對工作中出現(xiàn)的新問題、新需求。這需要系統(tǒng)前端開發(fā)人員、使用中的維護(hù)人員及普通操作人員能協(xié)調(diào)溝通,實(shí)時(shí)更新調(diào)整系統(tǒng)功能模塊,雖然這種更新肯定會有一定的滯后性,但決不能拖延時(shí)間太長,否則不能適應(yīng)的千變?nèi)f化的工作形勢,最后必然導(dǎo)致系統(tǒng)的使用率降低,甚至廢棄,從而造成不必要的浪費(fèi)。

三、 電子公文制作中的工作流技術(shù)

1、 工作流的原理及其在電子公文制作中的應(yīng)用價(jià)值

工作流“是一類能夠完全或部分自動執(zhí)行的過程,它根據(jù)一系列的過程規(guī)則,使文檔、信息或者任務(wù)能夠在不同的執(zhí)行者之間進(jìn)行傳遞與執(zhí)行”,[2]它是在二十世紀(jì)八十年代開始興起的涉及計(jì)算機(jī)及管理領(lǐng)域的新興技術(shù)。

工作流技術(shù)是針對行政管理、政務(wù)管理中具有固定程序的常規(guī)、例行性工作提出,這些工作中一些相對固定的事務(wù)形成統(tǒng)一的模式,較少有例外情況出現(xiàn),如電子公文的制發(fā)流程,雖然每個(gè)工作環(huán)節(jié)的具體工作的內(nèi)容不同,但制作流程是相同的。引進(jìn)工作流技術(shù)后,將一個(gè)常規(guī)工作流程分解成定義明晰、界限清楚的任務(wù),用計(jì)算機(jī)程序固定下來,建立參與用戶角色、賬戶、組織單位、用戶間的工作關(guān)系,并通過網(wǎng)絡(luò)形成各個(gè)客戶端環(huán)節(jié)的連通,形成一條生產(chǎn)線,按照一定的規(guī)則和過程來執(zhí)行任務(wù)并對它們進(jìn)行實(shí)時(shí)監(jiān)控及及時(shí)反饋總結(jié),達(dá)到減少重復(fù)工作的精力投入,提高辦事效率和管理水平目標(biāo)。

一個(gè)完整的工作流系統(tǒng)應(yīng)具有三個(gè)方面的功能特征:建造功能,主要指對工作流過程及其組成活動的建模、定義;運(yùn)行控制,在運(yùn)作環(huán)境中處理工作流過程并為過程活動定序;運(yùn)行交互,跟最終用戶和IT應(yīng)用工具進(jìn)行交互。[3]

2、 工作流的技術(shù)復(fù)雜性與普及應(yīng)用需求

從唯技術(shù)觀的角度看,現(xiàn)代工作流技術(shù)主要研究工作流的工作流過程建模、算法、編程、過程描述語言等技術(shù),包括分布式工作流、基于Web的工作流、Web的工作流管理系流、工作流互操作、工作流中的移動計(jì)算、面向?qū)ο蟮墓ぷ髁鳌⒋砑夹g(shù)與工作流管理技術(shù)的結(jié)合、工作流模型的分析和仿真工具、工作流事務(wù)管理、網(wǎng)格工作流技術(shù)等高尖技術(shù)課題。但純技術(shù)觀視野中的工作流技術(shù),也存在很多不足,如(1)工作流的運(yùn)行時(shí)需要的底層的通信基礎(chǔ)結(jié)構(gòu)在實(shí)際應(yīng)用中仍然顯得不夠成熟;(2)缺乏標(biāo)準(zhǔn);(3)實(shí)現(xiàn)的復(fù)雜性;(4)工作流技術(shù)本身的不成熟性。[4]這說明持唯技術(shù)觀的專業(yè)人士對工作流技術(shù)也并不自信,對于一種完全處于實(shí)驗(yàn)性并不成熟的技術(shù),對于普通辦公人員相隔甚遠(yuǎn)。

其實(shí),從本質(zhì)上看,工作流技術(shù)并不神秘,從國家機(jī)關(guān)、企事業(yè)單位的行政管理運(yùn)作本是由一個(gè)個(gè)工作流組成的,從有國家意識形態(tài)開始,從有了公文的文字載體來算,已經(jīng)有幾千年的歷史了。只是現(xiàn)代意義上的工作流,由于與計(jì)算機(jī)輔助協(xié)同工作(CSCW)、辦公自動化、文檔管理以及數(shù)據(jù)庫、數(shù)據(jù)挖掘等信息化技術(shù)聯(lián)系在一起,顯得技術(shù)色彩更加濃厚,本質(zhì)卻是一致的。從研究上看,目前最大的問題是工作流技術(shù)集中在軟件公司、少數(shù)專業(yè)技術(shù)人員手中,研究的重點(diǎn)是開發(fā)性技術(shù),缺少從普及、操作層面的而向普通辦公人員的應(yīng)用性技術(shù)研究。我們檢索了近五年的核心期刊上關(guān)于工作流的論文,98%的論文均為理論和開發(fā)方面的研究,只有很少幾篇具有一定的普及性,但還是屬于理論綜述性文章。從普及應(yīng)用的角度來看,上面介紹的前沿工作流技術(shù)顯然不是普通辦公人員關(guān)注的重點(diǎn),也沒有必要強(qiáng)求普通從業(yè)人員都懂工作流的原理、算法,這些唯技術(shù)觀式的研究常使普通辦公人員對其產(chǎn)生神秘感的疏離感,感覺這一技術(shù)與己無關(guān),缺少應(yīng)用工作流技術(shù)的動力,導(dǎo)致工作流技術(shù)的高效性特點(diǎn)被埋沒。

基于工作流技術(shù)的先進(jìn)性和高效性,除了要培養(yǎng)普通辦公人員能動使用工作流技術(shù)的意識,還要將他們對電子公文的認(rèn)識由靜態(tài)轉(zhuǎn)向動態(tài)交互。傳統(tǒng)的電子公文的格式可以是DOC、靜態(tài)PDF、方正等電子公文的格式等,交互性、智能性比較差,只是體現(xiàn)了電子化錄入、排版,直接打印分發(fā)等操作,缺少發(fā)文者和收文者之間的交互,這樣造成環(huán)節(jié)多,時(shí)間冗長,浪費(fèi)了人力和物力等問題。隨著電子政務(wù)的發(fā)展,很多單位內(nèi)部局域網(wǎng)中建立起了專門的工作流公文處理系統(tǒng),例如書生公文處理系統(tǒng)等,確實(shí)能夠解決大多電子公文制作與傳輸過程中的交互問題,但這些系統(tǒng)一般價(jià)格昂貴,且大多分布在少數(shù)政府部門中,造成工作流系統(tǒng)服務(wù)面的狹化。只要單位有管理,就會有公文,有公文就需要制作和流轉(zhuǎn),所以常規(guī)電子公文制作廣泛地分布在所有機(jī)關(guān)企事業(yè)單位的辦公室之間,但在當(dāng)前大多的電子辦公環(huán)境里,根本無法進(jìn)行完整或相對完整的工作流應(yīng)用。

解決以上這些問題,不可能寄希望于所有單位投入大量的資金購置專用電子公文制發(fā)與傳輸系統(tǒng),但這并不意味著普通單位就無法利用工作流技術(shù)的優(yōu)越性來提高工作效率,其實(shí)在目前還無法普及專業(yè)系統(tǒng)之前,可以根據(jù)現(xiàn)有辦公軟件組合一套過渡期的工作流工具集合。

3、 過渡期的工作流工具集合

在計(jì)算機(jī)應(yīng)用中,最不明智的做法就是選用大量的軟件來實(shí)現(xiàn)不同的目的,人為增加學(xué)習(xí)負(fù)擔(dān),最好的辦法是將眾多工作應(yīng)用盡量集中在最少的軟件中。另外,為了更廣泛的使用工作流技術(shù),這些軟件要有使用面廣、易上手的特點(diǎn)。

如現(xiàn)在的電子公文的制作應(yīng)用中,Word軟件在編輯排版方面的位置無可替代,是辦公領(lǐng)域使用最多的工具,也是電子公文制發(fā)的基礎(chǔ)技術(shù),另外一個(gè)軟件就是Acrobat,它是一個(gè)普及性的公文處理工作流軟件,可以與Word無縫對接,順利地將Word中排好版的DOC格式轉(zhuǎn)換為PDF格式,進(jìn)入常規(guī)的批注審閱工作流系統(tǒng)。這兩個(gè)軟件普及率高,使用面廣,如果再加上基本的電子郵件功能就能組合成電子公文制發(fā)的基礎(chǔ)工具組合,而且能覆蓋電子公文制發(fā)各個(gè)環(huán)節(jié),滿足各環(huán)節(jié)的基本要求。現(xiàn)在國內(nèi)專用的昂貴的工作流系統(tǒng)多在軟件功能的專業(yè)性、安全性上做更多的考慮和設(shè)置,可用于特定的部門的公文制發(fā),如垂直公文、保密公文等。這樣專業(yè)工具組合與過渡工作組合形成互補(bǔ),全面滿足電子公文制發(fā)工作流的需要。

選擇Acrobat軟件為過渡組合的核心軟件,一方面考慮到目前在我國的機(jī)關(guān)、企事業(yè)單位的電子公文處理中,PDF文件也是事實(shí)的標(biāo)準(zhǔn),另一方面,PDF文件除了普通靜態(tài)文件外,更有帶有高智能交互功能的動態(tài)PDF表單文件制作功能,而工作流主要是基于動態(tài)表單文件的,這方面Word都沒有配套完善的功能,只有依靠Acrobat中的專業(yè)而易用的動態(tài)表單文件設(shè)計(jì)軟件LiveCycle Designer,這一軟件提供了強(qiáng)大的高級功能和充足的控件,可以自由方便地添加通用的交互控件,如靜態(tài)文本、輸入框、密碼框、列表框、單選框、按鈕、圖形、圖像域等,用戶無須編程,通過簡單的鼠標(biāo)拖放就能將控件選中并拖拽到表單中,然后設(shè)置這些控件的名稱、值、標(biāo)題、交互行為、驗(yàn)證機(jī)制、提示信息、外觀等屬性,還支持?jǐn)?shù)據(jù)合法性校驗(yàn)和自動計(jì)算,也可以格式化輸入內(nèi)容,如身份證號碼、電話號碼、郵政區(qū)號、E-mail地址、出生日期等數(shù)據(jù)。所以,設(shè)計(jì)一個(gè)專業(yè)的表單非常快捷,作為一個(gè)普及性工具,非常易于掌握。

表單分發(fā)出去后,可以靠基于電子郵件的審閱行為和基于服務(wù)器實(shí)現(xiàn)審閱工作流。接到表單的部門人員可以利用Acrobat中完備的注釋工具,可以方便在添加各種標(biāo)記符號、印章等,還可添加文字及多媒體批注,創(chuàng)建交互行為,這些都是公文制發(fā)的審閱工作流中不可缺少工具。還可以通過Acrobat的審閱追蹤器追蹤審閱方向及審閱進(jìn)度,并進(jìn)行動態(tài)提醒,進(jìn)行及時(shí)的督辦。審閱結(jié)果可以匯集在注釋管理器中,進(jìn)行集中匯總,并進(jìn)入回復(fù)交流等。所有的審閱信息還可以合并輸入,或進(jìn)行打印輸入。

最具智能化的是表單制作出來后,通過基于電子郵件的審閱,將表單文件傳送給收文單位,收文單位在通過交互行為填寫表單后,可以點(diǎn)擊表單頁面的“通過電子郵件反饋”按鈕,將數(shù)據(jù)反饋回發(fā)文者。發(fā)文者將自動生成的反饋數(shù)據(jù)文件加入數(shù)據(jù)組文件,然后導(dǎo)入Acrobat的數(shù)據(jù)組匯總窗口進(jìn)行動態(tài)跟蹤和管理,待所有數(shù)據(jù)匯總完成,將其導(dǎo)出可以在Excel軟件中使用的CSV文件,利用Excel強(qiáng)大的數(shù)據(jù)統(tǒng)計(jì)、篩選、分析功能進(jìn)行專業(yè)處理,形成數(shù)據(jù)報(bào)告。通過以上這些操作,發(fā)文者與收文者之間可以進(jìn)行互動操作、滿足電子公文制作、傳輸、批閱、提交、反饋、匯總、分析等工作流各個(gè)環(huán)節(jié)的需求。極大地提高了效率。這就是動態(tài)交互表單工作流的優(yōu)勢所有,這是傳統(tǒng)手工方式無法想像的。

雖然在很多技術(shù)派眼中這套工具組合并不專業(yè),但卻是大多用戶最愿意掌握的技術(shù),培訓(xùn)成本和學(xué)習(xí)成本都是最低的。我們的電子公文制發(fā)工作流的定位應(yīng)該是:寧愿讓90%的從業(yè)人員都將自己的工作納入一個(gè)比較初步但能滿足常規(guī)工作要求的工作流中來提高效率,也不愿僅讓10%的人花大量的時(shí)間去掌握只能使用一部分功能的專業(yè)工作流系統(tǒng)。

四、 電子公文制發(fā)工作流的數(shù)據(jù)挖掘環(huán)節(jié)

數(shù)據(jù)挖掘是電子公文制作工作流的末端環(huán)節(jié),是對電子公文信息的二次利用,深入挖掘海量電子公文內(nèi)容的附加值,進(jìn)而為領(lǐng)導(dǎo)決策及新公文的撰擬提供依據(jù),目前在電子政務(wù)領(lǐng)域受到越來越多的重視。

1、 數(shù)據(jù)挖掘及其在電子公文制發(fā)中的應(yīng)用價(jià)值

電子公文制發(fā)技術(shù)是緊密地和辦公自動化聯(lián)系在一起的,二者有很多相重合之處。有專家把辦公自動化分為三個(gè)發(fā)展階段,即單機(jī)辦公、網(wǎng)絡(luò)協(xié)作和知識管理。注重個(gè)體性的普通應(yīng)用主要體現(xiàn)的是文秘人員單機(jī)文件的編排及處理,在網(wǎng)絡(luò)協(xié)作方面主要體現(xiàn)的是上面所說的工作流階段,而目前的OA系統(tǒng)已經(jīng)進(jìn)入知識管理階段,包括4個(gè)環(huán)節(jié):知識獲取、知識轉(zhuǎn)化、知識共享、知識價(jià)值度量。[5]“知識價(jià)值度量”知識管理要求從來人員必須要有高效利用已有公文進(jìn)行知識發(fā)現(xiàn)的能力,專業(yè)術(shù)語叫“數(shù)據(jù)挖掘”。

數(shù)據(jù)挖掘(Data mining)是對數(shù)據(jù)庫知識進(jìn)行信息發(fā)現(xiàn)的過程(knowledge-discoveryin databases)(KDD),一般指指按照一定挖掘模型從大量原生態(tài)數(shù)據(jù)中自動搜索、聚類、分析數(shù)據(jù),從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。作為近年來來一門處理數(shù)據(jù)的新興技術(shù),“數(shù)據(jù)挖掘的目標(biāo)主要是為了幫助決策者尋找數(shù)據(jù)間潛在的關(guān)聯(lián)(Relation),特征(pattern)、趨勢(Trend)等,發(fā)現(xiàn)被忽略的要素,對預(yù)測未來和決策行為十分有用。”[6]發(fā)現(xiàn)了的知識可以被用于信息管理、查詢優(yōu)化、決策支持、過程控制等。

單位的公文有兩個(gè)特點(diǎn),一是海量,二是蕪雜,但卻蘊(yùn)含很多價(jià)值,在傳統(tǒng)的紙媒為主政務(wù)領(lǐng)域難以進(jìn)行系統(tǒng)的研究,現(xiàn)在可以利用數(shù)據(jù)挖掘技術(shù)對電子公文數(shù)據(jù)進(jìn)行更加深入全面的利用。多年積累下來的電子公文文本數(shù)據(jù)量每年增長速度非???,累積在數(shù)據(jù)倉庫中的數(shù)據(jù)量會越來越龐大,數(shù)據(jù)是海量的,單憑人力很難發(fā)現(xiàn)它們之間的有機(jī)聯(lián)系及價(jià)值;另外,在積累的電子公文中,重要信息和次要信息,緊急信息與一般信息,本部門信息與其他部門信息等高度交叉,如無系統(tǒng)地整理,將產(chǎn)生信息泛濫,信息冗余,將信息的價(jià)值湮沒了。

領(lǐng)導(dǎo)的決策機(jī)制是建立在電子公文中的已有信息的基礎(chǔ)上,必須有一種技術(shù)將這些原生態(tài)的、帶有噪音的信息進(jìn)行挖掘、整理,將信息的潛在價(jià)值最大限度挖掘出來。利用數(shù)據(jù)挖掘技術(shù)可以根據(jù)算法自動聚類,自動系聯(lián),可以發(fā)現(xiàn)材料之間的內(nèi)在聯(lián)系,例如對市長信箱一年來的所有電子投訴郵件進(jìn)行數(shù)據(jù)挖掘,可以自動聚類出百姓投訴最多問題的排行;再如信訪部門的信息挖掘系統(tǒng)就會利用一個(gè)主題詞表進(jìn)行文本自動分詞,并綜合根據(jù)詞頻等因素將來訪信息中的熱點(diǎn)問題自動歸類,形成報(bào)告。

總之,數(shù)據(jù)挖掘可以發(fā)現(xiàn)很多表面看起來毫無關(guān)聯(lián)的工作之間的內(nèi)在聯(lián)系,從而合并一些工作環(huán)節(jié),降低成本,提高效率,這些都為本單位總結(jié)前期工作、領(lǐng)導(dǎo)決策、制訂新工作計(jì)劃等提供依據(jù)。

2、 數(shù)據(jù)挖掘技術(shù)的復(fù)雜性及普及應(yīng)用層面的需求

數(shù)據(jù)挖掘技術(shù)要比工作流技術(shù)更復(fù)雜、更專業(yè)。在唯技術(shù)觀的眼中,數(shù)據(jù)挖掘主要是圍繞數(shù)據(jù)挖掘的算法、語言等進(jìn)行研究,在數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘的具體階段、模型評估、鞏固知識、運(yùn)用知識等環(huán)節(jié)中,都需要專業(yè)的數(shù)據(jù)結(jié)構(gòu)及計(jì)算機(jī)信息管理系統(tǒng)、數(shù)據(jù)倉庫知識、大型數(shù)據(jù)庫軟件的操作和開發(fā)技能,甚至要掌握專業(yè)的數(shù)據(jù)挖掘軟件,如IBMIntelligent Miner、SAS Enterprise Miner、SPSSClementine等,它們都能夠提供專業(yè)的挖掘過程和挖掘模式。例如數(shù)據(jù)存儲是知識挖掘的最重要的對象,它是挖掘內(nèi)容的集成,挖掘要在其中開始。對于唯技術(shù)觀的人來講,不管數(shù)據(jù)量有多大,一般是不使用Access等桌面數(shù)據(jù)庫工具,而是直接基于Oracle、SQL Server、Sybase等大型數(shù)據(jù)倉庫軟件開發(fā)應(yīng)用。這些軟件雖然可以處理TB級的海量數(shù)據(jù),但價(jià)格昂貴,而且體積龐大,安裝、使用非常復(fù)雜,培訓(xùn)任務(wù)艱巨。所以在數(shù)據(jù)挖掘這一個(gè)先進(jìn)的理念下,很多單位經(jīng)常是被持唯技術(shù)觀的人員領(lǐng)錯(cuò)了方向,導(dǎo)致資金投入好高騖遠(yuǎn),而不是以實(shí)用夠用好用為目的,形成驚人的浪費(fèi)。

數(shù)據(jù)挖掘技術(shù)由于功能多、設(shè)置復(fù)雜,初學(xué)者很長時(shí)間難以入門。而且數(shù)據(jù)挖掘的應(yīng)用,如采用決策樹、遺傳算法、人工神經(jīng)網(wǎng)絡(luò)、粗集理論、關(guān)聯(lián)規(guī)則等方法都是非專業(yè)辦公人員無須掌握的,如果有需要,單位一般會組織軟件公司的人開發(fā),辦公人員只需掌握終端操作方法。作為普通辦公人員,首先要了解什么是知識挖掘,了解其工作機(jī)制和原理,樹立在工作中有意識在使用數(shù)據(jù)挖掘技術(shù)的意識,哪怕只是初步的涉獵,也會給工作帶來很多創(chuàng)新性思路和成果的;其次需要根據(jù)目前的使用現(xiàn)狀,組合一套過渡階段的基本工具組合。

3、 過渡期的數(shù)據(jù)挖掘工具集合

作為普通辦公人員在過渡階段利用數(shù)據(jù)挖掘先進(jìn)技術(shù)時(shí)最起碼要做到兩點(diǎn):

一是在數(shù)據(jù)存儲時(shí),有意識地注意數(shù)據(jù)的結(jié)構(gòu)化信息的建立。如在建立文件夾時(shí)用人工分類的方法,將信息的類別層次進(jìn)行科學(xué)歸類設(shè)計(jì),這樣以后尋找相關(guān)信息就會有的放矢,直奔主題,也會提高對數(shù)據(jù)挖掘結(jié)果分析的清晰度和可靠度。

二是掌握必要的全文檢索工具組合。有時(shí)所需參考的信息是分布在不同的年份、不同部門、不同類別的文件夾中,基本的全文檢索工具就可以實(shí)現(xiàn)跨文件夾的文本檢索與目標(biāo)信息提取。這就是數(shù)據(jù)挖掘技術(shù)在非專業(yè)層面的最基本使用。技術(shù)的深度和廣度永無止境,對于普通辦公人員來講要學(xué)會組合適合自己的全文檢索工具即可滿足一般的數(shù)據(jù)挖掘需要。

可以用Editplus、Emeditor這樣的小工具進(jìn)行跨文件或文件夾的多文件同時(shí)檢索,提取帶有我們需要的關(guān)鍵詞的例句,根據(jù)這些線索就可以進(jìn)行深入挖掘。采用全文索引技術(shù)的普及性檢索工具還有 Isys Desktop以及百度、Google、MSN、Yahoo的桌面搜索系統(tǒng)。這些軟件最突出的優(yōu)點(diǎn)就是在操作簡單方便的基礎(chǔ)上,采用了自動索引技術(shù),經(jīng)過一次索引的海量文件,檢索速度可實(shí)現(xiàn)零等待。另外,這些軟件支持的文件類型多,包括Word、Acrobat、WPS、郵件、網(wǎng)頁、即時(shí)通訊等文本型的結(jié)構(gòu)型的數(shù)據(jù),也包括音頻、視頻、圖片、壓縮包等半結(jié)構(gòu)型或非結(jié)構(gòu)型數(shù)據(jù),是全方位的高速檢索系統(tǒng)。有了這些小工具,非專業(yè)人員也可以使海量數(shù)據(jù)的潛藏價(jià)值從隱藏狀態(tài)初步呈現(xiàn)出來。

但應(yīng)該看到,相比于成熟的普及層面的工作流工具組合,數(shù)據(jù)挖掘技術(shù)目前還高高在上,面向普通應(yīng)用的工具組合還不夠全面和深入,也缺乏專業(yè)公司開發(fā)的面向普通應(yīng)用的類似Acrobat這種類型的半專業(yè)平臺。

五、 結(jié)語

從以上提供的工作流、數(shù)據(jù)挖掘這兩個(gè)電子公文制發(fā)中的嶄新技術(shù)的分析可以看出,目前的電子政務(wù)領(lǐng)域需要理性技術(shù)觀與普及應(yīng)用觀相結(jié)合的指導(dǎo)理念,理性技術(shù)觀可以作用于技術(shù)意識的提升與突顯,而普及應(yīng)用觀則面向全體從業(yè)人員,指導(dǎo)能實(shí)現(xiàn)基本工作目標(biāo)的技術(shù)組合。所以在辦公人員群體整體向高技術(shù)過渡的階段,選擇組合一套適合大多數(shù)人員而又夠用、好用的工具組合,這是當(dāng)務(wù)之急。

[1]柳新華、王東海、董相志.實(shí)用電子公文處理教程[M].科學(xué)出版社,2009.

[2]孫滿囤等.工作流模式支持語言YAWL可視化設(shè)計(jì)環(huán)境實(shí)現(xiàn)分析[J].微電子學(xué)與計(jì)算機(jī),2006(3).

[3]轉(zhuǎn)引自鄒曉宇等.基于工作流的軟件過程開發(fā)平臺的研究[J].計(jì)算機(jī)應(yīng)用研究,2006(1).

[4]羅海濱,范玉順,吳澄.工作流技術(shù)綜述[J].軟件學(xué)報(bào),2000(7).

[5]沈兵虎等.基于工作流技術(shù)的知識管理系統(tǒng)研究與設(shè)計(jì)[J].制造業(yè)自動化,2007(3).

[6]朱曉華.淺析數(shù)據(jù)挖掘技術(shù)在圖書館自動化中的應(yīng)用[J].圖書館學(xué)研究,2002(5).

猜你喜歡
表單數(shù)據(jù)挖掘工具
電子表單系統(tǒng)應(yīng)用分析
華東科技(2021年9期)2021-09-23 02:15:24
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
波比的工具
波比的工具
淺談網(wǎng)頁制作中表單的教學(xué)
“巧用”工具
讀者(2017年18期)2017-08-29 21:22:03
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究
動態(tài)表單技術(shù)在教學(xué)管理中的應(yīng)用*
鲁山县| 阳东县| 湖州市| 邵阳市| 开原市| 西贡区| 宜宾县| 滨州市| 土默特右旗| 林芝县| 含山县| 永和县| 郴州市| 五原县| 茌平县| 大埔县| 湖南省| 淮阳县| 遵义县| 米泉市| 班戈县| 屏边| 巴楚县| 行唐县| 昌江| 驻马店市| 黎平县| 铅山县| 宕昌县| 年辖:市辖区| 合川市| 康平县| 邓州市| 合阳县| 崇明县| 克拉玛依市| 柏乡县| 敦煌市| 淳安县| 高平市| 侯马市|