李晶
摘 要: 經(jīng)過處理并賦予一定的意義之后,數(shù)據(jù)便成為信息。發(fā)展電子政務(wù)需要應(yīng)用大量的各種類型數(shù)據(jù),如何高效、準確地處理數(shù)據(jù)以獲取有用的信息,是大數(shù)據(jù)時代電子政務(wù)所面臨的問題。因此,有必要對電子政務(wù)數(shù)據(jù)處理的流程和關(guān)鍵問題進行探討。通過分析數(shù)據(jù)處理在電子政務(wù)中的作用,得出數(shù)據(jù)處理系統(tǒng)能夠提升政府的信息服務(wù)質(zhì)量,建立電子化政府,為政府重大政策出臺提供信息支持,促進政府之間交流的結(jié)論。
關(guān)鍵詞: 電子政務(wù); 大數(shù)據(jù); 數(shù)據(jù)處理; 信息服務(wù)
中圖分類號: TN964?34 文獻標識碼: A 文章編號: 1004?373X(2014)10?0077?03
Abstract: The rapid development of E?government needs to apply various types of large amounts of data, but how to efficiently and accurately extract useful information from these data is still a problem faced by E?government in the era of big data. Therefore, it is necessary to discuss the technical process and key issues of E?government data processing. By analyzing the role of data processing in E?government, some conclusions has been obtained: the data processing system can improve the information service quality of government, help to establish an electronization government, provide an information support for the realization of the government's some important policies, and promote exchanges between governments.
Keywords: E?government; big data; data processing; information service
0 引 言
以網(wǎng)絡(luò)和電子信息技術(shù)為代表的現(xiàn)代科技的迅猛發(fā)展有力地推動了政府治理和公共服務(wù)范式的變革。政府管理理念和公共服務(wù)方式產(chǎn)生了巨大的轉(zhuǎn)變,從工業(yè)時代的傳統(tǒng)政務(wù)發(fā)展到互聯(lián)網(wǎng)時代的電子政務(wù)。電子政務(wù)綜合體現(xiàn)了“透明的政府”(Transparent Government)、“無縫”(Seamless)、“一體化的政府”(Integrated Government)和“回應(yīng)的政府”(Responsive Government),“以公眾為中心”(Citizen?centric)、“惠及所有人”(For All)、“變革的政府 ”(Transformational Government)等理念[1],是一種高效的、信息化的公共服務(wù)范式。
信息產(chǎn)業(yè)背景下,必須注重數(shù)據(jù)庫的發(fā)展和應(yīng)用,數(shù)據(jù)庫在各類型不同行業(yè)的系統(tǒng)中都占據(jù)著基礎(chǔ)的位置,電子政務(wù)系統(tǒng)也一樣采用了數(shù)據(jù)中心的運行方式。在所有的管理信息系統(tǒng)中,電子政務(wù)系統(tǒng)是最復(fù)雜、最龐大的系統(tǒng)之一[2],數(shù)據(jù)來源紛繁龐雜,對這些數(shù)據(jù)準確分析處理,所獲取的信息是政府部門城市管理和決策科學(xué)的重要依據(jù)。
利用相應(yīng)的技術(shù)和設(shè)備進行各類數(shù)據(jù)加工的過程就是數(shù)據(jù)處理(Data Processing),具體內(nèi)容包括對數(shù)字、文字、圖形或聲音等符號的采集、存儲、檢索、加工、變換和傳輸,經(jīng)過這些處理與解釋,數(shù)據(jù)被賦予一定的意義,形成信息。
數(shù)據(jù)處理技術(shù)涉及到數(shù)據(jù)庫管理系統(tǒng)、分布式數(shù)據(jù)處理系統(tǒng)、文檔處理等方面的技術(shù)[3]。
1 數(shù)據(jù)處理在電子政務(wù)中的作用
21世紀以來,社會各個領(lǐng)域廣泛應(yīng)用著數(shù)據(jù)處理系統(tǒng)。美國政府于 2012 年 3 月 29 日宣布推出“大數(shù)據(jù)的研究和發(fā)展計劃”[4],旨在提高從大量的、復(fù)雜的數(shù)據(jù)集合中獲取知識和見解的能力,推進和改善政府部門的數(shù)據(jù)采集、數(shù)據(jù)組織和數(shù)據(jù)分析技術(shù)。
在我國,社會信息化的基礎(chǔ)是政府信息化,電子政務(wù)位于政府積極推進的“信息高速公路”的5個領(lǐng)域(電子政務(wù)、電子商務(wù)、遠程教育、遠程醫(yī)療、電子娛樂)之首[5]。電子政務(wù)范式下,政府如何高效利用數(shù)據(jù)信息并開發(fā)出其作為一種重要資源的價值,特別是在公眾信息服務(wù)、電子化政府、政府之間交流、政府行政決策等方面,成為政府公共管理部門關(guān)注的問題。所以,數(shù)據(jù)處理系統(tǒng)已經(jīng)成為我國電子政務(wù)建設(shè)中不能缺少的信息化工具,對提高政府工作效率、輔助政府工作、提供決策支持等具有極大的作用。主要體現(xiàn)在:
1.1 提升政府的信息服務(wù)質(zhì)量。
政府的公信力體現(xiàn)在及時提供給公眾各類官方信息,包括社會經(jīng)濟數(shù)據(jù)、緊急狀態(tài)下的救援情況、各類新聞發(fā)布等。通過計算機數(shù)據(jù)處理進行信息管理已成為政府為公眾提供信息服務(wù)的重要方式[6]。信息管理需要建立數(shù)據(jù)庫,對各種原始數(shù)據(jù)(包括數(shù)值的和非數(shù)值的)進行整理、分析、計算和編輯加工,通過系統(tǒng)地存儲和整理、分析數(shù)據(jù)獲取有價值的信息。信息化的數(shù)據(jù)處理技術(shù)相對于人工信息發(fā)布方式而言,顯著提高了政府工作效率,豐富了政府信息服務(wù)內(nèi)容,提升政府的信息服務(wù)質(zhì)量。
1.2 建立電子化政府。
電子化政府的重要表現(xiàn)形式是政府建立門戶網(wǎng)站。政府網(wǎng)站設(shè)計需要對網(wǎng)站內(nèi)容(文本或圖像內(nèi)容)進行數(shù)據(jù)處理,采用數(shù)據(jù)自動歸類技術(shù)實現(xiàn)網(wǎng)站信息的分類整理,準確快捷地組織網(wǎng)站信息,整理點擊量高的信息數(shù)據(jù),還可以結(jié)合用戶訪問記錄,把握用戶的興趣,有助于個人信息的定制服務(wù)以及開展網(wǎng)站信息推送服務(wù),吸引更多的用戶。
通常,政府門戶網(wǎng)站的訪問量很大,經(jīng)常需要處理數(shù)據(jù)。在進行專業(yè)模塊的數(shù)據(jù)分析時,先要把無關(guān)的、不重要的數(shù)據(jù)清理掉,即有針對性的進行數(shù)據(jù)清洗;接下來的步驟就是對數(shù)據(jù)進行分類,分類劃分之后,根據(jù)具體的數(shù)據(jù)分析需求,選擇相應(yīng)的模式分析技術(shù),如路徑分析、興趣關(guān)聯(lián)、聚類規(guī)則等進行數(shù)據(jù)處理。
例如,網(wǎng)絡(luò)數(shù)據(jù)處理部分可以利用搜索引擎技術(shù)來實現(xiàn)。通過搜索引擎對網(wǎng)頁內(nèi)容檢索,可以實現(xiàn)網(wǎng)絡(luò)信息的分類瀏覽和網(wǎng)頁的分類聚類;在分類基礎(chǔ)上運用數(shù)據(jù)處理技術(shù),改進網(wǎng)站內(nèi)容關(guān)鍵詞加權(quán)算法,可以增強檢索效果,提高網(wǎng)絡(luò)信息的標引準確度。
1.3 為政府重大政策出臺提供信息支持。
政府科學(xué)決策需要全面、準確、客觀、科學(xué)的數(shù)字依據(jù),即數(shù)據(jù)采集、存儲,分析和匯總所形成的有效信息。例如,通過采集海量社會經(jīng)濟文化數(shù)據(jù)(人口、交通、教育、工農(nóng)業(yè)等),建立數(shù)據(jù)庫系統(tǒng),針對不同類型的數(shù)據(jù)資源整理和分析處理,取得有意義的信息,預(yù)測未來的社會經(jīng)濟發(fā)展方向,從而制定出相應(yīng)的宏觀經(jīng)濟調(diào)控政策[7]。同理,通過對各類渠道獲取的社會資源的數(shù)據(jù)分析處理,可以科學(xué)地制定出一些社會服務(wù)、社會保障與社會福利等政策。
1.4 促進政府之間交流。
現(xiàn)階段我國政府采用的是條塊結(jié)合的行政組織架構(gòu),地方政府之間需要經(jīng)常性的橫向或縱向交流溝通,這些交流很大程度上以網(wǎng)絡(luò)化信息化方式實現(xiàn)。通過訪問政府網(wǎng)站,應(yīng)用數(shù)據(jù)處理技術(shù),自動獲取并分析網(wǎng)絡(luò)瀏覽器端的用戶訪問模式和行為模式、日志信息記錄等,再結(jié)合用戶登記信息,通過模式分析,找出政務(wù)交往對象,或發(fā)現(xiàn)潛在的交流對象,最后通過聯(lián)機分析(OLAP)進行驗證。例如,評價用戶是否有與該政府機構(gòu)交往的意愿,可以通過用戶瀏覽政府門戶網(wǎng)站信息內(nèi)容及所花費的總時間做出判斷;應(yīng)用聚類分析來識別用戶的訪問動機和訪問趨勢等。
2 電子政務(wù)中數(shù)據(jù)處理技術(shù)關(guān)鍵問題探討
2.1 構(gòu)建數(shù)據(jù)處理系統(tǒng)
各種數(shù)字、符號、聲音、圖片和文字的集合都可以稱為數(shù)據(jù)[8]。借助計算機技術(shù)采集、記錄、分析數(shù)據(jù),生成面向特定對象的信息,這個過程就是數(shù)據(jù)處理。運用計算機技術(shù)構(gòu)建一個完整的數(shù)據(jù)處理系統(tǒng),通常包括以下內(nèi)容:
采集數(shù)據(jù):收集用戶需要的各類型數(shù)字、符號、聲音、圖片和文字。
轉(zhuǎn)換數(shù)據(jù):整理收集到的各類數(shù)據(jù),將其轉(zhuǎn)換成計算機能夠識別的信息。
數(shù)據(jù)分組:按照設(shè)定的分類編碼,將相關(guān)信息進行分組歸類。
數(shù)據(jù)排序:按照設(shè)定要求,將數(shù)據(jù)排列先后次序。
數(shù)據(jù)檢索:分為單一因素檢索和綜合條件檢索。根據(jù)用戶查詢,從數(shù)據(jù)集合中迅速提取準確的信息。
數(shù)據(jù)計算:運用各種算術(shù)和邏輯運算,其結(jié)果就是信息。
數(shù)據(jù)存儲:將計算的結(jié)果及原始數(shù)據(jù)保存起來,以備后用。
根據(jù)用戶需要,分別從這幾方面進行數(shù)據(jù)處理,數(shù)據(jù)處理原理圖如圖1所示。
2.2 數(shù)據(jù)處理系統(tǒng)的工作步驟
數(shù)據(jù)處理的過程大致可分為數(shù)據(jù)的輸入、處理和輸出3個階段的工序。
數(shù)據(jù)錄入階段,也可以稱為數(shù)據(jù)的準備階段。數(shù)據(jù)錄入以后,由計算機編譯程序,按程序的指示和要求對數(shù)據(jù)進行處理。數(shù)據(jù)處理的工作步驟,即上述7個工作內(nèi)容中的一個或若干個組合。數(shù)據(jù)經(jīng)處理,最后輸出的是各種文字和數(shù)字的報表或表格,即有意義的信息。數(shù)據(jù)處理工作順序流程圖如圖2所示。
概括的講,數(shù)據(jù)錄入是基礎(chǔ),數(shù)據(jù)處理是重點,數(shù)據(jù)輸出是目的。
2.3 數(shù)據(jù)處理體系的分類依據(jù)
基于數(shù)據(jù)時間空間不同的分布方式,數(shù)據(jù)處理設(shè)備不同的工作方式、結(jié)構(gòu)方式,要對數(shù)據(jù)處理進行不同的分類。不同的數(shù)據(jù)處理方式需要不同的軟件和硬件支撐,每種處理方式都具有各自的特點。在實際工作中,應(yīng)根據(jù)具體環(huán)境選擇適當?shù)臄?shù)據(jù)處理方式。數(shù)據(jù)處理主要有4種分類方式:
(1) 根據(jù)數(shù)據(jù)處理時間的分配方式,劃分為實時處理方式、分時處理方式和批處理方式。
(2) 根據(jù)數(shù)據(jù)處理空間的分布方式,劃分為集中式處理方式和分布式處理方式。
(3) 根據(jù)計算機中央處理器的工作方式,劃分為單通道作業(yè)處理方式、多通道作業(yè)處理方式和交互式處理方式。
(4) 根據(jù)數(shù)據(jù)處理設(shè)備的結(jié)構(gòu)方式,劃分為聯(lián)機處理方式和脫機處理方式。
2.4 不確定數(shù)據(jù)處理
關(guān)于數(shù)據(jù)處理的研究,除了針對確定性數(shù)據(jù),更多的則是針對Web數(shù)據(jù)和不確定性數(shù)據(jù)的研究[9]。在電子政務(wù)工作中經(jīng)常會產(chǎn)生不確定性數(shù)據(jù),例如:規(guī)劃城市公交線路時,可以通過采集刷卡數(shù)量的方法迅速統(tǒng)計出多少人/次乘坐了公交車,但是個人乘坐的站點數(shù)量,即刷卡的密度很難精確統(tǒng)計,而這些數(shù)據(jù)對公交車站點的設(shè)置非常重要。如果有精確的數(shù)據(jù),可以根據(jù)一定的算法計算出最合理的線路,在數(shù)據(jù)不確定情況下,只能根據(jù)乘坐的人數(shù)對具體的數(shù)據(jù)進行推測。另外,電子化政務(wù)工作中,有不少數(shù)據(jù)存在隱瞞、欺詐的情況,這些不真實數(shù)據(jù)也是造成不確定數(shù)據(jù)的主要原因。
由于取得的數(shù)據(jù)不確定,數(shù)據(jù)處理中心的方式僅能夠進行數(shù)據(jù)管理和分析,而無法算出確定的結(jié)論,無法為政府決策提供有效的信息參考。因此對于不確定數(shù)據(jù)要進行轉(zhuǎn)換。
3 結(jié) 語
隨著電子政務(wù)的發(fā)展和網(wǎng)絡(luò)用戶對高品質(zhì)、個性化的信息需求的不斷擴大,必將對數(shù)據(jù)處理技術(shù)提出更高的要求。從發(fā)展趨勢上看,數(shù)據(jù)處理技術(shù)未來發(fā)展的重點將主要集中于智能性、易用性、集成性3個方面[10],需要從這三方面入手推動信息處理技術(shù)的不斷發(fā)展與完善,更好地為電子政務(wù)服務(wù),提高信息化水平。
參考文獻
[1] 趙玎,陳貴梧.從電子政務(wù)到智慧政務(wù):范式轉(zhuǎn)變、關(guān)鍵問題及政府應(yīng)對策略[J].情報雜志,2013(1):205?207.
[2] 吳昊,孫寶文.當前我國電子政務(wù)發(fā)展現(xiàn)狀、問題及對策實證研究[J].國家行政學(xué)院學(xué)報,2009(5):16?19.
[3] 陳貴梧.地方電子政務(wù)公共服務(wù)的公眾接受問題:基于X市訪談數(shù)據(jù)的探索性研究[J].圖書情報工作,2011(3):28?30.
[4] 涂蘭敬.專家觀點:“大數(shù)據(jù)”與“龐大數(shù)據(jù)”的區(qū)別[J].網(wǎng)絡(luò)與信息,2011(12):37?38.
[5] 李建中,于戈,周傲英.不確定性數(shù)據(jù)管理的要求與挑戰(zhàn)[J].中國計算機學(xué)會通訊,2009,5(4):6?14.
[6] 李菲.基于數(shù)據(jù)挖掘的電子政務(wù)個性化推薦服務(wù)框架研究[J].商業(yè)時代,2010(9):47?48.
[7] 林野.探析我國電子政務(wù)發(fā)展的現(xiàn)狀及趨勢[J].信息與電腦,2012(2):29?30.
[8] 黃霞,朱曉峰,張琳.個性化電子政務(wù)信息服務(wù)研究[J].電子政務(wù),2012(3):79?84.
[9] 徐子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)與我們的生活[M].桂林:廣西師范大學(xué)出版社,2012.
[10] 王欣欣.芻議電子政務(wù)中的個性化服務(wù)模式研究:基于美國等電子政務(wù)網(wǎng)站建設(shè)的思考[J].情報雜志,2010(z):226?228.
通常,政府門戶網(wǎng)站的訪問量很大,經(jīng)常需要處理數(shù)據(jù)。在進行專業(yè)模塊的數(shù)據(jù)分析時,先要把無關(guān)的、不重要的數(shù)據(jù)清理掉,即有針對性的進行數(shù)據(jù)清洗;接下來的步驟就是對數(shù)據(jù)進行分類,分類劃分之后,根據(jù)具體的數(shù)據(jù)分析需求,選擇相應(yīng)的模式分析技術(shù),如路徑分析、興趣關(guān)聯(lián)、聚類規(guī)則等進行數(shù)據(jù)處理。
例如,網(wǎng)絡(luò)數(shù)據(jù)處理部分可以利用搜索引擎技術(shù)來實現(xiàn)。通過搜索引擎對網(wǎng)頁內(nèi)容檢索,可以實現(xiàn)網(wǎng)絡(luò)信息的分類瀏覽和網(wǎng)頁的分類聚類;在分類基礎(chǔ)上運用數(shù)據(jù)處理技術(shù),改進網(wǎng)站內(nèi)容關(guān)鍵詞加權(quán)算法,可以增強檢索效果,提高網(wǎng)絡(luò)信息的標引準確度。
1.3 為政府重大政策出臺提供信息支持。
政府科學(xué)決策需要全面、準確、客觀、科學(xué)的數(shù)字依據(jù),即數(shù)據(jù)采集、存儲,分析和匯總所形成的有效信息。例如,通過采集海量社會經(jīng)濟文化數(shù)據(jù)(人口、交通、教育、工農(nóng)業(yè)等),建立數(shù)據(jù)庫系統(tǒng),針對不同類型的數(shù)據(jù)資源整理和分析處理,取得有意義的信息,預(yù)測未來的社會經(jīng)濟發(fā)展方向,從而制定出相應(yīng)的宏觀經(jīng)濟調(diào)控政策[7]。同理,通過對各類渠道獲取的社會資源的數(shù)據(jù)分析處理,可以科學(xué)地制定出一些社會服務(wù)、社會保障與社會福利等政策。
1.4 促進政府之間交流。
現(xiàn)階段我國政府采用的是條塊結(jié)合的行政組織架構(gòu),地方政府之間需要經(jīng)常性的橫向或縱向交流溝通,這些交流很大程度上以網(wǎng)絡(luò)化信息化方式實現(xiàn)。通過訪問政府網(wǎng)站,應(yīng)用數(shù)據(jù)處理技術(shù),自動獲取并分析網(wǎng)絡(luò)瀏覽器端的用戶訪問模式和行為模式、日志信息記錄等,再結(jié)合用戶登記信息,通過模式分析,找出政務(wù)交往對象,或發(fā)現(xiàn)潛在的交流對象,最后通過聯(lián)機分析(OLAP)進行驗證。例如,評價用戶是否有與該政府機構(gòu)交往的意愿,可以通過用戶瀏覽政府門戶網(wǎng)站信息內(nèi)容及所花費的總時間做出判斷;應(yīng)用聚類分析來識別用戶的訪問動機和訪問趨勢等。
2 電子政務(wù)中數(shù)據(jù)處理技術(shù)關(guān)鍵問題探討
2.1 構(gòu)建數(shù)據(jù)處理系統(tǒng)
各種數(shù)字、符號、聲音、圖片和文字的集合都可以稱為數(shù)據(jù)[8]。借助計算機技術(shù)采集、記錄、分析數(shù)據(jù),生成面向特定對象的信息,這個過程就是數(shù)據(jù)處理。運用計算機技術(shù)構(gòu)建一個完整的數(shù)據(jù)處理系統(tǒng),通常包括以下內(nèi)容:
采集數(shù)據(jù):收集用戶需要的各類型數(shù)字、符號、聲音、圖片和文字。
轉(zhuǎn)換數(shù)據(jù):整理收集到的各類數(shù)據(jù),將其轉(zhuǎn)換成計算機能夠識別的信息。
數(shù)據(jù)分組:按照設(shè)定的分類編碼,將相關(guān)信息進行分組歸類。
數(shù)據(jù)排序:按照設(shè)定要求,將數(shù)據(jù)排列先后次序。
數(shù)據(jù)檢索:分為單一因素檢索和綜合條件檢索。根據(jù)用戶查詢,從數(shù)據(jù)集合中迅速提取準確的信息。
數(shù)據(jù)計算:運用各種算術(shù)和邏輯運算,其結(jié)果就是信息。
數(shù)據(jù)存儲:將計算的結(jié)果及原始數(shù)據(jù)保存起來,以備后用。
根據(jù)用戶需要,分別從這幾方面進行數(shù)據(jù)處理,數(shù)據(jù)處理原理圖如圖1所示。
2.2 數(shù)據(jù)處理系統(tǒng)的工作步驟
數(shù)據(jù)處理的過程大致可分為數(shù)據(jù)的輸入、處理和輸出3個階段的工序。
數(shù)據(jù)錄入階段,也可以稱為數(shù)據(jù)的準備階段。數(shù)據(jù)錄入以后,由計算機編譯程序,按程序的指示和要求對數(shù)據(jù)進行處理。數(shù)據(jù)處理的工作步驟,即上述7個工作內(nèi)容中的一個或若干個組合。數(shù)據(jù)經(jīng)處理,最后輸出的是各種文字和數(shù)字的報表或表格,即有意義的信息。數(shù)據(jù)處理工作順序流程圖如圖2所示。
概括的講,數(shù)據(jù)錄入是基礎(chǔ),數(shù)據(jù)處理是重點,數(shù)據(jù)輸出是目的。
2.3 數(shù)據(jù)處理體系的分類依據(jù)
基于數(shù)據(jù)時間空間不同的分布方式,數(shù)據(jù)處理設(shè)備不同的工作方式、結(jié)構(gòu)方式,要對數(shù)據(jù)處理進行不同的分類。不同的數(shù)據(jù)處理方式需要不同的軟件和硬件支撐,每種處理方式都具有各自的特點。在實際工作中,應(yīng)根據(jù)具體環(huán)境選擇適當?shù)臄?shù)據(jù)處理方式。數(shù)據(jù)處理主要有4種分類方式:
(1) 根據(jù)數(shù)據(jù)處理時間的分配方式,劃分為實時處理方式、分時處理方式和批處理方式。
(2) 根據(jù)數(shù)據(jù)處理空間的分布方式,劃分為集中式處理方式和分布式處理方式。
(3) 根據(jù)計算機中央處理器的工作方式,劃分為單通道作業(yè)處理方式、多通道作業(yè)處理方式和交互式處理方式。
(4) 根據(jù)數(shù)據(jù)處理設(shè)備的結(jié)構(gòu)方式,劃分為聯(lián)機處理方式和脫機處理方式。
2.4 不確定數(shù)據(jù)處理
關(guān)于數(shù)據(jù)處理的研究,除了針對確定性數(shù)據(jù),更多的則是針對Web數(shù)據(jù)和不確定性數(shù)據(jù)的研究[9]。在電子政務(wù)工作中經(jīng)常會產(chǎn)生不確定性數(shù)據(jù),例如:規(guī)劃城市公交線路時,可以通過采集刷卡數(shù)量的方法迅速統(tǒng)計出多少人/次乘坐了公交車,但是個人乘坐的站點數(shù)量,即刷卡的密度很難精確統(tǒng)計,而這些數(shù)據(jù)對公交車站點的設(shè)置非常重要。如果有精確的數(shù)據(jù),可以根據(jù)一定的算法計算出最合理的線路,在數(shù)據(jù)不確定情況下,只能根據(jù)乘坐的人數(shù)對具體的數(shù)據(jù)進行推測。另外,電子化政務(wù)工作中,有不少數(shù)據(jù)存在隱瞞、欺詐的情況,這些不真實數(shù)據(jù)也是造成不確定數(shù)據(jù)的主要原因。
由于取得的數(shù)據(jù)不確定,數(shù)據(jù)處理中心的方式僅能夠進行數(shù)據(jù)管理和分析,而無法算出確定的結(jié)論,無法為政府決策提供有效的信息參考。因此對于不確定數(shù)據(jù)要進行轉(zhuǎn)換。
3 結(jié) 語
隨著電子政務(wù)的發(fā)展和網(wǎng)絡(luò)用戶對高品質(zhì)、個性化的信息需求的不斷擴大,必將對數(shù)據(jù)處理技術(shù)提出更高的要求。從發(fā)展趨勢上看,數(shù)據(jù)處理技術(shù)未來發(fā)展的重點將主要集中于智能性、易用性、集成性3個方面[10],需要從這三方面入手推動信息處理技術(shù)的不斷發(fā)展與完善,更好地為電子政務(wù)服務(wù),提高信息化水平。
參考文獻
[1] 趙玎,陳貴梧.從電子政務(wù)到智慧政務(wù):范式轉(zhuǎn)變、關(guān)鍵問題及政府應(yīng)對策略[J].情報雜志,2013(1):205?207.
[2] 吳昊,孫寶文.當前我國電子政務(wù)發(fā)展現(xiàn)狀、問題及對策實證研究[J].國家行政學(xué)院學(xué)報,2009(5):16?19.
[3] 陳貴梧.地方電子政務(wù)公共服務(wù)的公眾接受問題:基于X市訪談數(shù)據(jù)的探索性研究[J].圖書情報工作,2011(3):28?30.
[4] 涂蘭敬.專家觀點:“大數(shù)據(jù)”與“龐大數(shù)據(jù)”的區(qū)別[J].網(wǎng)絡(luò)與信息,2011(12):37?38.
[5] 李建中,于戈,周傲英.不確定性數(shù)據(jù)管理的要求與挑戰(zhàn)[J].中國計算機學(xué)會通訊,2009,5(4):6?14.
[6] 李菲.基于數(shù)據(jù)挖掘的電子政務(wù)個性化推薦服務(wù)框架研究[J].商業(yè)時代,2010(9):47?48.
[7] 林野.探析我國電子政務(wù)發(fā)展的現(xiàn)狀及趨勢[J].信息與電腦,2012(2):29?30.
[8] 黃霞,朱曉峰,張琳.個性化電子政務(wù)信息服務(wù)研究[J].電子政務(wù),2012(3):79?84.
[9] 徐子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)與我們的生活[M].桂林:廣西師范大學(xué)出版社,2012.
[10] 王欣欣.芻議電子政務(wù)中的個性化服務(wù)模式研究:基于美國等電子政務(wù)網(wǎng)站建設(shè)的思考[J].情報雜志,2010(z):226?228.
通常,政府門戶網(wǎng)站的訪問量很大,經(jīng)常需要處理數(shù)據(jù)。在進行專業(yè)模塊的數(shù)據(jù)分析時,先要把無關(guān)的、不重要的數(shù)據(jù)清理掉,即有針對性的進行數(shù)據(jù)清洗;接下來的步驟就是對數(shù)據(jù)進行分類,分類劃分之后,根據(jù)具體的數(shù)據(jù)分析需求,選擇相應(yīng)的模式分析技術(shù),如路徑分析、興趣關(guān)聯(lián)、聚類規(guī)則等進行數(shù)據(jù)處理。
例如,網(wǎng)絡(luò)數(shù)據(jù)處理部分可以利用搜索引擎技術(shù)來實現(xiàn)。通過搜索引擎對網(wǎng)頁內(nèi)容檢索,可以實現(xiàn)網(wǎng)絡(luò)信息的分類瀏覽和網(wǎng)頁的分類聚類;在分類基礎(chǔ)上運用數(shù)據(jù)處理技術(shù),改進網(wǎng)站內(nèi)容關(guān)鍵詞加權(quán)算法,可以增強檢索效果,提高網(wǎng)絡(luò)信息的標引準確度。
1.3 為政府重大政策出臺提供信息支持。
政府科學(xué)決策需要全面、準確、客觀、科學(xué)的數(shù)字依據(jù),即數(shù)據(jù)采集、存儲,分析和匯總所形成的有效信息。例如,通過采集海量社會經(jīng)濟文化數(shù)據(jù)(人口、交通、教育、工農(nóng)業(yè)等),建立數(shù)據(jù)庫系統(tǒng),針對不同類型的數(shù)據(jù)資源整理和分析處理,取得有意義的信息,預(yù)測未來的社會經(jīng)濟發(fā)展方向,從而制定出相應(yīng)的宏觀經(jīng)濟調(diào)控政策[7]。同理,通過對各類渠道獲取的社會資源的數(shù)據(jù)分析處理,可以科學(xué)地制定出一些社會服務(wù)、社會保障與社會福利等政策。
1.4 促進政府之間交流。
現(xiàn)階段我國政府采用的是條塊結(jié)合的行政組織架構(gòu),地方政府之間需要經(jīng)常性的橫向或縱向交流溝通,這些交流很大程度上以網(wǎng)絡(luò)化信息化方式實現(xiàn)。通過訪問政府網(wǎng)站,應(yīng)用數(shù)據(jù)處理技術(shù),自動獲取并分析網(wǎng)絡(luò)瀏覽器端的用戶訪問模式和行為模式、日志信息記錄等,再結(jié)合用戶登記信息,通過模式分析,找出政務(wù)交往對象,或發(fā)現(xiàn)潛在的交流對象,最后通過聯(lián)機分析(OLAP)進行驗證。例如,評價用戶是否有與該政府機構(gòu)交往的意愿,可以通過用戶瀏覽政府門戶網(wǎng)站信息內(nèi)容及所花費的總時間做出判斷;應(yīng)用聚類分析來識別用戶的訪問動機和訪問趨勢等。
2 電子政務(wù)中數(shù)據(jù)處理技術(shù)關(guān)鍵問題探討
2.1 構(gòu)建數(shù)據(jù)處理系統(tǒng)
各種數(shù)字、符號、聲音、圖片和文字的集合都可以稱為數(shù)據(jù)[8]。借助計算機技術(shù)采集、記錄、分析數(shù)據(jù),生成面向特定對象的信息,這個過程就是數(shù)據(jù)處理。運用計算機技術(shù)構(gòu)建一個完整的數(shù)據(jù)處理系統(tǒng),通常包括以下內(nèi)容:
采集數(shù)據(jù):收集用戶需要的各類型數(shù)字、符號、聲音、圖片和文字。
轉(zhuǎn)換數(shù)據(jù):整理收集到的各類數(shù)據(jù),將其轉(zhuǎn)換成計算機能夠識別的信息。
數(shù)據(jù)分組:按照設(shè)定的分類編碼,將相關(guān)信息進行分組歸類。
數(shù)據(jù)排序:按照設(shè)定要求,將數(shù)據(jù)排列先后次序。
數(shù)據(jù)檢索:分為單一因素檢索和綜合條件檢索。根據(jù)用戶查詢,從數(shù)據(jù)集合中迅速提取準確的信息。
數(shù)據(jù)計算:運用各種算術(shù)和邏輯運算,其結(jié)果就是信息。
數(shù)據(jù)存儲:將計算的結(jié)果及原始數(shù)據(jù)保存起來,以備后用。
根據(jù)用戶需要,分別從這幾方面進行數(shù)據(jù)處理,數(shù)據(jù)處理原理圖如圖1所示。
2.2 數(shù)據(jù)處理系統(tǒng)的工作步驟
數(shù)據(jù)處理的過程大致可分為數(shù)據(jù)的輸入、處理和輸出3個階段的工序。
數(shù)據(jù)錄入階段,也可以稱為數(shù)據(jù)的準備階段。數(shù)據(jù)錄入以后,由計算機編譯程序,按程序的指示和要求對數(shù)據(jù)進行處理。數(shù)據(jù)處理的工作步驟,即上述7個工作內(nèi)容中的一個或若干個組合。數(shù)據(jù)經(jīng)處理,最后輸出的是各種文字和數(shù)字的報表或表格,即有意義的信息。數(shù)據(jù)處理工作順序流程圖如圖2所示。
概括的講,數(shù)據(jù)錄入是基礎(chǔ),數(shù)據(jù)處理是重點,數(shù)據(jù)輸出是目的。
2.3 數(shù)據(jù)處理體系的分類依據(jù)
基于數(shù)據(jù)時間空間不同的分布方式,數(shù)據(jù)處理設(shè)備不同的工作方式、結(jié)構(gòu)方式,要對數(shù)據(jù)處理進行不同的分類。不同的數(shù)據(jù)處理方式需要不同的軟件和硬件支撐,每種處理方式都具有各自的特點。在實際工作中,應(yīng)根據(jù)具體環(huán)境選擇適當?shù)臄?shù)據(jù)處理方式。數(shù)據(jù)處理主要有4種分類方式:
(1) 根據(jù)數(shù)據(jù)處理時間的分配方式,劃分為實時處理方式、分時處理方式和批處理方式。
(2) 根據(jù)數(shù)據(jù)處理空間的分布方式,劃分為集中式處理方式和分布式處理方式。
(3) 根據(jù)計算機中央處理器的工作方式,劃分為單通道作業(yè)處理方式、多通道作業(yè)處理方式和交互式處理方式。
(4) 根據(jù)數(shù)據(jù)處理設(shè)備的結(jié)構(gòu)方式,劃分為聯(lián)機處理方式和脫機處理方式。
2.4 不確定數(shù)據(jù)處理
關(guān)于數(shù)據(jù)處理的研究,除了針對確定性數(shù)據(jù),更多的則是針對Web數(shù)據(jù)和不確定性數(shù)據(jù)的研究[9]。在電子政務(wù)工作中經(jīng)常會產(chǎn)生不確定性數(shù)據(jù),例如:規(guī)劃城市公交線路時,可以通過采集刷卡數(shù)量的方法迅速統(tǒng)計出多少人/次乘坐了公交車,但是個人乘坐的站點數(shù)量,即刷卡的密度很難精確統(tǒng)計,而這些數(shù)據(jù)對公交車站點的設(shè)置非常重要。如果有精確的數(shù)據(jù),可以根據(jù)一定的算法計算出最合理的線路,在數(shù)據(jù)不確定情況下,只能根據(jù)乘坐的人數(shù)對具體的數(shù)據(jù)進行推測。另外,電子化政務(wù)工作中,有不少數(shù)據(jù)存在隱瞞、欺詐的情況,這些不真實數(shù)據(jù)也是造成不確定數(shù)據(jù)的主要原因。
由于取得的數(shù)據(jù)不確定,數(shù)據(jù)處理中心的方式僅能夠進行數(shù)據(jù)管理和分析,而無法算出確定的結(jié)論,無法為政府決策提供有效的信息參考。因此對于不確定數(shù)據(jù)要進行轉(zhuǎn)換。
3 結(jié) 語
隨著電子政務(wù)的發(fā)展和網(wǎng)絡(luò)用戶對高品質(zhì)、個性化的信息需求的不斷擴大,必將對數(shù)據(jù)處理技術(shù)提出更高的要求。從發(fā)展趨勢上看,數(shù)據(jù)處理技術(shù)未來發(fā)展的重點將主要集中于智能性、易用性、集成性3個方面[10],需要從這三方面入手推動信息處理技術(shù)的不斷發(fā)展與完善,更好地為電子政務(wù)服務(wù),提高信息化水平。
參考文獻
[1] 趙玎,陳貴梧.從電子政務(wù)到智慧政務(wù):范式轉(zhuǎn)變、關(guān)鍵問題及政府應(yīng)對策略[J].情報雜志,2013(1):205?207.
[2] 吳昊,孫寶文.當前我國電子政務(wù)發(fā)展現(xiàn)狀、問題及對策實證研究[J].國家行政學(xué)院學(xué)報,2009(5):16?19.
[3] 陳貴梧.地方電子政務(wù)公共服務(wù)的公眾接受問題:基于X市訪談數(shù)據(jù)的探索性研究[J].圖書情報工作,2011(3):28?30.
[4] 涂蘭敬.專家觀點:“大數(shù)據(jù)”與“龐大數(shù)據(jù)”的區(qū)別[J].網(wǎng)絡(luò)與信息,2011(12):37?38.
[5] 李建中,于戈,周傲英.不確定性數(shù)據(jù)管理的要求與挑戰(zhàn)[J].中國計算機學(xué)會通訊,2009,5(4):6?14.
[6] 李菲.基于數(shù)據(jù)挖掘的電子政務(wù)個性化推薦服務(wù)框架研究[J].商業(yè)時代,2010(9):47?48.
[7] 林野.探析我國電子政務(wù)發(fā)展的現(xiàn)狀及趨勢[J].信息與電腦,2012(2):29?30.
[8] 黃霞,朱曉峰,張琳.個性化電子政務(wù)信息服務(wù)研究[J].電子政務(wù),2012(3):79?84.
[9] 徐子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)與我們的生活[M].桂林:廣西師范大學(xué)出版社,2012.
[10] 王欣欣.芻議電子政務(wù)中的個性化服務(wù)模式研究:基于美國等電子政務(wù)網(wǎng)站建設(shè)的思考[J].情報雜志,2010(z):226?228.