□陳大杰
(寧波市公安局,浙江 寧波 315000)
當(dāng)前,隨著情報(bào)信息主導(dǎo)警務(wù)模式的深入推進(jìn),社會數(shù)據(jù)作為一類重要的應(yīng)用資源,越來越受到各級公安機(jī)關(guān)的重視與關(guān)注,同時,對社會數(shù)據(jù)資源的采集、管理和應(yīng)用的需求也日益迫切。在大數(shù)據(jù)時代,如何更好地采集、管理和應(yīng)用社會數(shù)據(jù),確保社會數(shù)據(jù)更好地服務(wù)于公安工作,值得各級公安機(jī)關(guān)深入探索實(shí)踐。本文試從當(dāng)前寧波市社會數(shù)據(jù)管理應(yīng)用工作現(xiàn)狀出發(fā),分析社會數(shù)據(jù)管理應(yīng)用工作的難點(diǎn),提出加強(qiáng)社會數(shù)據(jù)采集、管理與應(yīng)用的工作對策,旨在為探索社會數(shù)據(jù)轉(zhuǎn)化警務(wù)工作戰(zhàn)斗力提供可借鑒的范式。
(一)社會數(shù)據(jù)概念。社會數(shù)據(jù)是人們在社會活動中產(chǎn)生的各類信息。按行業(yè)類別可分為銀行類、證券類、保險類、郵政類、通信類、勞務(wù)類、社保類、衛(wèi)生類、交通類(包括航空公司信息、出租車信息、汽車租賃信息等)、典當(dāng)類、稅務(wù)類、工商類等,是一個范圍很廣的概念。本文僅從公安業(yè)務(wù)的角度出發(fā),選用狹義的社會數(shù)據(jù)概念,即公安外部信息資源。公安外部信息資源是指公安系統(tǒng)外的政府部門、行業(yè)主管單位、壟斷性企業(yè)所掌握的,可以服務(wù)于公安偵查破案和基礎(chǔ)工作的社會各類基礎(chǔ)性數(shù)據(jù)信息。
(二)社會數(shù)據(jù)特性。一是社會數(shù)據(jù)的多樣性。在信息化時代,無論是個人還是單位,在社會上活動必然會留下各種社會數(shù)據(jù),如通話通信、勞動社保、房地產(chǎn)登記、郵政匯款、醫(yī)療保障、金融交易和公交運(yùn)輸?shù)?,目前國?nèi)約80%的社會數(shù)據(jù)資源由政府部門掌控。①二是社會數(shù)據(jù)的關(guān)聯(lián)性。社會數(shù)據(jù)是一個信息綜合體,各種關(guān)系錯綜復(fù)雜。在大量紛繁復(fù)雜的社會數(shù)據(jù)之間存在著一定的關(guān)聯(lián)性。三是社會數(shù)據(jù)的高增長性。同一類型的數(shù)據(jù)量在快速增大,數(shù)據(jù)增長的速度在加快。哈爾·范里安是谷歌的首席經(jīng)濟(jì)學(xué)家,他于2000年對數(shù)據(jù)和信息進(jìn)行研究后認(rèn)為,每年人類社會產(chǎn)生的信息量大,因此無法準(zhǔn)確計(jì)算,只能估算,他估計(jì)2000年新產(chǎn)生的數(shù)據(jù)量為1000PB②到2000PB,但到2010年,僅僅全球企業(yè)一年新存儲的數(shù)據(jù)量就超過了7000PB。③
(三)社會數(shù)據(jù)與公安業(yè)務(wù)數(shù)據(jù)的關(guān)系
1.社會數(shù)據(jù)是公安業(yè)務(wù)數(shù)據(jù)的有益補(bǔ)充。在信息化時代,雖然違法犯罪嫌疑對象極力隱瞞自己的身份,但在社會生活、生產(chǎn)和管理過程中,他始終是社會中的一員,必須在特定的時間、地點(diǎn)和行業(yè)以真實(shí)身份出現(xiàn),在社會上活動就必然會留下社會數(shù)據(jù),如交通往來、住宿娛樂、通話通信、勞動社保、房地產(chǎn)登記、郵政匯款、醫(yī)療保障、金融交易等,從中不難發(fā)現(xiàn)其活動軌跡。公安機(jī)關(guān)通過收集整合各類社會數(shù)據(jù),就是要將社會數(shù)據(jù)作為公安業(yè)務(wù)數(shù)據(jù)的有益補(bǔ)充,做到為我所用。
2.社會數(shù)據(jù)與公安業(yè)務(wù)數(shù)據(jù)存在交叉重疊。“在一點(diǎn)精確地或近似地復(fù)現(xiàn)在另一點(diǎn)所選取的訊息,這些訊息往往都帶有意義”。④社會數(shù)據(jù)是一個信息綜合體,既包括內(nèi)外之間的關(guān)系,又包括主次之間的關(guān)系,各種關(guān)系錯綜復(fù)雜。同時,各類社會數(shù)據(jù)之間包括與公安業(yè)務(wù)數(shù)據(jù)之間,總會出現(xiàn)交叉重疊的現(xiàn)象,存在著一定的關(guān)聯(lián)性。社會數(shù)據(jù)為公安分析研判、實(shí)現(xiàn)各類數(shù)據(jù)的碰撞比對提供條件。
3.社會數(shù)據(jù)促進(jìn)公安業(yè)務(wù)數(shù)據(jù)的鮮活。社會數(shù)據(jù)的價值取決于社會數(shù)據(jù)的時效性,特別是反映客觀事物某種發(fā)展趨勢、動向的數(shù)據(jù),時效性越強(qiáng),數(shù)據(jù)的價值越大,高時效的社會數(shù)據(jù)對公安業(yè)務(wù)數(shù)據(jù)而言,補(bǔ)充了公安業(yè)務(wù)數(shù)據(jù)的內(nèi)容,促進(jìn)了公安業(yè)務(wù)數(shù)據(jù)的鮮活準(zhǔn)確。例如,常住人口登記中的婚姻登記項(xiàng)目,如結(jié)合民政部門數(shù)據(jù)則更為鮮活精確。
為全面了解寧波市(以下簡稱“我市”)社會數(shù)據(jù)管理應(yīng)用工作現(xiàn)狀,我們開展了文獻(xiàn)調(diào)查和問卷調(diào)查。前期組織了一次公安內(nèi)部社會數(shù)據(jù)采集、應(yīng)用、管理網(wǎng)絡(luò)問卷調(diào)查,針對社會數(shù)據(jù)采集、管理、應(yīng)用現(xiàn)狀,分采集情況、日常維護(hù)管理、發(fā)揮實(shí)效情況以及對此項(xiàng)工作建議等4 個方面設(shè)置了20 余個問題,邀請各縣(市、區(qū))公安局、公安分局情報(bào)部門、各派出所及部分民警開展問卷調(diào)查,一周時間回收問卷300 份。其中,受調(diào)查對象中來自派出所的占73.5%,業(yè)務(wù)大隊(duì)占14.9%,綜合部門占11.6%;受調(diào)查對象崗位包括國保、經(jīng)偵、法制、刑偵、交管、警衛(wèi)、網(wǎng)警、邊防、治安、巡特警、派出所、信訪辦、指揮中心、禁毒等,其中派出所和治安分別占比44.8%和22.5%。(見圖1)
圖1 受調(diào)查對象崗位分布圖
受調(diào)查對象工作年限在7年以上占三分之二。從問卷調(diào)查情況來看,我市社會信息管理應(yīng)用的現(xiàn)狀主要體現(xiàn)在以下四個方面。
(一)制度建設(shè)方面。2009年,我市以反恐辦的名義發(fā)布《關(guān)于整合相關(guān)政府部門信息數(shù)據(jù)的通知》,要求面向政府部門采集社會數(shù)據(jù)。2011年1月,公安部與國家十四部委聯(lián)合下發(fā)了《關(guān)于建立實(shí)名制信息快速查詢協(xié)作執(zhí)法機(jī)制的實(shí)施意見》,推動了實(shí)名制信息交流共享的開展。寧波市公安局從2007年建立情報(bào)信息處開始,啟動社會數(shù)據(jù)獲取工作。2007年10月,寧波市公安局職能部門提出《關(guān)于加強(qiáng)批量社會數(shù)據(jù)獲取和管理的報(bào)告》,在全局范圍開展社會數(shù)據(jù)應(yīng)用情況和需求調(diào)研,明確需要采集的31 家政府(社會)單位數(shù)據(jù)。2012年,面向縣級公安機(jī)關(guān)和市局業(yè)務(wù)部門擬定《全市公安機(jī)關(guān)社會數(shù)據(jù)采集工作實(shí)施方案》,明確社會數(shù)據(jù)采集三年工作規(guī)劃。2012 至2014年,我市逐年下發(fā)《社會數(shù)據(jù)采集任務(wù)書》,并納入全市重點(diǎn)工作、業(yè)務(wù)考核和績效考核,開展定期通報(bào)考核。我市的縣(市、區(qū))層面,余姚市、慈溪市以市政府兩辦名義發(fā)文明確整合各部門信息資源,其余各地每年下發(fā)社會數(shù)據(jù)采集任務(wù)書。
(二)系統(tǒng)建設(shè)方面。政府層面,全市信息應(yīng)用網(wǎng)絡(luò)基礎(chǔ)設(shè)施不斷完善,黨政機(jī)關(guān)內(nèi)部局域網(wǎng)建設(shè)步伐不斷加快,全市涉及社會管理、公共服務(wù)的各個政府部門相繼建立了業(yè)務(wù)信息系統(tǒng),如寧波電子口岸已建成區(qū)域性大通關(guān)、大物流、大外貿(mào)的統(tǒng)一信息平臺。市政府明確宏觀經(jīng)濟(jì)基礎(chǔ)數(shù)據(jù)庫由市發(fā)改委牽頭建設(shè),人口基礎(chǔ)數(shù)據(jù)庫由寧波市公安局牽頭建設(shè),作為智慧城市建設(shè)的一項(xiàng)內(nèi)容。公安機(jī)關(guān)內(nèi)部,截止2013年,寧波市公安局將核對梳理后的社會數(shù)據(jù)統(tǒng)一存儲于寧波綜合信息資源庫,2014年起,獨(dú)立建成社會數(shù)據(jù)管理系統(tǒng),專門用于社會數(shù)據(jù)的存儲查詢,且數(shù)據(jù)與寧波綜合信息資源庫互享互通。余姚、慈溪、奉化、象山、鎮(zhèn)海、海曙等多地自行開發(fā)社會數(shù)據(jù)管理系統(tǒng)或?qū)n}數(shù)據(jù)庫,有效地推進(jìn)了社會數(shù)據(jù)管理應(yīng)用工作。
(三)采集管理方面。近年來,公安機(jī)關(guān)內(nèi)部已存儲的社會數(shù)據(jù)總類別和數(shù)量均呈逐年遞增趨勢。據(jù)初步統(tǒng)計(jì),寧波市公安局獲取社會數(shù)據(jù)總類別達(dá)200 余種,總數(shù)超2 億多條。全市工商、機(jī)場等已建立數(shù)據(jù)實(shí)時獲取專線,水、燃?xì)?、?shù)字電視、電力、醫(yī)療就診、教育信息、超市商業(yè)場所、市民卡、電信移動用戶等十余種優(yōu)質(zhì)數(shù)據(jù)定時更新;全市醫(yī)療就診、計(jì)生、社保的實(shí)時數(shù)據(jù)獲取工作正在洽談之中。部分縣市已開通電信、寬帶、學(xué)校、社保等信息專線,可實(shí)時獲取社會數(shù)據(jù),但同時,與外地市交換數(shù)據(jù)或民警零星采集仍然是基層社會數(shù)據(jù)采集的主要方式。從調(diào)查問卷情況來看,有66%的民警參與過社會數(shù)據(jù)采集工作,在獲取的這些社會數(shù)據(jù)類型中,主要有醫(yī)院類、教育類、商業(yè)類和員工類,個別的還有快遞類、保險類等;每個民警每年的社會數(shù)據(jù)采集任務(wù)總體較低,10000 條以上的占39%,1000-10000 條的占30%,1000 條以下的占19%,“零”條的占12%;社會數(shù)據(jù)獲取周期一年以上的占35%,半年以上的占32%,3 個月以上的占29%,從不更新的占4%。(見圖2)
圖2 社會數(shù)據(jù)的獲取周期分布圖
(四)應(yīng)用實(shí)效方面。從調(diào)查情況看,基層民警對當(dāng)前社會數(shù)據(jù)采集工作滿意度評價,很滿意的占24%,基本滿意的占69%,不滿意的占7%。(見圖3)這說明社會數(shù)據(jù)采集工作受到了肯定,但還有很大的提升空間。
圖3 當(dāng)前全市社會數(shù)據(jù)采集、應(yīng)用工作評價
社會數(shù)據(jù)應(yīng)用工作還是集中在少數(shù)專業(yè)人員內(nèi)部。調(diào)查數(shù)據(jù)顯示,將近一半的民警對于本地是否有社會數(shù)據(jù)查詢系統(tǒng)不清楚,只有31.1%的民警知道本地的查詢系統(tǒng)在指揮中心或情報(bào)中心,有68.1%的民警從來沒有使用過社會數(shù)據(jù)進(jìn)行案件偵查。社會數(shù)據(jù)查詢多應(yīng)用于失蹤人員軌跡、犯罪嫌疑人軌跡查詢,利用社會數(shù)據(jù)協(xié)助案件偵查、人員查控,對專業(yè)人員而言不乏經(jīng)典案例。
(一)法律支撐不足。當(dāng)前,尚無法律法規(guī)對公安機(jī)關(guān)在社會數(shù)據(jù)整合方面的問題進(jìn)行明確,以致公安機(jī)關(guān)在整合信息數(shù)據(jù)時于法無據(jù),部分單位不理解、不支持、不配合,給此項(xiàng)工作帶來一定阻力。如當(dāng)前公安機(jī)關(guān)各職能部門僅能通過上門溝通、發(fā)函協(xié)調(diào)、簽署保密協(xié)議等辦法,獲得部分行政單位社會數(shù)據(jù)資源,私營企業(yè)往往以諸如個人論壇網(wǎng)站服務(wù)器、管理人員不在本地,注冊用戶信息為個人隱私等為由拒絕提供相關(guān)數(shù)據(jù)。從基層調(diào)查情況看,反映社會數(shù)據(jù)采集困難的原因中“缺少法律依據(jù)”一條占比最大,為38.9%。
(二)主動獲取意識不強(qiáng)。社會數(shù)據(jù)采集是公安機(jī)關(guān)管理工作的需要。公安機(jī)關(guān)及基層民警通過維護(hù)穩(wěn)定、打擊犯罪、治安管理、服務(wù)群眾等活動,將人、事、物、圖像、聲音、痕跡等信息收集、歸類,再錄入相應(yīng)信息系統(tǒng),這一過程都需要耗費(fèi)民警相當(dāng)長的工作時間和精力。這就需要我們積極主動協(xié)調(diào)溝通、上門走訪做工作,職能部門或責(zé)任民警由于一開始溝通不暢而產(chǎn)生“怕煩、厭煩”情緒,影響了數(shù)據(jù)的主動采集。
(三)數(shù)據(jù)規(guī)范不夠。如何收集、保存、維護(hù)、管理、分析這些呈指數(shù)級增長的社會數(shù)據(jù),是一個重大挑戰(zhàn)。譬如,社會數(shù)據(jù)由于屬性不同,會有不同的數(shù)據(jù)展現(xiàn)形式;由于來源渠道不同,存儲在不同的載體中,有的在計(jì)算機(jī)硬盤里,有的在數(shù)據(jù)倉庫內(nèi);由于部分社會部門實(shí)名制標(biāo)準(zhǔn)制定不久,規(guī)范采集的信息尚需時日,譬如,醫(yī)院登記的就醫(yī)人員信息、通信部門登記的手機(jī)信息、電力部門登記的用電戶信息、自來水部門登記的用水戶信息、互聯(lián)網(wǎng)中的微博信息等。部分社會部門在信息采集中,有信息項(xiàng)缺項(xiàng)、數(shù)據(jù)重復(fù)填寫等問題存在,例如,在一社區(qū)衛(wèi)生院采集的數(shù)據(jù)中,就有同一電話號碼對應(yīng)193 名不同的就診人員的情況。這些數(shù)據(jù)的不規(guī)范影響了社會數(shù)據(jù)資源整合的效益,公安機(jī)關(guān)需要呼吁政府層面來統(tǒng)籌解決這一問題。
(四)技術(shù)標(biāo)準(zhǔn)不統(tǒng)一。由于此項(xiàng)工作涉及各行各業(yè)的不同系統(tǒng),而公安機(jī)關(guān)在處理這些社會數(shù)據(jù)資源時均按照本行業(yè)的技術(shù)標(biāo)準(zhǔn)和行為習(xí)慣進(jìn)行,導(dǎo)致信息庫無法整體獲取、信息要素不齊全等問題,需要大量的人工入庫工作,過程復(fù)雜、耗費(fèi)時間長,大大降低了信息工作的時效性。很多部門的系統(tǒng)建庫工作進(jìn)展緩慢,或由省級管理部門研發(fā),縣級采集信息、開展應(yīng)用,部門與部門之間信息交流的平臺多沒有搭建。在基層調(diào)查中,反映數(shù)據(jù)獲取缺少技術(shù)手段和對方單位數(shù)據(jù)電子化程度低的問題分別占比11.8%和16.2%。
(五)整合應(yīng)用不夠。近年來,公安機(jī)關(guān)各業(yè)務(wù)部門結(jié)合自身管理職能和警種優(yōu)勢,建立了社會數(shù)據(jù)應(yīng)用管理系統(tǒng),但受限于缺乏上層統(tǒng)一的整合管理機(jī)制和長遠(yuǎn)統(tǒng)籌規(guī)劃,致使各層面社會數(shù)據(jù)資源的應(yīng)用、整合較為松散、孤立,無法形成高端綜合應(yīng)用的規(guī)模效應(yīng)。通過問卷調(diào)查的數(shù)據(jù)分析,存在三個方面問題:一是部分優(yōu)質(zhì)數(shù)據(jù)仍未整合。在獲取的社會數(shù)據(jù)中,醫(yī)院類、教育類、物流類、交通類、商業(yè)類、外來人口類等社會數(shù)據(jù)占比比較大,最具應(yīng)用效益,但目前民警迫切需要物流類、社保類、商業(yè)類、鐵路類的實(shí)時數(shù)據(jù)還未整合。二是部分字段關(guān)聯(lián)查詢尚未實(shí)現(xiàn)。對基層民警而言,平常查詢時應(yīng)用比較多的字段是身份證號碼、電話號碼、車牌等信息,從目前清理的數(shù)據(jù)來看,尚未能做到關(guān)聯(lián)查詢。三是權(quán)限開放與專業(yè)有限共享之間的矛盾時刻存在。由于社會數(shù)據(jù)涉密的原因,權(quán)限管理控制嚴(yán)格,僅限部分專業(yè)警種使用,而民警希望加大開放權(quán)限的呼聲比較高。
加強(qiáng)社會數(shù)據(jù)采集、管理與應(yīng)用,是公安信息化建設(shè)的必然趨勢,是提升公安機(jī)關(guān)核心戰(zhàn)斗力的必由之路。根據(jù)社會數(shù)據(jù)資源的特點(diǎn)和整合過程面臨的問題,筆者結(jié)合實(shí)際情況,提出如下加強(qiáng)社會數(shù)據(jù)采集、管理與應(yīng)用的工作對策。
(一)豐富社會數(shù)據(jù)資源源頭采集模式。一是推動政府主導(dǎo)下的信息采集。公安機(jī)關(guān)要為各級黨委、政府做好參謀,就社會數(shù)據(jù)獲取工作主動建言獻(xiàn)策,積極推動政府層面有關(guān)社會數(shù)據(jù)整合的政策文件出臺落實(shí),使整合利用社會數(shù)據(jù)工作有據(jù)可依、有章可循。要結(jié)合當(dāng)前公安機(jī)關(guān)“四項(xiàng)建設(shè)”和我市人口基礎(chǔ)數(shù)據(jù)庫建設(shè)工作,利用“智慧寧波”建設(shè)的契機(jī),從反恐應(yīng)急處置工作高度出發(fā),爭取得到當(dāng)?shù)攸h委、政府的重視和支持,將整合社會數(shù)據(jù)工作納入黨委、政府的整體工作,采取相應(yīng)工作措施,使整合社會數(shù)據(jù)工作責(zé)任明確、措施到位。二是嘗試以協(xié)議和購買服務(wù)的形式開展社會數(shù)據(jù)采集,可以借鑒美國的做法。美國國家執(zhí)法電子通信系統(tǒng)是一個由各州聯(lián)合組建的為全國執(zhí)法部門服務(wù)的系統(tǒng),總部設(shè)在亞利桑那州的鳳凰城。用戶每月需支付1700 美元的服務(wù)費(fèi),以保證該系統(tǒng)的運(yùn)轉(zhuǎn)。全美50 個州和聯(lián)邦執(zhí)法機(jī)構(gòu)都是該系統(tǒng)的用戶。該系統(tǒng)是唯一用來專門傳送司法信息的系統(tǒng),并由州政府管理操作,系統(tǒng)晝夜服務(wù),獲取信息快速、方便、完整?,F(xiàn)該系統(tǒng)包括各州的犯罪歷史記錄檔案、機(jī)動車和船只注冊檔案、國家犯罪局檔案、加拿大檔案、聯(lián)邦調(diào)查局檔案等各種檔案。此外,美國的金融犯罪執(zhí)法網(wǎng)絡(luò)(FinCEN)與聯(lián)邦、各個地方執(zhí)法機(jī)構(gòu)達(dá)成信息共享協(xié)議,以付費(fèi)和簽訂協(xié)議形式,進(jìn)行信息間的溝通與交換;通過該網(wǎng)絡(luò),可以獲得包括商業(yè)、企業(yè)、個人等涉及的各種經(jīng)濟(jì)活動、社會生活中所有有價值的信息資料,包括住址、出生年月、特征、家庭成員、鄰居名字、健康狀況以及財(cái)務(wù)情況,個人或家庭使用水電煤、電子通訊等記錄資料,以及外國企業(yè)單位的資料。⑤寧波市公安局在此項(xiàng)工作上也有突破,2014年上半年與民航旅客數(shù)據(jù)的管理單位協(xié)商,以購買數(shù)據(jù)服務(wù)的形式獲取本地機(jī)場旅客實(shí)時數(shù)據(jù),提升了旅客數(shù)據(jù)的完整性和時效性。三是立足全警開展非標(biāo)信息采集。有一部分社會信息,既無法由社會組織機(jī)構(gòu)向公安機(jī)關(guān)直接匯集,也沒有專門社會組織機(jī)構(gòu)掌握這一部分信息并與公安機(jī)關(guān)建立信息交流共享機(jī)制,因此,只能由公安機(jī)關(guān)組織民警直接搜集。通過動員轄區(qū)派出所民警、信息員、社區(qū)聯(lián)絡(luò)員等力量,從各方面、多角度收集社會數(shù)據(jù)資源,并加以整合。2012年起,寧波市公安局每年編制社會數(shù)據(jù)任務(wù)書,指導(dǎo)基層整合各類數(shù)據(jù),每年獲取零散數(shù)據(jù)2000 余萬條。在此,要避免一個誤區(qū),即片面強(qiáng)調(diào)社會數(shù)據(jù)的數(shù)量,因?yàn)楫?dāng)社會數(shù)據(jù)資源總體量達(dá)到一定級別后,縣級部門很難有大量更新的數(shù)據(jù)。所以,在下發(fā)每年社會數(shù)據(jù)采集的任務(wù)時,應(yīng)該參考各地的人口因素、警力因素、社會治安復(fù)雜程度因素、經(jīng)濟(jì)發(fā)展因素等。
(二)創(chuàng)新社會數(shù)據(jù)資源質(zhì)量管理模式。一是實(shí)行情報(bào)部門對社會數(shù)據(jù)的統(tǒng)一歸口管理。將社會數(shù)據(jù)資源職能統(tǒng)一劃歸情報(bào)部門,以情報(bào)部門牽頭,其他職能部門配合,派出所為根基,共同做好社會數(shù)據(jù)資源的整合工作。二是完善數(shù)據(jù)品質(zhì)標(biāo)準(zhǔn)管理。要規(guī)范社會數(shù)據(jù)采集標(biāo)準(zhǔn),在采集數(shù)據(jù)項(xiàng)標(biāo)準(zhǔn)、采集周期上進(jìn)行規(guī)范。要依托社會各部門力量,推進(jìn)實(shí)名制信息管理,規(guī)范社會數(shù)據(jù)實(shí)名制采集的行為,推動政府和相關(guān)部門共同落實(shí)社會活動實(shí)名登記制度。要注重?cái)?shù)據(jù)品質(zhì)問題,將整合的社會數(shù)據(jù)資源,在入庫前進(jìn)行“清洗”,特別對粗放型、偽質(zhì)性、表面性的信息數(shù)據(jù)進(jìn)行精加工。三是尋找數(shù)據(jù)之間的相關(guān)關(guān)系?!拔覀儽仨氷P(guān)注,當(dāng)數(shù)據(jù)點(diǎn)以數(shù)量級方式增長的時候,我們會觀察到許多似是而非的相關(guān)關(guān)系”。相關(guān)關(guān)系最早由達(dá)爾文的表弟高爾頓爵士于1888年提出,在大數(shù)據(jù)時代來臨前很久,相關(guān)關(guān)系就已經(jīng)被證明大有用途。大數(shù)據(jù)背景下產(chǎn)生的相關(guān)關(guān)系分析法則更準(zhǔn)確、更快。目前,公安機(jī)關(guān)處理的大多是結(jié)構(gòu)化的數(shù)據(jù)。據(jù)Gartner的分析報(bào)告,隨著數(shù)據(jù)量的增長,將有95%的非結(jié)構(gòu)化數(shù)據(jù),公安機(jī)關(guān)需要尋找它們之間的相關(guān)關(guān)系并予以利用。四是建立數(shù)據(jù)采集獎懲機(jī)制。建立信息質(zhì)量終身負(fù)責(zé)制度,實(shí)行采集、應(yīng)用民警雙獎制,在獎勵應(yīng)用民警的同時,對采集民警加大獎勵力度,鼓勵基層民警采集社會數(shù)據(jù)的積極性,對采集數(shù)據(jù)中弄虛作假的,也制定相應(yīng)懲罰措施。
(三)推動社會數(shù)據(jù)資源應(yīng)用共享模式。加強(qiáng)公安機(jī)關(guān)社會數(shù)據(jù)的綜合利用,應(yīng)打破“條”“塊”分割局面,建立社會數(shù)據(jù)資源整合、共享機(jī)制,實(shí)現(xiàn)情報(bào)價值的增值。因此,一是要匯集整理深層次業(yè)務(wù)需求。目前公安機(jī)關(guān)對社會數(shù)據(jù)的應(yīng)用僅限于簡單查詢,基層民警平常查詢時應(yīng)用比較多的字段是身份證號碼、姓名、電話號碼、戶籍、車牌等信息。隨著數(shù)據(jù)量的爆炸式增長,傳統(tǒng)的應(yīng)用模型已經(jīng)不能滿足情報(bào)業(yè)務(wù)發(fā)展的實(shí)戰(zhàn)需求,公安機(jī)關(guān)不僅應(yīng)重視原始社會數(shù)據(jù)的積累與存儲,還應(yīng)加強(qiáng)對社會數(shù)據(jù)的二次開發(fā),以滿足公安工作延展性、多樣性的情報(bào)需求。要全面規(guī)劃云計(jì)算與大數(shù)據(jù)技術(shù)在數(shù)據(jù)深度應(yīng)用中的新模式,充分借鑒“公安百度”精確或模糊的檢索方式,運(yùn)用HBase 分布式存儲、Solr全文搜索以及Neo4j 關(guān)系挖掘的大數(shù)據(jù)技術(shù),將其與現(xiàn)有公安業(yè)務(wù)有機(jī)融合,構(gòu)建社會數(shù)據(jù)云服務(wù)體系,在數(shù)據(jù)整合、信息安全、背景聯(lián)查、關(guān)系挖掘、信息布控及多維碰撞等方面進(jìn)行整體規(guī)劃。⑥二是做好數(shù)據(jù)平臺統(tǒng)一維護(hù)。全市人口基礎(chǔ)數(shù)據(jù)庫作為社會數(shù)據(jù)交換的一個前端系統(tǒng),要做好管理工作,增加服務(wù)器配置、明確各類型數(shù)據(jù)接入方式。開展社會數(shù)據(jù)管理庫的維護(hù)管理,定期對服務(wù)器的容量、運(yùn)行狀況進(jìn)行檢測,清除存在的隱患和問題,確保系統(tǒng)的穩(wěn)定性。在公安機(jī)關(guān)社會數(shù)據(jù)的開發(fā)利用上,要做到集成多樣,開發(fā)多種信息載體和信息傳遞方式,提供集文字、圖形、數(shù)據(jù)、語音為一體的多媒體信息服務(wù)。三是要加強(qiáng)民警信息應(yīng)用培訓(xùn)。信息應(yīng)用的成效極大依賴于人的素質(zhì),要整合社會數(shù)據(jù)、應(yīng)用社會數(shù)據(jù),關(guān)鍵在于有懂業(yè)務(wù)懂計(jì)算機(jī)的民警。因此,要結(jié)合公安機(jī)關(guān)“四項(xiàng)建設(shè)”內(nèi)容,把基層民警信息應(yīng)用技能包括社會數(shù)據(jù)應(yīng)用技能培訓(xùn)作為日常培訓(xùn)的一項(xiàng)基礎(chǔ)課程和必訓(xùn)內(nèi)容,使全體民警能夠熟練掌握各類數(shù)據(jù)應(yīng)用,做到學(xué)透、學(xué)精、學(xué)活,形成社會數(shù)據(jù)應(yīng)用培訓(xùn)的常態(tài)機(jī)制。要在基層民警中宣傳利用社會數(shù)據(jù)破案的案例,進(jìn)一步增強(qiáng)應(yīng)用社會數(shù)據(jù)的自覺性和主動性,使民警完成從被動使用到愿意使用再到自覺使用的轉(zhuǎn)變。
(四)轉(zhuǎn)變社會數(shù)據(jù)資源安全管理模式。隨著對社會數(shù)據(jù)獲取、處理分析能力的提高,大量數(shù)據(jù)得以應(yīng)用。這種情況下,數(shù)據(jù)安全從傳統(tǒng)計(jì)算機(jī)網(wǎng)絡(luò)安全等可控安全管理變?yōu)椴豢煽氐陌踩芾?,?shù)據(jù)泄密時有發(fā)生。同時,基層單位對數(shù)據(jù)公開、開放的需求與數(shù)據(jù)安全之間的矛盾更加突出。公安機(jī)關(guān)應(yīng)通過制定相關(guān)制度,嚴(yán)格權(quán)限管理,既要促進(jìn)社會數(shù)據(jù)的交流共享及廣泛應(yīng)用,也要避免社會數(shù)據(jù)安全管理上的漏洞。大量社會數(shù)據(jù)涉及公民的個人隱私,如社交關(guān)系網(wǎng)、活動軌跡、生理特征等個人信息,一些社會數(shù)據(jù)表面上并不涉及個人信息,但經(jīng)分析處理后可以追溯至個人,而且,大數(shù)據(jù)技術(shù)應(yīng)用使數(shù)據(jù)的二次利用非常廣泛,許多創(chuàng)新性的用途事先無法預(yù)知,惡意利用公民隱私的技術(shù)門檻大大降低,一些隱私保護(hù)策略難以奏效。數(shù)據(jù)采集與存儲數(shù)量的劇增、規(guī)模的擴(kuò)大,必將對公民隱私形成挑戰(zhàn),甚至損害公民人身安全。公安機(jī)關(guān)在社會數(shù)據(jù)的開發(fā)利用中,應(yīng)承擔(dān)隱私保護(hù)的責(zé)任,避免侵犯公民的隱私。⑦我們建議,要建立嚴(yán)格的數(shù)據(jù)資源使用管理制度,既激發(fā)數(shù)據(jù)的創(chuàng)新性再利用,又確保個人隱私免受侵害;要加強(qiáng)數(shù)據(jù)使用管理,指定專人負(fù)責(zé),完善數(shù)據(jù)使用審批登記制度。對涉及國家或商業(yè)秘密、個人隱私或其他法律、法規(guī)禁止公開的信息,公安機(jī)關(guān)必須依法規(guī)范使用。同時,要推行新技術(shù)方式來促進(jìn)隱私保護(hù)。例如,引入“差別隱私”概念,即故意將數(shù)據(jù)模糊處理,促使對數(shù)據(jù)的查詢只顯示模糊的結(jié)果。譬如,對某一信息呈現(xiàn)“有登記信息10 條”這樣的結(jié)果,更進(jìn)一步的使用權(quán)限則只開放給更高級別的用戶。
注釋:
①彭知輝:《公安情報(bào)應(yīng)用專題研究》,中國人民公安大學(xué)出版社,2013年版。
②PB 是計(jì)算機(jī)的計(jì)量單位,1PB 相當(dāng)于千萬億字節(jié)。
③涂子沛:《大數(shù)據(jù)》,廣西師范大學(xué)出版社,2012年版。
④轉(zhuǎn)引自詹姆斯·格雷克:《信息簡史》,人民郵電出版社,2013年版。
⑤孔憲明:《中國警官走進(jìn)美利堅(jiān)》,上海人民出版社,2004年版。
⑥富靜:《公安機(jī)關(guān)對社會信息資源的開發(fā)和利用》,《遼寧行政學(xué)院學(xué)報(bào)》2012年第6期。
⑦彭知輝:《大數(shù)據(jù):開啟公安情報(bào)工作新時代》,《公安研究》2014年第 1期。
[1]張小兵.美國聯(lián)邦警察制度研究[M].北京:中國人民公安大學(xué)出版社,2011.
[2]維克托·邁爾.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2013.
[3]楊槐.我國政府信息資源增值利用的機(jī)制創(chuàng)新 [J].重慶科技學(xué)院學(xué)報(bào),2010(16).
[4]張紅勝,呂冪.淺議政府信息資源共享[J].中國科技資源導(dǎo)刊,2009(5).