曹智猛,陳剛
(中國人民公安大學 北京 100038)
自大數(shù)據(jù)偵查的概念誕生以來,眾多學者對其進行了大量的研究。王燃博士在其專著中詳盡地論述了大數(shù)據(jù)偵查的模式、思維和方法;程雷教授在《大數(shù)據(jù)偵查的法律控制》一文中提出應(yīng)在偵查控制和數(shù)據(jù)控制的雙重路徑下對大數(shù)據(jù)偵查進行法律規(guī)制;還有諸多研究者圍繞著大數(shù)據(jù)偵查的實現(xiàn)條件、配套機制以及具體犯罪偵查中的運用展開討論,為后人的學習研究提供了豐碩的材料。但是,大數(shù)據(jù)偵查并非一種偵查方法,而是一個充實、復雜的體系。一個不可忽視的研究是,我們應(yīng)明確其實際發(fā)展現(xiàn)狀、深入分析其發(fā)展制約因素,從更為宏觀的視角為大數(shù)據(jù)偵查的發(fā)展規(guī)劃路徑。
作為大數(shù)據(jù)時代的產(chǎn)物,大數(shù)據(jù)偵查推動了犯罪偵查由警力密集型勞動向數(shù)據(jù)密集型、科技密集型的轉(zhuǎn)變。與傳統(tǒng)偵查和信息化偵查相比,大數(shù)據(jù)偵查呈現(xiàn)以下本質(zhì)特征:
早在2008 年,大數(shù)據(jù)這一概念尚未出現(xiàn)之時,郝宏奎教授便在《論虛擬偵查》一文中提出了虛擬偵查并論證了其與實體偵查相互間的區(qū)別與聯(lián)系。大數(shù)據(jù)時代的到來賦予了虛擬偵查全新的面貌:“萬物皆可數(shù)據(jù)化”成為事實——人的一言一行都能被數(shù)據(jù)定格下來,搭建出一個與現(xiàn)實空間相平行、相對應(yīng)的鏡像虛擬數(shù)據(jù)空間,每個人、每件事都能在數(shù)據(jù)空間找到其映射,從而很多與犯罪行為相關(guān)的線索和信息得以顯現(xiàn)。正是這樣一個數(shù)據(jù)空間,承載著大數(shù)據(jù)偵查實踐活動。
大數(shù)據(jù)偵查首先需要滿足數(shù)據(jù)量夠“大”的條件。偵查中每個環(huán)節(jié)對于海量數(shù)據(jù)的處理是不可能僅靠偵查人員的人工工作完成的,無論是數(shù)據(jù)采集、數(shù)據(jù)清洗還是數(shù)據(jù)分析都需要依托相關(guān)智能化、專業(yè)化的大數(shù)據(jù)技術(shù)。偵查手段的智能化轉(zhuǎn)型,不僅提升了偵查工作的精準度和效率,也變革了傳統(tǒng)偵查中依托人力勞動、人海戰(zhàn)術(shù)的粗放模式,推動了偵查效能的釋放。
相關(guān)性是大數(shù)據(jù)思維特征的精髓所在。通過海量計算,大數(shù)據(jù)偵查能探尋各要素之間的相關(guān)關(guān)系,為偵查提供有價值的線索及新的思維視角。此外,大數(shù)據(jù)的相關(guān)性讓犯罪預測更具提客觀性、科學性,犯罪預測由以往的主觀經(jīng)驗式分析轉(zhuǎn)變?yōu)楝F(xiàn)在的科學數(shù)據(jù)化分析,并出現(xiàn)了越來越多的自動化、智能化大數(shù)據(jù)犯罪預測工具[1]。
任何事物都是逐步發(fā)展起來的,刑事偵查亦經(jīng)歷了傳統(tǒng)偵查、業(yè)務(wù)信息驅(qū)動偵查、數(shù)據(jù)驅(qū)動偵查的歷程,各階段更迭存在交叉之處。學界對于目前處于大數(shù)據(jù)偵查或信息化偵查階段存有不同看法。單從數(shù)據(jù)的特質(zhì)來看,目前在偵查中涉及到的數(shù)據(jù)已初步具備了齊全性、動態(tài)性和異構(gòu)性,且能夠通過對元數(shù)據(jù)的智能化挖掘刻畫出詳盡的犯罪關(guān)系網(wǎng)絡(luò)并在犯罪預測中加以應(yīng)用,這是信息化偵查所不能企及的深度。因此現(xiàn)階段的數(shù)據(jù)驅(qū)動型偵查屬于大數(shù)據(jù)偵查的范疇。筆者認為,我們目前處于大數(shù)據(jù)偵查的初級階段,其階段性特征如下:
數(shù)據(jù)應(yīng)用范式的形成是大數(shù)據(jù)偵查實踐趨于成熟的必要條件。目前尚未形成數(shù)據(jù)應(yīng)用范式的原因主要在于數(shù)據(jù)質(zhì)量阻礙和數(shù)據(jù)應(yīng)用局限兩個方面:
1.數(shù)據(jù)質(zhì)量阻礙。在質(zhì)量方面,內(nèi)外數(shù)據(jù)皆存在瑕疵。首先,內(nèi)部數(shù)據(jù)實時性較差。為了支撐數(shù)據(jù)量,在警務(wù)大數(shù)據(jù)建設(shè)初期將各執(zhí)法勤務(wù)部門在以往工作中收集的數(shù)據(jù)簡單堆疊,更新不及時、鮮活度低下。其次,外部數(shù)據(jù)難以直接利用。輻射到社會生活方方面面的外部數(shù)據(jù)類型繁多、標準不統(tǒng)一、制式不盡相同,甚至有錯誤數(shù)據(jù),偵查機關(guān)在辦案過程中數(shù)據(jù)整合難度高、數(shù)據(jù)治理工作量巨大?;A(chǔ)數(shù)據(jù)存在質(zhì)量瑕疵,必然會影響大數(shù)據(jù)偵查的效率和精準度。
2.數(shù)據(jù)應(yīng)用局限。在應(yīng)用方面,大部分半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)在偵查領(lǐng)域尚未得以應(yīng)用或應(yīng)用不充分。一是半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)其本身的特點決定的。相比于結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)的格式繁多、品質(zhì)參差不齊,且能與半結(jié)構(gòu)化數(shù)據(jù)交叉融合①,分析處理的難度和工作量更大。二是技術(shù)的原因,由于欠缺半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的智能化挖掘分析技術(shù),往往需要通過人工或圖像處理技術(shù)將之轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)再加以使用。隨著信息技術(shù)對生產(chǎn)、生活的滲透,半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的體量及占比會持續(xù)上升,其偵查價值不容小覷,大數(shù)據(jù)偵查的發(fā)展還須充分應(yīng)用半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)。
大數(shù)據(jù)偵查在控制和打擊犯罪中初露鋒芒,但是作為一套體系其結(jié)構(gòu)要素尚未培育成熟,發(fā)展不均衡的現(xiàn)象依然突出,不利于大數(shù)據(jù)偵查整體性效能的發(fā)揮。
1.數(shù)據(jù)基礎(chǔ)失衡。(1)經(jīng)濟差異下的地域性數(shù)據(jù)基礎(chǔ)失衡。社會經(jīng)濟與科技是相互促進的正相關(guān)關(guān)系,依賴科技驅(qū)動的大數(shù)據(jù)偵查往往隨著經(jīng)濟的地域性差異形成發(fā)展不均衡的樣態(tài)。首先是地區(qū)間的不均衡,主要表現(xiàn)為東部強西部弱。東部地區(qū)多省市大數(shù)據(jù)發(fā)展指數(shù)普遍較高[2]。以北京、長江三角地區(qū)和珠江三角地區(qū)為例,這些地區(qū)經(jīng)濟高速發(fā)展、流動人口較多,其偵查機關(guān)在大數(shù)據(jù)偵查領(lǐng)域發(fā)展較快,無論數(shù)據(jù)來源還是技術(shù)支撐均處全國領(lǐng)先地位。其次是城鄉(xiāng)間的不均衡。現(xiàn)階段我國農(nóng)村人口大量外流、視頻監(jiān)控等智能安防設(shè)備覆蓋率較低,在數(shù)據(jù)體量上難以滿足大數(shù)據(jù)偵查的需求。雖然隨著“雪亮工程”的推進該現(xiàn)象正在逐漸改善,但相較于城市仍有較大差距。(2)體制原因下的結(jié)構(gòu)性數(shù)據(jù)基礎(chǔ)失衡。由于我國“統(tǒng)一領(lǐng)導、分級管理、條塊結(jié)合、以塊為主”的公安工作體制,在大數(shù)據(jù)偵查的建設(shè)初期,各省市公安機關(guān)如火如荼各自開展。這種各地分別建設(shè)的發(fā)展模式有利于行業(yè)領(lǐng)先者之間智慧成果的交流與融合,能促進良性競爭;但其不可避免會產(chǎn)生“馬太效應(yīng)”②:領(lǐng)先地區(qū)愈發(fā)精進,落后地區(qū)則與之相去懸殊,導致目前大數(shù)據(jù)偵查在我國各地的發(fā)展良莠不齊,而且會進一步加劇偵查資源的地方保護主義現(xiàn)象。
2.研究基礎(chǔ)薄弱。從研究主題來看,大數(shù)據(jù)偵查的研究主題相對集中為大數(shù)據(jù)偵查的理論、思維、模式以及公民個人隱私權(quán)方面。從研究成果來看,關(guān)于大數(shù)據(jù)偵查如何在某類案件中運用的研究居多——大數(shù)據(jù)偵查更多地體現(xiàn)為“術(shù)”,其體系性研究較為薄弱。從研究群體來看,大數(shù)據(jù)偵查的研究群體呈現(xiàn)較為單一,大多為公安和政法院校的師生,缺少來自以信息技術(shù)為學科背景的學術(shù)組成。“倘若只有偵查學研究背景的學術(shù)群體呼吁并投身于大數(shù)據(jù)偵查研究,那么研究將始終閉塞于單一學科領(lǐng)域而缺乏發(fā)展活力,唯有多學科交叉、科學技術(shù)推進才可能賦予大數(shù)據(jù)偵查研究鮮活的生命力?!保?]從與實踐的關(guān)系來看,當下的研究難有現(xiàn)實性突破和實踐意義,難以被實務(wù)部門轉(zhuǎn)化和運用。換言之,實踐支撐不足也是研究基礎(chǔ)薄弱的惡果。
3.技戰(zhàn)法發(fā)展存在結(jié)構(gòu)性失衡。大數(shù)據(jù)偵查方法包括數(shù)據(jù)搜索、數(shù)據(jù)碰撞、數(shù)據(jù)挖掘、數(shù)據(jù)畫像、以及犯罪網(wǎng)絡(luò)分析等。筆者經(jīng)調(diào)研發(fā)現(xiàn),實務(wù)中運用最廣泛、技術(shù)最成熟的方法是數(shù)據(jù)搜索和數(shù)據(jù)碰撞。在一些大數(shù)據(jù)偵查發(fā)展較滯后的地區(qū),甚至有偵查人員認為“大數(shù)據(jù)偵查即‘數(shù)據(jù)檢索+碰撞比對’”。實際上,業(yè)務(wù)信息主導的偵查模式已經(jīng)誕生了數(shù)據(jù)搜索和數(shù)據(jù)碰撞的技戰(zhàn)法,其與大數(shù)據(jù)偵查中數(shù)據(jù)搜索和數(shù)據(jù)碰撞的主要區(qū)別在于數(shù)據(jù)的體量以及完成工作的自動化程度。隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)挖掘、數(shù)據(jù)畫像以及犯罪網(wǎng)絡(luò)分析等技戰(zhàn)法才得以創(chuàng)制,雖然已取得顯著的研究以及實戰(zhàn)成果,但在偵查實務(wù)中的運用尚未完全成熟。因此數(shù)據(jù)挖掘、數(shù)據(jù)畫像等更高級的大數(shù)據(jù)偵查方法的發(fā)展和應(yīng)用程度明顯低于數(shù)據(jù)搜索以及數(shù)據(jù)碰撞。
大數(shù)據(jù)技術(shù)顯著釋放了偵查效能,極大減少了諸如摸底排隊、調(diào)查訪問等工作量。大數(shù)據(jù)偵查的高級形態(tài)應(yīng)是集數(shù)據(jù)挖掘、人腦智慧和人工智能于一體的智慧偵查。但是現(xiàn)階段大數(shù)據(jù)偵查實踐存在算法支持不足、智能程度較低、運算能力欠缺等制約因素,難以滿足智慧偵查的需求。
1.技術(shù)的限制。近年來,各地公安機關(guān)對人工智能影響與介入執(zhí)法辦案進行了大膽探索。部分走在前列的地區(qū)相繼推出各種智能執(zhí)法辦案系統(tǒng)。如上海市的“206系統(tǒng)”,浙江省“政法機關(guān)一體化辦案系統(tǒng)”,貴州省的“一尺辦案”“數(shù)據(jù)鐵籠”以及“共享平臺”,江蘇省蘇州市的公檢法司“桌子結(jié)構(gòu)”[4]。此類探索多側(cè)重于執(zhí)法辦案以及偵查活動的程序性監(jiān)督,而非應(yīng)用于偵查辦案業(yè)務(wù)。原因在于程序性事務(wù)是例行的、固定的,而偵查活動復雜多變,基于目前算法的弱人工智能③無法對瞬息萬變的犯罪行為精準識別并做出有效反應(yīng)。智慧偵查離不開數(shù)據(jù)挖掘,數(shù)據(jù)挖掘需要算法支持。目前以Apriori算法為代表的的關(guān)聯(lián)挖掘,盡管利用最小支持閾值和最小信任閾值可以幫助或減少挖掘無意義的規(guī)則,但其所獲得的許多關(guān)聯(lián)規(guī)則仍是無價值的[5]。算法是一種邏輯規(guī)則,改進算法意味著在保證輸出結(jié)果精準的前提下尋求更高效、更精妙的問題解決路徑。因此大數(shù)據(jù)偵查領(lǐng)域內(nèi)的算法還需不斷優(yōu)化升級。
2.設(shè)備的制約。運算能力是影響大數(shù)據(jù)偵查效率的關(guān)鍵要素之一,其取決于核心硬件設(shè)備的性能。相較于其他行業(yè),大數(shù)據(jù)偵查雖發(fā)展較晚,但是具有后起優(yōu)勢,其硬件設(shè)備比較先進,數(shù)據(jù)庫性能普遍較高,與大數(shù)據(jù)應(yīng)用兼容良好,能適應(yīng)智慧偵查。例如,我國基于動態(tài)人臉識別技術(shù)和大數(shù)據(jù)分析處理技術(shù)的“天網(wǎng)”系統(tǒng),可實現(xiàn)每秒比對30 億次,1 秒鐘就能將全國人口排查一遍,2秒鐘便能將世界人口排查一遍④。但是大數(shù)據(jù)偵查有相當一部分工作是依托公共交通、銀行等社會部門的數(shù)據(jù)開展的,其數(shù)據(jù)庫建立較早,雖然內(nèi)含海量歷史數(shù)據(jù),但性能滯后、算力沒有多余空間。如將大數(shù)據(jù)偵查的挖掘模型掛入其中運行,輕則結(jié)果輸出緩慢,重則系統(tǒng)崩潰。落后的硬件設(shè)備會嚴重影響大數(shù)據(jù)偵查的效率,更難以適應(yīng)智慧偵查。
概言之,目前處于大數(shù)據(jù)偵查初級階段。在對大數(shù)據(jù)偵查實際發(fā)展現(xiàn)狀充分認識的基礎(chǔ)上,進一步對其研究并分析其面臨的困境才能客觀準確、探索其發(fā)展路徑才能有現(xiàn)實價值。
偵查思維是一種貫穿于偵查全過程的認識活動,其在偵查實踐中起到指導作用。隨著大數(shù)據(jù)偵查日趨火熱,偵查思維受其影響產(chǎn)生變革,但逐漸涌現(xiàn)出了“新的僵化”思潮——唯數(shù)據(jù)論,直接導致了偵查思維與數(shù)據(jù)思維混同、大數(shù)據(jù)偵查與傳統(tǒng)偵查斷層的弊病。
1.數(shù)據(jù)思維與偵查思維定位不清。證明因果關(guān)系素來較為困難。大數(shù)據(jù)則能另辟蹊徑,直接探索事物之間的相關(guān)關(guān)系。自大數(shù)據(jù)走入公眾視野后,很多學者強調(diào)偵查人員應(yīng)該沖破基于因果關(guān)系的傳統(tǒng)偵查思維而注重培養(yǎng)大數(shù)據(jù)相關(guān)性思維并將其應(yīng)用于犯罪預測,個別研究者甚至指出基于因果邏輯的偵查假設(shè)是一種主觀的、片面的、耗時費力的經(jīng)驗主義陳舊思維。這種認識是脫離大數(shù)據(jù)偵查實際現(xiàn)狀的跨越式發(fā)展思維誤區(qū)。誠然,在商業(yè)活動中,相關(guān)性能更快地帶來決策的優(yōu)化以及利潤的增加。但是這種相關(guān)性能否直接植入偵查思維?筆者認為需要三思。偵查思維是建立于因果邏輯基礎(chǔ)上的“強相關(guān)關(guān)系”,在邏輯體系中可以用“推理”或“推導”來表達,如物質(zhì)交換原理、同一認定原理;而數(shù)據(jù)思維更強調(diào)建立在機器計算基礎(chǔ)上的“弱相關(guān)性”,存在“黑箱效應(yīng)”,缺乏縝密的邏輯體系,經(jīng)不起因果關(guān)系的推敲和司法程序的檢驗,至多用“推測”來形容。無論大數(shù)據(jù)偵查模式是回溯型還是預測型⑤,“好的偵查假設(shè)是刑事偵查大數(shù)據(jù)應(yīng)用的邏輯核心”[6]。因此,數(shù)據(jù)思維不能混同于偵查思維。
2.大數(shù)據(jù)偵查脫離傳統(tǒng)刑事偵查。偵查思維“新的僵化”直接導致了大數(shù)據(jù)偵查與傳統(tǒng)偵查出現(xiàn)斷層脫節(jié)現(xiàn)象。自2015年以來,各地公安機關(guān)都積極探索基于數(shù)據(jù)的大合成、大偵查機制,并在技術(shù)方面努力突破,但在實務(wù)中大數(shù)據(jù)偵查與傳統(tǒng)偵查出現(xiàn)了斷層:一是大數(shù)據(jù)偵查的新生力量普遍缺乏傳統(tǒng)偵查實踐的磨礪,刑事偵查的基本功不夠扎實,難以盤活海量的數(shù)據(jù)資源。長此以往大數(shù)據(jù)偵查難免淪為一種機械化的流程,一旦偵查過程中遇到卡殼、難以推進,嚴重影響偵查效率;二是涉毒、涉黑惡、涉槍等案件中,要打擊黑色鏈條、摧毀犯罪網(wǎng)絡(luò)無法離開情報的支撐,而這些職業(yè)化的犯罪嫌疑人反偵查意識很強,必須憑借傳統(tǒng)人力情報才能對案件有更加深入的認識、找到案件突破口。例如廣東省中山市公安局的“緝槍神探”數(shù)據(jù)挖掘模型,通過對自然語言中敏感詞匯的識別及過濾,進行頻度分析,得出有價值的線索[7]。但是這些敏感詞匯往往是暗語和行話,如“禿鷹”“燕尾”“母雞”“狗糧”等混雜在普通對話中,若脫離了傳統(tǒng)人力情報,則難以被有效識別。因此,現(xiàn)階段的大數(shù)據(jù)偵查不能陷入脫離傳統(tǒng)偵查的思維誤區(qū)。
偵查資源的質(zhì)量是指其準確率、可利用率、以及耦合度等屬性。相比于“整合”,統(tǒng)籌偵查資源更是一種從根源上解決偵查資源質(zhì)量問題的途徑。僅憑借當前不同主題數(shù)據(jù)庫“物理相加”的方式,無法形成規(guī)?;?、一體化的數(shù)據(jù)庫集成,也不能從根本上改善資源的質(zhì)量。如果不能將所有的數(shù)據(jù)挖掘、分析等工作平滑地集成到統(tǒng)一數(shù)據(jù)處理中心,現(xiàn)有的各個實戰(zhàn)應(yīng)用系統(tǒng)不能緊密耦合成為一個無縫的統(tǒng)一構(gòu)架[8],大數(shù)據(jù)偵查將受資源質(zhì)量牽制而滯于初級階段,無法進階。
1.內(nèi)部困境。從橫向來看,公安機關(guān)內(nèi)部各自為政的現(xiàn)象不僅存在于地區(qū)間,也發(fā)生在部門間。刑偵、情報、網(wǎng)安、技偵等部門分別建設(shè)各自業(yè)務(wù)主題的大數(shù)據(jù)平臺,相互間資源割裂或互通程度低。各平臺由不同的競標企業(yè)開發(fā),系統(tǒng)接口不一,數(shù)據(jù)規(guī)格不同,導致在平臺整合、數(shù)據(jù)共享上困難重重,存在資源浪費和重復勞動的現(xiàn)象[9]。因此,實務(wù)中基于數(shù)據(jù)資源共享的內(nèi)部偵查協(xié)作往往依靠偵查人員的個人人際關(guān)系,以非正式、非官方的形式進行。雖然部分省地區(qū)已開始探索全警種范圍的數(shù)據(jù)庫以及網(wǎng)上作戰(zhàn)平臺,但在建設(shè)的過程中存在建設(shè)主體與應(yīng)用主體脫節(jié)的現(xiàn)象:科信部門對于具體業(yè)務(wù)所需了解不夠深入,單純地匯總各數(shù)據(jù)源,偵查資源僅實現(xiàn)了簡單疊加,無法起到“1+1>2”的效果;而辦案部門在具體實戰(zhàn)中不知有哪些數(shù)據(jù)能夠應(yīng)用以及如何應(yīng)用。從縱向來看,受制度影響,偵查機關(guān)的數(shù)據(jù)資源權(quán)限大都呈倒金字塔狀,即數(shù)據(jù)權(quán)限與行政級別成正比關(guān)系,基層一線辦案部門的“數(shù)據(jù)獲得感”較差,與實戰(zhàn)需求有明顯沖突。由此可以看出,內(nèi)部困境的成因更多地體現(xiàn)為結(jié)構(gòu)性布局問題,大數(shù)據(jù)偵查的發(fā)展不僅需要技術(shù)上的支持和突破,而且也將對現(xiàn)行偵查工作機制形成較大的沖擊[10]。
2.外部困境。根據(jù)筆者調(diào)研發(fā)現(xiàn),大數(shù)據(jù)偵查中的社會面數(shù)據(jù)存在獲取不暢等情況。在個案偵查中,雖然能以調(diào)取證據(jù)的方式從外部獲取數(shù)據(jù),但辦理手續(xù)繁瑣、等待耗時長的弊病難免延誤戰(zhàn)機;調(diào)取數(shù)據(jù)不充分、社會主體配合積極性不高的問題導致難以深挖相關(guān)線索。由于法律依據(jù)缺位、出于私利考慮等因素,社會部門以及企業(yè)不敢或不愿為偵查機關(guān)開放數(shù)據(jù)。實務(wù)中,偵查機關(guān)以“借取”“購買”或“交換”等方式,拷貝或接口其他行業(yè)數(shù)據(jù),取證行為的合法性經(jīng)不起推敲。由于缺乏高效、合法的社會數(shù)據(jù)獲取途徑,很多觸網(wǎng)類犯罪難以實現(xiàn)真正意義上的大數(shù)據(jù)偵查。同時,地緣差異會導致不同地區(qū)偵查機關(guān)在統(tǒng)籌外部數(shù)據(jù)資源時難度不盡相同,如阿里巴巴集團、騰訊集團能與其當?shù)毓矙C關(guān)建立良好的數(shù)據(jù)共享合作關(guān)系。
警務(wù)服務(wù)外包是目前各地公安機關(guān)大數(shù)據(jù)偵查建設(shè)中的普遍現(xiàn)象。在實務(wù)中,大數(shù)據(jù)偵查活動大多是由偵查人員提出具體需求,再由合作企業(yè)技術(shù)人員開發(fā)大數(shù)據(jù)應(yīng)用或設(shè)計數(shù)據(jù)模型,繼而開展偵查工作。偵查機關(guān)與社會企業(yè)是一個“甲方與乙方”的合作關(guān)系,社會企業(yè)能夠發(fā)揮專業(yè)特長,幫助偵查機關(guān)補足科技短板。但長此以往,地域性的財政差距會導致企業(yè)服務(wù)質(zhì)量和水平的差異,同時其他弊端也日漸顯露。
1.數(shù)據(jù)安全問題。大數(shù)據(jù)偵查過于依賴社會企業(yè),首先帶來的即數(shù)據(jù)安全問題。刑事偵查是一項嚴謹?shù)乃痉ɑ顒?,社會企業(yè)的直接參與已經(jīng)對偵查主體的合法性提出了挑戰(zhàn),且在整個過程中,企業(yè)技術(shù)人員與偵查人員接觸到同樣的敏感信息和數(shù)據(jù),這必然會加劇數(shù)據(jù)泄露的風險,不符合公安工作的保密性要求。若僅僅依靠“職業(yè)道德”或“保密合同”去約束社會企業(yè)及其技術(shù)人員,是不能從根源上解決數(shù)據(jù)安全問題的,也是不負責的。此外,基于偵查體制,我國大數(shù)據(jù)警務(wù)的建設(shè)由各省、市公安機關(guān)獨立開展,與各地合作的企業(yè)良莠不齊。社會企業(yè)作為經(jīng)濟實體,必然要承擔市場環(huán)境中的風險,這些企業(yè)一旦面臨資金困難或者破產(chǎn)停運,不僅會影響偵查機關(guān)的工作開展,數(shù)據(jù)安全更是無從保障。
2.與乙方合作效率低下。術(shù)業(yè)有專攻,社會企業(yè)的技術(shù)人員對刑事偵查一竅不通。為了保障其開發(fā)產(chǎn)品的實用性,偵查人員需先行向技術(shù)人員先提出需求,為使其充分領(lǐng)會意圖還需講解刑事偵查專業(yè)知識、描述偵查的邏輯框架。這一過程必然會消耗大量的時間,不利于偵查效率的提升。為了解決這種問題,以便于偵查人員自行開展大數(shù)據(jù)偵查工作,大部分合作企業(yè)搭建了簡易建模平臺,提前編寫了可供選擇組合的部分應(yīng)用。但該方式非常機械化、工具化,依靠簡單的“托拉拽”拼湊出一個數(shù)據(jù)模型。這種常規(guī)性、模式性的偵查要素提取分析很難應(yīng)付瞬息萬變的偵查工作。因此簡易建模平臺發(fā)揮的實際效用十分有限。大數(shù)據(jù)偵查工作最終依然陷入由偵查人員提需求、技術(shù)人員重新開發(fā)的怪圈。
大數(shù)據(jù)偵查思維既是大數(shù)據(jù)偵查建設(shè)的指引,也是大數(shù)據(jù)偵查的有機組成部分,二者互為因果[10]。因此,在大數(shù)據(jù)偵查初級階段,正確的思維先導能夠避免大數(shù)據(jù)偵查在發(fā)展的過程中走彎路。
1.明確大數(shù)據(jù)相關(guān)性的功能定位。大數(shù)據(jù)的相關(guān)性思維固然重要,但是犯罪偵查和司法證明素來要求嚴密的邏輯體系和充分的因果關(guān)系。嚴苛的司法程序不僅是為了查明事實,更是為了保障公民的合法權(quán)益。在大數(shù)據(jù)偵查的初級階段,無論是法律層面還是技術(shù)層面,僅憑借大數(shù)據(jù)的相關(guān)性無法滿足刑事偵查的邏輯嚴謹性需求。但是偵查思維是開放包容的,基于相關(guān)性的數(shù)據(jù)思維能為其提供新的參考。因此,應(yīng)明確“知其然不知其所以然”這種結(jié)果主義的相關(guān)性在犯罪偵查中的功能定位,為偵查工作開辟新的視角。偵查人員可基于相關(guān)性去尋找因果關(guān)系,但并非所有的相關(guān)關(guān)系都能經(jīng)受因果邏輯的檢驗。如果能找到因果解釋,則可以此為基礎(chǔ)進行傳統(tǒng)的證據(jù)調(diào)查,即保證大數(shù)據(jù)偵查輸出結(jié)果的可解釋性以符合司法證明的邏輯性,將“推測”落地為“推導”;若無法進行因果解釋,偵查人員也能以之為線索,開拓新的偵查途徑,尋找更多的線索和證據(jù)。另外,相關(guān)性可以為犯罪監(jiān)控、犯罪預測提供支持。很多犯罪行為不便直接觀察,可以通過其在平行數(shù)據(jù)空間的相關(guān)變量加以關(guān)注。
2.協(xié)調(diào)大數(shù)據(jù)偵查與傳統(tǒng)偵查的關(guān)系。大數(shù)據(jù)偵查之所以能夠?qū)崿F(xiàn),是因為其載體是由現(xiàn)實空間通過網(wǎng)絡(luò)映射出的平行數(shù)據(jù)空間,這實際上就是偵查學基礎(chǔ)理論——同一認定原理的網(wǎng)絡(luò)化、數(shù)據(jù)化版本。換言之,大數(shù)據(jù)偵查是傳統(tǒng)刑事偵查在現(xiàn)代科技基礎(chǔ)上的分支,其本質(zhì)是刑事偵查,因此大數(shù)據(jù)偵查的發(fā)展離不開傳統(tǒng)偵查的基礎(chǔ)理論支撐。傳統(tǒng)偵查學科凝結(jié)了古今中外刑事司法領(lǐng)域的哲學智慧,也是偵查人員必須具備的基本功。大數(shù)據(jù)偵查尚處初級階段,必須堅持與傳統(tǒng)偵查方式的融合互補,摒棄“模型包打天下”的思想。傳統(tǒng)偵查通過信息錄入的方式實現(xiàn)實體偵查資源向數(shù)據(jù)偵查資源的轉(zhuǎn)化;大數(shù)據(jù)偵查挖掘出的犯罪情報信息“必須與實體形態(tài)的偵查資源相印證,才能作為犯罪證據(jù)使用。”[11]如前文論述,部分案件在利用大數(shù)據(jù)偵查方法挖掘犯罪鏈條、分析犯罪網(wǎng)絡(luò)時離不開人力情報的支持。同理,對于部分非觸網(wǎng)類犯罪,如果傳統(tǒng)偵查模式能夠更快更好地破案,那么大數(shù)據(jù)偵查方法就不一定是最佳選擇。防止因大數(shù)據(jù)偵查的濫用而致使偵查人員過度依賴、思維僵化、喪失基本功,出現(xiàn)“高科技低能力”的狀態(tài)。
5G 技術(shù)日趨成熟,萬物互聯(lián)的時代悄然來臨,全社會即將掀起一場全新的數(shù)據(jù)化革命。偵查機關(guān)若能順應(yīng)時代潮流、把握契機,大數(shù)據(jù)偵查初級階段的許多問題會迎刃而解。例如目前社會部門數(shù)據(jù)庫普遍性能低下而影響大數(shù)據(jù)偵查效率的問題。5G 技術(shù)的普及必然會推動社會各部門數(shù)據(jù)庫硬件設(shè)備的迭代和軟件的升級,其運算能力將有質(zhì)的飛躍,因此大數(shù)據(jù)偵查中建立的數(shù)據(jù)模型在掛入社會各部門數(shù)據(jù)庫后不必再因其算力有限而影響運行速度,從而大大提升偵查效率。因此,5G 時代與大數(shù)據(jù)偵查初級階段碰撞的過程中,偵查機關(guān)必須主動回應(yīng),改革創(chuàng)新偵查機制,才能把握先機,為大數(shù)據(jù)偵查的進一步發(fā)展培育出優(yōu)渥的土壤。
1.積極推進全國統(tǒng)一性的大數(shù)據(jù)偵查云平臺建設(shè)。云計算是一種高效、安全、便捷、低成本的分布式計算、存貯技術(shù)。在5G 技術(shù)的高傳輸速率的加持下云計算如虎添翼,全國性的云端警務(wù)建設(shè)勢在必行。首先應(yīng)促成建設(shè)全國性的公安大數(shù)據(jù)庫,這是突破現(xiàn)階段偵查資源質(zhì)量瓶頸的基本條件。公安內(nèi)部數(shù)據(jù)庫作為大數(shù)據(jù)偵查的第一資源池,其地位舉足輕重。實現(xiàn)數(shù)據(jù)的共享是大數(shù)據(jù)偵查發(fā)展的應(yīng)有之義,其首要環(huán)節(jié)便是消除公安內(nèi)部數(shù)據(jù)壁壘、打通偵查資源的流轉(zhuǎn)通道。因此,偵查機關(guān)應(yīng)統(tǒng)籌規(guī)劃全國性、全警種的數(shù)據(jù)庫的建設(shè),積極促進現(xiàn)有數(shù)據(jù)資源的高質(zhì)量集成,而非各地區(qū)、各部門、各警種分別投入轟轟烈烈的建設(shè)浪潮中。其次,應(yīng)在云端警務(wù)的基礎(chǔ)上開發(fā)大數(shù)據(jù)偵查平臺,囊括數(shù)據(jù)分析挖掘、情報研判等應(yīng)用,所有的大數(shù)據(jù)偵查活動均在此平臺開展。
如圖1所示,此舉措最明顯的優(yōu)勢在于能夠避免大數(shù)據(jù)應(yīng)用的重復開發(fā),節(jié)約大數(shù)據(jù)偵查的經(jīng)濟成本、時間成本和人力成本。此外,整體化建設(shè)有利于數(shù)據(jù)規(guī)范的統(tǒng)一制定以及大數(shù)據(jù)偵查工作制度的完善。一方面能夠從根源上消除部門間數(shù)據(jù)壁壘、填平地域性資源鴻溝,調(diào)和偵查資源質(zhì)、量不統(tǒng)一的矛盾,實現(xiàn)真正意義上的資源大融合;另一方面能夠?qū)刹槿藛T從目前種類繁多的數(shù)據(jù)庫、數(shù)據(jù)挖掘應(yīng)用、網(wǎng)上作戰(zhàn)平臺以及瑣碎的數(shù)據(jù)治理工作中解放出來,釋放偵查機關(guān)戰(zhàn)斗力。
圖1 一體化偵查云平臺建設(shè)模型
2.優(yōu)化基于云端警務(wù)的內(nèi)部偵查協(xié)作機制。大數(shù)據(jù)偵查中的協(xié)作更多地表現(xiàn)為數(shù)據(jù)資源的共享。將穩(wěn)定完善的偵查協(xié)作機制納入統(tǒng)一的云端警務(wù)框架,保障大數(shù)據(jù)偵查協(xié)作行為的合法化、規(guī)范化,讓大數(shù)據(jù)偵查協(xié)作在可操控、可監(jiān)督的程序規(guī)范內(nèi)運行,做到有法可依、責任明晰,打消偵查資源持有主體的顧慮、杜絕建立在偵查人員個人人際關(guān)系基礎(chǔ)上的“關(guān)系協(xié)作”和“人脈偵查”等無監(jiān)督、無管理、無法律依據(jù)的“三無”狀態(tài)。在云端警務(wù)運行偵查內(nèi)部協(xié)作機制,一方面能夠在公安內(nèi)網(wǎng)快速完成協(xié)作手續(xù)的流轉(zhuǎn),有利于節(jié)省事前審批的時間,避免延誤戰(zhàn)機;另一方面能夠?qū)崿F(xiàn)“一次協(xié)作、多個節(jié)點”的業(yè)務(wù)留痕,有利于大數(shù)據(jù)偵查的事后監(jiān)督,保障大數(shù)據(jù)偵查協(xié)作的合法性并杜絕個別部門出于私利而不愿配合的現(xiàn)象。此外,共享理念也能夠在內(nèi)部偵查協(xié)作機制中得以深化和落實:共享經(jīng)濟與偵查協(xié)作具有相同的效用——提高資源的利用率,并使雙方需求得到滿足[12]。即偵查機關(guān)通過偵查信息的交流共享,各取所需,最終在滿足偵查機關(guān)信息數(shù)據(jù)需要的同時提升偵查效率[13]。
3.科學管理數(shù)據(jù)權(quán)限。在大數(shù)據(jù)偵查中,數(shù)據(jù)權(quán)限充當著偵查行為許可證的角色。數(shù)據(jù)權(quán)限的科學管理有利于保障偵查行為的合法性以及數(shù)據(jù)安全??茖W管理數(shù)據(jù)權(quán)限應(yīng)包括以下內(nèi)容:一是數(shù)據(jù)權(quán)限分類管理機制。按照大數(shù)據(jù)偵查體系,數(shù)據(jù)權(quán)限可以分為業(yè)務(wù)資源類和監(jiān)督管理類。業(yè)務(wù)資源類數(shù)據(jù)權(quán)限是指能夠獲取偵查實戰(zhàn)所需資源的數(shù)據(jù)權(quán)限;監(jiān)督管理類權(quán)限是指通過審批、查詢對大數(shù)據(jù)偵查的合法性進行把關(guān)、并為大數(shù)據(jù)偵查實戰(zhàn)提供必需保障的數(shù)據(jù)權(quán)限。這種分類的意義在于通過對數(shù)據(jù)權(quán)限分類管理,科學合理配置數(shù)據(jù)資源的同時能夠完善對大數(shù)據(jù)偵查行為的內(nèi)部監(jiān)督。大數(shù)據(jù)偵查實踐中所謂“數(shù)據(jù)權(quán)限下沉”的呼聲,指的是業(yè)務(wù)資源類數(shù)據(jù)權(quán)限根據(jù)實際業(yè)務(wù)需求分配、向大數(shù)據(jù)偵查一線實戰(zhàn)部門靠攏,并非機械地按照行政級別由上至下呈金字塔狀分布;同理,監(jiān)督管理類數(shù)據(jù)權(quán)限應(yīng)根據(jù)崗位職能和職位職責配置。二是數(shù)據(jù)權(quán)限動態(tài)管理機制。數(shù)據(jù)權(quán)限的管理并非一定不易,而是個動態(tài)的過程。數(shù)據(jù)權(quán)限管理部門應(yīng)與公安人事部門形成聯(lián)動,緊跟偵查人員崗位、職務(wù)的調(diào)整變更數(shù)據(jù)權(quán)限,防止出現(xiàn)“人走權(quán)限在”的數(shù)據(jù)安全隱患和“人來無權(quán)限”的工作阻礙現(xiàn)象;并通過系統(tǒng)定期監(jiān)測,核查數(shù)據(jù)權(quán)限使用情況,以此為依據(jù)對偵查人員的數(shù)據(jù)權(quán)限進行調(diào)整,關(guān)停使用率不高的數(shù)據(jù)權(quán)限。三是高、低密級數(shù)據(jù)融合機制。數(shù)據(jù)的高質(zhì)量融合能夠極大地提升犯罪情報研判質(zhì)量和偵查效率,但同時應(yīng)嚴格遵守相關(guān)法律和公安工作紀律。大數(shù)據(jù)偵查實踐中常需要技偵、網(wǎng)安、國保等部門的數(shù)據(jù)支撐,而這些部門的業(yè)務(wù)數(shù)據(jù)往往涉密,具有嚴格的法律控制和較高的啟動門檻。為充分釋放大數(shù)據(jù)偵查的效能,偵查機關(guān)需在現(xiàn)行法律框架內(nèi)降低數(shù)據(jù)密級和權(quán)限對資源流通的限制。因此,高、低密級數(shù)據(jù)融合機制應(yīng)以數(shù)據(jù)流單項傳輸?shù)姆绞剑蓚刹槿藛T將低密級數(shù)據(jù)以及嫌疑線索推送給涉密部門,涉密部門將低密級數(shù)據(jù)結(jié)合涉密信息二次挖掘、分析研判后的綜合情報產(chǎn)品以及驗證結(jié)果反饋給偵查部門。
圖2 高、低密級數(shù)據(jù)融合機制
如圖2 所示,高、低密級數(shù)據(jù)的融合發(fā)生在高密級數(shù)據(jù)池,整個封閉式數(shù)據(jù)融合的過程中高密級數(shù)據(jù)始終保持靜態(tài),流轉(zhuǎn)的是情報和驗證結(jié)果。對于通過大數(shù)據(jù)偵查獲取的高敏感度信息管理可類比《刑事訴訟法》中對技術(shù)偵查手段的規(guī)定:涉及到國家秘密、商業(yè)秘密、個人隱私的內(nèi)容需要嚴格保密,與案件無關(guān)的必須及時銷毀。該機制的創(chuàng)新具有現(xiàn)實意義,一方面能夠有效實現(xiàn)高、低密級數(shù)據(jù)的融合,提升偵查效能;另一方面保證了高密級數(shù)據(jù)的安全和偵查手段的合法性,能夠有效防止大數(shù)據(jù)偵查手段的濫用。
4.積極溝通完善外部數(shù)據(jù)合作機制。從體量來看,相比于社會數(shù)據(jù),公安內(nèi)部數(shù)據(jù)猶如九牛一毛。我國是一個數(shù)據(jù)大國,擁有極為豐富的數(shù)據(jù)資源,且具有“集中力量辦大事”的制度優(yōu)勢,大數(shù)據(jù)偵查的發(fā)展具備更多的便利條件[14]。隨著5G時代到來,智能穿戴設(shè)備、車聯(lián)網(wǎng)等愈發(fā)普及,數(shù)據(jù)即將面臨新一波的爆發(fā)式增長。憑借目前的個案式、地緣式外部數(shù)據(jù)獲取方式,大數(shù)據(jù)偵查的發(fā)展必然難以為繼。因此偵查機關(guān)應(yīng)主動牽頭,與各社會部門、企事業(yè)單位積極溝通,廣辟數(shù)據(jù)來源、疏通外部數(shù)據(jù)獲取渠道,建立長效外部協(xié)作機制。應(yīng)當注意的是,外部數(shù)據(jù)合作既非一味地將社會部門和企事業(yè)單位的原生數(shù)據(jù)納入公安數(shù)據(jù)庫,也不是單純地給大數(shù)據(jù)偵查平臺留有數(shù)據(jù)庫接口,“物理堆疊”的方式徒增警務(wù)云服務(wù)器的壓力和數(shù)據(jù)治理工作量。而是應(yīng)該在合作機制構(gòu)建初期與社會各部門共同參與制定數(shù)據(jù)規(guī)范,并參考智能前端設(shè)備算法,提高外部衍生數(shù)據(jù)的利用率,避免數(shù)據(jù)挖掘應(yīng)用的重復開發(fā)。例如:利用云計算與邊緣計算相結(jié)合的技術(shù),將算力不強的運算置于邊緣服務(wù)器,在減輕警務(wù)云的數(shù)據(jù)壓力的同時能夠直接利用外部偵查資源的數(shù)據(jù)挖掘產(chǎn)品。
大數(shù)據(jù)偵查行為過度依賴社會力量不是長久之策。社會企業(yè)科技板塊的戰(zhàn)略價值在于協(xié)助公安機關(guān)建設(shè)高質(zhì)量的內(nèi)部大數(shù)據(jù)人才梯隊。精通犯罪偵查業(yè)務(wù)和前沿科技的復合型人才是大數(shù)據(jù)偵查實現(xiàn)從初級階段進化至高級形態(tài)的中流砥柱。公安內(nèi)部人才培養(yǎng)可從以下兩個方面布局:一方面,當務(wù)之急是優(yōu)化偵查人員獨立開展大數(shù)據(jù)偵查活動的水平。偵查機關(guān)應(yīng)選拔出在偵查破案一線磨礪過、具備扎實刑偵基本功的偵查人員,在合作企業(yè)、高校師資力量的協(xié)助下加以培訓,以業(yè)務(wù)需求為目標引導偵查人員開拓、探索大數(shù)據(jù)在犯罪偵查中的應(yīng)用和價值,逐步實現(xiàn)偵查人員獨立完成大數(shù)據(jù)偵查工作、社會企業(yè)僅提供技術(shù)支持和系統(tǒng)維護的定位轉(zhuǎn)變。另一方面,培養(yǎng)公安政法院校在校生是大數(shù)據(jù)偵查發(fā)展的戰(zhàn)略層面布局。公安教育領(lǐng)域應(yīng)盡快加強查偵查學專業(yè)建設(shè),公安院校在偵查學二級學科下開設(shè)大數(shù)據(jù)偵查方向,以推動偵查專業(yè)結(jié)構(gòu)的改革[15],積極搭建警、校、企三方合作平臺,創(chuàng)新校內(nèi)、校外雙導師教學模式,深化學科的交叉融合,為廣大師生研究提供更為豐富的學術(shù)資源,促進大數(shù)據(jù)偵查的進一步發(fā)展。
大數(shù)據(jù)偵查方興未艾,位于刑事偵查的前沿模塊。但其尚處于初級階段,受經(jīng)濟、體制和布局的影響呈現(xiàn)出數(shù)據(jù)應(yīng)用未形成范式、結(jié)構(gòu)要素未培育成熟、科技動力不足的特征,并存在偵查思維僵化、資源統(tǒng)籌困難和外部依賴過高的發(fā)展瓶頸。當前研究者們和實踐部門所做的一切努力都是致力于推動大數(shù)據(jù)偵查早日發(fā)展到高級形態(tài)。但是大數(shù)據(jù)偵查是一個復雜的體系,在初級階段,技術(shù)上的攻克僅僅是基礎(chǔ)環(huán)節(jié),正確引導大數(shù)據(jù)偵查思維、彌合內(nèi)外數(shù)據(jù)鴻溝以及建設(shè)大數(shù)據(jù)偵查人才梯隊才是各偵查機關(guān)都需要面對的問題。
[注釋]:
①例如網(wǎng)絡(luò)社交媒體中較為流行的“表情包”就是一種典型的非結(jié)構(gòu)化與半結(jié)構(gòu)化數(shù)據(jù)交融的形式。
②馬太效應(yīng)(Matthew Effect)是指強者愈強、弱者愈弱的現(xiàn)象,廣泛應(yīng)用于社會心理學、教育、金融以及科學領(lǐng)域。馬太效應(yīng)是社會學家和經(jīng)濟學家們常用的術(shù)語,反映的社會現(xiàn)象是兩極分化嚴重。
③“弱人工智能”是指,在某一方面表現(xiàn)出智能,但是不具有與人類相當?shù)闹橇λ胶退季S模式。弱人工智能其實并不具備思考的能力,而弱人工智能本質(zhì)上也是統(tǒng)計學以及擬合函數(shù)等運算,實際上并不能真正地去推理問題,去解決問題,也沒有自己的世界觀、價值觀。
④詳情參見:中共云南省委政法委員會云南長安網(wǎng)《“天網(wǎng)”已應(yīng)用全國16省市人臉識別技術(shù)助力安防》,http://www.zfw.yn.gov.cn/gczs/201803/t20180323_731416.htm,最后瀏覽時間2020年5月10日。
⑤回溯型偵查模式是指針對已發(fā)生的犯罪行為,可在具體個案偵查中用大數(shù)據(jù)方法尋找相關(guān)線索、證據(jù),也可以對大量的歷史犯罪數(shù)據(jù)進行整體化分析,尋找犯罪活動的內(nèi)在規(guī)律。預測型偵查模式是通過大數(shù)據(jù)預測技術(shù)預測未來犯罪活動的發(fā)生,以及發(fā)現(xiàn)某些正在發(fā)生的隱蔽性犯罪的線索。