可搜索加密機制研究與進展
沈志榮,薛巍,舒繼武
摘要:目的:隨著云計算的迅速發(fā)展,用戶開始將數(shù)據(jù)遷移到云端服務(wù)器,以避免繁瑣的本地數(shù)據(jù)管理并獲得更加便捷的服務(wù)。而云存儲中的數(shù)據(jù)安全和用戶隱私得到了越來越多的關(guān)注。將數(shù)據(jù)密文存儲在云端雖然簡單易行,但是如何在密文上進行安全搜索成為了隨之而來的一個難題??伤阉骷用埽╯earchable encryption,簡稱SE)是近年來發(fā)展的一種支持用戶在密文上進行關(guān)鍵字查找的密碼學(xué)原語,它能夠為用戶節(jié)省大量的網(wǎng)絡(luò)和計算開銷,并充分利用云端服務(wù)器龐大的計算資源進行密文上的關(guān)鍵字查找。近年來具有不同特性的可搜索加密機制被不斷提出,本文回顧總結(jié)了當(dāng)前主要的可搜索加密機制,分析了它們所適用的應(yīng)用場景,并對可搜索加密機制未來的發(fā)展進行展望。方法:本文首先總結(jié)了當(dāng)前主流的可搜索加密機制的研究內(nèi)容,即靈活高效的搜索語句設(shè)計、模糊搜索和基于相似度排序的模糊搜索、以及在不同現(xiàn)實場景下的應(yīng)用等。其次,對構(gòu)造可搜索加密機制的算法進行總結(jié)回顧。按照構(gòu)造算法的不同,本文將當(dāng)前的可搜索加密機制分為基于對稱密碼學(xué)算法的可搜索加密機制和基于非對稱密碼學(xué)算法的可搜索加密機制。對不同分類的可搜索加密機制,本文介紹了其構(gòu)建算法方式、構(gòu)造原理、以及各自的優(yōu)缺點等。再次,本文按照搜索效果將當(dāng)前的可搜索加密機制分為支持單詞搜索的可搜索加密機制、支持連接關(guān)鍵字搜索的可搜索加密機制、和支持復(fù)雜邏輯結(jié)構(gòu)的可搜索加密機制。同時分析比較了當(dāng)前主要的可搜索加密機制的存儲開銷、網(wǎng)絡(luò)傳輸開銷和加解密復(fù)雜度。最后,本文分析了可搜索加密機制的應(yīng)用場景,分別為數(shù)據(jù)獨享場景、數(shù)據(jù)共享場景和郵件處理場景等,并對可搜索機密機制進行了總結(jié)和展望。結(jié)果與結(jié)論:SE機制的研究逐漸成熟化,將逐漸成為云計算環(huán)境下用戶對數(shù)據(jù)密文進行操作的有利工具。未來的一段時間,SE機制依然將被視為解決云計算中的安全問題的研究熱點之一。隨著越來越多的數(shù)據(jù)存儲在云端服務(wù)器中,以及用戶對數(shù)據(jù)安全和個人隱私的敏感程度越來越強,如何高效、精確且安全地對存儲在云端服務(wù)器中的密文進行搜索,將是研究者不斷研究的方向。我們認為,未來可搜索加密機制研究將應(yīng)重點解決以下問題:高效率且支持靈活查詢語句的 SE機制是未來重點的研究方向之一。支持模糊搜索(fuzzy search)和支持按相關(guān)性排序的可搜索加密機制依然是未來需要解決的問題。支持關(guān)系運算(>,<,=等)的可搜索加密機制依然是未來需要研究的內(nèi)容。保留語義的 SE機制依然是研究難點。應(yīng)用于實際場景中的SE機制得到業(yè)界更多關(guān)注。
來源出版物:軟件學(xué)報, 2014, 25(4): 880-895
入選年份:2016
社會計算:大數(shù)據(jù)時代的機遇與挑戰(zhàn)
孟小峰,李勇,祝建華
摘要:目的:社會計算作為一種數(shù)據(jù)密集型科學(xué),在收集和分析數(shù)據(jù)的廣度、深度以及規(guī)模上都產(chǎn)生了巨大影響,社會計算作為一種新的計算范式,產(chǎn)生了一個新的跨學(xué)科研究與應(yīng)用領(lǐng)域,其廣闊的研究內(nèi)容與應(yīng)用已引起了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。本文旨在幫助讀者快速了解社會計算產(chǎn)生的歷史背景及概念、研究現(xiàn)狀及大數(shù)據(jù)帶來的機遇,從面向社會科學(xué)和面向技術(shù)應(yīng)用兩個發(fā)展趨勢出發(fā),總結(jié)社會計算研究領(lǐng)域存在的挑戰(zhàn),包括跨學(xué)科合作與訓(xùn)練的問題、科學(xué)研究中大數(shù)據(jù)共享問題以及隱私保護。方法:物聯(lián)網(wǎng)、云計算、社交網(wǎng)絡(luò)、社會媒體以及信息獲取技術(shù)的飛速發(fā)展,數(shù)據(jù)正以前所未有的速度迅速增長和積累,數(shù)據(jù)是人類社會最重要的財富,大數(shù)據(jù)時代的到來,為研究人類社會動態(tài)和模擬社會問題帶來了前所未有的機遇。首先,從自然科學(xué)、社會科學(xué)和人文科學(xué)的角度概括出社會計算產(chǎn)生的歷史背景;然后,給出社會計算的定義;接著,闡述社會計算的主要研究領(lǐng)域(包括社會網(wǎng)絡(luò)分析、計算社會科學(xué)等)、大數(shù)據(jù)時代的社會計算、社會計算研究現(xiàn)狀等;最后,著重對社會計算面臨的挑戰(zhàn)進行了合理的分析。結(jié)果:(1)社會計算是使用系統(tǒng)科學(xué)、人工智能、數(shù)據(jù)挖掘等科學(xué)計算理論作為研究方法,將社會科學(xué)理論與計算理論相結(jié)合,為人類更深入地認識社會、改造社會,解決政治、經(jīng)濟、文化等領(lǐng)域復(fù)雜性社會問題的一種理論和方法論體系。(2)社會計算形成了2種發(fā)展趨勢:一種是面向社會科學(xué)的社會計算;一種是面向技術(shù)應(yīng)用的社會計算,這兩種發(fā)展趨勢同時又相互影響。(3)社會科學(xué)與自然科學(xué)本質(zhì)區(qū)別在于思維方式的不同,社會科學(xué)是總體邏輯思維,自然科學(xué)是類型邏輯思維。(4)從大數(shù)據(jù)中采集到足夠準確、系統(tǒng)而有代表性的社會個體特征,面臨著倫理、法規(guī)和技術(shù)等多個方面的困難,這些難題已經(jīng)構(gòu)成大數(shù)據(jù)時代社會計算的嚴重挑戰(zhàn)。結(jié)論:工業(yè)化時代的學(xué)科分類為推動社會進步做出了巨大貢獻,隨著后工業(yè)化時代的到來,這種學(xué)科劃界越來越成為人們思想上的羈絆。計算機科學(xué)的基礎(chǔ)雖然基于電子學(xué)等自然科學(xué),但集成電路、操作系統(tǒng)等都不是自然界客觀存在的,是人類智慧的產(chǎn)物。社會計算為人類發(fā)現(xiàn)自身價值提供了更多的機會,計算語言學(xué)、計算人類學(xué)、計算廣告學(xué)、城市計算等跨學(xué)科研究領(lǐng)域不斷產(chǎn)生。社會計算的研究還處于起步階段,本文作了一些初步的探索,分析了社會計算產(chǎn)生的歷史背景、學(xué)科分類,給出了確切的定義,對現(xiàn)有的研究工作及方法進行了歸納總結(jié),最后指出了大數(shù)據(jù)時代社會計算面臨的挑戰(zhàn)性問題。
來源出版物:計算機研究與發(fā)展, 2013, 50(12): 2483-2491
入選年份:2016
微博數(shù)據(jù)挖掘研究綜述
丁兆云,賈焰,周斌
摘要:目的:隨著近幾年微博的快速發(fā)展與普及,微博憑借平臺的開放性、終端擴展性、內(nèi)容簡潔性和低門檻等特性,在網(wǎng)民中快速滲透,發(fā)展成為一個重要的社會化媒體,微博成為網(wǎng)民獲取新聞時事、人際交往、自我表達、社會分享以及社會參與的重要媒介,從而使得微博成為社會公共輿論的重要平臺,對國家安全和社會發(fā)展都會產(chǎn)生深遠的影響。對微博的研究也存在巨大的挑戰(zhàn),微博是人類在虛擬網(wǎng)絡(luò)世界生活的抽象概括和延伸,與一般信息網(wǎng)絡(luò)不同,微博本身具有大規(guī)模、噪音數(shù)據(jù)多樣性、快速傳播演化性、非線性、社會媒體性、以及多關(guān)系等特征,因此其在分析方法和挖掘目標上都與傳統(tǒng)信息系統(tǒng)具有很大差別,在技術(shù)上也帶來了更大的挑戰(zhàn)。針對微博新特性,研究了微博近幾年的相關(guān)研究現(xiàn)狀,同時分析了Twitter數(shù)據(jù)集特征,且總結(jié)了未來研究面臨的挑戰(zhàn)。方法:在微博話題事件分析上,研究了事件檢測與跟蹤、首事件與突發(fā)事件檢測、話題摘要、話題模型等國內(nèi)外發(fā)展趨勢;在微博情感分析上,總結(jié)了基本概念,研究了微博情感分析國內(nèi)外發(fā)展趨勢;在微博信息檢索與推薦上,提煉了信息檢索中的概率模型與發(fā)展趨勢,研究了信息推薦中的協(xié)同過濾技術(shù)與發(fā)展趨勢;在微博關(guān)系分析與挖掘上,研究了關(guān)注關(guān)系形成機制、轉(zhuǎn)發(fā)關(guān)系形成機制、關(guān)系預(yù)測的國內(nèi)外發(fā)展趨勢;在微博信息傳播上,研究了傳播機制、傳播預(yù)測、以及傳播案例等國內(nèi)外發(fā)展趨勢;在微博影響力分析上,研究了點度中心度、接近中心度、中間中心度、HITS算法、PageRank算法、擴散能力、以及個體特征與網(wǎng)絡(luò)結(jié)構(gòu)影響力計算等相關(guān)方面的發(fā)展趨勢;另外,研究了微博特征、地理位置、博文價值與可信度、以及用戶分類和垃圾用戶發(fā)現(xiàn)等國內(nèi)外發(fā)展趨勢。結(jié)果:實驗獲取了Twitter的 261954個中文用戶,10091543條博文,和17546289條關(guān)注關(guān)系邊。Twitter用戶粉絲數(shù)目和發(fā)帖數(shù)目皆近似服從冪律分布,表示大部分中文用戶擁有少數(shù)量的粉絲和發(fā)布少量的博文,僅存在少部分中文用戶擁有高數(shù)量的粉絲或者發(fā)布大量的博文;Twitter用戶時區(qū)分布前八為北京、阿拉斯加、香港、臺北、夏威夷、新加坡、美國太平洋時區(qū)、美國東部時區(qū),表明大部分中文用戶來自中國境內(nèi)、香港、和臺灣地區(qū);Twitter剛創(chuàng)建的時候,僅有少部分中文用戶使用 Twitter,在2007年和2008年,Twitter的中文用戶數(shù)量緩慢上升;2009年和2010年兩年內(nèi),Twitter的中文用戶數(shù)量開始急劇上升;在隨后的2011年內(nèi),Twitter中文用戶數(shù)目基本保持穩(wěn)定,略有下降。結(jié)論:主要總結(jié)了微博的話題事件分析、情感分析、信息檢索與推薦、網(wǎng)絡(luò)關(guān)系分析、信息傳播、影響力分析等研究現(xiàn)狀;分析了Twitter中文用戶的發(fā)展特征。
來源出版物:計算機研究與發(fā)展, 2014, 51(4): 691-706
入選年份:2016
基于DTN的空間網(wǎng)絡(luò)互聯(lián)服務(wù)研究綜述
林闖,董揚威,單志廣
摘要:目的:空間任務(wù)的通信需求不斷增長,數(shù)據(jù)鏈路的工作模式也不斷變化。早期針對單一任務(wù)開發(fā)專用通信系統(tǒng),后來發(fā)展到基于可復(fù)用技術(shù)和模塊階段,進一步發(fā)展到基于標準的協(xié)議和技術(shù)、實現(xiàn)跨機構(gòu)協(xié)作的階段。發(fā)展到現(xiàn)在,為實現(xiàn)信息共享、資源共享和提高效率的目標,產(chǎn)生了空間數(shù)據(jù)系統(tǒng)組網(wǎng)的需求。地面網(wǎng)絡(luò)技術(shù)的飛速發(fā)展和成熟應(yīng)用,也為空間網(wǎng)絡(luò)互連提供了發(fā)展思路和技術(shù)支持??臻g網(wǎng)絡(luò)具有子網(wǎng)異構(gòu)、網(wǎng)絡(luò)拓撲不斷變化、鏈路傳輸延遲大、鏈路誤碼率高的特點。TCP/IP網(wǎng)絡(luò)需要連續(xù)穩(wěn)定的網(wǎng)絡(luò)連接和較短的傳輸時延,空間網(wǎng)絡(luò)不能滿足這些條件,因此相關(guān)協(xié)議不能直接應(yīng)用于空間網(wǎng)絡(luò)。需要有一種特定的協(xié)議來實現(xiàn)空間網(wǎng)絡(luò)互連。方法:DTN(delay/disruption tolerant networking)是一種通用的面向消息的覆蓋層網(wǎng)絡(luò)體系結(jié)構(gòu),能夠適應(yīng)空間網(wǎng)絡(luò)的特點,是實現(xiàn)空間網(wǎng)絡(luò)互連的有效連接方式。與傳統(tǒng)方式相比,基于DTN體系結(jié)構(gòu)實現(xiàn)空間網(wǎng)絡(luò)互連具有明顯優(yōu)勢。本文首先闡述了DTN應(yīng)用于空間網(wǎng)絡(luò)互連服務(wù)(space internet working service,SIS)的體系結(jié)構(gòu),分析了組成要素和工作模式,包含協(xié)議棧構(gòu)成、消息轉(zhuǎn)發(fā)機制、命名與尋址機制等,介紹了支撐空間 DTN應(yīng)用的 LTP(licklider transmission protocol)傳輸層協(xié)議,并給出了火星探測場景實例。然后針對路由機制、安全機制和服務(wù)質(zhì)量控制3個重點研究方向,闡述了關(guān)鍵技術(shù)和進展情況,分析了存在的問題和下一步的研究方向。路由問題方面,首先闡述了DTN網(wǎng)絡(luò)的路由問題,而后介紹了CGR(contact graph routing)路由算法及其他確定性路由算法。安全機制方面,首先闡述了 DTN網(wǎng)絡(luò)的安全威脅,而后介紹了束安全協(xié)議框架和基于DTN的SIS安全。QoS機制上,首先明確空間DTN網(wǎng)絡(luò)的QoS需求,而后在隊列管理與調(diào)度,擁塞控制和QoS路由等方面介紹了相關(guān)成果。結(jié)果:文中介紹了DTN協(xié)議的的開發(fā)、實踐,及基于DTN的空間網(wǎng)絡(luò)應(yīng)用,包括NASA開展的基于DTN的空間網(wǎng)絡(luò)互聯(lián)研究,災(zāi)難檢測星座(disaster monitoring constellation,DMC)及ESA資助的“擴展Internet到太空”等相關(guān)研究項目中,都應(yīng)用到了基于 DTN體系結(jié)構(gòu)進行的數(shù)據(jù)傳輸飛行驗證。接下來,本文分別從路由問題,安全問題,QoS機制等方面綜述了在我國開展基于DTN的SIS應(yīng)用的相關(guān)研究成果及研究前景。結(jié)論:基于 DTN的空間網(wǎng)絡(luò)互連的體系結(jié)構(gòu)逐漸成熟,關(guān)鍵技術(shù)不斷完善,具有廣闊的應(yīng)用前景。在我國大力加快航天事業(yè)發(fā)展大背景下,基于DTN實現(xiàn)空間網(wǎng)絡(luò)互連,建成一體化的空間網(wǎng)絡(luò),可以滿足多用戶、多業(yè)務(wù)、動態(tài)、可擴展的數(shù)據(jù)傳輸需求,提高通信系統(tǒng)的開發(fā)和使用效率。我國也在航天領(lǐng)域與其他航天機構(gòu)廣泛開展了合作,這也要求我們開展進一步研究與應(yīng)用。基于DTN的空間網(wǎng)絡(luò)互連技術(shù)對建設(shè)我國天地一體化航天互聯(lián)網(wǎng)具有重要意義。
來源出版物:計算機研究與發(fā)展, 2014, 51(5): 931-943
入選年份:2016
暗原色先驗單幅圖像去霧改進算法
孫小明,孫俊喜,趙立榮,等
摘要:目的:為解決傳統(tǒng)基于暗原色先驗的單幅圖像去霧算法實現(xiàn)效率低以及恢復(fù)霧化圖像在天空、白云等明亮區(qū)域顏色失真的不足。方法:分析傳統(tǒng)算法,存在如下兩個問題。一是傳統(tǒng)暗原色先驗去霧算法估計的透射率偏小,在天空、白云等明亮區(qū)域的霧化圖像的恢復(fù),會出現(xiàn)明顯的顏色失真。實際上,在無霧條件下,自然圖像在天空、白云等明亮區(qū)域處各通道值很大,不存在暗通道,或者說這些區(qū)域暗通道值很高,接近于大氣光強度值。二是傳統(tǒng)基于暗原色先驗的單幅圖像去霧算法時間復(fù)雜度高,無論采用軟摳圖算法,還是引導(dǎo)濾波算法,其透射率計算都是逐像素為中心在空間分辨率為的范圍內(nèi)估計而得,每個像素都要參與比較次,透射率估計算法時間復(fù)雜度為,雖然這種估計透射率的方法有很好的空間自適應(yīng)性,但過于耗時?;谏鲜龇治?,作出如下改進,(1)采用圖像分塊方法估計透射率以降低算法時間復(fù)雜度。和傳統(tǒng)算法每個像素都對應(yīng)一個透射率不同,改進算法將每個圖像塊內(nèi)所有像素都對應(yīng)同一個透射率。實際上,傳統(tǒng)算法對像素透射率要求過于苛刻,我們認為:空間相鄰像素的屬性應(yīng)該近似,霧化圖像透射率的空間不均勻性,并不是每個像素的透射率都不同,而是圖像的局部不同區(qū)域存在不同的透射率,基于此,我們逐塊估計透射率,每個塊有各自的透射率,這也是一種空間自適應(yīng)屬性,而非逐像素估計。本文逐塊求取透射率,每個像素僅參與比較一次,因而算法求取透射率時間復(fù)雜度為。(2)提出明亮區(qū)域和非明亮區(qū)域的分類算法,以提高整幅圖像透射率估計的精準度。借助簡單的、明亮/非明亮區(qū)域判定準則,對明亮/非明亮區(qū)域采用不同的透射率計算公式。和傳統(tǒng)算法在R,G,B 3個通道分別估計透射率不同,本文引進一個參數(shù)K,通過判斷每個塊的暗通道值和大氣光強度A的差值絕對值,來人為改變透射率函數(shù)。若差值絕對值大于K,則代表非明亮區(qū)域;若差值的絕對值小于K,則代表明亮區(qū)域。結(jié)果:改進算法不僅降低傳統(tǒng)算法的時間復(fù)雜度,而且能夠彌補傳統(tǒng)算法在明亮區(qū)域透射率估計的不足,針對大量霧靄籠罩的、存在天空、白云等明亮區(qū)域圖片,都取得了不錯的去霧效果。結(jié)論:實驗結(jié)果表明:改進算法可行、有效,完全滿足實際應(yīng)用的需求。
來源出版物:中國圖象圖形學(xué)報, 2014, 19(3): 381-385
入選年份:2016
基于特征選擇的模糊聚類異常入侵行為檢測
唐成華,劉鵬程,湯申生,等
摘要:目的:網(wǎng)絡(luò)攻擊連接具有行為的多變性和復(fù)雜性等特征。基于傳統(tǒng)聚類的網(wǎng)絡(luò)行為挖掘技術(shù)來構(gòu)建異常入侵檢測模型是十分困難的。本文基于模糊聚類算法的改進,利用網(wǎng)絡(luò)攻擊行為的特征分析方法和特征屬性選擇數(shù)據(jù)集,探索入侵行為的異常檢測模型及其過程。方法:利用層次聚類算法和遺傳算法來改進和優(yōu)化 FCM聚類算法來研究攻擊行為的特征,從而建立異常入侵檢測模型。首先通過Agnes層次聚類算法克服FCM聚類算法對隨機選取初始聚類中心敏感的缺點,再利用遺傳算法的全局搜索能力避免其在迭代時陷入局部最優(yōu),實現(xiàn)聚類的快速收斂,并將它們合構(gòu)成一種AGFCM算法。該算法利用遺傳算法在初始過程中需要產(chǎn)生多個種群個體這一特點,保證產(chǎn)生能夠很好地代表整個原數(shù)據(jù)集的數(shù)據(jù)子集。然后采用信息增益方法對網(wǎng)絡(luò)攻擊連接數(shù)據(jù)集的特征屬性進行排序,同時利用約登指數(shù)來刪減數(shù)據(jù)集的特征屬性以確定特征屬性容量。該方法對數(shù)據(jù)集進行特征屬性選取以去除冗余分類特征屬性保留分類能力強的特征屬性,從而降低數(shù)據(jù)特征容量。最后利用低維特征屬性集和改進的FCM聚類算法,基于AGFCM的分類與檢測,構(gòu)建異常入侵檢測模型,能夠輸出關(guān)于網(wǎng)絡(luò)攻擊連接的相關(guān)信息。結(jié)果:在對網(wǎng)絡(luò)連接行為數(shù)據(jù)集進行聚類,建立異常檢測模型的過程分析中可以看出,(1)對于數(shù)據(jù)集中的DOS、PROBE、U2R和R2L 4種異常連接類,其中由于U2R和R2L這兩類連接行為的特征與正常連接十分相似,導(dǎo)致它們經(jīng)常和一些正常連接類聚在同一類中,隨著聚類個數(shù)增加,這種現(xiàn)象更為顯著,導(dǎo)致在利用聚類結(jié)果對這兩種連接的檢測效果不明顯。(2)隨著聚類個數(shù)的增加,對異常類的檢測能力逐漸增強,但是對正常類檢測的正確率卻在下降,即誤警率在增加。通過計算約登指數(shù)并對比實驗結(jié)果,本文的聚類個數(shù)設(shè)置為2,但此時對于U2R和R2L的檢測率卻很低,可在日常生活中以正常連接為多數(shù),若是增加聚類個數(shù)雖然提高了U2R和R2L的檢測率,卻會導(dǎo)致誤警率的大幅提高。(3)具有較大信息增益的特征屬性有更強的分類能力。通過計算信息增益量得出特征屬性對分類的重要性,選取生成的4組新特征子集,在運行AGFCM算法的時間上對于未篩選特征子集的聚類時間有比較大的優(yōu)越性。(4)在同樣的訓(xùn)練數(shù)據(jù)集和5組測試集的情況下,選擇數(shù)據(jù)集中的特征子集進行基于AGFCM聚類,與FCM和NavieBayes相比,在異常入侵檢測應(yīng)用中有更高的檢測率和更低的誤警率。結(jié)論:傳統(tǒng)的 FCM 是通過隸屬度矩陣對數(shù)據(jù)集中網(wǎng)絡(luò)連接數(shù)據(jù)進行軟劃分,因此,本文有針對性的將層次聚類引入到FCM聚類算法的初始聚類點的選取中,通過遺傳算法提高了FCM算法對聚類中心的全局搜索的能力,利用信息增益算法實現(xiàn)數(shù)據(jù)集特征屬性的排序,同時結(jié)合不同特征屬性容量下的約登指數(shù)值來刪減冗余分類屬性提高了聚類算法速度。在降低特征集容量的情況下,仍能達到較好的聚類效果,這為解決特征子集的選取及利用 FCM 取得更好的聚類效果等問題提供了一種可行的思路。
來源出版物:計算機研究與發(fā)展, 2015, 52(3): 718-728
入選年份:2016