范吉立 張巖峰 聶鐵錚 于 戈
(東北大學 沈陽110819)
隨著物聯網技術的不斷發(fā)展,物聯網設備和傳感器的數量巨大并繼續(xù)保持穩(wěn)定的增長速度。據國際數據公司(International Data Corporation,IDC)預測,到2025年,物聯網設備將超過410億臺,它們生成的數據將達到80ZB[1]。數量如此龐大的物聯網設備,將面臨終端設備易遭受攻擊、設備接入驗證不可靠、數據交換不安全、管理服務集中配置部署[2]、供應鏈各主體之間缺乏信任[3]等一系列問題。區(qū)塊鏈技術利用公私鑰加密算法、共識協議,實現了一個可信的分布式系統和應用平臺,具有無需信任、數據共享、分布式存儲、容錯性高、通信安全等特性,能夠在多個方面解決物聯網所面臨的挑戰(zhàn)。
2014年以來,區(qū)塊鏈在金融、網絡安全、物聯網、物流等非加密貨幣領域獲得巨大的關注。尤其在物聯網領域,區(qū)塊鏈作為通用的基礎平臺,承載交易和智能合約,通過滿足特定的貨物或環(huán)境條件執(zhí)行相應程序。據IBM分析,區(qū)塊鏈和智能合約可以為物聯網提供建立信任、降低成本和加速交易[4]等優(yōu)秀特性。與智能制造密切相關的工業(yè)物聯網(Industrial Internet of Things,IIoT),在區(qū)塊鏈技術的支持下,能夠彌補其安全性方面的缺陷,解決可擴展性、隱私性和可靠性問題[5],為制造業(yè)提供預測和決策信息。同時,區(qū)塊鏈還能夠降低傳統工業(yè)物聯網架構中的服務器負荷,保證供應鏈可追溯,通過智能合約對設備進行追蹤管理[6]。
物聯網與區(qū)塊鏈的集成示例如圖1所示,物聯網設備與物聯網系統和區(qū)塊鏈互聯,區(qū)塊鏈上包含多個智能合約,負責物聯網設備的管理、設備間數據交互以及提供應用服務等。
圖1 物聯網與區(qū)塊鏈集成示意圖
物聯網系統中,每個物聯網設備都可以對外提供服務,物聯網設備之間還有大量事件交互以及復雜的關系,當這個規(guī)模不斷擴展時,就會帶來前所未有的安全問題[7],主要體現在幾個方面:物聯網缺乏相關的標準協議、隱私安全無法得到有效保護[8]、物聯網設備易遭受攻擊、設備訪問控制不可靠。
以物聯網為基礎的智能制造系統在各個設備制造商之間起到協作作用,在整個制造生命周期中不間斷地收集數據并且由數據驅動[9~10],其中涉及到大規(guī)模的分布式制造商及其設備,因而智能制造系統及參與者之間的信任性成為值得關注的問題。智能制造系統信任的重點在于數據的準確性、完整性和可信性,因為失真的數據將導致基于此的預測和診斷決策出現失誤,從而影響制造過程。制造商與客戶,供應商,分銷商,服務提供商之間無信任的協作也會導致檢查、認證等過程產生高額成本。此外,智能制造系統還要求具備互操作性、信息透明性和分散決策特性[11]。當前制造系統在上述關鍵特性實現上,仍然存在很多問題,如互聯程度低、信息數據不共享、資源大量浪費、設備安全控制較差、必須集中決策等,需要借助先進信息技術作為輔助,提升智能化水平。對于物聯網和智能制造面臨的這些安全挑戰(zhàn),研究人員在試圖通過區(qū)塊鏈和智能合約技術提出相應的解決方案。
區(qū)塊鏈是一種電子記錄形式的賬簿,其中每一個區(qū)塊是賬簿的一頁,從第一頁“鏈接”到最新一頁。這些區(qū)塊一旦被確認就不能修改,每個區(qū)塊包含了當前一段時間內的所有交易信息和區(qū)塊元數據,具有分布式、去信任、開放、不可篡改、匿名、自治等特性[12]。作為交易的記錄載體,區(qū)塊鏈可以用作分布式存儲機制應用于各個領域,存儲在區(qū)塊鏈上的數據信息具有不可篡改、可驗證、可溯源等特性。
區(qū)塊鏈是一個分布式部署的記賬系統,它在網絡上各個節(jié)點之間需要共識來實現數據的一致性。目前主流的共識機制有PoW(Proof of Work)、PoS(Proof of Stake)、DPOS(Delegated Proof of Stake)、POA(Proof-of-Authority)、PBFT(Practical Byzantine Fault Tolerance)等。其中工作量證明PoW是當前應用最普遍的共識機制,在Bitcoin、Ethereum、Litecoin、Dogecoin等區(qū)塊鏈中廣泛應用。
PoW需要計算能力超過全網的節(jié)點計算能力總和的51%才能更快地解決工作量證明的數學難題,從而有機會篡改已經確認的區(qū)塊,更改歷史交易的內容。然而,隨著區(qū)塊鏈網絡的不斷增大,越來越多的節(jié)點不斷加入,增加全網的計算能力,一個單位或組織想集結計算能力并更改已確認的區(qū)塊變得越來越困難,因為區(qū)塊都是通過工作證明鏈接起來的,區(qū)塊后面被確認的區(qū)塊越多,篡改的成本就越大,這種篡改難以持久。PoS和DPoS均根據持有數字貨幣的數量和時間決定區(qū)塊的記賬權,區(qū)別在于DPoS需要先選舉出代理人,類似董事會投票,再由代理人來為區(qū)塊記賬。PBFT是一種狀態(tài)機副本復制算法,每個副本節(jié)點都需要和其他節(jié)點進行P2P的共識同步,具有(N-1)/3的容錯性,其中N為參與節(jié)點總數。
上述共識協議均具有抗攻擊性,公有鏈(Bit-Coin、Ethereum等)的抗攻擊能力最強,需要全網過半的計算力才可能攻擊成功,即使用于小規(guī)模部署的聯盟鏈共識PBFT,也具有接近1/3的容錯能力,這些共識協議保證了區(qū)塊鏈已經確認的區(qū)塊內容不可篡改,從而保護交易數據的安全。
區(qū)塊鏈中獲得記賬權的節(jié)點在創(chuàng)建新區(qū)塊時,在當前數據區(qū)塊頭中加入時間戳信息,標明區(qū)塊數據的寫入時間。主鏈上各個區(qū)塊按照時間順序依次排列。時間戳可以用作區(qū)塊數據的存在性證明[13]。同時,區(qū)塊創(chuàng)建過程中生成的所有交易記錄通過層層哈希計算,形成Merkle樹結構,最終生成Merkle根哈希值,與時間戳一起保存在區(qū)塊頭中,該哈希值生成過程都要經過其他節(jié)點的驗證。這種存儲機制保證了數據的真實和可驗證,無論在什么時間、在什么機器上驗證,都將得到一致的驗證結果。
區(qū)塊鏈本身是從創(chuàng)世區(qū)塊到當前區(qū)塊的一條最長主鏈,不同于傳統集中式數據庫系統記錄的是當前數據狀態(tài),區(qū)塊鏈基于時間戳和哈希值,記錄了區(qū)塊數據的完整歷史,數據可以沿著鏈條逐個追溯,理論上可以追溯到所有歷史源數據、目標數據以及處理過程。但實際上依靠區(qū)塊鏈本身的簡單查詢不易實現溯源,需要通過構建智能合約或外部查詢應用,為數據內容和對應的交易建立索引,才能實現鏈上數據的可信溯源。
鏈上數據具備了上述三種特性,即可保證數據的安全可信。將區(qū)塊鏈應用于物聯網和智能制造,可以把物聯網設備之間的弱信任轉變成對區(qū)塊鏈系統的強信任。區(qū)塊鏈分布式系統的特點也正好契合物聯網設備的分散部署,智能制造多方協作和數據交換的實際需求,因此研究和開發(fā)區(qū)塊鏈與物聯網、智能制造系統的集成將對該領域的發(fā)展具有重要推動作用。
物聯網技術利用現有網絡基礎設施,將各種物理設備與互聯網集成,實現物與物、物與人之間信息交換,隨著物聯網設備的不斷增長,分布范圍越來越廣,設備的安全控制、身份認證、數據交換、安全防御等問題逐漸凸顯,傳統集中式的訪問控制系統已經不能適應物聯網的發(fā)展需求[14]?;趨^(qū)塊鏈技術實現的物聯網成為當前學術研究的重點。2017年3月中國聯通和中興通訊聯合多家研究機構在ITU-T SG20成立全球首個物聯網區(qū)塊鏈標準項目,定義了物聯鏈(Blockchain of Things,BoT)概念,即基于區(qū)塊鏈的分布式物聯網。2019年11月,中國通信標準化協會(CCSA)牽頭多家通信公司和研究機構,發(fā)布了《“物聯網+區(qū)塊鏈”應用與發(fā)展白皮書》,提出一系列物聯網+區(qū)塊鏈技術應用的發(fā)展建議[15]。
區(qū)塊鏈技術應用到物聯網領域,涉及到區(qū)塊鏈系統與大量分散部署的物聯網設備進行連接和通信,因此,需要解決的一個問題是物聯網設備如何與區(qū)塊鏈系統進行集成,關于這個問題,目前研究者們提出多種方案。
4.1.1 設備直接接入區(qū)塊鏈
物聯網設備全部接入區(qū)塊鏈網絡,這種是最直接的集成方式,物聯網設備之間的所有通信都通過區(qū)塊鏈,能夠確保交互記錄不可篡改并且可追溯,IoT應用可以很方便地提供服務。Ana Reyna等[16]分析了這種集成方案存在的挑戰(zhàn),比如在區(qū)塊鏈中記錄所有的交互數據將給帶寬和數據存儲帶來很大壓力,為了向區(qū)塊鏈發(fā)送數據,設備需要具備加密功能,這樣對硬件的計算能力有更高的要求,從而給計算能力較弱的節(jié)能型終端節(jié)點或傳感器等設備接入區(qū)塊鏈系統帶來很大的挑戰(zhàn)。
4.1.2 網關設備連接至區(qū)塊鏈
Shi-Cho Cha等提出物聯網網關設備連接至區(qū)塊鏈方案[17],該設計利用網關設備向區(qū)塊鏈網絡發(fā)送交易數據,在區(qū)塊鏈上創(chuàng)建相應的智能合約記錄IoT設備信息,管理IoT設備和用戶訪問權限,達到對IoT設備信息隱私保護的目的。該方案減少了接入區(qū)塊鏈網絡的物聯網設備數量和數據傳輸的帶寬壓力。
4.1.3 混合互聯
采用云計算、區(qū)塊鏈、物聯網混合的云塊物混合互聯方案[18],是對前兩種方案的改進和擴展。前兩種方案對于有高性能需求的物聯網應用支持較弱,同時也不能滿足大規(guī)模物聯網設備之間交互通信的需求。在混合方案中,需要持久保存的關鍵交互信息記錄在區(qū)塊鏈上,其余的交互信息僅在物聯網設備之間進行,并將數據存儲和處理交給云計算設施。這種方案要求物聯網應用能夠明確區(qū)分并優(yōu)化實時交互事件和需要上鏈的交互事件,對它們進行合理調配。
4.1.4 物聯網區(qū)塊鏈
除了與現有區(qū)塊鏈技術進行集成外,還有一些擴展架構,例如,針對IoT領域而設計的下一代區(qū)塊鏈IoTA[19],IoTA使用基于有向無循環(huán)圖(DAG)的Tangle數據結構,與傳統區(qū)塊鏈中的區(qū)塊不同,Io-TA不需要礦工,當發(fā)送一個IoTA交易時,需要完成對另外兩個未確認交易進行驗證的任務,從而克服區(qū)塊鏈的上鏈成本和可擴展性限制問題。這樣,可基于傳感器等設備建立一個快速、低能耗的區(qū)塊鏈物聯網網絡。
表1詳細對比了四種集成方案的優(yōu)勢和不足之處。其中,云混合互聯方案更通用,符合實際應用場景的需求,既保證了關鍵數據信息能夠存儲到區(qū)塊鏈,實現設備和組織間的數據共享,通過網關和云計算技術使得隱私策略能夠得到執(zhí)行,保護組織內部設備數據,同時也避免了大量數據上鏈帶來的網絡和存儲成本過高問題?;贒AG的物聯網專用區(qū)塊鏈,雖然提高了數據的上鏈速度,增強了實時性,但在網絡中需要協調者的角色,不利于隱私保護,降低了系統的抗攻擊能力。
表1 集成方案對比
區(qū)塊鏈技術在物聯網應用場景的獨特優(yōu)勢,主要體現在解決物聯網體系架構中出現的設備和數據安全問題,以及用戶之間的信任問題。
區(qū)塊鏈的數據可追溯、可驗證等安全特性,在物聯網的應用中能夠從多個角度保護數據,加強系統整體安全性。針對前文所述物聯網缺乏相關的標準協議、隱私安全無法得到有效保護、物聯網設備易遭受攻擊、設備訪問控制不可靠等挑戰(zhàn)性問題,均有相應的解決方案。除此之外,在數據溯源、分散設備管理、運營模式創(chuàng)新方面也具有優(yōu)秀案例。
4.2.1 標準化
針對物聯網數據存儲和查詢標準化問題,有研究者將物聯網基礎設施與區(qū)塊鏈網絡集成,把大量數據存儲在分布式文件系統中(例如IPFS或Swarm)[20],并將文件資源的元數據保存在區(qū)塊鏈,由智能合約管理和跟蹤[21]。從網關取出數據、在后端存儲中保存和查詢數據等操作都由智能合約的JSON-RPC調用來實現,從而實現數據操作的標準化,簡化IoT開發(fā),提高數據安全性。
4.2.2 隱私保護
物聯網數據隱私保護方面,區(qū)塊鏈也可以提供可靠的解決方案。Ozyilmaz等提出的IDMoB系統[22],基于以太坊實現了物聯網數據提供方與數據消費方之間安全可信的傳遞和交互,以構建一個去中心化數據市場。數據提供方將IoT設備注冊到系統中,設備通過HTTP協議將加密的傳感器數據上傳到分布式存儲,元數據推送到區(qū)塊鏈。數據消費方也注冊到系統中,請求消息發(fā)送到智能合約,由智能合約擔任數據管理者和密鑰交換中間人,最終加密的數據和解密密鑰發(fā)送給消費方。整個過程沒有第三方參與,數據交換過程安全、可信、透明,為數據生產者和消費者提供端到端的標準化流程。Chandana Roy等將區(qū)塊鏈技術應用于Safe-aaS基礎服務架構[23],基于IoT節(jié)點和傳感器等設備采集的數據,為注冊用戶提供安全相關的決策服務。引入區(qū)塊鏈技術,能夠保護傳感器節(jié)點采集到的數據以及安全服務提供商(SSP)與用戶之間的交易隱私安全,在為用戶共享決策數據的同時,保護用戶信息和傳感器原始數據的隱私,讓服務數據可追溯,提高服務質量。
4.2.3 設備防護
針對物聯網設備安全防御,周啟惠等提出基于區(qū)塊鏈的防護物聯網設備DDoS攻擊方法[24]。將眾多邊緣計算節(jié)點組成區(qū)塊鏈網絡,把傳統目的端分析DDoS攻擊的方式轉變?yōu)樵炊薉DoS異常攻擊行為分析預警,通過區(qū)塊鏈節(jié)點之間基于密碼學的安全通信,進行預警數據的共享和分析,并借助智能合約,建立一套從DDoS攻擊受害者到異常結果提交者間的獎勵機制。該方法避免了傳統在目的端防御DDoS攻擊中流量清洗引流造成的高額成本和網絡阻塞。
4.2.4 訪問控制
在訪問控制方面,Dorri A[25]、Yuanyu[26]、梅穎[27]等提出了物聯網訪問控制模型,設計思路大致相似,利用區(qū)塊鏈和智能合約保證訪問策略的執(zhí)行,避免人為干預訪問權限。權限可以由資源所有者自主控制,同時起到保護用戶的隱私和設備安全的作用。
4.2.5 數據溯源
曹婷婷[28]等將區(qū)塊鏈應用于物聯網設備數據采集溯源,利用采集設備和IOT網關完成數據的篩選,對異常設備統計并進行警告,將真實和高質量的數據存儲到區(qū)塊鏈,用于數據和產品的溯源。
4.2.6 分散設備管理
Christidis Konstantinos等[29]提出將物聯網設備都部署到區(qū)塊鏈網絡中,利用區(qū)塊鏈上的智能合約存儲設備固件更新的哈希值,來對物聯網設備進行更新和升級,固件二進制文件存儲在分布式文件系統IPFS[30],固件升級由設備自動來檢測和安裝。這種集成方式能夠解決大量物聯網設備的固件安全更新問題,同時,降低了物聯網設備制造商的固件維護成本。
4.2.7 運營模式
除此之外,區(qū)塊鏈還能為物聯網應用創(chuàng)造新的協作模式。初創(chuàng)公司Transactive Grid運營一個新型能源市場項目[31],該能源市場建立在區(qū)塊鏈基礎上,計算節(jié)點將街道旁屋頂太陽能電池板產生的能量記錄進區(qū)塊鏈系統,房主之間能夠根據自己的能源剩余情況自主交易,形成社區(qū)范圍自治的本地微電網,能源交易不必通過Duke Energy等中央能源公司。麻省理工學院的初創(chuàng)公司SolarCoin[32]提供數字貨幣為能源生產方發(fā)放獎勵,與新能源市場項目形成一個生態(tài)系統。該模式可用于工業(yè)物聯網的能源供應和新能源轉型,同時也適用于物聯網設備間提供生產數據服務。
以上解決方案,均以可編程智能合約技術為核心,依靠區(qū)塊鏈技術的分布式部署、事務不可篡改、記錄可追溯、簽名通信等特性,使得塊鏈在物聯網的安全和應用中發(fā)揮巨大的作用,解決目前物聯網存在的安全問題,降低設備管理成本,提高數據共享效率,為物聯網創(chuàng)建可靠的基礎設施環(huán)境。
區(qū)塊鏈技術具有不可篡改性和分布式結構,為非信任環(huán)境運行的系統提供了基礎架構。物聯網應用中,區(qū)塊鏈可以作為數據后端系統,并提供數據分析和數據共享服務,設備制造商不必維護存儲數據的云后端,AI服務提供商也可以方便地利用大量數據進行訓練和測試,避免花費高額費用租賃云服務資源。智能合約作為自動執(zhí)行的腳本部署在區(qū)塊鏈上,形成一套自治系統,可以為數據隱私保護、設備安全防護、身份訪問控制提供解決方案。然而,要讓區(qū)塊鏈技術在復雜龐大的物聯網系統中實際應用,還有很多挑戰(zhàn)需要面對。
對于物聯網應用而言,成百上千個終端節(jié)點在短時間內會產生大量的數據,這些數據需要被存儲并分析。但一般IoT終端設備配置資源有限,如果所有數據都存儲在區(qū)塊鏈上,完全節(jié)點很難滿足存儲需求,隨著系統不斷擴展,新的節(jié)點加入需要花費很長時間同步數據。雖然大容量二進制文件或媒體文件可以存儲在離鏈的分布式文件系統中,但該模式無法滿足大多數物聯網應用場景。
因此,需要研究一套適用于物聯網的可擴展的區(qū)塊鏈存儲解決方案。包括:減少冗余的存儲策略、多類型的區(qū)塊結構、適合區(qū)塊鏈的數據壓縮方法、IPFS文件存儲技術等。
現有的主流區(qū)塊鏈系統仍然存在處理低效率問題,TPS吞吐率有限,難以滿足大規(guī)模生產的需要。
目前主流區(qū)塊鏈解決方案中,交易數據采用非加密方式存儲在區(qū)塊中,通過分析區(qū)塊中交易列表,可解析到對應的傳輸數據。如果數據生產者設備向區(qū)塊鏈中發(fā)送經過加密的數據,對于數據的消費者而言,需要通過共享密鑰的方式,對數據解密運算才能使用,這在實際應用中將對生產者和消費者設備的計算能力有較高的要求因此,需要研究支持大規(guī)模生產的區(qū)塊鏈事務處理解決方案,包括:優(yōu)化的P2P網絡通信技術、高效率的共識機制和調度策略、高并發(fā)的智能合約執(zhí)行策略、高效率的數據一致性維護策略。
現有的主流區(qū)塊鏈系統主要用于商務應用,在制造業(yè)應用中,難以滿足實時處理的需要,因為對于設備產生的數據需要及時記錄和確認,對于設備上的操作數據,需要及時的認證。
公有區(qū)塊鏈網絡創(chuàng)建新區(qū)塊具有時間間隔,存在區(qū)塊傳播延遲,如果數據的消費者想實時跟蹤數據反饋,則必須面臨高延遲的問題,然而大多數智能制造和IoT系統都要求實時或接近實時,需要即時交易確認?;贖yperledger的聯盟鏈雖然縮短了交易確認時間,實現了低延遲交易,但其有一定程度的集中化,并且可擴展規(guī)模受限[33]。專門為工業(yè)物聯網設計的IoTA,雖然提高了區(qū)塊生成時效,但交易確認過度依賴于協調者,協調者停止工作后將停止確認[34],這就導致系統去中心化程度不高,擴展性較差,同時也不支持智能合約,不適于物聯網的復雜和智能化應用。
因此需要研究面向區(qū)塊鏈的實時調度技術,包括:最壞時間分析技術、實時調度策略等。
雖然區(qū)塊鏈具有較高的可靠性和安全性,但在工業(yè)環(huán)境下,對于區(qū)塊鏈的可靠性和智能合約的安全性檢查和驗證,要求更高的標準。另外,如何安全地在多個設備之間共享密鑰,也是物聯網系統設計面臨的一大挑戰(zhàn)[35]。
對于PoW共識算法的區(qū)塊鏈系統,共識算法依賴于物聯網設備的哈希運算能力,由于傳感器等輕量級設備與物聯網網關、云計算服務器等節(jié)點間運算能力差距甚大,產生算力不平衡現象,容易造成高性能的節(jié)點算力超過其他輕量級節(jié)點算力總和,產生51%攻擊。
因此在工業(yè)物聯網應用場景中,需要研究支持工業(yè)標準的區(qū)塊鏈安全加固技術,包括:安全多方計算技術、密文訪問控制技術、程序正確性形式化驗證、安全漏洞檢測技術等。
本文闡述了區(qū)塊鏈技術與物聯網的關系,分析了區(qū)塊鏈技術在物聯網領域應用的解決方案,并提出了區(qū)塊鏈技術應用的局限性。其中,混合互聯方案結合云計算、物聯網、區(qū)塊鏈技術,對直接接入、網關設備接入和物聯網區(qū)塊鏈方案做了優(yōu)化,根據實時性和安全性的不同要求對交互信息進行區(qū)分,同時兼具高性能、高安全性的特點,適合網絡結構復雜的需求。區(qū)塊鏈技術能夠在數據存取標準化、隱私保護、訪問控制、數據溯源等方面解決物聯網存在的問題。但區(qū)塊鏈技術的應用也存在一些不足,存儲數據量大且冗余性高,在實際應用中會存在很多限制;執(zhí)行效率低,TPS吞吐率有限;實時性不高,如一個交易從產生到最終被固化到區(qū)塊鏈有一段時間延遲,缺乏面向區(qū)塊鏈的實時調度技術等,這些需要未來做進一步的研究。