中國科學(xué)院深圳先進技術(shù)研究院異構(gòu)智能計算體系與系統(tǒng)研究中心喻之斌研究團隊在時空共享調(diào)度抽象方面取得進展。相應(yīng)成果為“Wang YZ, Li LL, Wu Y, et al.TPShare: a timespace sharing scheduling abstraction for shared cloud via vertical labels [C] // ISCA2019, 2019:499-512(TPShare: 云環(huán)境下基于縱向標簽的時空共享調(diào)度抽象)”。
隨著共享云計算資源異構(gòu)性與任務(wù)異構(gòu)性不斷擴大,松耦合的調(diào)度架構(gòu)設(shè)計模式得到普遍應(yīng)用。但在該架構(gòu)下,不同層次的調(diào)度器之間缺乏信息的溝通和調(diào)度策略的協(xié)調(diào),導(dǎo)致調(diào)度效率低下。該研究提出基于縱向標簽的云操作系統(tǒng)與應(yīng)用框架間的調(diào)度協(xié)調(diào)機制 TPShare,重點解決如何調(diào)高云操作系統(tǒng)吞吐量和資源信息感知度,進而提高調(diào)度質(zhì)量,確保應(yīng)用性能等問題。
針對 Mesos 云操作系統(tǒng),以及 Spark、Flink應(yīng)用框架設(shè)計實現(xiàn)了 TPShare 協(xié)調(diào)調(diào)度原型。其中,通信協(xié)議主要采用基于縱向標簽的時間/空間消息傳遞機制。而主要優(yōu)化方法包括細粒度資源供給方案、負載感知的資源過濾機制和應(yīng)用端全局資源感知的資源擴展技術(shù)。
通過在 8 節(jié)點集群上部署以及與原始 Mesos的對比實驗發(fā)現(xiàn),TPShare 可以有效提高云操作系統(tǒng)調(diào)度的吞吐量,提高調(diào)度質(zhì)量。如在干擾環(huán)境下,平均降低尾部延遲約 2 倍。
研究縱向的調(diào)度協(xié)同理論和方法,不僅能為體系結(jié)構(gòu)設(shè)計和優(yōu)化提供新的指導(dǎo),而且提高了資源效率,保證了用戶體驗和云服務(wù)提供商的經(jīng)濟效益,因而具有重要的理論價值和實際意義。
圖1 基于標簽的跨層次協(xié)調(diào)機制 TPShare
圖2 不同負載下 Streaming repartition 尾部延遲的對比