趙正彬,石光偉,張舜欽,倪健,瞿瓊燕
(上海船舶研究設(shè)計院,上海 201203)
目前,以計算機(jī)云設(shè)計和三維數(shù)字化技術(shù)作為推動產(chǎn)業(yè)轉(zhuǎn)型和發(fā)展的重要抓手,船舶行業(yè)各大總體院所和總裝廠都在開展數(shù)字化研發(fā)設(shè)計探索,解決船舶詳細(xì)設(shè)計、生產(chǎn)設(shè)計和管理數(shù)據(jù)之間存在的信息孤島現(xiàn)象,共享各階段設(shè)計與管理數(shù)據(jù),為設(shè)計人員提供標(biāo)準(zhǔn)可靠、 靈活開發(fā)的云設(shè)計平臺,提高設(shè)計工作效率和產(chǎn)品質(zhì)量。
規(guī)劃建設(shè)的船舶云設(shè)計平臺基于超融合基礎(chǔ)架構(gòu),依托設(shè)計院智能化數(shù)值水池、多專業(yè)三維協(xié)同設(shè)計平臺、全流程項目管理及信息化建設(shè)多年積累的經(jīng)驗以及大量船舶研發(fā)數(shù)據(jù),貫通研發(fā)、設(shè)計全過程。 以三維一體化協(xié)同設(shè)計為主線,將數(shù)值水池仿真分析與數(shù)字化設(shè)計聯(lián)合應(yīng)用,形成符合船舶研發(fā)設(shè)計需求的優(yōu)化仿真與協(xié)同設(shè)計一體化平臺。
以“一臺服務(wù)器、一種應(yīng)用”為典型工況的傳統(tǒng)架構(gòu)模式,計算機(jī)資源的使用率不到25%[1],造成了極大的資源浪費。 目前, 在KVM、VMWare、Hyper-V、Xenserver、Openstack 等虛擬化技術(shù)的支持下,單臺物理服務(wù)器可以運行若干臺“虛擬”的主機(jī),這些虛擬主機(jī)都擁有獨立的操作系統(tǒng)與應(yīng)用[2],但是這種單主機(jī)虛擬化往往受限于I/O 讀寫與存儲, 而超融合架構(gòu)可以將計算機(jī)的計算、存儲、內(nèi)存和網(wǎng)絡(luò)資源集中到一起,組成一個大的資源池,將硬件資源進(jìn)行充分利用,有利于企業(yè)根據(jù)實際業(yè)務(wù)需求來調(diào)整服務(wù)器的負(fù)載。
超融合基礎(chǔ)架構(gòu)是一個軟件定義的IT 基礎(chǔ)架構(gòu),它由虛擬化計算(hypervisor)虛擬存儲(SDS)和虛擬網(wǎng)絡(luò)組成。 麥肯錫研究顯示:目前服務(wù)器的瓶頸主要在于傳統(tǒng)存儲的硬盤讀取速度,CPU 大部分計算能力都處于等待存儲數(shù)據(jù)傳輸過來的狀態(tài)。 傳統(tǒng)存儲容量和性能不具備和計算能力匹配的可擴(kuò)展性,不能滿足企業(yè)進(jìn)行數(shù)據(jù)訪問的需求。 超融合架構(gòu)是集計算、存儲和網(wǎng)絡(luò)為一體的虛擬化平臺,通過超融合軟件將集群中若干臺服務(wù)器的存儲整合成一個大的存儲池,成倍地提升整個集群的I/O 性能,并將CPU 和網(wǎng)絡(luò)虛擬化[3],在此基礎(chǔ)上提供業(yè)務(wù)系統(tǒng)所需的全部資源。 超融合架構(gòu)相比于傳統(tǒng)虛擬架構(gòu),具有無可比擬的優(yōu)勢,具體對比如表1 所示。
表1 傳統(tǒng)虛擬化架構(gòu)與超融合架構(gòu)對比
由表1 可知,超融合架構(gòu)簡單可靠,可實現(xiàn)物理服務(wù)器間的無縫橫向擴(kuò)展,當(dāng)其中任意一臺主機(jī)出現(xiàn)故障時,其他主機(jī)可以實現(xiàn)無縫對接,超高的整合比讓其具有更高的性價比。 在此基礎(chǔ)上構(gòu)建的云設(shè)計平臺具有高可用、高可靠、高效率和高彈性的特點。
采用2 臺數(shù)據(jù)中心網(wǎng)絡(luò)交換機(jī)作為超融合內(nèi)部數(shù)據(jù)交互通道, 由10G 雙鏈路萬兆光纖網(wǎng)絡(luò)進(jìn)行平臺內(nèi)部存儲數(shù)據(jù)傳輸,保證網(wǎng)絡(luò)的冗余可靠,為整個平臺提供高速穩(wěn)定的網(wǎng)絡(luò)環(huán)境。超融合對外數(shù)據(jù)傳輸同樣采用雙萬兆鏈路網(wǎng)絡(luò)連接至核心交換機(jī)。
云設(shè)計平臺主機(jī)與外部通過虛擬以太交換機(jī)(vSwitch)連接,根據(jù)不同的使用場景進(jìn)行VLAN 劃分,通過VLAN 劃分可以達(dá)到以下效果[4-5]:
1) 不同VLAN 之間的機(jī)器必須通過3 層路由才能實現(xiàn)通信,有助于控制網(wǎng)絡(luò)流量,提高網(wǎng)絡(luò)安全性;
2) 由于廣播域可以被限制在1 個VLAN 內(nèi),能大大提高網(wǎng)絡(luò)傳輸速度與利用率;
3) 根據(jù)部門不同,劃分不同的VLAN,有助于運維管理,一旦網(wǎng)絡(luò)不通,可快速定位到故障點;
4) 可以避免因業(yè)務(wù)需要物理隔離而需增加物理交換機(jī)的情況,可有效減少硬件設(shè)備的投資。
盡管各大總體院所和總裝廠都在數(shù)字化研發(fā)設(shè)計探索的道路上已經(jīng)取得了不少成果,但目前還沒有形成統(tǒng)一的工具平臺,在總體布置、結(jié)構(gòu)設(shè)計、強度分析、振動噪聲分析方面需要重復(fù)建立三維模型,以滿足不同場景的使用需求。 船舶云設(shè)計平臺通過上下游數(shù)據(jù),開展共模技術(shù)研究,打通結(jié)構(gòu)設(shè)計與有限元強度分析以及振動噪聲分析的模型信息傳遞,達(dá)到一體化協(xié)同工作、一次建模多次應(yīng)用的目的。 一體化協(xié)同設(shè)計模式可進(jìn)一步提高工作效率和設(shè)計質(zhì)量。
整個平臺采用負(fù)載均衡架構(gòu)[6],該技術(shù)通過平衡云設(shè)計平臺底層不同服務(wù)器的負(fù)載來達(dá)到性能最佳的目的,即當(dāng)某一臺服務(wù)器過載甚至掉線的情況,將會拿出一部分甚至全部運行的業(yè)務(wù)至另外一臺負(fù)載較小的服務(wù)器,這大大增強了整個系統(tǒng)的健碩性,極大地降低了整個系統(tǒng)癱瘓的可能性。 采用雙服務(wù)器架構(gòu), 保證了整個云設(shè)計平臺高可用性。在云平臺后端布置統(tǒng)一數(shù)據(jù)存儲云盤,云盤隨著用戶賬號進(jìn)行漂移,可同時應(yīng)用于云主機(jī)、云應(yīng)用和高性能計算集群。 同時,通過云平臺內(nèi)數(shù)據(jù)轉(zhuǎn)換模塊實現(xiàn)共模技術(shù)。 具體架構(gòu)如圖1 所示。
圖1 超融合架構(gòu)圖
船舶云設(shè)計平臺除了可以打通設(shè)計與管理數(shù)據(jù)之外,還有以下幾個優(yōu)勢:
1) 提升數(shù)據(jù)安全,提高工作效率,減少運維工作量。 在傳統(tǒng)辦公模式下,企業(yè)數(shù)據(jù)文件比較分散,無法真正確保信息的安全性以及分散數(shù)據(jù)的有效備份。 云設(shè)計平臺改變了傳統(tǒng)數(shù)據(jù)分散存儲的模式, 根據(jù)用戶的角色設(shè)置用戶對應(yīng)的訪問權(quán)限,在不影響設(shè)計人員正常使用的前提下,管理員可通過云管平臺對每一個云設(shè)計主機(jī)進(jìn)行管控。 在保證數(shù)據(jù)安全的前提下,員工在辦公大樓可通過任意PC 或筆記本終端隨時訪問云設(shè)計平臺,實現(xiàn)辦公漫游,提升工作效率。 由于云設(shè)計平臺是統(tǒng)一部署,所以在生產(chǎn)環(huán)境中能解決由于系統(tǒng)或設(shè)備差異而導(dǎo)致的軟件兼容性問題, 有助于減少設(shè)計院辦公電腦的投入和運維人員的維護(hù)成本,增加員工的辦公效率。
2) 資源最大化利用。 根據(jù)文獻(xiàn)[7]中公式可計算出本次建設(shè)的船舶云設(shè)計平臺主機(jī)的數(shù)量約為106 臺;按內(nèi)存承載力,可計算出船舶云設(shè)計平臺主機(jī)的數(shù)量為115 臺。 根據(jù)“木桶短板”原理,本平臺最多可以同時運行106 臺用于三維設(shè)計的虛擬主機(jī),這些虛擬主機(jī)可以在這3 臺測試服務(wù)器間進(jìn)行不停機(jī)漂移。 管理員可以根據(jù)生產(chǎn)、科研的需求不同,從“質(zhì)”和“量”兩個維度實現(xiàn)云設(shè)計平臺資源的精準(zhǔn)分配:一方面,可以針對不同應(yīng)用場景的使用要求,對云平臺主機(jī)進(jìn)行定制化配置,如將CPU 或內(nèi)存成倍擴(kuò)展,增強系統(tǒng)的處理能力;另一方面,從云設(shè)計平臺平行設(shè)計使用人數(shù)角度出發(fā),定制項目所需資源的總體用量。 當(dāng)使用高峰期結(jié)束之后,釋放不需要的資源,降低使用成本。 然而,傳統(tǒng)電腦,用戶只能根據(jù)現(xiàn)有的資源進(jìn)行使用,不能做到配置的靈活變動與調(diào)度。
3) 降低能耗,節(jié)能減排。 由文獻(xiàn)[7-8]可知,臺式機(jī)的平均功耗約為150 W, 云設(shè)計平臺終端約為8.5 W。 通過對服務(wù)器監(jiān)測發(fā)現(xiàn):在工作時間消耗功率為750 W、非工作時間功率為300 W,由于機(jī)房需要空調(diào)不間斷制冷,一般空調(diào)與服務(wù)器功耗按1 比1 配置。以云設(shè)計平臺共106 個用戶計算,平均每人每天工作8 小時,每個月工作22 天,可得出月度不同終端的用電量,如表2 所示,每年可以節(jié)約用電14 570.7 kWh,全年用電量約可減少43.39%。
表2 不同終端功耗與電費對比
為了驗證超融合架構(gòu)與傳統(tǒng)架構(gòu)的性能差別,選取2 臺同樣配置的傳統(tǒng)架構(gòu)服務(wù)器和超融合節(jié)點進(jìn)行壓力測試。 選取8 種工況:256 K 順序讀、256 K順序?qū)憽? K 隨機(jī)70%讀30%寫、8 K 隨機(jī)讀、 8 K隨機(jī)寫、4 K 隨機(jī)70%讀30%寫、4 K 隨機(jī)讀和4 K 隨機(jī)寫。 具體測試結(jié)果如圖2 和圖3 所示。
圖2 超融合和傳統(tǒng)架構(gòu)IOPS 性能對比圖
圖3 超融合和傳統(tǒng)架構(gòu)延遲性能對比圖
從圖2 和圖3 可知: 超融合架構(gòu)IOPS 性能最高為傳統(tǒng)架構(gòu)的50.54 倍,最低為2.85 倍,平均為27.37 倍,即1 個超融合的讀寫性能約相當(dāng)于27 臺傳統(tǒng)架構(gòu)服務(wù)器。 同時延遲方面,超融合也體現(xiàn)出較大的優(yōu)勢,延遲相比于傳統(tǒng)架構(gòu),最大縮短為1/51.72,最低為1/2.91,平均為1/26.23。通過以上數(shù)據(jù)可知,超融合架構(gòu)的性能遠(yuǎn)遠(yuǎn)高于目前傳統(tǒng)架構(gòu)服務(wù)器的性能。
除了壓力測試,為了驗證本次建設(shè)的船舶云設(shè)計平臺能否滿足生產(chǎn)環(huán)境要求,選取對配置要求較高的CADMATIC 軟件進(jìn)行性能測試。測試對象具體配置如表3 所示,為目前常用的臺式機(jī)機(jī)型和云平臺主機(jī),測試結(jié)果見表4。 性能提升計算方式為:在進(jìn)行軟件操作時,云主機(jī)相比于臺式機(jī)減少的響應(yīng)時間與臺式機(jī)的響應(yīng)時間之比。
表3 臺式機(jī)與云平臺主機(jī)配置對比
表4 CADMATIC 軟件測試響應(yīng)時間
測試結(jié)果表明,在生產(chǎn)環(huán)境中進(jìn)行CADMATIC軟件操作,船舶云設(shè)計平臺各方面性能較之傳統(tǒng)臺式機(jī)都得到了不同程度的提升,其中:在進(jìn)行Auto-Numbering(零件自動編號)操作時,性能提升最少;為5.12%,進(jìn)行Code Part(分離零件)操作時,性能提升最多, 為328.13%; 所有操作性能平均提升106.83%。 云平臺較之臺式機(jī)具有較高的讀寫性能和較低的延遲。
綜上, 云設(shè)計平臺較之傳統(tǒng)臺式PC 機(jī)性能有了質(zhì)的飛躍,能夠滿足船舶研發(fā)設(shè)計工作的實際需求。
船舶云設(shè)計平臺以超融合為底層架構(gòu), 可以在不影響正常科研、生產(chǎn)的基礎(chǔ)上,將閑置的計算資源進(jìn)行回收,通過再分配的方式按需交付給用戶,最大化地利用現(xiàn)有資源。 該平臺突破了員工只能在自己工位上工作的局限,且不會因設(shè)備故障而影響工作,同時還能解決原有傳統(tǒng)架構(gòu)運維工作量大等問題,實現(xiàn)“按需分配、統(tǒng)一管理、高效運維”的建設(shè)目標(biāo)。