程遠(yuǎn)航
摘??要:分析了人工智能實(shí)驗(yàn)室的發(fā)展現(xiàn)狀和未來前景,介紹了深度學(xué)習(xí)和虛擬化技術(shù)的原理,給出了建設(shè)面向深度學(xué)習(xí)的人工智能實(shí)驗(yàn)室需要的硬件和軟件平臺(tái)方案,深入分析了硬件資源的搭建和管理以及軟件環(huán)境的部署和開源數(shù)據(jù)集的選擇。最后提供一些實(shí)驗(yàn)測(cè)試和評(píng)估的方案。這些工作將有助于提高實(shí)驗(yàn)室的性能、效率和可靠性,推動(dòng)深度學(xué)習(xí)的研究以及教學(xué)的進(jìn)展。
關(guān)鍵詞:深度學(xué)習(xí)???虛擬化技術(shù)???GPU虛擬化???人工智能??實(shí)驗(yàn)室建設(shè)
中圖分類號(hào):TP393
Research?on?the?Virtual?Open?Platform?of?Artificial?Intelligence?Laboratories?for?Deep?Learning
CHENG?Yuanhang
College?of?Science?and?Technology,?Guizhou?University,?Guiyang,?Guizhou?Province,?550025?China
Abstract:?This?article?analyzes?the?development?status?and?future?prospects?of?artificial?intelligence?laboratories,?introduces?the?principles?of?deep?learning?and?virtualization?technology,?gives?the?program?of?hardware?and?software?platforms?required?to?build?artificial?intelligence?laboratories?for?deep?learning,?deeply?analyzes?the?construction?and?management?of?hardware?resources,?the?deployment?of?the?software?environment?and?the?selection?of?open?source?datasets,?and?finally?provides?some?plans?for?experimental?testing?and?evaluation,?which?will?help?improve?the?performance,?efficiency?and?reliability?of?laboratories,?and?promote?research?on?deep?learning?and?the?progress?of?teaching.
Key?Words:?Deep?learning;?Virtualization?technology;?GPU?virtualization;?Artificial?intelligence;?Laboratory?construction
虛擬化技術(shù)作為一種新型的解決方案,在國(guó)內(nèi)外得到了廣泛研究和應(yīng)用。通過虛擬化技術(shù),可以實(shí)現(xiàn)對(duì)硬件資源的靈活調(diào)度和高效利用,降低實(shí)驗(yàn)室建設(shè)和維護(hù)成本。結(jié)合深度學(xué)習(xí)技術(shù),可以構(gòu)建一個(gè)面向深度學(xué)習(xí)的虛擬化人工智能實(shí)驗(yàn)室開放平臺(tái),提高深度學(xué)習(xí)研究和實(shí)驗(yàn)教學(xué)的效率和效果。本文旨在研究面向深度學(xué)習(xí)的虛擬化人工智能實(shí)驗(yàn)室開放平臺(tái),以滿足高校實(shí)驗(yàn)室的教學(xué)和研究需求。通過綜合分析國(guó)內(nèi)外相關(guān)研究和實(shí)踐經(jīng)驗(yàn),本研究將設(shè)計(jì)和優(yōu)化虛擬化平臺(tái)的架構(gòu)和功能,探索虛擬機(jī)管理、數(shù)據(jù)存儲(chǔ)、安全與權(quán)限控制等關(guān)鍵技術(shù),以實(shí)現(xiàn)高效的資源利用、靈活的實(shí)驗(yàn)環(huán)境和安全的實(shí)驗(yàn)操作,有助于中國(guó)高校人工智能教育和實(shí)驗(yàn)室建設(shè)的發(fā)展,為提高深度學(xué)習(xí)研究和實(shí)驗(yàn)教學(xué)的水平,培養(yǎng)更多創(chuàng)新型人才提供有益的借鑒和參考。
1?深度學(xué)習(xí)與虛擬化技術(shù)
深度學(xué)習(xí)作為人工智能領(lǐng)域的重要分支,以其在圖像識(shí)別、自然語言處理、語音識(shí)別等領(lǐng)域取得的卓越成果而備受矚目。然而,深度學(xué)習(xí)模型的訓(xùn)練和推理過程對(duì)于計(jì)算資源的需求非常高。目前,部分中國(guó)高校尤其是西部高校的實(shí)驗(yàn)室設(shè)備存在老化和落后的情況,無法滿足深度學(xué)習(xí)和人工智能領(lǐng)域的研究需求。盡管一些學(xué)校投入了大量資金購買新設(shè)備,但由于技術(shù)更新?lián)Q代迅速,設(shè)備很快便面臨淘汰的風(fēng)險(xiǎn)。人工智能領(lǐng)域,大語言模型的設(shè)備投入也不是一般普通高校能投入的,因此虛擬化技術(shù)為高校實(shí)驗(yàn)室提供了一種靈活、高效的解決方案,以滿足深度學(xué)習(xí)實(shí)驗(yàn)的需求。通過虛擬化技術(shù),可以實(shí)現(xiàn)對(duì)硬件資源的靈活調(diào)度和高效利用,降低實(shí)驗(yàn)室建設(shè)和維護(hù)成本。同時(shí),虛擬化技術(shù)還可以為學(xué)生提供一種沙盒環(huán)境,使其可以在隔離的環(huán)境中進(jìn)行實(shí)驗(yàn)和學(xué)習(xí),從而提高實(shí)驗(yàn)的安全性和效率。
傳統(tǒng)高校采用的虛擬化方案主要有虛擬桌面基礎(chǔ)架構(gòu)(Virtual?Desktop?Infrastructure,VDI),它完全將計(jì)算資源部署于云端,所有桌面全部運(yùn)行在云服務(wù)器端,本地終端僅承載一個(gè)基礎(chǔ)系統(tǒng)。還有一種智能桌面虛擬化架構(gòu)(ntelligent?Desktop?Virtualization,IDV)?架構(gòu),它采用了“集中管理,本地運(yùn)算”的方式,服務(wù)器僅提供鏡像制作、終端策略管理等功能,當(dāng)制作完鏡像文件之后下發(fā)給終端,由終端通過本地的計(jì)算資源渲染出相應(yīng)的桌面,優(yōu)點(diǎn)在于能夠不受硬件限制能夠虛擬出XP等較老的操作系統(tǒng);缺點(diǎn)在于由于本地運(yùn)行虛擬化層及操作系統(tǒng),資源會(huì)有一定損耗。另外,虛擬操作系統(tǒng)基礎(chǔ)架構(gòu)(Virtual?Operatingsystem?Infrastructure,VOI)架構(gòu)也比較常見,該架構(gòu)由服務(wù)器來管理操作系統(tǒng)鏡像,并下發(fā)給終端,操作系統(tǒng)運(yùn)行于終端本地硬件上。計(jì)算任務(wù)完全由終端承擔(dān),服務(wù)器只負(fù)責(zé)鏡像管理、鏡像上傳下載,以及終端的管理工作。
以新型網(wǎng)絡(luò)基礎(chǔ)設(shè)施、人工智能、大數(shù)據(jù)中心為代表的“新基建”的迅猛發(fā)展將為教育信息化發(fā)展注入強(qiáng)動(dòng)力。高校對(duì)計(jì)算機(jī)實(shí)驗(yàn)室的建設(shè)有了更多的需求,具體需求如下:(1)實(shí)驗(yàn)室的設(shè)計(jì)是否滿足上課、測(cè)試、考試、作業(yè)實(shí)驗(yàn),畢業(yè)設(shè)計(jì)等需求;(2)實(shí)驗(yàn)室的管理是否方便,使用是否便捷,是否可以方便地進(jìn)行遠(yuǎn)程管理和維護(hù);(3)實(shí)驗(yàn)室是否兼容各類教學(xué)應(yīng)用,是否兼容各類教學(xué)系統(tǒng),是否兼容常用的教學(xué)外接設(shè)備,是否對(duì)老舊設(shè)備友好;(4)實(shí)驗(yàn)室的并發(fā)啟動(dòng)、系統(tǒng)創(chuàng)建、軟件更新、故障恢復(fù)等速度是否夠快;(5)實(shí)驗(yàn)室的系統(tǒng)是否穩(wěn)定、云桌面是否穩(wěn)定等。
2?開放平臺(tái)架構(gòu)設(shè)計(jì)方案
面向深度學(xué)習(xí)的實(shí)驗(yàn)室由硬件平臺(tái)和軟件實(shí)驗(yàn)平臺(tái)組成,硬件平臺(tái)如圖1所示,包含了一套高性能的服務(wù)器集群,用于承擔(dān)深度學(xué)習(xí)任務(wù)的計(jì)算需求。服務(wù)器具備強(qiáng)大的計(jì)算能力和高速的數(shù)據(jù)傳輸能力,使用GPU加速卡;配置高速、大容量的存儲(chǔ)系統(tǒng),用于存儲(chǔ)大規(guī)模的數(shù)據(jù)集、模型和實(shí)驗(yàn)結(jié)果;配置核心交換機(jī)確保實(shí)驗(yàn)室內(nèi)部的網(wǎng)絡(luò)連接穩(wěn)定、高速,以便實(shí)現(xiàn)服務(wù)器之間的數(shù)據(jù)交互和遠(yuǎn)程訪問;防火墻提供安全保證。其中,GPU的虛擬化是建設(shè)的重點(diǎn),可根據(jù)實(shí)驗(yàn)室的需求和預(yù)算,選擇適量的GPU數(shù)量和型號(hào),每個(gè)服務(wù)器配備多塊GPU,以提供足夠的GPU計(jì)算資源。服務(wù)器應(yīng)具備強(qiáng)大的計(jì)算能力、高速的數(shù)據(jù)傳輸能力和充足的內(nèi)存容量。選擇支持GPU虛擬化的平臺(tái),如NVIDIA的NVIDIA?Virtual?GPU?(vGPU)、VMware的vSphere?with?vGPU、Citrix的XenServer?with?NVIDIA?vGPU等,使用虛擬化平臺(tái)創(chuàng)建和管理虛擬機(jī)實(shí)例,為每個(gè)虛擬機(jī)分配適當(dāng)?shù)腉PU資源。將物理GPU劃分為多個(gè)虛擬GPU,根據(jù)實(shí)驗(yàn)室需求和用戶規(guī)模進(jìn)行合理分配。可以采用靜態(tài)分配或動(dòng)態(tài)分配的方式,根據(jù)用戶的實(shí)時(shí)需求動(dòng)態(tài)調(diào)整虛擬GPU資源的分配,監(jiān)控和管理虛擬機(jī)使用的GPU資源,確保每個(gè)用戶獲得公平的GPU資源份額,并根據(jù)需要進(jìn)行任務(wù)調(diào)度、性能監(jiān)控和負(fù)載均衡。針對(duì)人工智能課程的要求,可選擇使用高性能VOI云桌面終端或采用顯卡虛擬化技術(shù)的VDI桌面終端。如圖2所示。
軟件環(huán)境平臺(tái)需要從操作系統(tǒng)的虛擬化、深度學(xué)習(xí)框架、GPU驅(qū)動(dòng)和CUDA、數(shù)據(jù)庫和數(shù)據(jù)管理、部署Jupyter?Notebook服務(wù)器、開發(fā)工具和編輯器、容器化支持等方面進(jìn)行部署。部署內(nèi)容如下表1所示。
提供靈活的實(shí)驗(yàn)環(huán)境管理和部署。這樣可以方便地創(chuàng)建、保存和共享實(shí)驗(yàn)環(huán)境,并確保實(shí)驗(yàn)環(huán)境的一致性和可重復(fù)性深度學(xué)習(xí)的實(shí)驗(yàn)很重要的一部分就是數(shù)據(jù)集,可以根據(jù)具體課程,有很多開源數(shù)據(jù)集可以選擇。ImageNet是計(jì)算機(jī)視覺領(lǐng)域最常用的數(shù)據(jù)集之一,包含了數(shù)百萬張標(biāo)記過的圖像,用于圖像分類、定位等任務(wù)。COCO?(Common?Objects?in?Context)是一個(gè)用于圖像識(shí)別、分割和標(biāo)題生成的大規(guī)模數(shù)據(jù)集。它包含了日常生活中的各種場(chǎng)景,并且有豐富的標(biāo)注信息。WikiText是一個(gè)用于自然語言處理任務(wù)的大型文本數(shù)據(jù)集,包含了從維基百科文章中提取的文本。LibriSpeech是一個(gè)用于語音識(shí)別任務(wù)的數(shù)據(jù)集,包含了大量的英文語音錄音和相應(yīng)的文本轉(zhuǎn)錄。KITTI是一個(gè)用于計(jì)算機(jī)視覺任務(wù)的數(shù)據(jù)集,特別是在自動(dòng)駕駛領(lǐng)域,它包含了從車載傳感器(如攝像頭、激光雷達(dá)和GPS)收集的數(shù)據(jù)。GLUE?(General?Language?Understanding?Evaluation)是一個(gè)用于自然語言理解任務(wù)的數(shù)據(jù)集集合,包含了多個(gè)不同類型的自然語言處理任務(wù)。還有一下入門級(jí)的MNIST?和?CIFAR等數(shù)據(jù)集。
3??實(shí)驗(yàn)與評(píng)估方案
對(duì)深度學(xué)習(xí)實(shí)驗(yàn)室進(jìn)行測(cè)試評(píng)估,驗(yàn)證實(shí)驗(yàn)室的功能和性能。主要完成圖像分類、自然語言處理、語音識(shí)別和處理、生成模型實(shí)驗(yàn)、目標(biāo)檢測(cè)和跟蹤、強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)模型優(yōu)化和壓縮、遷移學(xué)習(xí)和領(lǐng)域適應(yīng)、對(duì)抗性攻擊和防御等實(shí)驗(yàn)。
采用以下實(shí)驗(yàn)測(cè)試和評(píng)估方法對(duì)實(shí)驗(yàn)室進(jìn)行評(píng)測(cè)。(1)運(yùn)行標(biāo)準(zhǔn)的深度學(xué)習(xí)基準(zhǔn)測(cè)試套件,來評(píng)估實(shí)驗(yàn)室配置的性能和吞吐量。使用特定的深度學(xué)習(xí)模型和數(shù)據(jù)集進(jìn)行測(cè)試,對(duì)比不同配置下的模型訓(xùn)練和推理性能。(2)使用常見的深度學(xué)習(xí)模型,在實(shí)驗(yàn)室環(huán)境中進(jìn)行模型訓(xùn)練和調(diào)優(yōu)。測(cè)試不同超參數(shù)和優(yōu)化算法對(duì)模型性能的影響,如學(xué)習(xí)率、批量大小、正則化等。(3)使用實(shí)驗(yàn)室配置進(jìn)行深度學(xué)習(xí)模型的推理測(cè)試,評(píng)估推理速度和準(zhǔn)確性。(4)測(cè)試不同模型推理加速技術(shù)的效果。(5)模擬多用戶共享GPU資源的場(chǎng)景,評(píng)估實(shí)驗(yàn)室配置在多用戶環(huán)境下的性能和資源管理能力。(6)測(cè)試不同用戶同時(shí)進(jìn)行深度學(xué)習(xí)任務(wù)時(shí)的資源分配和調(diào)度效果。(7)對(duì)實(shí)驗(yàn)室環(huán)境中常用的數(shù)據(jù)集進(jìn)行處理和預(yù)處理,如數(shù)據(jù)清洗、圖像處理、特征提取等,評(píng)估處理和預(yù)處理過程的效率和準(zhǔn)確性。(8)進(jìn)行長(zhǎng)時(shí)間的實(shí)驗(yàn)或模型訓(xùn)練,評(píng)估實(shí)驗(yàn)室配置的穩(wěn)定性和可靠性,檢查系統(tǒng)日志和錯(cuò)誤日志,排查潛在的問題并進(jìn)行故障排除。
4??結(jié)語
本文分析和設(shè)計(jì)了一個(gè)面向深度學(xué)習(xí)的虛擬化人工智能實(shí)驗(yàn)室開放平臺(tái),并給出了合理的方案。給出了硬件平臺(tái)和軟件平臺(tái)的設(shè)計(jì)方案,通過選擇服務(wù)器集群、虛擬化平臺(tái)、操作系統(tǒng)、安裝和配置深度學(xué)習(xí)框架、提供數(shù)據(jù)庫和數(shù)據(jù)管理、部署Jupyter?Notebook服務(wù)器、提供開發(fā)工具和編輯器、支持虛擬化或容器化技術(shù)、配置版本控制和協(xié)作工具以及考慮GPU虛擬化方案等措施,可以建立一個(gè)高效、靈活、可擴(kuò)展的實(shí)驗(yàn)室技術(shù)棧,滿足深度學(xué)習(xí)研究和開發(fā)的需求。另外,還設(shè)計(jì)了實(shí)驗(yàn)測(cè)試和評(píng)估的方案,如基準(zhǔn)測(cè)試、模型訓(xùn)練與調(diào)優(yōu)等。通過實(shí)施這些方案,研究人員可以有效地搭建實(shí)驗(yàn)室環(huán)境并進(jìn)行深度學(xué)習(xí)的實(shí)驗(yàn)、測(cè)試和評(píng)估。通過本文的分析和設(shè)計(jì),可以建立一個(gè)面向深度學(xué)習(xí)的虛擬化人工智能實(shí)驗(yàn)室開放平臺(tái),為深度學(xué)習(xí)研究和開發(fā)提供全面的技術(shù)支持和解決方案。這將有助于促進(jìn)深度學(xué)習(xí)技術(shù)的發(fā)展和應(yīng)用,推動(dòng)高校人工智能領(lǐng)域教學(xué)的進(jìn)步和發(fā)展。
參考文獻(xiàn)
[1]?LI?G?J.?The?Vibrant?Field?of?Parallel?and?Distributed?Computing—Scan?the?Special?Issue?in?Honor?of?Professor?Kai?Hwang's?80th?Birthday[J].計(jì)算機(jī)科學(xué)技術(shù)學(xué)報(bào)(英文版),2023,38(1):1-2.
[2]彭德巍.人工智能課程實(shí)驗(yàn)案例研究與實(shí)踐[J].大學(xué)教育,2021(2):71-74.
[3]宋慶恒,莫林琳,張葉芳,等.地方本科院校人工智能實(shí)驗(yàn)室建設(shè)及實(shí)踐教學(xué)探索[J].教育教學(xué)論壇,2022(20):128-131.
[4]王雷全,吳春雷,郭曉菲,等.面向人工智能課程群的智能視覺實(shí)驗(yàn)平臺(tái)建設(shè)[J].計(jì)算機(jī)教育,2018(10):48-51.
[5]彭德巍.人工智能課程實(shí)驗(yàn)案例研究與實(shí)踐[J].大學(xué)教育,2021(2):71-74.