国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

端邊云AI算力爆發(fā),華為AI全場(chǎng)景布局浮現(xiàn)

2019-08-23 11:21
環(huán)球時(shí)報(bào) 2019-08-23
關(guān)鍵詞:達(dá)芬奇算力內(nèi)核

AI與IoT技術(shù)的融合將形成AIoT,也就是萬物智慧互聯(lián)。我們現(xiàn)有的生活方式將被重新定義——人與環(huán)境的交互從物理按鍵進(jìn)化到視覺、語音識(shí)別或虛擬現(xiàn)實(shí);原本單一的硬件產(chǎn)品開始互聯(lián)互通、端側(cè)具備智能;無人駕駛、機(jī)器助手等新物種的出現(xiàn)等。AIoT即將成為工業(yè)機(jī)器人、智能手機(jī)、無人駕駛、智能家居及智慧城市等新興產(chǎn)業(yè)的重要基礎(chǔ)。

伴隨5G技術(shù)商用,AIoT會(huì)加速落地和實(shí)現(xiàn)??深A(yù)見的是,未來巨量的多維數(shù)據(jù)(如語音、圖像、視頻等)集中處理與邊緣式分布計(jì)算的需求,將進(jìn)一步挑戰(zhàn)AI底層支持硬件——芯片的計(jì)算能力。同時(shí),AIoT場(chǎng)景下AI應(yīng)用對(duì)于端邊云互動(dòng)有著強(qiáng)需求。強(qiáng)大的云會(huì)讓邊、端能力更強(qiáng),而強(qiáng)大的端、邊則可提升數(shù)據(jù)處理的實(shí)時(shí)性和有效性,進(jìn)而增強(qiáng)云的能力,二者需要緊密結(jié)合。

另一方面,在應(yīng)用場(chǎng)景中,跨平臺(tái)兼容問題、訓(xùn)練成本、大規(guī)模部署問題層出不窮。想出一個(gè)模型不難,開發(fā)出來也還好,但要把框架里的算法部署到數(shù)量眾多的物聯(lián)網(wǎng)設(shè)備上,問題將是無窮無盡的。本地算力、網(wǎng)絡(luò)連接能力、平臺(tái)間的不兼容,都讓開發(fā)者望而卻步。

業(yè)界首創(chuàng)的全棧全場(chǎng)景AI解決方案

2018年10月,華為副董事長(zhǎng)、輪值董事長(zhǎng)徐直軍在2018華為全聯(lián)接大會(huì),發(fā)布了華為AI戰(zhàn)略及全棧全場(chǎng)景的解決方案。有媒體評(píng)價(jià),華為在AI領(lǐng)域是三年不鳴,一鳴驚人。

其中最受人關(guān)注的是華為一直保持神秘的芯片產(chǎn)品——昇騰系列芯片。從華為公布的信息來看,昇騰(Ascend)芯片層,包含了從AscendNano、Lite、Tiny一直到云側(cè)使用的As?cendMax。可以看出昇騰系列芯片是完整AI堆棧解決方案的基礎(chǔ)層,目標(biāo)是在任何場(chǎng)景下以最低成本提供最佳性能,使不同應(yīng)用可以選擇最優(yōu)的AI算力解決方案。

而是否要采用統(tǒng)一架構(gòu),是十分關(guān)鍵的選擇。統(tǒng)一架構(gòu)的好處是:只需一次算子開發(fā),就可在任何場(chǎng)景下使用;跨場(chǎng)景一致開發(fā)和調(diào)試體驗(yàn);更重要的是,一旦完成某個(gè)芯片的算法開發(fā),就可順利將其遷移到面向其它場(chǎng)景的其它芯片上。

完美的想法如何完美實(shí)現(xiàn)呢?從傳統(tǒng)設(shè)計(jì)思路來看,無非兩種選擇:

一、采用堆疊擴(kuò)展(Scaleout)的方法實(shí)現(xiàn)巨大的計(jì)算可擴(kuò)展性。首先,設(shè)計(jì)針對(duì)最小或較小計(jì)算場(chǎng)景進(jìn)行優(yōu)化的架構(gòu),然后通過堆疊來匹配最大的計(jì)算場(chǎng)景,但這將不可避免地增大芯片面積和功耗,直至難以接受;

二、采用向下縮?。⊿calein)的方法,即首先設(shè)計(jì)針對(duì)最大或較大計(jì)算場(chǎng)景進(jìn)行優(yōu)化的架構(gòu),然后通過精細(xì)分割來匹配最小的計(jì)算場(chǎng)景,但這必將導(dǎo)致任務(wù)調(diào)度和軟件設(shè)計(jì)異常復(fù)雜,并且可能由于電流泄漏而使低功耗目標(biāo)無法達(dá)成;

面對(duì)如上利弊點(diǎn),華為創(chuàng)造性的提出了達(dá)芬奇架構(gòu),通過可擴(kuò)展計(jì)算、可擴(kuò)展內(nèi)存和可擴(kuò)展互連等三大獨(dú)特關(guān)鍵技術(shù),使統(tǒng)一架構(gòu)成為可能。

為實(shí)現(xiàn)高可擴(kuò)展和靈活的計(jì)算能力,華為首先設(shè)計(jì)了一個(gè)可擴(kuò)展的3DCube作為超高速矩陣計(jì)算單元,在其最大配置(16x16x16)下,一個(gè)Cube可在一個(gè)時(shí)鐘周期內(nèi)完成4096個(gè)FP16MACs運(yùn)算。以16x16x16為中心,具有CubeScalein功能和高效的多核堆疊功能,這樣就可以使用一種架構(gòu)來支持所有場(chǎng)景。對(duì)于計(jì)算能力較低的應(yīng)用場(chǎng)景,Cube可以逐步縮小到16x16x1,在一個(gè)周期內(nèi)完成256個(gè)MACs運(yùn)算。這種靈活性與一套指令集結(jié)合,成功提供了計(jì)算能力和功耗的平衡。

為實(shí)現(xiàn)高可擴(kuò)展內(nèi)存,每個(gè)達(dá)芬奇Core都配備專用SRAM,其功能固定,容量可變,適應(yīng)不同的計(jì)算能力場(chǎng)景,提升了計(jì)算過程中數(shù)據(jù)的交換速度。

芯片內(nèi)超高帶寬Mesh網(wǎng)絡(luò)將多個(gè)達(dá)芬奇內(nèi)核連接在一起,保證內(nèi)核之間以及內(nèi)核與其它處理單元之間的極低延遲通信,使得高密度計(jì)算內(nèi)核的性能得到充分利用。

今年4月,基于昇騰310 (Ascendmini)的Atlas人工智能計(jì)算平臺(tái)正式開售,覆蓋了從終端、邊到云數(shù)據(jù)中心推理場(chǎng)景:

Atlas200尺寸僅有信用卡一半大小,是一款高效能的嵌入式AI加速模塊,可以實(shí)現(xiàn)圖像、視頻等多種數(shù)據(jù)分析與推理計(jì)算,可廣泛被集成到智能攝像頭、機(jī)器人、無人機(jī)中。

Atlas300智能加速卡是半高半長(zhǎng)的PCIeAI加速卡,可幫助傳統(tǒng)服務(wù)器實(shí)現(xiàn)AI算力騰飛,不僅可以提供多種數(shù)據(jù)精度及業(yè)界領(lǐng)先的性能,還可以兼顧能效限制,可廣泛應(yīng)用于數(shù)據(jù)中心和智能邊緣。

Atlas 500智能小站是業(yè)界領(lǐng)先的智能邊緣產(chǎn)品,機(jī)頂盒大小,可實(shí)現(xiàn)16路高清視頻處理能力;同時(shí)也是業(yè)界首款應(yīng)用半導(dǎo)體制冷散熱技術(shù)的智能邊緣產(chǎn)品,不用風(fēng)扇散熱,可滿足-40°-70°室外工作環(huán)境。

Atlas800深度學(xué)習(xí)系統(tǒng)是一站式深度學(xué)習(xí)平臺(tái)服務(wù),內(nèi)置大量?jī)?yōu)化的網(wǎng)絡(luò)模型算法,幫助用戶輕松使用深度學(xué)習(xí)技術(shù)提供數(shù)據(jù)標(biāo)注、模型生成、模型訓(xùn)練、模型推理服務(wù)部署的端到端能力,降低使用AI的技術(shù)門檻。

據(jù)悉,華為將在8月23日發(fā)布最新的昇騰芯片,會(huì)不會(huì)是久聞大名的As?cendMax?拭目以待。

猜你喜歡
達(dá)芬奇算力內(nèi)核
杭州“算力小鎮(zhèn)”
智能計(jì)算浪潮迭起
邊緣計(jì)算與算力網(wǎng)絡(luò)專題導(dǎo)讀
人民情懷:柳青為文為人的內(nèi)核(評(píng)論)
初春
計(jì)算萬物 算力之下要有堅(jiān)實(shí)的地基
達(dá)芬奇SP手術(shù)系統(tǒng)
微軟發(fā)布新Edge瀏覽器預(yù)覽版下載換裝Chrome內(nèi)核
“爪形手”致達(dá)芬奇未畫完《蒙娜麗莎》
達(dá)芬奇想飛