華為第一個把AI帶進(jìn)手機，如今想讓算力大爆發(fā)?

2019-09-24 09:29施然

財經(jīng) 2019年20期

施然

華為公司輪值董事長徐直軍表示，華為自2018年10月發(fā)布AI戰(zhàn)略以來，穩(wěn)步而有序地推進(jìn)戰(zhàn)略執(zhí)行、產(chǎn)品研發(fā)及商用進(jìn)程

華為正在逐步向外界釋放代表其能力高點的新技術(shù)。在鴻蒙操作系統(tǒng)之后，華為在8月23日亮出下一顆牙齒——異騰910。

和鴻蒙一樣，異騰（Ascend）是華為山海經(jīng)軍團重要成員之一。不同的是，鴻蒙蓋頭只是輕揭一角，異騰已是華為AI全棧戰(zhàn)略中的重要角色。

去年10月，在華為的全聯(lián)接大會上，華為輪值董事長徐直軍發(fā)布兩款A(yù)I芯片異騰310和910。當(dāng)時，采用7nm工藝制程的異騰910最受外界關(guān)注，原因在于它的計算密度目前最大計算力遠(yuǎn)超全球AI芯片巨頭谷歌和英偉達(dá)。

華為在8月23日發(fā)布了異騰910芯片及配套的MindSpore訓(xùn)練框架，并借此招徠更多開發(fā)者。這意味著，華為打算將AI生態(tài)做大做強。

鴻蒙的關(guān)鍵能力是自主操作系統(tǒng)，異騰之于華為，戰(zhàn)略意義在于算力。在人工智能領(lǐng)域，數(shù)據(jù)是計算對象，算法決定計算上限，算力決定計算效率。全球各大科技巨頭在算法上均有部署，差距不大，算力是巨頭們爭搶的下一個高地，畢竟，要讓更多開發(fā)者和使用者加入自己的生態(tài)，便宜高效的算力是決定性因素。

這是一個算力決定競爭力的時代。當(dāng)人工智能能力逐步成為下一個時代的通用能力時，計算力就是生產(chǎn)力。以手機為例，消費者手中的華為Mafe20手機，今天可以輕松實現(xiàn)人臉識別、物體識別、物體檢測、圖像分割、智能翻譯等AI功能。背后依仗的是手機算力的大幅提升。

芯片性能的快速迭代，是算力快速進(jìn)步的基礎(chǔ)。今天，一部智能手機的計算力，已經(jīng)比美國航空航天局1969年登月計劃中最先進(jìn)計算機還高出幾百萬倍。

手機端的芯片算力幾年間已經(jīng)發(fā)展到如此驚人，用于云端的AI芯片需要處理自動駕駛等復(fù)雜場景的海量數(shù)據(jù)，又需要多強大的算力呢？第三方數(shù)據(jù)分析機構(gòu)OpenAI近期數(shù)據(jù)顯示，2012年以來，人們對算力的需求增長六年超過30萬倍，平均每年增長10倍，遠(yuǎn)超摩爾定律的發(fā)展速度。

從技術(shù)發(fā)展角度來看，這是因為，深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)需要對張量（可以簡化理解為矩陣）進(jìn)行大規(guī)模并行計算，顛覆了傳統(tǒng)的浮點計算，對算力的需求正在出現(xiàn)指數(shù)級的爆炸式增長。例如，原來1個時鐘單元只能進(jìn)行1次浮點計算，現(xiàn)在可以通過新的算子同時對N*N的矩陣計算，如果N=10，那就是同時計算了100次，計算次數(shù)較原來增長了100倍，新算子帶來了對新芯片更強大算力訴求。

算力需求在增加，沒有人可以忽略這個趨勢。

把專用NPU AI芯片放進(jìn)手機

人工智能改變一切，這已是不爭的事實。人工智能三要素（數(shù)據(jù)、算法和算力）中，算力最不起眼，但最考驗硬件能力。中國在數(shù)據(jù)方面具備優(yōu)勢，算法與算力環(huán)節(jié)仍在追趕和發(fā)展過程中，芯片與硬件的發(fā)展水平?jīng)Q定算力能力。

也正因此，算法科學(xué)家、工程師和應(yīng)用廠商面臨著AI算力稀缺和昂貴問題，大大抬高了算法研究和創(chuàng)新門檻，阻礙了人工智能的普及應(yīng)用。

過去三年，中國科技巨頭和AI獨角獸著力提升算法能力，此后，算力的提升開始被視為下一個競爭高點。承載算力的AI芯片在金錢、時間和人力各方面的研發(fā)成本高昂，但各廠商都開始打造各自的芯片體系。

不過，AI芯片設(shè)計復(fù)雜，門檻更高，多數(shù)廠商目前的AI芯片產(chǎn)品多為聚焦于某一應(yīng)用或某一場景的特定芯片，華為的布局有所不同。

智能手機是華為的核心業(yè)務(wù)，華為首先將AI芯片放進(jìn)了手機。

在一部小小的智能手機里，無論是AI基礎(chǔ)功能還是場景化AI服務(wù)，都需要手機完成復(fù)雜深度學(xué)習(xí)算法模型運算，計算密集復(fù)雜，計算需求巨大，挑戰(zhàn)實時性。

智能手機體積小，使用頻率高，運行環(huán)境受限，功耗、內(nèi)存、存儲空間的挑戰(zhàn)也大，強大的算力可以保證更好的運行環(huán)境和使用體驗。

從2017年開始，蘋果、華為在內(nèi)的手機廠商開始發(fā)力攻破這個問題。

2017年9月，華為發(fā)布全球首款移動端AI芯片麒麟970，一個月后發(fā)布了搭載麒麟970的旗艦手機Mate10。麒麟970是全球首款內(nèi)置了獨立神經(jīng)網(wǎng)絡(luò)處理單元（即NPU）的人工智能芯片。

華為第一個將NPU引入手機芯片，此后，蘋果、三星等全球主流智能手機廠商先后推出。短短兩年，AI能力成為主流智能手機的標(biāo)準(zhǔn)配置。

麒麟970芯片可以用更少的能耗更快地完成AI計算任務(wù)。它內(nèi)置的NPU性能大幅優(yōu)于CPU、GPU和DSP這些通用計算單元，同時相比CPU又有約50倍能效和25倍性能優(yōu)勢。

NPU加持的好處是，不少手機功能會從“好看”變得更加“好用”。以智能語音功能為例，此前，語音功能在智能手機上并不鮮見，也算標(biāo)配，但普遍不好用，原因在于，當(dāng)時智能手機本身算力有限，不少計算需要在云端完成。加入了NPU，本地計算能力大大提升，AI會對當(dāng)前語境和內(nèi)容進(jìn)行細(xì)致地分析，從而實現(xiàn)高準(zhǔn)確率的識別體驗，將語音識別的成功率提升到更高的級別。

從用戶端的體驗來看，這令語音助手變得更加可靠實用，越來越多消費者開始將傳統(tǒng)的手動輸入習(xí)慣改成了和智能手機語音互動。

另一個例子是手機拍照。AI的出現(xiàn)同樣為喜歡手機攝影的人們帶來新的改變。麒麟970搭載雙通道ISP圖像信號處理器，在動態(tài)影像捕捉和低光拍照上有很大的提升。雙攝鏡頭+雙ISP軟硬件優(yōu)化、再配合人工智能的計算機視覺分析，便能自動分析畫面內(nèi)的物體，并選擇當(dāng)前最佳的拍照模式，甚至可以進(jìn)行物體追蹤對焦和預(yù)測用戶拍照時機。這是此前的手機相機無法實現(xiàn)的功能。

麒麟970的推出，成為傳統(tǒng)智能手機和未來AI手機的重要分水嶺，AI手機的發(fā)展也從單純的算法優(yōu)化進(jìn)入了硬件能力的真人工智能比拼階段。

2018年8月，華為又發(fā)布了全球首款7nm（納米）人工智能手機芯片——麒麟980。

1納米等于1毫微米（即十億分2_--米），約為10個原子的長度。一根頭發(fā)絲直徑約為0.1毫米，而7nm相當(dāng)于頭發(fā)絲的萬分之一。

7nm相當(dāng)于70個原子直徑，逼近了硅基半導(dǎo)體工藝的物理極限。也就是說，在不到1平方厘米的麒麟980芯片內(nèi)部，分布著高達(dá)69億個晶體管，可謂是“針尖上起舞”。華為消費者業(yè)務(wù)CEO余承東當(dāng)時透露，麒麟980的7nm工藝是由超過1000多名半導(dǎo)體工程師組成的團隊歷時三年時間、經(jīng)歷超過5000多次的工程驗證精心打磨的成果。

AI算力方面，麒麟980全面升級。以圖像識別速度為例，麒麟970可達(dá)到每分鐘約2005張，而麒麟980在移動端雙NPU強大算力加持下，實現(xiàn)每分鐘圖像識別4500張，識別速度相比上一代提升120%。此外，還有人臉識別、語音助手、Al拍照及各類智能美拍P圖等APP在手機上的全面升級。

到了2019年，華為推出麒麟810芯片，這是華為第二款7nm工藝的手機芯片，也是華為首款自研達(dá)芬奇架構(gòu)NPU的手機芯片。

至此，華為完成第一輪在手機端的AI芯片布局。

“達(dá)芬奇”構(gòu)建端邊云算力大爆發(fā)基礎(chǔ)

如果說華為在芯片上的持續(xù)投入屬“居安思?！?，顯示遠(yuǎn)見與決心，那么，華為在人工智能領(lǐng)域的野心則更為宏大，這一次，華為不僅要覆蓋云、邊、端各種場景，還要形成從應(yīng)用使能到系統(tǒng)到芯片的閉環(huán)。

去年10月，華為在其全聯(lián)接大會上首次提出全棧全場景AI解決方案，徐直軍解釋稱，全場景，是指包括公有云、私有云、各種邊緣計算、物聯(lián)網(wǎng)行業(yè)終端以及消費類終端等部署環(huán)境。全棧是技術(shù)功能視角，是指包括芯片、芯片使能、訓(xùn)練和推理框架和應(yīng)用使能在內(nèi)的全堆棧方案。

其中，全棧AI的基礎(chǔ)，是一系列基于統(tǒng)一的達(dá)芬奇架構(gòu)的AI芯片——從IoT到終端（如麒麟芯片的NPU）、到邊緣側(cè)再到云。

達(dá)芬奇架構(gòu)針對AI運算特征設(shè)計，以高性能3D Cube計算引擎為基礎(chǔ)，提升算力和能效。出發(fā)點是云、邊緣、端獨立的和協(xié)同的AI實際需求，從極致低功耗，到極致大算力的AI場景，為云、邊、端之間的算法協(xié)同、遷移、部署、升級和運維，提供了統(tǒng)一架構(gòu)底層核心支撐，大大降低了人工智能算法開發(fā)和迭代的門檻，降低企業(yè)人工智能部署和商用成本。

目前，異騰（Ascend）芯片家族中的異騰310已經(jīng)落地商用。

基于異騰310，華為陸續(xù)發(fā)布了包括Atlas200、Atlas300、Atlas500、Atlas800等產(chǎn)品，已被廣泛應(yīng)用于安防、金融、醫(yī)療、交通、電力、汽車等行業(yè)，涉及攝像機、無人機、機器人、智能小站、MDC（Mobile Data Center）等產(chǎn)品形態(tài)。

華為還上線了基于異騰310的AI云服務(wù)，華為云圖像分析類服務(wù)、OCR服務(wù)、視頻智能分析服務(wù)等超過50款A(yù)PI已經(jīng)基于異騰310，日均調(diào)用量超過1億次。大量企業(yè)客戶正在借助異騰310芯片自己開發(fā)算法服務(wù)。

異騰310產(chǎn)品矩陣的成熟，令外界對異騰910的期待更盛。

去年10月，徐直軍說，異騰910是計算密度最大的單芯片，最大功耗為350W，半精度為（FPl6）256 Tera FLOPS，比英偉達(dá)V100的125 Tera FLOPS還要高出近1倍。若集齊1024個異騰910，將會出現(xiàn)迄今為止全球最大的AI計算集群，性能也將達(dá)到256個P，不管多復(fù)雜的模型都能輕松訓(xùn)練。

簡單說，異騰910是業(yè)界算力最高的AI處理器，相同功耗情況下，它的算力是業(yè)界芯片的2倍，最強CPU的50倍。

昇騰910和MindSpore的推出，標(biāo)志著華為已完成全棧全場景AI解決方案的構(gòu)建，AI戰(zhàn)略的實行進(jìn)入新階段。

算力之外的全棧AI

異騰之外，華為提出的全棧AI，還包括支持端、邊、云獨立的和協(xié)同的AI訓(xùn)練框架MindSpore，芯片算子庫和高度自動化算子開發(fā)工具CANN，提供全流程服務(wù)（ModeIArts）、分層API和預(yù)集成方案的應(yīng)用使能。

2019年已經(jīng)落地實現(xiàn)商用的，除了異騰310，還有其面向用戶和開發(fā)者的門戶——華為云ModelArts。

作為一站式AI開發(fā)平臺，ModelArts可以為開發(fā)者提供海量數(shù)據(jù)預(yù)處理及半自動化標(biāo)注、大規(guī)模分布式訓(xùn)練、自動化模型生成及端-邊-云模型按需部署能力，幫助用戶快速創(chuàng)建和部署模型，管理全周期AI工作流。

2019年5月，在斯坦福大學(xué)DAWN-Bench榜單，華為云ModelArls獲得圖像識別訓(xùn)練第一，ImageNet-1k數(shù)據(jù)集上用128塊V100 GPU訓(xùn)陳ResNet-50模型僅需要2分43秒。

2017年10月，斯坦福DAWN的訓(xùn)練時間是13天10小時41分鐘。斯坦福大學(xué)DAWNBench榜單幾乎聚集了國內(nèi)外領(lǐng)先AI廠商，一位華為技術(shù)人士認(rèn)為，ModelArts如果由異騰910加持，很有可能進(jìn)一步刷新世界紀(jì)錄。若再采用1024個異騰910的全球最大AI計算集群，可能還有更大的驚喜。

此時距離華為去年10月發(fā)布AI全棧戰(zhàn)略已經(jīng)過去將近一年。從端側(cè)到邊緣側(cè)再到云側(cè)，從底層硬件到深度學(xué)習(xí)框架再到上層應(yīng)用使能，華為的全棧全場景AI戰(zhàn)略正在逐步落地。

一年前的那次大會上，當(dāng)時徐直軍稱，華為當(dāng)下的任務(wù)是探索一套能夠快速落地的AI戰(zhàn)略實施路徑，其中生態(tài)從無到有到興盛，又是重中之重。新的故事，正在開講。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

華為第一個把AI帶進(jìn)手機，如今想讓算力大爆發(fā)?

把專用NPU AI芯片放進(jìn)手機

“達(dá)芬奇”構(gòu)建端邊云算力大爆發(fā)基礎(chǔ)

算力之外的全棧AI