国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能芯片產(chǎn)業(yè)現(xiàn)狀

2018-03-22 02:20:09
信息通信技術(shù)與政策 2018年2期
關(guān)鍵詞:架構(gòu)芯片環(huán)節(jié)

蔣阿芳 中國信息通信研究院泰爾終端實驗室高級工程師

紀學(xué)毅 中國信息通信研究院泰爾終端實驗室碩士研究生

1 引言

隨著A lphaGo將AI帶入人們的視野,AI逐漸被人們認為是下一個“互聯(lián)網(wǎng)”類顛覆行業(yè)的技術(shù)。人工智能的發(fā)展正處在第三次高潮,看重AI技術(shù)帶來的巨大市場潛力,科技巨頭們紛紛布局人工智能產(chǎn)業(yè)鏈,具體來講有3種方式,即打造AI開源平臺、布局AI芯片、布局AI核心技術(shù)。

人工智能領(lǐng)域是一個數(shù)據(jù)密集的領(lǐng)域,傳統(tǒng)的數(shù)據(jù)處理技術(shù)難以滿足高強度、大數(shù)據(jù)的處理需求。AI芯片的出現(xiàn)讓大規(guī)模的數(shù)據(jù)效率大大提升,加速了深層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練迭代速度,極大地促進了人工智能行業(yè)的發(fā)展。

人工智能芯片作為人工智能行業(yè)的重要底層架構(gòu),其戰(zhàn)略重要性不言而喻。如圖1所示,AI芯片位于基礎(chǔ)層中的計算能力部分。AI芯片作為產(chǎn)業(yè)核心,也是技術(shù)要求和附加值最高的環(huán)節(jié),除了本身的產(chǎn)業(yè)價值外,其戰(zhàn)略地位也遠遠大于應(yīng)用層創(chuàng)新。

目前,AI芯片行業(yè)的整體情況是進入門檻偏高,如FPGA領(lǐng)域,有多達9000項的專利,知識產(chǎn)權(quán)壁壘較高,Intel也是耗資167億美元收買了A ltera,從而獲得了進入FPGA領(lǐng)域的入場券。且FPGA整個的市場總額偏小,2016年僅為50億美元,有9成還落入賽靈思和Altera兩家公司,另外兩類如GPU、ASIC也有相同的情況。同時,芯片行業(yè)的整體投入時間較長,一般從研發(fā)到產(chǎn)品真正規(guī)?;a(chǎn)需要近7年的時間。

2 AI芯片分類

芯片又叫集成電路,按照功能不同可分為很多種,有負責(zé)電源電壓輸出控制的,有負責(zé)音頻視頻處理的,還有負責(zé)復(fù)雜運算處理的。算法必須借助芯片才能夠運行,而由于各個芯片在不同場景的計算能力不同,算法的處理速度、能耗也就不同。在人工智能市場高速發(fā)展的今天,人們都在尋找能讓深度學(xué)習(xí)算法更快速、更低能耗執(zhí)行的芯片。

人工智能芯片分類如圖2所示。從技術(shù)架構(gòu)角度分類,主要包括GPU、FPGA、ASIC以及類腦芯片,在人工智能時代,它們各自發(fā)揮優(yōu)勢,呈現(xiàn)出百花齊放的狀態(tài);從市場需求角度來講,AI芯片可分為兩大使用場景,即訓(xùn)練(Training)和推斷(Inference)。AI芯片共3類,即訓(xùn)練需求(基于云端設(shè)備端需求目前不明確)、基于云端的推斷需求和基于設(shè)備端的推斷需求。

2.1 技術(shù)架構(gòu)角度分類

(1)GPU

GPU最初是作為應(yīng)對圖像處理需求而出現(xiàn)的芯片。其特點為擅長大規(guī)模并行運算,可以平行處理大量信息。在人工智能技術(shù)發(fā)展早期,因其優(yōu)異的大規(guī)模數(shù)據(jù)處理能力,GPU被使用在多個項目之中。在圖像識別、棋牌類博弈、輔助駕駛系統(tǒng)和無人駕駛試驗中,均使用了GPU作為加速芯片。

圖1 AI芯片在人工智能產(chǎn)業(yè)要素中的位置

圖2 AI芯片分類

然而,從芯片底層架構(gòu)來講,由于GPU并非專為深度學(xué)習(xí)設(shè)計的專業(yè)芯片,未必為人工智能加速硬件的最終答案。目前,GPU的設(shè)計和生產(chǎn)均已非常成熟,在集成度和制造工藝上具有優(yōu)勢,因而從成本和性能的平衡來講,是當下人工智能運算的很好選擇。

(2)FPGA

FPGA全稱為“可編輯門陣列”(Field ProgrammableGateArray),它是一種通用型的芯片,設(shè)計更接近于硬件底層的架構(gòu),其最大特點是可編程。基于可編程的特點,用戶可以通過FPGA配置文件來實現(xiàn)應(yīng)用場景的高度定制,進而實現(xiàn)高性能、低功耗。FPGA成本較高,更適用于企業(yè)用戶,尤其是可重配置需求較高的軍事和工業(yè)電子領(lǐng)域。此外,互聯(lián)網(wǎng)企業(yè)也都有專門做FPGA的團隊為服務(wù)器加速。FPGA在深度學(xué)習(xí)加速方面具有可重構(gòu)、低功耗、可定制和高性能等特點。當然,F(xiàn)PGA也存在硬件編程困難,且尚未形成統(tǒng)一的編程模型,重用方面也是一大難題。

(3)ASIC

ASIC全稱為“專用集成電路”(ApplicationSpecific Integrated Circuits),對應(yīng)特定應(yīng)用場景,針對特定用戶需求的專用類芯片。假如把FPGA比作科研研發(fā)專用芯片,那么ASIC就是確定應(yīng)用市場后,大量生產(chǎn)的專用芯片?;诖?,廠家可以針對特定用戶場景使用FPGA進行研發(fā),當算法成熟、芯片設(shè)計固定后可以以ASIC的方式進行大規(guī)模生產(chǎn)。因此,作為全定制設(shè)計的ASIC芯片,針對適用的應(yīng)用場景,ASIC的性能和能耗都要優(yōu)于市場上的現(xiàn)有芯片,包括FPGA和GPU。目前,人工智能類ASIC的發(fā)展仍處于早期。其根本原因是,ASIC一旦設(shè)計制造完成后電路就固定了,只能微調(diào),無法大改。而硬件的研發(fā)設(shè)計與生產(chǎn)成本很高,企業(yè)很難貿(mào)然嘗試。此外,能設(shè)計出適用于人工智能芯片的公司必然是要既具備人工智能算法又擅長芯片研發(fā)的公司。

代表性的ASIC芯片即TPU(Tensor Processing Unit)是Google研發(fā)的一款針對深度學(xué)習(xí)加速的ASIC芯片,第一代TPU僅能用于推理,而目前發(fā)布的TPU 2.0既可以用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),又可以用于推理。TPU2.0包括4個芯片,每秒可處理180萬億次浮點運算。Google還找到一種方法,使用新的計算機網(wǎng)絡(luò)將64個TPU組合到一起,升級為所謂的TPUPods,可提供大約1.15萬萬億次浮點運算能力。目前,Google并不直接出售TPU芯片,而是結(jié)合其開源深度學(xué)習(xí)框架TensorFlow為AI開發(fā)者提供TPU云加速的服務(wù),以此發(fā)展TPU2的應(yīng)用和生態(tài),比如TPU2同時發(fā)布的TensorFlow ResearchCloud(TFRC)。

(4)類腦芯片

類人腦芯片架構(gòu)是一款模擬人腦的新型芯片編程架構(gòu),這種芯片的功能類似于大腦的神經(jīng)突觸,處理器類似于神經(jīng)元,而其通訊系統(tǒng)類似于神經(jīng)纖維,可以允許開發(fā)者為類人腦芯片設(shè)計應(yīng)用程序。通過這種神經(jīng)元網(wǎng)絡(luò)系統(tǒng),計算機可以感知、記憶和處理大量不同的情況。

IBM從2008年開始研究能模擬人類大腦的芯片項目,2014年推出首個基于SyNAPSE打造的TrueNorth芯片,該芯片內(nèi)置100萬個模擬神經(jīng)元和2.56億個模擬神經(jīng)突觸。不同芯片還可以通過陣列的方式互聯(lián)。據(jù)稱48顆芯片組建成的具有4800萬個神經(jīng)元的網(wǎng)絡(luò),智力水平已經(jīng)和普通老鼠大腦差不多。

Neural/Neuromorphic Processing Unit為神經(jīng)/神經(jīng)形態(tài)處理器,更多的時候被稱為“神經(jīng)形態(tài)芯片(Neuromorphic Chip)”或者是“類腦芯片(Brain-Inspired Chip)”。這類AI芯片不是用CNN、DNN等網(wǎng)絡(luò)形式來做計算,而是以更類似于腦神經(jīng)組成結(jié)構(gòu)的SNN(Spiking Neural Network)的形式來進行計算。2013年10月,高通研發(fā)的Zeroth處理器就隸屬于NeuralProcessingUnits(NPUs)范疇,其試圖通過模擬人腦的方式對外界刺激做出反應(yīng),從而“學(xué)”到東西,避免程序員再寫代碼。總體來看,類腦計算芯片領(lǐng)域仍處于探索階段。

(5)小結(jié)

芯片定義了產(chǎn)業(yè)鏈和生態(tài)圈的基礎(chǔ)計算架構(gòu),正如CPU是IT產(chǎn)業(yè)的核心一樣,芯片也是人工智能產(chǎn)業(yè)的核心。對AI芯片按技術(shù)架構(gòu)角度分類,表1列出了主要的4類型芯片對比。

表2進一步對表1中已經(jīng)發(fā)布的具有代表性的芯片從計算能力角度進行了對比,因類腦芯片仍處于探索階段,且采用非馮諾依曼架構(gòu),表中沒有對其進行對比。其中,GPU選取的是NVIDIA的TeslaK40,F(xiàn)PGA選取的是Xilinx的V7-690T,ASIC選取的是寒武紀的DIANNAO。從表中的對比來看,能耗比方面為ASIC>FPGA>GPU。

2.2 市場需求角度分類

作為推動第三次浪潮的人工智能核心算法,深度學(xué)習(xí)是機器學(xué)習(xí)領(lǐng)域的一個重要研究方向,一項深度學(xué)習(xí)工程的搭建,可分為訓(xùn)練(Training)和推斷(Inference)兩個環(huán)節(jié)(見圖3)。

(1)訓(xùn)練環(huán)節(jié)

通常需要通過大量的數(shù)據(jù)輸入,或采取增強學(xué)習(xí)等非監(jiān)督學(xué)習(xí)方法,訓(xùn)練出一個復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)模型。訓(xùn)練過程由于涉及海量的訓(xùn)練數(shù)據(jù)和復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),運算量巨大,需要龐大的計算規(guī)模,對于處理器的計算能力、精度、可擴展性等性能要求很高。目前,在訓(xùn)練環(huán)節(jié)主要使用NVIDIA的GPU集群來完成,Google自主研發(fā)的ASIC芯片TPU2.0也支持訓(xùn)練環(huán)節(jié)的深度網(wǎng)絡(luò)加速。

(2)推斷環(huán)節(jié)

指利用訓(xùn)練好的模型,使用新的數(shù)據(jù)去“推理”出各種結(jié)論,如利用后臺訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)模型,判斷一張輸入圖片中的目標類別。雖然推斷的計算量相比訓(xùn)練少很多,但仍然涉及大量的矩陣運算。在推理環(huán)節(jié),GPU、FPGA和ASIC都有很多應(yīng)用價值。

目前,從市場需求角度來講,AI芯片主要可分為3類,其相關(guān)企業(yè)分布如圖4所示。

(1)訓(xùn)練需求,面向各大人工智能企業(yè)及實驗室研發(fā)階段。

(2)基于云端的推斷需求,F(xiàn)ace++、出門問問、Siri等主流人工智能應(yīng)用均通過云端提供服務(wù)。

(3)基于設(shè)備端的推斷需求,面向智能手機、智能攝像頭、機器人/無人機、自動駕駛、VR等設(shè)備的設(shè)備端推理市場,需要高度定制化、低功耗的AI芯片產(chǎn)品。例如,華為麒麟970搭載了“神經(jīng)網(wǎng)絡(luò)處理單元(NPU,實際為寒武紀的IP)”、蘋果A11搭載了“神經(jīng)網(wǎng)絡(luò)引擎(NeuralEngine)”。

表1 技術(shù)架構(gòu)角度的主要4類AI芯片對比

表2 性能與功耗對比

3 我國面臨的機遇與挑戰(zhàn)

圖3 深度學(xué)習(xí)工程搭建的兩個環(huán)節(jié)

人工智能,特別是深度學(xué)習(xí),這幾年呈爆發(fā)性的發(fā)展,很大程度上得益于芯片技術(shù)多年的積累。如果不是芯片技術(shù)已經(jīng)發(fā)展到了一定的高度,能夠給大規(guī)模的機器學(xué)習(xí)提供足夠的處理能力,就沒有戰(zhàn)勝人類頂尖棋手的A lphaGo。過去十幾年驅(qū)動芯片技術(shù)發(fā)展的主要是通信,即多媒體和智能手機這些應(yīng)用。而隨著這些應(yīng)用增長放緩,芯片技術(shù)發(fā)展已經(jīng)逐步轉(zhuǎn)向了AI領(lǐng)域,AI的驅(qū)動效應(yīng)將在芯片技術(shù)上會有更明顯的體現(xiàn)。

圖4 AI芯片行業(yè)布局動態(tài)

作為一項計算密集型的新技術(shù),人工智能早期可以依靠通用芯片的性能來迅速發(fā)展,而后期則必須依靠專用芯片的出現(xiàn)才能統(tǒng)治市場。人工智能芯片的發(fā)展將會從通用走向?qū)S茫ㄒ妶D5),定制的硬件才能實現(xiàn)更優(yōu)的功耗效率,滿足不同算法、結(jié)構(gòu)、終端和消費者的需求,實現(xiàn)規(guī)模化的收益。同時,通用芯片與專用芯片永遠都不是互相替代的關(guān)系,二者必須協(xié)同工作才能發(fā)揮出最大的價值。

圖5 AI芯片發(fā)展路徑

近年來,雖然我國在核心芯片集成能力上大幅提升,但由于核心芯片關(guān)鍵技術(shù)缺失,因此在實際設(shè)計和生產(chǎn)中仍需要大量引進發(fā)達國家和地區(qū)的技術(shù)和產(chǎn)品。另外,從產(chǎn)業(yè)鏈來看,AI芯片可分為設(shè)計、制造和封裝3個主要環(huán)節(jié),其中設(shè)計環(huán)節(jié)需要EDA和邏輯電路設(shè)計驗證等軟硬件平臺的支撐,芯片制造和封裝環(huán)節(jié)需要相關(guān)材料和技術(shù)的支撐。

隨著我國政府不斷加大對于人工智能和芯片領(lǐng)域的投入,接下來幾年將是我國AI芯片技術(shù)和市場成熟的重要階段,未來產(chǎn)業(yè)競爭格局將取決于這幾年各企業(yè)的技術(shù)和市場發(fā)展情況。在這種情況下,我國應(yīng)抓住這一時間窗口,堅持集成創(chuàng)新的思路,通過引人成熟技術(shù),實現(xiàn)AI芯片產(chǎn)業(yè)的“彎道超車”。

同時需要認識到的是,AI芯片除了本身的產(chǎn)業(yè)價值外,其戰(zhàn)略地位也遠遠大于應(yīng)用層創(chuàng)新。在巨大的國際競爭壓力下,需要多方合作,才能夠在AI時代從戰(zhàn)略層面占有一席之地。

[1]王沖鶄.人工智能技術(shù)與產(chǎn)業(yè)發(fā)展態(tài)勢分析[J].電信網(wǎng)技術(shù),2017(7):46-51.

[2]騰訊研究.中美兩國人工智能產(chǎn)業(yè)發(fā)展全面解讀.[DB/OL].http://www.tisi.org/4924.August2,2017.

[3]張軍陽,王慧麗,郭陽,等.深度學(xué)習(xí)相關(guān)研究綜述[J/OL].計算機應(yīng)用研究,2018(2017-08-18).

[4]Chen T,Du Z,Sun N,et al.DianNao:a small-footprint highthroughput accelerator for ubiquitous machine-learning[J].Acm SigplanNotices,2014,49(4):269-284.

[5]戰(zhàn)略前沿技術(shù).AI芯片產(chǎn)業(yè)生態(tài)梳理.[DB/OL].https://wx.abbao.cn/a/4816-c7ec9c4445fa3d0e.htm l.

猜你喜歡
架構(gòu)芯片環(huán)節(jié)
基于FPGA的RNN硬件加速架構(gòu)
必要的環(huán)節(jié)要寫清
功能架構(gòu)在電子電氣架構(gòu)開發(fā)中的應(yīng)用和實踐
汽車工程(2021年12期)2021-03-08 02:34:30
在農(nóng)民需求迫切的環(huán)節(jié)上『深耕』
LSN DCI EVPN VxLAN組網(wǎng)架構(gòu)研究及實現(xiàn)
芯片測試
多通道采樣芯片ADS8556在光伏并網(wǎng)中的應(yīng)用
現(xiàn)代學(xué)徒制管理模式及其頂崗實習(xí)環(huán)節(jié)
一種基于FPGA+ARM架構(gòu)的μPMU實現(xiàn)
74HC164芯片的應(yīng)用
河南科技(2014年10期)2014-02-27 14:09:18
七台河市| 白银市| 双柏县| 文昌市| 长宁区| 叙永县| 吴旗县| 台中县| 晋江市| 洛隆县| 牟定县| 洛川县| 文安县| 武宁县| 岳阳县| 东安县| 灌阳县| 枣阳市| 崇仁县| 鹤壁市| 郓城县| 营口市| 咸阳市| 井冈山市| 屏东县| 新乡市| 兰坪| 清新县| 墨江| 宁远县| 措勤县| 彭泽县| 田林县| 玛曲县| 隆尧县| 柘城县| 合川市| 周口市| 东山县| 扶绥县| 泗水县|