国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

ARM big.LITTLE系統(tǒng)技術(shù)應(yīng)用

2013-04-29 00:44:03RobinRandhawaBrianJeff
電子產(chǎn)品世界 2013年8期
關(guān)鍵詞:中央處理器處理器集群

Robin Randhawa Brian Jeff

對(duì)于未來任何一種處理器,處理速度都將因?yàn)槭芟抻谏釂栴}而無法大幅躍進(jìn)。設(shè)備一旦達(dá)到熱障(thermal barrier)就會(huì)熔化,如果是移動(dòng)電話,便會(huì)使設(shè)備的溫度上升造成用戶不適。除了物理層面的散熱問題外,能源效率也相當(dāng)差。若調(diào)校處理器使其速度加快,則所需耗能便會(huì)呈指數(shù)數(shù)增長(zhǎng),而為了增加最后一丁點(diǎn)的性能需要付出的成本非常高。過去,尺寸倍增代表著速度翻倍,但如今,面積倍增,速度卻只增加幾個(gè)百分點(diǎn),因此復(fù)雜度并不代表有效率,而這就是單一核心系統(tǒng)有所限制的原因之一。

如果無法加快單一核心的速度,那么就必須增加獨(dú)立核心的數(shù)量。這也有助于每個(gè)核心去應(yīng)對(duì)其被分配到的任務(wù)需求,而這也就是ARM big.rLITTE(大小核)處理器技術(shù)的貢獻(xiàn)所在。

big.LITTLE處理器技術(shù)要解決業(yè)界目前最嚴(yán)峻的挑戰(zhàn):通過提升性能和延長(zhǎng)電池續(xù)航時(shí)間來拓展消費(fèi)者“始終在線、始終連接”的互聯(lián)移動(dòng)體驗(yàn)。這種技術(shù)之所以能達(dá)成上述目標(biāo),是通過結(jié)合一個(gè)大(big)的多核心處理器與一個(gè)?。↙ITFLE)的多核心處理器,然后根據(jù)性能需求,以無縫的方式針對(duì)不同任務(wù)選擇合適的處理器。更重要的是這種動(dòng)態(tài)選擇的動(dòng)作,對(duì)于上層應(yīng)用軟件或中間件在處理器上的執(zhí)行絲毫沒有任何影響。

目前已應(yīng)用于市面上移動(dòng)設(shè)備的big.LITTLE設(shè)計(jì),結(jié)合了高性能Cortex-A15多處理器集群與具有節(jié)能特色的Cortex-A7多處理器集群。這些處理器在架構(gòu)上是百分之百兼容且具有相同功能(均支持LPAE、虛擬化擴(kuò)充及NEON、VFP之類的運(yùn)作單元),無須另外調(diào)整即可讓針對(duì)其中一種處理器類型所編譯的軟件應(yīng)用程序順暢地應(yīng)用于另一款處理器上。

big.UTTLE系統(tǒng)結(jié)構(gòu)

就高速緩存一致性(cachecoherency)的維護(hù)而言,無論是同一處理器集群中的高速緩存、或是跨不同處理器集的高速緩存,皆保持了高速緩存數(shù)據(jù)的一致性。這種跨集群的一致性來自ARM CoreLink高速緩存一致性互連(CCI-400,也能提供ARMMali-T604之類的圖形處理器[GPU]系統(tǒng)等組件的I/O一致性)。兩種集群的中央處理器,還可通過CoreLink GIC-400之類的共享中斷控制器互傳信號(hào)。

big.LITTLE系統(tǒng)執(zhí)

行模式

由于同一應(yīng)用程序不需要任何修改以同時(shí)在Cortex-A7和Cortex-A15上運(yùn)行,因此可以在隨機(jī)的情況下也能為某個(gè)應(yīng)用程序選擇正確的處理器。下列執(zhí)行模式便以止理論為基礎(chǔ):

·big.LITFLE轉(zhuǎn)移模式:

·big.LITFLE MP模式。

顧名思義,轉(zhuǎn)移模式支持不同類型處理器之間的內(nèi)容獲取和恢復(fù)。以中央處理器轉(zhuǎn)移來說,集群中每個(gè)中央處理器在另一個(gè)集群中都有對(duì)應(yīng)的中央處理器,而軟件內(nèi)容則以每個(gè)中央處理器為單位,隨機(jī)在不同的集群間轉(zhuǎn)移。如果集群中沒有正在運(yùn)轉(zhuǎn)中的中央處理器,便可關(guān)閉整個(gè)集群以及相關(guān)的二級(jí)緩存(L2 cache)電源。MP模式則將軟件堆棧分配到兩個(gè)集群中各個(gè)處理器上。所有的中央處理器可同時(shí)運(yùn)作,將系統(tǒng)性能提升到最高點(diǎn)。

big.UITTLE轉(zhuǎn)移模式

轉(zhuǎn)移模式是動(dòng)態(tài)電壓頻率調(diào)整(DVFS)等功耗/性能管理技術(shù)的延伸。轉(zhuǎn)移操作類似DVFS操作點(diǎn)的轉(zhuǎn)換。處理器上DVFS曲線的操作點(diǎn),會(huì)隨負(fù)載變化不同而來回移動(dòng)。在當(dāng)前的處理器(或集群)已達(dá)到最高操作點(diǎn)時(shí),如果軟件堆棧仍需要更高的性能,處理器(或集群)轉(zhuǎn)移就會(huì)發(fā)生。此時(shí)就會(huì)由另一個(gè)處理器(或集群)來執(zhí)行工作,這個(gè)處理器(或集群)的操作點(diǎn)也會(huì)隨著負(fù)載變化不同而來回變動(dòng)。當(dāng)性能需求不再,可以再切換回之前的處理器(或集群)。

一致性是實(shí)現(xiàn)快速轉(zhuǎn)移的重要因素,它允許監(jiān)視并將保存在離埠處理器(outbound processor)的狀態(tài),在入埠處理器(inbound processor)上檢測(cè)與恢復(fù),而不必通過主存儲(chǔ)器的存取。此外,由于離埠處理器的L2有高速緩存一致性(cache coherency)的功能,當(dāng)任務(wù)轉(zhuǎn)移時(shí),可以透過檢測(cè)數(shù)據(jù)值的方式,改善入埠處理器的高速緩存預(yù)熱時(shí)間,此時(shí)L2高速緩存仍然可以維持供電狀態(tài)。不過,因?yàn)殡x埠處理器的L2高速緩存無法提供新數(shù)據(jù)的配置,最后還必須清除并關(guān)閉電源以節(jié)省耗電。

big.UITTLE中央處理器轉(zhuǎn)移模式

至于中央處理器轉(zhuǎn)移,小核的處理器集群中每個(gè)處理器都對(duì)應(yīng)了一個(gè)大核集群的處理器。中央處理器為成對(duì)配置(cortex-A15及Cortex-A7處理器上同時(shí)配置CPUO、CPU1……依此類推)。使用中央處理器轉(zhuǎn)移時(shí),每個(gè)處理器配對(duì)中在同一時(shí)間只有一個(gè)中央處理器能夠運(yùn)轉(zhuǎn)。

系統(tǒng)會(huì)主動(dòng)檢測(cè)各處理器的負(fù)載。高負(fù)載時(shí)內(nèi)容執(zhí)行會(huì)轉(zhuǎn)移到大的核心,當(dāng)負(fù)載較低,執(zhí)行則會(huì)轉(zhuǎn)移到小的核心。不論何時(shí)每個(gè)配對(duì)中只有一個(gè)處理器可以運(yùn)轉(zhuǎn)。當(dāng)負(fù)載從離埠核心轉(zhuǎn)移到入埠核心時(shí),前者便會(huì)關(guān)閉。這種模式讓大核與小核的組合能隨時(shí)運(yùn)轉(zhuǎn)。

big.UITTLE MP運(yùn)作

由于big.LITTLE系統(tǒng)可以經(jīng)由CCI-400達(dá)到高速緩存的一致性,因此有另一種模式能讓Cortex-A15及Cortex-A7處理器同時(shí)運(yùn)作并同步執(zhí)行程序代碼,稱為big.LITTLE MP(本質(zhì)上是一種異質(zhì)性多任務(wù)處理模型)。這是big.LITTLE系統(tǒng)最先進(jìn)且最具彈性的模式,能跨越兩個(gè)集群調(diào)整單一執(zhí)行環(huán)境。在這種使用模式下,若線程有上述處理性能方面的需求,便可開啟Cortex-A15處理器核心并同時(shí)通過Cortex-A7處理器核心執(zhí)行任務(wù)。如果沒有這方面需求,則只需開啟Cortex-A7處理器。在實(shí)際應(yīng)用上,不同集群的處理器核心并不需要保持一致,而big.LITFLE MP更容易支持非對(duì)稱的叢集。

移動(dòng)應(yīng)用的特性

big.LITTLE技術(shù)具有優(yōu)勢(shì)的原因之一,就是普通情況下移動(dòng)應(yīng)用工作量對(duì)性能的需求各有不同。圖5顯示的是目前搭載Cortex-A9的移動(dòng)設(shè)備中,兩個(gè)核心在DVFS、閑置與完全關(guān)機(jī)狀態(tài)下所花費(fèi)時(shí)間的百分比。圖中紅色代表最高頻率的操作點(diǎn),綠色區(qū)塊則代表最低頻率操作點(diǎn),介于兩者的顏色則屬中級(jí)頻率。除了DVFS狀態(tài),操作系統(tǒng)電源管理也會(huì)使中央處理器閑置。圖中淺藍(lán)色區(qū)塊代表空閑時(shí)間。當(dāng)中央處理器閑置的時(shí)間夠長(zhǎng),系統(tǒng)的電源控制軟件可能會(huì)完全關(guān)閉其中一個(gè)核心以節(jié)省耗電。圖中最深的顏色便代表這部份。

從圖5可清楚看出,應(yīng)用程序處理器在好幾種普通工作量下,都有相當(dāng)多時(shí)間處于低頻率狀態(tài)。在big.LITTLE系統(tǒng)里,系統(tǒng)級(jí)芯片(Soc)可利用耗能較低的cortex-A7中央處理器,執(zhí)行深紅色部分以外的所有工作。下圖則以相同方式分析了更為密集的工作量,而即使是在這樣的狀況下,在Cortex-A7處理器對(duì)應(yīng)出低于1GHz的頻率的機(jī)會(huì)仍然很大。

性能與耗電分析:big.LITTLE測(cè)試芯片

2011年起,用戶層級(jí)軟件已能在big.LITTLE排程上運(yùn)轉(zhuǎn),不過,那只是在處理器核心與互聯(lián)的軟件模型環(huán)境上發(fā)展。為完整評(píng)估big.LITTLE系統(tǒng)的性能、節(jié)能以及調(diào)校是否合適,必須打造一個(gè)能讓用戶軟件全速運(yùn)轉(zhuǎn)的測(cè)試芯片。ARM的測(cè)試芯片早在2012年初夏即由制造廠完成,并在短短幾周內(nèi)開始搭配硬件開發(fā)板(development board)運(yùn)轉(zhuǎn),支持完整版的Linux系統(tǒng)及安卓操作系統(tǒng)Ice Cream Sandwich(Jelly Bean亦納入測(cè)試但本文引用結(jié)論均來自Ice Creamsandwich)。這個(gè)測(cè)試芯片包含了一個(gè)雙核Cortex-A15集群、一個(gè)三核Cortex-A7集群,以及CCI-400高速緩存一致總線架構(gòu)。會(huì)影響部分使用者評(píng)效基準(zhǔn)的圖形處理器并不包括在內(nèi),但平臺(tái)仍可支持Linux、安卓操作系統(tǒng)以及性能測(cè)試軟件。

圖5的性能測(cè)評(píng)是由Cortex-A15與Cortex-A7中央處理器集群各自獨(dú)立運(yùn)轉(zhuǎn)。測(cè)試芯片的Cortex-A1S最高頻率達(dá)1.2GHz,Cortex-A7則為1GHz。性能測(cè)評(píng)結(jié)果顯示,雖然測(cè)試芯片上的內(nèi)存系統(tǒng),其性能不如big.LITTLE系統(tǒng)級(jí)芯片量產(chǎn)后的預(yù)測(cè)水平,Cortex-A15與Cortex-A7中央處理器的性能仍落在預(yù)期范圍內(nèi)。根據(jù)各個(gè)核心獨(dú)立運(yùn)轉(zhuǎn)所得結(jié)果,我們對(duì)平臺(tái)測(cè)量big,LITFLE性能的準(zhǔn)確度深具信心。測(cè)試芯片平臺(tái)軟件包含基本的Linux核心,還采用了中央處理器轉(zhuǎn)移軟件與big.LITTLE MP修正程序組,以測(cè)試中央處理器轉(zhuǎn)移或big.LITFLE MP模式。

而用來測(cè)試big.LITTLE性能的任務(wù)量,主要基于Android CreamSandwich系統(tǒng),通過網(wǎng)頁進(jìn)行網(wǎng)絡(luò)瀏覽器性能循環(huán),背景則有音效播放。在這個(gè)使用實(shí)例中,是以相當(dāng)密集的工作量搭配對(duì)性能需求不高的背景活動(dòng)。網(wǎng)絡(luò)瀏覽器每2秒便進(jìn)行網(wǎng)頁循環(huán),每頁卷動(dòng)達(dá)500像素,因此對(duì)系統(tǒng)性能需求相對(duì)較高。為了在進(jìn)行性能測(cè)試的同時(shí)測(cè)量性能與能耗,首先必須建立性能與能耗的基線。而這個(gè)基線則搭配獨(dú)立運(yùn)作的Cortex-A15集群進(jìn)行測(cè)量。

值得一提的是,這組結(jié)論屬于較早期的測(cè)試結(jié)果:用來測(cè)試的第一版big.LITTLE MP修正程序組,將Linux排程程序從一個(gè)完整而平衡的排程模式調(diào)整成big.LITTLE模式。我們預(yù)期軟件修正后性能與能耗將會(huì)改善,也會(huì)尋找其他可調(diào)校的元素。另外,測(cè)試芯片缺少繪圖處理器:這將使得中央處理器的負(fù)載高于搭載繪圖處理器的系統(tǒng)在卸除狀態(tài)下的負(fù)載水平,而在中央處理器負(fù)載較低的狀況下,可能會(huì)較常使用LITTLE核心,進(jìn)而達(dá)到節(jié)能目的。它包含一套基本的電壓及頻率操作點(diǎn)(DVFS),但沒有對(duì)單處理器核心做獨(dú)立的電源開關(guān)設(shè)計(jì),因此big.LITTLE系統(tǒng)單芯片量產(chǎn)后測(cè)試結(jié)果有望提升。舉例來說,后臺(tái)任務(wù)的性能便可節(jié)省超過70%的能耗。

如何選擇big.LITTLE軟件模式

各界最常見的疑問就是:“應(yīng)該選擇哪一種軟件模式?”目前主要是在中央處理器轉(zhuǎn)移與big.LITTLEMP之間選擇一種,而兩種方式各有優(yōu)劣勢(shì)。在中央處理器轉(zhuǎn)移方面,由于big以及LITTLE核心處于搭配成對(duì)的狀態(tài),因此對(duì)稱式的拓?fù)淠茼槙尺\(yùn)作。而big及LITTLE核心數(shù)量不同的非對(duì)稱式拓?fù)鋭t需要額外運(yùn)作。由于Cortex-A7中央處理器核心體積較小,因此可使用4個(gè)LITTLE核心加上1到2個(gè)big核心,這種作法可能會(huì)具有吸引力。從正面的角度來看,中央處理器轉(zhuǎn)移讓電源及性能的調(diào)校更為容易,可重復(fù)利用既有的操作系統(tǒng)電源管理程序代碼,代表產(chǎn)品將有多年的研發(fā)及測(cè)試結(jié)果作為支持。加上不必調(diào)整核心的排程程序,范圍比執(zhí)行big.LITTLE MP模式更為簡(jiǎn)化,而軟件模式也正日趨成熟。整體而言,中央處理器轉(zhuǎn)移是一種極佳的解決方案,2013上半年后可望進(jìn)入量產(chǎn),并持續(xù)為尚未完成big.LYITLE MP模式升級(jí)準(zhǔn)備的系統(tǒng)提供可行的轉(zhuǎn)移模式解決方案。

big.LITTLE MP具有多項(xiàng)技術(shù)上的優(yōu)勢(shì),雖然技術(shù)尚未完全成熟,但目前正處于進(jìn)階研發(fā)階段,測(cè)試結(jié)果如本文所示相當(dāng)不錯(cuò)。由于支持非對(duì)稱式拓?fù)錇闃?biāo)準(zhǔn)配備,因此無需調(diào)整軟件,big.LITTLE MP技術(shù)便能利用系統(tǒng)中所有核心。它在性能與能耗方面優(yōu)點(diǎn)更多。舉例來說,它能同步利用所有核心以提升性能,或?qū)ig與LITTLE核心上的DVFS設(shè)定與排程程序設(shè)定調(diào)成不同狀態(tài)以節(jié)省更多能耗。因?yàn)樾枰黾诱{(diào)校的動(dòng)作,才能從big.LITTLE MP平臺(tái)獲取完整的性能及能耗優(yōu)勢(shì),所以彈性提升仍有其代價(jià)。這與過去數(shù)年來由硅組件以及代工廠商將操作系統(tǒng)能源管理設(shè)定以及DVFS參數(shù)數(shù)據(jù),并依據(jù)裝置需求轉(zhuǎn)化為移動(dòng)系統(tǒng)級(jí)芯片平臺(tái)的主流做法并無太大差異。big.LITTLE MP模式將轉(zhuǎn)移模式延伸并納入新的參數(shù)數(shù)據(jù),不僅更為節(jié)能,更能為經(jīng)過性能優(yōu)化的big核心增加系統(tǒng)響應(yīng)度。

big.LITTLE MP模式正快速成熟,雖然尚未成為主流技術(shù),但目前這項(xiàng)技術(shù)已可接受合作伙伴整合,并有望在2013下半年打入上游。所幸支持big.LITTLE MP并不需要改變硬件,因此晶圓廠可能會(huì)部署具有中央處理器轉(zhuǎn)移的平臺(tái),針對(duì)部署平臺(tái)進(jìn)行核心更新并升級(jí)至big.LITTLE MP模式,或建設(shè)現(xiàn)有的big.LITTLE平臺(tái)以便在2013年后半年直接取得big.LITTLE MP軟件轉(zhuǎn)移模式。

雖然big.LITTLE MP模式尚未進(jìn)入量產(chǎn),但如文中測(cè)試結(jié)果,我們可以看到相關(guān)軟件已開始運(yùn)作,并已開始在硅組件廠研發(fā)平臺(tái)端進(jìn)行測(cè)試。big.LYITLE MP軟件已用于我們的測(cè)試系統(tǒng),目前正積極進(jìn)行軟件強(qiáng)化,并針對(duì)各種實(shí)際應(yīng)用將系統(tǒng)性能調(diào)校至最佳效果。

有部分的可調(diào)校因素已在應(yīng)用中,包括排程程序的負(fù)載平衡策略、上下移轉(zhuǎn)點(diǎn)以及線程優(yōu)先順序,ARM與芯片設(shè)計(jì)合作伙伴將持續(xù)就上述領(lǐng)域進(jìn)行系統(tǒng)調(diào)校。

新一代big.LITTLE硬件

cortex-A15與cortex-A7核心代表第一代的big.LITTLE硬件。ARM已發(fā)布兩款具有big.LITTLE處理性能的新型中央處理器核心,即cortex-AS7以及Cortex-AS3處理器。Cortex-AS7處理器是經(jīng)過性能優(yōu)化的big核心,每頻率周期的性能可增加25%,頻率性能也更為提高,效率則略高于cortex-A15處理器。Cortex-AS3處理器為L(zhǎng)ITTLE核心,每頻率周期的性能可增加40%,能源效率則大約于cortex-A7處理器相同。

這些新的處理器核心在架構(gòu)上都完全相同,并支持ARMv8架構(gòu),因此能導(dǎo)入全新的NEON技術(shù)與浮點(diǎn)功能、加密加速并支持64位架構(gòu)。除了AMBA4 ACE,兩種核心也都支持新一代高速緩存一致總線架構(gòu),且與現(xiàn)有的ARMv7中央處理器核心相同,能在AArch32模式下執(zhí)行既有程序代碼。支持64位及額外一般用途緩存器的應(yīng)用方式效率更高,且能耗增加不多。同時(shí),微架構(gòu)也經(jīng)過強(qiáng)化,以增加各核心在每個(gè)指令頻率周期中的傳輸量。這些新款核心在經(jīng)過軟件細(xì)節(jié)升級(jí)并支持64位尋址模式后,將會(huì)與cortex-A15以及cortex-A7處理器一樣支持big.LITTLE技術(shù)。

結(jié)論

big.LITTLE系統(tǒng)為能耗及性能控制點(diǎn)的極度寬動(dòng)態(tài)(wide dynamicrange)開啟了大門。這是僅由單一類型處理器組成的產(chǎn)品所無法達(dá)到的。目前市面上設(shè)備的工作量往往混雜了需求程度高低不同的線程,這種寬動(dòng)態(tài)便可為其提供完美的執(zhí)行環(huán)境。由于日后Cortex-A7將成為平臺(tái)主力,這一系統(tǒng)另一個(gè)優(yōu)點(diǎn)即能夠打造基于Cortex-A7的高度節(jié)能產(chǎn)品。

猜你喜歡
中央處理器處理器集群
海上小型無人機(jī)集群的反制裝備需求與應(yīng)對(duì)之策研究
計(jì)算機(jī)中央處理器液體循環(huán)散熱器實(shí)驗(yàn)研究
一種無人機(jī)集群發(fā)射回收裝置的控制系統(tǒng)設(shè)計(jì)
電子制作(2018年11期)2018-08-04 03:25:40
關(guān)于計(jì)算機(jī)中央處理器的研究
Python與Spark集群在收費(fèi)數(shù)據(jù)分析中的應(yīng)用
CPU與GPU探究
計(jì)算機(jī)中央處理器的研究
勤快又呆萌的集群機(jī)器人
Imagination的ClearCallTM VoIP應(yīng)用現(xiàn)可支持Cavium的OCTEON? Ⅲ多核處理器
ADI推出新一代SigmaDSP處理器
汽車零部件(2014年1期)2014-09-21 11:41:11
岚皋县| 皮山县| 天柱县| 长汀县| 麻阳| 黄骅市| 孟连| 肇庆市| 安远县| 格尔木市| 从江县| 吴忠市| 岫岩| 临猗县| 井冈山市| 武陟县| 鹤壁市| 临朐县| 三门县| 北宁市| 旌德县| 东港市| 田阳县| 虎林市| 昌黎县| 白玉县| 徐州市| 临沧市| 淳安县| 通道| 三明市| 祥云县| 页游| 平顺县| 溧阳市| 新安县| 略阳县| 鸡泽县| 沿河| 云龙县| 汕头市|