單機(jī)游戲|攻略秘籍|升級補(bǔ)丁|蘋果游戲|軟件下載|游戲?qū)n}|游戲排行榜跑跑車蘋果下載站

文章文章下載
手機(jī)gpu性能指標(biāo)參數(shù)介紹作者:imgtec  來源:imgtec  2014/4/11 15:59:59   我要評論

高級圖形處理器在進(jìn)行推廣時通常比較多個低級別性能指標(biāo)。例如Imagination PowerVR GPU比較常用的比較指標(biāo)為GFLOPS (測量計算吞吐量) ,每秒三角形生成數(shù)量(測量幾何吞吐量),每秒像素數(shù)填充和每秒紋理數(shù)(測量填充率) 。

除了這些較為傳統(tǒng)的指標(biāo),企業(yè)開始按照產(chǎn)品中所包含的內(nèi)核數(shù)量來說明架構(gòu)已經(jīng)較為常見。盡管按照既定狀況來說,內(nèi)核數(shù)量的含義已經(jīng)被GPU市場曲解。也就是說,這個詞語具有延展性,經(jīng)過一段時間這個詞語在反映常見功能方面已經(jīng)有所更新。我來說明內(nèi)核數(shù)量的常見意義。

什么是內(nèi)核?

這要依據(jù)實際情況而定。內(nèi)核數(shù)量的意義在以前是表示處理器前端的數(shù)量。內(nèi)核并不復(fù)雜,前端的作用是調(diào)度執(zhí)行線程。幾乎所有高級GPU都已經(jīng)簡化設(shè)計,在計算資源前端設(shè)置多個調(diào)度器和相關(guān)調(diào)度邏輯,執(zhí)行預(yù)訂的任務(wù)。

每個調(diào)度器跟蹤數(shù)個需要執(zhí)行的線程,在單個時鐘周期中運(yùn)行單個程序的單一指令。單個指令指標(biāo)的作用是在一組算資源上運(yùn)行程序,不考慮線程數(shù)量或者計算資源的共享方式,這是內(nèi)核的通常定義。

但是,我們也用這個內(nèi)核來說明Series5 SGX GPU的整個狀況。例如在SGX544MP3中,共有SGX544MP3的3個完整例程—可以復(fù)用所有GPU資源,我們稱之為MP3配置,或者叫3核 GPU。

多核的誤區(qū)

因此,隨著高級移動系統(tǒng)中CPU內(nèi)核數(shù)量迅速增加, GPU廠商要表達(dá)的信息是GPU也是多核設(shè)計,我們的許多競爭對手將獨(dú)立的ALU流水線視作內(nèi)核以強(qiáng)調(diào)其優(yōu)勢。但這些ALU流水線不能實現(xiàn)完全獨(dú)立的相互調(diào)度,這些流水線與SIMD模式中的流水線一樣每個時鐘周期運(yùn)行同一指令。并未出現(xiàn)我們所指的獨(dú)立前端或獨(dú)立指令指針,但盡管如此市場依然稱其為一個內(nèi)核。

我們按照同樣的方式從基本的構(gòu)建模塊---統(tǒng)一著色器集群(Unified Shading Cluster,USC)到獨(dú)立流水線來說明PowerVR Rogue,來看一下如何計算內(nèi)核數(shù)量。

PowerVR Rogue USC

Rogue的架構(gòu)是由多個模塊構(gòu)建而成,這些模塊稱為統(tǒng)一著色器集群,簡稱USC。我們擴(kuò)展這個架構(gòu)來滿足客戶對GPU的需求,以支持系統(tǒng)級芯片及專門的細(xì)分市場,我們將數(shù)個USC以及其他相關(guān)資源連接在一起后集成在整個GPU IP上。

打開USC,您會發(fā)現(xiàn)用于分析數(shù)據(jù)并得出結(jié)果的是數(shù)個ALU流水線。我們并行設(shè)置這些流水線,每個USC設(shè)置16個流水線。這樣設(shè)置的原因是,圖像呈并行處理,其中多個相關(guān)的數(shù)據(jù),通常是矢量或像素同時運(yùn)行。事實上,高級像素著色的屬性驅(qū)動相關(guān)像素是并行的,因此有必要同時運(yùn)行這些高級像素。

標(biāo)量SIMD執(zhí)行和矢量低效

USC的關(guān)鍵屬性是按照標(biāo)量模式處理數(shù)據(jù)。也就是說對于給定的工作項目,例如一個象素,USC不是在同一時鐘周期內(nèi)的同一獨(dú)立管道上同時執(zhí)行紅、綠、藍(lán)和透明度的矢量。相反, USC在一個時鐘周期內(nèi)執(zhí)行一個紅色組件,接下來執(zhí)行藍(lán)色組件,以此類推,直到執(zhí)行完所有組件。為實現(xiàn)矢量基準(zhǔn)單位的峰值吞吐量,標(biāo)量SIMD單元并行處理多個工作項目。例如,每個時鐘周期內(nèi)處理一個像素的4-wide矢量的峰值吞吐量相當(dāng)于4-wide 標(biāo)量SIMD單元,可在每個時鐘周期內(nèi)處理四個像素。

表面上看這兩種方法的吞吐量相同。但是,高級GPU負(fù)載通常由使用許多不同數(shù)據(jù)寬度的數(shù)據(jù)組成。例如,通常顏色數(shù)據(jù)寬度為4 ( ARGB ),而紋理坐標(biāo)的數(shù)據(jù)寬度通常為2 ( UV),還有許多標(biāo)量實例( 1個組件)處理,如典型的光照計算一樣。

在光照計算中,如果數(shù)據(jù)處理沒有填滿整個矢量寬度時,就會浪費(fèi)矢量處理器寶貴的計算資源。在標(biāo)量架構(gòu)中,正執(zhí)行的運(yùn)算采用一種運(yùn)算類型,在同一時間運(yùn)行一個組件,并行處理同一任務(wù)。例如著色處理中完全由標(biāo)量處理組成,在4-wide矢量架構(gòu)中執(zhí)行25%的任務(wù),而在標(biāo)量SIMD架構(gòu)中本應(yīng)執(zhí)行100%的任務(wù)。

多個低功耗ALU!

我們再來說說USC并行任務(wù)中的獨(dú)立流水線。共有16個流水線,每個流水線內(nèi)部實際上存在數(shù)個執(zhí)行任務(wù)的ALU。即2個FP32 ALU,2個FP16 ALU,以及1個專用函數(shù)ALU 。

為什么使用專用FP16 ALU?主要是為了節(jié)省功耗同時也是為了提高性能。與FP32 ALU相比,簡化ALU邏輯復(fù)雜度可以較低功耗執(zhí)行FP16指令組,同時可執(zhí)行更多的運(yùn)算,在每個時鐘周期實現(xiàn)更高的吞吐量。稍后您就會明白。

在高級圖像渲染中以較低精度計算可能需要耗費(fèi)較多時間,而APIs Rogue力求在所有通用圖形中支持混合精度運(yùn)算,其中包括Direct3D 11,以及更常見的OpenGL ES2和ES3 APIs。在嵌入式圖形運(yùn)算中沒有構(gòu)建混合精度計算流水線是個錯誤,原因是執(zhí)行混合精度工作量會造成功率放大。

性能和功能

各個ALU的功能并不一樣,我們來看一下每個ALU的作用,以便了解其性能:

PowerVR Series6, Series6XT和Series6XE中的FP32 ALU能夠在每個時鐘周期執(zhí)行2浮點運(yùn)算。每個USC即每個時鐘周期的64 FLOP峰值。

PowerVR Series6 GPU內(nèi)共有最多8個統(tǒng)一著色集群( USC )

PowerVR Series6 GPU中的FP16 ALU能夠在能夠在每個時鐘周期執(zhí)行最高3浮點運(yùn)算,我們在Series6XE和Series6XT 改進(jìn)了FP16 ALU可在每個時鐘周期執(zhí)行最高4浮點運(yùn)算。按照不同的產(chǎn)品和系列,每個USC在每個時鐘周期執(zhí)行高達(dá)128浮點運(yùn)算。升級型Series6XE和Series6XT更為靈活,執(zhí)行流水線部分運(yùn)算的編譯器更為容易。

PowerVR Series6XT GPU內(nèi)共有最多8個Unified Shading Clusters( USC )

最后來說一下具有專用功能的ALU,ALU可處理更復(fù)雜的算法和三角運(yùn)算,如正弦、余弦、對數(shù)、倒數(shù)和親和數(shù)、標(biāo)量運(yùn)算。按照這些運(yùn)算的性質(zhì),設(shè)置了ALU輸出精度和性能。

增強(qiáng)ALU內(nèi)核配置

現(xiàn)在,我已經(jīng)說明從構(gòu)建USC塊到利用16個并行管道執(zhí)行任務(wù)來說明Rogue計算架構(gòu),各個管道有較大的專用計算資源,我們按照競爭對手的方式來說明內(nèi)核。每個USC包括:32 FP32 ALU內(nèi)核,高達(dá)64個FP16 ALU內(nèi)核、16 個USC專用函數(shù)ALU內(nèi)核。

按照同樣的方式將Rogue與市場競爭產(chǎn)品比對,ALU內(nèi)核這個術(shù)語很重要,我們希望大家盡可能按這條思路來解釋內(nèi)核。

最后,請記住,Imagination根據(jù)不同的產(chǎn)品Series6, Series6XT和Series6XE設(shè)置1對多的USC。以下為兩個實例:

PowerVR G6230: 兩個Series6 USC-64 FP32 ALU內(nèi)核,每個時鐘周期執(zhí)行高達(dá)128 FLOP – 64 FP16 ALU 內(nèi)核,每個時鐘周期執(zhí)行高達(dá)192 FLOP。也就是按照600MHz的頻率執(zhí)行高達(dá)115.2 FP16 GFLOPS及高達(dá)76.8 FP32 GFLOPS。

PowerVR GX6650: 六個Series6XT USC-192 FP32 ALU內(nèi)核,每個時鐘周期執(zhí)行高達(dá)384 FLOP –384FP16 ALU 內(nèi)核,每個時鐘周期執(zhí)行高達(dá)786 FLOP。也就是按照600MHz的頻率執(zhí)行高達(dá)460.8FP16 GFLOPS及高達(dá)230.4 FP32 GFLOPS。

這才是真正的內(nèi)核比較參數(shù)!

相關(guān)文章 14-04-11一加手機(jī)拍照樣張曝光 人大女神當(dāng)模特14-04-06紅米手機(jī)白色真機(jī)圖 白色款后蓋很漂亮哦14-04-05紅米手機(jī)有白色的嗎_紅米手機(jī)白色版視頻公布14-04-04日本11歲嫩模試車手機(jī)壁紙14-04-03諾基亞發(fā)布wp8.1旗艦手機(jī)Lumia 93014-04-01努比亞z5迷你手機(jī)介紹14-03-25同洲發(fā)布960e雙系統(tǒng)安全手機(jī) 960OS+Android 1888元

網(wǎng)友評論
發(fā)表評論

歡迎加入單機(jī)游戲QQ群:176097074

本類排行 小米3評測好不好_小米3怎么樣評價ios7有什么新功能介紹匯總魅族mx3好不好用評測小米3手機(jī)真實官方網(wǎng)圖片大全ipad天氣熱充不進(jìn)電為什么怎么辦v版無鎖iphone5美國無鎖版 iphone5無鎖版多少錢保衛(wèi)蘿卜1.06深海:巨鯨的領(lǐng)地AppStore 上架ios狂氣育成游戲之羊駝的進(jìn)化史三星Galaxy S4將秒殺iphone5 Galaxy S4什么時候出小米隨身wifi評測好用嗎_小米隨身wifi怎么用是什么

iphone游戲 保衛(wèi)菠蘿2iphone/ipad越獄版類型:策略游戲
大。43.8M
保衛(wèi)菠蘿2是一款超級超萌塔防游戲哦,和保衛(wèi)蘿卜滿滿的類似感,感興趣的來跑跑車蘋果網(wǎng)下載保衛(wèi)菠蘿2ios版ipa吧。
喵星2048iphone/ipad越獄版類型:休閑益智
大。17M
喵星2048是一款2048類型的數(shù)字游戲,把各種數(shù)字的賣萌喵星人組合起來相加吧,喜歡的來跑跑車蘋果網(wǎng)下載喵星2048ios版ipa吧。
line釣魚大師類型:休閑益智
大。54.1M
LINE MASS FISHING是一款line平臺的釣魚游戲,愛好釣魚的玩家肯定會喜歡的哦,跑跑車蘋果網(wǎng)下載LINE MASS FISHING ios版ipa吧。
釣魚大師第二季iphone/ipad破解版類型:休閑益智
大。47.4M
釣魚可是很有趣的事情哦,愛玩釣魚游戲的玩家來跑跑車下載釣魚大師ios破解版ipa吧。
開心消消樂iphone/ipad越獄版類型:休閑益智
大小:41.9M
開心消消樂是一款不錯的消除類休閑游戲,好玩的關(guān)卡超萌的動物很有趣哦,喜歡的來跑跑車蘋果網(wǎng)下載ios開心消消樂ipa吧。

iphone軟件 goodplayer iphone/ipad越獄版類型:iphone軟件
大。23.2M
GoodPlayer是一款不錯的ios視頻播放應(yīng)用,喜歡在iphone、ipad上看視頻的用戶必備哦,喜歡的來跑跑車蘋果網(wǎng)下載GoodPlayer ios版ipa吧。
易信iphone版類型:iphone軟件
大小:42.5M
易信是很不錯的聊天app,飛信和微信的優(yōu)點結(jié)合起來,跑跑車推薦易信iphone版ipa下載。
新浪微博hd版類型:iphone軟件
大小:49.2M
新浪微博iphone版類型:iphone軟件
大小:43.5M
經(jīng)常喜歡上新浪微博的iphone用戶一定需要新浪微博iphone客戶端哦,跑跑車蘋果網(wǎng)為你提供最的新浪微博iphone版ipa下載。
同步助手電腦版類型:iphone軟件
大。19.9M
同步助手pc版哦,同步助手是一款很好用的iPhone和ipad管理軟件,如果你有ios設(shè)備就來使用它吧,跑跑車提供同步助手電腦版安全無毒高速下載。