流處理器單元是統一架構GPU內通用標量著色器的稱謂。流處理單元直接影響處理能力,因為流處理單元是顯卡的核心。流處理單元個數越多則處理能力越強,一般成正比關系,但這僅限于NVIDIA自家的核心或者AMD自家的核心比較范疇。NVIDIA和AMD的流處理單元比較不可采取近似比較,實際上AMD的應該叫流處理器單元,它每5個單元配一個數據收發的,這才是一個完整的流處理器,這樣算一個流處理器。而NVIDIA的1個流處理單元卻只有1個單元。這是A卡與N卡的構造區別。形象點說,這個流處理單元相當于神經元,神經元越多大腦越發達,流處理單元越多顯卡處理性能也就越強。
流處理器數量有哪些分類?
在進入統一渲染架構時代后,提高Shader運行頻率與效率是NVIDIA主導的設計思路,而AMD則維持龐大的流處理器數量。兩種思路各有優劣。
1、N的優勢和A的劣勢
N卡的GPU中每個流處理器都具有完整的ALU(算術邏輯單元)功能,在發出一條操作指令時每個流處理器都能充分工作。而A卡的GPU中每個流處理器的5個流處理單元都是固定的,不能拆開重組,如果在處理純4D指令的時候,每個流處理器只能處理一條4D指令,有一個流處理器單元閑置,但卻無法加入其他組合來共同工作。簡單地說,一個指令任務派發下來的時候,N卡的GPU是需要1個“人”獨立工作即可完成。而A卡的GPU則需要5個“人”。結組工作才能完成ATI的人數雖然多,但這5個“人”中有可能會有4個“人”閑置,因為這4個“人”不具有獨立完整的ALU功能,不能執行函數運算,浮點運算和Multipy運算。
2、N的劣勢和A的優勢
ATI的設計也有其顯著的特點——浮點運算能力強大。也就是說如果單純比拼顯示核心在浮點運算上的能力的話,可能ATI則要強一些,在GPGPU(通用圖形處理器)項目應用比較多的科學計算方面,理論上能適應GPU和CPU融合的趨勢。
3、結論
開篇提到的,因為N卡的一個流處理器等于五個A卡的流處理單元,也即HD5970的3200個流處理單元相當于640(3200/5)個流處理器。