gpu處理股票數據_股市中的gpu是什麼

『壹』中電子旗下CPU+GPU概念股龍頭一覽

摘要景嘉微300474：龍頭股。景嘉微300474，GPU國產化龍頭

『貳』 GPU是什麼意思

GPU即圖形處理器，又稱顯示核心、視覺處理器、顯示晶元，是一種專門在個人電腦、工作站、游戲機和一些移動設備（如平板電腦、智能手機等）上進行圖像運算工作的微處理器。

『叄』 GPU概念股有哪些上市公司

GPU存在響應速度快、對能源需求低的優勢，可以平行處理大量瑣碎信息，並在高速狀態下分析海量數據，在AR/VR游戲、深度學習等領域，應用前景廣闊。
相關概念股：
景嘉微
通富微電
浪潮信息
中科曙光

『肆』股市中的gpu是什麼

GPU概念股（相關個股）
景嘉微：公司在圖形顯控領域擁有圖形顯控模塊，圖形處理晶元，加固顯示器，加固電子盤和加固計算機等五類產品，其中圖形顯控模塊是公司最為核心的產品。
通富微電：通富微電具備較強的GPU封裝技術，擁有幾十個系列、五百多個品種產品，主要封裝產品包括SOP/SOT/TSSOP、QFP/LQFP、MCM（MCP）、QFN/PDFN、BGA、SiP、Wafer Bumping、WLCSP、FC等系列產品，並提供微處理器、數字電路、模擬電路、數模混合電路、射頻電路的FT測試及PT圓片測試服務。公司在中高端封裝技術方面佔有領先優勢，公司是國內第一家將BUMP技術應用於CPU、GPU等領域的上市公司，也是國內第一家將BGA產品應用於汽車電子產品領域的企業。
北京君正：北京君正公告宣布更新一項授權協議，其中包括性能更高的Vivante GPU內核，從而為公司新一代應用處理器提供支持。Vivante 的圖形內核憑借為消費娛樂專門創建的先進GPU架構可提供非凡流暢的用戶體驗。
中科曙光：與NVIDIA合作深度學習平台。具有業界最完整的高性能計算機產品線，擁有支持TC3600/TC4600集群架構和GPU異構雲計算技術的曙光星雲、TC2600集群架構的曙光5000系列、支持GPU異構計算技術的GHPC1000、個人高性能計算機、刀片伺服器等。

『伍』同花順的漲停聚焦功能在電腦上顯示嗎

同花順的漲停聚焦功能是手機APP上面顯示的。

如下圖，進入方式為打開同花順APP，點擊數據中心，點擊漲停聚焦即可進入。該功能主要用來分析市場熱點，幫助快速了解市場動態變化。

『陸』 GPU概念股有哪些

GPU概念一共有6家上市公司，其中1家GPU概念上市公司在上證交易所交易，另外5家GPU概念上市公司在深交所交易。

根據雲財經龍頭挖掘機 自動匹配，GPU概念股的龍頭股最有可能從以下幾個股票中誕生。

『柒』 GPU在高性能計算方面具有怎樣的優勢

基於GPU的通用計算已成為近幾年人們關注的一個研究熱點。將GPU用於通用計算的主要目的是為了加速計算，加速的動力來自GPU在高性能計算方面所具有的優勢：

（1）高效的並行性。

這一功能主要是通過GPU多條繪制流水線的並行計算來體現的。在目前主流的GPU中，多條流水線可以在單一控制部件的集中控制下運行，也可以獨立運行。GPU的頂點處理流水線使用MIMD方式控制，片段處理流水線使用SIMD結構。相對於並行機而言，GPU提供的並行性在十分廉價的基礎上，為很多適合於在GPU上進行處理的應用提供了一個很好的並行方案。

（2）高密集的運算。

GPU通常具有128位或256位的內存位寬，因此GPU在計算密集型應用方面具有很好的性能。

（3）超長圖形流水線。

GPU超長圖形流水線的設計以吞吐量的最大化為目標，因此GPU作為數據流並行處理機，在對大規模的數據流並行處理方面具有明顯的優勢。

如下圖所示，CPU中的大部分晶體管主要用於構建控制電路（如分支預測等）和Cache，只有少部分的晶體管來完成實際的運算工作。GPU與CPU的設計目標不同，其控制電路相對簡單，而且對Cache的需求較小，所以大部分晶體管可以組成各類專用電路和多條流水線，使GPU的計算速度有了突破性的飛躍，擁有驚人的處理浮點運算的能力。

圖：GPU與CPU內部結構比較

正是由於GPU在並行處理和計算密集型問題求解等方面所具有的諸多優勢，GPU已成為目前普通PC機所擁有的強大、高效的計算資源。從系統架構上看，GPU是針對向量計算進行了優化的高度並行的數據流處理機。這種以數據流作為處理單元的處理機，在對數據流的處理上可以獲得很高的效率。

來源：https://blog.csdn.net/m2mgroup/article/details/3352736

『捌』圖形處理器的GPU在數據中心中的重要作用

GPU在商用應用程序上的部署究竟能帶來多少性能提升，這是很多人關心的問題，也許只是個昂貴的噱頭，也許會變成數據處理的一個重要組成部分。
GPU大概從2003年開始，我們開始使用GPU來獨立處理電腦3D游戲的數據，或者其他對圖形要求比較高的程序。
GPU逐漸進入了我們視線，包括我們的家用電腦，筆記本，GPU都開始發揮它的作用。但現在，在數據中心的伺服器上，你都可以發現GPU的身影了。 GPU是否也可用通過這種遠程協作的方式使用？如虛擬化GPU。隨著虛擬化技術的發展，已經可以把GPU應用在虛擬機里使用，這樣可以讓GPU代替許多CPU的工作。
GPU的核心數量非常多，這和CPU有本質的區別，一般GPU都內置了數百個內核，甚至上千個，GPU的工作原理就是並行計算，在並行處理特定數據的時候，GPU比CPU高效非常多。但在復雜指令計算方面，GPU遠遠不及CPU，所以GPU和CPU是一種互補的關系，而不是互相代替的關系。
一些適合GPU計算的地方就利用GPU並行計算的優勢去部署，而不是單單考慮提升CPU的性能。高性能的GPU處理器不是普通的計算處理過程。GPU是用利用高度序列化的處理模式和CPU配合使用，並不是使用高性能GPU就可以搭配低性能的CPU。由於它們的工作側重點不同，是一種並行處理的方式，所以不能因為GPU的並行處理能力很強就忽略了CPU的重要性。
GPU部署在數據中心比部署在現場好，科學家在現場只需要將探測的數據交回數據中心處理，之後再接收傳回的GPU處理完的數據。這也就是數據中心為什麼越來越多的部署GPU進行數據處理的原因。

『玖』 GPU的計算處理包括哪些

首先，你確定你問的是GPU而不是CPU？！
GPU的計算，應該說，絕大多數不是用VC++做的，而是用C做的。現在，Nvidia最新版的CUDA支持VC++了，但是只在Fermi核心的GPU——Geforce GTX 400系列家用顯卡、Fermi核心的Tesla上有支持VC++的CUDA。
GPU和CPU不同，CPU內部可以實現並行處理，而GPU內部只能實現並行計算，負責輸出一系列數據。但是，GPU內部的統一渲染管線結構，決定了GPU計算的並發線程遠遠大於CPU。一顆I7 980X的並行計算線程和處理線程都是12條，而GT 200系列核心雖然沒有並行處理能力，但是並行計算能力在30000線程以上。這個就是GPU通用計算的力量。
GPU通用計算領域，Nvidia居於獨孤求敗的地位。而ATI由於自身的GPU設計，以及市場定位的原因，通用計算做得不如Nvidia。現在的Nvidia大力發展GPGPU，但GPU通用計算的應用還處於起步階段，國內接觸CUDA編程的人也不多。你可以上Nvidia的官網看看，有不少的介紹。

『拾』 GPU和CPU之間是如何協調數據處理的

因為設計的目標不同，當今的CPU和GPU功能上有本質的不同。作為通用處理器的CPU，顧名思義，它是設計用來處理通用任務的處理、加工、運算以及系統核心控制等等的。CPU中包含的最基本部件有算術邏輯單元和控制單元，CPU的微架構是為高效率處理數據相關性不大的計算類、復雜繁瑣的非計算類的等等百花八門的工作而優化的，在處理日常繁復的任務中應付自如。

計算機的「靈魂」——操作系統，以及幾乎100%的系統軟體都主要仰仗CPU來順利運行。CPU面對的算術、邏輯運算以及控制處理是非常繁瑣和復雜的，面對處理的數據和信息量不僅數量多而是種類多。CPU運算和控制多面手的這種設計，讓它在計算機中得心應手，位置不可動搖。

GPU設計的宗旨是實現圖形加速，現在最主要的是實現3D 圖形加速，因此它的設計基本上是為3D圖形加速的相關運算來優化的，如z-buffering 消隱，紋理映射(texture mapping)，圖形的坐標位置變換與光照計算(transforming & lighting)等等。這類計算的對象都是針對大量平行數據的，運算的數據量大，但是運算的類型卻並不復雜，大多類似和雷同，計算性強但是邏輯性不強，如矩陣運算就是圖形運算的典型特性。

如今的游戲，單單從圖象的生成來說大概需要下面四個步驟：

1、Homogeneous coordinates（齊次坐標）
2、Shading models（陰影建模）
3、Z-Buffering（Z-緩沖）
4、Texture-Mapping（材質貼圖）
在這些步驟中，顯示部分（GPU）只負責完成第三、四步，而前兩個步驟主要是依靠 CPU 來完成。而且，這還僅僅只是3D圖象的生成，還沒有包括游戲中復雜的AI運算。場景切換運算等等……無疑，這些元素還需要CPU去完成，這就是為什麼在運行《魔獸世界》的時候，當場景切換時再強勁的顯卡都會出現停頓的現象。
對於需要CPU進行大量AI運算的游戲來說，在固定的顯示解析度下，CPU的架構越強、主頻越高的確有一定的優勢。著名的FPS第一人稱設計游戲——CSS，就是一個很好的例子。當你開啟了30個左右的機器人，在大混戰的時候就很容易體現出高端CPU與入門級CPU之間的區別了。
打造一套完整的游戲 PC 系統，CPU和顯卡的搭配應該相得益彰，高成低就或低成高就都是不平衡的組合方式。

第一代 GPU 首先，CPU將數據傳遞給GPU進行處理，數據先進入T&L單元中的Transform Engine，在這里，數據將以頂點的形式接受視野范圍的判斷，當處理單元判斷某部分頂點處於觀察者的視線范圍以外時，Transform Engine將把這部分頂點「剪除」以使其不會干擾後續的流水線操作, 具個簡單的例子：當你在某FPS游戲中突然打開狙擊槍的狙擊鏡，視野變成了一個圓形的空洞，而其他部分則為黑色，這時 Transform Engine將去除這個圓形視野范圍以外的所有頂點，不過，這里進行的只是視野范圍的判斷，Transform Engine去除在你的視線范圍內但是被其它東西擋住了的物體，另外，每一個三角形可能被旋轉，放大/縮小，上升，下降，左偏，右移等。這就是多邊形轉換轉換。 Transform Engine根據你的視角，改變了由程序提供的組成3D物體的頂點的坐標。經過Lighting Engine處理後的圖象經過判斷處理後的數據將流入T&L單元中的Lighting Engine，根據光源的類型，距離，角度，數目，應用方式等不同參數，每一個多邊形都會有不同的光影表現和光影關系，因而需要不同的光線函數予以表徵，在Lighting Engine中，處理單元將根據軟體提出的光源分布情況為每個頂點計算出它所具有的光線矢量，以便後續進行的光線紋理貼圖，著色等操作
經過Lighting Engine處理的畫面
其實，經由T&L單元處理過的數據還只是抽象的數據，並不是具體的圖形，上面兩副圖僅僅是方便讀者進行想像的示意圖。
接下來數據將流入Setup Engine，在這里，運算單元將進行三角形的設置工作，這是整個繪圖過程中最重要的一個步驟，Setup Engine甚至直接影響著一塊GPU的執行效能。三角形的設置過程是由一個一個的多邊形組成的，或者是用更好的三角形代替原來的三角形。在三維圖像中可能會有些三角形被它前面的三角形擋住，但是在這個階段3D晶元還不知道哪些三角形會被擋住。所以三角形建立單元接收到的是一個個由三個頂點組成的完整三角形。三角形的每個角（或頂點）都有對應的X軸、Y軸和Z軸坐標值，這些坐標值確定了它們在3D景物中的位置。同時，三角形的設置也確定了像素填充的范圍
經過Setup Engine處理的畫面
最終著色完畢的畫面
在三角形設置完畢後，T&L單元的全部運算就完成了。接下來數據將進入NV15獨有的NSR像素處理單元進行一定的像素處理，接著流入像素流水線進行後續的紋理像素填充等操作，這部分操作在DriectX7.0中的變化並不明顯，基本的渲染填充過程與過去的顯卡幾無二異
T&L雖然再一定程度上緩解了CPU運算能力的不濟所帶來的瓶頸，使得系統在圖形方面的資源得到了再分配和增強，但同時，T&L也將新的矛盾轉到了GPU上
T&L是一組相對固定的簡單的圖形函數，所實現的特效受到了函數本身語句的限制，雖然這種固定的指令集設計可以帶來比較高的執行效率，但這種設置使得DX7下所能實現的特效受到了指令集的約束，許多逼真的特效無法實現，程序員的思想也被限定在一個相對狹窄的范圍內。
2、我要看到你飄逸的秀發和迷人的微笑—可編程Shader以及第二代GPU
DriectX8.0在傳統T&L的基礎上加入了兩個新的概念—可編程的Vertex Shader和Piexl Shader，同樣的，第二代 GPU的標志就是硬體級別的可編程Shader運算，代表產品為NV2X（Geforce3/4Ti），R2XX（Radeon8500）等
可編程Shader的復雜程度遠非T&L可比，為了方便大家理解第二代GPU的特點，我們先來認識一下什麼是可編程Shader，以及可編程Shader運算單元
可編程Vertex Shader及頂點處理器：
可編程Vertex Shader讓程序員能夠對特定物體，甚至整個畫面的每一個頂點，指定特別的運算程序，卻不需要CPU介入。每一個頂點都攜帶相當多的信息，比如坐標，重量，法線，顏色，紋理坐標，霧和點大小數據。頂點處理器能夠以簡短的程序來改變上述這些信息。這些小程序直接由頂點著色引擎本身執行，不必勞駕CPU。典型的T&L引擎將程序員限制在3D運算的光影轉換之前，在有了頂點處理器的支持之後，游戲設計師對游戲場景里的3D物體能夠為所欲為的操縱變化，而且不需要用到中央處理器。
這導致了一場革新，程序可以改變頂點的坐標，這樣基本上改變物體的形狀，以達到更接近真實的移動、移動殘影、混色、內插（在兩種外型間轉換），以及變形，比如改變角色臉部的骨骼和皮膚一個產生一個適時的微笑。也可改變頂點上的顏色數據和紋理坐標，物體表面的顏色達到設計師所想要的色彩效果、投影、凹凸貼圖設置（如Blinn Bump mapping）或者其它投射的紋理。光源也可以為程序員隨心所欲的調整，不再像過去那樣需要對光源的效果進行笨拙的光線紋理貼圖，而這些在以前是不可想像的。這一切都歸功於可編程Vertex Shader和頂點處理器的出現
Blinn Bump mapping
可編程Piexl Shader以及像素處理器
在NV15中，nVidia曾經嘗試加入一個叫NSR的像素處理單元，它可以在數據進入像素流水線之前對每個像素進行一系列運算操作，雖然同為每像素操作，但NSR與Piexl Shader可不能同日而語， NSR對於像素的運算只有7種，同T&L一樣，它依然是固定模式的，程序員依然要依照規定好的條條框框寫出程序，而Piexl Shader則不同，我們可以用許多不同方式去編程，以實現不同的特效，下面就是一般的像素處理器所具備的特性：
· 陰影貼圖
· 快速紋理載入
· 影像乘法，對稱核心
· 支持4096x4096或512x512x512 紋理
· 立方體貼圖每邊可4096x4096x32-位
· 支持YUYV的紋理（自動轉換成RGB三原色）
· 支持全景貼圖
可以指向任何一個圖像，如背景緩沖區（back buffer），而可直接當作紋理使用
· 邊緣色彩及邊緣紋理
· 硬體同步化讀/寫
對同一張紋理的讀及寫允許全流水線操作。
可以對背景緩沖區著色，然後馬上能當作紋理使用
· Pass through colors
· 支持DX6規格的環境凹凸/亮度貼圖（就是環境凹凸貼圖）
· 簡單的紋理，S,T 在alpha/紅(AB)及藍/綠 (BG)
· 等向的雙方向性反射分布功能光源
· 內積產生色彩貼圖或Z坐標
· 真實反射凹凸貼圖
這看起來似乎有點抽象，簡單的說，可編程Piexl Shader實現了一個非常重要的特效—真實的毛發
古老街道上昏暗燈光中的狼人
在3D渲染中，渲染真實的毛發一直是一件非常困難的事情，大量的多邊形給多邊形生成帶來了嚴峻的考驗，而每一根毛發之間復雜多變的即時光影關系更不是幾個簡單固定的指令所能實現的。Piexl Shader的可編程性和運算能力很好的解決了這個問題
好啦，現在讓我們來看看第二代GPU是如何完整處理一個畫面的吧
首先，來自CPU的各種物理參數進入GPU，Vertex Shader將對頂點數據進行基本的判斷，如果沒有需要處理的Vertex效果，則頂點數據直接進入Transform&Lighting Unit進行傳統的T&L操作以節約時間提高效率，如果需要處理各種Vertex效果，則 Vertex Shader將先對各種Vertex Programs的指令進行運算，一般的Vertex Programs中往往包含了過去轉換，剪切，光照運算等所需要實現的效果，故經由Vertex Shader處理的效果一般不需要再進行Transform&Lighting操作；另外，當遇到涉及到曲面鑲嵌（把曲面，比如弓形轉換成為多邊形或者三角形）的場合時，CPU可以直接將數據交給Vertex Shader進行處理
另外，在DX8.0的Transform過程中，Vertex Shader可以完成Z值的剔除，也就是Back Face Culling—陰面隱去，這就意味著除了視野以外的頂點外，視野內被前面頂點遮住的頂點也會被一並剪除，這大大減輕了需要進行操作的頂點數目
接下來，經由Vertex Shader處理完成的各種數據將流入Setup Engine，在這里一如既往的進行三角形的設置工作，到這里為止，Vertex Shader的工作就完成了
過去，設置好的三角形本來應該帶著各自所有的參數進入像素流水線內進行紋理填充和渲染，但現在則不同，在填充之前我們還需要進行Piexl Shader的操作
其實Piexl Shader並非獨立存在的，它位於紋理填充單元之後，數據流入像素流水線後先進入紋理填充單元進行紋理填充，然後便是 Piexl Shader單元，經由Piexl Shader單元進行各種處理運算之後再進入像素填充單元進行具體的著色，再經由霧化等操作後，一個完整的畫面就算完成了
值得注意的是，第二代GPU中普遍引入了獨立的顯示數據管理機制，他們位於Vertex Shader，Setup Engine以及像素流水線之間，負責數據的更有效率的傳輸、組合，各種無效值的剔除，數據的壓縮以及寄存器的管理等工作，這個單元的出現對整個GPU的工作效率的保證其到了至管重要的作用。
HyperZ系列：HyperZ技術本身就是一種類似nVIDIA的「Z-封閉甄別」的技術，但是比nVIDIA還更進一步。它的主要功能簡單說來就是分析在Z軸上的場景，被遮擋的就會被忽略掉，只渲染我們能看到的部分場景；然後對渲染過的Z軸場景進行壓縮處理，數據的壓縮可減少他所佔用的空間，從而在存取Z-Buffer數據的時候可以保留更多的顯存帶寬。而且這是一種畫面質量沒有損害的壓縮演算法，並不影響畫面質量。最後一步就是把經過渲染的場景中的Z -Buffer信息立刻清除掉，這樣就更加大了顯存帶寬的利用率。
LMA（光速顯存架構）系列：光速顯存架構採用的第一個技術是「顯存交錯控制」技術， LMA中的顯存控制器劃分成了4個獨立的顯存控制單元，每個單元最大可以進行32bit圖形相關數據的存取工作，並且這4個單元之間以及它們和圖形處理單元之間都保持密切的通訊聯系，並隨時協調平衡各個子單元之間的數據流量，因此整體來看LMA的顯存控制單元還是可以進行128bit數據的存儲，但是保證了顯存帶寬的充分利用。光速顯存架構採用的第二個技術是「無損Z壓縮演算法」。傳統的圖形晶元對於每個待渲染的圖形象素都要進行Z軸數據的讀寫工作，因此存儲這些數據的Z緩存一向是消耗顯存帶寬的大戶。LMA中集成了硬體「無損Z壓縮」單元，採用「無損Z壓縮演算法」對Z－緩存數據進行4:1的完全無損壓縮。光速顯存架構採用的第三個技術是「Z-封閉甄別」。排除了圖象中被遮蓋住而不可見的部分，這樣GPU就不做隱面模型構建(節省處理器的多邊形運算資源),並且渲染管線也不對隱面進行渲染(無需從幀緩存中讀寫隱面資料數據,節省渲染管線的象素和紋理生成資源並完全消滅了隱面資料對顯存帶寬的佔用)。最後，LMA還包括了4組高速Cache，對數據傳輸進行緩沖。
3、夢中的鏡花水月—可編程Shader2.0以及第三代GPU
當你第一次看到3Dmark03中的MotherNature時，你有沒有感覺到震撼？
更加寬泛的色彩范圍能夠使得圖形的逼真度上升，這就是Shader2.0的由來，Shader2.0的核心實際上就是以擴大指令數目以及FLOAT數據形式的應用來提高色彩表達的精確度，而第三代GPU的Shader單元也由此而具備了高精度FLOAT色彩數據的運算能力。從一般角度來講，第三代GPU同第二代GPU相比在基本的操作控制形式等方面並沒有本質的區別，但是由於Shader2.0更大的指令長度和指令個數，以及通用程序+子程序調用的程序形式等使得第三代GPU在處理高精度的龐大指令時效率上有了明顯的提升，同時也使得第三代GPU的可編程性躍上了一個新的台階
讓我們來看看第三代GPU到底有哪些改進吧
Vexter Shader部分
第三代GPU的頂點處理器部分除了一般的操作功能外還具備流程式控制制能力，包括循環，跳躍以及子程序調用等，這些控制指令以及更多向量（或標量）寄存器的應用使得頂點處理器能夠以更高的效率執行Vertex Programs，提高了Vertex的處理速度。同時，加大的指令長度和指令數量使得頂點處理器的功能得到了進一步的強化。另外，在第三代GPU中，傳統的T&L數據將完全交由頂點處理器來執行，Transform& Lighting Unit將徹底被頂點處理器「吞並」，這也是第三代GPU的一個重要特點
Piexl Shader部分
第二代GPU的Piexl Shader只能實現INT數據的運算，這勢必會帶來最終運算結果的不精確，而數據的不精確導致了顏色表現的不準確，干擾了最終畫面的質量以及效果的表現，第三代GPU的重點改進就是運算單元和寄存器所支持的運算格式，現在Piexl Shader可以進行更高精度的FLOAT 運算和輸出，從而使得圖形的色彩顯示更加精確
暴光正確的圖象
數據精度不當而無法實現的特種暴光
另外，第三代GPU的像素處理器每周期所能處理的材質以及指令也分別增加了數倍，這些新特性使得第三代GPU可以處理各種復雜程度的效果，營造一個更為真實的3D畫面，比如更加真實的水面效果
INT Piexl Shader所表現的水面效果
FLOAT Piexl Shader所表現的水面效果
傳統的INT無法表現寬泛的波浪效果，程序員害怕數據精度范圍狹窄引起的上溢或者下溢的發生而不得不在一個很小的物理參數范圍內控制漣漪水面所需的波長、波浪的大小、移動速度以及反射和折射效果等，現在，由於數據精度的提升，像素處理器完全可以處理一個非常寬泛的數據精度范圍，避免數據的溢出，這就使得更加真實的水面效果得以被表現。第三代GPU的代表是NV3X系列，R3XX系列等，其中R3XX系列的基本處理方式和順序與第二代GPU在本質上基本相同，僅僅是Vertex Shader和Piexl Shader的具體操作細節和運算精度上有些許不同，而NV3X雖然在基本原理上也與之大略相同，但從流水線的角度來看則與完全不同，應該算是個「異類」。產生過程，只分析一下NV3X
以NV35為例：
首先，他具有8個紋理帖圖單元，但8個紋理貼圖單元並不在固定分布於每一條Piexl流水線，而是集簇在一起，根據情況來搭配，可以是4*2、8*1。
其次，他具有12條Shader流水線，但沒有全盤採用浮點渲染流水線，而只是把12條Shader流水線中的8條做成具備浮點處理能力;不過全部12條Shader流水線都具備Fixed-Point Shader的執行能力。
另外，NV3X將流水線後部的各種渲染單元，如霧化，Alpha混合等大幅削減，使得流水線在一定程度上公用這些單元
NV30的構架組成形式基本上與之相當，只是數目上略有不同
由於這個構架並不是傳統意義上的4*2或者8*1的固定構架，我們不能象過去那樣說NV35「每個流水線具有2個紋理帖圖單元」或者「每條管線具有3個Shader流水線」……我們只能說「NV35單位周期可以完成8次左右的紋理貼圖或者12次Shader操作」
另外，由於NV3X對於Fixed-Point Shader的支持精度是FP16和FP32，同時NV3X的Shader流水線的單位Fixed- Point Shader處理精度是16位，所以當遇到32位Fixed-Point Shader數據時，能進行Fixed-Point Shader 數據處理的8條Shader流水線也會根據情況進行搭配來運算32位的Fixed-Point Shader數據
Pixel Programs往往是由多條指令構成的，不同的指令需要不同的執行時間來完成，每個像素必須在應用在它「身上」的Pixel Shader 操作完成後才能由像素流水線寫入到幀緩存里。故此，對於應用了Piexl Shader的像素實際上是需要多個以上的周期才能寫入到幀緩存里，如果採用8 條完整的渲染流水線的話，流水線後面的霧化、色彩混合等單元很多時候都會處在等待階段，這部分單元需要佔用的晶體管數量不在少數，如果這樣浪費就怪可惜的，砍掉後其中的霧化等單元後，對整體的性能雖然有一些影響，但是卻可以把節省下來的晶體管用於加強Pixel Shader的功能和性能上來，同時可以保證比較高的多重紋理效率，利大於弊。
簡單的，這個有點詭異的體系節省晶體管的同時能確保相對較好的Pixel Shader效能，同時還有極高的多重貼圖效能
nVidia本指望4條Pixel管線+ 12條Shader流水線的設計能夠在現在以及未來較長的一段時間的游戲里提供超過4條甚至8條 Pixel Pipeline顯卡的效能。不過，實際情況卻與nVidia的初衷有些背道而馳，Shader的完美應用帶來的一個結果就是越來越好的非多紋理光效果，傳統的多紋理貼圖才能表現的很好的光效果現在只需要進行一次貼圖或者直接使用Shader就可以達到，這使得NV3X的設計成為了空架子，實用意義大大降低，而在單紋理處理過程中由於NV3X的後續效果單元被削減，它的渲染效能註定沒有傳統的完整流水線高，另外，由於DX9中的最終FP精度被定義為FP24，這導致了NV3X的相對低下的FP效能。最終，本來「先進」的NV3X構架落的個整體效能低下的下場
從本質上來講，圖形數據在NV3X中的實際處理過程依然是沿著頂點處理器—Setup Engine—像素流水線的順序進行的，這與R3XX以及所有的第二代GPU是相同的
天堂的入口—可編程Shader3.0，DriectX Next以及未來的GPU
在微軟剛剛公布的Driect9.0C中，Vertex Shader和Piexl Shader已經具有了幾乎相同的能力，而在nVidia新發布的第四代GPU—NV40中，我們發現Vertex Shader包含了4個紋理取樣器，可以使用texld指令進行查表操作， NV40可以在一個 shader pass里完成4個紋理的讀取，這個對於通用替換貼圖而言相當的重要，有了vertex texturing功能後， vertex shader就能讀取紋理信息直接映射到頂點上，以實現displacement mapping（位移映射）等等效果，用不同的紋理和較少的頂點傳輸時間就能實現外形復雜、平滑的模型，這表明GPU中Vertex Shader的功能正在逐漸接近Piexl Shader。隨著GPU的發展，未來GPU中的Vertex Shader和Piexl Shader最終將被合並成一個統一的處理單元—Intergrated Shader，兩種處理單元將使用完全相同的語法以及指令集，Shader的統一將帶來完全不同與現在的數據執行處理方式，GPU的內部結構將發生本質的變化， Intergrated Shader帶來了更低晶體管數目的解決方案，以更少的晶體管數目來完成現在需要數億晶體管才能完成的功能，同時統一 Shader將引出類似全通用I/O介面的設計以利資源的更合理的傳輸和分配，同時，為了解決越來越龐大的數據量，虛擬顯存、無限資源訪問以及幀緩沖操作等技術的引入也勢在必行。另外，我們在DirectX Next中還發現了整數指令集，處理器等特殊的定義，這些新穎的設計為我們勾勒出了未來GPU的輪廓
整數指令集
在編程中不必在擔心指令限制是一個很大的進步，不過想使得GPU更為通用還需要更多的工作。一個需要提高的主要區域就是整數處理能力。目前基於在著色器中處理的所有數據都是浮點，這對於大多數顯卡操作而言是沒有問題的，不過不適合動態分支預測、非內插式顯存搜索（如頂點緩沖的索引）等操作。在目前的GPU 中，唯一的內存定址就是紋理查找，使用的也是浮點值。這樣的情況對於紋理定位而言沒有什麼問題，不過對於通用內存定址而言就不合適了，這里的連續內存塊可以完全彼此沒有關聯，採用內插式查找沒有任何意義。微軟對於這樣的情況，在4.0版的Shader模型中引入了全新的、完整的整數指令集。拓撲處理器實際上，目前的顯卡可以在某些情況下新生成三角形，比如在用到直線以及點的時候。大多數的娛樂級顯卡只具備對三角形進行光柵化處理的能力，這也就意味著所有的點、線就必須轉化為三角形。點和線在最後都將以2個三角形結束，這樣就需要用到2-6個頂點（根據索引方式的不同而變化）。從本質上來說，這樣的做法是有益處的，通過可編程的管線，顯示先前應該遮蔽的場景也就無需通過CPU，而可以通過微軟的「拓撲處理器」直接完成。從邏輯上來說，這個拓撲處理器和鑲嵌單元是相互獨立的，這個處理器在兩種操作集中均可以使用。由目前的趨勢來看，未來的GPU將向著高運算能力，高精度，高通用性的方向發展，GPU在工作方式上將越來越接近CPU，由於高通用性等CPU特性的引入，GPU可能在一定程度上替代一部分CPU在非繪圖領域的工作，也許在未來我們會看到由全GPU組成的圖形工作站。盡管未來GPU需要面對由於這些改進而帶來得的諸多問題，尤其是通用性導致的效率低下，比如Intergrated Shader的效率低下，但隨著時間的推移，各種問題都將會得到妥善的解決。

導航:首頁 > 數據行情 > gpu處理股票數據

gpu處理股票數據

與gpu處理股票數據相關的資料