顶点着色单元


请输入要查询的词条内容:

顶点着色单元


顶点着色单元是显示芯片内部用来处理顶点(Vertex)信息并完成着色工作的并行处理单元。顶点着色单元决定了显卡的三角形处理和生成能力,所以也是衡量显示芯片性能特别是3D性能的重要参数。



简介


顶点(Vertex)是图形学中的最基本元素,在三维空间中,每个顶点都拥有自己的坐标和颜色值等参数,三个顶点可以构成成一个三角形,而显卡所最终生成的立体画面则是由数量繁多的三角形构成的,而三角形数量的多少就决定了画面质量的高低,画面越真实越精美,就越需要数量更多的三角形来构成。顶点着色单元就是处理着些信息然后再送给像素渲染单元完成最后的贴图工作,最后再输出到显示器就成为我们所看到的3D画面。而显卡的顶点处理能力不足,就会导致要么降低画质,要么降低速度。

在相同的显示核心下,顶点着色单元的数量就决定了显卡的性能高低,数量越多也就意味着性能越高,例如具有6个顶点着色单元的GeForce 6800GT就要比只具有5个顶点着色单元的GeForce 6800性能高:但在不同的显示核心架构下顶点着色单元的数量多则并不一定就意味着性能越高,这还要取决于顶点着色单元的效率以及显卡的其它参数,例如具有4个顶点着色单元的Radeon 9800Pro其性能还不如只具有3个顶点着色单元的GeForce 6600GT

与渲染管线的区别


渲染管线也称为渲染流水线,是显示芯片内部处理图形信号相互独立的的并行处理单元渲染管线的数量一般是以 像素渲染流水线的数量×每管线的纹理单元数量 来表示渲染管线的数量是决定显示芯片性能和档次的最重要的参数之一,在相同的显卡核心频率下,更多的渲染管线也就意味着更大的像素填充率和纹理填充率。

顶点着色单元是显示芯片内部用来处理顶点(Vertex)信息并完成着色工作的并行处理单元。顶点着色单元决定了显卡的三角形处理和生成能力,所以也是衡量显示芯片性能特别是3D性能的重要参数

在相同的显示核心下,顶点着色单元的数量就决定了显卡的性能高低,数量越多也就意味着性能越高,顶点着色单元就是处理着些信息然后再送给像素渲染单元完成最后的贴图工作,最后再输出到显示器就成为我们所看到的3D画面。而显卡的顶点处理能力不足,就会导致要么降低画质,要么降低速度

应用


ATi R520

R520,Radeon X1800将内建8个顶点着色单元。ATi上一代产品集成6个顶点着色单元,但是顶点数据从来不是整体性能的瓶颈。目前唯一受制于顶点着色的游戏是3DMARK05,其它所有游戏都受制于显示卡的像素着色性能。

已经说过多次,R520内建16条像素着色流水线,ATi喜欢称作是16条像素着色处理器。

R520可以处理16个纹理,因为它有16个纹理单元。在1个时钟周期内,可以渲染16个Render Back ends。

R520可以比较16个Z比较单元,在优化Z信息方面非常有用处。

R520是1个非常有可编程性的芯片,你可以在这个GPU上处理多达512个线程,这意味着,2个R520协同可以同时处理1024线程。Intel和ATi相信,这样的线程编程性将给双R520用户更多的性能提升。

Geforce FX

Geforce FX图形芯片支持AGP8x,系统处理器的顶点数据都是通过显示卡的AGP总线传输到图形芯片,进行渲染的过程,因此理论上来说,AGP总线的带宽越大,通过的顶点数据量也就越多,进而加速图形芯片的渲染过程。但是在实际应用当中,目前还没有任何程序可以让AGP总线的数据传输处于满负荷状态,相对于AGP4x来说,目前AGP8x对图形芯片效能提升还无法做出什么贡献来,nVIDIA宣称向GPU传输多股HDTV数据流可以让2.1GB/s的AGP8x总线处于满负荷的状态。

为了满足微软DirectX 9.0对3D图形芯片的要求,nVIDIA重新设计了Geforce FX内核顶点着色引擎电路。nVIDIA之前的Geforce4 Ti内核集成了2个顶点着色单元,这次的Geforce FX图形芯片内核集成单顶点着色管线,由多个浮点处理器组成的巨型并行列队组成。nVIDIA的这种设计类似于3DLabs P10图形芯片采用的顶点着色架构,不过目前还不清楚Geforce FX内核单顶点着色管线由多少独立的处理单元并行工作。

这些并行的浮点顶点处理单元具备专用的多线程指令集,并且nVIDIA对这些指令集进行了优化,最大限度地提升了图形芯片的三角形吞吐量。nVIDIA宣称Geforce FX的三角形生成速率达到了每秒3亿7千5百万个,稍微超过ATi Radeon 9700 Pro的三角形生成速率。不过,Geforce FX图形芯片的工作频率也要比Radeon 9700 Pro高出很多。

借助Geforce FX内核集成的这种顶点着色架构,nVIDIA宣布Geforce FX支持DirectX 9.0当中2.0版本的顶点着色技术规范。实际上Geforce FX图形芯片在许多方面已经超越了DirectX 9.0 2.0版本的顶点着色技术规范。Geforce FX图形芯片能够以比2.0版本VS更多的指令、更多的常数、更多的循环来处理顶点着色程序,在这方面,Geforce FX要强过ATi的Radeon 9700 Pro图形芯片,Radeon 9700 Pro图形芯片只支持到2.0版本的顶点着色技术规范。Geforce FX芯片在硬件层面上也集成了更多的寄存器,来支持超越2.0版本的顶点着色功能。

显然,Geforce FX已经支持到了DirectX 9.0 2.0版本的顶点着色技术规范制定的所有标准。不过未来一年当中的游戏可能还无法完全发挥Geforce FX在像素和顶点着色方面的优势。即便是2003年即将上市的设计游戏大作DOOM 3,大部分也是基于DirectX 8平台进行开发。充分使用到Geforce FX复杂的顶点像素着色功能的游戏,可能要到明年下半年末期才能出现。因此,单从纸面参数上来看,Geforce FX的效能要强过Radeon 9700 Pro不少,但是就近期游戏来说,Geforce FX强大的技术规格并不能立即转化成游戏效能的提升。

8条完全浮点化的像素渲染管道

大多数完全支持微软DirectX 9.0的3D图形芯片都会集成8条像素渲染管线,如ATi之前推出的Radeon 9700 Pro,这次Geforce FX图形芯片也不例外,在内核当中集成了8条128-bit完全浮点化的像素渲染管线。

这8条像素渲染管线耗费了Geforce FX大部分新增加的晶体管,也就是这8条像素渲染管线,使得电影级别的画质和效果得以实现。和Radeon 9700 Pro一样,Geforce FX图形芯片在单周期当中,每条渲染管线只能处理一个纹理,因此和Radeon 9700 Pro相比,Geforce FX在填充率方面不具优势,因此nVIDIA在Geforce FX的显存控制部分下了功夫,来弥补渲染管线在纹理处理方面的不足,另外更高的主频速度和整体较高的效率也参加了弥补的工作。和Radeon 9700 Pro一样,Geforce FX对单像素最多可以处理16个纹理。

在像素着色方面,Geforce FX再次超前,其像素处理单元不仅仅符合微软DirectX 9.0 2.0版本的像素着色技术规范的规定,更是超越了2.0版本的像素着色技术规范,为用户提供了Pixel Shader 2.0+的技术功能,具体体现在为着色程序提供更多的指令上。

这里,我们看到要完全发挥Geforce FX的像素着色功力的话,还要等上1年的时间。另外,Geforce FX支持的色彩精度也大大超过竞争对手。

相关分词: 顶点 着色 单元