核心:
GPU(Graphic Processing Unit即图形处理单元)
GPU的性能高低直接决定了显卡性能的好坏,主要是处理系统输入的视频信息并将其进行构建、渲染等工作.
核心制作工艺:
单位:微米
材料用硅晶片以微米来衡量其加工精度.
核心位宽:
单位:Bit
指的是显示芯片内部数据总线的位宽.带宽越大,可以提供的计算能力和数据吞吐能力也越快.
显存品牌:
SamSung.Hynix.EtronTech.Infineon.Micron.EliteMT/ESMT And So On...
显存类型:
DDR SDRAM:DDR---Double Data Rate (Ⅰ.Ⅱ.Ⅲ)
又名:帧缓存.作用是用来存储显卡芯片处理过或者即将提取的渲染数据.
显存封装:
TSOP(Thin Small Out-Line Package:薄型小尺寸封装)(Ⅰ.Ⅱ)
QFP(Quad Flat Package:小型方块平面封装)
MicroBGA(Micro Ball Grid Array:微型球闸阵列封装)
封装方式不同,空气中的杂质和不良气体,乃至水蒸气都会腐蚀芯片上的精密电路,造成电学性能下降程度也就不同.
显存时钟周期:
单位:NS(纳秒)
它是衡量显存速度的重要指标.显存速度越快,单位时间交换的数据量也就越大,在同等情况下显卡性能将会得到明显提升.
显存频率=1/显存时钟周期x2
显存容量:
单位:MB
容量的大小决定着显存临时存储数据的能力.合理的和GPU搭配容量才是最重要的.
显存容量=单颗显存颗粒的容量x显存颗粒数量
显存带宽:
单位:字节/秒
指的是显示芯片与显存之间的数据传输速率.
显存带宽=显存频率x显存位宽/8
显存位宽:
单位:Bit
它是显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大.
显存位宽=显存颗粒位宽x显存颗粒数
核心/显存频率:
单位:MHz
显示核心的工作频率.显存的工作频率.
RAMDAC(Random Access Memory Digital-Analog Convertor 模拟转换器):
单位:MHz
工作速度越高,频带越宽,高分辨率时的画面质量越好.
总线接口:
AGP(Accelerated Graphics Prot)
AGP AGP 1x AGP 2x AGP 4x AGP 8x
工作电压 3.3v 3.3v 1.5v 0.8v
时钟频率 66MHz 66MHz 66MHz 66MHz
工作频率 66MHz 133MHz 266MHz 533MHz
理论带宽 266MB/s 533MB/s 1066MB/s 2100MB/s
带宽位数 32Bit 32Bit 32Bit 32Bit
AGP 1x MB AGP 2x MB AGP 4x MB AGP 8x MB
AGP 1x显卡 兼容 兼容 不兼容 不兼容
AGP 2x显卡 兼容 兼容 不兼容 不兼容
AGP 4x显卡 兼容 兼容 兼容 兼容
AGP 8x显卡 兼容 兼容 兼容 兼容
PCI-E(PCI Express)
接口定义图
带宽需求图
渲染管线:
也称为渲染流水线
渲染管线的数量(表示):像素渲染流水线的数量 x 每管线的纹理单元数量
顶点着色单元:
显示芯片内部用来处理顶点(Vertex)信息并完成着色工作的并行处理单元
TurboCache:
主要特性:
1.专利型硬件和软件技术,可直接利用系统内存进行渲染.
2.TurboCache管理器(TCM),可动态分配内存,从而最大限度地提高系统性能.
3.智能化软件算法,可最大限度提高应用性能.
4.双向PCI Express带宽,结合TurboCache架构,提高了图形芯片的性价比.
SLI(Scalable Link Interface):
多个nVIDIA图形解决方案和nVIDIA nForce SLI媒体通信处理器(MCP),智能化地提升系统图形几何和填充率性能.
每个nVIDIA GPU和MCP里的专有软件算法和专用稳定性逻辑电路.
SLI抗锯齿:独立式渲染模式.两片显卡分担抗锯齿处理任务,将抗锯齿性能提升至两倍.启用后,SLI抗锯齿可提供2种全新抗锯齿设置SLI 8x和 SLI 16x.
PureVideo:
借助专用视频处理核心,在PC上实现令人惊叹的流畅、平稳的高清视频播放效果.
可编程视频处理器,实现加速式处理H.264、VC-1、WMV和MPEG-2等格式的高清视频.
分立式视频处理核心,卸载了CPU和三维引擎复杂的视频处理任务,不仅降低了功耗,而且让PC可以轻松自如地同时运行多个应用.
PureVideo技术可以消除重影、模糊和扭曲等现象,呈现清晰明快的画面.
通过空间时间去交织、反向电视电影处理和先进的缩放技术,消除锯齿状边缘,显示鲜锐的图像.
归功于灰度、亮度和饱和度控制、色温矫正以及LCD锐化等特性,可以在任何显示器上呈现栩栩如生的画面和鲜活生动的色彩.
本机支持高清电视,通过分量、DVI和HDMI接口,可以最高达1920x1080p的分辨率驱动高清电视机.
CrossFire(交叉火力):
多个ATI图形解决方案
Alternate Frame Rendering-把Frame以单双数分给不同的GPU处理.
Scissor(SplitFrame Rendering)-将画面分为上下半部,并各自由一颗GPU运算,然后再组合成同一个图面.
SuperTiling-把画面分割成很多小格,让两颗绘图核心梅花间竹地处理小格内的资料.这个方法效能最佳.
Super AA-增加画面质素,让两个绘图核心同时执行AA运算,然后把结果组合.
HDMI(High Definition Multimedia Interface):
HDMI 可支持的数字视频格式有:
SXGA:1280X1024@85Hz
UXGA:1600X1200@60Hz
SDTV 标清:480i、480p、576i、576p
HDTV 高清:720p、1080i、1080P
HDMI支持的数字音频格式有:
CD:16 位@32、44.1、48KHz
DVD-VIDEO:8 通道数字音频@96KHz
DVD-AUDIO:1 通道的24 位@192KHz
Dolby Digital/DTS
AVIVO(Advanced VIV):
支持对H.264、MPEG2、MPEG4、WMV9、VC-1、DivX和WMV9 PMC的解码,并支持前五种类型的编码和转码.
Intellisample 4.0:
第四代Intellisample技术引进了两种全新抗锯齿模式-透明自适应超级采样模式和透明自适应多级采样模式-能够显著提升抗锯齿处理的质量和性能.
UltraShadow II(第二代阴影加速技术):
该技术加速了互动环境中阴影交集侦测的计算.
编程人员透过消除不必要的区域运算来实现更高速的计算阴影.
CineFX 4.0:
重新设计的顶点着色器缩短了设置时间和执行几何处理的时间.
全新像素着色器的浮点运算能力提高了一倍,其他数学运算能力也大幅提升,吞吐量显著提高.
高级纹理处理单元采用了全新硬件算法和更先进的高速缓存,可加速过滤和混合运算.
nVIDIA High-Precision Dynamic Range(HPDR 高精度动态范围渲染技术):
与Vertex Shader和Parallax Mapping等技术并列的图像渲染特效.
非标准寄存器来存储颜色数据转32Bit色彩.
GPU必须具备浮点精度的着色'混合'滤波以及贴图功能.
3D API(Application Programming Interface 3D程序接口):
DirectX(Direct Input、Direct Play、Direct Sound、Direct Show、Direct Setup、Direct Media Objects And So On...)
Shader Model 3.0:由Pixel Shader 3.0和Vertex Shader 3.0两个着色语言规范组成.
Shader Model 2.0 Shader Model 3.0
顶点着色指令集 256条 65535条
位移贴图 不支持 支持
顶点纹理调用 不支持 支持
几何学例证 不支持 支持
动态程序流控制 不支持 支持
着色精度 24位 32位
顶点程序长度限制 有限长度 无限制长度
像素着色指令集 96条 65535条
子程序调用 不支持 支持
循环-分支 不支持 支持
动态程序流控制 不支持 支持
像素程序长度限制 有限长度 无限制长度
OpenGL(Open Graphics Library 开放的图形程序接口)
渲染管线
渲染管线也称为渲染流水线,是显示芯片内部处理图形信号相互独立的的并行处理单元。在某种程度上可以把渲染管线比喻为工厂里面常见的各种生产流水线,工厂里的生产流水线是为了提高产品的生产能力和效率,而渲染管线则是提高显卡的工作能力和效率。
渲染管线的数量一般是以 像素渲染流水线的数量×每管线的纹理单元数量 来表示。例如,GeForce 6800Ultra的渲染管线是16×1,就表示其具有16条像素渲染流水线,每管线具有1个纹理单元;GeForce4 MX440的渲染管线是2×2,就表示其具有2条像素渲染流水线,每管线具有2个纹理单元等等,其余表示方式以此类推。
渲染管线的数量是决定显示芯片性能和档次的最重要的参数之一,在相同的显卡核心频率下,更多的渲染管线也就意味着更大的像素填充率和纹理填充率,从显卡的渲染管线数量上可以大致判断出显卡的性能高低档次。但显卡性能并不仅仅只是取决于渲染管线的数量,同时还取决于显示核心架构、渲染管线的的执行效率、顶点着色单元的数量以及显卡的核心频率和显存频率等等方面。一般来说在相同的显示核心架构下,渲染管线越多也就意味着性能越高,例如16×1架构的GeForce 6800GT其性能要强于12×1架构的GeForce 6800,就象工厂里的采用相同技术的2条生产流水线的生产能力和效率要强于1条生产流水线那样;而在不同的显示核心架构下,渲染管线的数量多就并不意味着性能更好,例如4×2架构的GeForce2 GTS其性能就不如2×2架构的GeForce4 MX440,就象工厂里的采用了先进技术的1条流水线的生产能力和效率反而还要强于只采用了老技术的2条生产流水线那样。
顶点着色单元
顶点着色单元是显示芯片内部用来处理顶点(Vertex)信息并完成着色工作的并行处理单元。顶点着色单元决定了显卡的三角形处理和生成能力,所以也是衡量显示芯片性能特别是3D性能的重要参数。
顶点(Vertex)是图形学中的最基本元素,在三维空间中,每个顶点都拥有自己的坐标和颜色值等参数,三个顶点可以构成成一个三角形,而显卡所最终生成的立体画面则是由数量繁多的三角形构成的,而三角形数量的多少就决定了画面质量的高低,画面越真实越精美,就越需要数量更多的三角形来构成。顶点着色单元就是处理着些信息然后再送给像素渲染单元完成最后的贴图工作,最后再输出到显示器就成为我们所看到的3D画面。而显卡的顶点处理能力不足,就会导致要么降低画质,要么降低速度。
在相同的显示核心下,顶点着色单元的数量就决定了显卡的性能高低,数量越多也就意味着性能越高,例如具有6个顶点着色单元的GeForce 6800GT就要比只具有5个顶点着色单元的GeForce 6800性能高:但在不同的显示核心架构下顶点着色单元的数量多则并不一定就意味着性能越高,这还要取决于顶点着色单元的效率以及显卡的其它参数,例如具有4个顶点着色单元的Radeon 9800Pro其性能还不如只具有3个顶点着色单元的GeForce 6600GT。 |