楼主: SpeedDrift
收起左侧

[转贴]成就3D图形霸业!NVIDIA历代显卡回顾

 关闭 [复制链接]
SpeedDrift
 楼主| 发表于 2008-8-29 19:07:05 | 显示全部楼层
GeForce 6系列问世,NVIDIA一雪前耻!

    不过在高端方面,新一代的NV40已是即将发布,NVIDIA绝地反击的大幕也将被拉开。


    2004年4月13日,历时18个月,前后投入了10亿美元研发费用后,NVIDIA发布了新一代NV40图形核心,并正式名称命名为GeForce 6800Ultra,NV40使用了空前的2.22亿个晶体管,具有创纪录的16条完整像素管线,其无与伦比的性能也使NVIDIA也重新成为图形显示技术的领先者。

   

    从今天眼光来看,NV40绝对是一款不记代价的复仇之作。其最大的特点可以用“加倍”来形容,整体上讲,NV40的晶体管为2.22个,是对手上一代R300的2倍。内部架构方面,像素着色器单元、ROP单元、TMU单元,也是对手的两倍。而且NV40还率先提供了对DriectX 9.0C中SM3.0技术的完整支持。总之,就像当年R300对NV25一样,NVIDIA在NV40上悉数奉还。

NV40核心功能模块图

    NV40采用了0.13微米工艺制造,由于引入了SM3.0电路,其内部集成了2.22个亿晶体管,由于这已经是当时0.13微米工艺的极限,NVIDIA通过IBM合作,引入冗余电路技术,提高了NV40良品率。


NV40的核心架构

    架构方面,NV40采用了第三代的CineFX 3.0引擎。CineFX 3.0完全符合DriectX 9.0C的Vertex Shader3.0和Piexl Shader3.0规范。同时,CineFX 3.0也完全支持OpenGL 1.5。开发环境方面,CineFX 3.0可以支持微软的HLSL(High-Level Shader Language)和NVIDIA自己的CG高级开发语言。
   
    CineFX 3.0引擎在着色器单元部分的提高更大。首先在Vertex Shader方面,NV40完整支持Vertex Shader3.0,为了更好的利用动态条件分支的特性,顶点单元采用了MIMD的设计,每个单元由一个4D向量处理器和一个1D标量处理器及以及顶点纹理取样(Vertex Texture Fetch)单元构成,可进行指令的并行处理。


Vertex Shader结构

    NV40可以支持的Vertex Shader指令长度不再受到限制,开发人员可以根据自己的需要任意长度的顶点着色代码。顶点单元具有完整的程序流程控制的能力,程序员通过“if、else、then"等指令能够在各个分支中跳转,还可以方便的调用子程序,从而使着色程序执行效率显著提高,尤其对于取消指令长度后的着色程序更为有效。


Vertex Shader规格

    NV40的Vertex Shader还有一个特点就是可以支持顶点纹理拾取。它允许Vertex Shader像Pixel Shader一样从纹理中读取数据。在渲染过程中,程序把包含了有效顶点位置的网格(mesh)传入到vertex shader中,顶点纹理拾取就能将纹理转换为几何体。

    另外,NV40还支持Vertex Texturing,可以在单个pass里完成4个纹理的查找操作。使用Vertex Texture后,在游戏中可以获得更真实的水面模拟效果等更高级的特效。过去,开发人员一般使用凹凸贴图模拟水面,但是与采用Vertex Texture和几何位移算法实现的效果比相差甚远。


超标量的Pixel Shader管线
    在Pixel Shader方面,NV40采用了超标量的设计,增加了一个完整运算功能的FP32 Shader Unit2,所以NV40的两个Shader Unit都具备完整的mini ALU以及浮点运算能力,而Shader Unit1还可以进行纹理定址至以及执行用于计算法线的nrm指令。NV40共有32个FP32 Shader Unit,峰值浮点计算性能可以达到76.8 GFlops。

Pixel Shader架构
   
    NV3X的Pixel Shader由于不具备co-issue能力,指令并行处理能力较低。有鉴于此,NV40中也提供了对co-issue的支持,并被命名为Dual-Issue,执行方式上也更灵活,不仅支持常见的3D+1D,还可进行了2D+2D的操作,使NV40的峰值Pixel Shader指令吞吐量达到了空前的25600 MIPS。另外,nVidia重新设计NV40的寄存器部分,还增加了寄存器的数量,VS3拥有32个,256个常数寄存器,Pixel Shader拥有10个interpolated寄存器、32个临时寄存器、224个常数寄存器,保证Shader具有充足的Register资源可以利用。


Dual-Issue

    另外,NV40的Pixel Shader也具有动态程序流程控制,完全支持子程序、循环和分支的程序流程,提供了循环计数寄存器和条件码的支持,还提供了一个新的back/face寄存器,不仅提高了编程的灵活性,还可以减少无效渲染。


Pixel Shader规格

    NV40的ROP单元也采用了全新的设计,支持16位浮点像素混合(FP BLENDING)功能,可实现顶级FP精度的HDR效果(nVidia将其命名为HPDR,采用OpenEXR做为运算的缓存格式)。ROP单元还支持多渲染目标(Multiple Render Targets)技术,使光照可以在所有几何图形被渲染以后最后进行应用,不再需要进行多步的渲染。因而这种技术也可以被称为延期着色(Deferred Shading)。


ROP 结构

    NV40还引入了全新的 IntelliSample 3.0 抗锯齿技术。 其核心是一套旋转网格线( Rotated-grid )的抗锯齿采样算法,旋转栅格方式允许子像素更好地覆盖在水平方向和垂直方向上,能为多边形边缘提供更高的色彩精确性。
   
    NV40也采用了第二代UltraShadow技术,UltraShadow II技术具有32 Z/stencil渲染能力,即在渲染stencil shadow volume等效于32管线。NVIDIA宣称UltraShadowII速比Ultra Shadow第一代高出四倍,可以提高显卡在Doom3中的性能表现。UltraShadowⅡ技术同样能和的IntelliSample 3.0 配合,确保阴影边缘能获得正确抗锯齿效果。


无效渲染大大减少

    另外,NV40在视频方面也是进步不小,提供了强大的视频编码、解码支持,能够实现MPEG-2(标准分辨率以及高清晰分辨率)、MPEG-4(DiVX)、WMV9(标准分辨率和高清晰分辨率)的硬件编码和硬件解码。内建的VP单元(Video Processor)还提供了自适应消除场交错现象、高品质的缩放、伽马纠正、噪点降低、WMV9/H.264的运动补偿和色块消除的硬件支持。


VP单元

GeForce 6800系列产品介绍


  GeForce 6800ULTRA

    GeForce 6800ULTRA作为GeForce6系列的旗舰级产品,就像NVIDIA CEO在发布会的表示:"...这是GPU史上,新一代产品性能提升最大的一次,也是业界唯一支持Shader Model 3.0的GPU..."。GeForce 6800ULTRA作为NVIDIA技术领先的象征,从规格到性能各方面都完全领先于对手。不过GeForce 6800ULTRA高达500以上美元的价格也使其象征意义更大,这也是说NV40是一款不记代价的复仇之作的原因所在。

     Geforce 6800 Ultra显卡全部由NVIDIA统一制造,并提供给显卡厂商,所以市场上各个品牌的Geforce 6800Ultra显卡几乎一模一样。GeForce 6800Ultra显卡完全采用P201公板设计,10层PCB板上覆盖有超大型的散热器,需要占据一条PCI槽的空间,将热管散热和风冷散热有机地结合到了一起,能够非常有效地控制内含2.22亿个晶体管的GPU和GDDR3显存颗粒的温度。

    显存方面GeForce 6800Ultra也有巨大的提升,采用了速度最快的GDDR3,工作率高达1100MHz,配合256位显存位宽,NV40的显存带宽高达空前的35.2GB/s。

    由于晶体管规模庞大,GeForce 6800Ultra核心的峰值功耗达到100瓦,由于AGP 8X总线无法提供足够的功率,6800Ultra显卡不得不使用了两个外接电源接口。在NVIDIA的测试指南中,推荐使用480瓦的高功率电源。

   
GeForce 6800标准版

    NVIDIA GeForce 6800系列分共分为GeForce 6800Ultra、GeForce 6800GT 和GeForce 6800、GeForce 6800LE,他们全都采用了NV40图形核心。其中GeForce 6800标准版使用的NV40芯片因为有瑕疵而被屏蔽了4个PS单元以及1个VS单元,也就是12PS/5VS的设计。不过其价格也降到299美元,它也是三款中最具有普及意义的。同时,由于GeForce 6800标准版也因为具有可以改造的潜力,国外有网站曾经对120个使用GeForce 6800的3D发烧友进行过调查,其中55%的用户可以成功打开被屏蔽的管线,可见6800标准版的改造成功率还是相当大的。特别是RivaTuner的出现使得6800标准版的改造更加方便,吸引了大批的DIY玩家,成为当时人气颇高的一款产品。

GeForce 6800 轻松变身,倾倒无数玩家

    NVIDIA推出GeForce 6800标准版,也有其市场意义。自从2004年3月份ATI 将高端产品9800PRO降到250美元后,在这个价位上NVIDIA一直没有合适的产品与之抗衡,而GeForce 6800标准版凭借12条渲染管线以及NV40核心的众多先进技术,在性能上完全领先9800PRO,官方报价却仅为299美元,显然更有竞争力。

    Inno3D GeForce6800显卡采用NVIDIA公板P212设计,是8层的PCB。显卡使用了更加成熟的DDR显存颗粒,在保证显示卡性能发挥的前提下极大的降低了成本。由于仍然是256BIT显存位宽,显存工作在700MHz的频率仍然为核心提供了高达22.4GB/s的显存带宽。


Inno3D GeForce 6800LE

    Geforce 6800LE是NV40系列中规格最低的一款显卡,屏蔽后为8PS/4VS,因为针对OEM市场,早期6800LE还被进行了锁频处理。它的价格也最低廉,和6600GT的建议零售一样都为199美元,它的对手是同样8个PS单元的X800SE。从发布后NVIDIA一直没有将Geforce6800 LE推向零售市场,而仅仅供应OEM厂商。这主要是担心Geforce 6800LE会冲击中端市场,出现6600GT AGP和6800LE手足相争的局面。

    Inno3D GeForce 6800LE的工作频率为300/700MHz外,为了降低成本也使用了DDR显存颗粒。6800 LE具8条像素渲染管线/4组顶点单元。和GeForce 6600系列相比,GeForce 6800LE的优势在于具有256 bit显存位宽、8个ROP单元,在高分辨率、反锯齿打开的情况下,比6600更有优势。但因为默认频率过低的原因,总体性能上GeForce 6800LE仍旧落后于GeForce 6600GT。但是,Inno3D GeForce 6800LE显卡具有较强的超频能力和改造潜力,尤其是改造成GeForce 6800标准版的可能性极大,运气好的话甚至可以打开全部的管线。

   

GeForce 6800XT

    在2005年中端市场,NVIDIA的GeForce 6600系列在于ATI的X700的较量中占得了上风,为了扭转劣势,ATI 将高端的Radeon X800引入中端,以颇具竞争力的价格推出了Radeon X800GT。考虑当时很多厂商私下里都推出了零售版的6800LE,市场反映很好,于是2005年9月,NVIDIA针对Radeon X800GT推出了GeForce 6800XT,基本上就是。虽然当时PCIE接口已经成为市场的主流,但由于市场惯性,AGP平台依然占有相当大的市场份额,GeForce6800 XT也有AGP的版本,以弥补6600 AGP供货不足的缺口。

    PCIE版本的GeForce 6800XT共有NV41和NV42两种核心,其中后者是0.11微米工艺,功耗、成本更低,超频能力更强。AGP版本的GeForce 6800XT则采用了NV40核心。在规格上GeForce 6800XT和GeForce 6800LE完全相同,都是8PS+4VS+8ROP的设计,并采用了256BIT显存接口。

    6800XT的默认频率为400MHz/700MHz,也可以说是6800LE的高频版本。和6800LE一样,GeForce 6800XT也同样具有修改的潜力,PCIE版本最高可以改为6800标准版的12PS/5VS,而AGP版本则有机会改为NV40。

NV大举反攻,GF6收复失地

    2004年4月份发布基于NV40的GeForce 6800ULTRA后,凭借16条超标量浮点像素渲染管线,NVIDIA成功夺回了失去已久显卡性能的王冠。而且由于NV40支持ShaderModel3.0以及FP HDR等业界领先的新技术,此前GeForce FX时期人们对NVIDIA技术实力的怀疑也被一扫而空。NV40作为NVIDIA技术实力的象征,在500美元左右的高端市场大举收复失地,获得了很多高端3D发烧玩家的青睐。

    相比在高端市场的大获成功,但是在市场规模最大、整体利润更高的主流市场中,NVIDIA却面临着进入新世纪以来的最困难的一段时期。在250美元以内的中端市场,GeForce FX系列仍是市场上的主力。但是2004年开始,DirectX 9游戏的普及速度突然被加快,大量的DirectX 9游戏纷纷上市,使得GeForce FX的架构缺陷暴露的更彻底,因此GeForce FX系列显卡也在竞争中全面落败,NVIDIA的市场占有率也是逐步走低。因此,将新一代GeForce 6系列引入中端,也就成了NVIDIA的当务之急。不过中端产品除了性能外,对成本的要求较高,所以NVIDIA也决定等待0.11微米制造工艺的成熟,但这多少也延误了一些时间。

    终于,2004年8月13日,在QuakeCon2004上,NVIDIA正式了GeForce 6家族中的主流产品,GeForce 6600系列显卡。

    GeForce 6600的核心研发带号为NV43,其架构体系全面继承于NV40,NV43具有NV40的全部3D特性,同时视频功能也被加强。由于当时Intel 915/925系列芯片组已经大规模登陆市场,PCI Express接口已渐成主流,所以NV43也是NVIDIA首款采用原生PCI Express解决方案的核心。

    由于当时在200美元以下的中端PCI Express图形市场中,一直没有出色的显卡产品,几乎是个空白。而这部分市场伴随着Intel 915/925主板的普及规模越来越大,NV43的推出恰好符合了这部分用户的对高性能产品的渴望。而对手ATI虽然早就将高端产品全部转向PCI Express接口,但是产品价格都在300美元以上,而中端的RV410迟迟不见踪影,直到9月底才正式发布,性能处于下风且供货也不稳定,让GeForce 6600轻松占领了大部分市场,NVIDIA敏锐的市场洞察力体现的很充分。

    NV43为TSMC 0.11微米工艺制造,集成了1.43亿个晶体管。由于制程的改进并且引入了low-k 技术,NV43的频率可以轻松达到500MHz,同时成本以及功耗都控制在可以接受的范围内。


low-k 工艺

   在核心架构方面,NV40不惜代价引入SM3.0电路对于核心成本的副作用也很明显,所以NV43上不等不进行了大幅度的精简,基本上缩减了一半处理单元。即便如此,NV43的晶体管数量还是达到了1.43亿,而对手RV410(X700)在顶点着色管线、ROP单元都2倍于NV43的情况下,晶体管数量仅为1.2亿个。


NV43架构图

    NV40中,16条像素着色管线以四个组成一组,每组称为一个“Quad",所以NV40中共有4组Quad单元。而在NV43上有两组Quad单元,所以共有8条像素着色管线(每管线一个TMU单元),和对手X700相同。NV43的顶点单元为3组。为了进一步控制成本,NVIDIA果断的缩减了ROP单元的数量,只保留了4个ROP单元(这也是NV43被认为使4X2架构的原因),仅为对手X700的一半,但是本身6600GT只支持128-bit显存位宽,且频率只有1GHz,如果采用8个ROP单元,受到显存带宽的制约很明显。即便只有四个ROP单元,充分发挥后,在象素填充能力上和X700差距并不大。事实也是6600凭借性能优异的Pixel Shader处理单元事实也是6600凭借性能优异的Pixel Shader处理单元(NV43的超标量PS管线为单周期4条指令并发,理论上是RV410的两倍),在与X700的竞争中以完胜而告终。


SLI技术
   
   NV43核心的另一个特点就是率先实现了对SLI技术的支持。2004年下半年,PCI Express技术的逐渐普及,这是SLI技术得以重现的一个必备条件。SLI技术最早源自3dfx,全称是Scan Line Interleave ,基于PCI接口,随着AGP接口的普及逐渐被谈玩。而NVIDIA SLI(Scalable Link Interface)在很多方面都有较大的进步。首先,PCI Express可以提供60倍于PCI总线的总带宽。其次,3dfx SLI为隔行扫描,属于模拟应用,可能因为数模转换差异造成图像质量欠佳。NVIDIA SLI技术则是基于PCI Express技术,采用一种完全数字化的帧组合方法,对图像质量无任何影响,可提高几何性能,支持多种实现灵活伸缩性的算法,能够根据应用需要选用最有效的方法来实现灵活伸缩性。
SpeedDrift
 楼主| 发表于 2008-8-29 19:08:23 | 显示全部楼层
GeForce 6600GT中端PCIE之王

   

GeForce 6600GT

    NV43虽然发布于2004年8月,GeForce6600显卡在9月份开始向OEM客户出货,到10月份才正式登录零售市场,距离NV40发布已有半年时间。而AGP版本的GeForce6600显卡更是直到11月中旬才上市。

    GeForce 6600GT是GeForce 6600系列的最高端版本,也是最先提供SLI功能的显卡,上市伊始便受到众多3D发烧玩家的关注。GeForce 6600GT核心/显存频率高达500/1000MHz,采用128Bit的GDDR3显存。AGP版本的GeForce 6600GT则是采用原生PCI-Express的NV43核心+桥接芯片(HIS)的方式来实现AGP界面。6600GT AGP的供电电路也有所改变,采用了P218 公版PCB(前者是P216),并引入了外接电源接口,以弥补AGP总线功率不足的缺陷,同时其显存频率也比PCIE版本的6600GT低100MHz。

    由于当时GeForce 6800系列的出色表现,游戏玩家显然也对GeForce 6600GT充满了期待,而6600GT的性能也没有让用户失望。而且其219美元的实际零售价格也得到了中端用户的认可,尤其是6600GT AGP的强劲表现与合理的价格直接导致了当时ATI中端的9800PRO大幅度降价,在PCIE平台,也迫使ATI不等不提前发布了RV410(X700)。

   

GeForce6600

    GeForce 6600标准版是系列的普及型产品,定位于整体利润最高的150美元中端主流市场,担负着为NVIDIA夺回市场份额的重任。在规格上,NVIDIA也采用了很灵活的的策略,早期的6600标准版采用了TSOP封装的DDR显存,推荐核心/显存频率为300/550MHz。以后又有DDR II显存的版本,频率提高到400MHz/800MHz。但NVIDIA对6600标准版的工作频率并未限制,板卡厂商可以根据自己的市场策略来设定最终的工作频率,因此GeForce 6600显卡的产品也是十分丰富。

    事实上,NV43核心的超频能力普遍不错,6600标准版核心的默认频率虽然只有300MHz,但反而留给用户更大的超频空间,所以性价比也更高。后期NVIDIA解除对6600标准版的SLI限制后,不少厂商还推出了采用6600GT PCB的GeForce 6600 GDDR3加强版,深受广大DIY玩家所喜爱。

    由于6600系列在性能的较量中完胜对手的X700系列,以及NVIDIA与各个AIC厂商的通力配合,GeForce 6600系列在很长一段时间内占领了相当份额的中端市场,为NVIDIA扩大市场占有率立下了汗马功劳,也是一代相当经典的中端佳作。
6200:

    不过在2004年中后期,在入门级市场上,NVIDIA的GeForce FX5700、FX5500、FX5200在对手Radeon 9250、Radeon 9550的夹击下,全线溃败,丢失了大量的市场份额,在中高端市场布局完毕后,NVIDIA也开始着手扭转在低端方面的局势,于2004年10月中旬发布了GeForce 6200,之后,又在12月16日发布了GeForce 6200TC。


    GeForce 6200采用了NV43-V核心,是NV43生产过程中的瑕疵品,如果NV43核心中有一个QUAD有问题或者不能全速运行,就将这一组管线屏蔽,并用于6200显卡。因此,除了只有四条像素管线外,NV43-V的核心特性和NV43相同,也采用CINFX3.0引擎,支持Shader Model 3.0、UltraShadow II及Intellisample 3.0。不过GeForce 6200显卡的ROP功能受到了一定简化,去掉了对Color-compression、Z-compress以及OpenEXR这三个技术的支持。

6200家族规格一览

    GeForce 6200显卡的默认频率为300MHz/500MHz,也有AGP和PCIE两个版本。由于采用了NV43-V核心,6200也具有相当的改造潜力,尤其是当年NV43-V  A2版本的核心普遍可以打开被屏蔽的4条像素管线。即便不改造,NV43-V也具有良好的超频能力。根据相关测试,6200 AGP在默认频率下性能就已经完全超过了Radeon 9550,在DOOM3中超过Radeon 9600PRO达30%之多。
   
    不过性能上的优势并没有使得GeForce 6200有太大作为,原因就是其过高的售价。尤其是AGP版本的6200,采用的NV43-V+HSI桥接芯片的方案使其在国内的上市售价竟然高达900元以上,对Radeon9550没有直接的威胁。

   
GeForce 6200 TurboCache

    GeForce 6200 TurboCache(6200 TC)采用研发带号NV44的图形核心。基于NV4X系列的核心架构,配备3个顶点着色单元和 4 条像素着色管线,而ROP单元则由GeForce 6200 的4个降到了2个。其核心频率为350MHz,最高支持64M/64Bit的显存规格。6200 TC不支持Color and Z-Compression和 OpenEXR技术,对开启AA和AF的情况下会有一定影响。不过NV4X 核心主要特性:Shard Mode 3.0 、Intellisample 3.0、UltraShadow II以及 PureVideo 视频技术都得到了保留。而NV44核心的最大特色就是采用了TurboCache技术。



    由于新一代PCI-Experss技术,采用点对点的串行连接方式,允许和每个设备建立独立的数据传输通道,充分保障各设备的带宽资源独立,从而拥有较高的数据传输带宽。PCI-E X16的单向传输带宽为4G/s,是AGP 8X的两倍,并且PCI Express总线能够真正做到双向对等的数据传输,最大数据传输带宽可达到8GB/s。PCI-E的带宽优势,也是实现与系统共享内存资源的基础。


TurboCache架构图

    TurboCache技术正是充分利用了PCI-Experss总线的数据带宽优势,从而实现了共享系统内存资源。TurboCache中的内存管理技术可以“允许GPU在分配和不分配系统内存时无缝切换,并且高效的读写内存”。这个工作由驱动程序中名叫TC的管理部分执行。6200TC还新引入了内存管理单元(Memory Manage Unit,MMU),能够让GPU同过PCI-E总线直接对系统内存进行读取和写操作,自动把渲染结果和纹理分配在本地内存或者系统内存上,以虚拟寻址方式自由地分配帧缓存以及纹理缓存。

    6200 TC 采用TurboCache技术后,能够利用PCI Express的Auxiliary Memory Channel,动态的调用系统主内存和以满足板载少量显存不足的情况,同时也可以直接从系统内存中获得另外一条相对等的显存位宽,使只有64Bit本地显存位宽的Geforce6200TC变成128Bit(32Bit也可以变成64Bit)。


TurboCache工作流程

     6200 TC 作为GeForce6 系列在低端唯一的原生PCIE核心,也是低端PCI Express市场的主力产品,针对ATI的Radeon X300系列。由于是原生4管线设计,核心成本明显降低,加上可以板载更少的显存,价格上很有竞争力。同时性能上64MB/64 bit显存的6200 TC可以略微超过128 bit显存的Radeon X300,尤其是32bit显存6200 TC凭借出色的成本几乎更扫了Radeon X300SE。6200 TC 能有这样的表现实属于不易,因而也得到了入门级用户的肯定。

   

GeForce 6200A

    2004年,nVidia继推出了Geforce 6600、Geforce 6200、Geforce 6200TC后,6系已完整覆盖了PCI-E方面高中低三个层次的产品线。进入2005年后,虽然中高端PC市场上PCI-Express已经成为主流,但是再低端AGP平台依然占有较大的市场份额,而Radeon 9550的持续热卖对NVIDIA依然是个难以解决的问题。由于消费者对DX9性能低下的GeForce FX5200、FX5700 LE 系列并不买账,而之前推出的GeForce  6200AGP的售价居高不下,而且长期使用NV43-V+HSI桥接芯片来生产Geforce 6200这样的低端型号产品也绝非上策,毕竟对于这种入门级显卡而言,HSI桥芯片成本所占显卡成本的比例是不能忽略的。于是,在2005年3月中旬,NVIDIA发布了采用核心代号NV44A的Geforce6200A显示卡。

    Geforce6200A所采用的NV44A是原生AGP接口的核心,采用0.11微米制程,核心含有7500万个晶体管,其核心面积较NV43缩小的一半,所以成本也更低廉。规格上和NV44相同,配备3个顶点着色单元和4条像素着色管线以及2个ROP单元,支持64Bit显存位宽。显卡采用NVIDIA P362的4层公版PCB板,默认频率为350/500MHz。由于基于AGP接口,所以并不支持Turbo Cache技术。

     Geforce6200A在性能上可以和默认频率的Radeon 9550持平,在DOOM3中还可以小幅度领先。但是当Radeon 9550超频后,即便Geforce6200A同时也超频,后者还是会落后不小的一段距离,再加上用户对64BIT显存位宽根深蒂固的偏见,Geforce6200A在零售市场的表现也很一般,消费者还是更倾向于128 BIT显存位宽的Radeon 9550。

   
GeForce 6600 LE
   

从理论上说,显卡的性能是其各项指标的一个综合结果,这些指标包括核心架构、运行频率,显存规格等等诸多因素
GeForce 6600标准版受制于过低的核心、显存频率,性能发挥受到很大。所以在中低端市场,NVIDIA也准备为
GeForce 6600标准版增加一个助手,所以在2005年中又推出了GeForce 6600LE。
    GeForce 6600 LE图形芯片将渲染管线的数量由8条缩减到4条,而且制程上更加成熟,甚至可以超到600 MHz,极大的弥补了管线减少带来的影响。 NVIDIA的本意是使用GeForce 6600 LE来填补GeForce 6200A和GeForce 6600标准版之间的空间,但是Inno3D凭借出色的设计和制造技术,并采用了GeForce 6600的PCB,将GeForce 6600 LE的核心/显存默认频率提升至425 / 1000 MHz,极高的运行频率弥补了渲染管线的缺憾,在此频率下GeForce 6600 LE的性能已经完全超过了GeForce 6600标准版,加上还有相当的超频潜力,凭借当时6XX左右的价格,性价比非常出色。

6800压倒性优势战胜X800

    随着新一代GeForce 6800系列的上市,高端市场中,NVIDIA的局势有了很显著的改观,根据统计,在2004年第三季度NVIDIA出货了约150万片高端DirectX 9.0图形卡,占整个高端图形市场的64%,而对手ATi的占有率为下降到36%。而Geforce6800系列刚推出市场的时候,NVIDIA的占有率还仅仅为26%。

    顶级的产品虽然出货量不大,但是却可以展示一个公司的技术实力并且可以在行业内提高自身的威望。作为GeForce 6系列的旗舰产品,GeForce 6800ULTRA有效的帮助NVIDIA在用户中重新树立起技术、性能领先的地位,对系列中端的热卖起到了相当的促进作用。

    完整支持SM3.0、HDR技术的NV4X核心,不仅使NVIDIA重新树立起技术领先的形象,也给对手不小的震动。例如,当时ATI的工程师就对NVIDIA能够在110nm制程上实现SM3.0技术感到惊讶。


DirectX 9.0c普及过慢

    不过也要指出的是,在GeForce 6发布后,某些软件厂商在SM3.0标准的推广上态度消极,像2004年底发布的测试软件3DMARK2005,就没有采用SM3.0技术。这种状况一直持续到2005年后期,才逐渐开始有新游戏基于SM3.0标准开发,而SM3.0的游戏也直到2006年才开始大规模普及,这也客观上帮助了当时还不能支持SM3.0的竞争对手。所以说GeForce 6系列显卡在技术上的领先优势在当时并未得到充分发挥,也是一个不小的遗憾。

    对于新技术的支持,也使NVIDIA付出了高昂的成本代价,GeForce 6系列在成本上比对手的同档次产品也要高,这也是6系列显卡主要的一个缺点。所以在PC独立图形核心的市场占有率方面,NVIDIA也未能反超ATI。

    不过在整体图形市场占有率上,根据Mercury Research的统计,2004年第三季度NVIDIA的占有率却跌倒了谷底,从第二季度的23%下降到了15%。同时在全部的独立图形核心占有率统计上,也只有37%,Radeon系列在入门级桌面市场和移动平台的出色表现,使ATI的占有率上升到59%。不过好在NVIDIA的反弹趋势也很明显,凭借9月份上市的Geforce 6600系列的优秀表现,以及西方圣诞节期间的热销,在2004年第四季度,NVIDIA的占有率迅速回升到21%,并维持了良好的发展态势。另一个引人注目的成绩,是当时Intel 的915/925系列整合芯片组已经大规模登陆市场,在图形市场上的占有率达到39%。
SpeedDrift
 楼主| 发表于 2008-8-29 19:09:17 | 显示全部楼层
不给对手喘息机会——GeForce 7提前面世

    在渡过了2004年中后期在市场上的困难时期后,吸取了GeForce FX系列的经验教训的NVIDIA也变得更加成熟,同时已经在技术上取得领先优势的NVIDIA并不给对手以喘息的机会,在2005年6月22日,在美国旧金山举行的GeForce LAN 2.0大会上正式发布新一代图形芯片G70。


3.04个亿晶体管规模空前

    在G70图形核心上,NVIDIA采用了新的命名方式,G70的含义就是GeForce系列的第7代核心。G70公认还有一个内部代号为NV47,不过根据NVIDIA的表示:“原本NV47的项目已经取消,因为工程师已经能够做出比NV47更强的芯片,才决定整个跳过NV47"。


G70

    G70为TSMC 0.11微米工艺制造,由于管线数达到空前的24条,其内部集成了3.02个亿晶体管,核心面积超过300平方毫米,也是当时业内最复杂图形核心。但是由于制程的改进,其功耗可以略低于NV40。


G70架构

    核心架构方面,G70引入了新一代的CineFX4.0引擎。CineFX4.0引擎可以说是CineFX3.0完美增强版,提供了对DriectX 9.0C的Vertex Shader3.0和Piexl Shader3.0的完整支持并进一步完善。功能方面则新增加了透明材质智能采样抗锯齿、次表面散射、Relief Mapping、64Bit HDR运算、法线贴图压缩、光能传递贴图等一系新技术。

    G70的CineFX4.0的架构最容易被忽视的一个提高就是SM3.0中的动态分支性能,相对于NV40初代的动态分支性能,由于改进的多线程调度分配机制,G70的动态分支能力有了成倍的提升,不过在05年SM3.0游戏还不多,所以未能在实际中应用体现。

    在Vertex Shader方面,G70采用了与NV40相同的MIMD架构设计,由一个4D向量处理器和一个1D标量处理器及以及顶点纹理取样(Vertex Texture Fetch)单元构成。Vertex Shader的数量增加了两个,达到8个。处理能力随之也提高了33%左右。


Vertex Shader架构
    新的Vertex Shader单元具有单周期MADD指令运算能力,其中的特殊功能单元(SFU :special function unit,用于单周期执行SIN、COS、SCS 等运算)的标量处理性能也得到了提高。
   同时Setup Engine(3D顶点坐标转换为2D平面坐标)性能也提高了将近50%,以配合Vertex Shader数量的增加。
    由于游戏中Vertex Texture(顶点纹理,配合几何位移算法使用)的使用越来越普及,顶点单元的Vertex Texture Fetch性能也很重要。由于Vertex Texture Fetch是比较消耗资源的操作,过开发人员不得不尽量减少在顶点程序中的纹理读取次数。G70的Vertex Texture Fetch性能也获得了提高,使开发人员可以更自由的读取纹理数据。另外,G70的Vertex Shader也和NV40一样为128bit长的VLIW型指令集。
    在Pixel Shader方面,G70也沿用了NV40的超标量的设计,不过数量上增加了两个QUAD,即8条Pixel Shader管线。Pixel Shader内部和NV40一样具有两个FP32的4D矢量单元,不过NV40的Shader Core 1不支持MADD(Multiply-ADD几何运算中常见的操作 )、ADD,而G70的两个Shader Core 都可以支持 ADD、MUL、MADD这三种操作。

Pixel Shader架构

    G70通过提高Pixel Shader内的并行性,来提高Shader单元的指令级并行计算能力 (Instruction-Level Parallelism:ILP)。G70的Pixel Shader同样支持dual-issue,可以进行交错运算,并为MADD作了优化。NVIDIA的技术文档中表明G70的Shader(430MHz)运算性能是313 GFLOP,远高于NV40的120 GFLOPS。
   
    G70的纹理映射单元(TMU)数量上也增加到了24个,同时纹理拾取的能力也得到了增强,可以提高向异性过滤的性能,同时可以略微提高核心的HDR渲染性能。

    G70的ROP单元在数量上并没有增加,这也是因为纹理操作在新游戏中的比例越来越小,而且显存带宽也不足以分配给更多ROP单元。ROP单元性能上有所增强,其Single Texture Alpha Blend的测试成绩超过NV40约20%。在ROP单元在功能上有所增强,可以支持的全新的透明超级取样(transparent supersampling)及透明多重采样(transparent multisampling)技术。另外G70也可以支持64bit浮点精度的HDR渲染。

   

GeForce 7800GTX

        GeForce 7800GTX是GeForce 7系列的旗舰级产品,相比NV40发布后一个月后,GeForce 6800才上市的情况不同,在G70发布的同时,GeForce 7800GTX也就正式发售,说明NVIDIA这次准备的也更充分,对GeForce 7800GTX也寄予了厚望。

    和Geforce 6800Ultra相同,GeForce 7800GTX也全部由NVIDIA统一制造。7800GTX虽然在功耗上有所下降,但是其供电电路却比 6800Ultra还要奢华。7800GTX采用了10层P347公版PCB,板长达到了229mm ,所以外观看上去比以往任何PC显卡都要长。供电系统的用料相当奢华,由3组、每组3个的英飞凌优质Mofset及3组VITEC高频电感构成了三项增强型供电。大量陶瓷积层电容的使用,使得7800GTX的品质可以和高端专业级显卡相媲美。


INNO3D GeForce 7800GTX

    GeForce 7800GTX的散热器不再是Geforce 6800Ultra那种笨重的双槽设计,而是看上去轻盈且更美观的单槽热管系统,也说明G70核心的功耗、和发热也控制得很好。

   GeForce 7800GTX配备了256M GDDR3显存,而其采用P347公版PCB设计之初也可以用于512M显存,不过后来GeForce 7800GTX 512M使用了P348  PCB。GeForce 7800GTX采用了当时速度最快的三星1.6NS GDDR3显存颗粒,工作频率1.2GHz,提供高达38.4 GB/s的显存带宽,也是当时PC级显卡的最高峰。
   
    作为旗舰级产品,GeForce 7800GTX的上市价格高达599美元,比上一代Geforce 6800Ultra还高,当然NVIDIA这么做的原因主要为了给Geforce 6800系列清理库存。后来,GeForce 7800GTX的价格也是很快降到500美元以内,成为2005年夏天显卡市场上最具热点的产品。

   

GeForce 7800GT
    7800GT被屏蔽了4条管线,PCB也被作了一定程度的简化,因此成本低很多,上市价格在3000元左右,因此还是有不小的市场。

NV攻其不备,ATI措手不及

    2005年6月份GeForce 7800GTX发布后,在很长一段时间内都没有对手。竞争对手ATI则忙于游戏平台领域的开发(微软的XBOX360、任天堂的WII ),以及公司内部也是斗争不断,使其下一代产品Radeon X1800XT系列一直拖延,竟然到10月中旬才上市,也失去了不小的市场份额。NVIDIA则抓住时间,全线出击,除了高端发布了GeForce 7800GTX,中低端除了降低下格外,还不断细化市场,推出了众多基于GeForce6系列的高性价比产品,其在图形市场中的占有率也进一步扩大。到第三季度,Nvidia的在独立图形芯片市场上的份额为50.4%反超ATI的47.9%。在整个2005年,NVIDIA实现了23.7亿美元的营业收入,净利润达到3.02亿美元。

    R520比G70晚了近4个月的时间才发布,但是Radeon X1800XT的性能却只能和GeForce 7800GTX打成平手,而前者的工作频率为600MHz/1400MHz,远远高于7800GTX的430MHz/1200MHz,所以看起来R520的核心处理效率偏低。但是R520的最大特色在于引入了全新的(Ultra-Threading dispatch processor)超线程分配处理器,最大能够同时处理512个并行的线程,大幅度的提高了核心的动态分支能力,动态分支也是SM3.0引入的动态控制流中的一个重要特性。而且在动态分支性能的测试中,X1800XT也确实高出GeForce 7800GTX不少。不过X1800XT的这个新特性在当时却没有体现出来,一个原因就是当时基于SM3.0开发的游戏还比较少,另一个就是,虽然R520可以支持多达512个的并行线程,SIMD流水线的并行度也很高,但是每个线程内的处理资源却严重不足,也就是R520的运算单元过少且效率一般(R520只有16个可以执行MADD指令的FP32 mainALU,而G70有48个可以执行MADD指令的FP32 mainALU),空有强大的动态分支能力,却无法充分发挥。

    当然ATI也清楚这一点,所以早在R520还没正式发布的时候就已经完成了R580的设计,并将相关信息通过一些文档透露出来。等到90nm工艺更成熟后,在2006年1月发布了R580以及X1900XT。R580相对于R520的扩充很大,ATI为其设计了规模空前的48个像素着色器单元(48个可以执行MADD指令的FP32 mainALU+48个 mini ALU),所以R580即有较高的动态分支性能(不过batch size也增大到了48),又有规模空前的浮点运算单元,SM3.0性能自然也上了个档次,在一些采用SM3.0、HDR技术的新游戏中也反映的很明显。不过R580并不能算是DirectX 9.0c级别的最完美的核心,这主要是因为90nm制程下,即便R580通过3:1的架构(在提高Shader性能(3)的同时降低了ROP、TMU等单元的比例(1)以减少不必要的晶体管消耗),但仍集成了3.84亿个晶体管,所以其功耗、发热也是很难控制,适用性不高。

核心面积对比

    NVIDIA显然对ATI的反击有所准备,也清楚R520、R580的弱点,所以改变了策略,即在DirectX 9.0c级别的核心上不与ATI做过多纠缠,而是在GeForce 7800GTX发布后就立即继续进行下一代DirectX 10级别G80核心的研发。对于R580,NVIDIA则针对其弱点,推出了G70核心的高频、低功耗版——G71核心来抗衡。

性能并不是唯一,G71从成本、功耗、发热方面胜出
   
    2006年3月9日,在CeBIT2006展会上NVIDIA正式推出了G70的继任者G71图形核心。当时G71核心发布后,也使很多人都感到惊讶,因为新发布的顶级核心在晶体管数量上反而低于其前任,这在历史上恐怕还是第一次,这也反映出了NVIDIA的魄力与对局势的准确把握。

GeForce 7900GTX

    作为NV新一代旗舰级核心,G71拥有2.78亿个晶体管,较G70下降10%,而且由于采用了成熟的90nm工艺,核心面积仅有196mm2 ,远低于R580的352mm2,以及G70的346mm2,使得制造成本显著下降,良品率更高。同时可以在降低功耗、发热的同时,大幅度提高核心的运行频率,7900GTX(650MHz)的核心频率比7800GTX(430MHz)高出了220MHz,提升达50%,两代顶级显卡的频率差距(220MHz)如此之大,在历史上恐怕也不多见。

    架构方面,G71与G70完全相同,也是CineFX4.0引擎的设计,具有24条像素渲染管线、8个顶点着色单元和16个ROP单元。G71的RTL(register transfer logic )被重新设计,并且精简了管线中一些不必要的cache,所以晶体管数得以减少,同时所有处理单元都保留了下来。G71架构的具体内容前面已介绍过的G70相同,这里就不再赘述。

   

GeForce 7900GTX

    G71针脚定义与G70相同,和G70是Pin-to-Pin兼容的设计,因此7900GTX所使用的PCB和7800GTX 512MB一样都是P348公版。同时沿用了7800GTX 512MB的双槽散热器。显存方面,7900GTX采用了三星1.1ns GDDR3,显存默认频率为1600MHz。
   
   

GeForce7900GT

    为旗舰级产品,GeForce7900GTX的售价为599美元,相比GeForce 7800GTX 599美元、X1900XTX 的649美元要也合理的多。


    NVIDIA在2006年三月发布了采用90nm工艺的GeForce 7900系列显卡,在成本、功耗和发热等方面都控制的较好,产品的性价比、易用性都达到了一个新的高度。

    反观ATI方面,除了06年初发布的R580由于成本问题导致价格居高不下,让大多数消费者望而却步。不过随着时间推移,80nm制程逐渐成熟,ATI也准备推出RV570、RV560进行反击。

    不过NVIDIA早就预料到此种局面,早在RV570、RV560发布前就把原本只用于OEM市场的7900GS推向了零售市场,产品性价比再次攀升,受到广大游戏爱好者的热捧。
   

GeForce 7900GS

    GeForce 7900GS是GeForce 7900GT的简化版,核心仍然采用了G71核心核心,采用90nm工艺,只是在7900GT的24条像素管线和8个顶点渲染单元的基础上减少了4条像素管线和一个顶点单元,具备20条管线和7个顶点渲染单元。而核心频率与GeForce 7900GT相同,公版默认450MHz,显存位宽为256BIT,频率为1320MHz,如此低的默认频率使得显卡具有较好的超频潜力。GeForce 7900GS定位于中高端市场,上市价格在179美元左右。



    GeForce 7900GS在默认频率下的性能在X1950Pro与X1650XT之间,但是超频后提升不小,远高于X1650XT也接近X1950Pro。GeForce 7900GS的出现使得ATI凭借X1950Pro与X1650XT进行反击的效果打了不小的折扣,X1950Pro还被迫与GeForce 7900GS进行价格战,7900GS很好的担当了一个阻击者的角色。

    后来ATI改变策略,用X1950Pro瞄准7900GS,以及2007年初又推出了X1950GT,使得7900GS的压力突然增大。不过NVIDIA也应对自如,在下调7900GS价格进入千元以下的同时大幅度提升显卡的频率,取得了不错的效果。

    GeForce 7900GS充分反映了NVIDIA对产品性能的知己知彼以及市场手段的灵活多变,对于消费者来说,GeForce 7900GS降价后也是具有相当的性价比的产品。
SpeedDrift
 楼主| 发表于 2008-8-29 19:10:15 | 显示全部楼层
完美演绎性价比,7600/7300又是一代经典
   

GeForce 7600GT
   7600GT采用了90nm工艺G73核心,拥有12条像素管线和5个顶点单元,规格基本接近6800标准版,比6600GT高出一个档次,尤其是TMU、ROP单元数量是Radeon X1600XT的2倍,高分辨率下的反锯齿性能要强的多。默认核心频率达560MHz。

    90nm的GeForce 7系列的显卡大都具有高频、低功耗的特性,而GeForce 7600GT把这些特性发挥到了及至。7600GT基于公版P456 PCB制造,虽然7600GT的频率大幅提高,但功耗控制依旧非常出色,不会超过PCI-E接口75W的上限,所以省掉了外接供电。

    因为是中端产品,所以7600GT采用了128Bit显存接口,搭配4颗显存组成256MB/128Bit的规格,显存频率1400MHz。
   由于NVIDIA在G73内部集成了SLI处理模块,通过显卡PCB上SLI金手指,就可以非常方便的组建SLI系统,获得更大的性能提升。

    过去在中端市场中,GeForce 6600GT虽然有技术、性能优势,但是成本比对手的Radeon X700高出不少,无形中降低了显卡的性价比。而在G73核心中只有1.77亿晶体管,比X1600XT的1.57亿仅仅多了10%,在90nm制程下,成本差距下几乎可以忽略。而性能方面,1280X1024的分辨率下,7600GT在游戏中的性能几乎平均都有X1600XT的1.5倍,在DOOM3中更是2倍于X1600XT,所以在中端市场,7600GT取得了近乎辉煌的胜利,也是继GeForce 6600GT之后,又一个中端性能之王。
   

GeForce 7600GS

    GeForce 7600GS是GeForce 7600GT的降频版本,采用G73核心,完整的继承了7600GT的所有规格和特性,上市价格只有129美元,售价与X1600Pro相当,但整体性能比X1600XT还要高。G73核心天生的优异超频性能更使得GeForce 7600GS成为中端市场性价比最高的传奇式产品。

    GS这个后缀是从6800GS开始出现在我们的视线中的,由于6800GS出众的性能以及平易近人的价格, GS后缀命名的N卡从此给人留下了高性价比的印象。毫无疑问7600GS也是一款物美价廉的产品,从厂商到消费者都对其十分喜爱,从某种意义上说,7600GS才是6600GT真正的接班人。早期的7600GS是90nm制程,并以GDDR2 256M为主。随着后期80nm G73-B1核心的采用,7600GS的性价比进一步提高,而去年底599元128M GDDR3版本的上市使其达到了性价比的巅峰.

    直到发布一年后的今天,7600GS的传奇仍在继续,也是目前中低端市场中最成熟、产品最丰富、销量最大的显卡之一,深受消费者推崇,堪称一代以高性价比为特点的经典之作。


    如果说GeForce 7600GS是2006年的中端性价比之王,那么GeForce 7300 GT 则是新一代的低端霸主,也可以说是NVIDIA的9550,而且其意义甚至还超过了7600GS。

    NVIDIA上一次中低端称霸还要追溯到GeForce4 MX440时期,那时候MX440凭借出色的性价比、良好的驱动支持,在低端及OEM市场全面开花,NVIDIA甚至还凭借GeForce GO MX440打入了ATI传统的移动独立核心市场。但是自从2002年在ATI发布Radeon 9000之后,NVIDIA在低端市场上就再没有领先过,其后的FX 5200、6200LE、6600LE都因为成本或是性能原因为Radeon 9250、9550、X550所压制,这一状况也一直持续到GeForce 7300GT 的发布。

    GeForce 7300GT采用了与7600GT相同的90nm G73核心,但为了合理划分档次,NV在硬件规格上作了限制,屏蔽掉了4条像素渲染管线和1个顶点着色单元,但是保留了全部的ROP单元因此7300GT的规格是8PS和4VS+8ROP的全8管线配置,在硬件规格上7300GT全面领先6600也是其成功的根本因素。部分管线的屏蔽还使得GeForce 7300GT的发热、功耗进一步缩小,超频能力也最高。

    NVIDIA对于GeForce 7300GT显卡的政策与以往完全不同,最出人意料就在于并没有限定7300GT的频率以及显存规格,也没有公版显卡参考标准。因此7300GT显卡种类繁多、规格各异,绝大多数厂商均推出了三款以上7300GT规格,令人惊叹。

    由于7300GT依然是G73核心,所以厂商既可以选择直接使用7600GS的各种公版/非公版PCB,也可以开发成本更低的方案,性价比优势更加明显。而且7300GT也可以支持SLI功能,两块显卡的价格不过1000左右,大大降低了SLI的价格门槛。
   
    550/1600MHz的7300GT  GDDR3在绝大多数游戏中均领先于ATI最高频的X1600XT,而7300GT GDDR2(450/800)也全面领先的X1600Pro(450/800),在成本相近的情况下几乎把X1600系列逼上了绝境。

     2006年后期基于全新80nm制造工艺G73-B1的7300GT  GDDR3也大量上市,不仅功耗下降,发热量更是大为降低,在1.4V的电压下,核心超频频率轻松达到700MHz以上,十分惊人,不仅横扫500元以下的显卡市场,G73-B1核心还被大量用于移动平台,移动平台独立显示核心也是今后增长最快的市场,以往ATI具有的传统的功耗优势从G73开始也被逐渐削弱。。

    7300GT的出现无疑了完善了整个GeForce 7系列产品线布局,也使得NVIDIA重新获得了丢失已久的主流市场。直到今天,7300GT仍然拼杀在500元以下的市场中,为NVIDIA扩大整体市场占有率立下了汗马功劳

R580确实强大,双核7950GX2出世
    进入2005年后期,NVIDIA和ATI在追求显卡的顶级性能上走上了不同的道路,ATI的做法是在单个GPU核心上集成更多的晶体管,而NVIDIA则采用了多核心以SLI方式协同工作的方式。

    Quad SLI最早出现在CES 2006展会上,NVIDIA和Dell正式将基于2组Geforce 7800 GTX 512的Quad SLI系统公开亮相,在为世人所瞩目。之后,NVIDIA又在3月份的Cebit2006大会上又发布了Geforce 7900GX2,为Quad SLI技术的实用化以及进一步推广奠定了物质基础。但当时的Geforce 7900GX2限于制造成本的高昂,驱动程序也有待完善,大规模上市的时机并不成熟,因此只为OEM和System Builder制造,没有在零售市场销售。
   

单卡性能之王 Geforce7950GX2

    2006年5月份正式推出了全新的Geforce7950GX2显卡。NVIDIA通过供电电路的优化设计,并在7950GX2引入了全新的BR03芯片,使卡内GPU间的数据管理、调度更加科学合理,提高了执行效率。两块显卡之间的连接也得到了简化,只需要一个SLI桥接器即可。Geforce 7950GX的意义还在于,这是第一款面向零售市场的可以用于组建Quad SLI系统的产品,使得Quad SLI的普及迈出了实质性的一步。

   

    7950GX2双芯片显卡最大的区别就是采用了双PCB解决方案,每块核心都集成在自己的PCB上,具备完整的板载显存和供电电路,而此前推出的双芯片方案都采用单PCB设计。作为NVIDIA亲自研发的多核心解决方案,在驱动等方面等会得到更好的支持,前景也更广阔。

    7950GX2 Quad SLI无疑是G80面世之前目前性能最强的桌面级显卡系统,尤其是在高分辨率下打开反锯齿后,游戏的FPS下降的幅度相对以往来说要小的多,其独特的SLi Antialiasing反锯齿技术可以带来最顶级的画质体验,而且7950GX2 Quad SLI对游戏的推动能力非常优秀,其最低FPS的数值比过去有了明显提高,也就说游戏帧数的波动小的多,能够明显感觉到游戏运行时流畅程度大为改善。但Quad SLI系统面临的主要是驱动问题,NVIDIA首次官方正式提供GeForce 7950GX2 Quad SLI的支持在去年7月份,但是还有些的问题有待解决,尤其是与DirectX的配合问题。由于多卡些同的工作模式对驱动的管理、控制功能要求更高,如果可以妥善解决,Quad SLI还有较大的提升潜力。

RV570遭遇强敌,难过7950GT一关

    拥有36个PSU的X1950Pro性能的确强大,无论规格功能还是性能都要全面压制7900GT/GS,不过NVIDIA提前给它准备了竞争对手,那就是拥有512MB显存的7950GT,得益于较高的频率和大容量显存,X1950Pro在和他的对抗中讨不到任何好处。

   

Geforce 7950GT

    不过,由于上市价格过高,因此7950GT并未对X1950Pro造成多大压力,不过随着时间的推移,时下拥有24管线的7950GT反而成为中端最具性价比的产品。NVIDIA刚刚发布的8600GTS甚至不敌它。


    众所周知,近些年来,在游戏软件方面,游戏中的数值计算操作所占的比重就越来越大、远远高于纹理操作,这是什么原因呢?我们知道,早先3D游戏提高显示效果主要是以提高多边形数量、纹理层数、精细度、以及使用一些特殊的贴图来实现的。从DirectX 8开始引入了可编程着色管线概念后,游戏编程的方式就有了很大改变,游戏开发中,为了更真实的模拟现实世界,应用了大量的数值计算,通过求解很多工程计算中常用的数学方程来实现对逼真的3D效果。


算术操作比例大大增加

    例如,电影特效和游戏中广泛应用的水面模拟就属于计算机图形学中的流体模拟,过去工程计算常用、较为复杂的NSEs(navier-stokes equations)也开始被用于互动娱乐软件的开发,当然,2D波方程因为计算量较小而应用的更广泛。对游戏中光线的模拟也是如此,例如有些游戏中使用了Radiosity方式的光照贴图,就包括了对光传输方程的求解。还有去年开始大规模的普及的HDR特效,其中在色调映射这个步骤中,也使用了三个计算密集型的数学方程,包含大规模的算术操作。另外物理引擎的大规模采用,如现在使用广泛的HAVOK物理引擎,也使游戏中出现了不少动力学方程。总之,这些都使得游戏中数学计算的比例越来越高,未来游戏也会和目前的通用计算相似,依靠更多的数值计算来提高3D显示、物理效果。


HDR渲染中的色调映射包含大量的数值计算

    在硬件方面,自从NVIDIA在NV20中引入可编程的SHADER处理单元后,GPU的发展就进入了一个崭新的时代,SHADER单元所具有的强大并行计算能力也使GPU的数学运算能力大幅度提高。特别是NV40对于SM3.0完整支持以及可以进行FP32浮点计算,可编程性能(各种分支操作,包括循环、if/else、重复、子函数调用)的大幅度提高及运算精度的提高,更使其具有了明显的流式信息处理器(stream processor)特征。

    目前的图形核心已经发展成为具备强劲并行计算性能并且编程方便的处理器。GPU不但提供了巨大的存储带宽和计算能力,也把运算提升到了浮点的精度(对现在通用计算来说,浮点精度是必须的条件),所以能够将现代的GPU看作是一种通用的流式信息处理器(stream processor),它完全适用于对任何流信息模型进行处理。



一种流处理器核心结构图

    由于GPU强大的并行处理能力,它的数值计算性能上大幅度超过同时代的CPU,因为后者更像是一种控制密集的型的处理器,并且拥有大量的CACHE。如Intel Xeon微处理器集成了1.08亿各晶体管,但是60%应用在CACHE上。而GPU则把大量的晶体管应用在算术逻辑单元(ALU)上,其不具有大容量的CACHE,直接在芯片上利用临时寄存器作流数据的操作。


基于CPU与基于GPU运算效率对比(越短越好)

     应用GPU进行数值计算的研究很早也就开始了,图形处理的并行性以及可编程功能一直是图形硬件发展所追求的目标。上世纪80年代出现的Pixel Planes 系列图形系统就可进行二次多项式的并行计算。进入新世纪后,2001年GeForce2的Texture Shader+Register Combiner就被用于求解扩散方程,2002年具有可编程Shader单元的GeForce3出现后,也被用来进行矢量、矩阵的基本代数运算,及求解有限差分方程组。

    未来,GPU将被越来越多的应用到传统图形处理以外的数值计算上,更多的基础数值算法也将被移植到 GPU 上,随之产生各种实时交互的模拟应用,比如对流体、光线物理行为的交互模拟,成为计算机科学的一个新兴领域。
    上面简单介绍了游戏发展的趋势以及现今GPU的特性,那么作为游戏程序与GPU之间的沟通桥梁,DirectX又有哪些发展呢?下面也简单介绍下新一代DirectX10的特点。


DirectX10的崭新架构

    DirectX10中引入了统一渲染架构,不再有的Vertex shader和Pixel shader的区分。这主要是在实际的游戏中,vertex shader和pixel shader的需求比例相差不小,由于过去GPU中的vertex shader和pixel shader的比例是固定,不够灵活,限制了开发人员自主创作的空间,也使GPU运算资源被浪费的现象时常发生。在统一渲染架构中,顶点和像素处理可以同时进行,而过去必须先进行顶点处理。所以,处理的并行性也被提高。


统一渲染架构的优势

    在DirectX10中,Shader Model 也发展到了SM4.0。Shader Model 4.0中引入了几何着色器(Geometry Shader),第一次允许程序在图像处理器中创建新数据,意义在于使GPU可以能够制造新的几何体,添加新的三角形,变成了既可处理又可生成数据的处理器,从而减轻CPU的负担。在游戏中,诸如dynamic cubemap(动态立方体贴图)、displacement mapping(置换贴图)、stencil shadows(模板阴影)等技术都需要由CPU来生成新的对象,而在DirectX 10体系中,GPU自身即可单独完成画面渲染,Geometry Shader甚至具有直接Render to Cubemap的能力,可以有效降低CPU负载。

    另外,Shader Model4.0的寄存器资源也大大提高,临时寄存器增加到4096个,常数寄存器增加到65536个,内插值寄存器采用16/32规格等。由于程序中的shader代码越来越长,SM4.0也引入了Switch 语句,使GPU的可编程性进一步提高,让程序员能过编写出更简洁、执行效率更高的程序,同时也可以产生效果更逼真的特效。关于DirectX10的新特性还有很多,由于篇幅关系,此处不再赘述。



    2006年无疑是NVIDIA的历史中非常成功的一年,凭借90nm GeForce 7系列产品的优异表现,NVIDIA在桌面独立核心的占有率(Q3)达到57%,尤其是在移动独立图形核心方面达到了53%的占有率,这对NVIDIA无疑是具有历史意义的,因为在移动独立图形核心一直是ATI最据优势的领域,是ATI多年来唯一没有失守的部分。而且和桌面独立核心市场已经出现萎缩的情况相反,移动核心的市场却大幅度增长。NVIDIA在移动平台的出色表现,也说明90nm G7X核心的功耗、发热控制的非常出色。

    2006年NVIDIA总收入为30.7亿美元,创公司年度营收新高,比上一年度的23.8亿美元,增长高达29%。其中净利润为4.488亿美元,也比上一年度的3.012亿美元增长幅度接近50%。


    面对非常有利的局面,NVIDIA还是保持了非常清醒的头脑,在产品研发上也没有丝毫懈怠。并于2006年11月09日发布了全新一代的GeForce 8800GTX显卡,将PC显示核心正式引入DirectX 10时代。
SpeedDrift
 楼主| 发表于 2008-8-29 19:10:59 | 显示全部楼层
DX10提前降临!8800领先ATI长达半年

    GeForce 8800GTX带来的不仅仅是令人惊叹的效能,更在于它所采用的统一渲染架构以及DirectX 10支持,同时强大的通用计算性能使其超强的物理加速能力,可以给三维游戏带来最真实的画面、互动效果。所以NVIDIA也把GeForce 8定调为“真实重新定义”的主题。
   

  GeForce 8800GTX

    GeForce 8800GTX的核心研发代号为G80,是PC平台上首颗采用统一渲染架构的GPU,同时也是首款支持DirectX 10、Shader Mode 4.0的GPU,极具历史意义。G80图形核心基于TSMC的90nm工艺生产,核心集成集
成6.8亿个晶体管,核心频率为575MHz,其中Unified Shader的运行频率为1350MHz。

    虽然80纳米工艺在已经被引入实际生产,但是对于晶体管数量庞大G80来说,台积电80纳米工艺还无法提供必需的良品率。而且新工艺生产的核心工作频率不总是比旧的高,像130纳米的R480和110纳米的R430就是一个很好的例子,所以采用90纳米工艺无疑更保险。



    在架构方面,G80的统一渲染架构中Vertex Shader(顶点)和Pixel Shader(像素)的区别已经不复存在,取而代之的是8组并行的阵列,每组阵列中有16个Stream Processor(流处理器)和8个Texture Filtering Unit(纹理单元),这样G80总共拥有128个流处理器和64个纹理单元。

    G80的统一渲染架构基于庞大规模的流处理器(Stream processor)来动态分配给各种操作。可以让每个处理单元都参与运算,每个流处理器均能够处理顶点、像素和几何操作,从而达到提高GPU的利用效率。

Streaming Processors

    过去,自从NV40以后,GPU核心中Shader单元中的每个ALU都有能力单周期完成一个3D+1D(也就是3D矢量+1D标量指令,它们如果并行,被称做co-issue)或者2D+2D总共4D这样的指令操作。而G80核心中,采用了采用完全的标量化设计,将3D+1D或者2D+2D这样执行能力为4D的“大”ALU拆分为1D的“小”ALU,然后将这些ALU组成8个阵列(TCP),每个TCP拥有16个ALU,它们被称做1D Scalar Streaming Processors。每个1D ALU都有各自的指令发射端口和控制资源,相对于4D ALU的浪费现象被杜绝,可以保证100%的执行效率。通过独特的内部分频技术,这些流处理器以超过时钟频率2倍多的频率(1.35GHz)运行,所以GeForce 8800 GTX的128个标量流处理器性能和64个4D SIMD的性能差距不是很大。当然也必须看到,在3D图形的着色程序中,3D+1D操作使用的更为广泛,所以传统“3D+1D”设计有一定的优势。但是,1D ALU的设计分配更加灵活、效率更高,更适合通用计算领域的应用。


G80的核心架构

    G80图形核心引入了Thread Control Unit单元,负责整个流水线的仲裁和控制,最大可以支持4096个1D 线程,比R520的(Ultra-Threading Dispatch Processor)512个4D 线程要大的多。G80在进行分支处理时的Batch Size(可以理解为分支工作的区域)为4x4x2,虽然不是很小,但与对Batch Size大小更为依赖传统SIMD架构来说相比,G80仍然具较更高的动态分支能性能。


Thread Control Unit

    由于 SM4.0中提供了全新纹理阵列(Texture arrays)的支持,NVIDIA继续保持了2:1的比例,纹理单元数目也提高到了空前的64个。


    ROP方面,G80拥有6组ROP(Raster Operation Partitions),比G71多了2组,既有24个ROPs单元,每组连接64bit显存控制器,这样G80就总共拥有规模空前的384bit的显存位宽,能够支持GDDR1、GDDR2、GDDR3和GDDR4显存。

    由于在G80身上GPU架构发生较大的变化,因此NVIDIA放弃了传统的CineFX命名,将其架构命名为Lumenex Engine(流明引擎),这里也简单介绍下流明引擎的新特性:

1. Coverage Sampling Anti-Aliasing (CSAA),引入多种全新抗锯齿模式:8xAA、16xAA和16xQ AA,单颗GPU就能实现高达16倍抗锯齿;

2. Lumenex Texture Filtering Engine,流明纹理过滤引擎,各项异性过滤图像质量大幅提高;

3. 支持128bit HDR,配合CSAA完美实现高倍HDR+AA;

4. 10bit Display Pipeline,64倍于上代产品的输出颜色数;

5. Quantum Effects,GPU物理加速技术。

产品简介 :


GeForce 8800系列规格对比

    GeForce 8800GTX作为新一代的旗舰产品,拥有拥有迄今为止最强大的硬件规格、最强悍的3D渲染效能。

   

GeForce 8800GTX

    由于GeForce 8800GTX的最高功耗为145瓦,整卡的长度达到32厘米,都是历史上PC显卡的最高纪录,显卡被一块体积硕大的散热器所覆盖,不过风扇噪音控制的比较好,即便在全速运行状态下也是非常安静。同时显卡上集成了两个6Pin接口,比单个接头+12V的电流输入的方式更加安全。显卡上也集成了两个SLI金手指,可以组建更为强大的GeForce 8800GTX SLI双卡互连。

   GeForce 8800GTX配备了PC显卡上最高的768MB GDDR3显存,显存为384bit位宽,频率为900MHz带宽更达到空前的86GB/s。

    GeForce 8800GTX零售价为599美元,非常具有竞争力,于2006年11月8日正式发布迄今已出货40万块,不仅叫好而且叫座。

   

GeForce 8800GTS

    GeForce 8800GTS是GeForce 8800GTX的简化版,也是GeForce 8800系列的普及版,默认频率500/1600MHz ,Stream Processor精简了2组,从128个减至96个,另外ROP单元减少了1组共4个,纹理单元为48个,显存减少了320MB 320Bit的规格。相对上一代顶级显卡来说,这样的规格仍然十分强大。

    8800GTS采用10颗8M×32Bit的显存就组成了320MB 320Bit的规格,显存的速度为1.2ns,默认显存频率为1600MHz。

    8800GTS散热器和8800GTX的结构完全相同,体积上要比GTX小一号,不过8800GTX的频率有所下降、部分管线也被屏蔽,所以功耗和发热都小得多。同时,8800GTS由于功耗的降低,只提供了一个6Pin接口供电,另外,显卡上的SLI接口也只保留了一个。

    Geforce 8800GTS 320MB的售价为299美元,非常具有竞争力,国内目前甚至已经打出了1999元的超值价格,比ATI的X1950XTX价格便宜很多,但性能却反而高出不少,所以Geforce 8800GTS 320MB无疑是目前性价比最高的准高端显卡。

8600/8500再次抢得先机,NVIDIA全线产品严正以待

    不过,G80的热销只是相对的,因为高端游戏玩家所占比例依然很小,据统计有75%的用户会选择千元价位的中端显卡。也就是说G80对于主流玩家来说依然是可望而不可即的,更多的用户是在期待中端DX10显卡,或者是在DX9和DX10之间犹豫不决。
    2007年4月17日,NVIDIA终于正式发布了基于G80图形架构的中端G84核心及低端G86核心,至此NVIDIA GeForce 8系列DX10全线显卡构建完成,DX10的普及之路由此开始,改朝换代的时刻终于来临了!

8600GTS


8600GT


8500GT

    现在,NVIDIA已经提前部署好了全线DX10产品,由此迎接即将到来的DX10游戏,已经竞争对手ATI的相关产品。从NVIDIA信心十足地表现来看,此次在DX10主流显卡方面再次抢得先机,ATI的相关产品即便是晚了半年之久,依然不敢保证能够击败同级N卡!
SpeedDrift
 楼主| 发表于 2008-8-29 19:12:32 | 显示全部楼层
●8系在继续 9系在延续
NVIDIA在第一代DirectX 10产品Geforce 8000系列上大获全胜,无论从低端还是高端都霸占着绝对的市场占有率。转眼至2007年11月,AMD-ATI为了挽回第一代产品上丢失的阵地,准备用第二代DirectX 10产品——Radeon HD 3000系列反扑。不过NVIDIA凭借在第一代DirectX 10产品上赢得的时间,早于Radeon HD 3000系列一周发布,不过NVIDIA并不像放弃Geforce 8000系列这个金字招牌,虽然使用了全新设计的G92核心,但是却为其命名Geforce 8800GT,它的出现也预示着新一轮GPU之争的开始。
众所周知,Geforce 8800GT采用了G92-270核心,这款核心在技术支持上可以看做是延续G8X,但是在核心制程和性能上都相对G8X有了长足进步。首先,G92核心为了在较小的面积上集成更多功能,其采用了先进的65nm制程并包含7.54亿晶体管,而且到目前为止G92仍然保持着单核晶体管之最。其次,作为NVIDIA新一代的中高端产品,首次加入了BSP技术和VP2引擎,从此解决NVIDIA中高端产品高清播放能力欠佳的遗憾。


Geforce 8800GT
Geforce 8800GT使用的G92-270核心拥有112个流处理器和16个光栅处理器,3D性能突出尤其是在DirectX 10游戏中的表现折服很多用户。不过NVIDIA此次发布的新一代产品并不是最强设计,因为G92核心硬件全规格为128个流处理器和16个光栅处理器。但是面对随后一周对手发布的Radeon HD 3870和Radeon HD 3850,Geforce 8800GT还是表现出了游刃有余的实力。
●8800再升级 全规格G92出击
G92在Geforce 8800GT上成功之后,NVIDIA看到G92核心的巨大潜力并随即推出了Geforce 8800GTS 512MB版。虽然在型号上与早期采用G80核心的Geforce 8800GTS 640MB/320MB重名,但是在规格、性能上Geforce 8800GTS 512MB却有了长足的进步,而且一经发布便问鼎最强单卡称号。值得一提的是,相对上一代顶级产品Geforce 8800 Ultra来说,Geforce 8800GTS 512MB仅为Geforce 8800 Ultra的一半不到,性能却在各项测试中打平甚至超越。

Geforce 8800GTS
Geforce 8800GTS 512MB使用了台积电采用65nm工艺制造的G92-400核心,其拥有全规格设计的128个流处理器和16个光栅处理器。虽然Geforce 8800GT与其仅差16个流处理器,但是由于Geforce 8800GTS 512MB默认高频,从根本上拉开产品间性能并确定高端形象。
Geforce 8800GTS 512MB和Geforce 8800GT都采用相同的P393公版设计,外观的不同主要是散热器升级为双槽高效散热器,显卡供电模组变为3+1相,这些设计都是为了解决由于高频等因素带来的大功耗和高温问题。

划时代的9系列 全面进军DX10
●千元重地 9600GT全力把守
如果说Geforce 8800GTS 512MB和Geforce 8800GT是G9X较早的应用,那么在2008年2月21日亮相的Geforce 9600GT则是Geforce 9000系列真正的开始。
正如上文所提及,采用G9X核心的产品2007年发布很多,例如使用G92核心的新Geforce 8800系列和G98核心的新Geforce 8400GS,而采用G9X核心并且命名归属Geforce 9000系列Geforce 9600GT是第一款。而且值得一提的是,此次Geforce 9000系列的全新开端与以往NVIDIA惯用的从高到低发布顺序不同,型号中百位数为“6”这很明显是NVIDIA定位中端的产品。NVIDIA此次采用从中端开始发布的主要原因也许有两点,其一 是行业竞争对手给NVIDIA形成的压力越来越小,其二是NVIDIA在这个段位上确实缺少一款可灵活操作的长线产品。
Geforce 9600GT采用了NVIDIA全新设计的65nm制程G94核心,其原生64个流处理器和16个光栅处理器。虽然从技术指标和着色器数量上看,G94核心很像是G92核心缩减64个流处理器而得,但是从核心面积及核心晶体管数上可以证明G94核心为全新设计产物,并非G92瑕疵品屏蔽规格而得。


Geforce 9600GT
由于在规格、成本上的优势,NVIDIA为其精准的定位于千元价格,虽然上市之初价格虚高但经过3个月时间的洗礼,加上生产工艺和制造成本的进一步优化,目前很多非公版Geforce 9600GT的价格已经跌破900元大关,并成为很多注重性价比尤其性能方面用户的首选。
不得不说的是,目前Geforce 9600GT和Geforce 8800GT在性能和价格上有很多重合的部分,但是很明显NVIDIA和所有显卡厂商都大力推崇Geforce 9600GT,这主要是因为在不久的将来Geforce 8800GT将恢复正身为Geforce 9800GT,与Geforce 9600GT彻底拉开档次,并进一步完善整条Geforce 9000系列布线。
●最强单卡 双核的“心”
NVIDIA在Geforce 9000系列上的第二炮是目前旗舰产品——Geforce 9800GX2,这款产品在3月18日发布后便夺回了Radeon HD 3870x2刚刚获得的最强单卡称号。与AMD-ATI在顶级产品上的设计不谋而合,都是采用了单卡双核的设计,而且设计、技术等成熟度上NVIDIA要领先一筹,毕竟上NVIDIA在Geforce 7000系列时代设计了Geforce 7950GX2这款双核产品。


Geforce 9800GX2
与Geforce 8800GT、Geforce 8800GTS一样,Geforce 9800GX2同样使用了G92核心,不过编号为G92-450芯片。Geforce 9800GX2使用了单卡双核设计,每颗G92-450核心拥有全规格的128个流处理器和16个光栅处理器,并且每颗核心独享512MB显存容量。高清播放能力已经被NVIDIA推到了与3D性能一样的首要位置,而且细心的用户可以注意到,在视频信号输出接口上Geforce 9800GX2标配了HDMI原生接口。
也许设计Geforce 9800GX2的意义并不单单是为了获得最高的性能,因为每项技术的诞生不仅仅是只考虑某一款产品,它会向以后产品中渗透及延续。通过Geforce 7950GX2和Geforce 9800GX2两代双核产品的试水,想必NVIDIA以后的顶级旗舰产品都会采用这种多核架构。

乘胜追击 确保领先 猜想GT200
●又一款G92 豪华98GTX诞生
G92强大的性能、经典的设计让其拥有了顽强的生命力和可塑性,在完成Geforce 8800GT、Geforce 8800GTS和Geforce 9800GTX产品组建后,又衍生出了Geforce 9000系列中最强单核产品——Geforce 9800GTX。
不过我们可以把其看做是Geforce 8800GTS的升级版,因为二者使用了相同规格的G92核心,例如拥有128个流处理器和16个光栅处理器。但在频率上Geforce 9800GTX相对Geforce 8800GTS有了大幅度的提升,所以性能上也会大幅度提升,而且值得一提的是Geforce 9800GTX的PCB做了重新设计,与Geforce 8800Ultra一样使用了象征着高端、尊贵的全黑色PCB,并且供电模组使用了豪华的4+2相设计,这是到目前为止民用级别单核显卡中最奢侈的用料。


Geforce 9800GTX
AMD-ATI和NVIDIA都看到了多核产品在性能上的优势,纷纷推出了CrossFire和SLI技术,这种技术不仅可以带来更强的性能,还会为平台提供更大的升级空间,而在后来出现的单卡多核产品也都是基于多卡多核的CrossFire和SLI技术衍生而来。
尤其值得关注的是,在显卡进入DirectX 10时代后,AMD-ATI和NVIDIA更是推出了成熟的多卡协作模式(GPU数量大于2),例如AMD-ATI的CrossFireX目前最高可支持4卡互联,还有NVIDIA的3-Way SLI和Quad SLI分别支持3核和4核互联。其中Quad SLI是针对单卡双核产品的双卡互联技术,Geforce 9800GX2可以实现,并且它与普通的单卡单核显卡组建双卡SLI一样仅需一组SLI MIO即可;而3-Way SLI则对SLI MIO要求比较苛刻,必须使用两组SLI MIO桥,目前支持这种技术的产品仅有Geforce 8800GTX、Geforce 8800Ultra和Geforce 9800GTX。
●未来探秘 NVIDIA进入第三代DX10时代
NVIDIA的步伐从未停止过,在Geforce 9000系列还未布局完毕时全新一代的DirectX 10产品又在酝酿中,它就是神秘的GT200。虽然NVIDIA官方对未发布产品一如既往的守口如瓶,但是在网络这条信息化高速路面前显得十分脆弱。一些网友通过非官方渠道获得了很多GT200相关信息,从频率到规格甚至产品流片图。
据目前网上的消息称,采用核心编号为GT200的产品为Geforce GTX 280,而这款产品根据NVIDIA未来的定义型号为D10U。这款核心或者说产品不仅仅是G9X的简单PCB、频率升级,而是在产品规格上做了重大更新。例如流处理器和光栅处理器暴涨为240个和32个,相对于全规格的G92核心几乎是100%的提升。根据Geforce GTX 280产品设计图纸了解到,PCB正反两面各拥有8颗显存构成512bit显存位宽,这也是继Radeon HD 2900XT又一款拥有512bit显存位宽的产品。


Geforce GT200
Geforce GTX 280的PCB版本号为P651长10.5英寸,尺寸与Geforce 9800GTX相同。在3D性能和技术上,Geforce GTX 280支持DirectX 10、PhysX、CUDA、PureVideo HD、OpenGL 2.1、SLI、PCI-Express 2.0等,也许是NVIDIA认为目前DirectX 10.1 API尚未成熟,所以在第三代DirectX 10产品中仍未加入丢DirectX 10.1的支持。
另外获悉,基于GT200规格缩减版产品有GeForce GTX 260,它相对与GeForce GTX 280缩减了48个流处理器和32bit显存位宽,即192个流处理器和448bit显存位宽,在其它规格和技术支持方面与GeForce GTX 280相同。

Geforce 9800GTX+
  2008年6月16日NVIDIA发布了下一代旗舰级产品Geforce GTX280,吸引了整个行业的眼球,不过正当大家把注意力集中在Geforce GTX280身上时,Geforce 9800GTX+悄悄空降来临,NVIDIA公司于当地时间6月19日发布了基于55nm制造工艺的Geforce 9800GTX+。Geforce 9800GTX+是Geforce 9800GTX的加强进化版,主要针对竞争对手HD4850,该产品官方定价229美元,而GeForce 9800GTX售价则被下调到了199美元,与HD4850持平。Geforce 9800GTX+发布的恰当好处,随着GTX280和9800GTX+的相继发布,在前有虎、后有追兵情况下,HD4000系列似乎陷入了NVIDIA精心设置的包围圈。Geforce 9800GTX+同样采用G92核心,不过在制造工艺上升级成了55nm,这使得Geforce 9800GTX+的核心面积比Geforce 9800GTX小了不少,同时制程工艺的提高还有利于降低功耗,使核心发热量降低。

GeForce GTX280
GTX280采用台积电65nm工艺,核心面积达到576平方毫米,而同为65nm工艺的G92则是330平方毫米,90nm工艺的G80为484平方毫米。GTX280正面8颗GDDR3显存,背面也有8颗GDDR3显存,6pin+8pin供电,PCB长10.5英寸(26.67厘米),双槽风扇设计.
SpeedDrift
 楼主| 发表于 2008-8-29 19:15:42 | 显示全部楼层
总结与展望:

    2007年2月份,NVIDIA公布去年第四季营收报告,其中GeForce 8800系列于2006年11月8日正式发布后40万块,2006年第四季度与年度营收均再创新高,年度总收入首次突破30亿美元,NVIDIA再次成为成长率最快的半导体公司之一。


    对于今后GPU市场竞争的格局来说, 2006年老对手ATI被AMD收购这一事件的产生的影响还是不小。众所周知,2006年7月24日NVIDIA的传统合作伙伴AMD以54亿美元收购了自己的主要竞争对手ATI。从此,GPU市场上,AMD成为NVIDIA直接的最大竞争对手,这当然对NVIDIA也产生了一定的影响,尤其是双方在AMD平台芯片组方面一直合作良好,今后会发生怎样的变化尚难以预料。不过,另一方面,过去一直提携ATI的CPU巨头INTEL则准备缩小双方的合作规模,转而与NVIDIA靠的更近。

    虽然NVIDIA和ATI两强争霸的局面还将持续下去,但是在GPU这个充分依靠技术实力的领域中,NVIDIA对先进技术的孜孜追求也将使其立于不败之地。未来,NVIDIA将在多个领域呈现强劲的增长势头, 第一,NVIDIA IGP芯片组将深入Intel平台市场,。第二,新一代Vista操作系统、DirectX10的普及与也使得GPU在PC系统中的地位进一步提高,NVIDIA的影响力也将进一步扩大。另外在移动GPU平台,NVIDIA去年实现了对ATI的反超,GeForce7系列的优秀的性能/功耗比也将使NVIDIA在这个强劲增长的领域内获得更大的成就。

    近些年来,手持式移动多媒体领域随着手机以及便携视频播放器的大规模普及而出现惊人的增长。而在技术方面的进步比PC图形系统高出数倍,从PC产业建立到1995年为止,15年内没有标准的图形API随着技术的不断进步,从手机产业建立到2004年为止,仅花了四年就有了自己的API(OpenGL ES),发展速度惊人。同时,消费者对手持式移动产品的多媒体性能要求也越来越高,包括3D游戏、视频播放等变得日益普及。GPU全面进入手持式移动多媒体领域已成为未来发展的趋势。为此,NVIDIA也做好了充分的准备,在去年收购PortalPlayer公司后,进一步加强了自身在MobileMedia、Mobile 3D领域的实力。虽然,这一市场上ATI起步较早,现在的市场占有率也更大,但是NVIDIA后来者居上也并非空谈。

结语:



  半年更新、一年换代是NVIDIA长期奉行的产品更新策略,正是这样的赶超自我的驱动力让NVIDIA在激烈的技术市场厮杀中胜出,回顾近年来NVIDIA高端产品的发展历程,几乎半年一次的新产品更替速度不仅让竞争对手疲于应付,还有效的进行了优胜劣汰,让懦弱者沉沦于历史长河之底,让勇敢者抵达光辉的彼岸。

          百度百科 http://baike.baidu.com/view/16412.htm

评分

参与人数 1经验 +5 收起 理由
gpgt + 5 这么多图.差点整死机了. 呵呵

查看全部评分

永远Ъù分手
发表于 2008-8-29 21:21:03 | 显示全部楼层
楼主辛苦了
我作为N卡的粉丝
以前看过这篇文章了
很好很强大
但是楼主这么辛苦发这个
支持
给你加个人气
jer
发表于 2008-8-29 23:30:38 | 显示全部楼层
嘿嘿..虽然是我喜欢A卡~
但是还是要支持一下~~~
yczhou
发表于 2008-8-31 07:38:18 | 显示全部楼层
一口气发了这么多,辛苦了,辛苦了~
您需要登录后才可以回帖 登录 | 快速注册

本版积分规则

手机版|杀毒软件|软件论坛| 卡饭论坛

Copyright © KaFan  KaFan.cn All Rights Reserved.

Powered by Discuz! X3.4( 沪ICP备2020031077号-2 ) GMT+8, 2025-1-23 03:11 , Processed in 0.113577 second(s), 14 queries .

卡饭网所发布的一切软件、样本、工具、文章等仅限用于学习和研究,不得将上述内容用于商业或者其他非法用途,否则产生的一切后果自负,本站信息来自网络,版权争议问题与本站无关,您必须在下载后的24小时之内从您的电脑中彻底删除上述信息,如有问题请通过邮件与我们联系。

快速回复 客服 返回顶部 返回列表