2000元高端显卡:gtx260与hd4870
采用55nm制作工艺的gtx260
geforcegtx200系列带来了全新的第二代统一架构。而第二代统一架构最大的特点就是在全部继承第一代统一架构的优点后,提升各单元处理器能力的同时也提升了效率,真正意义上把同一架构发挥至极点。为了适应未来并行运算的需要,geforcegtx200系列显卡开创性提供了2种不同的架构——并行处理架构与图形处理器架构。
完整的gt200架构
优化的shader/tf比值适应未来的需求
在图形处理方面,geforcegtx200可以说有了成倍的性能增加,不仅在流处理数量方面的成倍增加,在跟图形处理器息息相关的几何着色器(geometryshader)及数据流输出(streamoutput)、rops、纹理填充率以及寄存器方面都有长足的进步。
tpc(计算处理器群集)中多添加了一组sm
目前,越来越多的游戏以及应用程序都需要大量的shaders,未来在shaders以及纹理单元上寻找一个最佳的平衡搭配,geforcegtx280显卡在每组tpc中,多添加了一次sm,然后保持tf的数量不变,这样一来shaders与tf的比值要比上代产品提高50%,非常适合目前以及未来的游戏和应用程序的需求。
提升几何着色器及数据流输出(streamoutput)的表现
随着dx10游戏的流行,在dx10规范中首次引用的几何着色器(geometryshader)作用用来越显著。为了提升gt200的游戏表现,顶级geforcegtx280内部的输出缓冲限制已显著升至上代产品的6倍,提供了更快的几何着色器(geometryshader)速度以及数据流输出(streamoutput)表现。
测试demo美杜莎很大程度上依赖几何着色器及数据流输出的表现
加倍的寄存器文件
在上代旗舰g80核心中,在每组流处理集(sm)里面添加了高速的本地缓存用于存放shaders之间计算完的活跃数据。但随着编程的复杂度增加,shaders的处理器能力也得到了成倍的增加,一次可完成上千条指令。寄存器的容量就成为了整个核心的瓶颈,当sm内寄存器的容量不足以保存全部处理后的活跃数据时,溢出的数据就会直接存放到显卡的显存当中,而本地显存较大的延时会严重影响性能。为了解决这个问题,适应未来更复杂的编程需求,在gt200核心的寄存器容量直接提升至上代产品的2倍,大大减少了数据溢出到本地显存的机率,使gt200的运算性能更强,运算效率更高。
升级rops(光栅化处理器)
最新的geforcegtx200系列gpurops不仅全部支持上代产品的特性,而且还实现了最大32pixels输出每时钟,等同于八个rop分区中每个rop分区输出4pixels每时钟,同时每个rop分区在8xmsaa下支持32色彩和z采样每时钟。像素方面采用了u8(未签名8bit整数)数据格式,像素的混合比率是上代产品的2倍。跟仅有6个rop分区以及支持24pixels输出每时钟,12pixels混合每时钟的上代产品相比,gtx280提升到支持32pixels输出和混合每时钟。能给用户带来更绚丽更真实的视觉效果。
4面向未来:cuda并行计算的应用
随着显卡的发展,gpu越来越强大,第二代统一渲染架构的geforcegtx200系列拥有200多个单独的alu,因此非常适合并行计算,而且浮点处理能力也远远优于目前的多核cpu,加上gpu为显示图像做了优化。在众多计算领域上已经超越了通用的cpu。如此强大的芯片如果只是作为显卡就太浪费了,因此nvidia推出cuda,让显卡可以用于图像计算以外的目的。cuda(computeunifieddevicearchitecture)工具包是一种针对支持cuda功能的gpu(图形处理器)的c语言开发环境,未来还将发布fortran语言版本。
cuda(computeunifieddevicearchitecture)是一个新的基础架构,这个架构可以使用gpu来解决商业、工业以及科学方面的复杂计算问题。跟以往的gpgpu概念不同的是,cuda是一个完整的解决方案,包含了api、c编译器等,能够利用显卡核心的片内l1cache共享数据,使数据不必经过内存-显存的反复传输,shader之间甚至可以互相通信。对数据的存储也不再约束于以往gpgpu的纹理方式,存取更加灵活,可以充分利用streamout特性。以上几点都将大大提高gpgpu应用的效率。例如,在游戏中我们可以使用cuda来让gpu承担整个物理计算,而玩家将会获得另他们感到惊奇的性能和视觉效果。另外,用于产品开发和巨量数据分析的商业软件也可以通过它来使用一台工作站或者服务器完成以前需要大规模的计算系统才能完成的工作。这一技术突破使得客户可以任何地方进行实时分析与决策。同时,一些以前需要很先进的计算技术来达到的强大计算能力的科学应用程序,也不再受限在计算密度上;使用cuda的计算可以在现有的空间里为平台提供更强大的计算性能。cuda采用c语言作为编程语言提供大量的高性能计算指令开发能力,使开发者能够在gpu的强大计算能力的基础上建立起一种效率更高的密集数据计算解决方案。
并行处理器在各个方面都有优势
cuda工具包推出已有1年,它的推出马上受到了众多软件/游戏开发商以及科研机构和程序爱好者的欢迎,nvidia方面也将发布最新的cuda2.0版本。相信在未来,cuda将会受到越来越多的领域的支持。目前,支持cuda环境的gpu主要有采用统一渲染架构的显示核心。
下面是cuda实现的gpu并行计算应用:
badaboom视频压缩
一直以来,视频编码的转化都是令用户非常头疼的一件事,一款顶级的处理器在转换容量巨人的视频文件的时候,慢如蜗牛的速度令人难以忍受,这也主要受目前cpu性能的制约。目前,nvidia与许多软件开发商在推广支持gpu加速的视频压缩软件,badaboom就是一款支持gpu加速的视频转换软件,可以把mpeg2的视频转换为ipod或者iphone这样的所使用的h.264视频格式,据称速度方面是目前cpu转化的10倍以上,为了验证其真实性,我们就做了一次相关的评测。
早在2007年,adobe就与nvidia展开合作,推出了支持gpu加速的pdf版本,adobeacrobat8及adobereader8系列产品提供全新的页面显示着色技术,利用gpu来加速pdf格式下的绘图及显示功能,除了在效能上有所增进外,还可以利用gpu的可编程特性,进一步加强pdf文件中的2d内容展示效果。
据adobe平台产品营销总pamdeziel表示,nvidiageforce与quadrogpu使用者可利用pdf档案进行更多样的作业,同时也能更有效率。包括平移、卷动、缩放等,实际上adobereader8每一项运用到gpu的功能都有着显著的效能增进。使用者过去避免使用的一些应用,例如可进行极精细比例缩放的地图,现在都可以轻易地显示。
打开同样复杂的一幅图表,利用gpu加速你可能会获得更快的浏览速度
5更真实游戏体验:physx物理加速回顶部
5更真实游戏体验:提供physx物理加速
随着nvidia收购ageia公司,业界最先进的physx物理加速技术的加入,让大家对于gpu支持物理加速期待已久。不久前,支持geforce8/9/200系列的显卡physx物理驱动终于发布了,通过物理加速驱动,gpu能分担cpu的工作,从而提高游戏的执行效率,目前主要体现在3dmarkvantage测试中。按照nvidia自己宣称的physx是目前最先进的物理加速引擎。
不带物理驱动的测试成绩
安装物理驱动的测试成绩
讯景gtx260(gx-260n-adf)图 库评 测论 坛报 价
类型公版gtx260的散热器
双6pinpci-e供电接口
接口部分
inno3d映众gtx260+(55nm)图 库评 测论 坛报 价
接口部分
gtx260拆解图
类似公版65nmgtx260的一体式散热器
sli接口与nvio芯片
55nmgtx260映众拆解图
gtx260公版拆解图
55nmgtx260公版背面
65nmgtx260公版背面
55nm/65nmgtx260供电模块(左为非公版,右为公版) geforcegtx260公版供电部分的做工跟用料上完全可以用奢华来形容,不计成本的大量采用了陶瓷贴片电容以及封闭式电感。采用volterra的顶级数字供电方案,主控芯片为vt1165mf搭配5颗vt1165sf芯片为核心提供5相供电,显存方面也采用了2两相供电。
55nm和65nmgtx260核心图(左为55nm版本,右为65nm版本)
55nmgtx260
65nmgtx260
geforcegtx260896mb(576/1998mhz,sp:1242mhz)
radeonhd48701gb(750/3600mhz)