5 D6 K' T$ m" _ A
6 l; E3 M/ N [4 |, S+ Z+ j
倍受“N饭”以及众多游戏玩家瞩目的NVIDIA下一代GPU产品:GTX200系列,将在2008年6月16日晚正式发布,也就是说,在大家看到本文的时候,其实还没有正式的发布。不过我们电脑报已经在一周之前就拿到了GeForce GTX280的工程样卡并进行了详细的测试,因此可以在其发布之前,最早地为大家送上有关GeForce GTX280的详尽介绍。接下来就让我们来仔细了解一下NVIDIA这款率先支持异构计算的显卡到底为我们带来了什么样的惊喜。
1 l; @ S0 l/ i+ }9 G1 QGTX200系列,第二代统一架构的GPU + b- }! w: D) L1 y
9 j- s& i2 W' a: I 首先让我们来看看NVIDIA提供的GTX200系列技术资料中提到的设计重点。 % q' v* h! M0 N4 |1 }9 a
●提供两倍于GeForce 8800GTX的性能。 & P! n% z8 ?1 U
从图形处理部分的规格来看,GeForce GTX280提供了240个“核心”(注意这里NVIDIA已经将以前的流处理器直接称呼为核心,表现出GPU开始向CPU挑战的野心),相对于GeForce 8800GTX的128个来说几乎是提升了一倍。另外,GeForce GTX280的显存配置也从GeForce 8800GTX的768MB/384bit提升到了1GB/512bit。再加上处理数据的方式进一步优化,GeForce GTX280实现双倍于GeForce 8800GTX的性能也不在话下。
6 k# a: U* V( e; m6 E8 | ●根据将来大量使用复杂Shader和显存的游戏重新平衡架构。 2 K% p0 E8 \8 b5 r/ b, E
由于将来的游戏对于像素填充性能的需求增加,GeForce GTX280将更高的Shader优先级划分给了材质处理,相对于GeForce 8800GTX来说这个比例几乎提升了50%,在实际应用中大约会获得20%的材质处理能力的提升,这就使得GeForce GTX280在应付目前和以后的3D游戏时表现会更好。GeForce GTX280光栅处理器的工作频率相对上一代的GeForce 8800GTX提升了一倍,这也意味着在高分辨率、多重采样的情况下,GeForce GTX280的性能提升更明显。 ; D0 M" r5 D. F, I, O
●提供更高的GPU每瓦性能和每平方毫米(核心面积)性能。 + U ]! i4 |- b# g- {6 @: Z h
GeForce GTX280的满载功耗是236W,GeForce GTX260的满载功耗是183W,功耗虽然很高,但相对于上一代的产品来说提升的性能会更明显,所以每瓦性能以及每平方毫米性能都会更好。 3 f4 a+ Q' [$ {; E/ _) {; [+ p5 Q
●提升DX10特效性能,例如几何Shader和流输出。 4 N. T. K; @, e1 Z0 ^9 P! j8 a% I
GeForce GTX280的几何Shader能力得到增强,在几何处理方面的性能更加强大;提升了一倍的寄存器数量让Shader处理的指令数量可以达到上千条,溢出到内存的数据大大减少,提高了处理的效率。 ) ?3 F- z' r/ o- R
●提供针对高性能CUDA程序以及GPU物理运算(PhysX引擎)的计算能力。
: _ B0 l) F( I! z, C; N 在强大的CUDA支持下,GPU也能完成很多异构计算的工作,例如视频编码、科学计算、物理引擎计算等,而这些以前都是CPU的专利,但现在GPU甚至可以在这些方面提供数十倍于CPU的性能!
, y4 S/ i& i) L8 L, B9 a1 H ●提供更好的电源管理兼容性,将闲置模式的功耗降到更低。 7 v, @- O1 \% {$ h
在高负载的情况下,GeForce GTX280的功耗会比GeForce 9800GTX高不少,但在闲置模式下,GeForce GTX280会比GeForce 9800GTX更省电!例如在运行3DMark06的时候,GeForce GTX280的功耗为147W,GeForce 9800GTX为80W,但在闲置的时候,GeForce GTX280的功耗仅为25W,而GeForce 9800GTX为45W,差距非常明显。 % ^5 h( h8 b: g$ E; \- B
GeForce GTX280实物抢鲜
p4 f+ r G% H4 a7 s; g5 ]) y" ]2 \ V9 K6 [; M* H: J2 b) W
- P" Q) _6 `2 D
$ ?9 O: W }5 w2 Y, N6 b7 J
& v" \3 z9 |8 z- j5 c6 g 我们从NVIDIA老家圣克拉拉带回的这一款GeForce GTX280工程样卡从外观上来看与上一代顶级显卡相比并无特别之处,依然是采用占用双卡位的巨大散热器,提供了支持三路SLI的接口。再来看看具体的规格,GeForce GTX280核心频率为602MHz,提供了240个核心,处理器(Shader)频率为1296MHz。从频率上来讲,GeForce GTX280并无太大提升,但核心架构的改变让它的执行效率有了很大的进步。显存部分,依然使用了GDDR3的颗粒,位宽提升到了512bit,容量也高达1GB,显存频率达到了2214MHz。视频处理部分,GeForce GTX280采用了和G92一样的VP2单元。 ; @: A: c3 Z. w
GeForce GXT280参数规格及对比 | | GeForce GTX280 | GeForce 8800GTX | 核心数量 | 240 | 128 | 核心频率 | 602MHz | 575MHz | 处理器频率(Shader频率) | 1296MHz | 1350MHz | 显存频率 | 2214MHz | 1800MHz | 显存容量 | 1GB | 768MB | 显存位宽 | 512bit | 384bit | 运算精度 | fp64 | fp32 | 材质填充 | 48GT/s | 37GT/s | 光栅混合 | 19GBL/s | 7GBL/s | PCI-E带宽 | 12.8GB/s | 6.4GB/s | 视频处理单元 | VP2 | VP1 |
: @% [4 M! Z( q5 D, u% W4 ?- E
实战性能测试 2 I4 d: B" Z: i, p# q5 Q9 p/ c
测试平台
; O: {! v4 h5 ?/ W4 n2 \处理器:Core 2 Duo E8200
9 [8 W2 v" X0 T. C- A1 z V9 p内存:金士顿DDR2 800 1GB×2
3 E, E* y S; _) @主板:华硕P5Q Deluxe " u/ x: t7 X# r
显卡:GeForce GTX280 3 R# A0 d( p4 s7 X8 f
GeForce 8800GTX
+ x, n4 [9 v2 A a硬盘:希捷酷鱼7200.11 1TB & W3 y3 X5 s- f1 R0 }
显示器:BenQ G2400W
$ B; u8 ^! p' z5 ~( C$ y电源:航嘉磐石800 , ?1 J* _9 C: K9 n% o% b9 z
测试环境:Windows Vista32 + SP1
, N; b/ [) m1 W3 o( T. z) ] ForceWare177.34
% @$ ^& `: y) m# s4 [5 G: U+ I J2 M8 G1 {0 w$ r' n
6 O# A- m: B9 y$ h% c; D2 w2 }/ U% D
5 q/ P0 v3 Z6 u
性能测试表 | ! c; j" g$ U F S. {6 M. d, y
| GeForce GTX280
( Q" b( I2 t! x) F. [- P | GeForce 8800GTX ) }+ E: N5 e4 W
| 3DMark Vantage 6 e) T' J% X6 F4 {6 h; W! T& h
| Extreme
# Z- g+ O; a6 H. m8 N | X4759 $ L+ A% Y/ e' z6 F! Y
| X2227
2 A. h- g( I& Y0 k) {* } | Performance
% w1 b" h) [6 w! L' D; [' }4 o | P8275 & J w! s/ x) V( h$ H
| P5255 " {( P# Z! q3 F- `' [
| 《孤岛危机》
$ }" D0 L- U$ k, x( e; n | 1900×1200@32bit
" ], P( v( i/ h) M. j0 t最高画质/16×AA
3 a% F" i2 H* _ | 15fps
: s5 F1 f( a$ X9 L: h7 X z | 1fps
+ f% h: [9 l3 }9 A2 d5 o8 r4 i | 1680×1050@32bit 6 }1 \* }: } F& v8 N
高画质 $ ^+ q7 l0 { P- f1 ~7 f8 F
| 37fps . l7 b3 d& I" \5 b# g* r, g
| 27fps
6 x6 H; G: Y; m g | 《失落的星球》 ; O% e" u5 ~$ l) Z5 v, i
| 1920×1200@32bit
6 A9 g5 \5 M! |- K最高画质/16×AA/16×AF
" e1 I" z+ v% H | 42fps + b/ F' u+ n* s6 n) }; p! l6 |, _
| 24fps / Z! i# b% G* E1 U. v2 |- J$ J1 n
| 1600×1000@32bit
& M6 i4 X; K0 a3 ^6 L最高画质 6 G9 ^/ S" m1 x. E
| 96fps 0 |* A, E% Z* k' |
| 57fps
) W6 S5 H+ @# n# ?4 y& ? | 《鬼泣4》 - K5 K4 C- f7 P% X
| 1900×1200@32bit
7 J: c% V# Q6 T: W+ [% u$ z5 B最高画质/16×AA
/ t$ y% ?1 H. p+ D+ L | 83fps ' u8 p) y* b' C3 a/ l5 A
| 46fps
: m9 `+ W3 e3 J$ W3 c+ G | 1680×1050@32bit 4 H3 r& a- ~& A/ E' Y$ O8 x
最高画质 0 x6 o& K) }) e$ s: F7 x1 U, {
| 162fps
7 [6 \# |) \8 }4 k | 85fps ( o% T1 m: B, t& J- w1 o/ F
|
7 y9 y5 I: s3 F0 z k2 }
4 y- U: c3 r4 V2 v2 t5 v7 r GeForce GTX280的性能的确给了我们一个惊喜,从整个测试情况来看,GeForce GTX280几乎在所有测试项目中提供了两倍于GeForce 8800GTX的性能——甚至在一些项目中得分为GeForce 8800GTX的两倍还要多。GeForce 8800GTX双卡SLI也未必是GeForce GTX280的对手。
$ V( U. e' z3 p% _4 e. u6 r" R GeForce GTX280最明显的优势是在高分辨率和开启AA(抗锯齿)的高画质模式下。从3Dmark Vantage的Extreme、Performance两个档次的测试得分来看,在Extreme这样近乎“变态”的参数环境下,GeForce GTX280相对GeForce 8800GTX的优势更大。另外,最有说服力的测试就是《孤岛危机》的最高画质测试,GeForce 8800GTX由于显存只有768MB,完全无法应付1900×1200@32bit、16×AA画面设置下对显存的巨大需求,游戏速度仅有1fps,而GeForce GTX280仍然可以达到15fps。
; |/ r5 \7 ~2 Q# p( D% }
总的说来,GeForce GTX280的确达到了几乎两倍于GeForce 8800GTX的性能,在频率相差并不大的情况下,更多的性能优势其实来自于架构上的改进与显存规格的大幅度提升。
) A1 s( R& c$ p+ ]体验异构计算/ u$ g* Y2 @) |% F1 f
& y0 c: b: t* I! O4 `) [, \
: |# b$ s$ t0 o( J! J
本次测试中采用的Badaboom是一款视频转换软件,可以把MPEG-2的视频转换为iPod或者iPhone、PSP等设备可以使用的H.264视频格式;Folding@home则是斯坦福大学的一个分布式计算计划,可以利用分布于全球的计算机模拟复杂的蛋白质折叠效应,是一款典型的科学计算程序,它可以利用GPU/VPU进行计算。
6 M& ?4 ]9 g7 x/ l; Q+ q$ ?
i- C U$ b( \$ K4 }7 Y; n( d& D1 {6 {7 g1 H/ Q! Y. y+ F9 w
187MB MPG(MPEG-2编码)文件转换为iPhone使用的MP4文件(H.264编码) + W9 }- O! |3 N. b7 f7 A, P
| GeForce GTX280 * ]6 f0 t; a2 v) [5 Y, d/ R6 b
采用Badaboom转换 # e# D" [& C2 l8 F- K, h$ A) w
(GPU运算)
+ V* @ g: d" h& M% l7 U | Core2 Duo E8200
# G# i6 T/ Q9 X, ?; f采用iTunes转换 ) V4 y! P' }$ C+ J; T1 Z- @
(处理器运算)
* @- e7 V. ^/ n2 g | 25秒
5 y& T/ b* d- M$ r f O) M$ a4 B: J | 85秒
4 m( B. p; z0 S$ s% [( G |
3 G& E) U2 ^2 C. ~6 B, n
- J- f. e: v, ~/ j3 D 很明显,采用CUDA制作的Badaroom充分利用了GPU的强大计算能力,在视频编码方面相对CPU有比较明显的优势。而且从转换后的视频效果来看,甚至比iTunes转换的还要稍好一些。当然,Badaroom现在支持的文件格式还很少,不过CUDA是完全开放的,软件开发者可以利用它继续完善这一类软件的功能,因此我们认为通过CUDA让GPU实现异构计算是非常具有发展潜力的。 3 O! A: f3 y1 M. t! {* h1 s5 X
Folding@home分布式计算性能! \% E3 N( v E7 @& d
/ P3 m3 k( p" M$ I7 E. Y, _
|
+ Q1 K' t* a$ K# G! P0 _" E | GeForce GTX280 | 单位:NS/day | 670 |
- ~3 U' o% R9 _9 o7 f2 a; C
Folding@home的测试结果再次给我们展现了GeForce GTX280强大的计算能力。而1.6GHz的双核处理器,这个得分基本上是在10NS/day以下。
0 q6 E8 d( h% ^1 p
7 @! ^/ Z' U% S! [0 W# ~工程师点评: K/ j5 ?" v0 m; U
" K( s' k; A L' F硬件评测周刊 王诚 # k1 O- Z9 K) m( c
5 J4 U( E# ~" ~0 O A$ K 采用第二代统一渲染架构的GeForce GTX280的确从性能上给我们带来了一个惊喜,仅用单卡就能提供相当于GeForce 8800GTX SLI的性能,对于高端发烧玩家来说,的确又是一件价值不菲的礼物。当然,GeForce GTX280给我们带来的不仅是在高分辨率、高画质下强悍的性能,还有一些新的亮点,包括崭新的异构计算应用、物理加速能力(PhysX)和能耗控制技术。' X4 h) w+ y, U, N/ k6 |6 f
J0 ?' P# q- m- d7 `# ]8 b' P
NVIDIA通过CUDA让GPU可以实现异构计算功能,也就是完成部分CPU的工作,而GPU先进的架构设计让它们在完成一些科学计算时表现出异常强大的性能。不过这方面的软件还处于雏形阶段,相信经过一段时间的完善之后,GPU的通用计算能力还将进一步被挖掘出来——要知道CUDA可是完全免费的,任何人都可以用它来开发可以利用GPU计算能力的软件。
* j; v6 `& P/ ^1 `. o0 V" @% G. D0 b F& ~( Q7 Y% e( v
NVIDIA收购Ageia就是为了让物理加速成为GPU的一部分。很快的,我们就将用上带物理加速(使用PhysX引擎)的ForceWare驱动。就在本周,NVIDIA会正式发布支持PhysX的显卡驱动(暂时可能只有GeForce GTX280/9800GTX/9600GT支持),到时候使用这些显卡的用户就可以在支持PhysX物理引擎的3D游戏中感受到不一样的体验了。
3 K- d+ @" }" \
- J: e3 U3 f7 l g, n4 y 总的来说,GeForce GTX280作为NVIDIA针对发烧级用户的旗舰产品,其霸主地位完全确立,AMD随后将推出的RV770系列也只是针对GeForce 9800GTX等级的产品,所以在399美元这个价位段上,NVIDIA暂时没有对手。当然,对于普通用户来说,采用GTX200系列架构的简化版产品才是最实在的,可以用主流的价格享受到异构计算、物理加速等等功能,相信大家不会久等了。 |