- 等级
- 砌墙工人
- 等级进度
-
- 积分
- 92
- 阅读权限
- 35
- 主题
- 精华
- 社区币
- 星梦
- 注册时间
- 2007-7-21
- 最后登录
- 1970-1-1
|
● AMD K10桌面处理器新品牌“Phenom”9 x1 A+ W& Y3 i
相信大家仍然还是最关注AMD面向桌面的四核处理器,让我们先来看看官方正式宣布了用于下一代四核心、双核心高端、主流桌面处理器的新品牌“Phenom”。在K6之后,AMD的K7、K8架构桌面产品都采用了Athlon品牌,与笔记本的Turion和服务器的Opteron组成AMD的整体产品线。而进入K10架构之后,Athlon将被废弃,取而代之的是新的“Phenom”。
( L. T$ R8 z8 K. r: ]( H6 s& T$ @& m0 I1 b; p2 p
! k: R; E# L& M" L
AMD确认“Phenom”命名
3 ?) @4 E. @4 q4 d& Z. I7 J* q P
据AMD代表确认,Phenom的确源自英语口语,意为“杰出人才”,发音类似精简版的“phenomenal”(显著的、现象的)。Phenom处理器由三部分组成:双路四核心Phenom FX(Agena FX)、四核心Phenom X4(Agena)、双核心Phenom X2(Kuma)。AMD只是说它们的架构都源自于服务器的Barclona Opteron,但没有披露任何型号和规格信息。有消息称,Phenom X4主频2.7-2.9GHz,功耗125W;Phenom X2主频2.0-2.9GHz,功耗89W。
- | w. _7 H: z6 k( v: z* f AMD产品经理Ian McNaughton指出,Phenom平台支持DDR2-1066规格内存,而“在OEM厂商有所需求之前”,AMD不会转向DDR3。
, V: ]) l+ H/ q+ Z) u 在启用新品牌后,AMD还将全面放弃型号中的“64”字样,因此原来的Athlon 64 X2将改名Athlon X2并进入低端市场,单核心Athlon消失,单核心Sempron暂时还会存在,竞争Intel的Celeron。今年第三季度,AMD将发布多款新Sempron,基于65nm Sparta核心,包括35W节能型的3800+、3600+、3500+、3400+等。2 [3 K, B% v7 s2 K) V
此前我们已经知道的四核心Agena FX Phenom FX系列是用于双路系统Quad FX的旗舰型号,主频2.2-2.4GHz和2.4-2.6GHz,接口Socket F 1207+,二级缓存4×512KB,三级缓存2MB,热设计功耗(TDP)未定。
: |0 {) J3 m! o8 d9 X' z
3 i6 G4 p' q3 v, o+ _9 H) P6 H1 T/ w( k$ s9 L% G
AMD K10桌面处理器规格/上市日期(点击看大图): \6 d9 K y* c7 n0 O
0 R( R; j# a7 b. w4 c
面向高端服务器方面的,AMD用于单路普通系统的Phenom FX,主频2.2-2.4GHz,接口Socket AM2+。其他各款型号也都会采用这种接口。* @3 J. T* S+ x$ q X9 i
高端桌面市场为四核心Agena,其中四核心Phenom X4已知两款,主频2.4、2.2GHz,二级缓存4×512KB,三级缓存2MB, TDP 89W。
( j, h7 d' y* M% |4 Q5 T 中端桌面是双核心Kuma Phenom X2已知六款,主频2.8、2.6、2.4、2.3、2.1、1.9GHz,二级缓存2×512KB,三级缓存2MB,TDP前两款89W、第三款65W、后三款节能型45W。
8 M- f' c0 P: l$ X0 l L 中低端双核心主要是Rana Athlon 64 X2,已知有一款,主频2.2GHz,二级缓存2×512KB,没有三级缓存,TDP 65W。! ^# Q0 P! Z! `" w
低端单核心则是Spica Sempron,已知两款,主频2.4、2.2GHz,二级缓存512KB,没有三级缓存,TDP 45W。
1 D5 z% \7 X( _4 k# J% j7 V$ | 上市时间方面,从高端到低端依次推出,Phenom FX和Phenom X4在今年第三季度率先登场,89W和65W的常规型Phenom X2第四季度跟上,节能型Phenom X2、Athlon 64 X2和Sempron都要等到明年第一季度。
1 c4 ~+ ^& B# Q! S3 T+ z" l* V, o" l
' h$ J& v# R1 o) D0 O8 K
5 K0 c# a6 p$ c/ s5 _) I- r$ U4 x; N
对于“Phenom”品牌的中文命名,有人认为抛弃使用已久的Athlon名称更说明了K10的革命性,以及AMD对这款全新架构的处理器能带来全新突破的希望。但此前AMD处理器中文名以“龙”为命名已经被广大用户所接受,那么Phenom能是什么“龙”呢?我们也做了相关的投票调查,结果网友认为可能是“飞龙”的占55.8%,意思是“飞龙在天”,表达出了大家的祝福。由于AMD还没有正式公布最新一代“Phenom”处理器的中文名,因此AMD会赋予“Phenom”品牌什么样中文名还是个迷,让我们拭目以待。: Q% ^$ t; \" U3 }% d! I: r' ?
4 |3 H4 w2 U7 O& K: Q. ?3 ~7 P. ~● K10是什么?K10微架构又有哪些新特性?
- q/ x# Q. m7 x5 z" q0 L, d 作为AMD下一代的处理器架构,K10还在孕育期时就受到各方的关注。K10也就是通常俗称的K8L,是AMD现有K8架构产品的继任者(没有K9),在架构上有所进步,并将四核心引入桌面。K10是AMD下一代CPU的架构,AMD声称其K10架构四核心具备一系列“革命性设计”,其中最大的卖点依然是“原生”,另外还有每核心512KB二级缓存、共享2MB三级缓存、HyperTransport 3.0总线、增强型PowerNow省电技术、AMD-V虚拟化技术、领先的性能每瓦特指标等。
' ?4 E& R7 ?) J7 a 下面我们通过Barcelona核心介绍,来了解一下K10微架构的几大新特性。- i9 f9 U. h# Z8 N& ^+ l) e
9 {: @1 N4 u+ v% X$ X' T
◎ Barcelona核心介绍:四核、4.63亿晶体管% J5 d7 b7 F+ D. O
Barcelona是AMD第一款四核处理器,原生架构基于65nm工艺技术。和Intel Kentsfield四核不同的是,Barcelona并不是将两个双核封装在一起,而是真正的单芯片四核心。尽管在技术上AMD似乎更为领先,但是否能体现在实际性能表现上目前还不得而知。$ [# p! B+ U- v) k+ [/ J
+ b3 k: p5 T5 q7 T% J& w/ n7 z4 s5 R6 o) M, H& h
, o: ]5 y, D4 H# h
AMD四核与Intel四核:原生与非原生对比
; S+ s u5 y& w' l- o( M0 D$ R. n' B; a. U2 C* w
基于AMD 65nm工艺,Barcelona相比K8在结构上更为复杂,其需要11层金属层,而K8只需要9层。在同工艺情况下Barcelona相比Intel处理器需要更多的金属层,这意味着量产的复杂程度也更高。
3 Y8 m# p4 B& m7 J4 P0 r
7 Z( v Y/ ]. F( m C1 p- [6 p
7 G# O! M! r' e4 p* b6 w6 O! ^* p7 ^6 |& T% e) ?' E% O
拥有四个核心和2MB三级缓存,Barcelona的晶体管数量达到4.63亿个,相比Intel四核Kentsfield的5.82亿还是要少1.19亿。这1.19亿晶体管主要来自于缓存方面:每一个Barcelona核心拥有128KB L1缓存和512KB L2缓存,四个核心共享2MB L3缓存,那么芯片上总缓存容量为4.5MB。而Intel Kentsfield中每一个核心配备了64KB L1缓存,两个核心共享4MB L2缓存,总缓存容量为8.25MB,比Barcelona高出80%,体现在晶体管数量上有25.6%的增加。
3 L! k( @) S( x, g- s5 U) D5 t 然而Barcelona并不仅仅是配备了L3缓存的四核K8,我们估计不算缓存的双核Athlon 64 X2晶体管数量在9400万左右,而Barcelona大约是2.47亿,比前者双倍还要多,那么新增的晶体管用处何在呢?% f+ p( b! z2 r" I- Y5 R. w, b( V
. A, x/ }* X3 M3 C1 i6 e8 a● Barcelona新特性解析:引入全新SSE128技术
w+ a: q7 a! Q' I( I6 v- j4 A$ H Barcelona中的一项重要改进是被AMD称为“SSE128”的技术,在K8架构中,处理器可以并行处理两个SSE指令,但是SSE执行单元一般只有64位带宽。对于128位的SSE操作,K8处理器需要将其作为两个64位指令对待。也就是说,当一个128位 SSE指令被取出后,首先需要将其解码为两个micro-ops,因此一个单指令还占用了额外的解码端口,降低了执行效率。* `' r* y; p# h
而Barcelona加宽了执行单元从64位到128位,所有128位的SSE操作不再需要进行解码分解为两个64位操作,并且浮点调度器也可以支持这种128位 SSE操作,提高了执行效率。
. R, s. Y1 [' o+ G8 l( S. t3 F( W0 e9 {* b8 h
( m6 }. ?2 ~& x; `- ~
4 t0 J; W4 z+ n) {; Z! \" X4 K 提高SSE指令执行单元带宽的同时,也会带来一些新的变化,也可以说是新的瓶颈:指令存取带宽。为了将并行处理器过程中解码数量最大化,Barcelona开始支持32字节每时钟周期的指令存取,而先前K8架构只支持16字节。32字节的指令存取带宽不仅对处理器SSE代码有帮助,同时对于整数指令也有效果。& n. S2 d4 i8 d/ m ]/ \
" ]. ~* x' {! X4 u) t' A: w
" M0 `( @$ [5 }AMD Architecture Comparison
, \( M# l3 c+ ], s/ {2 x, K3 I
8 i; W6 x6 Y) W5 {
Y k5 w: P) _! h% R/ v
$ s6 }& S, Y% V, {! j! N6 ~! a; B: Q% l5 b( V3 l- Z
/ b) e g! Q5 s9 ]. r / M. Q5 @) `2 [
K8- E( f* E( ^* C% O# I
$ B1 }3 X+ i" V' d- J - Q/ ^) F/ F+ O; \2 @& x
Barcelona# N( X3 R* [$ v, H6 p
4 W) e g& Q$ G R6 q5 m 0 l0 F" F/ }0 s: w8 |/ ~, U. q
, v+ t% \: z# S i G# x( xSSE Execution Width* R1 b( R/ y2 _
0 P% e, M: p; G' }: o' c 9 I+ A: K9 h9 C2 @5 T; {" J
64-bit
0 \) D0 M7 Q1 g/ M- z" H* s" K4 R. t% o! T# u) F
- L; }6 f6 R3 w
128-bit$ D. U. |# T: \: c9 v
* _1 W$ b) t/ C! \( j2 ?7 |# e
& F+ P: c2 m q; x. k/ W: ^8 S
$ A+ O" k, Y! F7 E! h4 `" I) S' O
Instruction Fetch Bandwidth6 L% B: q1 K7 q( A3 F
: ?' e i6 ?/ K : Z) b7 N$ Y ]' i8 c' e
16 bytes/cycle+ y d, I2 ]) J5 z3 |
# P& _3 h1 u4 j; \7 o# Z
( o/ R! C) t) P% w1 |4 f2 U9 m32 bytes/cycle
3 x( z: C/ Q0 p$ d. W7 w
5 \0 l& D# U/ m3 d# w" N/ v2 Y
! h" o: h- m3 D7 O+ r0 R ^2 f. e$ y3 P
Data Cache Bandwidth* Q5 q; P) b: D: G+ g
% w2 J+ I( |5 C) a9 u ' V" ~) Z, W' \! }1 I; J$ v( q$ s! m
2 x 64-bit loads/cycle5 \$ }' d* B8 h4 {
- s; Q1 ?* ]3 W- L+ f* f " M2 W, }. D* ~& h! S1 T
2 x 128-bit loads/cycle4 {2 i: ~8 b& i; ?! J
2 m: K! q& ~: z, V8 @0 u
* @ v" }: p$ A5 ^1 v+ B9 }" X. `, ~
. |1 }+ R% O- S* M3 H- B
L2/Northbridge Bandwidth
3 r) E% g4 x, l N1 `7 s8 Z9 ]) N" j
) p8 @- M$ T, U' E9 V) R % k; _ G5 E" r4 O! J+ ]
64 bits/cycle
& Y1 o$ H; v a9 B3 g3 S. I, J8 m; c& r+ z. ?3 U5 l
- @/ ?3 M7 R9 U% m% ^& k128 bits/cycle) p& _: V! u+ Q8 Z( @) v
; C5 _9 K$ W, O; |8 G& F ! {! d' H: Q+ J) t+ x0 ]9 c
% n$ H2 _( n# ~# i8 AFP Scheduler Depth6 r# L/ H; w& I& C
# n0 m$ Y2 O. z
* V" J- W# G7 r/ F1 j36 Dedicated x 64-bit ops! r4 F5 u% }1 O! L" @: M, R( a
9 D+ U2 [& [& ~* J
7 h+ c( s1 }3 i/ x
36 Dedicated x 128-bit ops
- ?' O$ r$ k z" D# _8 ]; |5 i/ K; e5 z3 B% d S z4 `1 i
1 [) P. k1 g- l3 ~4 u* D8 l
* Q: T* y. V" Q3 ~5 x3 X- |
' h! W( i- ~: @0 u2 X* J 现在你获得了存取和解码更多的指令,而你还需要获得更多的数据送往执行核心,因此AMD还加宽了L1数据缓存和SSE寄存器之间的带宽。. _& p7 F2 L+ T, D2 ]1 i6 e
AMD在SSE128方面的改进非常类似Intel Yonah到Merom的变化。在Conroe/Merom之前,Yonah在浮点SSE方面的表现并不如K8,我们之前曾经对比过同频下Yonah和K8处理器这方面的性能,在一般应用、3D渲染和游戏等测试中,Yonah基本可以和K8打平,但在视频编码方面,K8性能更好。不过在Core 2处理器发布后,AMD K8则不再有这方面的优势。 |
|