- 等级
- 砌墙工人
- 等级进度
-
- 积分
- 92
- 阅读权限
- 35
- 主题
- 精华
- 社区币
- 星梦
- 注册时间
- 2007-7-21
- 最后登录
- 1970-1-1
|
● AMD K10桌面处理器新品牌“Phenom”! h. D% [0 X9 A4 M& N6 a
相信大家仍然还是最关注AMD面向桌面的四核处理器,让我们先来看看官方正式宣布了用于下一代四核心、双核心高端、主流桌面处理器的新品牌“Phenom”。在K6之后,AMD的K7、K8架构桌面产品都采用了Athlon品牌,与笔记本的Turion和服务器的Opteron组成AMD的整体产品线。而进入K10架构之后,Athlon将被废弃,取而代之的是新的“Phenom”。5 ]- A3 M9 D) r
" m [6 y" l- w' u2 G
& r$ |! `" d4 F3 a2 _* F- l
AMD确认“Phenom”命名
! N# P) L" {9 n* E7 _+ _% d
# q- l+ _# P4 v' V. r$ u 据AMD代表确认,Phenom的确源自英语口语,意为“杰出人才”,发音类似精简版的“phenomenal”(显著的、现象的)。Phenom处理器由三部分组成:双路四核心Phenom FX(Agena FX)、四核心Phenom X4(Agena)、双核心Phenom X2(Kuma)。AMD只是说它们的架构都源自于服务器的Barclona Opteron,但没有披露任何型号和规格信息。有消息称,Phenom X4主频2.7-2.9GHz,功耗125W;Phenom X2主频2.0-2.9GHz,功耗89W。
$ \' C% g _: ] AMD产品经理Ian McNaughton指出,Phenom平台支持DDR2-1066规格内存,而“在OEM厂商有所需求之前”,AMD不会转向DDR3。2 v. Y9 A! B$ Z( M7 G% I
在启用新品牌后,AMD还将全面放弃型号中的“64”字样,因此原来的Athlon 64 X2将改名Athlon X2并进入低端市场,单核心Athlon消失,单核心Sempron暂时还会存在,竞争Intel的Celeron。今年第三季度,AMD将发布多款新Sempron,基于65nm Sparta核心,包括35W节能型的3800+、3600+、3500+、3400+等。: r2 i; Y4 V2 S, l6 |
此前我们已经知道的四核心Agena FX Phenom FX系列是用于双路系统Quad FX的旗舰型号,主频2.2-2.4GHz和2.4-2.6GHz,接口Socket F 1207+,二级缓存4×512KB,三级缓存2MB,热设计功耗(TDP)未定。
& b7 u/ Q( D/ p. _- d
- `9 {: J. J* V" z2 @) m% b6 [( u. j: _8 ?. S- w7 z. a
AMD K10桌面处理器规格/上市日期(点击看大图)
( ]) q" I: {9 N" I- @
7 t2 f. M( \) v 面向高端服务器方面的,AMD用于单路普通系统的Phenom FX,主频2.2-2.4GHz,接口Socket AM2+。其他各款型号也都会采用这种接口。. ]# ~( }: P3 ~3 D2 k5 }
高端桌面市场为四核心Agena,其中四核心Phenom X4已知两款,主频2.4、2.2GHz,二级缓存4×512KB,三级缓存2MB, TDP 89W。
! t" ~) T' A3 _2 x 中端桌面是双核心Kuma Phenom X2已知六款,主频2.8、2.6、2.4、2.3、2.1、1.9GHz,二级缓存2×512KB,三级缓存2MB,TDP前两款89W、第三款65W、后三款节能型45W。
6 N" d6 V" K7 E" G 中低端双核心主要是Rana Athlon 64 X2,已知有一款,主频2.2GHz,二级缓存2×512KB,没有三级缓存,TDP 65W。$ Q4 P8 H% C( m
低端单核心则是Spica Sempron,已知两款,主频2.4、2.2GHz,二级缓存512KB,没有三级缓存,TDP 45W。6 y x% a9 F& l* U) a R; [8 n; e r; _
上市时间方面,从高端到低端依次推出,Phenom FX和Phenom X4在今年第三季度率先登场,89W和65W的常规型Phenom X2第四季度跟上,节能型Phenom X2、Athlon 64 X2和Sempron都要等到明年第一季度。
% P" \; z" A% l- k. r
7 S9 @* d$ B$ c" [9 y
3 t: d$ Z4 S9 a* D" S
0 i) V9 f* Z/ w; }. N& ^
5 c1 D# Q+ U$ N1 o, l 对于“Phenom”品牌的中文命名,有人认为抛弃使用已久的Athlon名称更说明了K10的革命性,以及AMD对这款全新架构的处理器能带来全新突破的希望。但此前AMD处理器中文名以“龙”为命名已经被广大用户所接受,那么Phenom能是什么“龙”呢?我们也做了相关的投票调查,结果网友认为可能是“飞龙”的占55.8%,意思是“飞龙在天”,表达出了大家的祝福。由于AMD还没有正式公布最新一代“Phenom”处理器的中文名,因此AMD会赋予“Phenom”品牌什么样中文名还是个迷,让我们拭目以待。2 ?" W' p0 q! [8 c+ U5 f
4 C& k5 P1 O# ]4 @; i( D* r● K10是什么?K10微架构又有哪些新特性? p1 o# G6 A7 ]+ d, }( B
作为AMD下一代的处理器架构,K10还在孕育期时就受到各方的关注。K10也就是通常俗称的K8L,是AMD现有K8架构产品的继任者(没有K9),在架构上有所进步,并将四核心引入桌面。K10是AMD下一代CPU的架构,AMD声称其K10架构四核心具备一系列“革命性设计”,其中最大的卖点依然是“原生”,另外还有每核心512KB二级缓存、共享2MB三级缓存、HyperTransport 3.0总线、增强型PowerNow省电技术、AMD-V虚拟化技术、领先的性能每瓦特指标等。
4 T8 {; K* @7 d! a" z% ? 下面我们通过Barcelona核心介绍,来了解一下K10微架构的几大新特性。& p0 z9 m$ J7 U
; y% T+ \/ x5 e6 h" s. k◎ Barcelona核心介绍:四核、4.63亿晶体管
! j3 Q: B, F+ x3 l/ }. L1 S Barcelona是AMD第一款四核处理器,原生架构基于65nm工艺技术。和Intel Kentsfield四核不同的是,Barcelona并不是将两个双核封装在一起,而是真正的单芯片四核心。尽管在技术上AMD似乎更为领先,但是否能体现在实际性能表现上目前还不得而知。1 v# x% k3 Z$ w% I9 [
. S2 |5 L4 |* p5 M
: P. b, v9 ^' y2 N, D
: g8 k7 X; c. W. y/ k# u
AMD四核与Intel四核:原生与非原生对比
, @# _, t7 B7 Q' J; D! h* q; y
( t5 Q3 S, }& N' v 基于AMD 65nm工艺,Barcelona相比K8在结构上更为复杂,其需要11层金属层,而K8只需要9层。在同工艺情况下Barcelona相比Intel处理器需要更多的金属层,这意味着量产的复杂程度也更高。- v* h; V( _9 J
# {- n3 \! j4 E* }3 n" i2 ]- [7 {( N, ^
5 n a6 D, Q: V, a8 `& |0 z 拥有四个核心和2MB三级缓存,Barcelona的晶体管数量达到4.63亿个,相比Intel四核Kentsfield的5.82亿还是要少1.19亿。这1.19亿晶体管主要来自于缓存方面:每一个Barcelona核心拥有128KB L1缓存和512KB L2缓存,四个核心共享2MB L3缓存,那么芯片上总缓存容量为4.5MB。而Intel Kentsfield中每一个核心配备了64KB L1缓存,两个核心共享4MB L2缓存,总缓存容量为8.25MB,比Barcelona高出80%,体现在晶体管数量上有25.6%的增加。
$ L! p) y: T! l% Q8 h* @* h' d 然而Barcelona并不仅仅是配备了L3缓存的四核K8,我们估计不算缓存的双核Athlon 64 X2晶体管数量在9400万左右,而Barcelona大约是2.47亿,比前者双倍还要多,那么新增的晶体管用处何在呢?
1 A& Q$ F O8 h6 H8 b- R8 J* j7 A" U5 y$ m. G3 m6 _; R
● Barcelona新特性解析:引入全新SSE128技术
9 k3 \$ X1 t% A2 D; a! ? Barcelona中的一项重要改进是被AMD称为“SSE128”的技术,在K8架构中,处理器可以并行处理两个SSE指令,但是SSE执行单元一般只有64位带宽。对于128位的SSE操作,K8处理器需要将其作为两个64位指令对待。也就是说,当一个128位 SSE指令被取出后,首先需要将其解码为两个micro-ops,因此一个单指令还占用了额外的解码端口,降低了执行效率。5 j. q' G1 ~6 A9 |/ _+ E
而Barcelona加宽了执行单元从64位到128位,所有128位的SSE操作不再需要进行解码分解为两个64位操作,并且浮点调度器也可以支持这种128位 SSE操作,提高了执行效率。7 z! f7 M+ B; R- S4 o: m# }
: K; w6 c6 |2 Q* B6 c
6 F1 B- ?, c- w
( d/ e/ u. n3 k5 X- p. i; J1 r5 i5 D 提高SSE指令执行单元带宽的同时,也会带来一些新的变化,也可以说是新的瓶颈:指令存取带宽。为了将并行处理器过程中解码数量最大化,Barcelona开始支持32字节每时钟周期的指令存取,而先前K8架构只支持16字节。32字节的指令存取带宽不仅对处理器SSE代码有帮助,同时对于整数指令也有效果。9 S/ ?; E! _0 a5 D
6 K, t e1 p, b& f8 N# l T. o! p! A) u1 B, Z$ [5 g) Q
AMD Architecture Comparison. j. P3 t& w v6 N8 O* M
* Q3 T% h; M4 L3 @3 i
) r. w( s. i5 @ I- T$ B7 J
8 ^3 ^/ W0 e* o) x: m S5 @
+ O3 }5 Y& N2 w$ m0 m. X) O2 s. Y. B8 \2 H
; S5 v5 B, h, [2 n
K8# _; d8 L* {. @* H
- s0 N: Z ~( J0 g# p( E! b * D" s! x* G1 e& o
Barcelona
# l6 T8 n% j v' U Y
) u/ f5 h, C/ t! D / F4 ~2 q; E! K. T* b
) M {+ @, x1 uSSE Execution Width
% f% b0 u! ]6 n7 F7 C& U. L G, x7 c8 k6 {+ Y1 M- w
, C' t2 l4 X- K A
64-bit
& s b+ @: _9 z; s* Z% ]1 x% {6 C9 I, E2 `2 @/ L) {
- \, |1 h! H7 l- `) T Y
128-bit
- Q1 x& B1 ]4 M2 G9 b( e2 J) k
' q) z I! H* J$ v/ b % I. l/ b" J$ q2 G- y
$ k0 u* c" M7 w0 `8 @0 ^Instruction Fetch Bandwidth* _' L& d" Q9 N- x
3 q- [- j$ c q/ R 9 A( u9 `" z2 C! B1 Z( ^
16 bytes/cycle7 d. j7 l2 Y' G) y" a; G; e7 c7 I
' R) l# y, m: W7 M0 h5 `6 L0 E
/ ?. j. D- j$ _% s32 bytes/cycle; v& J% H3 o( h* ~( Q1 T
) W/ [* }" d' l Z 1 e/ s! t) b8 |, [1 g4 Q1 h
, g+ y& j, M( rData Cache Bandwidth: D9 g% e# O# F1 O
2 n$ l9 }2 T# t% `' F9 r, k; @
. ^5 u: _" r2 ~/ U$ b2 x 64-bit loads/cycle
4 o- X. ]) }9 ]) R3 t8 X6 e+ r; x2 h* J7 w1 T
" `4 U0 `& K: b) B
2 x 128-bit loads/cycle
% L0 _7 \; ]& }! x$ J( r9 ?
2 `3 O% m# i s- F) y9 v 9 N8 N9 y" l) Y& _" I
0 f$ Z; S8 Z J
L2/Northbridge Bandwidth9 _( j& A3 D- u4 V: Y% I5 I
6 C S. v! W! W3 ~$ R0 t5 l
4 K0 y2 c! i: H2 P- u/ i! _64 bits/cycle
4 [$ V1 r+ w& @' I9 q' U. T
, n( Y: m5 Q9 l6 w5 F " V/ x; D1 ~! `) c# t1 f" h6 ]0 Q
128 bits/cycle
" k1 n1 b: R; ^2 E2 v/ R0 r* t: |/ U8 q g" i5 p( h# _# `' W* f
( z: @9 n* c/ S* w5 X. Q8 X7 c8 V: _' D3 D4 P- S
FP Scheduler Depth; h( O) @6 j+ v7 A
- f/ ?; v# b3 Q. y$ _- h
6 R9 \' o' Z3 ^2 O) ~* l; N& y" c# [
36 Dedicated x 64-bit ops
: V& k7 C/ P1 L, l7 b. D4 K5 y1 Y1 W2 Q# Z$ u! P! ]- T4 f
3 T- X+ M0 ` W9 J/ n- o36 Dedicated x 128-bit ops( c7 |5 j& B" m( v/ m/ \: |
- e; g" B5 R1 ]' Y. B* Q. r7 U
( D0 ]8 F8 @! E$ t
1 |5 e+ F/ W$ u7 g, b% S# M1 l2 M4 G) L/ Q
现在你获得了存取和解码更多的指令,而你还需要获得更多的数据送往执行核心,因此AMD还加宽了L1数据缓存和SSE寄存器之间的带宽。
# h: ]2 G" _/ J! {2 r AMD在SSE128方面的改进非常类似Intel Yonah到Merom的变化。在Conroe/Merom之前,Yonah在浮点SSE方面的表现并不如K8,我们之前曾经对比过同频下Yonah和K8处理器这方面的性能,在一般应用、3D渲染和游戏等测试中,Yonah基本可以和K8打平,但在视频编码方面,K8性能更好。不过在Core 2处理器发布后,AMD K8则不再有这方面的优势。 |
|