技术开发 频道

嵌入式x86:非PC设计的要旨?

  诸多性能 

  Nehalem级CPU集成了专用 QuickPath Interconnect 跨处理器,即从前的CSI(公共系统接口)。该链路在概念上让人回想起 HyperTransport 链路,后者是 AMD 于 2001 年推出的,用于一颗晶粒上的多个核心之间以及多晶粒 CPU 和封装 CPU 之间的通信。基于 Nehalem 的产品还会让人回想起 AMD 公司于2003年凭借 Athlon 64和Opteron K8(也称作 Hammer)CPU率先推出的技术,这些产品嵌入 DRAM 控制器的目的之一是降低延长的等待时间。目前,当由于缓存遗漏 (cache miss) 而需要访问外部存储器时,系统就会经历上述等待时间。谈到缓存,目前的英特尔产品把多颗晶粒组合在共同的封装罩之下,由此使核心数量超过两颗,而 45 nm 工艺可承受的庞大晶体管预算将使该公司能以单片形式把至少六颗 CPU 核心压缩到基于 Nehalem 的 Dunnington 芯片的单一薄片上(图 1)。正如当前其它产品那样,每对核心共享一块公共的 L2 缓存,并且所有六颗核心分用布局孔中的一块公共 L3 缓存,布局孔还可供第四对双核进入。

  45 nm工艺使英特尔不仅能构建合算的大晶粒产品,而且能构建非常合算的小晶粒处理器。这种成本有效性是 Atom CPU 产品线的推动力,英特尔公司于今年四月初在上海英特尔开发者论坛上正式推出了上述产品(参考文献 3)。Atom 以前被称作 Silverthorne,结合了一种单片配套器件,英特尔以前把这种芯片组称作 Menlow。Atom 起源于正在开发并基于 x86 的 Larrabee PC 协处理器,后者预定用于图形、成像、物理和其它功能。英特尔的体系结构设计师断定:他们需要能够合算地把 16 或更多 x86 核心嵌在单一 Larrabee 晶粒上,并且断定:该公司的主流 CPU 的乱序执行和其它奇特属性应对目标应用绰绰有余。结果,英特尔“回到了未来”,重新启用它的 Pentium III 原理图为 Larrabee 提出面积优化的 CPU 核心设计。该公司正在试图另外开发具有很少物理核心的芯片,它们基于 Larrabee 原子构件,一些还具备 HyperThreading 虚拟多核支持,用于对功率和成本敏感的移动系统。而这么做是为了使投资回报最大化。

 


  第一代 Atom CPU 有五个版本,时钟速度达到 1.86 GHz,TDP(热设计功率)范围是 0.65 W~ 2.4 W。相应的平均功率和闲置功率范围分别是 160 mW~至 220 mW 和 80 mW~ 100 mW。配套的系统控制器中心有三个版本,特性包括 3D 图形核心、硬件加速高清视频解码引擎、 高清音频处理,以及支持 PCI Express、USB、SDIO(安全数字输入/输出)连接。并且英特尔考虑了长寿命周期嵌入式系统设计,许诺了至少七年的产品支持。一个列入计划的双核 Atom 变型在低成本笔记本和台式系统领域将更加引人注目,并且英特尔还为明年计划了集成度更高的单片但可能多晶粒的 Moorestown Atom 家族。总而言之,在数年磕磕绊绊之后,英特尔似乎回到完全的大步发展阶段了。对于这个十年的余下时间,该公司路线图的最大问题也许是 Atom 将在多大程度上以一种财务方面对英特尔毫无吸引力的方式拼用公司自身的产品,而不是像英特尔希望的那样,通过挤压 ARM 等竞争对手拓宽 x86 市场。


  AMD:去向不明

  主要竞争对手英特尔在本世纪的最初五六年艰难挣扎,AMD抓住了这个有利时机。该公司的 K7 Athlon 微处理器是 1999 年推出的,事实证明是一种比英特尔一年后推出的基于 NetBurst 的 Pentium 4 更为常规的体系结构,因此从性能和功耗角度看,时钟效率非常高。英特尔多年来一直试图把 64 比特系统市场推向其专有的革命性的 Itanium 处理器——大部分都失败了,只有超高端配置例外,而 AMD 选择了一条更具演变性的途径——在 Athlon 基础上追加 64 比特指令支持。结果便是 2003 年基于 K8 的 Athlon 64 和 Opteron(参考文献 4)。K8 CPU 还提供了其它关键的演变性增强特性,比如 HyperTransport 链路和集成式系统存储器控制器。从 2005 年推出的多核 Opteon 和 Athlon 64 X2 来判断,AMD 还是第一个将多核 x86 CPU 推向市场的,至少从单片晶粒角度看是这样。

 然而,最近几年却暴露了 AMD 的主要弱点:该公司是一家比英特尔小得多的 x86 市场参与者,无论是从员工人数还是市场份额衡量标准看均如此,因此它从事的每个项目的成败都比较关键。AMD 于 2003 年开始针对 K10 微体系结构探讨体系结构目标,并且于 2006 年公布了它以 64 nm 工艺为目标的单片四核 Opteron、Barcelona 以及 Athlon 后继型号 Phenom 的主要细节。AMD 最终把 Barcelona 的推出延期到 2007 年 9 月,然后进一步把全面生产发售推迟到两个月前,而在此前,该公司修复了一个令人尴尬的 L2 缓存 TLB(转换旁视缓冲器)缺陷,这是在 Barcelona 推出后发现的,并与 Phenom 的公布时间巧合。

  AMD 在修复 TLB 缺陷之前发售了一些 Phenom 材料,伴随一份基于 BIOS 的微代码补丁,后者有一个令人遗憾的副作用——显著降低了与许多基准相关的性能。并且前沿的 Opteron 和 Phenom CPU 在部分程度上反映了 AMD 落后英特尔一代工艺的事实,它们运行时,在核心时钟速度和基准方面均落后英特尔同等产品。一方面,AMD 很熟悉这种情况。正如它在上世纪 90 年代中期的 P(性能)评级体系所暗示的那样,与英特尔提供的产品相比,它的产品早就表现出较低的时钟速度,而时钟使用效率更高。不过,尽管在本世纪的最初几年,AMD 与英特尔基于 NetBurst 的 CPU 旗鼓相当,但它眼下是在和 Core 衍生的出众的后继产品竞争。AMD 处理器的 HyperTransport 链路和集成式 DRAM 控制器弥补了时钟速度的部分不足,但它们无法完全弥补缺口。并且,在 AMD 预计向市场推出基于 45 nm 的 K10 后继产品时,英特尔也预告了将投产首批 32 nm Westmere CPU,由此保持蚀刻技术领先一代的优势。

 


  这个消息尽管令AMD烦恼,但对 AMD 并不全是坏事。尽管该公司积极的定价方式对产品利润率的影响不为人知,但在它的芯片性能和功耗特性使它能获得相当影响力的市场领域,已使它能对英特尔保持很强的竞争力。凭借 AMD 基于 HyperTransport 的核心互连方法,以及 K10 设计从一开始就包含的其它有吸引力的特性,AMD可以把一些部分程度有缺陷的晶粒作为三核 Phenom 芯片发售,由此使每片晶圆的收入最大化(图 2)。AMD也在把其基于 K8 的双核 CPU 转向 65nm 工艺,这应该会提高晶粒/晶圆使用率,也有利于AMD的专用产能和代工厂产能的结合。

  与英特尔一样,AMD 出售一些嵌入式产品,它们具有延长的寿命周期保证、增强的测试,以及非 PC 客户重视的其它属性。并且 AMD 还继续出售 Geode 集成式 x86 系列,这是它于 2003 年从 National Semiconductor 公司收购的,其历史可追溯至 Cyrix MediaGX。(National Semiconductor 公司于 1997 年收购了 Cyrix 公司。)虽然 AMD 未正式就 Geode 的未来计划发表评论,但最新公开的产品变型 Geode LX 可追溯至 2005 年,而且该公司在 2006 年就关闭了它的 Geode 设计中心。
 

0
相关文章