【IT168 评论】1971年11月15日Intel发布了第一款4004微处理器,40年间处理器行业发生了翻天覆地的变化,特别是近些年来随着智能计算中端的新起,移动芯片性能正在以惊人的速度发展,以满足越来越多、越来越高的用户需求。
微处理器发展初期,产品提升性能纯粹依靠架构指令集、频率和缓存配置,进入20世纪初期这一单纯的提升频率做法已经变成了性能提升的瓶颈障碍,半导体芯片巨人Intel和AMD都在寻求突破性能障碍的解决办法,在单一处理器上安置两个或更多强大的计算核心的创举开拓了一个全新的充满可能性的世界,这也正是我们现在所看到的。
多核心处理器可以为战胜今天的处理器设计挑战提供一种立竿见影、经济有效的技术――降低随着单核心处理器的频率的不断上升而增高的热量和功耗。
NVIDIA进军移动平台
提起NVIDIA我们知道这是一家图形领域的领导者,而随着新兴移动计算的崛起,NVIDIA早在2008年2月份就推出了Tegra品牌的移动芯片,正式加入到移动计算的大军之中。
经历三载卧薪尝胆之后,NVIDIA在2011年11月份发布了业界首款4+1核Tegra 3芯片,这一发展趋势很好的印证了PC的多核发展之路。
2008年2月11日,NVIDIA发布了用于智能手机与PDA平台的APX 2500应用处理器。该处理器集成了一个ARM处理器和一个显示核心。这款处理器是由NVIDIA和微软联合研制,方面应用于使用Windows Mobile的电话中,提高Windows Mobile平台的多媒体处理能力。随后,nVIDIA发布了Tegra系列产品,Tegra的首批产品有两款,分别是Tegra 600和Tegra 650,基于ARM 11架构,APX 2500亦更名为Tegra APX 2500。集成的显示核心是基于GeForce 6,但加入对CUDA和双精度浮点运算的支持。
APX 2500芯片的制程是65纳米,核心频率750 MHz,并集成256KB的L2缓存。芯片亦内建GeForce核心,支持OpenGL ES 2.0和Direct3D Mobile标准。APX 2500属于ARM11 MPCore架构,其低耗电设计,使手提电话可以长时间播放音乐或高清影片。此外,它支持720p的MPEG-4与H.264/MPEG-4 AVC的解码。输出方面,它支持HDMI 1.2和双显示输出。
${PageNumber}第二代Tegra大放异彩
自后推出的Tegra APX 2600在APX 2500基础上增强了对NAND闪存的支持。2009年微软推出的Zune HD中使用了Tegra APX 2600芯片。
早期ARM9、ARM11时代,芯片全面以单核为主,而面对的应用主要是以非智能手机、单功能嵌入式产品,伴随着以智能手机为代表的移动计算时代来临,单核ARM芯片显得捉襟见肘,CES2010展会上NVIDIA正式发布了第二代Tegra芯片(Tegra 2),产品采用了40nm双核设计,运算速度提升至运算速度达到了5520MIPS。
Tegra 2采用台积电的40nm制程制造,集成8个不同功用的处理器。其中两个是ARM Cortex A9核心,运作频率是1GHz。另外有一个ARM7处理器,一个音频处理器,一个图像处理器,一个高清影片解码处理器,一个高清影片编码处理器,一个图像处理器。当中的影片编码器可以支持1080p分辨率的H.264格式影片。影片解码器方面,同样支持1080p分辨率的H.264格式影片。当Tegra 2芯片进行影像解码的时候,电源功耗只有100mW。图像处理器方面,芯片支持200万像素摄像头。而图像处理器支持OpenGL ES 2.0,与上一代相同。但是频率和带宽的提升,可以使性能有2-3倍的增长。Tegra 2芯片可用于制造智能手机,平板电脑,电子书。
自此以后双核ARM芯片如雨后春笋般出现,双核芯片给智能手机和平板带来了更低的功耗和更强劲的性能,可实现更快Web浏览速度、更短响应时间以及更高整体性能。
得益于优秀的设计,Tegra 2芯片很快成为高性能智能手机和平板的非常好的选择,市场上基于此方案的产品风起云涌。如果说Tegra象征着21世纪之前的处理器,那么Tegra 2无疑是和Core 2 Duo/Althon X2对等的明星产品。
时间回溯到2010年,苹果发布了首款iPad 平板电脑,产品使用了苹果A4 Cortex-A8单核芯片,这也正式宣布而来平板计算时代的来临,这也造就了包括LG Optimus 2X,摩托罗拉Artix 4G、Xoom,宏碁A500,华硕 Eee Pad TF101,戴尔Streak 10 Pro在内的一系列明星产品,这些产品的一共共同特点是全面基于双核Tegra 2芯片。
基于NVIDIA双核Tegra 2的胜利后,苹果也迅速在2011年3月份发布了同样采用双核Cortex-A9架构的iPad 2平板电脑,不俗的性能表现使得产品获得热卖,多核的发展趋势也到业界普遍的认同,这一切正如PC领域的转变。
${PageNumber}第三代Tegra掀起移动产业变革
如果说Core 2 Duo的胜利奠定了多核发展的趋势,那么Core i系列绝对是将其发扬光大的一代,随后四核、六核、八核产品不断发力,整个处理器行业出现了欣欣向荣的局面。
而受此背景熏陶的移动芯片业正在酝酿这样一种变革,2011年11月份NVIDIA正式发布了全球首款基于4+1核设计的Tegra 3芯片,产品首次将移动计算带入四核时代。
Tegra 3仍采用台积电40nm工艺制造,四核心最高频率1.4GHz,单核最高1.5GHz,CPU性能最高可达Tegra 2的5倍。不同于PC领域,移动计算芯片虽然迫切需要多核高效,但是面临的功耗依然不容小觑,而NVIDIA Tegra 3采用的超低功耗第五核心(协处理器)很好的解决了这一问题,每个内核包括32KB的数据缓存和32KB的指令缓存,另外四个内核共享1MB的二级缓存另外在Tegra 2时代由于删掉了可选的NEON协处理器,导致面对多媒体加速处理方面性能损失较大,为了弥补这一遗憾,NVIDIA重新找回了这一方案,NVIDIA命名为“companion core”,意即协处理器内核,集高性能、低功耗设计于一身的Tegra 3可以用完美来形容。
虽然Tegra在3D游戏及应用方面表现不俗,不过由于去掉了NEON,一些网页(Flash)等图形应用表现很糟糕,新的Tegra 3芯片吸取了这一经验,加入了全新的“companion core”内核,这样简单的图形应用以及多媒体处理器主要交由companion core负责,而大型的应用则交由4个Cortex A9内核以及图形单元处理,这样做的好处除了增强了芯片的处理能力,还提升了芯片的效能。
为了提高能效,NVIDIA还引入了新的Variable Symmetric Multiprocessing(vSMP)技术,即动态均衡多核调节,顾名思义就是根据任务的轻重情况动态调节内核的工作状态以达到节能的目的,当然在任务繁重的情况下,在TDP的调节范围内,也可以全面发挥四核的性能,以满足任务的需求。在后台运行、音频、视频、Email同步、社交媒体同步等应用时,仅调用“companion core”内核就可以满足需求,而当任务升级为2D游戏、地图应用等操作时,将启用1个Cortex A9内核以满足需求。
companion core是利用低功耗工艺技术设计而成的,然而却拥有同主核心相同的内部架构。因为它是利用低功耗工艺技术制造的,以低性能模式运行,所以它的功耗低于这些采用高速工艺技术制造的主CPU核心。在Tegra3处理器上测得的性能功耗比显示,协核心在500MHz以下工作时可实现高于主核心的每瓦特性能。因此协核心的最高工作频率不高于500MHz。
与协核心不同,CPU主核心需要以极高的频率运行才能实现高性能。因此它们是利用高速工艺技术制造而成的,这种工艺技术让主核心能够在较低的工作电压下将工作频率提升至极高的水平,因此主核心能够在不大幅增加动态功耗的情况下实现高性能。
vSMP技术通过利用协核心最大限度降低活动待机状态下的漏电功耗,同时利用四个主核心最大限度降低峰值工作频率下的动态功耗,从而可大幅降低整体功耗。根据使用场合,vSMP技术能够动态地启用和关闭CPU核心,从而在尽可能低的功耗下实现想要的性能。
而得益于可变对称多重处理,Tegra 3虽然拥有5个核心,不过功耗却比单核芯片效能要高出2-3倍,正如一些基本的应用,单核就可以满足性能需求,所以整体功耗控制依然非常出色。
${PageNumber}Tegra带来更高质量的游戏体验
多核处理器的一个重要优势是能够为高要求应用以及使用场合提供更强的性能。基于四核CPU的Tegra3不仅能够为应用提供更高的性能,而且还让开发者能够打造出前所未有、更加引人入胜的移动设备应用程序。
当今的大多数游戏引擎均支持多线程,例如Unreal3.0、Id Tech 5以及Frostbite等等,而且游戏引擎正越来越多地移植到任务处理模型上来,在这种模型中,单个工作的“尺寸”得到了缩减,而线程的数量则实现了增加。这些线程用于诸多任务,例如音频、碰撞检测、人工智能、用户输入处理、游戏策略以及网络通信等等。所有现代游戏平台均支持多线程,而未来的平台将继续这一趋势。
由于四核处理器能够实现更高的性能,因此移动游戏现在可以具备先进的游戏特性,例如实时物理效果以及实时纹理生成。如此一来,移动游戏的图像质量便得到了大幅提升、玩家也能够获得更加逼真的游戏体验。
实时物理效果增进逼真度
当物理世界的碰撞、风、水、重力、运动等元素运用在虚拟游戏世界中时,我们自然希望这些元素的表现与在物理世界中如出一辙。这些基于游戏中玩家行为以及现实世界规律的效果,进一步提高了游戏的逼真度,使得游戏更加身临其境和引人入胜。
在Tegra3上,动态照明、物理效果、人工智能的处理任务以及其它与游戏相关的CPU处理通过四个核进行共享。通过这种负载共享,没有哪一个核会过载,并且处理器仍有额外的处理空间用来处理后台任务,丝毫不会影响到用户体验。
实时动态纹理生成
移动游戏的复杂性和视觉上的丰富程度在不断增加,同时可下载游戏内容的文件大小相应剧增。游戏文件往往太大,下载游戏的时间超过十五分钟,导致用户购买游戏后如果不喜欢该款游戏将要求退款。这不仅让买家感到失望,也致使买家失去购买需要下载大文件的高级游戏的动力。
实时动态纹理生成技术允许游戏开发者编写游戏代码,以使游戏中所需的纹理根据游戏的情节和状态实时创建。由于是即时生成纹理的,因此不必在购买时提供。通过这项技术,游戏开发者可以将游戏文件的大小减小几个数量级。
动态文理生成的另一个关键好处在于可以通过对游戏编码,使游戏中的环境根据玩家的输入和自定义相应改变。例如,可以为玩家提供改变游戏中的天气的选项,根据选择的天气情况动态生成影响场景的相应纹理。这种技术能提供高度互动的游戏体验,而且不会明显增加游戏文件大小或编码复杂度。
实时生成这种大型纹理集要求具备强大的CPU处理能力,这是单核和双核移动处理器所无法提供的。在双核移动处理器上生成实时纹理将使两个处理核过载,导致游戏体验欠佳。而四核移动处理器不仅能轻松处理这个任务,而且能提供足够的空间来在后台处理其它任务。
${PageNumber}NVIDIA将成为计算时代的移动芯片巨人
Tegra 3同时支持Windows 8和Android,可以为其提供双重拓展机会,赢得更多的市场,全面为移动计算添一份力量。基于Tegra 3的成功,包括 HTC One X、LG Optimus 4X HD、中兴 Era、以及天语Treasure V8以及富士通Tegra 3智能手机在内的多款Tegra 3四核手机全面登陆WMC 2012世界移动大会。
既定于Tegra 3,未来NVIDIA还将推出新的Tegra 3、Tegra 4等芯片,产品无一不是多核方案,最高可能会到8核,而更具ARM最新的消息,基于Cortex-A15的芯片未来将会出现在网络Web 2.0服务器上,移动芯片性能孱弱将不复存在。
目前来看,Windows 8、Android、iOS将成为移动市场的三大霸主,除了苹果自家的iOS,Tegra 3很好的实现了另外两大移动操作系统Windows 8和Android的支持,由于Windows 8还在积极准备之中,所以市面上的Tegra 3设备目前仅出现了Android的局面。相信伴随Windows 8的发布,基于Tegra 3的设备将再一次遍地开花。
智能手机和平板一个重大的应用便是3D体验(娱乐、游戏),目前来说游戏主机似乎牢牢的控制了这些游戏市场,而最新的报告显示在未来移动GPU图形性能会出现突飞猛进的发展,大约在2013-2014年就能和微软X360平起平坐,甚至一举将其超越,和PC的差距也越来越小。不出意外的话到时候微软的新一代“Xbox 720”也该面世了,而肩负重任的Tegra 4或许将成为这样一款赶超游戏主机的产品。
来自可靠消息,Tegra 4芯片早在2011年12月份已经开始送交OEM合作厂商测试,产品有望在下届CES、MWC大会上亮相,而大规模的量产则要等到2013年第二季度。芯片则基于全新的ARM Cortex-A15架构,并采用28nm工艺,兼容CUDA并行计算。由于采用了全新的28nm工艺,Tegra 4将具备更好的能效比,产品默认频率将突破2GHz,最高2.5GHz,而早未来产品还将进一步进化到20nm工艺,功耗进一步得到减低。
而现阶段来说,功耗和性能全面优越的Tegra 3无疑是众多智能手机和平板的非常好的搭档,新一代硬件的出炉,亦代表着配套软件产品会进行更新换代。对这样一款以主打性能品牌的芯片来说,高画质、玩法多样的游戏无疑是检验其品质的最好实践。而对玩家来说,新硬件平台下的游戏也更值得期待,而Tegra 3的智能手机和平板全面上市,也再一次掀起移动计算的新高潮,这或许就是PC进化的写照,我们有理由相信NVIDIA将成为计算时代的移动芯片巨人。
早在多年以前,桌面CPU就已经开始从单核CPU架构向双核和四核架构转变。但直至几年前,广大用户才开始领会到多核CPU真正的好处。这是因为除了在多个核上执行多种不同应用程序的多任务之外,能够运用多核CPU的真正多线程浏览器和应用程序是在推出多核CPU之后几年才实现的。今天的桌面PC正在见证着多核CPU带来的诸多益处。
而在移动领域,从单核CPU向多核CPU的过度将更快,这是因为移动软件系统是在桌面领域的既有成果之上进化来支持多核移动CPU的。广为使用的移动软件已提供对多任务和多线程的支持。由于移动游戏发展迅猛,开发者正将受欢迎的PC和游戏机游戏引擎移植到移动环境。这些游戏引擎最初是针对多核桌面PC而开发的,因此也将在移动处理器中利用多核CPU,为移动游戏玩家带来立竿见影的好处。四核CPU为游戏开发者提供了强大的处理能力,将使开发者具备高级的物理效果、人工智能、碰撞检测/避免、虚拟纹理、更好的联网游戏等。