微信扫一扫 分享朋友圈

已有 10822 人浏览分享

开启左侧

挑战软件极限!6核12线程"i9"全国首测

[复制链接]
10822 23
9月16日 当处理器的频率达到一定程度之后,就很难进一步提升频率了,所以处理器厂商们开始考虑其他的途径来增强处理器的性能。如多核变化,架构改良甚至革新。


    在Core 2奠定基础后,Intel的tick-tock铁蹄无情地剿灭着竞争对手的反扑。毕竟在制程和架构交替领先的情况下,竞争对手难以翻身。去年这个时候,Intel为我们带来了全新架构集成内存控制器的Core i7,那么,作为tick(制程)年,Intel会给我们带来什么呢?Lynnfield?不是,那只不过是Bloomfield为成本妥协的产物;Clarkdale?也不是,那是Intel觊觎中低端市场的重磅炸弹,对整合图形市场重新划分势力的王牌,那么32nm的正统传人究竟是什么呢?

    来自各方的猜测可能是在明年发布的六核Gulftown,得益于全新32nm制程的优秀功耗表现,Nehalem架构也得以进化至Westmere,其代号为Gulftown的6核心12线程处理器。目前这款处理器已经抵达泡泡网评测室,那么,Westmere与Nehalem有什么区别?6核心在现有软件环境下能发挥几成功力?本文将为大家献上全面的分析测试。

● 跟随Tick-Tock节奏 架构再度升级
    自2006年INTEL发布了革命性的酷睿2处理器,凭借着高效能的特点,将AMD苦心经营的性能宝座重新握在手中,重新挽回了自己的颜面。对AMD的一系列胜利,INTEL并没有冲昏头脑,继续按照自己的钟摆tick-tock(即英特尔芯片技术与微体系结构创新发展步调模式)节奏稳步发展。

● 回顾Tick-Tock节拍
    Tick——07年底,钟摆tick-tock的摆针摇到了tick这一侧,INTEL也按计划推出了改进工艺制造的Penryn处理器,随着45nm工艺产能的提高,INTEL迅速将45nm工艺处理器推向主流市场,将AMD牢牢压制在自己脚下。
    Tock——08年底,在老对手AMD窘态频出,为注入资金频于奔命,45nm技术迟迟不见上马的情况下,INTEL的钟摆tick-tock节奏继续着自己的脚步运转。摆针这次摇到了TOCK一侧,革新架构的Nehalem降临了!
    Tick——09年底,钟摆又转到了制程年,那么Intel会给我们带来什么惊喜呢?想必刚刚发布的lynnfield不属于tick-tock的战略范畴。提升工艺后的32nm Westmere架构产品是什么样子呢?
    Westmere架构处理器的核心代号为Gulftown,遗憾的是,由于尚未发布,其命名还不能确定,不过据业内人士传它有可能命名为“Core "i9"”,规格为6核心12线程,6x256KB二级缓存,12MB三级缓存。
    小贴士:tick-tock模式就是每隔两年就会推出新的制程技术,然后隔年推出新的微构架,如英特尔在05年推出65nm工艺酷睿处理器以及酷睿微构架,07年推出的45nm工艺Penryn处理器以及Nehalem微构架,以及预计在09年底推出的32nm工艺Westmere微构架,都是符合tick-tock研发模式。tick-tock研发模式将处理器技术不断推向新的高度,也是英特尔保持活力和市场占有率的重要战略。

评论 23

地瓜  论坛元老  发表于 2010-3-18 09:39 | 显示全部楼层
● 摩尔定律的延续!Intel最新32nm制程讲解
    采用高k+金属架构栅极的45nm制程技术取得巨大成功之后,英特尔再接再厉推出了采用第二代高k+金属栅极的32纳米制程技术,目前已接近量产。这种新制程技术将用来制造英特尔Nehalem微体系架构的32nm版本-Westmere。


    据Intel英特尔高级院士Mark Bohr透露,32nm制程技术的基础是第二代高k+金属栅极晶体管。英特尔对第一代高k+金属栅极晶体管进行了众多改进。 在45纳米制程中,高k电介质的等效氧化层厚度为1.0nm。而在32nm制程中,此氧化层的厚度仅为0.9nm,而栅极长度则缩短为30nm。
    晶体管的栅极间距每两年缩小0.7倍——32nm制程采用了业内最紧凑的栅极间距。32nm制程采用了与英特尔45纳米制程一样的置换金属栅极工艺流程,这样有利于英特尔充分利用现有的成功工艺。这些改进对于缩小集成电路(IC)尺寸、提高晶体管的性能至关重要。采用高k+金属栅极晶体管的32nm制程技术可以帮助设计人员同时优化电路的尺寸和性能。

    Intel已经成功完成了32nm制程的研发工作,并且是业界第一家可以演示运行的32nm处理器的厂商,它采用第二代High-K和金属栅极晶体管技术,九个金属铜和Low-K互联层,其中的关键层会在Intel历史上首次应用沉浸式光刻技术,无铅无卤素,核心面积可比45nm减小大约70%,在性能方面提高超过22%以上。
地瓜  论坛元老  发表于 2010-3-18 09:39 | 显示全部楼层
● 不仅是工艺改进!32nm处理器规格和架构全面升级


    此前Core 2从65nm进化至45nm时,仅仅是加大了二级缓存和加入部分新指令级而已,而此次45nm Nehalem升级至32nm Westmere,不仅是三级缓存增加了4M,核心数直接增加两颗,由此可见超前的32nm工艺能够容纳下更多的晶体管,这可是Intel的原生六核处理器。
    同时32nm Westmere家族系列仍会全面支持超线程技术,其中Gulftown面向高端桌面,六核心十二线程,将继续使用英特尔X58芯片组主板,基于Westmere的处理器将在09年第四季度投入生产,这种基于32nm制程的处理器将使现有的微体系架构变得更小、更快、更节能。随后将推动基于Nehalem的产品成为主流客户机。同时,32nm Westmere技术的处理器将提升客户机的性能,缩小处理器内核的尺寸,并且将促成将显卡集成至处理器的多芯片封装(MCP)中。

    此外,Tick-Tock制造模式中的Tick意为,将现有的处理器微体系架构缩小到尺寸更小的处理器核心中。通常,在用新制程缩小硅核芯片时,基本不会对处理器进行改进。然而,基于Westmere的处理器未遵循这一原则,它新增了微码指令和硬件功能,从而提高了电源管理能力。
    Westmere处理器将采用全新指令来加速加密和解密算法。这6条新的高级加密标准(AES)指令在企业计算中会发挥巨大的作用。比如,设计人员可以编写软件,以便充分利用AES实现全面的磁盘加密。

● 超线程让核心数翻倍!软件能否支持12颗核心?
    虽然我们已经处于多核时代,但我们还是会有不少人会问,为什么要从单核过渡到双核、四核,甚至是更多的核心?然而这样在CPU内集成多个核心,究竟能给我们带来什么?

6核心处理器
    与传统的单核CPU相比,多核CPU带来了更强的并行处理能力、更高的计算密度和更低的时钟频率,并大大减少了散热和功耗。能够在短时间之内迅速提高电脑的性能,而一直固守单核高频率则会因物理因素走入尽头。

现有软件环境能满足如此配置的胃口吗?
    虽然多核心处理器在为我们带来新的计算体验,但同时却为众多程序员增添了许多烦恼,理论尚不完备,经验尚不够丰富,还有开发环境不成熟,一切都为编写可充分利用多核处理器计算能力的程序创造了重重困难。他们必须将过去由单一处理器负责的程序化整为零,分散到各个处理器进行运算。
    所以在现有软件环境中,多核心处理器能否如鱼得水,发挥多核心处理器的全部效能?让我们用测试来检验!
地瓜  论坛元老  发表于 2010-3-18 09:40 | 显示全部楼层
● 全国首颗Core "i9"泡泡网首测
    Core "i9"处理器在国内的踪迹可谓是扑朔迷离,不见其踪影。日前,这款处理器终于抵达PCPOP评测室。据消息称,Core "i9"在国内只有两颗,PCPOP能够拿到其中的一颗实在是幸运加实力的体现啊。
    由于现在Westmere还处于待定阶段,所以频率没有设定,默认频率为2.56GHz。



左为六核Core""i9""右为Core i7
    从外观来看,"i9"与i7几乎是一个模子出来的,但"i9"的CPU PCB正面电容与i7截然不同,相比"i9"的电容,更小更密集。

    从外观分析,32nm的确带变化很多,架构没有变化的情况下,通过制程的升级,却加入了2颗核心和4MB缓存。可见32nm的威力,这也是Clarkdale能够集成GPU和CPU的真实原因。

● 只有X58才能支持六核,目前只有技嘉才能点亮
    提起技嘉,人们的第一印象都是稳定,甚至有些偏执地“堆料”,有些人认为一味“堆料”是不正确的,但事实证明,技嘉的每次元器件升级都引领了潮流,甚至超前。



    脱胎于英特尔跨时代的X58芯片组的X58-Extreme,以海蓝色PCB、银白色的散热器上点缀着蓝色GIGABYTE图案靓丽出现在我们面前。该主板采用全尺寸ATX大板,依照超耐久3设计理念,全板均使用了高品质的三洋固态电容、铁素体电感,并在所有的供电部分采用了低阻抗MOSFET。


双六相CPU供电设计,满足Core "i9"的变态要求
    对多核心处理器来说,CPU供电部分是十分重要,在Core i7时代,因为CPU对供电的要求不是那么苛刻,所以某些厂商出于成本控制考量,将Core i7 CPU的供电部分仅采用6相供电乃至更低,当然,这样做无可厚非,毕竟可以使用Core  i7。但"i9"即将来临,一般主板那脆弱的CPU供电部分能否承受住6核12线程的考验呢?因为正式版"i9"还未上市,所以还不能盖棺定论。虽然32nm制程很先进,但6核心毕竟不是吃素的主,对CPU供电部分要求很高。而一年前上市的技嘉双6相供电展现出超前的设计理念,可以稳定地使用Westmere架构六核心处理器。

    Nehalem的全新架构下,集成内存控制器的Core i7将AMD仅有的一块遮羞布(内存带宽)奚落地体无完肤,三通道内存性能高的惊人,内存带宽的性能完全超过了一般用户的需求,而内存中的翘楚——海盗船Dominator GT更是无人能及,超频后三通道内存带宽超越29GB\s!

    通过前文的介绍大家可以了解到,我们所用的Westmere测试样品为工程样板,频率不可调节,仅为2564MHz。因"i9"的天生宿命是加速i7留下的前进脚步,所以我们加入频率与之相近的Core i7 940和Core i7 920。重点对比i7、"i9"间的性能差异。
地瓜  论坛元老  发表于 2010-3-18 09:41 | 显示全部楼层
● 测试平台:
PCPOP.COM泡泡网DIY评测室
硬件系统配置
处理器
Core i7 940 (四核八线程/2.93GHz/4x256KB L2/8M L3)
Core i7 920 (四核八线程/2.66GHz/4x256KB L2/8M L3)
Core "i9" xxx (六核十二线程/2.56GHz/6x256KB L2/12M L3)

主板
技嘉 Gigabyte X58-Extreme chipset:intel X58
硬盘
希捷 7200.12 500GB
内存
海盗船Dominator GT DDR3-2000C8 2Gx3
1333MHz 9-9-9-24
显卡
影驰 GeForce GTX285
电源
海盗船HX1000W
显示器
ASUS 24寸 M241H
软件系统配置
操作系统
windows 7 RTM 64bit
驱动
Nvidia forceware 190.56

Core "i9"  御用平台
    Core "i9"由于频率不能改变,所以在测试中开启和关闭超线程两种模式测试,而两颗Core i7则是开启超线程进行测试,以对比6核带来的性能变化,为了保证统一性,除了功耗测试外,三颗CPU在测试时均关闭节能与自动超频技术。
    测试软件方面,64Bit系统下,有64bit的版本我们使用64bit测试,没有则使用32Bit进行测试。测试软件版本在下面的性能解析中会有说明。

    当年Core2从65nm到45nm过渡时,由于加入了全新指令集,并加大二级缓存。Penryn相对Conroe单核效能提高了不少,那么这次Nehalem进化至32nm的Westmere有没有提高呢?

从CPU-z看,Westmere提高的是多出2个核心和2x256KB二缓和4MB三缓
    由于此次拿到的CPU属于早期工程样品,所以bug在所难免,而此次的bug出在内存控制器上,仅能使用单通道内存。所以,为了对比两代处理器单核效能的差异,我们统一使用单根Dominator GT 2GB内存,并将频率设置为统一的1333MHz 9-9-9-24。

Core "i9"的CPU得分:23950

Core i7的CPU得分:16059
     3D Mark Vantage成绩对比中,多出的2核心4线程的威力相当明显。
    在多线程软件测试下,6核展现出了强大的威力,不过算均值的话,单核效能和Nehalem改进不多。
地瓜  论坛元老  发表于 2010-3-18 09:41 | 显示全部楼层
● 单核心效能测试,12MB三级缓存提升有限
    一直以来,Intel处理器对二级缓存的大小非常的敏感,与其CPU的一级缓存设计有直接关系。一般来讲,只有一级缓存中没有CPU所需要的数据时,才会从稍慢的二级缓存中读取。而Intel CPU采用的是“数据+代码指令缓存”设计,基于这种架构设计的的一级缓存分为用来存放数据和执行这些数据的指令的两个独立部分,两者可以同时被CPU访问,减少了争用Cache所造成的冲突。
    这样的设计利弊都很明显,有利的是降低处理器的生产难度和成本(一级缓存的生产成本比二级缓存更高)。弊端同样明显,因为一级缓存容量有限,并不能满足CPU的读取要求,所以对二级缓存,甚至是三级缓存的依赖性严重。
    单核比拼下,从成绩上看,拥有更大3级缓存的"i9"并没有因为大缓存而得以性能提升。
    超频玩家的最爱的检测工具,纯粹考验CPU计算能力的单线程super pi,无疑是检验单核效能最好的工具。两代CPU对比后,大缓存体现出了作用。“"i9"”同频率下领先前代i7半秒钟左右。
    综合来看,此次32nm的Westmere的单核效能与Nehalem相比提升并不大,多线程测试中,性能的提升与核心数量的增加呈等效关系。单核对比中,提升也不明显。
地瓜  论坛元老  发表于 2010-3-18 09:41 | 显示全部楼层
● Sisoftware Sandra 2009 SP2算数/多媒体测试(原生支持64Bit)
    Sisoftware Sandra是一套功能强大的系统分析评比工具,拥有电脑你能想到的各种设备的测试方案,作为一款系统测试软件,除了可以提供详细的硬件信息外,还可以做产品的性能对比。其中算数和浮点运算程序直观明了,能够大体知道一款CPU的性能表现。


    即使频率较低,但6核心12线程的Westmere还是将频率更高的Core i7打得体无完肤,此外,即使关闭超线程后,Westmere还是要比8线程的Core i7高一些,由此可见,超线程的作用只是负责,真正的核心才是更重要的。
地瓜  论坛元老  发表于 2010-3-18 09:41 | 显示全部楼层
● Sisoftware Sandra 2009 SP2算数/多媒体测试(原生支持64Bit)
    Sisoftware Sandra是一套功能强大的系统分析评比工具,拥有电脑你能想到的各种设备的测试方案,作为一款系统测试软件,除了可以提供详细的硬件信息外,还可以做产品的性能对比。其中算数和浮点运算程序直观明了,能够大体知道一款CPU的性能表现。


    即使频率较低,但6核心12线程的Westmere还是将频率更高的Core i7打得体无完肤,此外,即使关闭超线程后,Westmere还是要比8线程的Core i7高一些,由此可见,超线程的作用只是负责,真正的核心才是更重要的。
地瓜  论坛元老  发表于 2010-3-18 09:42 | 显示全部楼层
● SuperPi性能测试
    SuperPI是由东京大学Kanada Lab.所制作的一款通过计算圆周率的来检测处理器性能的工具,在测试里面可以有效的反映包括CPU在内的运算性能。在玩家群中,Super PI更是一个衡量CPU性能的标尺之一。

    SuperPi这种纯计算软件完全由架构效率和核心频率高低,以及缓存容量大小速度来左右测试结果,所以核心效能几乎一致,高频率的Bloomfield比Westmere性能好也不难理解了。由于是单线程的软件,是否开启HT自然不会对结果造成太多影响。
● wPrime性能测试
wPrime是一款与Super Pi相同的圆周率计算软件,但与Super Pi只能支持单线程不同的是,wPrime最多可以支持八个线程,也就是说可以支持八核心处理器,并且测试多核心处理器性能时比Super Pi更准确。
    这是一款取代SuperPi的新一代的纯计算软件,不过加入了多核多线程的支持,软件测试原理依旧是测试CPU整体的计算能力。从成绩上看,Westmere展现出了多核心的强大优势,在主频更低的情况下,比Core i7表现更好。
    关闭超线程后的Westmere表现和频率更高的i7 940相差不多。看来超线程技术对于多线程软件的性能贡献幅度还是蛮高的。

● Fritz 10 Benchmark性能测试

最高支持8线程
    这是一款国际象棋测试软件,但它并不是独立存在的,而是《Fritz9》这款获得国际认可的国际象棋程序中的一个测试性能部分。由于国际象棋的运算大致仍旧是依靠电脑CPU的高速处理能力,将每一个可能的走法以穷举算法预测,从中选择胜算最大的最佳走法。所以用它来衡量对比不同的PC系统中CPU的多线程运算能力也是有参考价值的。Fritz这款国际象棋引擎模拟器,测试的是CPU的AI算法运算能力,在默认情况下,软件是根据核心的数量,自动设置线程数进行计算。
地瓜  论坛元老  发表于 2010-3-18 09:42 | 显示全部楼层
● ScienceMark 2.0性能测试
    ScienceMark是一款通过运行一些科学方程式来测试系统性能的工具。主要用于桌面台式机和工作站上测试内存子系统,同时也用于测试服务器环境中的读写延时,当然,它对内存的带宽及CPU与内存控制器之间的速度等也可进行测试。


    从测试成绩来看,ScienceMark对主频更加敏感,核心数量以及三通道内存不是决定因素。

● CineBench R10 性能测试(原生64Bit)

    CineBench使用针对电影电视行业开发的Cinema 4D特效软件引擎,可以测试CPU和显卡的性能。Maxon公司表示,相对于之前的9.x版,R10版更能榨干系统的最后一点潜能,准确体现系统性能指标。最新R10版,支持XP、vista、MAC等,最高支持16核。
  
默认优化线程模式:双核处理器双线同开,三核则三线同开,以此类推
    单线程模式下,我们可以看到,高频率的Core i7表现更好,从中可以看出Westmere单核效能几乎没有改变;但多线程模式下就是另外一番情形了,开启超线程Westmere远远地将Core i7甩开。

    OpenGL模式下,测试主要依靠显卡渲染,CPU只是起到辅助作用,这里由于软件兼容性原因,Westmere开启超线程性能反倒降低。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

0

关注

27

粉丝

2671

主题
精彩推荐
热门资讯
网友晒图
图文推荐
  • 微信公众平台

  • 扫描访问手机版

Archiver|手机版|小黑屋|水窝ibm

GMT+8, 2024-11-30 19:40 , Processed in 0.124805 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2022 Comsenz Inc.