歌尔姜龙:"芯"酷睿性能巅峰 六核i7-980X首发评测
Intel并没有把新的32nm HKMG制造工艺首先用到高端的酷睿i7系列上,毕竟AMD对它完全够不成威胁,不过Intel还是在32nm Clarkdale芯片发布后的两个月把新的制造工艺带到了酷睿i7系列上,它的影响力并不亚于CPU+GPU的Clarkdale芯片,这就是业界首枚台式机六核心处理器芯片——Gulftown,产品型号是酷睿i7-980X至尊版(酷睿i9的命名方式不攻自破),台式电脑也由此开启了六核心计算时代的大门。
业界首颗六核心台式机处理器Intel酷睿i7-980X至尊版要用什么主板和内存?它会有怎样的性能表现?十二线程的空前规格能发挥多大作用?电力消耗表现会水涨船高吗?超频能力又如何?本文将会为您一一揭晓答案。
Intel转产32nm HKMG花80亿美元,比AMD市值都高
Intel在美国本土的四座晶圆厂将陆续开始32纳米芯片的生产
70亿至80亿美元,这是Intel在美国本土转产32nm制造工艺要花掉的钱,现在位于俄勒冈州的两座晶圆厂D1D和D1C已经完成了32nm制造工艺的转产工作,而位于亚利桑那州和新墨西哥州的两座晶圆厂Fab 32和Fab11X也预计会在2010年下半年完成32nm制造工艺的转产工作。六核心Gulftown芯片的面积有248平方毫米,晶体管数量有11.7亿个,基本上就是双核心Clarkdale芯片81平方毫米和3.84亿个(不包括45nm GPU)的三倍。
研发代号P1268的32纳米制造工艺
虽然Intel的Tick-Tock运转是从2006年的65纳米Core芯片才开始的,不过每两年更新芯片制造工艺的周期从1989年开始就一直被Intel保持着,这也就是我们所说的广义上的摩尔定律。Intel在上一轮的Tick更新,也就是代号P1266的45纳米Penryn芯片上首次采用了High-K和Metal Gate材料的晶体管,这也让45纳米Penryn芯片成为Intel历史上从研发到量产周期最短的芯片,其中研发周期则更是只有代号P1264的65纳米芯片的一半而已。
NMOS和PMOS晶体管的效能较之45纳米制造工艺时分别提高了14%和22%
代号P1268的32纳米芯片仍然是基于High-K和Metal Gate材料的晶体管设计的,不过其High-K介质层的厚度已经从45纳米的1纳米变薄至0.9纳米(65纳米制造工艺下采用传统二氧化硅材料做到1.2纳米的厚度已经是极限了),Metal Gate介质层的厚度也变薄至30纳米。除此之外,晶体管栅极之间的距离也正在以每两年0.7倍的速度变窄,Intel 32纳米Westmere芯片112.5纳米的晶体管栅极宽度是现在所有相同芯片制造工艺上最窄的了。
Intel 32纳米制造工艺更薄的High-K介质层和Metal Gate介质层让NMOS和PMOS晶体管的效能较之45纳米制造工艺时分别提高了14%和22%,漏电流也分别降低了5倍和10倍。Intel 32纳米Westmere芯片的重要金属层仍然采用193纳米浸没式光刻技术,非重要金属层采用193纳米或248纳米干式光刻技术,芯片面积相当于45纳米制造工艺时的70%。处理器本身采用9层铜基板和主要材料是铜的Low-K内部连接线,并采用无铅无卤封装。
Intel 32纳米制造工艺技术特性
重温Nehalem架构的模块化设计
做为全球最大的芯片供应商,Intel是要同时兼顾到台式机、笔记本以及工作站/服务器这三大市场的,缺一不可。坦白说在65nm Core架构到45nm Penryn这轮Tick-Tock上,虽然Intel在台式机和工作站/服务器这两大市场上斩获颇丰,但最大的受益者还是笔记本平台。而在Nehalem架构的设计上,Intel的工程师们不再向某一平台倾斜,而是力求设计出能同时满足台式机、笔记本以及工作站/服务器三大平台新型应用需求的处理器产品。
Nehalem架构的设计精髓所在,即模块化的设计(Building Block)
这也就是Nehalem架构的设计精髓所在,即模块化的设计(Building Block)。正如这个设计思路的名字那样,Intel把Nehalem架构分成了若干个单元,他们可以根据不同市场对处理器产品的不同需求对这些单元进行任意组合,从而形成最符合那个市场的处理器产品。这些单元包括了核心/线程数量、系统总线控制器/内存控制器数量、共享缓存容量、节电单元模块甚至是内建图形芯片(32nm Westmere架构的Clarkdale芯片)等等。
这样做的好处是显而易见的。在Nehalem架构设计成型后,Intel就可以像“搭积木”一样在最短的时间里迎合市场对处理器产品的需求,因为在这个时候只需要增减对应的功能模块来满足效能需求就好了,并不像旧有的酷睿2四核和酷睿2双核那样,只能依靠芯片的工作频率和二级缓存容量来定位产品,从而避免产品定位重叠的“尴尬”。市场反应更快、定位更加精准且更丰富的产品对于Intel这样一家商业公司来说无疑是相当重要的。
Bloomfield芯片
Gulftown芯片
Nehalem架构可扩充的设计初衷让Gulftown芯片不需要进行重新设计。得益于32nm第二代HKMG制造工艺,Gulftown芯片在Bloomfield芯片的基础上增加了两个物理核心,加之第三代超线程技术,从而达成6核心12线程的空前规格。Gulftown芯片也继续贯彻了Nehalem架构首席设计师Ronak Singhal每个核心至少有2MB三级缓存的政策,因此你可以看到六核心Gulftown芯片的三级缓存是12MB,而四核心Bloomfield芯片是8MB。
Nehalem/Westmere架构也是在Core/Penryn架构上改良而来的
“失而复得”的AES-NI指令
新的32纳米Westmere芯片在这方面也有动作,新增了六条针对加密和解密运算的指令
上代Nehalem架构在上上代Penryn芯片SSE 4.1指令集的基础上新增了七条SSE 4.2指令,主要对字符和文本处理能力做出强化,而新的32纳米Westmere芯片在这方面也有动作,新增了六条针对加密和解密运算的指令——AES(Advanced Encryption Standard),其运算标准是根据美国联邦信息处理标准(FIPS)第197号文件制定的,是分组密码(Block Cipher)运算最为主流的规范,这意味着Intel AES-NI指令的应用范围会很广。
这六条AES指令中包括了四条的加密解密指令(AESENC、AESENCLAST、AESDEC、AESDECLAST)和两条的密钥生成(AESIMC 、AESKEYGENASSIST)指令,Intel宣称硬件支持AES加速可以比软件快四倍以上。Intel AES-NI指令不但支持三种符合AES官方规范的密钥长度(ASE128 、ASE192 、ASE256)和所有符合AES官方规范的运算模式,甚至还可以支持若干种并不在AES官方规范中的算法,数据的安全性也可以因其而获益。
另外,Westmere芯片还支持一组名为Carryless Multiply(PCLMULQDQ)的指令,它可以让处理器在一个周期内处理两组64-Bit的Carry-less Multiplication,这是很多加密标准所必须要处理到的部分,采用伽罗瓦计数器模式(GCM)。这一模式在2006年4月份得到了美国政府的批准和支持,和AES规范混合使用,是美国国家安全机构(NSA)发布的Suite B加密算法集的子集,也是美国电气和电子工程师协会IEEE 802.1AE的标准。
A1版本上还看不到AES-NI指令
B1版本上已经有了AES-NI指令
有助于提高处理器的AES加密和解密运算性能
最终定名酷睿i7-980X,酷睿i9说法不攻自破
八线程+睿频技术的是i7,四线程+睿频技术的是i5,四线程没有睿频技术的就是i3
从45nm Nehalem芯片开始,Intel台式机处理器启用了新的“Core i”品牌。当时正值Microsoft Windows 7发布,加之Intel的新品牌叫Core i7,因此很容易让人把两者联系在一起,就像当年AMD借Windows XP发布之势拿出的Athlon XP品牌一样。不过随着Core i5和Core i3品牌的相继到来,人们才知道Core i7里的7和Windows 7里的7没有半点关系,Core i品牌里的数字只不过是和BMW车一样用来划分产品定位高低的型号罢了。
在我看来,“Core i”品牌里的“Core”还是核心、芯片的意思,而“i”则是智能、智慧(Intelligence)的意思。我不知道Intel在其他国家是怎么宣传“Core i”品牌的,至少在中国“Core i”的确像我所说被宣传为“智能芯片”。记得当时有人问Intel为什么要用“Core i”这个品牌,他们只是说在过去的一年里他们一直在对旗下的品牌结构进行探索,力求让其更能简洁的反映出产品定位,而新的“Core i”会比旧的“Core 2”更好。
英特尔酷睿i7处理器家族对比
这一轮Tick-Tock过后Intel Core 2 Duo/Quad品牌和LGA775插座已经成为过去式,取而代之的是新的Core i品牌和LGA1366/1156插座。你可以这样区分i7、i5、i3三个系列:八线程+睿频技术的是i7,四线程+睿频技术的是i5,四线程没有睿频技术的就是i3了。如果按照这样的划分依据,那么980X至尊版的确不应该被放在酷睿i7品牌下,难怪也会出现所谓酷睿i9的猜想。不过Intel也明确放话了,酷睿i7(至尊版)就是他们的高端品牌。
Intel酷睿i家族处理器列表(点击放大)
酷睿i7-980X/975合照,都是LGA1366电容有区别
图左为酷睿i7-980X,右为酷睿i7-975
图左为酷睿i7-980X,右为酷睿i7-975
图左为酷睿i7-980X,右为酷睿i7-975,可以看到两者的电容有明显的不同
处理器基板上面那些密密麻麻的触点,Intel告诉我们说那是用来进行内部检测用的
X58/ICH10R主板接着用,更新BIOS文件即可
X58/ICH10R主板接着用,更新BIOS文件即可
Intel在2008年底发布Bloomfield核心处理器和X58/ICH10R主板的LGA1366平台时,我们还不知道六核心Gulftown处理器的事情,以至于我们还会怀疑高端的LGA1366平台到底可以有多长的生命周期。不过我们当时的这种疑虑随着六核心Gulftown处理器的发布被打消掉了,酷睿i7-980X沿用了LGA1366插槽,也就是说它可以继续在X58/ICH10R主板上使用,你所要做的只是更新主板的BIOS文件让它可以识别i7-980X的CPUID就好。
处理器支持列表上依然没有酷睿i7-980X处理器
不过这并不影响它对这颗处理器的识别
1201版BIOS文件的华硕P6T主板
官方DDR3-1066内存规格不遗憾,实际要高的多
官方DDR3-1066内存规格不遗憾,实际要高的多
可以透过Intel官方的XMP内存技术来获得更快的内存频率
DDR3-1600
内存支持方面,Gulftown处理器和Bloomfield处理器一样官方只是支持到DDR3-1066,我记得当时在Bloomfield处理器发布的时候Intel对此的解释是说DDR3-1333及以上的规格暂时还没有通过官方认证。事实上无论是透过Intel官方的XMP内存技术,还是各家主板厂商的BIOS支持,Core i7-980X处理器都可以获得DDR3-1600甚至是更高的内存规格支持。像是华硕基本款的X58主板PT6在BIOS中也可以给到预设DDR3-2400的选项。
按照Intel的设计规范,DDR3内存工作在1.65V以上的电压时就会出现警告
用LGA1366平台不差钱,首选三通道DDR3-1600内存
空前强大的原厂散热器——Intel DBX-B
全新Intel DBX-B散热解决方案
盒装Core i7-980X处理器内会搭载一个名为“Intel DBX-B”的塔式散热器来支持提高超频性能,它可以承受50倍的重力冲击(相当于从3 英尺多的高度落下),闲置状态下的CPU(800 RPM)噪音低于20分贝,承担繁重负载时的CPU(1800 RPM)最大噪音低于35分贝。散热器顶部设有调速开关,“Q”档为较低转速,“P”档为较高转速,我们在后面测试Core i7-980X处理器超频能力的时候就使用了这个自带的DBX-B塔式散热器。
散热器顶部设有调速开关,“Q”档为较低转速,“P”档为较高转速
抛光处理的接触面
我们的测试平台
基准测试软件方面优先选择了我们最为看重的BAPCo SYSMark 2007 Preview,其次是是Futuremark PCMark/3DMark Vantage。随着Microsoft Windows 7的上马,我们所做的应用测试基本上也都是在x64版本的Windows 7下进行的。除了整体性能的SYSMark 2007,我们也加入更多的项目在处理器测试上,其中包括音、视频的转档,3D渲染,办公应用以及3D游戏这几个方面,处理器在功耗和超频方面的表现也是我门要测试的。
你能相信这是一台桌面级电脑的线程数量吗?
SYSMark 2007整机性能
PCMark/3DMark Vantage整机性能
视频转档/编辑性能测试
3D渲染性能测试
办公应用性能测试
3D游戏性能测试
电力消耗表现
酷睿Core i7-980X处理器在待机时会自动降频至1.6GHz
超频能力表现
140MHz x 31 = 4.35GHz
直接拉升Core i7-980X处理器的倍频从x25到x31,BCLK频率也从133MHz微调至140MHz,比较轻松的拿到4.35GHz的时钟频率,这个时候处理器的工作电压是由主板自动分配的,有1.344V,而预设的电压是1.24V。
134MHz x 35 = 4.7GHz
酷睿i7-980X绝非纸面发布,Intel至尊地带渠道助力
酷睿i7-980X是x86处理器市场上运作速度最快、表现最智能、功能最强大的台式机产品
如果在x86服务器/工作站领域谈六核心处理器,那确实不算什么新鲜玩意,Intel的Dunnington和AMD的Istanbul都早已经是这样的产品了。尽管台式电脑对于并行计算能力的需求远不及服务器/工作站来的迫切,但x86双雄还是都打算在今年把六核心处理器推向台式机市场。不过,Intel的Gulftown已经和当年的Dunnington完全不是一回事,新的制造工艺、新的架构设计……,而AMD的Thuban则基本上就是Istanbul的台式机版本。
其实Gulftown芯片的主战场还是应该在x86服务器/工作站领域,因为在台式机市场上,酷睿i7-980X至尊版处理器不可能会有对手,无论是在效能上还是在价格上,一颗酷睿i5-750就让AMD难以逾越了。所以说与其把酷睿i7-980X看成一颗台式机处理器,倒不如说它是至强W3680(单路的Gulftown,除此之外还有双路的X5600系列和低电压的L5640)的台式机版本。当然,酷睿i7-980X无倍频上限的至尊版概念在台式机处理器上才有。
其实给酷睿i7-980X处理器下结论反倒简单了——它是x86处理器市场上运作速度最快、表现最智能、功能最强大的台式机产品,主要面向DIY发烧友、极限游戏及超频玩家、3D内容创建者等,或许也只有Intel自己才知道什么时候能有新的产品超过它。我们在肯定酷睿i7-980X处理器巅峰性能的同时,更称道它在电力消耗方面的表现,在轻松刷新酷睿i7-975所保持的性能纪录的同时,我们并没有看到酷睿i7-980X的电力消耗有明显增长。
Intel中国越来越重视高端用户与市场,未来也将会投入更多时间开发高端市场
- 处理器频率:3.33GHz
- 多核心:六核心12线程
- 接口类型:LGA1366
- 制程工艺:32纳米
- 二级缓存容量:1536KB
- 三级缓存容量:12288KB
- 核心类型:Gulftown