岩土工程师基础难考么:CPU的制作过程详解

来源:百度文库 编辑:偶看新闻 时间:2024/04/26 12:39:52
现在市场上产品丰富,琳琅满目,当你使用着配置了最新款CPU的电脑在互联网上纵横驰骋,在各种程序应用之间操作自如的时候,有没有兴趣去想一想这个头不大、功能不小的CPU是怎么制作出来的呢。

在今天的半导体制造业中,计算机中央处理器无疑是受关注程度最高的领域,而这个领域中众所周知的两大巨头,其所遵循的处理器架构均为x86,而另外一家号称信息产业的蓝色巨人的IBM,也拥有强大的处理器设计与制造能力,它们最先发明了应变硅技术,并在90纳米的处理器制造工艺上走在最前列。在今天的文章中,我们将一步一步的为您讲述中央处理器从一堆沙子到一个功能强大的集成电路芯片的全过程。

制造CPU的基本原料

如果问及CPU的原料是什么,大家都会轻而易举的给出答案—是硅。这是不假,但硅又来自哪里呢?其实就是那些最不起眼的沙子。难以想象吧,价格昂贵,结构复杂,功能强大,充满着神秘感的CPU竟然来自那根本一文不值的沙子。当然这中间必然要经历一个复杂的制造过程才行。不过不是随便抓一把沙子就可以做原料的,一定要精挑细选,从中提取出最最纯净的硅原料才行。试想一下,如果用那最最廉价而又储量充足的原料做成CPU,那么成品的质量会怎样,你还能用上像现在这样高性能的处理器吗?

 除去硅之外,制造CPU还需要一种重要的材料就是金属。目前为止,铝已经成为制作处理器内部配件的主要金属材料,而铜则逐渐被淘汰,这是有一些原因的,在目前的CPU工作电压下,铝的电迁移特性要明显好于铜。所谓电迁移问题,就是指当大量电子流过一段导体时,导体物质原子受电子撞击而离开原有位置,留下空位,空位过多则会导致导体连线断开,而离开原位的原子停留在其它位置,会造成其它地方的短路从而影响芯片的逻辑功能,进而导致芯片无法使用。

这就是许多Northwood Pentium 4换上SNDS(北木暴毕综合症)的原因,当发烧友们第一次给Northwood Pentium 4超频就急于求成,大幅提高芯片电压时,严重的电迁移问题导致了CPU的瘫痪。这就是intel首次尝试铜互连技术的经历,它显然需要一些改进。不过另一方面讲,应用铜互连技术可以减小芯片面积,同时由于铜导体的电阻更低,其上电流通过的速度也更快。

  除了这两样主要的材料之外,在芯片的设计过程中还需要一些种类的化学原料,它们起着不同的作用,这里不再赘述。

CPU制造的准备阶段

在必备原材料的采集工作完毕之后,这些原材料中的一部分需要进行一些预处理工作。而作为最主要的原料,硅的处理工作至关重要。首先,硅原料要进行化学提纯,这一步骤使其达到可供半导体工业使用的原料级别。而为了使这些硅原料能够满足集成电路制造的加工需要,还必须将其整形,这一步是通过溶化硅原料,然后将液态硅注入大型高温石英容器而完成的。

  而后,将原料进行高温溶化。中学化学课上我们学到过,许多固体内部原子是晶体结构,硅也是如此。为了达到高性能处理器的要求,整块硅原料必须高度纯净,及单晶硅。然后从高温容器中采用旋转拉伸的方式将硅原料取出,此时一个圆柱体的硅锭就产生了。从目前所使用的工艺来看,硅锭圆形横截面的直径为200毫米。不过现在intel和其它一些公司已经开始使用300毫米直径的硅锭了。在保留硅锭的各种特性不变的情况下增加横截面的面积是具有相当的难度的,不过只要企业肯投入大批资金来研究,还是可以实现的。intel为研制和生产300毫米硅锭而建立的工厂耗费了大约35亿美元,新技术的成功使得intel可以制造复杂程度更高,功能更强大的集成电路芯片。而200毫米硅锭的工厂也耗费了15亿美元。下面就从硅锭的切片开始介绍CPU的制造过程。


单晶硅锭

在制成硅锭并确保其是一个绝对的圆柱体之后,下一个步骤就是将这个圆柱体硅锭切片,切片越薄,用料越省,自然可以生产的处理器芯片就更多。切片还要镜面精加工的处理来确保表面绝对光滑,之后检查是否有扭曲或其它问题。这一步的质量检验尤为重要,它直接决定了成品CPU的质量。

新的切片中要掺入一些物质而使之成为真正的半导体材料,而后在其上刻划代表着各种逻辑功能的晶体管电路。掺入的物质原子进入硅原子之间的空隙,彼此之间发生原子力的作用,从而使得硅原料具有半导体的特性。今天的半导体制造多选择CMOS工艺(互补型金属氧化物半导体)。其中互补一词表示半导体中N型MOS管和P型MOS管之间的交互作用。而N和P在电子工艺中分别代表负极和正极。多数情况下,切片被掺入化学物质而形成P型衬底,在其上刻划的逻辑电路要遵循nMOS电路的特性来设计,这种类型的晶体管空间利用率更高也更加节能。同时在多数情况下,必须尽量限制pMOS型晶体管的出现,因为在制造过程的后期,需要将N型材料植入P型衬底当中,而这一过程会导致pMOS管的形成。

在掺入化学物质的工作完成之后,标准的切片就完成了。然后将每一个切片放入高温炉中加热,通过控制加温时间而使得切片表面生成一层二氧化硅膜。通过密切监测温度,空气成分和加温时间,该二氧化硅层的厚度是可以控制的。在intel的90纳米制造工艺中,门氧化物的宽度小到了惊人的5个原子厚度。这一层门电路也是晶体管门电路的一部分,晶体管门电路的作用是控制其间电子的流动,通过对门电压的控制,电子的流动被严格控制,而不论输入输出端口电压的大小。准备工作的最后一道工序是在二氧化硅层上覆盖一个感光层。这一层物质用于同一层中的其它控制应用。这层物质在干燥时具有很好的感光效果,而且在光刻蚀过程结束之后,能够通过化学方法将其溶解并除去。

光刻蚀

这是目前的CPU制造过程当中工艺非常复杂的一个步骤,为什么这么说呢?光刻蚀过程就是使用一定波长的光在感光层中刻出相应的刻痕,由此改变该处材料的化学特性。这项技术对于所用光的波长要求极为严格,需要使用短波长的紫外线和大曲率的透镜。刻蚀过程还会受到晶圆上的污点的影响。每一步刻蚀都是一个复杂而精细的过程。设计每一步过程的所需要的数据量都可以用10GB的单位来计量,而且制造每块处理器所需要的刻蚀步骤都超过20步(每一步进行一层刻蚀)。而且每一层刻蚀的图纸如果放大许多倍的话,可以和整个纽约市外加郊区范围的地图相比,甚至还要复杂,试想一下,把整个纽约地图缩小到实际面积大小只有100个平方毫米的芯片上,那么这个芯片的结构有多么复杂,可想而知了吧。

当这些刻蚀工作全部完成之后,晶圆被翻转过来。短波长光线透过石英模板上镂空的刻痕照射到晶圆的感光层上,然后撤掉光线和模板。通过化学方法除去暴露在外边的感光层物质,而二氧化硅马上在陋空位置的下方生成。

掺杂

在残留的感光层物质被去除之后,剩下的就是充满的沟壑的二氧化硅层以及暴露出来的在该层下方的硅层。这一步之后,另一个二氧化硅层制作完成。然后,加入另一个带有感光层的多晶硅层。多晶硅是门电路的另一种类型。由于此处使用到了金属原料(因此称作金属氧化物半导体),多晶硅允许在晶体管队列端口电压起作用之前建立门电路。感光层同时还要被短波长光线透过掩模刻蚀。再经过一部刻蚀,所需的全部门电路就已经基本成型了。然后,要对暴露在外的硅层通过化学方式进行离子轰击,此处的目的是生成N沟道或P沟道。这个掺杂过程创建了全部的晶体管及彼此间的电路连接,没个晶体管都有输入端和输出端,两端之间被称作端口。

重复这一过程

  从这一步起,你将持续添加层级,加入一个二氧化硅层,然后光刻一次。重复这些步骤,然后就出现了一个多层立体架构,这就是你目前使用的处理器的萌芽状态了。在每层之间采用金属涂膜的技术进行层间的导电连接。今天的P4处理器采用了7层金属连接,而Athlon64使用了9层,所使用的层数取决于最初的版图设计,并不直接代表着最终产品的性能差异。

接下来的几个星期就需要对晶圆进行一关接一关的测试,包括检测晶圆的电学特性,看是否有逻辑错误,如果有,是在哪一层出现的等等。而后,晶圆上每一个出现问题的芯片单元将被单独测试来确定该芯片有否特殊加工需要。


  而后,整片的晶圆被切割成一个个独立的处理器芯片单元。在最初测试中,那些检测不合格的单元将被遗弃。这些被切割下来的芯片单元将被采用某种方式进行封装,这样它就可以顺利的插入某种接口规格的主板了。大多数intel和AMD的处理器都会被覆盖一个散热层。在处理器成品完成之后,还要进行全方位的芯片功能检测。这一部会产生不同等级的产品,一些芯片的运行频率相对较高,于是打上高频率产品的名称和编号,而那些运行频率相对较低的芯片则加以改造,打上其它的低频率型号。这就是不同市场定位的处理器。而还有一些处理器可能在芯片功能上有一些不足之处。比如它在缓存功能上有缺陷(这种缺陷足以导致绝大多数的CPU瘫痪),那么它们就会被屏蔽掉一些缓存容量,降低了性能,当然也就降低了产品的售价,这就是Celeron和Sempron的由来。

在CPU的包装过程完成之后,许多产品还要再进行一次测试来确保先前的制作过程无一疏漏,且产品完全遵照规格所述,没有偏差。
  回复: CPU的制作过程详解
CPU核心详解

核心(Die)又称为内核,是CPU最重要的组成部分。CPU中心那块隆起的芯片就是核心,是由单晶硅以一定的生产工艺制造出来的,CPU所有的计算、接受/存储命令、处理数据都由核心执行。各种CPU核心都具有固定的逻辑结构,一级缓存、二级缓存、执行单元、指令级单元和总线接口等逻辑单元都会有科学的布局。

为了便于CPU设计、生产、销售的管理,CPU制造商会对各种CPU核心给出相应的代号,这也就是所谓的CPU核心类型。

不同的CPU(不同系列或同一系列)都会有不同的核心类型(例如Pentium 4的Northwood,Willamette以及K6-2的CXT和K6-2+的ST-50等等),甚至同一种核心都会有不同版本的类型(例如Northwood核心就分为B0和C1等版本),核心版本的变更是为了修正上一版存在的一些错误,并提升一定的性能,而这些变化普通消费者是很少去注意的。每一种核心类型都有其相应的制造工艺(例如0.25um、0.18um、0.13um以及0.09um等)、核心面积(这是决定CPU成本的关键因素,成本与核心面积基本上成正比)、核心电压、电流大小、晶体管数量、各级缓存的大小、主频范围、流水线架构和支持的指令集(这两点是决定CPU实际性能和工作效率的关键因素)、功耗和发热量的大小、封装方式(例如S.E.P、PGA、FC-PGA、FC-PGA2等等)、接口类型(例如Socket 370,Socket A,Socket 478,Socket T,Slot 1、Socket 940等等)、前端总线频率(FSB)等等。因此,核心类型在某种程度上决定了CPU的工作性能。

一般说来,新的核心类型往往比老的核心类型具有更好的性能(例如同频的Northwood核心Pentium 4 1.8A GHz就要比Willamette核心的Pentium 4 1.8GHz性能要高),但这也不是绝对的,这种情况一般发生在新核心类型刚推出时,由于技术不完善或新的架构和制造工艺不成熟等原因,可能会导致新的核心类型的性能反而还不如老的核心类型的性能。例如,早期Willamette核心Socket 423接口的Pentium 4的实际性能不如Socket 370接口的Tualatin核心的Pentium III和赛扬,现在的低频Prescott核心Pentium 4的实际性能不如同频的Northwood核心Pentium 4等等,但随着技术的进步以及CPU制造商对新核心的不断改进和完善,新核心的中后期产品的性能必然会超越老核心产品。

CPU核心的发展方向是更低的电压、更低的功耗、更先进的制造工艺、集成更多的晶体管、更小的核心面积(这会降低CPU的生产成本从而最终会降低CPU的销售价格)、更先进的流水线架构和更多的指令集、更高的前端总线频率、集成更多的功能(例如集成内存控制器等等)以及双核心和多核心(也就是1个CPU内部有2个或更多个核心)等。CPU核心的进步对普通消费者而言,最有意义的就是能以更低的价格买到性能更强的CPU。

Athlon XP的核心类型

Athlon XP有4种不同的核心类型,但都有共同之处:都采用Socket A接口而且都采用PR标称值标注。

Palomino
这是最早的Athlon XP的核心,采用0.18um制造工艺,核心电压为1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz。

Thoroughbred
这是第一种采用0.13um制造工艺的Athlon XP核心,又分为Thoroughbred-A和Thoroughbred-B两种版本,核心电压1.65V-1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz和333MHz。

Thorton
采用0.13um制造工艺,核心电压1.65V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为333MHz。可以看作是屏蔽了一半二级缓存的Barton。

Barton
采用0.13um制造工艺,核心电压1.65V左右,二级缓存为512KB,封装方式采用OPGA,前端总线频率为333MHz和400MHz。

新Duron的核心类型

AppleBred
采用0.13um制造工艺,核心电压1.5V左右,二级缓存为64KB,封装方式采用OPGA,前端总线频率为266MHz。没有采用PR标称值标注而以实际频率标注,有1.4GHz、1.6GHz和1.8GHz三种。

Athlon 64系列CPU的核心类型

Clawhammer
采用0.13um制造工艺,核心电压1.5V左右,二级缓存为1MB,封装方式采用mPGA,采用Hyper Transport总线,内置1个128bit的内存控制器。采用Socket 754、Socket 940和Socket 939接口。

Newcastle
其与Clawhammer的最主要区别就是二级缓存降为512KB(这也是AMD为了市场需要和加快推广64位CPU而采取的相对低价政策的结果),其它性能基本相同。

Athlon XP的核心类型

Athlon XP有4种不同的核心类型,但都有共同之处:都采用Socket A接口而且都采用PR标称值标注。

Palomino
这是最早的Athlon XP的核心,采用0.18um制造工艺,核心电压为1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz。

Thoroughbred
这是第一种采用0.13um制造工艺的Athlon XP核心,又分为Thoroughbred-A和Thoroughbred-B两种版本,核心电压1.65V-1.75V左右,二级缓存为256KB,封装方式采用OPGA,前端总线频率为266MHz和333MHz。

目前Intel推出的双核心处理器有Pentium D和Pentium Extreme Edition,同时推出945/955芯片组来支持新推出的双核心处理器,采用90nm工艺生产的这两款新推出的双核心处理器使用是没有针脚的LGA 775接口,但处理器底部的贴片电容数目有所增加,排列方式也有所不同。

桌面平台的核心代号Smithfield的处理器,正式命名为Pentium D处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外,D的字母也更容易让人联想起Dual-Core双核心的涵义。

Intel的双核心构架更像是一个双CPU平台,Pentium D处理器继续沿用Prescott架构及90nm生产技术生产。Pentium D内核实际上由于两个独立的2独立的Prescott核心组成,每个?

目前Intel推出的双核心处理器有Pentium D和Pentium Extreme Edition,同时推出945/955芯片组来支持新推出的双核心处理器,采用90nm工艺生产的这两款新推出的双核心处理器使用是没有针脚的LGA 775接口,但处理器底部的贴片电容数目有所增加,排列方式也有所不同。

桌面平台的核心代号Smithfield的处理器,正式命名为Pentium D处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外,D的字母也更容易让人联想起Dual-Core双核心的涵义。

Intel的双核心构架更像是一个双CPU平台,Pentium D处理器继续沿用Prescott架构及90nm生产技术生产。Pentium D内核实际上由于两个独立的2独立的Prescott核心组成,每个核心拥有独立的1MB L2缓存及执行单元,两个核心加起来一共拥有2MB,但由于处理器中的两个核心都拥有独立的缓存,因此必须保正每个二级缓存当中的信息完全一致,否则就会出现运算错误。

MCH协调两颗核心之间的相互调用
为了解决这一问题,Intel将两个核心之间的协调工作交给了外部的MCH(北桥)芯片,虽然缓存之间的数据传输与存储并不巨大,但由于需要通过外部的MCH芯片进行协调处理,毫无疑问的会对整个的处理速度带来一定的延迟,从而影响到处理器整体性能的发挥。
由于采用Prescott内核,因此Pentium D也支持EM64T技术、XD bit安全技术。值得一提的是,Pentium D处理器将不支持Hyper-Threading技术。原因很明显:在多个物理处理器及多个逻辑处理器之间正确分配数据流、平衡运算任务并非易事。比如,如果应用程序需要两个运算线程,很明显每个线程对应一个物理内核,但如果有3个运算线程呢?因此为了减少双核心Pentium D架构复杂性,英特尔决定在针对主流市场的Pentium D中取消对Hyper-Threading技术的支持。
同出自Intel之手,而且Pentium D和Pentium Extreme Edition两款双核心处理器名字上的差别也预示着这两款处理器在规格上也不尽相同。其中它们之间最大的不同就是对于超线程(Hyper-Threading)技术的支持。Pentium D不能支持超线程技术,而Pentium Extreme Edition则没有这方面的限制。在打开超线程技术的情况下,双核心Pentium Extreme Edition处理器能够模拟出另外两个逻辑处理器,可以被系统认成四核心系统。

前言:

  受硬件发烧友追捧的Athlon 64处理器在2004年下半年开始改用90nm制程的新核心。目前,90nm K8 Winchester核心已经广泛应用在Socket 939 Athlon 64 3000+、3200+和3500+和Socket 939、754 Sempron处理器系列中。然而Winchester并不能完全取代此前采用130nm制程的Athlon 64处理器核心。

  之所以这样,里面有诸多原因,其中最大的问题是Winchester核心的频率提升潜力的并不是很理想。与130nm核心相比,尽管它拥有较低的电源消费量及热量,但基于Winchester核心的处理器最大实际工作频率仅仅只有2.2GHz。这也是为什么拥有2.4GHz和2.6GHz核心频率的Athlon 64顶级型号及Athlon 64 FX-55仍然基于采用0.13微米制程的Newcastle和ClawHammer旧核心的原因。

  然而,AMD宣称将在2005年4月开始停产基于旧制程核心的Athlon 64处理器了。正是在这种情况下,第一款基于Winchester核心的处理器诞生了!AMD公司的工程师们已经完成了大量工作。他们设计了一个新的90nm Venice核心(E3改进版),它应该会让130nm旧核心成为历史。

  对新核心寄予的巨大希望是基于这个事实的:AMD开始引入专门对Venice核心使用的新生产标准了。当然,这个新核心并不仅仅只用来取代低频Athlon 64型号的Winchester核心、将新功能性、新特性能引入到了这些处理器之中那么简单,同时也将取代在顶级Athlon 64处理器中使用的Newcastle和ClawHammer核心。

  而且Venice的到来为更快的Athlon 64处理器型号的发布亮起了绿灯。在不远的将来,AMD预计会发布基于Venice和San Diego核心(San Diego是Venice的改进版,具有更大的L2缓存)的Athlon 64 4200+和Athlon 64 FX-57新处理器。那么新的Venice核心将为Athlon 64 带来多大的新意思呢?这就是本文所要探讨的主要话题! CPU核心详解

一、Venice核心新在那里?—三大新特性!

1、Dual Stress Liner(DSL)技术

  在2004 年末,AMD和IBM联合公布在晶体管工艺领域取得突破。这两家公司的工程师共同开发了一项称为Dual Stress Liner的技术,可以将半导体晶体管的响应速度提高24%。

  其实这技术背后的原理是相当简单的。事实上,DSL很类似于英特尔在90nm生产技术中引入的应变硅技术。我们都知道,晶体管越微细化,运行速度就越高,但同时也会引发泄漏电流增加、开关效率降低,从而导致耗电和发热量的增加。而Dual Stress Liner通过向晶体管的硅层施加应力,同时实现了速度的提高与耗电量的降低。

  换句话说,DSL能改变硅之间的原子格,从而让晶体管获得更快的响应时间及更低的热量。在一种情况下硅原子是被“拉开”的,而在另一种情况下则是“挤在一起”的,这通过把它们移到一个具有要么伸展,要么压紧的原子格的氮化物封闭层上来实现。与Intel使用的应变硅不同,来自AMD和IBM的DSL能够被用于两种类型的晶体管:NMOS和PMOS(具有n和p通道)而无需使用极难获得的硅锗层,硅锗层会增加成本,并且有可能影响芯片的产量。

  DSL这种双重性性,让它比英特尔的应变硅更有效:DSL可以将晶体管的响应速度提升24%,而应变硅能提供的最大改进在15-20%。并且更重要的是,AMD和IBM 这项新技术对产量及生产成本并没有任何负面影响。由于在生产时无需使用新的生产方法,所以使用标准生产设备和材料便可迅速展开量产。另外,配合使用硅绝缘膜构造(SOI,绝缘体上硅)与应变硅,还可生产性能更高、耗电更低的晶体管。

新的Venice处理器核心是AMD第一款应用Dual Stress Liner技术的桌面处理器。这项新技术与目前的SOI技术共同使用可以让基于Venice的处理器能够达到更高的核心工作时钟频率。AMD工程师们预料,Dual Stress Liner和SOI一起结合可以让Athlon 64处理器的频率潜力有大约16%的增长。换句话说,基于Venice的CPU应该拥有达到2.8GHz的标称频率。

2、支持SSE3指令集

  在生产技术转换过程中也引入了一些更具切实意义的东西。我们应该首先指出Venice处理器核心所支持的SIMD指令集有所扩展。目前基于Venice核心上的Athlon 64已经提供对SSE3指令的支持,就象基于象基于Prescott核心的Pentium 4处理器一样。然而,需要提醒你的是SSE3并不是一个完整的指令集,但仅仅只是SSE2指令集的扩展版本。

  因此,Venice所支持SSE3指令集包括11条新指令:

(1)ADDPS,HSUBPS,HADDPD,HSUBPD

  这几条是优化命令,它们能有效地优化标量向量乘积的计算,可以对程序起到自动优化的作用。这些指令对处理3D图形相当有用。

(2)ADDSUBPS,ADDSUBPD,MOVSHDUP,MOVSLDUP,MOVDDUP

  这几条属于数据处理指令,这些指令可以简化复杂数据的处理过程,由于未来数据处理流量将会越来越大,因此Intel在这里应用的指令集最多、达到了五条。

(3)FISTTP

  这属于数据传输命令,它有利于x87浮点转换成整数,并可以大大提高优化的效率。

(4)LDDQU

  这属于特殊处理命令,这条指令主要针对视频解码,用来提高处理器对处理媒体数据结果的精确性。

  在P4中SSE3还包括MONITOR、MWAIT两条指令,而在Venice核心中已经被省去了,因为它们只对Hyper-Threading技术起作用。

  因此,基于Venice核心上的新Athlon 64处理器是目前支持最多SIMD指令集的处理器,包括3DNow!,SSE2和SSE3。从技术上来看,SSE3对于SEE2的改进非常有限,我们不应该期望SSE3指令集能为新Athlon 64带来大幅度的性能提升,而且性能提升也需要有软件支持为前提。尽管Intel在03年夏天就为软件开发者公布了SSE3指令指南,但目前支持SSE3软件的软件寥寥无几,而且都是一些特殊应用程序。

3、改良的整合内存控制器

  每推出一款新Athlon 64处理器核心,AMD工程师都会改良一下它们的整合内存控制器。虽然这可以在一定程度上增加处理器的性能,但更主要的是为了增加内存控制器对不同DIMM模块和不同配置的兼容性。

  此前基于采用90nm 制程、Winchester核心的 Athlon 64处理器当与4条DDR400 SDRAM内存模块搭配使用时,性能将会受到一定程度是限制。如果在一个基于Winchester 核心的Athlon 64处理器的系统中使用4条单面DDR400 ,那么这些内存模块只能工作在2T默认模式下,这将会这导致使系统性能要比普通水准的性能低几个百分点。

  如果使用4条双面内存模块装,DDR400 SDRAM将不能工作在它默认工作频率下,工作频率将会自动降到333MHz。AMD工程师们承诺在新的Venice核心中解决这个问题,他们也的确实现了他们的承诺。基于Venice的Athlon 64处理器能够没有任何限制地与四条单面DDR400 SDRAM内存一起运行,并且如果安装了双面DDR400 SDRAM DIMM的话,它们能够以2T时钟工作在400MHz下。

  除了Venice内存控制器的兼容性得到改进外,内存控制器的性能也有显著的提升。在Venice运行在性能最佳模式时优,我们明显感受到增强型硬件数据预取和更多的写入联合缓存区(4个代替2个)所带来的性能提升。

  所有这些改进正是基于Venice核心的Athlon 64处理器在同频下能胜过旧核心的原因,并且如果在系统中安装了四条内存模块的话,那性能提升将会更为明显。

二、新产品,新的产品阵容线

  新90nmVenice核心将会应用到AMD所有Socket 939 Athlon 64处理器系列中。如果说此前的Winchester核心只能用于工作频率低于2.2GHz的处理器,那么Venice显然应该有助于改善这种情况。AMD从四月4日开始发布基于Venice核心的Socket 939 Athlon 64了,PR值从3000+到3800+。需要注意的是,3000+,3200+和3500+ CPU型号将取代Winchester核心上的相应型号,而新的Athlon 64 3800+将取代Newcastle核心上的相应产品。

  整个核心替换还将包括Athlon 64 4000+,它现在是基于ClawHammer核心的,拥有1MB L2缓存。四月十五日,AMD将开始推出基于San Diego核心的新Athlon 64 4000+处理器,它架构、功能与Venice一样,但拥有更大的L2缓存。下表中列出了基于新旧处理器核心的所有Socket 939 Athlon 64处理器,它们已经上市或短期内将现身:

我们可以看到,基于Venice的CPU还有一个更令我们感到惊奇的地方:动态电压。在对处理器内核心封装时,AMD采取了与Intel一样的手法—基于Venice的处理器将不会在内核封装上标识电压。不同的CPU可能会有不同的电压:1.35V或1.4V。但不幸的是,我们以后从它的外观上将无法知道处理器的默认核心电压。

  至于在TDP(散热设计功率)方面,新的Venice核心的发热量看起来似乎与老版核心一样,然而实际上情况却并非如此。这一点已经得到证明:Venice拥有更大的频率提升潜力,这主要是因为优异的散热设计有效控制了热量的产生。基于Venice核心的Athlon 64在2.6GHz频率以下的功耗将只有89W,而只有在工作频率达到2.8GHz时才会达到更高一级TDP标准—104W。

  总而言之,Venice核心除了以上改进之外,它的内核尺寸及晶体管数量仍与Winchester一样。下面还是让我们看看首款采用Venice核心的Athlon 64处理器—Athlon 64 3800+。这是Athlon 64处理器家族中新的顶级型号,它将在4月15日之前正式进入零售市场。

基于新Venice内核的处理器看起来与它的前辈相差无己。不过,我们仍然可以从编号中辨出谁才最是新者。在处理器封装盖上,如果最后两个字母是“BP”的,就暗示这是最新的Venice核心(E3修正版)。下面是这款处理器在CPU-Z诊断工具所显示出来的相关信息:

令人遗憾的是,最新CPU-Z 1.28版本仍然无法识别出Venice核心,但它检测出该核心支持SSE3,并显示了新处理器的ID号:00020FF0h。

结语:

  尽管Venice核心仍然采用与老版核心相类似的内部架构,但从实际的观点上来看,他仍然显著地不同于前辈:Venice核心引入了DSL技术、SSE3指令集,成功拓展Athlon 64处理器频率提升潜力及功能性。因此,即使这个时候AMD决定不大肆宣扬新核心的发布,我们也不能忽视它为Athlon 64处理器家族的进一步发展展现了新的前景这个重要的事实。那么基于Venice核心的新Athlon 64 3800+的性能、超频性能是否得会有新的突破呢?迟些时候我们将为大家揭开这个迷团……  CPU芯片的主要封装技术

DIP封装

DIP封装(Dual In-line Package),也叫双列直插式封装技术,指采用双列直插形式封装的集成电路芯片,绝大多数中小规模集成电路均采用这种封装形式,其引脚数一般不超过100。DIP封装的CPU芯片有两排引脚,需要插入到具有DIP结构的芯片插座上。当然,也可以直接插在有相同焊孔数和几何排列的电路板上进行焊接。DIP封装的芯片在从芯片插座上插拔时应特别小心,以免损坏管脚。DIP封装结构形式有:多层陶瓷双列直插式DIP,单层陶瓷双列直插式DIP,引线框架式DIP(含玻璃陶瓷封接式,塑料包封结构式,陶瓷低熔玻璃封装式)等。

DIP封装的8086处理器
  DIP封装具有以下特点:
1、适合在PCB(印刷电路板)上穿孔焊接,操作方便。
2、芯片面积与封装面积之间的比值较大,故体积也较大。
  最早的4004、8008、8086、8088等CPU都采用了DIP封装,通过其上的两排引脚可插到主板上的插槽或焊接在主板上。


QFP封装

这种技术的中文含义叫方型扁平式封装技术(Plastic Quad Flat Pockage),该技术实现的CPU芯片引脚之间距离很小,管脚很细,一般大规模或超大规模集成电路采用这种封装形式,其引脚数一般都在100以上。该技术封装CPU时操作方便,可靠性高;而且其封装外形尺寸较小,寄生参数减小,适合高频应用;该技术主要适合用SMT表面安装技术在PCB上安装布线。

QFP封装的80286


PFP封装

该技术的英文全称为Plastic Flat Package,中文含义为塑料扁平组件式封装。用这种技术封装的芯片同样也必须采用SMD技术将芯片与主板焊接起来。采用SMD安装的芯片不必在主板上打孔,一般在主板表面上有设计好的相应管脚的焊盘。将芯片各脚对准相应的焊盘,即可实现与主板的焊接。用这种方法焊上去的芯片,如果不用专用工具是很难拆卸下来的。该技术与上面的QFP技术基本相似,只是外观的封装形状不同而已。

PFP封装的80386


PGA封装

该技术也叫插针网格阵列封装技术(Ceramic Pin Grid Arrau Package),由这种技术封装的芯片内外有多个方阵形的插针,每个方阵形插针沿芯片的四周间隔一定距离排列,根据管脚数目的多少,可以围成2~5圈。安装时,将芯片插入专门的PGA插座。为了使得CPU能够更方便的安装和拆卸,从486芯片开始,出现了一种ZIF CPU插座,专门用来满足PGA封装的CPU在安装和拆卸上的要求。该技术一般用于插拔操作比较频繁的场合之下。

  早先的80486和Pentium、Pentium Pro等CPU均均采用PGA封装形式。


BGA封装

BGA技术(Ball Grid Array Package)即球栅阵列封装技术。该技术的出现便成为CPU、主板南、北桥芯片等高密度、高性能、多引脚封装的最佳选择。但BGA封装占用基板的面积比较大。虽然该技术的I/O引脚数增多,但引脚之间的距离远大于QFP,从而提高了组装成品率。而且该技术采用了可控塌陷芯片法焊接,从而可以改善它的电热性能。另外该技术的组装可用共面焊接,从而能大大提高封装的可靠性;并且由该技术实现的封装CPU信号传输延迟小,适应频率可以提高很大。

  BGA封装具有以下特点:

1、I/O引脚数虽然增多,但引脚之间的距离远大于QFP封装方式,提高了成品率
2、虽然BGA的功耗增加,但由于采用的是可控塌陷芯片法焊接,从而可以改善电热性能
3、信号传输延迟小,适应频率大大提高
4、组装可用共面焊接,可靠性大大提高
  目前较为常见的封装形式

OPGA封装

OPGA(Organic pin grid Array,有机管脚阵列)。这种封装的基底使用的是玻璃纤维,类似印刷电路板上的材料。 此种封装方式可以降低阻抗和封装成本。OPGA封装拉近了外部电容和处理器内核的距离,可以更好地改善内核供电和过滤电流杂波。AMD公司的AthlonXP系列CPU大多使用此类封装。

OPGA封装


mPGA封装

mPGA,微型PGA封装,目前只有AMD公司的Athlon 64和英特尔公司的Xeon(至强)系列CPU等少数产品所采用,而且多是些高端产品,是种先进的封装形式。



CPGA封装

CPGA也就是常说的陶瓷封装,全称为Ceramic PGA。主要在Thunderbird(雷鸟)核心和“Palomino”核心的Athlon处理器上采用。



FC-PGA封装

FC-PGA封装是反转芯片针脚栅格阵列的缩写,这种封装中有针脚插入插座。这些芯片被反转,以至片模或构成计算机芯片的处理器部分被暴露在处理器的上部。通过将片模暴露出来,使热量解决方案可直接用到片模上,这样就能实现更有效的芯片冷却。为了通过隔绝电源信号和接地信号来提高封装的性能,FC-PGA 处理器在处理器的底部的电容放置区域(处理器中心)安有离散电容和电阻。芯片底部的针脚是锯齿形排列的。此外,针脚的安排方式使得处理器只能以一种方式插入插座。FC-PGA 封装用于奔腾 III 和英特尔 赛扬 处理器,它们都使用 370 针。



FC-PGA2封装

FC-PGA2 封装与 FC-PGA 封装类型很相似,除了这些处理器还具有集成式散热器 (IHS)。集成式散热器是在生产时直接安装到处理器片上的。由于 IHS 与片模有很好的热接触并且提供了更大的表面积以更好地发散热量,所以它显著地增加了热传导。FC-PGA2 封装用于奔腾 III 和英特尔赛扬处理器(370 针)和奔腾 4 处理器(478 针)。



OOI封装

OOI 是 OLGA 的简写。OLGA 代表了基板栅格阵列。OLGA 芯片也使用反转芯片设计,其中处理器朝下附在基体上,实现更好的信号完整性、更有效的散热和更低的自感应。OOI 有一个集成式导热器 (IHS),能帮助散热器将热量传给正确安装的风扇散热器。OOI 用于奔腾 4 处理器,这些处理器有 423 针。



PPGA封装

“PPGA”的英文全称为“Plastic Pin Grid Array”,是塑针栅格阵列的缩写,这些处理器具有插入插座的针脚。为了提高热传导性,PPGA 在处理器的顶部使用了镀镍铜质散热器。芯片底部的针脚是锯齿形排列的。此外,针脚的安排方式使得处理器只能以一种方式插入插座。



S.E.C.C.封装

“S.E.C.C.”是“Single Edge Contact Cartridge”缩写,是单边接触卡盒的缩写。为了与主板连接,处理器被插入一个插槽。它不使用针脚,而是使用“金手指”触点,处理器使用这些触点来传递信号。S.E.C.C. 被一个金属壳覆盖,这个壳覆盖了整个卡盒组件的顶端。卡盒的背面是一个热材料镀层,充当了散热器。S.E.C.C. 内部,大多数处理器有一个被称为基体的印刷电路板连接起处理器、二级高速缓存和总线终止电路。S.E.C.C. 封装用于有 242 个触点的英特尔奔腾II 处理器和有 330 个触点的奔腾II 至强和奔腾 III 至强处理器。



S.E.C.C.2 封装

S.E.C.C.2 封装与 S.E.C.C. 封装相似,除了S.E.C.C.2 使用更少的保护性包装并且不含有导热镀层。S.E.C.C.2 封装用于一些较晚版本的奔腾II 处理器和奔腾 III 处理器(242 触点)。



S.E.P.封装

“S.E.P.”是“Single Edge Processor”的缩写,是单边处理器的缩写。“S.E.P.”封装类似于“S.E.C.C.”或者“S.E.C.C.2”封装,也是采用单边插入到Slot插槽中,以金手指与插槽接触,但是它没有全包装外壳,底板电路从处理器底部是可见的。“S.E.P.”封装应用于早期的242根金手指的Intel Celeron 处理器。



PLGA封装

PLGA是Plastic Land Grid Array的缩写,即塑料焊盘栅格阵列封装。由于没有使用针脚,而是使用了细小的点式接口,所以PLGA封装明显比以前的FC-PGA2等封装具有更小的体积、更少的信号传输损失和更低的生产成本,可以有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率、降低生产成本。目前Intel公司Socket 775接口的CPU采用了此封装。



CuPGA封装

CuPGA是Lidded Ceramic Package Grid Array的缩写,即有盖陶瓷栅格阵列封装。其与普通陶瓷封装最大的区别是增加了一个顶盖,能提供更好的散热性能以及能保护CPU核心免受损坏。目前AMD64系列CPU采用了此封装。





水珠儿
超级版主

少儿英文俱乐部:61829451


UID 150112
精华 0
积分 88823
帖子 40695
金币 1381225
威望 88823
阅读权限 10
注册 2006-9-18
来自 深圳
状态 在线 6楼 大 中 小 发表于 2007-3-4 20:29 水珠儿 回复: CPU的制作过程详解 CPU术语大揭秘

3DNow!: (3D no waiting)AMD公司开发的SIMD指令集,可以增强浮点和多媒体运算的速度,它的指令数为21条。
  
    ALU: (Arithmetic Logic Unit,算术逻辑单元)在处理器之中用于计算的那一部分,与其同级的有数据传输单元和分支单元。
  
    BGA:(Ball Grid Array,球状矩阵排列)一种芯片封装形式,例:82443BX。
  
    BHT: (branch prediction table,分支预测表)处理器用于决定分支行动方向的数值表。
  
    BPU:(Branch Processing Unit,分支处理单元)CPU中用来做分支处理的那一个区域。
  
    Brach Pediction: (分支预测)从P5时代开始的一种先进的数据处理方法,由CPU来判断程序分支的进行方向,能够更快运算速度。
  
    CMOS: (Complementary metal Oxide Semiconductor,互补金属氧化物半导体)它是一类特殊的芯片,最常见的用途是主板的BIOS(Basic Input/Output System,基本输入/输出系统)。
  
    CISC: (Complex Instruction Set Computing,复杂指令集计算机)相对于RISC而言,它的指令位数较长,所以称为复杂指令。如:x86指令长度为87位。
  
    COB: (Cache on board,板上集成缓存)在处理器卡上集成的缓存,通常指的是二级缓存,例:奔腾II
  
    COD: (Cache on Die,芯片内集成缓存)在处理器芯片内部集成的缓存,通常指的是二级缓存,例:PGA赛扬370
  
    CPGA: (Ceramic Pin Grid Array,陶瓷针型栅格阵列)一种芯片封装形式。
  
    CPU: (Center Processing Unit,中央处理器)计算机系统的大脑,用于控制和管理整个机器的运作,并执行计算任务。
  
    Data Forwarding: (数据前送)CPU在一个时钟周期内,把一个单元的输出值内容拷贝到另一个单元的输入值中。
  
    Decode: (指令解码)由于X86指令的长度不一致,必须用一个单元进行“翻译”,真正的内核按翻译后要求来工作。
  
    EC: (Embedded Controller,嵌入式控制器)在一组特定系统中,新增到固定位置,完成一定任务的控制装置就称为嵌入式控制器。
  
    Embedded Chips: (嵌入式)一种特殊用途的CPU,通常放在非计算机系统,如:家用电器。
  
    EPIC: (explicitly parallel instruction code,并行指令代码)英特尔的64位芯片架构,本身不能执行x86指令,但能通过译码器来兼容旧有的x86指令,只是运算速度比真正的32位芯片有所下降。
  
    FADD: (Floationg Point Addition,浮点加)FCPGA(Flip Chip Pin Grid Array,反转芯片针脚栅格阵列)一种芯片封装形式,例:奔腾III 370。
  
    FDIV: (Floationg Point Divide,浮点除)FEMMS(Fast Entry/Exit Multimedia State,快速进入/退出多媒体状态)  在多能奔腾之中,MMX和浮点单元是不能同时运行的。新的芯片加快了两者之间的切换,这就是FEMMS。
  
    FFT: (fast Fourier transform,快速热欧姆转换)一种复杂的算法,可以测试CPU的浮点能力。
  
    FID: (FID:Frequency identify,频率鉴别号码)奔腾III通过ID号来检查CPU频率的方法,能够有效防止Remark。
  
    FIFO: (First Input First Output,先入先出队列)这是一种传统的按序执行方法,先进入的指令先完成并引退,跟着才执行第二条指令。
  
    FLOP: (Floating Point Operations Per Second,浮点操作/秒)计算CPU浮点能力的一个单位。
  
    FMUL: (Floationg Point Multiplication,浮点乘)
  
    FPU: (Float Point Unit,浮点运算单元)FPU是专用于浮点运算的处理器,以前的FPU是一种单独芯片,在486之后,英特尔把FPU与集成在CPU之内。
  
    FSUB: (Floationg Point Subtraction,浮点减)
  
    HL-PBGA: (表面黏著、高耐热、轻薄型塑胶球状矩阵封装)一种芯片封装形式。
  
    IA: (Intel Architecture,英特尔架构)英特尔公司开发的x86芯片结构。
  
    ID: (identify,鉴别号码)用于判断不同芯片的识别代码。
  
    IMM: (Intel Mobile Module,英特尔移动模块)英特尔开发用于笔记本电脑的处理器模块,集成了CPU和其它控制设备。
  
    Instructions Cache: (指令缓存)由于系统主内存的速度较慢,当CPU读取指令的时候,会导致CPU停下来等待内存传输的情况。指令缓存就是在主内存与CPU之间增加一个快速的存储区域,即使CPU未要求到指令,主内存也会自动把指令预先送到指令缓存,当CPU要求到指令时,可以直接从指令缓存中读出,无须再存取主内存,减少了CPU的等待时间。
  
    Instruction Coloring: (指令分类)一种制造预测执行指令的技术,一旦预测判断被相应的指令决定以后,处理器就会相同的指令处理同类的判断。
  
    Instruction Issue: (指令发送)它是第一个CPU管道,用于接收内存送到的指令,并把它发到执行单元。IPC(Instructions Per Clock Cycle,指令/时钟周期)表示在一个时钟周期用可以完成的指令数目。
  
    KNI: (Katmai New Instructions,Katmai新指令集,即SSE) Latency(潜伏期)从字面上了解其含义是比较困难的,实际上,它表示完全执行一个指令所需的时钟周期,潜伏期越少越好。严格来说,潜伏期包括一个指令从接收到发送的全过程。现今的大多数x86指令都需要约5个时钟周期,但这些周期之中有部分是与其它指令交迭在一起的(并行处理),因此CPU制造商宣传的潜伏期要比实际的时间长。
  
    LDT: (Lightning Data Transport,闪电数据传输总线)K8采用的新型数据总线,外频在200MHz以上。
  
    MMX: (MultiMedia Extensions,多媒体扩展指令集)英特尔开发的最早期SIMD指令集,可以增强浮点和多媒体运算的速度。
  
    MFLOPS: (Million Floationg Point/Second,每秒百万个浮点操作)计算CPU浮点能力的一个单位,以百万条指令为基准。
  
    NI: (Non-Intel,非英特尔架构)
  
  除了英特尔之外,还有许多其它生产兼容x86体系的厂商,由于专利权的问题,它们的产品和英特尔系不一样,但仍然能运行x86指令。
  
    OLGA: (Organic Land Grid Array,基板栅格阵列)一种芯片封装形式。
  
    OoO: (Out of Order,乱序执行)Post-RISC芯片的特性之一,能够不按照程序提供的顺序完成计算任务,是一种加快处理器运算速度的架构。
  
    PGA: (Pin-Grid Array,引脚网格阵列)一种芯片封装形式,缺点是耗电量大。
  
    Post-RISC: 一种新型的处理器架构,它的内核是RISC,而外围是CISC,结合了两种架构的优点,拥有预测执行、处理器重命名等先进特性,如:Athlon。
  
    PSN: (Processor Serial numbers,处理器序列号)标识处理器特性的一组号码,包括主频、生产日期、生产编号等。
  
    PIB: (Processor In a Box,盒装处理器)CPU厂商正式在市面上发售的产品,通常要比OEM(Original Equipment Manufacturer,原始设备制造商)厂商流通到市场的散装芯片贵,但只有PIB拥有厂商正式的保修权利。
  
    PPGA: (Plastic Pin Grid Array,塑胶针状矩阵封装)一种芯片封装形式,缺点是耗电量大。
  
    PQFP: (Plastic Quad Flat Package,塑料方块平面封装)一种芯片封装形式。
  
    RAW: (Read after Write,写后读)这是CPU乱序执行造成的错误,即在必要条件未成立之前,已经先写下结论,导致最终结果出错。
  
    Register Contention: (抢占寄存器)当寄存器的上一个写回任务未完成时,另一个指令征用此寄存器时出现的冲突。
  
    Register Pressure: (寄存器不足)软件算法执行时所需的寄存器数目受到限制。对于X86处理器来
  说,寄存器不足已经成为了它的最大特点,因此AMD才想在下一代芯片K8之中,增加寄存器的数量。
  
    Register Renaming: (寄存器重命名)把一个指令的输出值重新定位到一个任意的内部寄存器。在x86
  架构中,这类情况是常常出现的,如:一个fld或fxch或mov指令需要同一个目标寄存器时,就要动用到寄存器重命名。
  
    Remark: (芯片频率重标识)芯片制造商为了方便自己的产品定级,把大部分CPU都设置为可以自由调节倍频和外频,它在同一批CPU中选出好的定为较高的一级,性能不足的定位较低的一级,这些都在工厂内部完成,是合法的频率定位方法。但出厂以后,经销商把低档的CPU超频后,贴上新的标签,当成高档CPU卖的非法频率定位则称为Remark。因为生产商有权力改变自己的产品,而经销商这样做就是侵犯版权,不要以为只有软件才有版权,硬件也有版权呢。
  
    Resource contention: (资源冲突)当一个指令需要寄存器或管道时,它们被其它指令所用,处理器不能即时作出回应,这就是资源冲突。
  
    Retirement: (指令引退)当处理器执行过一条指令后,自动把它从调度进程中去掉。如果
  仅是指令完成,但仍留在调度进程中,亦不算是指令引退。
  
    RISC: (Reduced Instruction Set Computing,精简指令集计算机)一种指令长度较短的计算机,其运行速度比CISC要快。
  
    SEC: (Single Edge Connector,单边连接器)一种处理器的模块,如:奔腾II。
  
    SIMD: (Single Instruction Multiple Data,单指令多数据流)能够复制多个操作,并把它们打包在大型寄存器的一组指令集,例:3DNow!、SSE。
  
    SiO2F: (Fluorided Silicon Oxide,二氧氟化硅)制造电子元件才需要用到的材料。
  
    SOI: (Silicon on insulator,绝缘体硅片)SONC(System on a chip,系统集成芯片)在一个处理器中集成多种功能,如:Cyrix MediaGX。
  
    SPEC: (System Performance Evaluation Corporation,系统性能评估测试)测试系统总体性能的Benchmark。
  
    Speculative execution: (预测执行)一个用于执行未明指令流的区域。当分支指令发出之后,传统处理器在未收到正确的反馈信息之前,是不能做任何工作的,而具有预测执行能力的新型处理器,可以估计即将执行的指令,采用预先计算的方法来加快整个处理过程。
  
    SQRT: (Square Root Calculations,平方根计算)一种复杂的运算,可以考验CPU的浮点能力。
  
    SSE: (Streaming SIMD Extensions,单一指令多数据流扩展)英特尔开发的第二代SIMD指令集,有70条指令,可以增强浮点和多媒体运算的速度。
  
    Superscalar: (超标量体系结构)在同一时钟周期可以执行多条指令流的处理器架构。
  
    TCP: (Tape Carrier Package,薄膜封装)一种芯片封装形式,特点是发热小。
  
    Throughput: (吞吐量)它包括两种含义:
  
      第一种:执行一条指令所需的最少时钟周期数,越少越好。执行的速度越快,下一条指令和它抢占资源的机率也越少。
  
      第二种:在一定时间内可以执行最多指令数,当然是越大越好。
  
    TLBs: (Translate Look side Buffers,翻译旁视缓冲器)用于存储指令和输入/输出数值的区域。
  
    VALU: (Vector Arithmetic Logic Unit,向量算术逻辑单元)在处理器中用于向量运算的部分。
  
    VLIW: (Very Long Instruction Word,超长指令字)一种非常长的指令组合,它把许多条指令连在一起,增加了运算的速度。
  
    VPU: (Vector Permutate Unit,向量排列单
CPU接口类型

我们知道,CPU需要通过某个接口与主板连接的才能进行工作。CPU经过这么多年的发展,采用的接口方式有引脚式、卡式、触点式、针脚式等。而目前CPU的接口都是针脚式接口,对应到主板上就有相应的插槽类型。CPU接口类型不同,在插孔数、体积、形状都有变化,所以不能互相接插。

Socket 478
  最初的Socket 478接口是早期Pentium 4系列处理器所采用的接口类型,针脚数为478针。Socket 478的Pentium 4处理器面积很小,其针脚排列极为紧密。英特尔公司的Pentium 4系列和P4 赛扬系列都采用此接口,目前这种CPU已经逐步退出市场。
但是,Intel于2006年初推出了一种全新的Socket 478接口,这种接口是目前Intel公司采用Core架构的处理器Core Duo和Core Solo的专用接口,与早期桌面版Pentium 4系列的Socket 478接口相比,虽然针脚数同为478根,但是其针脚定义以及电压等重要参数完全不相同,所以二者之间并不能互相兼容。随着Intel公司的处理器全面向Core架构转移,今后采用新Socket 478接口的处理器将会越来越多,例如即将推出的Core架构的Celeron M也会采用此接口。

Socket 775
  Socket 775又称为Socket T,是目前应用于Intel LGA775封装的CPU所对应的接口,目前采用此种接口的有LGA775封装的单核心的Pentium 4、Pentium 4 EE、Celeron D以及双核心的Pentium D和Pentium EE等CPU。与以前的Socket 478接口CPU不同,Socket 775接口CPU的底部没有传统的针脚,而代之以775个触点,即并非针脚式而是触点式,通过与对应的Socket 775插槽内的775根触针接触来传输信号。Socket 775接口不仅能够有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率、降低生产成本。随着Socket 478的逐渐淡出,Socket 775已经成为Intel桌面CPU的标准接口。

Socket 754
  Socket 754是2003年9月AMD64位桌面平台最初发布时的CPU接口,具有754根CPU针脚,只支持单通道DDR内存。目前采用此接口的有面向桌面平台的Athlon 64的低端型号和Sempron的高端型号,以及面向移动平台的Mobile Sempron、Mobile Athlon 64以及Turion 64。随着AMD从2006年开始全面转向支持DDR2内存,桌面平台的Socket 754将逐渐被Socket AM2所取代从而使AMD的桌面处理器接口走向统一,而与此同时移动平台的Socket 754也将逐渐被具有638根CPU针脚、支持双通道DDR2内存的Socket S1所取代。Socket 754在2007年底完成自己的历史使命从而被淘汰,其寿命反而要比一度号称要取代自己的Socket 939要长得多。

Socket 939
  Socket 939是AMD公司2004年6月才推出的64位桌面平台接口标准,具有939根CPU针脚,支持双通道DDR内存。目前采用此接口的有面向入门级服务器/工作站市场的Opteron 1XX系列以及面向桌面市场的Athlon 64以及Athlon 64 FX和Athlon 64 X2,除此之外部分专供OEM厂商的Sempron也采用了Socket 939接口。Socket 939处理器和与过去的Socket 940插槽是不能混插的,但是Socket 939仍然使用了相同的CPU风扇系统模式。随着AMD从2006年开始全面转向支持DDR2内存,Socket 939被Socket AM2所取代,在2007年初完成自己的历史使命从而被淘汰,从推出到被淘汰其寿命还不到3年。

Socket 940
  Socket 940是最早发布的AMD64位CPU的接口标准,具有940根CPU针脚,支持双通道ECC DDR内存。目前采用此接口的有服务器/工作站所使用的Opteron以及最初的Athlon 64 FX。随着新出的Athlon 64 FX以及部分Opteron 1XX系列改用Socket 939接口,所以Socket 940已经成为了Opteron 2XX全系列和Opteron 8XX全系列以及部分Opteron 1XX系列的专用接口。随着AMD从2006年开始全面转向支持DDR2内存,Socket 940也会逐渐被Socket F所取代,完成自己的历史使命从而被淘汰。

Socket 603
  Socket 603的用途比较专业,应用于Intel方面高端的服务器/工作站平台,采用此接口的CPU是Xeon MP和早期的Xeon,具有603根CPU针脚。Socket 603接口的CPU可以兼容于Socket 604插槽。

Socket 604
  与Socket 603相仿,Socket 604仍然是应用于Intel方面高端的服务器/工作站平台,采用此接口的CPU是533MHz和800MHz FSB的Xeon。Socket 604接口的CPU不能兼容于Socket 603插槽。

Socket A
Socket A接口,也叫Socket 462,是目前AMD公司Athlon XP和Duron处理器的插座接口。Socket A接口具有462插空,可以支持133MHz外频。

Socket 423
  Socket 423插槽是最初Pentium 4处理器的标准接口,Socket 423的外形和前几种Socket类的插槽类似,对应的CPU针脚数为423。随着DDR内存的流行,英特尔开发了支持SDRAM及DDR内存的i845芯片组,CPU插槽也改成了Socket 478,Socket 423接口也就销声匿迹了。

Socket 370
  Socket 370架构是英特尔开发出来代替SLOT架构,外观上与Socket 7非常像,也采用零插拔力插槽,对应的CPU是370针脚。英特尔公司著名的“铜矿”和”图拉丁”系列CPU就是采用此接口。

SLOT 1
  SLOT 1是英特尔公司为取代Socket 7而开发的CPU接口,并申请的专利。这样其它厂商就无法生产SLOT 1接口的产品。SLOT1接口的CPU不再是大家熟悉的方方正正的样子,而是变成了扁平的长方体,而且接口也变成了金手指,不再是插针形式。SLOT 1是英特尔公司为Pentium Ⅱ系列CPU设计的插槽,其将Pentium Ⅱ CPU及其相关控制电路、二级缓存都做在一块子卡上,目前此种接口已经被淘汰。

SLOT 2
  SLOT 2用途比较专业,都采用于高端服务器及图形工作站的系统。所用的CPU也是很昂贵的Xeon(至强)系列。Slot 2插槽比SLOT 1更长,有了Slot 2设计后,可以在一台服务器中同时采用 8个处理器。而且采用Slot 2接口的Pentium Ⅱ CPU都采用了当时最先进的0.25微米制造工艺。支持SLOT 2接口的主板芯片组有440GX和450NX。

SLOT A
  SLOT A接口类似于英特尔公司的SLOT 1接口,供AMD公司的K7 Athlon使用的。在技术和性能上,SLOT A主板可完全兼容原有的各种外设扩展卡设备。它使用的并不是Intel的P6 GTL+ 总线协议,而是Digital公司的Alpha总线协议EV6。EV6架构是种较先进的架构,它采用多线程处理的点到点拓扑结构,支持200MHz的总线频率。

针脚数

目前CPU都采用针脚式接口与主板相连,而不同的接口的CPU在针脚数上各不相同。CPU接口类型的命名,习惯用针脚数来表示,比如目前Pentium 4系列处理器所采用的Socket 478接口,其针脚数就为478针;而Athlon XP系列处理器所采用的Socket 462接口,其针脚数就为462针。

CPU超频

如何进行CPU超频,内容非常简单,而且细致,比较适合DIY初级爱好者。
  现在一提起DIY,要是少了超频,就好像炒菜少了盐一样,索然无味了。超频中最常提及的就是CPU超频,我们今天的话题将围绕CPU超频展开,相信看完后,你会觉得CPU超频其实并不难。
  估计还是有一些DIY爱好者对CPU超频有些陌生,尤其是首次尝试超频的用户,即使是看清BIOS中的内容,也是一项很有难度的挑战。在尝试超频之前,你首先必须明白你为什么要超频?是为了发挥系统的全部潜力,还是为了尝一下新鲜?另外,你还必须有一些心理准备,如果超频使用方法不当,很可能会造成极严重的后果。
CPU超频工具介绍:
  使用专门的超频工具来超频的话相当简单,相信以各位看官的聪明才智,看看下面的图就大致知道如何操作了。下面是一款常见的CPU超频软件——ClockGen:


也有一些超频工具是专门针对某些主板或芯片组设计的。另外,也有一些厂家针也提供了自己专门的超频软件,例如来自技嘉的EasyTune5:


还有来自微星的CoreCenter:


 上面两款超频软件都是随厂家的主板捆绑销售。那使用这些软件来超频到底好不好呢?当然好,因为非常简单。另外,如果主板BIOS如果提供的选项相当少的话,那使用这些软件来超频反而是唯一的手段。不过严格来说,我们不推荐大家使用这些软件来超频,有以下几个理由。首先,任何软件都存在bug,这些潜伏的bug可能会对我们超频带来不良影响;其次,如果从BIOS超频,每次设置后,系统都会重启,我们知道,Windows在重启的时候,都会对硬件进行一系列检测,如果超频失败,系统将立即自动终止。若使用这些软件超频,系统不会重启;最后,如果要成功使用这些软件,用户不得不仔细阅读难以理解的超频软件手册和主板用户指南。综上所述,我们还是推荐大家使用BIOS超频。
BIOS初窥:
  一般来说,在系统初启的时候,我们都是按键进入BIOS。当然,也有一些不是按进入BIOS,例如技嘉主板,可能需要按进入BIOS,用户可以在屏幕初现的时候看屏幕上的提示,或者是查阅主板用户指南。


不要被屏幕上这些单词或句子给蒙住了,虽然BIOS也有不同的版本,或者版本相同而某些选项的名称不同,但它们的实质是一样的。
  超频,顾名思义就是增加CPU工作频率,CPU工作频率的计算公式是【倍频×外频】。例如Intel Celeron D 310处理器频率为2.13GHz,它的倍频是16x,外频是133MHz,那它的频率就是133.3 x 16 = 2133MHz。由此可以看出,我们超倍频或者超外频都可以提升CPU频率。目前,Intel处理器都锁住了倍频,因此只能超外频。不过有少数AMD Athlon XP倍频和外频都没有锁,所以我们可以同时超倍频和外频。不过我们推荐大家只超CPU外频即可,它能够更明显地增加系统整体性能。


为什么说超外频能够更明显地增加系统整体性能呢?我们知道,计算机系统中的各个部件其实互连的,很多部件之间的协调是需要同步的。例如,如果我们增加了CPU的总线频率(bus frequency,也就是外频,它和FSB有些区别,FSB指的是数据传输的速度,外频是CPU与主板之间同步运行的速度,AMD CPU的FSB是外频的两倍,而Intel P4的FSB是外频的四倍),其实也就间接地增加了内存的工作频率,所以我们说增加了系统的整体性能。有时候我们会发现,CPU其实还有再超的空间,但是内存已经“江郎才尽”,导致超频超不上去了。所以说,要超频,选择好的内存也是比较重要的。一般来说,CPU外频和内存频率是相关的,不过有些主板,如NVIDIA nForce 4 Intel Edition可以让用户单独只超CPU或者是内存频率。
  我们先看看看BIOS中的内存频率选项,一般它会在两个地方出现,或者在独立的内存频率和时序设置页,或者在CPU频率设置页。第一个一般叫做【Advanced Chipset Features】,或简单地叫做【Advanced】,ASUS就采用的是这种风格,第二个一般叫做【Memclock index value】。
  另外,它也可能会出现在【POWER BIOS Features】页面中,EPoX采用的就是这种风格,在该页中它被】或简称【Memory Frequency】。在这里一般会显示DDR400 (见下图)、DDR333、DDR266,或者是更低的PC133、PC100。



首先,我们将内存频率尽可能设为最小值。设置内存频率值有几种方式,都依赖于主板商的实际设置。一般可以按键进入参数选择页,如果不行的话可以试试PageUp、PageDown按键,或者是“+”和“-”按键,绝大多数主板都采用的是这三种之一。
  为什么要先将内存频率设为最小值呢?在CPU超频的时候,我们会提升FSB频率,同时,内存的频率也会提升,如果将内存频率设为最小,它将存在更多的提升空间。也就是说,我们要先尽可能地消除内存对CPU超频的影响。另外,我们还可以稍稍将内存时序设高一点,或者为内存加少少电压,当然必须在允许的范围内进行。


接下来,我们保存所有设置,进入【Save & Exit Setup】选项,然后按退出,系统将重新启动。
调整其他总线频率:
  我们前面已经说过,提升CPU外频会间接提升内存频率,不过这不是唯一的好处。提升CPU外频,同时也会提高其他一些部件的总线频率,如PCI、SATA、PCIE、AGP等总线频率。由此可见,我们只需提高CPU的外频,整个系统几乎大部分配件的工作频率都会提升。但是我们也必须注意,有时候,配件的工作频率如果超过了一定限度,可能会停止正常工作。一般来说,PCI总线的频率是33.3MHz,AGP总线频率66.6MHz,SATA和PCIE总线频率100MHz。我们来看看下面的页面,确定你BIOS里面的AGP/PCI频率为66/33MHz。


有些超频爱好者有时喜欢不保证让外频工作在100MHz、133MHz或是166MHz这种标准频率下,这是非常危险的。因为PC系统中除了系统总线以外,还有我们上面提到的AGP总线、PCI总线等等,这些总线频率有的是可以独立调节的,有的却要由系统总线的频率来决定。PCI和AGP的标准频率是33MHz和66MHz。在100MHz外频下,为了让PCI和AGP总线工作在标准的频率下,PCI总线对系统总线就是1/3分频,而AGP总线对系统总线就是2/3分频;而在133MHz外频下,它们的分频可以分别设置为1/4和1/2,一样可以保证PCI和AGP总线分别运行在33MHz和66MHz的标准频率下。如果超频者将系统外频设置为120MHz,那么按照1/3和2/3分频的设置,PCI和AGP总线以及连接在他们上的设备就分别运行在40MHz和60MHz下。超过标准频率后,这些部件是否一定能够稳定运行呢?这谁也没法保证,硬盘可能会出现读写错误,声卡可能没法正常发声,网卡和SCSI卡可能会出现无法使用的情况,而显示卡有可能会花屏或是造成系统死机。因此,超频至非标准外频的作法是不可取的,势必会造成整体系统的不稳定。
当前的所有Pentium 4 Intel芯片组、NVIDIA芯片组和最新的SIS芯片组,都将AGP/PCI频率设为了标准值。不过,早期的Intel、SiS和VIA芯片组都没有将这些频率锁定为标准值。如果用户使用的是VIA K8T800芯片组主板,那CPU外频就不可能超过225MHz。一旦超过了这个极限值,系统就认不出相关设备了,甚至集成的声卡也会停止工作。
  对于NVIDIA推出的AMD Socket 754/939芯片组来说,HyperTransport总线频率是相当重要的,它的默认值是1000MHz或者800MHz。在对AMD CPU超频之前,我们将HyperTransport频率值设低一点也是有好处的。如果HyperTransport频率为1000MHz,那它的默认系数关系为5x,800MHz默认系数关系为4x。


HyperTransport总线频率也被称为是HyperTransport Frequency,或简称HT Frequency和LDT Frequency,它也有400MHz和600MHz这些值(默认系数关系分别为2x和3x)。


上面的几步中,我们降低了内存频率和HyperTransport频率,还锁定PCI/AGP工作频率为标准值,下面我们就正式开始我们的CPU超频之旅。
CPU超频:
  我们首先进到BIOS中的【Frequency/Voltage Control】页面:


该页面也可能被称做是【POWER BIOS Features】,如下图:


也有的叫做【JumperFree Configuration】,如下图:


也可能叫做【μGuru Utility】,如下图:


虽然会存在页面上的不同,但是这对我们超频丝毫没有影响。在各自的页面中,我们找到【CPU Host Frequency】,或【CPU/Clock】,或【 External Clock】等选项,这些选项就是用来设定CPU外频或FSB频率。
那我们将这个频率提升多少呢?这个就很难确定了。这要取决于你的主板、CPU、散热器、电源等的实际情况。最好就是慢慢地提升,例如先将外频默认值每次提高10MHz。退出BIOS (可别忘了保存),重新进入Windows,确认一下CPU是否正常工作,可以使用CPU-Z等工具来看看CPU具体情况。然后我们运行几个程序,如 Super PI、Prime95、S&M或游戏等等,来看看系统稳定性。如果系统没有出现任何异常,就证明超频成功。另外别忘了看看CPU温度,一般不要让CPU超过60度。
  如果你使用的是Intel Pentium 4或者是Celeron处理器,可以用ThrottleWatch或RightMark CPU Clock Utility等工具来检测CPU温度。有个细节必须提醒大家注意,超频不一定会提升系统整体性能,当CPU温度超过一定临界值后,系统性能会迅速下降。所以在超频过程中,掌握好温度是相当重要的。当系统超频出现性能不升反降的时候,ThrottleWatch或RightMark CPU Clock Utility会向用户反馈相关的信息。出现这种情况,我们有两种解决方法——使用更强劲的散热方案或者是使用更“温和”的超频手段。


如果系统性能、温度等方面一切正常,我们可以再稍稍提高CPU外频。如果在超频过程中出现了一些异常现象,如程序异常终止、机器自动重启、篮屏或温度过高等,我们就再将外频调低一些。
  或许有用户急切地想知道:“我的CPU到底最高可以超到多少?”这是没有定数的,一般来说,CPU的超频潜能要看CPU的类型、所使用的核心、采用的步进等因素。
结论:
  好,至此我们对CPU超频的介绍就已经全部完毕,不过工作还没有完。系统的性能不仅仅是由CPU决定的。还记不记得我们最初降低了内存的参数?现在我们再回到原来的地方,对内存的时序等再重新进行调节。如果你是一个游戏发烧友的话,接下来可以再尝试一下显卡超频。
  上面已经介绍了CPU超频的整个过程,算比较详细。不过也还有些细节没有涉及到,如给CPU加电压、CMOS放电等等。用户如果有疑问可以问问你身边的牛人。不论怎样,CPU超频其实并不复杂。
  最后我们强调一点,未超频的系统从稳定和可靠性来说,肯定优于超频超到了极至的系统。

CPU词汇

随着计算机技术在国内的普及,其已经由过去只在科研、军事等高精尖科技才应用的高级设备变为了我们工作以及生活中形影不离的工具。
所以处在这个信息时代,我们这些计算机爱好者掌握一定的计算机基本概念和常用的词汇是十分必要的。大家都知道,目前随着计算机网络在各行各业的广泛应用,产生了许多融合了各领域特点的新计算机词汇。
因这些大量的新词汇中许多是英文首字母缩略语,造成只有计算机专业人员才能理解其中的含义,
而对于一般读者来说可能只是摸棱两可的现象,如深究其意义总是不得要领。
特别是CPU方面,更是有大量的词汇,虽常在资料中看到,但细究其含义,怕是少有人能细说缘由。
介绍一下这方面的知识。

(1)Central Processing Unit (CPU):中央处理单元 计算机的计算和控制单元。
中央处理单元,或微型计算机中的微处理器(单芯片中央处理单元),具有如下功能,
如:取指令、解码,以及执行指令和通过计算机主要数据传输通路(即总线)将信息输入、输出到其它资源。根据其定义,中央处理单元是起到了计算机大脑功能的芯片。

(2)access:访问,存取从存储器读取或向存储器写入数据的操作。

(3)address:地址,寻址表明在内存数据的存放位置的数,引用或访问存储器中某个特定的位置。

(4)application processor:应用程序处理器一种专门为某个应用系统而设计的处理器。

(5)benchmark:基准程序用于测试硬件或软件性能的程序。
硬件基准程序利用程序来测试设备的性能—例如:CPU 执行指令的速度。软件基准程序确定程序在执行特定任务(例如重新计算电子表格中的数据)时的效率、准确性或速度。
测试每个程序时都使用同样的数据,因此从结果可以比较出运行效果更好的程序以及程序运行效果更好的区域。

(6)cache:高速缓冲存储器 一种特殊的存储器子系统,其中复制了频繁使用的数据,以利于CPU快速访问。
高速缓冲存储器存储了频繁访问的RAM位置的内容及这些数据项的存储地址。
当处理器引用存储器中的某地址时,高速缓冲存储器便检查是否存有该地址。
如果存有该地址,则将数据返回处理器;如果没有保存该地址,则进行常规的存储器访问。
因为高速缓冲存储器总比主RAM 存储器速度快,所以当RAM的访问速度低于微处理器的速度时,
常使用高速缓冲存储器。

(7)clock:时钟 计算机内部的一种电子电路,用来生成稳定的定时脉冲流,即用来同步每一次操作的数字信号。
计算机的时钟频率是决定计算机运行速度的主要因素之一,因此在计算机的其他部件允许的范围内,频率越高越好,也作system clock。

(8)Complex Instruction Set Computing (CISC):
复杂指令集计算它是在微处理器设计中一种对复杂指令的实现方案,通过这种实现方案就可以在汇编语言级别上调用这些指令。这些复杂指令的功能相当强大,它们能灵活地计算诸如内存地址之类的元素。

(9)Direct Memory Access (DMA):
直接内存访问在外围设备和主存之间开辟直接的数据交换通路的技术。
CPU工作时,所有工作周期都用于执行CPU的程序。
当外围设备将要输入或输出的数据准备好后,挪用一个工作周期,供外围设备和主存直接交换数据。
这个周期之后,CPU又继续执行原来的程序。
这种方式是在输入输出子系统中增加了DMA控制器来代替原来CPU的工作,而使成批传送的数据直接和主存交互,由DMA部件对数据块的数据逐个计数并确定主存地址。

(10)primary cache 一级高速缓存 设计在微处理器内部的高速缓存,放置在主板上的高速缓存器称为二级高速缓存。

(11)Symmetric MultiProcessing (SMP) 对称多处理 指多台计算机进行并行处理的一种体系结构,它是一种共享体系结构。
系统中的两个以上的CPU可以共享系统中的一切资源,如内存、硬盘、操作系统、应用软件以及数据。
当多个应用程序一起运行时,SMP非常灵活并具有很高的容错性。
SMP利用大缓存及其它技术来减少总线流量、增加吞吐量。

(12)Symmetric MultiProcessing server (SMP server) 对称多任务处理服务器一种计算机,在客户/服务器应用中作为服务器。为提高其性能,在设计时采用了对称多任务处理 (SMP) 的体系结构。

(13)3DNow! 技术指AMD公司为解决传统图像处理过程中进行浮点运算和多媒体应用程序的瓶颈问题,研究开发的一套全新的指令集,也是该公司首次提出的三维图像处理技术。
此技术提高了三维图形性能及逼真的图形效果,开创了计算机与三维图形加速卡同步运算的先河。
该指令集共包含21个指令,可最大程度地支持被称为“单指令多数据(SIMD)”的浮点运算。
传统处理器所欠缺的浮点运算能力在采用3DNow!技术的AMD K6(r) -2系列处理器中得到应用。

(14)CMOS:互补金属氧化物半导体complementary metal-oxide semiconductor 的首字母缩略词。
它是一种半导体技术,可以将成对的金属氧化物半导体场效应晶体管 (MOSFET) 集成在一块硅片上。
该技术通常用于生产 RAM 和交换应用系统, 产品速度很快,而且功耗极低。

(15)CPU cycle:CPU周期 CPU所能识别的最小时间单元,通常为亿分之几秒。

CPU 执行最简单的指令时所需要的时间,例如读取寄存器中的内容,也作 clocktick。

(16)coprocessor:协处理器 一种处理器,与主微处理器不同,它执行附加的功能并协助主微处理器进行工作。
最常见的一种协处理器是浮点协处理器,它在执行数值计算时比个人计算机中的通用微处理器速度更快、性能更好。

(17)floating-point processor:浮点处理器 执行浮点数算术运算的协处理器。
浮点数是指用尾数和相对一个基数的指数表示的数。
例如,2.33×1023 就是一个浮点数。
在系统中加入一个浮点数处理器,在使用识别并应用该协处理器的软件时,可以大幅度地加快数学运算和图像处理速度。
i486DX、68040 和更高级的处理器含有内置的浮点处理器
CPU