打印

[推荐] CPU基础知识综合(都是精心从各大it论坛搜集整理的经典)

CPU基础知识综合(都是精心从各大it论坛搜集整理的经典)

CPU基础知识综合:标题前面的数字代表楼层

2基本知识:CPU 术语详解

3CPU应用技巧!全面解答23个热点问题!

4教你认识CPU专业术语

5CPU知识大全

6CPU最基础知识



7CPU的专业知识

8CPU盒装和散装区别

9CPU术语解释

10从CPU的技术参数认识CPU

11论CPU和显卡的合理搭配!



12对CPU超频和注意事项

13AMD与Intel产品对比分析

14你真的了解“双核处理器”吗?

15Athlon64编号大揭秘

16双核/多核处理器在计算方面的优势



17教你辨别CPU真假

18Intel真假盒装辨别大全 看过你还买到假货说不过

19揭密双核心与超线程技术区别

20AMD与Intel的区别

21CPU常见病及解决方法



22cpu疑难解答新手可以看看

23(必看系列)CPU家族史-首部曲





24CPU缓存的巨大作用

25告诉你双核处理器不人所知的5个方面

26Intel CPU全集珍藏版

27Intel双核心处理器介绍

28这就是!!!单核和双核!!!!的区别(图解 )



29双核CPU大流行 老用户升级注意事项

30先弄懂了再选购 双核知识全面大补习



最新


31明明白白双通道DDR

32CPU资源占用100%解决方法

33这18条背下来没人敢和你呼悠CPU(这一下是全部的了)

34AM2 闪龙3000+上300外频详细BIOS设置

35Intel惊人新构架:1.91MHz也运行winXP



36AMD五大系列CPU核心详解

37高性能 低功耗!解析英特尔酷睿微体系结构

38先弄懂了再选购 双核知识全面大补习

39PC史上十大CPU超频王!

40看清形势好下手,不买酷睿的6个理由



41解答关于CPU的23个热点问题

42更换散热器后CPU温度反而升高?

43英特尔双核心处理器详细说明

44AMD处理器的频率表识为何要用PR值?

45Socket AM2超频问题深入研究



46AM2到来!仔细分辨闪龙处理器PR值

47正确调节CPU主频与内存频率

48你真的了解“双核处理器”吗?

49对超线程和双通道技术的正确认识

50震惊!INTEL宣布取消单核心"扣肉" 全新E200



51说感想!扣肉E6300超频艰幸之路!

52双CPU不等于双倍性能

53正确区分不同核心的P4

54Vista破解新方法~哈哈~

55使用AMD双核的朋友注意~!~所有驱动,补丁,优化下载地?



56AMD双通无用论-------真实的谎言(破解版)

57cpu故障解决方法

58双核CPU大流行 老用户升级注意事项

59该不该省风扇,再谈C61芯片散热对主板性能的影响!!

60很多人分不清楚BIOS和CMOS区别



61按图索骥 三十招杀手锏让你轻轻松松装机

62第一次装机最常咨询的七个问题

63教你用电脑——27招释放C盘空间具体优化技巧

64解读频率值,PR~~~~新手共同学习~~

65无知者无畏!DIY攒机之无敌乱入篇

TOP

2基本知识:CPU 术语详解 (更新完毕)

CPU 适用类型
“CPU适用类型”是指该处理器所适用的应用类型,针对不同用户的不同需求、不同应用范围,CPU被设计成各不相同的类型,即分为嵌入式和通用式、微控制式。嵌入式CPU主要用于运行面向特定领域的专用程序,配备轻量级操作系统,其应用极其广泛,像移动电话、DVD、机顶盒等都是使用嵌入式CPU。微控制式CPU主要用于汽车空调、自动机械等自控设备领域。而通用式CPU追求高性能,主要用于高性能个人计算机系统(即PC台式机)、服务器(工作站)以及笔记本三种。
  台式机的CPU,就是平常大部分场合所提到的应用于PC的CPU,平常所说Intel的奔腾4、赛扬、AMD的AthlonXP等等都属于此类CPU。

  应用于服务器和工作站上的CPU,因其针对的应用范围,所以此类CPU在稳定性、处理速度、同时处理任务的数量等方面的要求都要高于单机CPU。其中服务器(工作站)CPU的高可靠性是普通CPU所无法比拟的,因为大多数的服务器都要满足每天24小时、每周7天的满负荷工作要求。由于服务器(工作站)数据处理量很大,需要采用多CPU并行处理结构,即一台服务器中安装2、4、8等多个CPU,需要注意的是,并行结构需要的CPU必须为偶数个。对于服务器而言,多处理器可用于数据库处理等高负荷高速度应用;而对于工作站,多处理器系统则可以用于三维图形制作和动画文件编码等单处理器无法实现的高处理速度应用。另外许多CPU的新技术都是率先开发应用于服务器(工作站)CPU中。

  在最早期的CPU设计中并没有单独的笔记本CPU,均采用与台式机的CPU,后来随着笔记本电脑的散热和体积成为发展的瓶颈时,才逐渐生产出笔记本专用CPU。受笔记本内部空间、散热和电池容量的限制,笔记本CPU在外观尺寸、功耗(耗电量)方面都有很高的要求。笔记本电池性能是十分重要的性能,CPU的功耗大小对电池使用时间有着最直接的影响,所以为了降低功耗笔记本处理器中都包含有一些节能技术。在无线网络将要获得更多应用的现在,笔记本CPU还增加了一些定制的针对无线通信的功能。

  服务器CPU和笔记本CPU都包含有各自独特的专有技术,都是为了更好的在各自的工作条件下发挥出更好的性能。比如服务器的多CPU并行处理,以及多核多线程技术;笔记本CPU的SpeedStep(可自动调整工作频率及电压)节能技术。

  封装方式三者也有不同之处,笔记本CPU是三者中最小最薄的一种,因为笔记本处理器的体积需要更小,耐高温的性能要更佳,因此在制造工艺上要求也就更高。

  三者在稳定性中以服务器CPU最强,因为其设计时就要求有极低的错误率,部分产品甚至要求全年满负荷工作,故障时间不能超过5分钟。

  台式机CPU工作电压和功耗都高于笔记本CPU,通常台式机CPU的测试温度上限为75摄氏度,超过75摄氏度,工作就会不稳定,甚至出现问题;;而笔记本CPU的测试温度上限为100摄氏度;服务器CPU需要长时间的稳定工作,在散热方面的要求就更高了。

  在选购整机尤其是有特定功能的计算机(如笔记本、服务器等)时,需要注意CPU的适用类型,选用不适合的CPU类型,一方面会影响整机的系统性能,另一方面会加大计算机的维护成本。单独选购CPU时候也要注意CPU的适用类型,建议按照具体应用的需求来购买CPU。


CPU 系列型号CPU厂商会根据CPU产品的市场定位来给属于同一系列的CPU产品确定一个系列型号以便于分类和管理,一般而言系列型号可以说是用于区分CPU性能的重要标识。
早期的CPU系列型号并没有明显的高低端之分,例如Intel的面向主流桌面市场的Pentium和Pentium MMX以及面向高端服务器生产的Pentium Pro;AMD的面向主流桌面市场的K5、K6、K6-2和K6-III以及面向移动市场的K6-2+和K6-III+等等。

随着CPU技术和IT市场的发展,Intel和AMD两大CPU生产厂商出于细分市场的目的,都不约而同的将自己旗下的CPU产品细分为高低端,从而以性能高低来细分市场。而高低端CPU系列型号之间的区别无非就是二级缓存容量(一般都只具有高端产品的四分之一)、外频、前端总线频率、支持的指令集以及支持的特殊技术等几个重要方面,基本上可以认为低端CPU产品就是高端CPU产品的缩水版。例如Intel方面的Celeron系列除了最初的产品没有二级缓存之外,就始终只具有128KB的二级缓存和66MHz以及100MHz的外频,比同时代的Pentium II/III/4系列都要差得多,而AMD方面的Duron也始终只具有64KB的二级缓存,外频也始终要比同时代的Athlon和Athlon XP要低一个数量级。

CPU系列划分为高低端之后,两大CPU厂商分别都推出了自己的一系列产品。在桌面平台方面,有Intel面向主流桌面市场的Pentium II、Pentium III和Pentium 4以及面向低端桌面市场的Celeron系列(包括俗称的I/II/III/IV代);而AMD方面则有面向主流桌面市场Athlon、Athlon XP以及面向低端桌面市场的Duron和Sempron等等。在移动平台方面,Intel则有面向高端移动市场的Mobile Pentium II、Mobile Pentium III、Mobile Pentium 4-M、Mobile Pentium 4和Pentium M以及面向低端移动市场的Mobile Celeron和Celeron M;AMD方面也有面向高端移动市场的Mobile Athlon 4、Mobile Athlon XP-M和Mobile Athlon 64以及面向低端移动市场的Mobile Duron和Mobile Sempron等等。

目前,CPU的系列型号更是被进一步细分为高中低三种类型。就以台式机CPU而言,Intel方面,高端的是双核心的Pentium EE以及单核心的Pentium 4 EE,中端的是双核心的Pentium D和单核心的Pentium 4,低端的则是Celeron D以及已经被淘汰掉的Celeron(即俗称的Celeron IV);而AMD方面,高端的是Athlon 64 FX(包括单核心和双核心),中端的则是双核心的Athlon 64 X2和单核心的Athlon 64,低端就是Sempron。以笔记本CPU而言,Intel方面高端的是Core Duo,中端的是Core Solo和即将被淘汰的Pentium M,低端的则是Celeron M;而AMD方面,高端的则是Turion 64,中端的是Mobile Athlon 64,低端的则是Mobile Sempron。

但在购买CPU产品时需要注意的是,以系列型号来区分CPU性能的高低也只对同时期的产品才有效,任何事物都是相对的,今天的高端就是明天的中端、后天的低端,例如昔日的高端产品Pentium 4和Pentium M现在已经降为了中端产品,AMD的Turion 64在Turion 64 X2发布之后也将降为中端产品。另外某些系列型号的时间跨度非常大,例如Intel的Pentium 4系列从2000年11月发布至今已经过了6个年头,而当时属于高端的早期的Pentium 4其性能还远远不及现在属于低端的Celeron D。而且低端CPU产品中也出现过不少以超频性能著称或者能修改的精品,例如Intel方面早期的Celeron 300A,中期的图拉丁核心的Celeron III系列,以及现在的Celeron D系列等等;AMD方面也有早期的Duron由于可以依靠连接金桥而修改为Athlon和Athlon XP而风靡一时,中期的Barton核心Athlon XP 2500+和现在的64位Sempron 2500+都以超频性能著称。这些低端产品其修改后和超频后的性能也并不比同时期主流的高端型号差,性价比非常高。

CPU 接口类型
我们知道,CPU需要通过某个接口与主板连接的才能进行工作。CPU经过这么多年的发展,采用的接口方式有引脚式、卡式、触点式、针脚式等。而目前CPU的接口都是针脚式接口,对应到主板上就有相应的插槽类型。CPU接口类型不同,在插孔数、体积、形状都有变化,所以不能互相接插。
Socket AM2
Socket AM2是2006年5月底发布的支持DDR2内存的AMD64位桌面CPU的接口标准,具有940根CPU针脚,支持双通道DDR2内存。虽然同样都具有940根CPU针脚,但Socket AM2与原有的Socket 940在针脚定义以及针脚排列方面都不相同,并不能互相兼容。目前采用Socket AM2接口的有低端的Sempron、中端的Athlon 64、高端的Athlon 64 X2以及顶级的Athlon 64 FX等全系列AMD桌面CPU,支持200MHz外频和1000MHz的HyperTransport总线频率,支持双通道DDR2内存,其中Athlon 64 X2以及Athlon 64 FX最高支持DDR2 800,Sempron和Athlon 64最高支持DDR2 667。。按照AMD的规划,Socket AM2接口将逐渐取代原有的Socket 754接口和Socket 939接口,从而实现桌面平台CPU接口的统一。

Socket S1
Socket S1是2006年5月底发布的支持DDR2内存的AMD64位移动CPU的接口标准,具有638根CPU针脚,支持双通道DDR2内存,这是与只支持单通道DDR内存的移动平台原有的Socket 754接口的最大区别。目前采用Socket S1接口的有低端的Mobile Sempron和高端的Turion 64 X2。按照AMD的规划,Socket S1接口将逐渐取代原有的Socket 754接口从而成为AMD移动平台的标准CPU接口。

Socket F
Socket F是AMD于2006年第三季度发布的支持DDR2内存的AMD服务器/工作站CPU的接口标准,首先采用此接口的是Santa Rosa核心的LGA封装的Opteron。与以前的Socket 940接口CPU明显不同,Socket F与Intel的Socket 775和Socket 771倒是基本类似。Socket F接口CPU的底部没有传统的针脚,而代之以1207个触点,即并非针脚式而是触点式,通过与对应的Socket F插槽内的1207根触针接触来传输信号。Socket F接口不仅能够有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率、降低生产成本。Socket F接口的Opteron也是AMD首次采用LGA封装,支持ECC DDR2内存。按照AMD的规划,Socket F接口将逐渐取代Socket 940接口。

Socket 771
Socket 771是Intel2005年底发布的双路服务器/工作站CPU的接口标准,目前采用此接口的有采用LGA封装的Dempsey核心的Xeon 5000系列和Woodcrest核心的Xeon 5100系列。与以前的Socket 603和Socket 604明显不同,Socket 771与桌面平台的Socket 775倒还基本类似,Socket 771接口CPU的底部没有传统的针脚,而代之以771个触点,即并非针脚式而是触点式,通过与对应的Socket 771插槽内的771根触针接触来传输信号。Socket 771接口不仅能够有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率、降低生产成本。Socket 771接口的CPU全部都采用LGA封装。按照Intel的规划,除了Xeon MP仍然采用Socket 604接口之外,Socket 771接口将取代双路Xeon(即Xeon DP)目前所采用的Socket 603接口和Socket 604接口。

Socket 479
Socket 479的用途比较专业,是2003年3月发布的Intel移动平台处理器的专用接口,具有479根CPU针脚,采用此接口的有Celeron M系列(不包括Yonah核心)和Pentium M系列,而此两大系列CPU已经面临被淘汰的命运。Yonah核心的Core Duo、Core Solo和Celeron M已经改用了不兼容于旧版Socket 478的新版Socket 478接口。

Socket 939
  Socket 939是AMD公司2004年6月才推出的64位桌面平台接口标准,具有939根CPU针脚,支持双通道DDR内存。目前采用此接口的有面向入门级服务器/工作站市场的Opteron 1XX系列以及面向桌面市场的Athlon 64以及Athlon 64 FX和Athlon 64 X2,除此之外部分专供OEM厂商的Sempron也采用了Socket 939接口。Socket 939处理器和与过去的Socket 940插槽是不能混插的,但是Socket 939仍然使用了相同的CPU风扇系统模式。随着AMD从2006年开始全面转向支持DDR2内存,Socket 939被Socket AM2所取代,在2007年初完成自己的历史使命从而被淘汰,从推出到被淘汰其寿命还不到3年。

Socket 775
  Socket 775又称为Socket T,是目前应用于Intel LGA775封装的CPU所对应的接口,目前采用此种接口的有LGA775封装的单核心的Pentium 4、Pentium 4 EE、Celeron D以及双核心的Pentium D和Pentium EE等CPU。与以前的Socket 478接口CPU不同,Socket 775接口CPU的底部没有传统的针脚,而代之以775个触点,即并非针脚式而是触点式,通过与对应的Socket 775插槽内的775根触针接触来传输信号。Socket 775接口不仅能够有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率、降低生产成本。随着Socket 478的逐渐淡出,Socket 775已经成为Intel桌面CPU的标准接口。

Socket 940
  Socket 940是最早发布的AMD64位CPU的接口标准,具有940根CPU针脚,支持双通道ECC DDR内存。目前采用此接口的有服务器/工作站所使用的Opteron以及最初的Athlon 64 FX。随着新出的Athlon 64 FX以及部分Opteron 1XX系列改用Socket 939接口,所以Socket 940已经成为了Opteron 2XX全系列和Opteron 8XX全系列以及部分Opteron 1XX系列的专用接口。随着AMD从2006年开始全面转向支持DDR2内存,Socket 940也会逐渐被Socket F所取代,完成自己的历史使命从而被淘汰。

Socket 754
  Socket 754是2003年9月AMD64位桌面平台最初发布时的CPU接口,具有754根CPU针脚,只支持单通道DDR内存。目前采用此接口的有面向桌面平台的Athlon 64的低端型号和Sempron的高端型号,以及面向移动平台的Mobile Sempron、Mobile Athlon 64以及Turion 64。随着AMD从2006年开始全面转向支持DDR2内存,桌面平台的Socket 754将逐渐被Socket AM2所取代从而使AMD的桌面处理器接口走向统一,而与此同时移动平台的Socket 754也将逐渐被具有638根CPU针脚、支持双通道DDR2内存的Socket S1所取代。Socket 754在2007年底完成自己的历史使命从而被淘汰,其寿命反而要比一度号称要取代自己的Socket 939要长得多。

Socket 478
  最初的Socket 478接口是早期Pentium 4系列处理器所采用的接口类型,针脚数为478针。Socket 478的Pentium 4处理器面积很小,其针脚排列极为紧密。英特尔公司的Pentium 4系列和P4 赛扬系列都采用此接口,目前这种CPU已经逐步退出市场。
但是,Intel于2006年初推出了一种全新的Socket 478接口,这种接口是目前Intel公司采用Core架构的处理器Core Duo和Core Solo的专用接口,与早期桌面版Pentium 4系列的Socket 478接口相比,虽然针脚数同为478根,但是其针脚定义以及电压等重要参数完全不相同,所以二者之间并不能互相兼容。随着Intel公司的处理器全面向Core架构转移,今后采用新Socket 478接口的处理器将会越来越多,例如即将推出的Core架构的Celeron M也会采用此接口。

Socket 603
  Socket 603的用途比较专业,应用于Intel方面高端的服务器/工作站平台,采用此接口的CPU是Xeon MP和早期的Xeon,具有603根CPU针脚。Socket 603接口的CPU可以兼容于Socket 604插槽。

Socket 604
  与Socket 603相仿,Socket 604仍然是应用于Intel方面高端的服务器/工作站平台,采用此接口的CPU是533MHz和800MHz FSB的Xeon。Socket 604接口的CPU不能兼容于Socket 603插槽。

Socket A
Socket A接口,也叫Socket 462,是目前AMD公司Athlon XP和Duron处理器的插座接口。Socket A接口具有462插空,可以支持133MHz外频。

Socket 423
  Socket 423插槽是最初Pentium 4处理器的标准接口,Socket 423的外形和前几种Socket类的插槽类似,对应的CPU针脚数为423。随着DDR内存的流行,英特尔开发了支持SDRAM及DDR内存的i845芯片组,CPU插槽也改成了Socket 478,Socket 423接口也就销声匿迹了。

Socket 370
  Socket 370架构是英特尔开发出来代替SLOT架构,外观上与Socket 7非常像,也采用零插拔力插槽,对应的CPU是370针脚。英特尔公司著名的“铜矿”和”图拉丁”系列CPU就是采用此接口。

SLOT 1
  SLOT 1是英特尔公司为取代Socket 7而开发的CPU接口,并申请的专利。这样其它厂商就无法生产SLOT 1接口的产品。SLOT1接口的CPU不再是大家熟悉的方方正正的样子,而是变成了扁平的长方体,而且接口也变成了金手指,不再是插针形式。SLOT 1是英特尔公司为Pentium Ⅱ系列CPU设计的插槽,其将Pentium Ⅱ CPU及其相关控制电路、二级缓存都做在一块子卡上,目前此种接口已经被淘汰。

SLOT 2
  SLOT 2用途比较专业,都采用于高端服务器及图形工作站的系统。所用的CPU也是很昂贵的Xeon(至强)系列。Slot 2插槽比SLOT 1更长,有了Slot 2设计后,可以在一台服务器中同时采用 8个处理器。而且采用Slot 2接口的Pentium Ⅱ CPU都采用了当时最先进的0.25微米制造工艺。支持SLOT 2接口的主板芯片组有440GX和450NX。

SLOT A
  SLOT A接口类似于英特尔公司的SLOT 1接口,供AMD公司的K7 Athlon使用的。在技术和性能上,SLOT A主板可完全兼容原有的各种外设扩展卡设备。它使用的并不是Intel的P6 GTL+ 总线协议,而是Digital公司的Alpha总线协议EV6。EV6架构是种较先进的架构,它采用多线程处理的点到点拓扑结构,支持200MHz的总线频率。



CPU 针脚数

目前CPU都采用针脚式接口与主板相连,而不同的接口的CPU在针脚数上各不相同。CPU接口类型的命名,习惯用针脚数来表示,比如目前Pentium 4系列处理器所采用的Socket 478接口,其针脚数就为478针;而Athlon XP系列处理器所采用的Socket 939接口,其针脚数就为939针。
原则上CPU性能的好坏和针脚数的多少是没有关系的,而且CPU上的针脚也并不是每个针脚都是起作用的,也就是说其实CPU上还有些针脚是没有任何作用的“摆设”,是闲置起的。这是因为CPU厂商在设计CPU时,必然会考虑到今后一段时间内的功能扩展和性能提高,而会预留一些暂时不起作用的针脚以便今后改进。不过随着CPU技术的发展,需要越来越多的CPU针脚以实现更丰富的功能以及更高的性能,例如集成双通道内存控制器所需要的针脚数量就要比只集成单通道内存控制器所需要的针脚数要多得多,因此总的来说CPU针脚数有越来越多的趋势,基本上可以认为针脚多的CPU其架构也越先进。但是任何事物都不是绝对的,例如AMD在移动平台上用来取代Socket 754的Socket S1其针脚数反而从754根减少到了638根。



CPU 双核心类型
在2005年以前,主频一直是两大处理器巨头Intel和AMD争相追逐的焦点。而且处理器主频也在Intel和AMD的推动下达到了一个又一个的高峰就在处理器主频提升速度的同时,也发现在目前的情况下,单纯主频的提升已经无法为系统整体性能的提升带来明显的好处,并且高主频带来了处理器巨大的发热量,更为不利是Intel和AMD两家在处理器主频提升上已经有些力不从心了。在这种情况下,Intel和AMD都不约而同地将投向了多核心的发展方向在不用进行大规模开发的情况下将现有产品发展成为理论性能更为强大的多核心处理器系统,无疑是相当明智的选择。
双核处理器就基于单个半导体的一个处理器上拥有两个一样功能的处理器核心,即是将两个物理处理器核心整合入一个内核中。事实上,双核架构并不是什么新技术,不过此前双核心处理器一直是服务器的专利,现在已经开始普及之中。

TOP

CPU应用技巧!全面解答23个热点问题!

1、防止CPU工作温度过高   
问:我的电脑在工作时经常会遇到CPU过热的问题,该怎么解决?   

答:很多用户的电脑在使用时会发生CPU温度过高的问题。要解决这个问题,首先要换一个大风扇。并在CPU和散热片间抹上导热硅胶,一般来说,这样情况就有所改善。但如果在玩3D游戏时仍然会死机,我们还可以采用降低电压的方法来改善温度过高的问鼠因为随着制造工艺的不断改进,CPU的核心电压将进一步降低,这样使得CPU发热量及功耗越来越小。找到主板说明书,将CPU的核心电压从标准的2.2V调到2.1V,即给CPU降压。重新启动计算机进人Windows即可正常了。

2.改进CPU的散热风扇   

问:我的CPU散热风扇虽然风力很强劲,但是热量总是无法很好地散出去,请问该怎么办?   

答:按照一般的安装方法,风扇的叶片只占转子半径一半不到,中间是不会产生风的马达。风扇紧压着散热片,中间没有空间混合气流,导致散热片中间不会吹到风。还有一个问题就是散热器装好后风扇转起来噪声很大,原因是风扇的震动传给了散热片,再传给CPU主板,令人担心会不会震坏那脆弱的CPU。我们需要改装风扇来达到更好的散热效果:找块橡胶垫(像鼠标垫那样厚)剪成两块三角形状,用热熔胶固定在散热片的两边,风扇再用热熔胶固定在三角形橡胶片的上面,倾斜地偏离中心一些,使风斜着向散热片吹。这样改动有几个好处:一是风扇的震动被橡胶垫吸收,运转时用手触摸散热片基本没震动;二是风扇和散热片之间有空气混合空间;三是风向从一边吹向另一边,散热片全部可以吹得到。

3.防止CPU主芯片磨损  

 问:听说CPU用久了主芯片容易磨损,我该如何防止CPU主芯片被磨损?   

答:对于主芯片磨损,目前还没有行之有效的修理方法。因此,CPU不用时最好在芯片表面贴上一层胶布,现在不少商家在销售时就贴好了胶布,如果没有贴,可以向销售CPU的商家索取。此外,在安装CPU时一定要注意风扇的正确安装。安装风扇是有方向的,如果是英特尔原装风扇,必须使风扇散热片下面出厂时贴好的硅胶贴片与CPU芯片完全重合,否则,就会磨损主芯片。总之,要防止CPU主芯片磨损,必须保证两点:一是芯片与硅胶接触均匀;二是安装时用力均匀。

4.选择质量好的导热硅脂   问:导热硅脂有什么作用?   

答:制作再精良的散热片与CPU接触时都难免有空隙出现,因此我们很有必要使用导热硅脂填充CPU与散热片之间的空隙。通过增大两者的接触面积来改善导热的效果。但要注意的是,因为金属散热片的导热能力要比导热硅脂强得多,因此在这里使用导热硅脂仅仅是用来填补空隙,而不是用来连接CPU和散热片,切不可认为导热硅脂是散热主体,它只是帮助散热片散热而已。 现在市场上销售的DIY专用导热硅脂主要有三种:白色导热硅脂、灰色导热硅脂以及一种少见的偏黑色导热硅脂。 白色导热簿脂:这种导热硅脂最常见。常温下是粘稠的液体状态,由于在硅脂中添加了不同含量的金属银粉而分为几个等级,区别在于它们的粘稠程度不同,而其中金属银粉的成份则散热效果就越好,当然它的价格也就越高。 灰色导热硅脂:这种导热硅脂是Intel公司的原装导热硅脂,它在导热硅脂中添加了一定的石墨粉来增强导热效果,如果你觉得这种硅脂中石墨粉不够多,也可以自己添加一些。将灰色导热硅脂放到玻璃板上,然后把铅笔放在上面磨,边磨边与硅脂搅拌。不过要注意一点,在磨制过程中不要太用力,否则铅笔芯颗粒太大,反而影响导热效果。 偏黑色导热锺脂:这种有“色”导热硅脂并没有什么秘密,只不过在导热硅脂里加入了少量的焊锡粉,据说它的散热效果在导热硅脂中是最好的。

5.正确使用导热硅脂   问:我该怎样正确地使用导热硅脂?   

答:使用导热硅脂不用有什么顾虑(有些朋友害怕硅脂粘上CPU后擦不掉),因为大多数导热硅脂没有太强的粘性,粘上CPU后可以很容易地擦掉。至于怎样涂抹导热硅脂,却是十分有讲究:涂抹硅脂的时候要注意用量,涂抹量不可过多(“毒龙”、“雷鸟”大约需要黄豆般大小即可,Intel的CPU则要稍少一点),刚好把CPU内核凸出部分和其他部分填平或把凹糟涂满就可以了,切忌将整个CPU芯片都涂抹。同时,涂抹的时候一定要厚薄均匀。硅脂里特别注意不能留有气泡,否则空隙内的空气将会起到保温作用。还有一点要强调的是,由于AMD的CPU表面有许多裸露的铜导线,在使用导热硅脂的时候,就必须弄清楚该硅脂里是否含有过量的石墨粉或金属粉,以免造成短路的可怕后果。   

6.正确区分导热硅胶与导热硅脂   

问:导热硅胶与导热硅脂都有导热作用,它们有什么区别呢?   

答:导热硅胶的作用与导热硅脂基本相同,它的种类比较多,颜色也不一样,但是有一个共同点:低温下呈凝固状,高温下则呈粘稠状液态,有导热性。值得广大朋友注意的是,这里所说的导热硅胶绝不是工业硅胶。工业硅胶特点是防水绝热耐高温(盖房子还可以),如果你买的是工业硅胶就要小心CPU过热烧坏了。  

7.正确使用导热硅胶   问:我该如何正确使用导热硅胶?   

答:涂抹导热硅胶方法与涂抹导热硅脂大同小异,但由于导热硅胶在第一次使用的时候会被CPU高温熔化,然后均匀粘合在CPU与散热片上,当温度下降冷却后,硅胶则把CPU和散热片紧密地联结在一起,因此在涂抹时要注意不能涂抹过多,否则高温熔化后的硅胶会流到CPU插槽上面,不仅会把CPU牢固地粘在CPU插槽上,而且还有可能使CPU的针脚绝缘,导致CPU无法正常工作!   用导热硅脂、硅胶把CPU和散热片粘接在一起比较容易,但想把它们分开就没那么轻松了。拆卸粘有导热硅脂的CPU比较简单,毕竟它的粘合度不是很强调一把锋利的小刀从CPU和散热片的缝隙中插入(为了防止损坏CPU中间突出的内核,最好从内核旁边插入),再轻轻地一撬就能解决问题;而拆卸粘有导热硅胶的CPU就没有这么简单了,通常只能用小刀切开。由于CPU的陶瓷非常坚固,所以只要你小心大胆就完全能做到,这也是现在没人再把万能胶当导热硅胶的一个原因(万能胶粘得太牢,几乎无法把CPU与散热片分开)。   

8. 了解CPU制程   

问:什么是CPU制程?   

答:CPU制程即CPU的CMOS制造工艺,常以蚀刻芯片的光波波长来表示。CPU制程越小,晶体管集成度越高,发热量越少,同时也容易提升到更高的频率。例如Northwood核心的Pentium4采用的就是0.13微米的制程。   

9.CPU占有率的含义   

问:CPU占有率是什么意思?   

答:CPU占有率也称为CPU占用率。是指外部设备工作时占用CPU资源的时间多少,例如磁盘、显示卡、声音卡等都牵涉到CPU占用率的问题。CPU占用用百分比表示,其值越小越好,这意味着CPU可以在外设工作的同时并行地处理其他问题。   

10.CUP为什么要“锁频”   

问:什么是“锁频”?   

答:CPU厂商为防止一些不法商人以CPU Remark牟利,而限定CPU只能工作于某一频率,这就做“锁频”。目前CPU的锁频还只限于锁倍频,锁倍频也分为两种情况:一是锁住了最高倍频,但可以向下调整;二是锁住了某一倍频,不能调高也不能调低。

11.CPU为什么能超频

问:CPU为什么能超频

答:CPU能够超频的根本原因,是CPU生产厂商在CPU出厂标注工作频率时并没有按最高频率标注,而是留下了部分余量。

12.如何为CPU超频

问:怎样实现CPU超频?

答:一般超频有超外频和超倍频两种方法,不同的主板采用三种不同的方式实现对外频和倍颁的调节:

  ①较老的主板采用的方法是跳线,这类主板上有一组外频和倍频数的选择跳线,用户得根据说明书来跳接这两组跳线,从而实现对外频和倍频的设定。

  ②一些主板采用了DIP开关来代替跳线,它的操作比跳线方式简单,因此也更受欢迎。

  ③最新的主板采用了“免跳线”技术,通过修改BIOS设置来实现对外频和倍频数的调节。

  以上三种方法,对用户的电脑知识都有一定要求。采用跳线和DlP开关方式进行超频。需要打开机箱对照说明书进行相应的设置,比较烦琐。采用免跳线技巧通过修改BIOS来进行超频比较简单。

13.恢复CPU的默认频率

问:我的电脑在超频后运行时很不稳定,经常死机,最近开机自检时显示“DlSK BOOT FAILURE,lNSERT SYSTEM DlSK AND PRESSENTER”,然后就死机了,经检查硬盘没有问题,估计与超频有关,请问如何恢复到原来的频率?

答:请在Bl0S中设置启动顺序为“IDEOFLDOPY/CDROM”,然后将“BOOT OTHER DEVICE”设置为Enabled,再重新启动看看能不能从硬盘启动。如果不能,那很可能是超额引起的,如果找不到主板的说明书,那么请直接看主板PCB上的印刷说明文字,主板厂商会将超频跳线的使用方法印刷在主板上。只要按主板上的说明将主板外频降到CPU默认的外频即可。

14.增加CPU的内核电压

问:增加CPU的内核电压对CPU有何影响?

答:一般来说,适当提高CPU的内核电压可以增加高低电压的差值,提高讯号的清晰度。从而使超频更易成功。但也要注意增加内核电压也会带来副作用:一是增加CPU的发热量。所以提高内核电压后一定要注意散热问题;二是过高的电压会造成CPU栅极氧化层击穿,严重的会导致CPU烧毁,因此增加电压的幅度不宜过大。

15.超频对电脑硬件的要求

  问:要想超频戍功,对除CPU外的电脑硬件有何要求?

  答:现在超频通常采用提高外频的方法。外频的提高将可能引起一系列相关设备工作条件的改变,因此在超频时我们要对整个系统的超频能力进行综合考虑。

  ①主板有可供选择的频率。我们知道,频率是由主板上的时钟芯片产生的。主板外频是否丰富对于超频是否成功非常重要,9OMHz/95MHz/lO3MHz/1IOMHz/117MHz等过渡频率有时对于能否发挥CPU的最大潜能十分重要。同时我们还要注意主板对PCI和AGP频率的处理,因为在高频率下许多设备都可能因频率过高而{xx}。现在许多主板的PCI频率可在总线频率的1/2或1/3之间选择,而AGP频率可在与总线频率同步或2/3之间选择,有的甚至提供了四分频的选择。这样就可以使系统总线频率提高时,PCI,AGP的频率不变或变化不大,从而为各种设备的正常工作提供了条件。

  ②内存。内存对超频成功起着相当重要的作用。对于采用SDRAM的系统,要想系统工作在100Hz的外频以上,内存必须是符合PC1O0或PC133标准的高质量内存条。1OOMHz和133MHz的频率对应lOns和7ns的存取时间,在购买内存时应注意板面上的字迹是否清晰,电路板是六层还是八层。另外还要特别注意内存条上是否有SPD EEPROM,因为没有SPD EEPROM的SDRAM一定不属于PC1OO SDRAM。在购买时建议购买名牌厂家的产品,因为名牌厂家的内存在质量和性能上留有较大的余地,因此超频使用的成功率也较高。对于采用DDR SDRAM的系统,很多主板提供了锁定内存频率的选项,大家可以根据主板的说明书进行设置。

  ③AGP显卡在进行超频时,对正式支持133外频的主板来说,可能没有什么问题,因为此时AGP的频率为总线频率的1/2,即66MHz。但对于BX主板之类的老主板来说,虽然也可以提供133MHz的外频,但它不提供AGP的二分频技术,这对显卡在高频率下工作的稳定性就是一个考验了。此外显卡的板载内存的存取速度也应考虑,如显存的质量不好,跟不上内存的速度,将会出现花屏现象。

  ④硬盘。由于IDE频率和PCI频率同步,因此在使用75MHz、83MHz,112MHz、124MHz、133MHz等频率超 频时,硬盘可能工作在高频率上,超频性能不佳的硬盘 在这时会出现读写错误,无法启动等故障。甚至会因为高负荷而烧毁。

  ⑤散热。超频势必引起CPU温度的提高,CPU的散热问题必须引起我们注意,散热好有利于系统稳定性的提高。现在普遍采用大功率风扇和大散热片。在安装散热片时我们应注意在CPU和散热片之间均匀涂抹导热硅脂,它可以使散热片和CPU顶盖之间的空气排走。使结合更紧密。涂抹时只要在CPU顶盖和散热片底面接触部分涂上薄薄一层就可以了,越簿越好。

  同时应注意的是在超频后,除了给CPU加装散热设备以外还要注意显示芯片的散热问题,因为显示芯片也是个耗电大户,它的温度过高也会引起花屏或死机。

16.如何保养CPU

  问:我该如何对CPU进行保养?

  答:首先要保证良好的散热。CPU的正常工作温度为50℃以下,具体工作温度根据不同的CPU的主频而定。散热片质量要够好,并且带有测速功能,这样与主板监控功能配合监测风扇工作情况,散热片的底层以厚的为佳,这样有利于主动散热,保障机箱内外的空气流通顺畅。

  其次要减压和避震。CPU“死于”散热和扣具压力的惨剧时有所闻,主要表现在CPU的DlE被压毁,因此在安装CPU时应该注意用力要均匀。扣具的压力亦要适中。

  超频要合理。现在主流的CPU频率都在lGHz以上,此时超频的意义己经不大了,更多考虑的应是延长CPU的寿命,如确实需要超频。可考虑阡电压超频。

  最后要用好硅脂。硅脂在使用时要涂于CPU表面内核上,薄薄的一层就可以,过量会有可能渗漏到CPU表面相接口处。硅脂在使用一段时间会干燥,这时可以除净后再重新涂上硅脂。改良的硅脂更要小心,因为改良的硅脂通常是加碳粉和金属粉末,这时的硅脂有很强的导电性,在电脑运行时若渗漏到CPU表面的电容上后果不堪没想。

  17.P4对电源和机箱有何要求

  问:我最近想配台P4电脑,请问那些所谓的P4专用机箱(电源)是怎么回事?p4真的需要专用电源吗?

  答:大家知道电源是整个计算机的动力之源。如果电源出现任何故障,电脑中的任何配件都可能遭到灭顶之灾。如果电源质量不可靠,系统运行将极不稳定。随着电脑中CPU、内存、板卡芯片的时钟频率的提高,光驱转速的加快,散热风扇的增加,因此对电源的性能要求也就大大增加了。尤其在P4推出后,作为目前功率最大的桌面CPU处理芯片,其功率可高达60w以上,倘若电源性能不良就很可能出现供电不足的情况。因此在对机箱和电源的要求上。P4有新的要求。我们在组装P4电脑时一定要注意机箱和电源的配合。

  18.给AthlOn XP选个好散热器

  问:我使用的CPU是Thomughbred Athlon XP,应该选个什么样的散热器?

  答:AMD的CPU发热量大是比较出名的,而当Athlon XP采用0.13微米制程后,Thoroughbred核心的Ath1on XP的功率及核心电压都有所下降,但新AthlonXP的发热量仍然比较大,加上DIE的表面积比Palomino Ath1on XP的要小很多,因此我们必须为新Athlon XP选择一款比较好的CPU散热器。

  如果我们使用新Athlon XP,那些廉价的散热器最好不要用了,因为这类散热器与《PU核心接触部分的材料,大都使用的是铝合金,因此不能满足CPU散热性的要求。而根据AMD的规定,由于散热器的原因而烧毁的CPU是不能保修的。所以,建议消费者在使用新Athlon XP时,选择那些经过AMD认证的散热器,另外最好购买那些口碑较好的名牌风扇。

19.双CPU不等于双倍性能

  问:我想购买双CPU,听说这样可以获得双倍的性能。是这样的吗?

  答:双CPU需要操作系统和应用程序的支持才能发挥效能,要想获得双CPU应有的性能,你必须满足以下两个条件:①安装并使用支特多处理器的操作系统。Windows98是不支持多处理器的。如果你使用的操作系统是Windows 98,那双CPU在使用任何程序时都没有起到作用。要想发挥双CPU的性能,你必须使用Windows2000、Windows NT、LINUX等支持多处理器的操作系统(推荐使用Windows2000)。②便用支持多处理器的多线程程序,目前最常见的仅有Photoshop、3DStudio MAX等几个。此外,即便满足了以上条件,也只能根据软件的相应操作获得1.2~1.8倍的性能,不可能有双倍性能。

  20.CM0S显示的CPU主频不对

  问:我的电脑开机自检后系统显示CPU工作于450MHz,但在BIOS设置界面中,“BIOS&CPU FEATURESSETUP” 一项中的“CPU INTERNAL CORE SPEED”显示却是350MHz。不知是什么原因?

  答:有些主板的BI0S发现系统更新了硬件以后会自动将CMOS参数降低为最安全的设置。对支持CPU工作状态设置的BI0S程序,会自动将CPU工作频率降为主板支持的最低主频CPU。你的系统外频为100MHz,而100MHz外频CPU的最低主频为350MHz因而BIOS设置界面中应当显示350MHz(3.5xlOOMHz)属正常现象。为什么开机自检后系统显示CPU工作于450MHz(4.5x100MHz),因为你的CPU被锁定于4.5,也属正常现象。

  21.正确对待主板检测的CPU温度

  问:我的电脑一开机,BI0S就显示CPU温度为48℃(室温25℃左右),不运行任何程序几分钟后温度也会上升到54℃。这是什么问题?长期下去对硬件是否有影响?我该将主板中的CPU警戒温度设定到什么值?

答:主板检测CPU温度都是依靠CPU座下的探温头完成的。探温头做得高一些,就离CPU近。所探测到的温度就高;探温头做得低些。就离CPU远些,所探测的温度也就低。该温度显示的高低并不会对硬件工作造成影响。

设定BIOS中的CPU警戒温度的依据主要是CPU所能承受的极限温度。一般警戒温度设置为比它所能承受的极限温度低20℃左右即可。

22.正确区分不同核心的P4

  问:目前市面上P4处理器有两种核心,我该如何区分它们?

  答:目前市面上P4的核心有Wil1amette和Horthwood两种。

  Willamette核心的老P4:

  早期市场上P4有两种接口,最初采用的是SOcket 423接口,采用该接口的P4体型较大。随后上市的就是目前市场上最常见的产品—— Socket478接口的P4。Socket 478接口的P4看起来非常小巧,与SOCket 423接口的P4相比,其身材要“苗条”得多。需要提醒大家注意的是,这两种P4都是WiAlamette核心,其特征是:采用0.18微米铝连线工艺,256KB的L2 Cache,核心电压为1.7V(部分产成为1.75V),40OMHz的系统总线采用此核心的p4最高主频为2GHz。

  Northwood核心的新P4:

  与Willamett核心的P4相比,Northwood P4最重要的改进是将0.18微米的制造工艺提升到0.13微米,此外还来用了铜互连技术。这些先进工艺的运用。使得Northwood P4的工作电压从Willamette时代的1.7V降到了1.5V,发热量也小了许多,另外,Northwood P4还拥有512KB的L2 Cache。Northwood P4仍然采用Socket 478接口,所以从外观上来看,采用Willamette核心的Socket 478 P4与采用Northwood核心的P4简直一模一样。

  目前市场上能买到的新P4有1.6GHz、l.8GHz、2.OGHz、2。2GHz等,为了与Willamette核心的同频率的P4区分开来,销售商一般也会在报价单上将采用Northwood核心的P4后面标注“A”字样,如P4 1.60A、P4 1.8OA,P4 2.OA及P4 22A等。

  由于两种核心的Pendum4都使用Socket 478接口,封装、外形及大小都是十分想像,那么我们可以先看看CPU正面的编号。如Northwood的Pentium 4,它的编号是1.6A GHz/512/400/1.5v,分别代表CPU主频/CPU缓存/系统外频/核心电压。其中频率中的字母A是为了与Wulmette相区别(Willmette也有主频为1.6GHz的)。而Willamette核心的CPU编号为L6GHz/256/400/1.75V,我们可以看到Willmette与Northwood相比缓存少了256K,核心电压高了0.25V。然后可以看看CPU背面的电容数量,Nornhwood核心Pendum4的电容要多于Willamette核心的。除了看CPU的外观来识别外,还可以通过ProcessorFrequency ID Utility这款软件来识别,这款软件能识别出CPU的型号、原始频率、实际频率、缓存等指标。用这款软件不仅能很方便地区分新旧P4,还能检测出CPU是否被超频。

  23.区分400MHz和533MHz外频P4

  问:请问该如何区分40OMHz和533MHz外频的P4?

  答:使用400MHz总线频率的P4 与使用533MHz总线频率的P4内部结构是一样的,不同的就在于他们内部的编程与验证不一样、同频的400MHz和533Mz外频的P4。后者上会标记有“B”字样。

TOP

教你认识CPU专业术语

Intel公司的X86序列CPU以及其它公司所生产的兼容产品,是目前世界上个人电脑中装机最多的芯片。每当各种媒体介绍或评价这类CPU时,经常会提到诸如“流水线”、“乱序执行”和“分枝预测”等专业术语,尽管不少朋友也知道这些都是CPU使用的先进技术,但毕竟比什么主频、外频等难理解多了。所以笔者就经常出现在CPU特性表中的专业术语谈谈自己的理解,以供其他电脑业余爱好者参考。

  1、IA-32&IA-64
  IA是英语“英特尔体系/Intel Architecture”的缩写。这是因为目前使用的CPU以Intel公司的X86序列产品为主,所以人们将Intel生产的CPU统称为英特尔体系(IA)CPU。由于其它公司如AMD等公司生产的CPU基本上能在软、硬件方面与Intel的CPU兼容,所以人们通常也将这部分CPU列入IA系列。

  由于目前使用的CPU,包括新推出的Pentium III都还是32位的,所以又被列为IA-32。而IA-64就是Intel下一步将推出的64位CPU,但其物理结构和工作机理与目前的X86序列的IA-32CPU完全不同。


  2、CPU的位和字长

  位
  在数字电路和电脑技术中采用二进制,代码只有“0”和“1”,其中无论是“0”或是“1”在CPU中都是一“位”。

  字长
  电脑技术中对CPU在单位时间内(同一时间)能一次处理的二进制数的位数叫字长。所以能处理字长为8位数据的CPU通常就叫8位的CPU。同理32位的CPU就能在单位时间内处理字长为32位的二进制数据。


  字节和字长的区别
  由于常用的英文字符用8位二进制数就可以表示,所以通常就将8位称为一个字节。字节的长度是固定的,而字长的长度是不固定的,对于不同的CPU,字长的长度也不一样。8位的CPU一次只能处理一个字节,而32位的CPU一次就能处理4个字节,同理字长为64位的CPU一次可以处理8个字节。
3、CPU外频  CPU外频也就是常见特性表中所列的CPU总线频率,是由主板为CPU提供的基准时钟频率,而CPU的工作主频则按倍频系数乘以外频而来。在Pentium时代,CPU的外频一般是60/66MHz,从Pentium Ⅱ 350开始,CPU外频提高到100MHz。由于正常情况下CPU总线频率和内存总线频率相同,所以当CPU外频提高后,与内存之间的交换速度也相应得到了提高,对提高电脑整体运行速度影响较大。   4、CPU主频  CPU主频也叫工作频率,是CPU内核(整数和浮点运算器)电路的实际运行频率。在486DX2 CPU之前,CPU的主频与外频相等。从486DX2开始,基本上所有的CPU主频都等于“外频乘上倍频系数”了。   5、流水线技术  流水线(pipeline)是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5~6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5~6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高CPU的运算速度。从图1a中我们可以了解,由于486CPU只有一条流水线,通过流水线中取指令、译码、产生地址、执行指令和数据写回五个电路单元分别同时执行那些已经分成五步的指令,因此实现了486CPU设计人员预期的在每个时钟周期中完成一条指令的目的(按笔者看法,CPU实际上应该是从第五个时钟周期才达到每周期能完成一条指令的处理速度)。到了Pentium时代,设计人员在CPU中设置了两条具有各自独立电路单元的流水线,因此这样CPU在工作时就可以通过这两条流水线来同时执行两条指令,因此在理论上可以实现在每一个时钟周期中完成两条指令的目的。   6、超流水线  超流水线(superpiplined)是指某型CPU内部的流水线超过通常的5~6步以上,例如Pentium pro的流水线就长达14步。将流水线设计的步(级)数越多,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。这一点我们可以用日常事例来说明,比如栽树时由5个人同时栽10棵(一人两棵)所完成的速度当然没有10人同时栽(一人一棵)所完成的速度快。   7、超标量技术  超标量(superscalar)是指在CPU中有一条以上的流水线,并且每时钟周期内可以完成一条以上的指令,这种设计就叫超标量技术。   8、乱序执行技术  乱序执行(out-of-order execution)是指CPU采用了允许将多条指令不按程序规定的顺序分开发送给各相电路单元处理的技术。比方说程序某一段有7条指令,此时CPU将根据各单元电路的空闲状态和各指令能否提前执行的具体情况分析后,将能提前执行的指令立即发送给相应电路执行。当然在各单元不按规定顺序执行完指令后还必须由相应电路再将运算结果重新按原来程序指定的指令顺序排列后才能返回程序。这种将各条指令不按顺序拆散后执行的运行方式就叫乱序执行(也有叫错序执行)技术。 采用乱序执行技术的目的是为了使CPU内部电路满负荷运转并相应提高了CPU的运行程序的速度。这好比请A、B、C三个名人为晚会题写横幅"春节联欢晚会"六个大字,每人各写两个字。如果这时在一张大纸上按顺序由A写好"春节"后再交给B写"联欢",然后再由C写"晚会",那么这样在A写的时候,B和C必须等待,而在B写的时候C仍然要等待而A已经没事了。但如果采用三个人分别用三张纸同时写的做法, 那么B和C都不必须等待就可以同时各写各的了,甚至C和B还可以比A先写好也没关系(就象乱序执行),但当他们都写完后就必须重新在横幅上(自然可以由别人做,就象CPU中乱序执行后的重新排列单元)按"春节联欢晚会"的顺序排好才能挂出去。   9、分枝  分枝(branch)是指程序运行时需要改变的节点。分枝有无条件分枝和有条件分枝,其中无条件分枝只需要CPU按指令顺序执行,而条件分枝则必须根据处理结果再决定程序运行方向是否改变。因此需要"分枝预测"技术处理的是条件分枝。   10、分枝预测和推测执行技术  分枝预测(branch prediction)和推测执行(speculation execution)是CPU动态执行技术中的主要内容,动态执行是目前CPU主要采用的先进技术之一。采用分枝预测和动态执行的主要目的是为了提高CPU的运算速度。推测执行是依托于分枝预测基础上的,在分枝预测程序是否分枝后所进行的处理也就是推测执行。   由于程序中的条件分枝是根据程序指令在流水线处理后结果再执行的,所以当CPU等待指令结果时,流水线的前级电路也处于空闲状态等待分枝指令,这样必然出现时钟周期的浪费。如果CPU能在前条指令结果出来之前就能预测到分枝是否转移,那么就可以提前执行相应的指令,这样就避免了流水线的空闲等待,相应也就提高了CPU的运算速度。但另一方面一旦前指令结果出来后证明分枝预测错误,那么就必须将已经装入流水线执行的指令和结果全部清除,然后再装入正确指令重新处理,这样就比不进行分枝预测等待结果后再执行新指令还慢了(所以IDT公司的WIN C6就没有采用分枝预测技术)。这就好象在外科手术中,一个熟练的护士可以根据手术进展情况来判断医生的需要(象分枝预测)提前将手术器械拿在手上(象推测执行)然后按医生要求递给他,这样可以避免等医生说出要什么,再由护士拿起递给他(医生)的等待时间。当然如果护士判断错误,也必须要放下预先拿的器械再重新拿医生需要的递过去。尽管如此,只要护士经验丰富,判断准确率高,那么当然就可以提高手术进行速度。 因此我们可以看出,在以上推测执行时的分枝预测准确性至关重要!所以通过Intel公司技术人员的努力,现在的Pentium和Pentium Ⅱ系列CPU的分枝预测正确率分别达到了80%和90%,这样虽然可能会有20%和10%分枝预测错误但平均以后的结果仍然可以提高CPU的运算速度。   11、指令特殊扩展技术  在介绍CPU性能中还经常提到“扩展指令”或“特殊扩展”一说,这都是指该CPU是否具有对X86指令集进行指令扩展而言。扩展指令中最早出现的是Intel公司自己的“MMX”,其次是AMD公司的“3D Now!”,最后是最近的Pentium Ⅲ中的“SSE”。   MMX   MMX是英语“多媒体指令集”的缩写。共有57条指令,是Intel公司第一次对自1985年就定型的X86指令集进行的扩展。MMX主要用于增强CPU对多媒体信息的处理,提高CPU处理3D图形、视频和音频信息能力。但由于只对整数运算进行了优化而没有加强浮点方面的运算能力。所以在3D图形日趋广泛,因特网3D网页应用日趋增多的情况下,MMX业已心有余而力不足了。   3D Now!   AMD公司开发的多媒体扩展指令集,共有27条指令,针对MMX指令集没有加强浮点处理能力的弱点,重点提高了AMD公司K6系列CPU对3D图形的处理能力,但由于指令有限,该指令集主要应用于3D游戏,而对其他商业图形应用处理支持不足。   SSE   SSE是英语“因特网数据流单指令序列扩展/internet Streaming SIMD Extensions”的缩写。它是Intel公司首次应用于最近才推出的Pentium Ⅲ中的。SSE实际就是原来传闻的MMX2后来又叫KNI(Katmai New Instruction),Katmai实际上也就是现在的Pentium Ⅲ。SSE共有70条指令,不但涵括了原MMX和3D Now!指令集中的所有功能,而且特别加强了SIMD浮点处理能力,另外还专门针对目前因特网的日益发展,加强了CPU处理3D网页和其它音、象信息技术处理的能力。

CPU具有特殊扩展指令集后还必须在应用程序的相应支持下才能发挥作用,因此,当目前最先进的Pentium Ⅲ 450和Pentium Ⅱ 450运行同样没有扩展指令支持的应用程序时,它们之间的速度区别并不大。   12、CPU的生产工艺技术  我们常可以在CPU性能列表上看到“工艺技术”一项,其中有“0.35μm”或“0.25μm”等,这些同样是为了说明CPU技术先进程度。一般来说“工艺技术”中的数据越小表明CPU生产技术越先进。   目前生产CPU主要采用CMOS技术。CMOS是英语“互补金属氧化物半导体”的缩写。采用这种技术生产CPU时过程中采用“光刀”加工各种电路和元器件,并采用金属铝沉淀在硅材料上后用“光刀”刻成导线联接各元器件。现在光刻的精度一般用微米(μm)表示,精度越高表示生产工艺越先进。因为精度越高则可以在同样体积上的硅材料上生产出更多的元件,所加工出的联接线也越细,这样生产出的CPU工作主频可以做得很高。正因为如此,在只能使用0.65μm工艺时生产的第一代Pentium CPU的工作主频只有60/66MHz,在随后生产工艺逐渐发展到0.35μm、0.25μm时,所以也相应生产出了工作主频高达266MHz的Pentium MMX和主频高达500MHz的Pentium Ⅱ CPU。   由于目前科学技术的限制,现在的CPU生产工艺只能达到0.25μm,因此Intel、AMD以及其它公司正在向0.18μm和铜导线(用金属铜沉淀在硅材料上代替原来的铝)技术努力,估计只要生产工艺达到0.18μm后生产出主频为1000MHz的CPU就会是很平常的事了。

TOP

CPU知识大全

1.主频

  主频也叫时钟频率,单位是MHz,用来表示CPU的运算速度。CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行速度,这不仅是个片面的,而且对于服务器来讲,这个认识也出现了偏差。至今,没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关系,即使是两大处理器厂家Intel和AMD,在这点上也存在着很大的争议,我们从Intel的产品的发展趋势,可以看出Intel很注重加强自身主频的发展。像其他的处理器厂家,有人曾经拿过一快1G的全美达来做比较,它的运行效率相当于2G的Intel处理器。

所以,CPU的主频与CPU实际的运算能力是没有直接关系的,主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中,我们也可以看到这样的例子:1 GHz Itanium芯片能够表现得差不多跟2.66 GHz Xeon/Opteron一样快,或是1.5 GHz Itanium 2大约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水线的各方面的性能指标。

  当然,主频和实际的运算速度是有关的,只能说主频仅仅是CPU性能表现的一个方面,而不代表CPU的整体性能。

2.外频

  外频是CPU的基准频率,单位也是MHz。CPU的外频决定着整块主板的运行速度。说白了,在台式机中,我们所说的超频,都是超CPU的外频(当然一般情况下,CPU的倍频都是被锁住的)相信这点是很好理解的。但对于服务器CPU来讲,超频是绝对不允许的。前面说到CPU决定着主板的运行速度,两者是同步运行的,如果把服务器CPU超频了,改变了外频,会产生异步运行,(台式机很多主板都支持异步运行)这样会造成整个服务器系统的不稳定。

目前的绝大部分电脑系统中外频也是内存与主板之间的同步运行的速度,在这种方式下,可以理解为CPU的外频直接与内存相连通,实现两者间的同步运行状态。外频与前端总线(FSB)频率很容易被混为一谈,下面的前端总线介绍我们谈谈两者的区别。

3.前端总线(FSB)频率

  前端总线(FSB)频率(即总线频率)是直接影响CPU与内存直接数据交换速度。有一条公式可以计算,即数据带宽=(总线频率×数据带宽)/8,数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率。比方,现在的支持64位的至强Nocona,前端总线是800MHz,按照公式,它的数据传输最大带宽是{xxx}GB/秒。

外频与前端总线(FSB)频率的区别:前端总线的速度指的是数据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一千万次;而100MHz前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8Byte/bit=800MB/s。

其实现在“HyperTransport”构架的出现,让这种实际意义上的前端总线(FSB)频率发生了变化。之前我们知道IA-32架构必须有三大重要的构件:内存控制器Hub (MCH) ,I/O控制器Hub和PCI Hub,像Intel很典型的芯片组 Intel 7501、Intel7505芯片组,为双至强处理器量身定做的,它们所包含的MCH为CPU提供了频率为533MHz的前端总线,配合DDR内存,前端总线带宽可达到4.3GB/秒。但随着处理器性能不断提高同时给系统架构带来了很多问题。而“HyperTransport”构架不但解决了问题,而且更有效地提高了总线带宽,比方AMD Opteron处理器,灵活的HyperTransport I/O总线体系结构让它整合了内存控制器,使处理器不通过系统总线传给芯片组而直接和内存交换数据。这样的话,前端总线(FSB)频率在AMD Opteron处理器就不知道从何谈起了。

4、CPU的位和字长

  位:在数字电路和电脑技术中采用二进制,代码只有“0”和“1”,其中无论是 “0”或是“1”在CPU中都是 一“位”。

  字长:电脑技术中对CPU在单位时间内(同一时间)能一次处理的二进制数的位数叫字长。所以能处理字长为8位数据的CPU通常就叫8位的CPU。同理32位的CPU就能在单位时间内处理字长为32位的二进制数据。字节和字长的区别:由于常用的英文字符用8位二进制就可以表示,所以通常就将8位称为一个字节。字长的长度是不固定的,对于不同的CPU、字长的长度也不一样。8位的CPU一次只能处理一个字节,而32位的CPU一次就能处理4个字节,同理字长为64位的CPU一次可以处理8个字节。


5.倍频系数

  倍频系数是指CPU主频与外频之间的相对比例关系。在相同的外频下,倍频越高CPU的频率也越高。但实际上,在相同外频的前提下,高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据传输速度是有限的,一味追求高倍频而得到高主频的CPU就会出现明显的“瓶颈”效应—CPU从系统中得到数据的极限速度不能够满足CPU运算的速度。一般除了工程样版的Intel的CPU都是锁了倍频的,而AMD之前都没有锁。

6.缓存

  缓存大小也是CPU的重要指标之一,而且缓存的结构和大小对CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上寻找,以此提高系统性能。但是由于CPU芯片面积和成本的因素来考虑,缓存都很小。

L1 Cache(一级缓存)是CPU第一层高速缓存,分为数据缓存和指令缓存。内置的L1高速缓存的容量和结构对CPU的性能影响较大,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。一般服务器CPU的L1缓存的容量通常在32—256KB。

  L2 Cache(二级缓存)是CPU的第二层高速缓存,分内部和外部两种芯片。内部的芯片二级缓存运行速度与主频相同,而外部的二级缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能,原则是越大越好,现在家庭用CPU容量最大的是512KB,而服务器和工作站上用CPU的L2高速缓存更高达256-1MB,有的高达2MB或者3MB。

L3 Cache(三级缓存),分为两种,早期的是外置,现在的都是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升。比方具有较大L3缓存的配置利用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。

其实最早的L3缓存被应用在AMD发布的K6-III处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MB L3缓存的Itanium2处理器,和以后24MB L3缓存的双核心Itanium2处理器。

但基本上L3缓存对处理器的性能提高显得不是很重要,比方配备1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比缓存增加带来更有效的性能提升。

7.CPU扩展指令集

  CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运用看,如Intel的MMX(Multi Media Extended)、SSE、 SSE2(Streaming-Single instruction multiple data-Extensions 2)、SEE3和AMD的3DNow!等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能力。我们通常会把CPU的扩展指令集称为"CPU的指令集"。SSE3指令集也是目前规模最小的指令集,此前MMX包含有57条命令,SSE包含有50条命令,SSE2包含有144条命令,SSE3包含有13条命令。目前SSE3也是最先进的指令集,英特尔Prescott处理器已经支持SSE3指令集,AMD会在未来双核心处理器当中加入对SSE3指令集的支持,全美达的处理器也将支持这一指令集。

8.CPU内核和I/O工作电压

  从586CPU开始,CPU的工作电压分为内核电压和I/O电压两种,通常CPU的核心电压小于等于I/O电压。其中内核电压的大小是根据CPU的生产工艺而定,一般制作工艺越小,内核工作电压越低;I/O电压一般都在1.6~5V。低电压能解决耗电过大和发热过高的问题。

9.制造工艺

  制造工艺的微米是指IC内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的IC电路设计,意味着在同样大小面积的IC中,可以拥有密度更高、功能更复杂的电路设计。现在主要的180nm、130nm、90nm。最近官方已经表示有65nm的制造工艺了。

10.指令集

(1)CISC指令集

  CISC指令集,也称为复杂指令集,英文名是CISC,(Complex Instruction Set Computer的缩写)。在CISC微处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。其实它是英特尔生产的x86系列(也就是IA-32架构)CPU及其兼容CPU,如AMD、VIA的。即使是现在新起的X86-64(也被成AMD64)都是属于CISC的范畴。

要知道什么是指令集还要从当今的X86架构的CPU说起。X86指令集是Intel为其第一块16位CPU(i8086)专门开发的,IBM1981年推出的世界第一台PC机中的CPU—i8088(i8086简化版)使用的也是X86指令,同时电脑中为提高浮点数据处理能力而增加了X87芯片,以后就将X86指令集和X87指令集统称为X86指令集。


虽然随着CPU技术的不断发展,Intel陆续研制出更新型的i80386、i80486直到过去的PII至强、PIII至强、Pentium 3,最后到今天的Pentium 4系列、至强(不包括至强Nocona),但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以Intel公司所生产的所有CPU仍然继续使用X86指令集,所以它的CPU仍属于X86系列。由于Intel X86系列及其兼容CPU(如AMD Athlon MP、)都使用X86指令集,所以就形成了今天庞大的X86系列及兼容CPU阵容。x86CPU目前主要有intel的服务器CPU和AMD的服务器CPU两类。

(2)RISC指令集

  RISC是英文“Reduced Instruction Set Computing ” 的缩写,中文意思是“精简指令集”。它是在CISC指令系统基础上发展起来的,有人对CISC机进行测试表明,各种指令的使用频度相当悬殊,最常使用的是一些比较简单的指令,它们仅占指令总数的20%,但在程序中出现的频度却占80%。复杂的指令系统必然增加微处理器的复杂性,使处理器的研制时间长,成本高。并且复杂指令需要复杂的操作,必然会降低计算机的速度。基于上述原因,20世纪80年代RISC型CPU诞生了,相对于CISC型CPU ,RISC型CPU不仅精简了指令系统,还采用了一种叫做“超标量和超流水线结构”,大大增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它与传统的CISC(复杂指令集)相对。相比而言,RISC的指令格式统一,种类比较少,寻址方式也比复杂指令集少。当然处理速度就提高很多了。目前在中高档服务器中普遍采用这一指令系统的CPU,特别是高档服务器全都采用RISC指令系统的CPU。RISC指令系统更加适合高档服务器的操作系统UNIX,现在Linux也属于类似UNIX的操作系统。RISC型CPU与Intel和AMD的CPU在软件和硬件上都不兼容。

目前,在中高档服务器中采用RISC指令的CPU主要有以下几类:PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、Alpha处理器。

(3)IA-64

EPIC(Explicitly Parallel Instruction Computers,精确并行指令计算机)是否是RISC和CISC体系的继承者的争论已经有很多,单以EPIC体系来说,它更像Intel的处理器迈向RISC体系的重要步骤。从理论上说,EPIC体系设计的CPU,在相同的主机配置下,处理Windows的应用软件比基于Unix下的应用软件要好得多。

Intel采用EPIC技术的服务器CPU是安腾Itanium(开发代号即Merced)。它是64位处理器,也是IA-64系列中的第一款。微软也已开发了代号为Win64的操作系统,在软件上加以支持。在Intel采用了X86指令集之后,它又转而寻求更先进的64-bit微处理器,Intel这样做的原因是,它们想摆脱容量巨大的x86架构,从而引入精力充沛而又功能强大的指令集,于是采用EPIC指令集的IA-64架构便诞生了。IA-64 在很多方面来说,都比x86有了长足的进步。突破了传统IA32架构的许多限制,在数据的处理能力,系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。

IA-64微处理器最大的缺陷是它们缺乏与x86的兼容,而Intel为了IA-64处理器能够更好地运行两个朝代的软件,它在IA-64处理器上(Itanium、Itanium2 ……)引入了x86-to-IA-64的解码器,这样就能够把x86指令翻译为IA-64指令。这个解码器并不是最有效率的解码器,也不是运行x86代码的最好途径(最好的途径是直接在x86处理器上运行x86代码),因此Itanium 和Itanium2在运行x86应用程序时候的性能非常糟糕。这也成为X86-64产生的根本原因。

(4)X86-64 (AMD64 / EM64T)

AMD公司设计,可以在同一时间内处理64位的整数运算,并兼容于X86-32架构。其中支持64位逻辑定址,同时提供转换为32位定址选项;但数据操作指令默认为32位和8位,提供转换成64位和16位的选项;支持常规用途寄存器,如果是32位运算操作,就要将结果扩展成完整的64位。这样,指令中有“直接执行”和“转换执行”的区别,其指令字段是8位或32位,可以避免字段过长。

x86-64(也叫AMD64)的产生也并非空穴来风,x86处理器的32bit寻址空间限制在4GB内存,而IA-64的处理器又不能兼容x86。AMD充分考虑顾客的需求,加强x86指令集的功能,使这套指令集可同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64。在技术上AMD在x86-64架构中为了进行64位运算,AMD为其引入了新增了R8-R15通用寄存器作为原有X86处理器寄存器的扩充,但在而在32位环境下并不完全使用到这些寄存器。原来的寄存器诸如EAX、EBX也由32位扩张至64位。在SSE单元中新加入了8个新寄存器以提供对SSE2的支持。寄存器数量的增加将带来性能的提升。与此同时,为了同时支持32和64位代码及寄存器,x86-64架构允许处理器工作在以下两种模式:Long Mode(长模式)和Legacy Mode(遗传模式),Long模式又分为两种子模式(64bit模式和Compatibility mode兼容模式)。该标准已经被引进在AMD服务器处理器中的Opteron处理器。

而今年也推出了支持64位的EM64T技术,再还没被正式命为EM64T之前是IA32E,这是英特尔64位扩展技术的名字,用来区别X86指令集。Intel的EM64T支持64位sub-mode,和AMD的X86-64技术类似,采用64位的线性平面寻址,加入8个新的通用寄存器(GPRs),还增加8个寄存器支持SSE指令。与AMD相类似,Intel的64位技术将兼容IA32和IA32E,只有在运行64位操作系统下的时候,才将会采用IA32E。IA32E将由2个sub-mode组成:64位sub-mode和32位sub-mode,同AMD64一样是向下兼容的。Intel的EM64T将完全兼容AMD的X86-64技术。现在Nocona处理器已经加入了一些64位技术,Intel的Pentium 4E处理器也支持64位技术。

应该说,这两者都是兼容x86指令集的64位微处理器架构,但EM64T与AMD64还是有一些不一样的地方,AMD64处理器中的NX位在Intel的处理器中将没有提供。

11.超流水线与超标量

  在解释超流水线与超标量前,先了解流水线(pipeline)。流水线是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5—6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5—6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高CPU的运算速度。经典奔腾每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为八级流水。

超标量是通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。而超流水线是通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个操作,其实质是以时间换取空间。例如Pentium 4的流水线就长达20级。将流水线设计的步(级)越长,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。但是流水线过长也带来了一定副作用,很可能会出现主频较高的CPU实际运算速度较低的现象,Intel的奔腾4就出现了这种情况,虽然它的主频可以高达1.4G以上,但其运算性能却远远比不上AMD 1.2G的速龙甚至奔腾III。


12.封装形式

  CPU封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计,从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装,而采用Slot x槽安装的CPU则全部采用SEC(单边接插盒)的形式封装。现在还有PLGA(Plastic Land Grid Array)、OLGA(Organic Land Grid Array)等封装技术。由于市场竞争日益激烈,目前CPU封装技术的发展方向以节约成本为主。


13、多线程

同时多线程Simultaneous multithreading,简称SMT。SMT可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓和由于数据相关或Cache未命中带来的访问内存延时。当没有多个线程可用时,SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本就可以显著地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。Intel从3.06GHz Pentium 4开始,所有处理器都将支持SMT技术。

14、多核心

多核心,也指单芯片多处理器(Chip multiprocessors,简称CMP)。CMP是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。与CMP比较, SMT处理器结构的灵活性比较突出。但是,当半导体工艺进入0.18微米以后,线延时已经超过了门延迟,要求微处理器的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于CMP结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。目前,IBM 的Power 4芯片和Sun的 MAJC5200芯片都采用了CMP结构。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。

2005年下半年,Intel和AMD的新型处理器也将融入CMP结构。新安腾处理器开发代码为Montecito,采用双核心设计,拥有最少18MB片内缓存,采取90nm工艺制造,它的设计绝对称得上是对当今芯片业的挑战。它的每个单独的核心都拥有独立的L1,L2和L3 cache,包含大约10亿支晶体管。

15、SMP

SMP(Symmetric Multi-Processing),对称多处理结构的简称,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。像双至强,也就是我们所说的二路,这是在对称处理器系统中最常见的一种(至强MP可以支持到四路,AMD Opteron可以支持1-8路)。也有少数是16路的。但是一般来讲,SMP结构的机器可扩展性较差,很难做到100个以上多处理器,常规的一般是8个到16个,不过这对于多数的用户来说已经够用了。在高性能服务器和工作站级主板架构中最为常见,像UNIX服务器可支持最多256个CPU的系统。

构建一套SMP系统的必要条件是:支持SMP的硬件包括主板和CPU;支持SMP的系统平台,再就是支持SMP的应用软件。

为了能够使得SMP系统发挥高效的性能,操作系统必须支持SMP系统,如WINNT、LINUX、以及UNIX等等32位操作系统。即能够进行多任务和多线程处理。多任务是指操作系统能够在同一时间让不同的CPU完成不同的任务;多线程是指操作系统能够使得不同的CPU并行的完成同一个任务。

要组建SMP系统,对所选的CPU有很高的要求,首先、CPU内部必须内置APIC(Advanced Programmable Interrupt Controllers)单元。Intel 多处理规范的核心就是高级可编程中断控制器(Advanced Programmable Interrupt Controllers--APICs)的使用;再次,相同的产品型号,同样类型的CPU核心,完全相同的运行频率;最后,尽可能保持相同的产品序列编号,因为两个生产批次的CPU作为双处理器运行的时候,有可能会发生一颗CPU负担过高,而另一颗负担很少的情况,无法发挥最大性能,更糟糕的是可能导致死机。

16、NUMA技术

NUMA即非一致访问分布共享存储技术,它是由若干通过高速专用网络连接起来的独立节点构成的系统,各个节点可以是单个的CPU或是SMP系统。在NUMA中,Cache 的一致性有多种解决方案,需要操作系统和特殊软件的支持。图2中是Sequent公司NUMA系统的例子。这里有3个SMP模块用高速专用网络联起来,组成一个节点,每个节点可以有12个CPU。像Sequent的系统最多可以达到64个CPU甚至256个CPU。显然,这是在SMP的基础上,再用NUMA的技术加以扩展,是这两种技术的结合。


17、乱序执行技术

乱序执行(out-of-orderexecution),是指CPU允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。这样将根据个电路单元的状态和各指令能否提前执行的具体情况分析后,将能提前执行的指令立即发送给相应电路单元执行,在这期间不按规定顺序执行指令,然后由重新排列单元将各执行单元结果按指令顺序重新排列。采用乱序执行技术的目的是为了使CPU内部电路满负荷运转并相应提高了CPU的运行程序的速度。分枝技术:(branch)指令进行运算时需要等待结果,一般无条件分枝只需要按指令顺序执行,而条件分枝必须根据处理后的结果,再决定是否按原先顺序进行。

18、CPU内部的内存控制器

许多应用程序拥有更为复杂的读取模式(几乎是随机地,特别是当cache hit不可预测的时候),并且没有有效地利用带宽。典型的这类应用程序就是业务处理软件,即使拥有如乱序执行(out of order execution)这样的CPU特性,也会受内存延迟的限制。这样CPU必须得等到运算所需数据被除数装载完成才能执行指令(无论这些数据来自CPU cache还是主内存系统)。当前低段系统的内存延迟大约是120-150ns,而CPU速度则达到了3GHz以上,一次单独的内存请求可能会浪费200-300次CPU循环。即使在缓存命中率(cache hit rate)达到99%的情况下,CPU也可能会花50%的时间来等待内存请求的结束- 比如因为内存延迟的缘故。

你可以看到Opteron整合的内存控制器,它的延迟,与芯片组支持双通道DDR内存控制器的延迟相比来说,是要低很多的。英特尔也按照计划的那样在处理器内部整合内存控制器,这样导致北桥芯片将变得不那么重要。但改变了处理器访问主存的方式,有助于提高带宽、降低内存延时和提升处理器性能。

TOP

CPU最基础知识 CPU是Central Processing Unit的缩写,即中央处理器。CPU发展至今,其中所集成的电子元件也越来越多,上万个晶体管构成了CPU的内部结构。那么这上百万个晶体管是如何工作的呢?看上去似乎很深奥,但归纳起来,CPU的内部结构可分为控制单元,逻辑单元和存储单元三大部分。CPU的工作原理就象一个工厂对产品的加工过程:进入工厂的原料(指令),经过物资分配部门(控制单元)的调度分配,被送往生产线(逻辑运算单元),生产出成品(处理后的数据)后,再存储在仓库(存储器)中,最后等着拿到市场上去卖(交由应用程序使用)。 CPU是整个微机系统的核心,它往往是各种档次微机的代名词,CPU的性能大致上反映出微机的性能,因此它的性能指标十分重要。CPU主要的性能指标有:     1.主频,倍频,外频:主频是CPU的时钟频率(CPU Clock Speed)即系统总线的工作频率。一般说来,主频越高,CPU的速度越快。由于内部结构不同,并非所有的时钟频率相同的CPU的性能都一样。外频即系统总线的工作频率;倍频则是指CPU外频与主频相差的倍数。三者关系是:主频=外频x倍频。     2.内存总线速度(Memory-Bus Speed): 指CPU与二级(L2)高速缓存和内存之间的通信速度。     3.扩展总线速度(Expansion-Bus Speed): 指安装在微机系统上的局部总线如VESA或PCI总线接口卡的工作速度。     4.工作电压(Supply Voltage): 指CPU正常工作所需的电压。早期CPU的工作电压一般为5V,随着CPU主频的提高,CPU工作电压有逐步下降的趋势,以解决发热过高的问题。     5.地址总线宽度:地址总线宽度决定了CPU可以访问的物理地址空间,对于486以上的微机系统,地址线的宽度为32位,最多可以直接访问4096 MB的物理空间。    6.数据总线宽度:数据总线宽度决定了CPU与二级高速缓存、内存以及输入/输出设备之间一次数据传输的信息量。    7.内置协处理器:含有内置协处理器的CPU,可以加快特定类型的数值计算,某些需要进行复杂计算的软件系统,如高版本的AUTO CAD就需要协处理器支持。     8.超标量:是指在一个时钟周期内CPU可以执行一条以上的指令。Pentium级以上CPU均具有超标量结构;而486以下的CPU属于低标量结构,即在这类CPU内执行一条指令至少需要一个或一个以上的时钟周期。     9.L1高速缓存即一级高速缓存:内置高速缓存可以提高CPU的运行效率,这也正是486DLC比386DX-40快的原因。内置的L1高速缓存的容量和结构对CPU的性能影响较大,这也正是一些公司力争加大L1级高速缓冲存储器容量的原因。不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。     10.采用回写(Write Back)结构的高速缓存:它对读和写操作均有效,速度较快。而采用写通(Write-through)结构的高速缓存,仅对读操作有效。

TOP

CPU的专业知识 1.主频 主频也叫时钟频率,单位是MHz,用来表示CPU的运算速度。CPU的主频=外频×倍频系数。很多人认为主频就决定着CPU的运行速度,这不仅是个片面的,而且对于服务器来讲,这个认识也出现了偏差。至今,没有一条确定的公式能够实现主频和实际的运算速度两者之间的数值关系,即使是两大处理器厂家Intel和AMD,在这点上也存在着很大的争议,我们从Intel的产品的发展趋势,可以看出Intel很注重加强自身主频的发展。像其他的处理器厂家,有人曾经拿过一快1G的全美达来做比较,它的运行效率相当于2G的Intel处理器。 所以,CPU的主频与CPU实际的运算能力是没有直接关系的,主频表示在CPU内数字脉冲信号震荡的速度。在Intel的处理器产品中,我们也可以看到这样的例子:1 GHz Itanium芯片能够表现得差不多跟2.66 GHz Xeon/Opteron一样快,或是1.5 GHz Itanium 2大约跟4 GHz Xeon/Opteron一样快。CPU的运算速度还要看CPU的流水线的各方面的性能指标。 当然,主频和实际的运算速度是有关的,只能说主频仅仅是CPU性能表现的一个方面,而不代表CPU的整体性能。 2.外频 外频是CPU的基准频率,单位也是MHz。CPU的外频决定着整块主板的运行速度。说白了,在台式机中,我们所说的超频,都是超CPU的外频(当然一般情况下,CPU的倍频都是被锁住的)相信这点是很好理解的。但对于服务器CPU来讲,超频是绝对不允许的。前面说到CPU决定着主板的运行速度,两者是同步运行的,如果把服务器CPU超频了,改变了外频,会产生异步运行,(台式机很多主板都支持异步运行)这样会造成整个服务器系统的不稳定。 目前的绝大部分电脑系统中外频也是内存与主板之间的同步运行的速度,在这种方式下,可以理解为CPU的外频直接与内存相连通,实现两者间的同步运行状态。外频与前端总线(FSB)频率很容易被混为一谈,下面的前端总线介绍我们谈谈两者的区别。 3.前端总线(FSB)频率 前端总线(FSB)频率(即总线频率)是直接影响CPU与内存直接数据交换速度。有一条公式可以计算,即数据带宽=(总线频率×数据带宽)/8,数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率。比方,现在的支持64位的至强Nocona,前端总线是800MHz,按照公式,它的数据传输最大带宽是{xxx}GB/秒。 外频与前端总线(FSB)频率的区别:前端总线的速度指的是数据传输的速度,外频是CPU与主板之间同步运行的速度。也就是说,100MHz外频特指数字脉冲信号在每秒钟震荡一千万次;而100MHz前端总线指的是每秒钟CPU可接受的数据传输量是100MHz×64bit÷8Byte/bit=800MB/s。 其实现在“HyperTransport”构架的出现,让这种实际意义上的前端总线(FSB)频率发生了变化。之前我们知道IA-32架构必须有三大重要的构件:内存控制器Hub (MCH) ,I/O控制器Hub和PCI Hub,像Intel很典型的芯片组 Intel 7501、Intel7505芯片组,为双至强处理器量身定做的,它们所包含的MCH为CPU提供了频率为533MHz的前端总线,配合DDR内存,前端总线带宽可达到4.3GB/秒。但随着处理器性能不断提高同时给系统架构带来了很多问题。而“HyperTransport”构架不但解决了问题,而且更有效地提高了总线带宽,比方AMD Opteron处理器,灵活的HyperTransport I/O总线体系结构让它整合了内存控制器,使处理器不通过系统总线传给芯片组而直接和内存交换数据。这样的话,前端总线(FSB)频率在AMD Opteron处理器就不知道从何谈起了。 4、CPU的位和字长 位:在数字电路和电脑技术中采用二进制,代码只有“0”和“1”,其中无论是 “0”或是“1”在CPU中都是 一“位”。 字长:电脑技术中对CPU在单位时间内(同一时间)能一次处理的二进制数的位数叫字长。所以能处理字长为8位数据的CPU通常就叫8位的CPU。同理32位的CPU就能在单位时间内处理字长为32位的二进制数据。字节和字长的区别:由于常用的英文字符用8位二进制就可以表示,所以通常就将8位称为一个字节。字长的长度是不固定的,对于不同的CPU、字长的长度也不一样。8位的CPU一次只能处理一个字节,而32位的CPU一次就能处理4个字节,同理字长为64位的CPU一次可以处理8个字节。 5.倍频系数 倍频系数是指CPU主频与外频之间的相对比例关系。在相同的外频下,倍频越高CPU的频率也越高。但实际上,在相同外频的前提下,高倍频的CPU本身意义并不大。这是因为CPU与系统之间数据传输速度是有限的,一味追求高倍频而得到高主频的CPU就会出现明显的“瓶颈”效应—CPU从系统中得到数据的极限速度不能够满足CPU运算的速度。一般除了工程样版的Intel的CPU都是锁了倍频的,而AMD之前都没有锁。 6.缓存 缓存大小也是CPU的重要指标之一,而且缓存的结构和大小对CPU速度的影响非常大,CPU内缓存的运行频率极高,一般是和处理器同频运作,工作效率远远大于系统内存和硬盘。实际工作时,CPU往往需要重复读取同样的数据块,而缓存容量的增大,可以大幅度提升CPU内部读取数据的命中率,而不用再到内存或者硬盘上寻找,以此提高系统性能。但是由于CPU芯片面积和成本的因素来考虑,缓存都很小。 L1 Cache(一级缓存)是CPU第一层高速缓存,分为数据缓存和指令缓存。内置的L1高速缓存的容量和结构对CPU的性能影响较大,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。一般服务器CPU的L1缓存的容量通常在32—256KB。 L2 Cache(二级缓存)是CPU的第二层高速缓存,分内部和外部两种芯片。内部的芯片二级缓存运行速度与主频相同,而外部的二级缓存则只有主频的一半。L2高速缓存容量也会影响CPU的性能,原则是越大越好,现在家庭用CPU容量最大的是512KB,而服务器和工作站上用CPU的L2高速缓存更高达256-1MB,有的高达2MB或者3MB。 L3 Cache(三级缓存),分为两种,早期的是外置,现在的都是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升。比方具有较大L3缓存的配置利用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。 其实最早的L3缓存被应用在AMD发布的K6-III处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MB L3缓存的Itanium2处理器,和以后24MB L3缓存的双核心Itanium2处理器。 但基本上L3缓存对处理器的性能提高显得不是很重要,比方配备1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比缓存增加带来更有效的性能提升。 7.CPU扩展指令集 CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运用看,如Intel的MMX(Multi Media Extended)、SSE、 SSE2(Streaming-Single instruction multiple data-Extensions 2)、SEE3和AMD的3DNow!等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能力。我们通常会把CPU的扩展指令集称为"CPU的指令集"。SSE3指令集也是目前规模最小的指令集,此前MMX包含有57条命令,SSE包含有50条命令,SSE2包含有144条命令,SSE3包含有13条命令。目前SSE3也是最先进的指令集,英特尔Prescott处理器已经支持SSE3指令集,AMD会在未来双核心处理器当中加入对SSE3指令集的支持,全美达的处理器也将支持这一指令集。 8.CPU内核和I/O工作电压 从586CPU开始,CPU的工作电压分为内核电压和I/O电压两种,通常CPU的核心电压小于等于I/O电压。其中内核电压的大小是根据CPU的生产工艺而定,一般制作工艺越小,内核工作电压越低;I/O电压一般都在1.6~5V。低电压能解决耗电过大和发热过高的问题。 9.制造工艺 制造工艺的微米是指IC内电路与电路之间的距离。制造工艺的趋势是向密集度愈高的方向发展。密度愈高的IC电路设计,意味着在同样大小面积的IC中,可以拥有密度更高、功能更复杂的电路设计。现在主要的180nm、130nm、90nm。最近官方已经表示有65nm的制造工艺了。 10.指令集 (1)CISC指令集 CISC指令集,也称为复杂指令集,英文名是CISC,(Complex Instruction Set Computer的缩写)。在CISC微处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个操作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。其实它是英特尔生产的x86系列(也就是IA-32架构)CPU及其兼容CPU,如AMD、VIA的。即使是现在新起的X86-64(也被成AMD64)都是属于CISC的范畴。 要知道什么是指令集还要从当今的X86架构的CPU说起。X86指令集是Intel为其第一块16位CPU(i8086)专门开发的,IBM1981年推出的世界第一台PC机中的CPU—i8088(i8086简化版)使用的也是X86指令,同时电脑中为提高浮点数据处理能力而增加了X87芯片,以后就将X86指令集和X87指令集统称为X86指令集。 虽然随着CPU技术的不断发展,Intel陆续研制出更新型的i80386、i80486直到过去的PII至强、PIII至强、Pentium 3,最后到今天的Pentium 4系列、至强(不包括至强Nocona),但为了保证电脑能继续运行以往开发的各类应用程序以保护和继承丰富的软件资源,所以Intel公司所生产的所有CPU仍然继续使用X86指令集,所以它的CPU仍属于X86系列。由于Intel X86系列及其兼容CPU(如AMD Athlon MP、)都使用X86指令集,所以就形成了今天庞大的X86系列及兼容CPU阵容。x86CPU目前主要有intel的服务器CPU和AMD的服务器CPU两类。 (2)RISC指令集 RISC是英文“Reduced Instruction Set Computing ” 的缩写,中文意思是“精简指令集”。它是在CISC指令系统基础上发展起来的,有人对CISC机进行测试表明,各种指令的使用频度相当悬殊,最常使用的是一些比较简单的指令,它们仅占指令总数的20%,但在程序中出现的频度却占80%。复杂的指令系统必然增加微处理器的复杂性,使处理器的研制时间长,成本高。并且复杂指令需要复杂的操作,必然会降低计算机的速度。基于上述原因,20世纪80年代RISC型CPU诞生了,相对于CISC型CPU ,RISC型CPU不仅精简了指令系统,还采用了一种叫做“超标量和超流水线结构”,大大增加了并行处理能力。RISC指令集是高性能CPU的发展方向。它与传统的CISC(复杂指令集)相对。相比而言,RISC的指令格式统一,种类比较少,寻址方式也比复杂指令集少。当然处理速度就提高很多了。目前在中高档服务器中普遍采用这一指令系统的CPU,特别是高档服务器全都采用RISC指令系统的CPU。RISC指令系统更加适合高档服务器的操作系统UNIX,现在Linux也属于类似UNIX的操作系统。RISC型CPU与Intel和AMD的CPU在软件和硬件上都不兼容。 目前,在中高档服务器中采用RISC指令的CPU主要有以下几类:PowerPC处理器、SPARC处理器、PA-RISC处理器、MIPS处理器、Alpha处理器。 (3)IA-64 EPIC(Explicitly Parallel Instruction Computers,精确并行指令计算机)是否是RISC和CISC体系的继承者的争论已经有很多,单以EPIC体系来说,它更像Intel的处理器迈向RISC体系的重要步骤。从理论上说,EPIC体系设计的CPU,在相同的主机配置下,处理Windows的应用软件比基于Unix下的应用软件要好得多。 Intel采用EPIC技术的服务器CPU是安腾Itanium(开发代号即Merced)。它是64位处理器,也是IA-64系列中的第一款。微软也已开发了代号为Win64的操作系统,在软件上加以支持。在Intel采用了X86指令集之后,它又转而寻求更先进的64-bit微处理器,Intel这样做的原因是,它们想摆脱容量巨大的x86架构,从而引入精力充沛而又功能强大的指令集,于是采用EPIC指令集的IA-64架构便诞生了。IA-64 在很多方面来说,都比x86有了长足的进步。突破了传统IA32架构的许多限制,在数据的处理能力,系统的稳定性、安全性、可用性、可观理性等方面获得了突破性的提高。 IA-64微处理器最大的缺陷是它们缺乏与x86的兼容,而Intel为了IA-64处理器能够更好地运行两个朝代的软件,它在IA-64处理器上(Itanium、Itanium2 ……)引入了x86-to-IA-64的解码器,这样就能够把x86指令翻译为IA-64指令。这个解码器并不是最有效率的解码器,也不是运行x86代码的最好途径(最好的途径是直接在x86处理器上运行x86代码),因此Itanium 和Itanium2在运行x86应用程序时候的性能非常糟糕。这也成为X86-64产生的根本原因。 (4)X86-64 (AMD64 / EM64T) AMD公司设计,可以在同一时间内处理64位的整数运算,并兼容于X86-32架构。其中支持64位逻辑定址,同时提供转换为32位定址选项;但数据操作指令默认为32位和8位,提供转换成64位和16位的选项;支持常规用途寄存器,如果是32位运算操作,就要将结果扩展成完整的64位。这样,指令中有“直接执行”和“转换执行”的区别,其指令字段是8位或32位,可以避免字段过长。 x86-64(也叫AMD64)的产生也并非空穴来风,x86处理器的32bit寻址空间限制在4GB内存,而IA-64的处理器又不能兼容x86。AMD充分考虑顾客的需求,加强x86指令集的功能,使这套指令集可同时支持64位的运算模式,因此AMD把它们的结构称之为x86-64。在技术上AMD在x86-64架构中为了进行64位运算,AMD为其引入了新增了R8-R15通用寄存器作为原有X86处理器寄存器的扩充,但在而在32位环境下并不完全使用到这些寄存器。原来的寄存器诸如EAX、EBX也由32位扩张至64位。在SSE单元中新加入了8个新寄存器以提供对SSE2的支持。寄存器数量的增加将带来性能的提升。与此同时,为了同时支持32和64位代码及寄存器,x86-64架构允许处理器工作在以下两种模式:Long Mode(长模式)和Legacy Mode(遗传模式),Long模式又分为两种子模式(64bit模式和Compatibility mode兼容模式)。该标准已经被引进在AMD服务器处理器中的Opteron处理器。 而今年也推出了支持64位的EM64T技术,再还没被正式命为EM64T之前是IA32E,这是英特尔64位扩展技术的名字,用来区别X86指令集。Intel的EM64T支持64位sub-mode,和AMD的X86-64技术类似,采用64位的线性平面寻址,加入8个新的通用寄存器(GPRs),还增加8个寄存器支持SSE指令。与AMD相类似,Intel的64位技术将兼容IA32和IA32E,只有在运行64位操作系统下的时候,才将会采用IA32E。IA32E将由2个sub-mode组成:64位sub-mode和32位sub-mode,同AMD64一样是向下兼容的。Intel的EM64T将完全兼容AMD的X86-64技术。现在Nocona处理器已经加入了一些64位技术,Intel的Pentium 4E处理器也支持64位技术。 应该说,这两者都是兼容x86指令集的64位微处理器架构,但EM64T与AMD64还是有一些不一样的地方,AMD64处理器中的NX位在Intel的处理器中将没有提供。 11.超流水线与超标量 在解释超流水线与超标量前,先了解流水线(pipeline)。流水线是Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5—6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5—6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高CPU的运算速度。经典奔腾每条整数流水线都分为四级流水,即指令预取、译码、执行、写回结果,浮点流水又分为八级流水。 超标量是通过内置多条流水线来同时执行多个处理器,其实质是以空间换取时间。而超流水线是通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个操作,其实质是以时间换取空间。例如Pentium 4的流水线就长达20级。将流水线设计的步(级)越长,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。但是流水线过长也带来了一定副作用,很可能会出现主频较高的CPU实际运算速度较低的现象,Intel的奔腾4就出现了这种情况,虽然它的主频可以高达1.4G以上,但其运算性能却远远比不上AMD 1.2G的速龙甚至奔腾III。 12.封装形式 CPU封装是采用特定的材料将CPU芯片或CPU模块固化在其中以防损坏的保护措施,一般必须在封装后CPU才能交付用户使用。CPU的封装方式取决于CPU安装形式和器件集成设计,从大的分类来看通常采用Socket插座进行安装的CPU使用PGA(栅格阵列)方式封装,而采用Slot x槽安装的CPU则全部采用SEC(单边接插盒)的形式封装。现在还有PLGA(Plastic Land Grid Array)、OLGA(Organic Land Grid Array)等封装技术。由于市场竞争日益激烈,目前CPU封装技术的发展方向以节约成本为主。 13、多线程 同时多线程Simultaneous multithreading,简称SMT。SMT可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓和由于数据相关或Cache未命中带来的访问内存延时。当没有多个线程可用时,SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本就可以显著地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。Intel从3.06GHz Pentium 4开始,所有处理器都将支持SMT技术。

TOP

CPU盒装和散装区别


一、散装与盒装的区别

从技术角度而言,散装和盒装CPU并没有本质的区别,至少在质量上不存在优劣的问题。对于CPU厂商而言,其产品按照供应方式可以分为两类,一类供应给品牌机厂商,另一类供应给零售市场。面向零售市场的产品大部分为盒装产品,而散装产品则部分来源于品牌机厂商外泄以及代理商的销售策略。从理论上说,盒装和散装产品在性能、稳定性以及可超频潜力方面不存在任何差距,但是质保存在一定差异。

一般而言,盒装CPU的保修期要长一些(通常为三年),而且附带有一只质量较好的散热风扇,因此往往受到广大消费者的喜爱。然而这并不意味着散装CPU就没有质保,只要选择信誉较好的代理商,一般都能得到为期一年的常规保修时间。事实上,CPU并不存在保修的概念,此时的保修等于是保换,因此不必担心散装的质保水准会有任何水分。

做工粗糙的假冒盒装CPU

二、CPU市场现状——探询真品盒装产品

然而事情并非如此简单。日益猖獗的奸商甚至已经不屑于费功费力地Remark了,而是干脆就直接给一些散装CPU用强力胶粘上一个风扇,还美名其曰“原装正品”,然后只需在风扇上标上更高频率的CPU频率即可,真是简单!消费者会拆开风扇看一下吗?当然不会!除非是你风扇坏了,而且也没有这一胆子,因为要想拆下这种粘贴的牢牢的风扇,CPU很可能失去保修资格,弄不好还会造成物理损伤。

为了掩人耳目,部分奸商还会利用其他客户留下的原装风扇与外包装,以此与其散装产品相配合,简直是“天衣无缝”。毫无疑问,如果厂商不采取一些必要的措施,那么普通消费者对此几乎是无能为力。

无论是Intel还是AMD的CPU,盒装产品的来路都令人十分担忧。以Intel CPU为例,市场上绝大部分盒装产品都是假冒的,甚至有统计说已经达到了75%以上。所谓的假冒盒装不外乎是两种情况:散装CPU和原装散热器封装在一起,或者直接使用伪劣的假冒散热器与CPU粘合。相对而言,后一种情况更为明显,因为现在市场上的盒装产品几乎见不到真正的原装散热器,其来路的确令人生疑。

假冒的散热器对CPU寿命有很大影响

至于AMD的CPU,由于一直主要面向DIY市场,因此盒装产品很少见。然而最近市场上也出现假冒的盒装产品,其价格比散装的产品略高,也只有一年的质保,只不过使用包装盒来混淆视听。此外也不排除部分商家将其当作真正盒装产品来买并虚假承诺三年质保的可能性。

相对而言,目前AMD的真品盒装更加容易识别,它在塑料外包装以及内部风扇上都贴有条形码,外包装的侧面还有一防伪激光标志。此外,由于大多数购买AMD CPU的用户并不十分在意盒装与否,因此相对Intel盒装产品,其对奸商的诱惑力较小。

三、实话实说——如何面对盒装与散装

1. Intel CPU

根据上面的分析,大家应该已经理解盒装产品与散装产品之间的区别,更何况如今盒装的Intel CPU猫腻很多,因此个人更加倾向于直接选择散装的产品。从用户角度而言,以盒装产品的价格购买散装产品是最为无法接受的。更为重要的是,假冒盒装产品往往采用只有20元不到的劣质风扇,此时对CPU的危害更大。

正品的盒装Intel CPU也只不过采用AVC或者Sanyo的散热器,而零售市场的不少散热器也拥有很不错的品质,无论是噪音控制还是散热效果都不会逊色。只要CPU做好散热工作,那么稳定运行更定毫无问题,而且以目前的制作工艺,一般CPU是很少损坏的,多出来的两年质保时间并没有太大的诱惑力。

当然,这仅仅是笔者个人的消费形态。部分追求安心的用户可能还是更加倾向于盒装CPU,那么就应当在选购时多加注意。真正的盒装P4由Intel负责三年的质保,而所谓的一年质保的盒装产品全是由散装产品仿冒的。略为有些遗憾的是,目前Intel的盒装CPU并没有像AMD那样采取十分有效的防假措施,我们只能通过自己的仔细观察去辨别。正规盒装产品外包装的上下两个塑料壳是通过穿孔热封的方式粘合起来的,打开时非常麻烦,而假货省略了这个步骤,直接用胶布、胶水或者用钉书机来固定。此外,拨打800电话然后对照风扇上的序列号也是检验方法之一,不过这也并非是万能的。

凡是包装盒上贴有这个标签的,必假无疑;真品不会玩这种“此地无银三百两”的游戏

2.AMD CPU

AMD的盒装CPU大多采用AVC风扇,而且提供三年质保。但是对于超频用户而言,一般并不推荐购买盒装产品。退一步来讲,即便是盒装CPU,如果在超频过程中导致CPU损坏,而且核心有烧毁痕迹,那么此时依旧得不到保修。在一般情况下,CPU的损坏不外乎核心过热,或者物理损伤,真正的内部故障非常罕见,因此综合性价比来看,散装产品无疑更胜一筹。以Athlon XP 2500+(Barton内核)为例,散装产品大约650元,而盒装产品高达730元左右。此外,盒装CPU所搭配的散热器一般是适合在不超频的状态下工作,而且以后很难更换风扇。如果用户需要超频的话,那么选购盒装产品或许并不是明智之举。

当然,选择盒装产品能够让人更加安心,比较不是每一个用户都会频繁地更换设备,此时盒装产品所提供的长时间质保以及稳定的散热器确实很具吸引力,而且可以免受“Remark打磨”甚至“修改金桥”的假冒产品侵扰。

四、总结

散装与盒装产品可谓各有千秋。套用一句俗话:即便是存在的就是合理的!但是不要忘记,选购盒装产品一定要建立在百分百真品的基础上,否则其危险系数比散装产品更大,因为看不到CPU表面,商家作假的机会很多,而且劣质风扇也是一大隐患。至于散装CPU,选购时也应该确保能够得到一年质保,而不要选购无法提供质保的水货,毕竟散装不等于没有质保!

TOP

CPU术语解释

从上个世纪到现在,我一直写了多篇关于新千年CPU的文章,限于文章的篇幅问题,我没有对那些专业的术语进行解释,可能导致阅读时出现“知其然,不知其所以然”的情况,下文专门用来补充以往的不足,这些术语按0~9和A~Z的方式来排序。
3DNow!(3D no waiting)
AMD公司开发的SIMD指令集,可以增强浮点和多媒体运算的速度,它的指令数为21条。

ALU(Arithmetic Logic Unit,算术逻辑单元)
在处理器之中用于计算的那一部分,与其同级的有数据传输单元和分支单元。

BGA(Ball Grid Array,球状矩阵排列)
一种芯片封装形式,例:82443BX。

BHT(branch prediction table,分支预测表)
处理器用于决定分支行动方向的数值表。

BPU(Branch Processing Unit,分支处理单元)
CPU中用来做分支处理的那一个区域。

Brach Pediction(分支预测)
从P5时代开始的一种先进的数据处理方法,由CPU来判断程序分支的进行方向,能够更快运算速度。

CMOS(Complementary Metal Oxide Semiconductor,互补金属氧化物半导体)
它是一类特殊的芯片,最常见的用途是主板的BIOS(Basic Input/Output System,基本输入/输出系统)。

CISC(Complex Instruction Set Computing,复杂指令集计算机)
相对于RISC而言,它的指令位数较长,所以称为复杂指令。如:x86指令长度为87位。

COB(Cache on board,板上集成缓存)
在处理器卡上集成的缓存,通常指的是二级缓存,例:奔腾II

COD(Cache on Die,芯片内集成缓存)
在处理器芯片内部集成的缓存,通常指的是二级缓存,例:PGA赛扬370

CPGA(Ceramic Pin Grid Array,陶瓷针型栅格阵列)
一种芯片封装形式。

CPU(Center Processing Unit,中央处理器)
计算机系统的大脑,用于控制和管理整个机器的运作,并执行计算任务。

Data Forwarding(数据前送)
CPU在一个时钟周期内,把一个单元的输出值内容拷贝到另一个单元的输入值中。

Decode(指令解码)
由于X86指令的长度不一致,必须用一个单元进行“翻译”,真正的内核按翻译后要求来工作。

EC(Embedded Controller,嵌入式控制器)
在一组特定系统中,新增到固定位置,完成一定任务的控制装置就称为嵌入式控制器。

Embedded Chips(嵌入式)
一种特殊用途的CPU,通常放在非计算机系统,如:家用电器。

EPIC(explicitly parallel instruction code,并行指令代码)
英特尔的64位芯片架构,本身不能执行x86指令,但能通过译码器来兼容旧有的x86指令,只是运算速度比真正的32位芯片有所下降。

FADD(Floationg Point Addition,浮点加)

FCPGA(Flip Chip Pin Grid Array,反转芯片针脚栅格阵列)
一种芯片封装形式,例:奔腾III 370。

FDIV(Floationg Point Divide,浮点除)

FEMMS(Fast Entry/Exit Multimedia State,快速进入/退出多媒体状态)
在多能奔腾之中,MMX和浮点单元是不能同时运行的。新的芯片加快了两者之间的切换,这就是FEMMS。

FFT(fast Fourier transform,快速热欧姆转换)
一种复杂的算法,可以测试CPU的浮点能力。

FID(FID:Frequency identify,频率鉴别号码)
奔腾III通过ID号来检查CPU频率的方法,能够有效防止Remark。

FIFO(First Input First Output,先入先出队列)
这是一种传统的按序执行方法,先进入的指令先完成并引退,跟着才执行第二条指令。

FLOP(Floating Point Operations Per Second,浮点操作/秒)
计算CPU浮点能力的一个单位。

FMUL(Floationg Point Multiplication,浮点乘)

FPU(Float Point Unit,浮点运算单元)
FPU是专用于浮点运算的处理器,以前的FPU是一种单独芯片,在486之后,英特尔把FPU与集成在CPU之内。

FSUB(Floationg Point Subtraction,浮点减)

HL-PBGA(表面黏著、高耐热、轻薄型塑胶球状矩阵封装)
一种芯片封装形式。

IA(Intel Architecture,英特尔架构)
英特尔公司开发的x86芯片结构。

ID(identify,鉴别号码)
用于判断不同芯片的识别代码。

IMM(Intel Mobile Module, 英特尔移动模块)
英特尔开发用于笔记本电脑的处理器模块,集成了CPU和其它控制设备。

Instructions Cache(指令缓存)
由于系统主内存的速度较慢,当CPU读取指令的时候,会导致CPU停下来等待内存传输的情况。指令缓存就是在主内存与CPU之间增加一个快速的存储区域,即使CPU未要求到指令,主内存也会自动把指令预先送到指令缓存,当CPU要求到指令时,可以直接从指令缓存中读出,无须再存取主内存,减少了CPU的等待时间。

Instruction Coloring(指令分类)
一种制造预测执行指令的技术,一旦预测判断被相应的指令决定以后,处理器就会相同的指令处理同类的判断。

Instruction Issue(指令发送)
它是第一个CPU管道,用于接收内存送到的指令,并把它发到执行单元。

IPC(Instructions Per Clock Cycle,指令/时钟周期)
表示在一个时钟周期用可以完成的指令数目。

KNI(Katmai New Instructions,Katmai新指令集,即SSE)

Latency(潜伏期)
从字面上了解其含义是比较困难的,实际上,它表示完全执行一个指令所需的时钟周期,潜伏期越少越好。严格来说,潜伏期包括一个指令从接收到发送的全过程。现今的大多数x86指令都需要约5个时钟周期,但这些周期之中有部分是与其它指令交迭在一起的(并行处理),因此CPU制造商宣传的潜伏期要比实际的时间长。

LDT(Lightning Data Transport,闪电数据传输总线)
K8采用的新型数据总线,外频在200MHz以上。

MMX(MultiMedia Extensions,多媒体扩展指令集)
英特尔开发的最早期SIMD指令集,可以增强浮点和多媒体运算的速度。

MFLOPS(Million Floationg Point/Second,每秒百万个浮点操作)
计算CPU浮点能力的一个单位,以百万条指令为基准。

NI(Non-Intel,非英特尔架构)
除了英特尔之外,还有许多其它生产兼容x86体系的厂商,由于专利权的问题,它们的产品和英特尔系不一样,但仍然能运行x86指令。

OLGA(Organic Land Grid Array,基板栅格阵列)
一种芯片封装形式。

OoO(Out of Order,乱序执行)
Post-RISC芯片的特性之一,能够不按照程序提供的顺序完成计算任务,是一种加快处理器运算速度的架构。

PGA(Pin-Grid Array,引脚网格阵列)
一种芯片封装形式,缺点是耗电量大。

Post-RISC
一种新型的处理器架构,它的内核是RISC,而外围是CISC,结合了两种架构的优点,拥有预测执行、处理器重命名等先进特性,如:Athlon。

PSN(Processor Serial numbers,处理器序列号)
标识处理器特性的一组号码,包括主频、生产日期、生产编号等。

PIB(Processor In a Box,盒装