03
2005
09

让你了解双核心处理器技术

一:双核心 —— 处理器的必由之路

  自戈登·摩尔在1965年提出每隔18~24个月单位面积的晶体管数量倍增的摩尔定律之后,每一次的处理器研发,都凭借着每两~三年一次的制程提升,得以在一定的晶圆面积下,用更多的晶体管来设计新一代的核心架构,借由新架构以及时钟频率提升效应,来达到更高的性能。

  计算机发展到今天基于人们对运算性能也提出了越来越高需求。但随着处理器集成度的不断提升,处理器的架构也发生了翻天覆地的变化。通常开发一款新的处理器架构,不可避免带来了晶体管的增多,若不使用新的制程技术,将导致所需要的硅晶面积的大幅增加,而通常硅晶面积的大小与处理器功率是成正比的。我们以硅晶面积增加四倍来计算,如果没有使用新的制程技术,功率立刻也会相应的增大四倍。但实际上新的架构也最多能够给处理器性能带来两倍的提升,因此性能和功率的之间并没有得到很好的平衡。但如果我们不再研发新的处理器架构直接已既有研发完成、验证过的处理器核心,以两个或多个核心的方式加以迭加,这样功率虽然也增大了四倍,但在搭配支持四线程处理的软件时,理论执行性能也同样提升了四倍。其性能功率比的表现,多核心更胜单核心一筹!所以单芯片多线程(Chip Multi-Threading;CMT)、或芯片多重处理(Chip Multi-Processing;CMP)的处理器设计思维,就成为后摩尔时代处理器研发的必然趋势。

  首先开始采用单芯片双核心设计并不是今天Intel、AMD而是蓝色巨人IBM,为了巩固其Power系列RISC处理器与服务器市场的霸权,IBM在1999年10月微处理器论坛中,率先揭露了其双核心Power4的研发计划,其采用180nm铜导线搭绝缘硅(SOI)制程,于2000年元月开机成功,时钟频率冲上1.3GHz,随即引爆了整个业界对双核心以致于多核心处理器发展的关注。IBM Power4也夺得微处理器论坛主办机构Micro Design Resource的1999年最佳创新技术奖项。

  如果你对标量计算机RISC体系的多核心处理器有所了解,便会发现它们在设计上有惊人的相似点:所有多核心处理器都是以上一代产品为基础,所集成的硬件内核实际上就是前一代处理器,如IBM的Power 4便是在Power 3基础上构建,SUN的Gemini(针对刀片服务器)则直接集成了两个UltraSparc II内核,拥有PA-RISC处理器技术的惠普也曾将两颗PA-8700核心迭加出来的便成PA-8800处理器。这些做法的优点在于可以平滑升级到下一代产品,降低处理器的设计难度,而同时性能又可在前代产品基础上大幅度提升。所以Intel、AMD的双核心处理器也秉承相同的设计思维。

  相比高端服务器用处理器,个人用处理器发展的速度就相对比较慢了。Intel在去年才提出双核心开发计划,而且这样的产品本该在2007年出现,但是迫于竞争压力,将它提前了18个月。AMD选在4月21日64位Opteron处理器两年纪念日之际推出双核心处理器。

  为抢在AMD之前,英特尔将原计划下月底的发布双核芯片日期提前到美国东部时间4月18日也就是“摩尔定律(Moores Law)”诞生40周年纪念日。Intel此举显然是要赶在AMD之前,对AMD全力施压。


二:Intel Pentium D/Pentium EE系列双核心处理器

  Intel桌面双核心解决方案包括Pentium D/Pentium EE系列双物理核心处理器以及用以配套的945/955 Express系列芯片组及主板。

  Pentium D核心代号为Smithfield,采用90纳米工艺设计,总线频率为800MHz。从物理结构上看Pentium D处理器也使用了LGA775型接脚,其物理形式与Pentium4 5系列和6系列相同,但对应核心位置的处理器底部贴片电容元件数目有所增加,排布方式也发生了变化。标称L2 Cache容量为2MB,但这2MB的L2 Cache跟Pentium4 6系列的2MB并不相同,它是每个核心各分得独享的1MB的L2 Cache,如果一个核心需要存取另一个核心的L2 Cache内的数据则需要借助MCH来完成。

  和之前能够虚拟出两个核心的Hyper-Threading技术比较,物理双核心无疑占有性能上的优势。物理双核心每个处理器都有其各自独立的执行资源及结构状态。超线程技术的处理器复制处理器上的结构状态,让同一个处理器上的多个线程同步执行并共享处理器的执行资源,但他们仍共同使用一组执行资源。配置物理双核心的单处理器,系统的工作状态很类似于关掉Hyper-Threading功能的双至强处理器平台,MCH并没有区别和这两个核心处理器之间的通信,两个核心也将共享内存带宽。

  首批上市Pentium D处理器包括820(2.8GHz)、830(3.0GHz)和840(3.2GHz)共三款,其价格分别为240、316、530美元。它和目前的Prescott核心处理器一样使用90纳米技术制造,集成了2亿3千万只晶体管,核心顶面积也达到了206平方毫米。他的技术支持特性跟Pentium4近似:支持EM64T 64位扩展,Execute Disable Bit以及EIST(增强Intel SpeedStep),但是每个核心的Hyper-Threading(超线程单元)被屏蔽掉。

  而面向桌面高端的Pentium eXtreme Edition则推出了840(3.2GHz)以支持双核心 。它的基本规格与Pentium D类似,但其FSB提升到1066MHz,并且带有4线程TLP形式的Hyper-Threading,核心面积206平方毫米,集成2亿3000只万晶体管。上市之初Pentium EE 840的销售价格将达到999美元。

配套周边

  英特尔945/955芯片组将支持1066MHz前端系统总线,支持双核心Pentium D/Pentium EE系列处理器,并可支持支持667MHz的DDR2内存规范,此外PCI-E 16x插槽和PCI-E 1x插槽也继续得到了支持。该系列芯片组包含了两个版本,一个为不整合显示核心的P系列,另一个为整合英特尔下一代显示核心的G系列,显示性能将在现有915G显示核心性能上提升两倍。

  用以搭载的南桥芯片为ICH7系列,其可支持4个SATA2接口和8个USB2.0接口,并整合Matrix RAID技术(ICH7-R)与Hi-Def Audio技术,还新加入了iAMT主动管理技术和ADD2+媒体卡等的支持。ICH7中的PCI Express Tekoa控制器还将支持10/100/1000Mbps的以太网卡和Casewell2无线通讯技术。

  不同的是i945芯片组最高只支持4GB内存,而i955X芯片组则最高可支持到8GB。i955X是Intel在PC系统架构全面升级到PCI Express/DDR2/LGA775封装Pentium处理器之后的第二代旗舰产品,它的位置是代替目前市场上的925/925XE芯片组。955X在保持了向下兼容Pentium4的功能外,还在MCH和ICH部分全面升级,规格和支持特性都得到了大幅度增强。955X芯片组的报价是50美元。而初期采用英特尔955X芯片组的主板价格将达到200美元附近。

  在周边芯片组厂商合作方面,财大气粗的Intel一向不缺乏。NVIDIA于4月5日正式推出了nForce4 SLI芯片组的for Intel版本。用以支持Intel的Pentium D和Pentium EE系列处理器。

  ATI也准备好了他们的RD400芯片组,以对抗NVIDIA的nForce4 SLI Intel版本。ATI RD400支援Pentium 4,Pentium D和Pentium终极版本处理器,支持1066Mhz FSB,双通道的DDR2-667和6个SATA RAID和 Azalia 音频输出。作为nVIDIA最大的死敌ATi更是推出Multi-VPU技术,据称这个月底该技术就会正式展出。


三:AMD Opteron双核心处理器

  4月21日将是个特殊的日子——AMD选择了这一天来发布让人们苦苦企盼了许久的双核心Opteron处理器。此次将要发布的Opteron有三种编号:865、870和875,分别对应着1.8GHz、2.0GHz和2.2GHz的主频。其采用90nm,SOI工艺制造。据悉,AMD随后还会会推出针对桌面的双核心Athlon 64/FX同Intel的Pentium D抗衡,这些产品均由位于纽约州Fishkill的IBM晶圆厂以65纳米工艺进行生产。

  Opteron本身就可以直接支持多处理器运作而不必依赖芯片组,这是因为Opteron核心内部拥有三个Hyper Transport总线控制单元,分别用于处理其与北桥芯片、PCI-X控制器和其它处理器的连接。如果是双路系统,两枚Opteron可以借助16位、6.4GBps带宽的Hyper Transport总线直接连接。而如果是四路系统,Opteron就得使用两条Hyper Transport总线来与相邻的两枚处理器连接。问题就变得很明朗了:如果AMD要设计集成两枚Opteron核心的新型处理器,只需将两个核心直接集成在一起,通过Hyper Transport总线连接即可,而从逻辑上看,它与现在的双路系统根本没有任何差别。这样,从理论上来说,AMD完全可以在几个月的短时间内设计出双核心Opteron产品,技术实现的难度远小于Intel的Pentium D系了。同样,Athlon 64/FX也是类似的情况,虽然我们看到它们只有一条Hyper Transport总线与北桥通讯,但另外两条Hyper Transport仍然存在,只不过被AMD屏蔽罢了,若要开发双核心产品,将它们重新开启便是。

  在缓存方面,双核心Opteron和Athlon 64/FX也都将采用独享式缓存设计,其中双核心Opteron、Athlon 64 FX一共拥有2MB缓存,与Pentium D持平。

  整合内存控制器是AMD平台的主要优势之一,这一点在双核心时代进一步得到体现。双核心的Opteron和Athlon 64 FX便可以支持两个双通道DDR2-533(带宽17GBps,四通道效果),面向中低端的Athlon 64都可以支持两个单通道DDR2-533(带宽8.5GBps,双通道效果)但这仅是机械地将两个Opteron或Athlon 64 FX核心集成在一起的情况,而这样的话AMD就必须为微处理器增加信号针脚,改变处理器的物理接口,而两个双通道内存系统对主板布线也提出新的要求,造成开发成本较高的问题,也带来了同样的升级困难麻烦。为此,AMD暂时只能决定采用两个核心共享一个内存控制器的设计,即便如此,它的内存子系统仍不足以完全输于Intel,因为整合内存控制器的做法可以明显降低内存延迟,这一点已经被实无数事实证明了。不过随着时间的推移,双核心独享内存控制器的做法仍不失为一个非常好的解决方案,相信将来一定会被AMD用来对付Intel的有力工具。

  功耗方面目前的Opteron处理器功耗在90W左右比起Intel Prescott核心的的103W以上,其本身功耗就低了许多,而且考虑节能技术的影响,现在单核心的Opteron处理器平均功耗不过在50~60W之间,但如果将这样的两个核心集成,即便AMD成功引入65纳米技术,双核心产品超过120W的功耗不可避免,所以AMD必须得大力解决这方面的问题。不过,据来自AMD的最新消息,起跳的1.6GHz频率版本的双核心Opteron处理器约为90W,这样的功耗用户应该还是可以接受的,比之预期的120W已经下降了很多,而且说不定AMD可以找到更好的解决方案。

配套周边

  由于Hyper Transport早已被标准化,无论是双核心的Opteron,还是双核心的Athlon 64/FX都可以原用单核心的总线与芯片组连接,因此AMD并没有将接口方式作出改变,这样用户只需要购买一块新的处理器,便可以从现有的单核心平台无缝升级到双核心平台。现有的nForce 4、K8T890 Pro对于双核心Opteron/Athlon 64/FX都是很好的平台。

  操作系统方面,微软已经承诺将在自己的Windows中加入对AMD Opteron处理器的支持,而SuSe在Linux支持方面处于领先地位;其他领先的Linux和UNIX厂商那里Opteron也将在近期获得支持。

  HP已表示其Proliant DL385和HP XW9300工作站将按时出货,同时Sun、Dell和IBM也表示会推出基于最新Opteron处理器的产品。

« 上一篇 下一篇 »

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。