回复:
第六部分 酷睿遥祭图拉丁:奔腾4 NetBurst架构终结,古老的P6架构重新登场
在486及其以前的时代,英特尔AMD以及Cyrix处理器的技术架构相同,这是因为286时代的英特尔还只是给IBM PC原装机(ThinkCentre的前身)提供微处理器的一个打工仔而已(微软则是给IBM PC原装机提供操作系统的打工仔)。当时英特尔还是一个小公司,产能有限,而IBM PC机还没有与其兼容的兼容机出现(现在除了苹果电脑以外的品牌机,包括我们自己攒的电脑,严格说来都是IBM PC机的兼容机),产品销量很大,为了保证微处理器的供货充足,IBM强迫英特尔把自己的微处理器技术无偿授权给另外一家公司,得到授权的这家公司就是IBM PC机微处理器的“第二供货商”(也就是当英特尔的处理器供货不能满足IBM需求时,由第二供货商向IBM提供完全一样的微处理器)。英特尔当时一百个不愿意,但是又惹不起IBM,只好选择了AMD,将自己的微处理器技术无偿提供给了AMD,后来为了让AMD多一个竞争对手,免得AMD老来纠缠自己,英特尔又将微处理器技术无偿授权给Cyrix,因此这三家公司的处理器架构基本一致。
到了486时代,英特尔羽翼渐丰,IBM PC由于兼容机的大量涌现也不是垄断者了,英特尔的名气越来越大,很多人购买微处理器非英特尔不买,所以英特尔倒不是特别在乎AMD等竞争者生产的兼容微处理器,但是AMD和Cyrix的技术研发势力越来越强,兼容处理器的性能与英特尔不相上下,价格还特别低廉,所以从奔腾开始,英特尔终于翻脸,奔腾采用了全新的P5架构,AMD等竞争公司没有授权,只好先用5x86这样的超级486来抗衡英特尔,同时各自开发自己的下一代微处理器架构。
AMD面对这样的局面只能另辟道路。经过K5还算成功的试探之后,又发布了K6处理器,并逐渐衍生出K6-2和K6-3。第一代K6处理器只能与具备MMX技术的奔腾打成平手,但是后续的K6-2则凭借架构上的优势令英特尔感到了巨大的压力。为此英特尔将P6架构下放,取代奔腾/奔腾MMX的P5架构,以求在性能上保持领先地位。
P6架构问世于1995年,至今已经有11个年头了。最早采用P6架构的微处理器是高能奔腾(奔腾Pro)。P6架构与奔腾的P5架构最大的不同在于,以前集成在主板上的二级缓存被移植到了CPU内,从而大大地加快了数据读取和命中率,提高了性能,另外P6架构是一个纯32位的微处理器架构。第一代P6架构的微处理器奔腾Pro受制于当时的制造工艺,CPU核心集成二级缓存的成本太高,所以奔腾Pro的售价高昂,仅仅应用在服务器领域。为了将P6架构平价化以对抗AMD等竞争对手,英特尔采用了将二级缓存从CPU核心移出,外置于集成CPU核心的PCB板上的做法,推出了奔腾II处理器。奔腾II处理器的二级缓存外置于CPU核心以外,只能以处理器工作主频一半的速度运行,而不像奔腾Pro的二级缓存那样以全速运行。但是半速运行的二级缓存总比传统集成在主板上的二级缓存速度快得多,再加上奔腾II二级缓存容量大、一级缓存容量也是奔腾Pro 2倍、主频更高三大优点,它的性能还是要强过奔腾Pro。随着0.25微米工艺的成熟,英特尔尝试将奔腾II的二级缓存集成于核心,推出了Mendocino赛扬处理器(著名的超频王赛扬300A就是这一核心),虽然Mendocino赛扬的二级缓存只有128KB,但是它却以全速运行,再加上位宽高于奔腾II的二级缓存,所以同主频的赛扬/奔腾II性能差距并不大。除了早期的奔腾III以外,铜矿和图拉丁奔腾III及其简化版赛扬,加上后来的奔腾M,都是基于P6架构的优秀产品。
奔腾M就是现在的主流产品,但是它的身份只是法定的移动处理器而已,桌面处理器还是NetBurst的天下。但是随着酷睿2的到来,久磨愈精的P6架构全面回归。
酷睿处理器的基本设计思路继承于奔腾M。除了完全承袭了奔腾M的看家本领——微指令融合技术以外,酷睿还具备超强的四组指令编译器,这也正是酷睿的最大特色。采用四组指令编译器,酷睿可在单一频率周期内编译四个x86指令。四组指令编译器的设计思路还是承袭P6架构的传统,由三组简单编译器(Simple Decoder)与一组复杂编译器(Complex Decoder)组成。
酷睿处理的另一个技术亮点就是数据预读取技术。这也是早在图拉丁身上就出现了的新型技术,可以有效弥补缺乏内存控制器、导致内存存取延迟较长的缺憾。数据预读取技术可在处理器将数据回存内存的同时,预测后继的加载指令是否采用相同的内存地址。如果不是,就可立即执行加载动作,无须等待该回存指令,这可大幅改善乱序执行(Out-Of-Order Execution)核心的效率,并缩短存取内存的延迟。
而增强的“预先加载机制”则可满足第二项要求。Core微架构每个核心分别内建一组指令及二组数据预先抓取器,而共享的二级缓存内建两组、可动态分配至不同的核心的数据预先抓取器,可根据应用程序数据的行为,进行指令与数据的预先抓取动作,让所需要的内存地址数据,尽量存放在缓存中,减少读取内存的次数。
酷睿的电源管理机制基本上改良自图拉丁奔腾III-M与奔腾M的设计,即处理器内各功能单元并非随时保持启动状态,而是根据预测机制,仅启动需要的功能单元。不过在酷睿上新采用的分离式总线(Split Buses)、数字热感应器(Digital Thermal Sensor)以及平台环境控制接口(Platform Environment Control Interface)等技术的实际效果,要比以往模糊的省电效果实在得多。
温控方面,英特尔在酷睿处理器中最容易发热的位置,放置数字热量传感器(Digital Thermal Sensor),通过专门的控制电路,监控处理器的发热量以及运作模式,然后动态调整系统电压、系统风扇转速。
酷睿既然是基于P6架构,因此也有P6架构的缺点,比如说工作主频无法像奔腾4那样狂飙。P6家族处理器的工作主频提升,很大程度都是依赖制造工艺的改进,而不是加长运算管线。在45nm工艺采用之前,酷睿的核心频率很难超过3GHz,那些用着3.8GHz奔腾4处理的用户还有一段可以YY主频的时间。
总之,酷睿的发布,P6微架构的回归对业界影响深远,因为它代表着这样一种思路:即在降低耗电量的前提下,追求最大化的性能,而并非过去的“唯主频论”。