回复:

奔腾4的发布,开了一个恶劣的先例:从来没有下一代处理器在同主频的情况下性能低于上一代处理器,奔腾4做到了;英特尔处理器发展史中处理器的更新换代从没出现过主频断档,奔腾4也做到了。奔腾4的起始工作主频是1.4GHz(1.3GHz的奔腾4是过了很久才发布的,仅限量供应品牌机厂商),奔腾III的截止工作主频是1GHz,400MHz的频率断档靠谁来填补?这个受累不讨好的任务,就交给几乎已经胎死腹中的图拉丁来完成了。这几乎是图拉丁奔腾III桌面版问世的唯一原因。图拉丁奔腾III就像一个受虐待的童养媳,小心翼翼地出世了,为了尽量压低它对低主频奔腾4的巨大性能优势,英特尔先是阉割了它一半的二级缓存;一看性能还是太牛x,再把FSB降低到133MHz;一看性能还是太牛x,于是再把二级缓存延迟时间增大为1;一看还是太牛,于是还要阉割,我靠打住吧,再阉割不就成了赛扬了吗?图拉丁的开发工程师不干了,于是英特尔又在配套芯片组上打主意,取消了830主板的发布,而是推出了整合i752显卡的815GM芯片组来搭配图拉丁奔腾III……即便这样,图拉丁奔腾III 1.13A GHz还是打得奔腾4 1.5GHz满地找JJ,于是英特尔又出损招,严格限制图拉丁奔腾III的出货量,将其售价人为提升到很高的位置,鼓励品牌机厂商采用奔腾4处理器。这样一来,图拉丁奔腾III在市场中芳踪罕觅,其稀缺程度甚至超过了服务器版的奔腾III-S……从1GHz攀升到1.33GHz,图拉丁奔腾III终于完成了填补两代处理器主频空白的任务黯然退场了(图拉丁奔腾III 1.33GHz最惨,才发布就停产)。
图拉丁赛扬的命运比同门大哥好得多。这是因为英特尔需要它来抗衡AMD的钻龙(毒龙),继承了图拉丁的优良性能,256KB缓存(图拉丁赛扬的256KB缓存可比赛杨D的256KB缓存实在多了),100MHz FSB,加上精简数据预读取技术,图拉丁赛扬确实出色完成了任务。可是图拉丁就是双刃剑,英特尔又开始担忧它和Willamette赛扬的工作交接了,如果图拉丁赛扬像图拉丁奔腾III痛扁低主频奔腾4那样痛扁Willamette赛扬怎么办?如果他也把Willamette赛扬打得满地找JJ怎么办?哦忘记了,赛扬本来就是太监,没有JJ,不过图拉丁赛扬显然是韦小宝,假太监真男子汉。英特尔想不出妙策,于是就给两款赛扬留下了300MHz的主频空白,外行一看,我考,怎么赛扬1.4GHz完了就是赛扬1.7GHz呢?1.5/1.6GHz的产品呢?具有讽刺意味的是,图拉丁赛扬1.4GHz照样轻轻松松把Willamette赛扬1.7GHz打得满地找假阳具……
服务器版的图拉丁奔腾III-S问世有英特尔自己的苦衷。奔腾4至强的性能不济(照样被图拉丁奔腾III打得满地找JJ,更不要说跟奔腾III-S叫板了),配套主板平台昂贵(1GB Rambus内存,价格您自己算去吧),用户不理睬,于是拿出奔腾III-S来,兼容现有815平台,性能强大发热低,做1U服务器和低端双路服务器最理想,得,就它吧。于是奔腾III-S高价问世了。这里透露一下,图拉丁奔腾III-S很多都是不锁频的哟……
相比之下,移动版的图拉丁奔腾III命最好。如前所述,奔腾4具有高发热量高功耗的特点,用来做笔记本CPU实在是赶鸭子上架赶猪爬树,勉为其难。图拉丁奔腾III呢,具有发热低功耗低的优点(其实图拉丁用好的散热片,机箱通风良好情况下根本不用风扇),同时还具有很高的性能(图拉丁奔腾III-M一样能把主频比自己高几百MHz的移动版奔腾4打得满地找JJ,不过移动版处理器太小巧,找JJ要用放大镜),是最适合笔记本的处理器。所以英特尔高调宣传图拉丁奔腾III-M,还给它设计了一个和移动版奔腾4风格类似的logo,希望能用图拉丁奔腾III-M占居主流移动处理器市场的大部分份额。但是图拉丁再好也是奔腾III,英特尔不是用铺天盖地的广告宣传说4比3好吗?为什么买笔记本不买奔腾4的却买奔腾III的呢?英特尔有苦说不出,笔记本厂商也跟着倒霉,不得不用移动版奔腾4来制作主流笔记本,轻薄笔记本实在容不下移动版奔腾4这位大爷,才采用图拉丁奔腾III。结果呢,用户纷纷抱怨,买了主流笔记本的责问厂商,你的最新款笔记本怎么电池使用时间比老奔三笔记本短这么多?买了轻薄笔记本的用户也责问厂商,都说轻薄笔记本采用的才是笔记本厂商最先进的技术,你为啥卖给我一个已经淘汰的奔腾III笔记本啊?厂商的不满用户的抱怨,促使英特尔另辟蹊径,开始设计奔腾M。这个奔腾M迅驰平台,其实就是换了新汤(名字)加了调料(SSE2)搭配了两碟点心(无线网卡和855芯片组)的图拉丁奔腾III而已。

第三部分 图拉丁与奔腾4,性能孰优孰略
说这个问题前,我们先打个比方。你认为要完成扣篮动作,需要什么条件?答案是身高和弹跳力。身材很高的人轻轻一跳就能扣篮,但不是说矮个子就不能扣篮,我们国家那些一米六左右的举重运动员,不用助跑就可以原地跳起轻松来个倒扣,靠的就是机器发达的腿部肌肉和惊人的弹跳力。同样道理,决定处理器性能高低的因素也不是一个,主要有两个,一个是主频,一个是单位主频下的执行效率。
奔腾4能够在同样的0.18微米工艺下轻松达到2GHz的主频,奔腾III刚刚达到1.13GHz就已经到了极限,这是为什么?这是因为奔腾4的运算流水管线多达20级甚至31级,而奔腾III只有11级。运算流水管线越长,就越容易在同样制造工艺下达到更高的工作主频。Athlon在同样制造工艺下可以达到奔腾III难以达到的高主频,就是因为Athlon的运算流水管线比奔腾III略长。但是运算流水管线过长也会带来负面影响,管线越长,单位主频下的处理器执行效率就越低,性能的发挥就会受到影响。众所周知,奔腾4正是在流水管线上的加长设计,才能够达到如此之高的主频,并在主频争霸战中战胜AMD,逼得Athlon XP“不敢以真面目示人”(指Athlon XP不用真实主频标注,而用“相当于奔腾4多少”的主频标注)。但是流水管线的加长会导致数据在管线逗留的时间增长,导致数据出错的可能增加,一旦一个数据出错,其结果就在于整个运算步骤都将重新来过,这样就会造成处理器处理性能的降低。依靠高效的分支预测体系和Cache机制可以改善这一点,但仅仅是“改善”而不是“弥补”。要想弥补高频低能的缺点就要靠更高的主频来抵消,比如同样制造工艺下,2GHz的奔腾4性能总会高过1GHz奔腾III,这就是在不改变制造工艺的前提下带来的性能提升,只是英特尔不厚道,故意把人们误导到“高主频=高性能”这个自奔腾4问世后已经不再是真理的误区中来。而AMD呢,即便是Athlon 64,流水管线也很短,所以执行效率非常高。Athlon 64的整数流水线达到12级,浮点流水线达到17级,相比Athlon XP仅仅提高两个工位,但是大力改善了分支预测机制,所以同主频下性能提升明显。从中我们可以看到英特尔设计奔腾4与AMD设计Athlon的两个根本不同思路:英特尔是追求主频优先,靠极高的主频来提升性能;AMD则是追求效率优先,靠高效的执行机制实现在相同主频下达到更高的性能。AMD这种做法,其实师承于英特尔的P6架构设计思路(奔腾III、奔腾M以至酷睿,承袭的就是这种设计思路)。明白了两种设计原理,再考虑到奔腾4单位主频下的执行效率只有奔腾III 70%-75%左右的事实,我们就能很容易得出如下结论:同主频下,奔腾III的性能显然要高于奔腾4。但是,奔腾4在相同制造工艺下可以达到奔腾III所不能达到的高主频,这个高主频完全可以弥补低性能还显得绰绰有余。
如果不考虑处理器的功耗和发热量,我们可以认为,这两种处理器设计思路都是可行的。但是处理器不能只停留在纸面上,必须要生产制造出实物来才能实现价值,而实际的处理器在工作时必然要耗费电量发出热量,这时候就要看哪种设计思路更实际更合理的问题了。
流水线运算管线不是像输精管输卵管那样细微的生物细胞管子,而是由一个个的晶体管组成的。显而易见,流水线运算管线越长,晶体管数量就越多;晶体管数量越多,耗电量就越大;耗电量越大,发热量就越高。这就是奔腾4处理器的命门所在,谁愿意养一个电老虎在家里供着?