芯片每块大约拥有 15 亿到 20 亿的晶体管,架构创新提升硬件性能在IBM看来

【据《国际电子商情》
2007年08月06日报道】“我们现在处于一场革命的开始,一场如何构建计算机和大型计算机的革命的开始。这包括硬件的变革,即在硬件的建设中,如何利用加速器提升硬件的并行计算能力;同时,这场革命不光是硬件的变革,还牵扯到软件的变革,如何通过软件充分发挥硬件中并行和加速器能力,让‘混血系统’(hybrid
system)中的加速器和其它芯片更好协作。”
在最近北京举行的IBM-中国国家网格Cell/B.E.研讨会期间,IBM下一代计算系统和技术杰出工程师Robert
Guernsey博士表示。7月末,IBM和中国科学院计算机网络信息中心联合在京举行了IBM-中国国家网格Cell/B.E.研讨会。双方就基于Cell/B.E.(Cell
Broadband Engine)的IBM BladeCenter
QS20刀片系统在中国国家网格的成功应用,以及目前高性能计算领域的最新进展和发展趋势进行了研讨。基于Power架构的Cell/B.E.
最初是IBM、索尼和东芝为游戏主机而开发的。IBM BladeCenter
QS20是一种基于Cell/B.E.的刀片系统,专为那些准备从Cell/B.E.处理器的高性能计算力以及运行图形密集型应用的独特能力中受益的公司而设计。QS20集成了7个刀片共14个Cell处理器,最高性能超过了2.8TFLOPS——相当于每秒钟完成2.8万亿次浮点运算。2006年10月,中国科学院计算机网络信息中心和IBM启动了为CNGrid提供基于Cell/B.E.的刀片服务器计算节点的项目,并鼓励开发各种能够充分利用其独特性能的应用。今年4月,国内第一台基于Cell/B.E.的刀片服务器系统开始在位于北京的中国科学院超级计算中心投入运行。目前,这一系统已经能够对地震预报(Earthquake
Prediction)、分子动态仿真(Molecular Dynamics
Simulation),以及MPEG2代码转换机(MPEG2
Transcoder)等应用进行演示,Cell/B.E.多核并行处理技术的能力和性能在这些应用演示中得到了充分的展现。IBM的工作人员介绍说,与传统的x86处理器相比,地震预报和分子动态仿真在Cell处理器上的运行速度分别提升了37.7倍和21.5倍。摩尔定律已“死”,架构创新提升硬件性能在IBM看来,摩尔定律(moore’s
law)代表的工艺进步已接近极限,使得硬件产业需要在加速器、多核和SoC等方面实现架构创新,以继续提升硬件系统性能。“摩尔定律已死(moore’s
law is
over),对不起,对不起,实际上,摩尔定律还没有死,让我来仔细解释一下。”
Guernsey博士笑道。他向《国际电子商情》记者解释说,过去几十年来,我们让芯片变快的方法是让晶体管越来越小,但是现在让芯片变快非常困难,因为晶体管越小伴随漏电的问题越严重,现在我们正接近临界点。因此现在让芯片的频率变快越来越不现实,因为会有更大的功耗。事实上,摩尔定律并不是讲芯片的速度越来越快,而是指它的密度每18个月或者24个月翻倍,晶体管密度仍然继续翻倍,但是步伐也开始减慢,可能需要36个月翻倍。在芯片上集成更多的晶体管仍是可能的,但这也快接近终点了,越来越困难。今天看到Cell处理器是90nm的,下次看到的时候可能是45nm,再下去就是32nm的,每到一个新的工艺节点,就可以集成更多的晶体管。但是22nm是一个问题,太昂贵了,所以再过10-15年我们做到22nm的时候,就很难再往下走了。IBM认为,在工艺进步面临极限时,为了持续提升硬件系统性能,就必须在架构上进行创新,而以cell处理器为代表的加速器、多核和SoC就是未来的发展方向。“计算世界或者说硬件世界正在改变,它正在发生重大的转变,主要是因为功耗问题。我认为未来不可避免的在高性能计算会出现一种‘混血系统’(hybrid
system),我们的Cell处理器和传统的通用处理器能够一起合作提供很强的计算能力,就是一个很好的例子。”IBM中国技术学院院长John
Turek博士表示。与传统处理器不同的是,Cell处理器是一个9核处理器,拥有8个协同处理单元以及1个基于Power架构的核心,频率达3.2GHz,可在很多计算密集型应用中为客户提供强大的性能。在初始硬件测试中,Cell处理器的最高性能超过了200
GFLOPS——相当于每秒钟完成2,000亿次浮点运算。在研讨会现场,IBM的工作人员演示了MPEG2转换应用,采用一个Cell处理器,其中一个协处理器实现MPEG2解码,另外7个协处理器可支持7路H.264标清编码。据介绍,已有视频监控厂商非常感兴趣,希望用它来取代目前昂贵的FPGA和DSP。除了应用于众所周知的索尼PS3外,Cell处理器还被用于IBM刀片系统并被众多机构用于构建超级计算机,应用领域也扩展到了医疗影像、航空航天、防务、数字动画、通信以及石油和天然气等需要高性能计算力以及运行图形密集型的应用。例如,IBM将为美国能源部设计名为“Roadrunner”的混血超级计算机,这台将于今年底交付的超级计算机将使用超过1.6万个AMD
Opteron处理器内核以及超过1.6万个Cell处理器,最高性能超过了每秒钟1,600万亿次计算(1.6
petaflops)。“Roadrunner”的混血设计将允许系统对复杂的数学公式进行分解,然后将分解后的各组成部分发送到能够以最高效率对其进行处理的系统。典型的计算流程——文件IO和通信活动将由
AMD
Opteron处理器进行处理,而更加复杂和重复性的工作(传统上会占用超级计算机大部分资源的任务)将由超过1.6万个Cell处理器进行处理。IBM的Oliver
Retting表示,事实上,IBM并不孤单,AMD和nVIDIA都在走类似cell处理器这种发展路线,即将CPU和GPU集成。“总之,现在通过提升频率以提高速度已经很难了,但是你可以增加处理器的个数,这就需要更多的软件和编程”。Guernsey博士向《国际电子商情》记者总结说。

 导读

《卫报》特稿,摩尔定律快要走到尽头,但计算革命不会终止。更好的软件编程、3D芯片和量子计算等方法应运而生,其中云计算将成为业界应对摩尔定律消亡的最佳手段,物联网(IoT)的兴起将让我们逼近一个“消失点”,此前计算机的形体从大到小,此后计算机将变得“无形”,使计算无处不在,智能融入日常生活。

1971年,其时名不见经传后来名震硅谷的英特尔发布了一款名为 4004
的芯片。这是世界上首个商业微处理器,它将所有电子电路都整合在了单一的一个微小包装里,这在当时是个奇迹。这款芯片有
2300 个晶体管,每个晶体管宽约 1 万纳米,相当于一个红细胞的大小。

2015年,已经是全球领先芯片制造商、当年年收入超过550亿美元的英特尔发布了
Skylake 芯片。英特尔公司没有公布具体的数字,但推测 Skylake
芯片每块大约拥有 15 亿到 20 亿的晶体管。采用 14 纳米制程,一块 Skylake
芯片体积之小,肉眼几乎看不到。

摩尔定律快要走到尽头

人人都知道现代的计算机比以前的好,但很难说清楚具体怎么个好法,因为其他再没有什么消费者科技产品比计算机发展得还要快。世人常用汽车来类比:如果从1971年开始,汽车也以与计算机芯片相同的速度发展,那么到2015年最新型的汽车最高时速将达到每小时
4.2
亿英里左右。这大约是光速的三分之二,能够在不到五分之一秒的时间里绕地球一圈。如果这仍然太慢,那么在2017年年底之前,还可以再快两倍的模型车就能在展厅里展出了。

这种飞速的进步是 1965
年由英特尔的创始人戈登·摩尔首次观察并且提出结果。摩尔指出,可以挤在集成电路上的电子元件数量每年都会增加一倍。后来这个数字修改为每两年,从此“摩尔定律”为整个计算机行业设定了步伐。每年,英特尔和台积电等公司花费数十亿美元来计算如何缩小进入计算机芯片的组件。一路走来,摩尔定律帮助建立了一个世界,在这个世界里芯片被植入从水壶到汽车各种东西里,数百万人在虚拟世界中放松,金融市场由算法操控,专家担心人工智能将很快取代人从事所有的工作。

但摩尔定律的推动力量几乎也要走到尽头。每次你制作芯片时,缩小芯片的元件变得越来越困难,而现代晶体管的特性只有几十个原子,能够改善和提升的空间已经不够用了。从1971年的4004年推出到2016年年中,摩尔定律大约走了22步骤。要按照这个速度发展到2050年,意味着还要往前推进17步,在这种情况下,工程师必须找出原子体积比氢原子还要小的元素来构建计算机。任何人都知道,这是不可能的。

图片 1

不过,早在物理定律让摩尔定律失效前,商业的法则就会先将其淘汰,因为从经济利益上说,缩小晶体管的体积已经没有那么有效了。在摩尔定律之后,又出现了一种名为“Dennard
scaling”的现象(以 IBM 工程师 Robert Dennard 命名,他在 1974
年首次提出这一想法)。Dennard scaling
指出,缩小芯片组件的体积使芯片运行速度更快、消耗更少的功率,生产起来更加便宜。换句话说,具有较小组件的芯片是更好的芯片,这也是为什么计算产业能够说服消费者每隔几年就推出一款最新的型号。但是,老的魔法正在衰落。

体积的不断缩小不再像以前那样让芯片更快或更高效。与此同时,制造芯片所需的超精密设备的成本不断上升正在侵蚀芯片制造的经济利益。摩尔提出的第二条定律说,“铸造厂”的成本每四年翻一番。一个现代的芯片制造厂,成本大概需要
100 亿美元。即使对于英特尔来说,这也是很多钱。

结果就是硅谷专家达成了共识,摩尔定律已经接近尾声。“从经济角度看,摩尔定律已经死了,”运营一家硅谷分析公司的Linley
Gwennap说。IBM的研发主管Dario
Gil同样坦率地说:“我断言计算的未来不能只是依靠摩尔定律。”英特尔前芯片设计师Bob
Colwell认为,芯片产业可能到20世纪20年代初,制造出制程仅有 5
纳米的芯片——“但你要说再那个基础上变得更小就很难让我相信了。”

“后摩尔定律时代”的芯片

换句话说,过去 50
年中最强大的技术力量之一很快就将走到尽头。然而,计算机将以惊人的速度继续变得更好和更便宜,已经成为人们根深蒂固的想法,也是未来许多技术发展预测的基础,从无人驾驶汽车到更好的人工智能和更引人注目的消费者电子产品。实际上,除了缩小芯片的组件,还有其他的方法使计算机变得更好。摩尔定律的结束并不意味着计算机革命将就此停滞。不过,摩尔定律的结束确实意味着未来几十年将与前几个世纪大为不同,因为没有什么能比过去半个世纪以来芯片体积的持续缩小更加可靠或可重复的了。

图片 2

摩尔定律使计算机变得更小,将它们从占据整个房间的巨兽转变为多层灵活安装的电路板。摩尔定律也使计算机变得更加实用:如今一台智能手机的计算力比1971年全美国可用的计算能力加起来都多,而且只需要一块电池就可以用上一整天。但是,摩尔定律最有名的效用是使计算机变得更快。到2050年,当摩尔定律已成为古老的历史时,工程师们将不得不使用一系列其他的技巧让计算机的运行速度变得越来越快。

有一些简单的方法。一是更好的编程。在过去,摩尔定律的突破性步伐使软件公司没有时间精简他们的产品。事实上,他们的客户会每隔几年就会购买更快的机器这个事实进一步削弱了激励软件公司完善编程的想法:加速运行缓慢的代码最简单的方法可能只是等待一两年,当硬件的速度赶上就可以。随着摩尔定律的衰落,计算机行业短暂的产品周期可能会开始延长,这将给程序员更多的时间来打磨他们的工作。

另一个则是改善芯片设计。现代芯片开始具有专用电路,设计来专门为常见的任务,诸如解压缩电影、加密或绘制在视频游戏中使用的复杂3D图形等复杂计算加速。随着计算机普及到各种其他产品中,这种专用芯片将是非常有用的。例如,自动驾驶汽车将越来越多地利用机器视觉来解释现实世界中的图像,分类对象和提取信息,这些都是对计算量要求很高的任务。而专用电路将带来显着的性能提升。

然而,为了使计算能力以每个人都习惯的速度不断提高,还需要更为激进的东西。其中一个想法便是试着将摩尔定律推动到第三维。现代芯片基本上是扁平的,但如今研究人员正在采用芯片堆叠技术,这样就能在同样的面积里容纳更多的组件,就像摩天大楼那样可以在给定区域比低层房屋容纳更多的居民。

第一个这样的设备已经上市:韩国微电子公司三星销售的硬盘驱动器,内存芯片就采用了三维堆叠技术。
该技术具有巨大的前景。

现代计算机将它们的存储器安装在距离其处理器几厘米的地方。在硅速度下,一厘米是很长的一段距离,这意味着每当需要提取新的数据时都会产生比较显着的延迟。3D芯片可以通过在存储器层之间夹入处理逻辑层来消除这一瓶颈。IBM认为,3D芯片可以使设计师将目前一栋楼那么大的超级计算机缩小到一个鞋盒的大小。

但要让
3D芯片正常工作,还需要一些基本的设计更改。现代芯片在运行时会产生很多热量,需要强大的散热器和风扇来散热降温。3D芯片的产热情况会更糟,因为相比二维芯片,3D芯片可用于散热的表面积要小得多。出于同样的原因,3D芯片的供电和数据输入也要求新的技术。因此,IBM
所预想的只有鞋盒那么大的超级计算机将需要采用液体来冷却。每个芯片都将有微孔允许冷却液体流过。同时,IBM公司认为冷却剂也可以作为一个电源。根据这种想法,液态的冷却剂就像液态电池的电解质那样流过固定的电极。

相关文章