青蛙书签的制作方法:2011从超算的发展看中国科技的进步---神威蓝光的问世

来源:百度文库 编辑:偶看新闻 时间:2024/05/05 07:50:57

最近,国内又有一套系统出世---神威蓝光超算系统。这套系统超越了曙光公司的“星云”系统,目前国内排第二(第一是国防大学的“天河1A”)。

话得从2010 TOP500.org组织公布了全球超级计算机500强,来自国防大学的天河一号毫无悬念拔得头筹说起---这是中国超级计算机第一次夺得第一,在全球范围内引起关注。由此我们关注下我国超级计算机的发展。进入21世纪,我国超算的发展进入一个井喷期,形成超算研发的三驾马车---国防大学、曙光公司和江南计算所。三家都推出了有代表性的超算系统---国防大学的“天河一号”,曙光公司的“星云”系统,江南所的“神威蓝光”。可以说,已经形成了你追我赶的良性竞争态势。

值得关注的是,天河系统和星云系统都是采用CPU+GPU异构混合体系;而神威蓝光则采用的是多核高性能处理器实现了千万亿次的运算速度。这在异构混合体系已经成为主流趋势的另一个方向。另外值得关注的是,天河系统使用了部分国产“飞腾-1000”CPU;神威蓝光采用的是全国产的申威-1600。

下面是这几个系统的详细资料

天河一号A:基于NUDT YH Cluster集群,硬件上配备了Intel Xeon X5670 2.93GHz六核心处理器(32nm Westmere-EP)、我国自主研发的飞腾FT-1000八核心处理器、NVIDIA Tesla M2050高性能计算卡、224TB内存、专有互连架构、Linux操作系统,总计186368个核心,Linpack最大性能2.566PFlops(每秒千万亿次浮点运算)、峰值性能4.701PFlops,系统效率54.6%。

星云系统:曙光星云是中国第一台实现双精度浮点计算超过千万次的超级计算机,系统由x86架构处理器 GPU计算卡组成。CPU为9280颗Intel Xeon X5650,主频2.66GHz,6核12线程,GPU为4640块NVIDIA费米架构的Tesla C2050。

神威蓝光:全部采用国产高性能CPU搭建。(只有9个机柜,“京”有632个机柜......)

可见我国在超级计算机方面取得了很大的成就。但是我们距世界先进水平还有较长的路要走。

国防大学“飞腾”芯片,仿自SUN公司开源的“UltraSparc T2”芯片。

江南所“申威”来自DEC公司的alpha处理器(risc架构)。(DEC公司被康柏收购,康柏被惠普收购,已经停止了ALPHA处理器的发展。但基于RISC的alpha处理器技术上是并不落后。)

下面贴上一些2011年国内TOP100超算的资料

美国超算详情一览

练了北冥神功、乾坤大挪移、九阴真经、九阳神功、易筋经....各种神功,拥有屠龙刀倚天剑的美国,强到无以复加......

------------------------------------------

我国超算行业已经取得长足进步,在TOP500排名里,我国进入前十的计算机已经有两台,排名2和4,超算总数量不断增长,如今已达62台,甩开德国、英国、日本和法国稳居第二名,不过因为“京”的遥遥领先,就性能而言亚军属于日本。

不得不承认的是,目前超算方面最强的是美国,其次是日本。日本此次打榜的是“京”系统,峰值是天河的两倍,功耗更低,采用的是富士的芯片。(日本“京”只多消耗了1.45倍的功耗,就获得了3.18倍的计算性能,是能效最高的超级计算系统之一)而天河和蓝光,都是仿制美国公司的芯片。不过,这是一种好的方向,迟早会有自己的指令集出来。可以看出,申威1600采用的制程是比较落后的(65NM),如果采用目前最先进的32NM制程,性能会更优异,能和目前主流的服务器CPU媲美。

而超算方面的巨擘CRAY已经发布了下一代产品,使用AMD最新推土机架构16核心处理器和NVIDIA费米架构Telsa计算卡。整套系统将包含18000颗CPU和GPU,最终运算速度将达到70万亿次/秒,完成后将夺回超级计算机王座的位置,并将其他系统远远甩在身后。超算的竞争是一场未完成的比赛,我们还在追赶的路上。

最后,撇除技术的比较,我们可以看出,我国TOP500超算系统越来越多,这说明应用需求的旺盛,也可以看出未来我国科学技术发展已经有了强大的计算支持。我国的科学技术发展将迎来一个黄金时期......

路边社消息:

蓝光是出来打榜的,神威系列有更好的东西,在军方手里。

所谓的自主指令集,实际是由alpha指令集基础上扩展、改进而来。

记得原来有说神威是IA64指令集,也就是兼容安腾。但是好像没有Intel授权,只能偷偷摸摸自己用。

但是看参数,16核心,很可能是OpenSPARC核心,强化浮点部分。安腾核心比较复杂,集成16核心比较难。就算这样,140.8GFlops的速度也是非常恐怖的,有可能是向量引擎的速度。

sw1600主要是面向超级计算进行的优化,跟完全面向商用的处理器相比,spec成绩大概不会那么好看。

就超级计算的关键技术:互联来说,神威蓝光是非常出色的。神威蓝光的LINPACK效率是:单个处理器核80.28%,单CPU 75.20%,单机舱75.07%,整机74.37%,可以看到从单cpu到单机柜1024个cpu互联, 效率只下降了0.13%,单机柜到整机效率下降0.7%,这个说明其互联系统做得相当好。

实际整机的效率的瓶颈在单核的效率,我想主要还是在65nm工艺下单个die里塞进16个核,芯片面积还是有点捉襟见肘,

在最大芯片面积受限的条件下,cache容量肯定受到相当的限制,由于不能放进更多的内存控制器,访存带宽受到的限制也很明显。

——————

黑传说看法:

1、超算用于地震方面的计算比例有点不匹配地震数据所需的运算量?或许是因为游戏方面的计算量比较引人注目,所以相较而言,对地震方面的运算量会感觉到太少

2、国防科大贡献的性能和其所研发的机器数量不成比例,比较生猛。

3、美国还是太强了,但中国也在飞速抢地盘中。

4、以后运算效率和运算资源将是一个科研大国的重要指标,因为太多的东西需要靠这两样来拓展人力和组织形式的极限。