气象系统初探巴塞罗那真四核威力

2018-06-11    来源:

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

  气象预测一直是高性能计算机产品的主要用户之一,其为人民提供日常生产、生活所必须的信息资料。作为国内服务器行业领军企业的曙光公司,在气象行业应用中有着广泛的经验,早在2002年,曙光公司就推出了基于MM5模式的气象专用机,充分优化了并行机上的MM5模式。随后,曙光公司在2004年为气象行业完成了从32位平台到64位平台的移植。在今年4月,曙光公司又首次完成了WRF模式在X64高性能机群系统上的业务移植,开创了国内在64位机上做WRF模式业务的先河。近期,曙光公司又首度将AMD公司新推出的巴塞罗那处理器成功应用在了气象行业,打造了成熟的四路四核信息化服务系统,为苏州气象局提供了一套集高可用性、高稳定性于一身的科学、成熟的气象预测平台。

  高性能需求的气象预测平台

  气象预测是气象科学中发展最为迅速的一个重要组成部分,他所研究的大气运动关系到区域重要灾害性天气的生消。它一方面应用卫星、雷达、风廓线仪和自动观测站等一系列新的探测工具,获取观测实时数据;另一方面通过数值模式,对天气变化过程进行深入的模拟研究和预报试验。

  苏州气象局是该行政区域内最大的气象事业组织,负责该行政区域内重大灾害性天气跨地区、跨部门的联合监测、预报工作,需及时提出气象灾害防御措施,并对重大气象灾害作出评估,为本级人民政府组织防御气象灾害提供决策依据。在变换莫测的自然天气状况前,苏州气象局需要一套高性能计算机系统,来满足其在气象预测工作中的各种需求。

  首先,气象预报有着惊人的计算量,其必须在规定时间内将各个观测点传输来的实时数据进行分析、计算。而且,伴随人们对气象预测精度所提出的越来越高的要求,气象预报精度的的范围从以往的几百公里缩小到了几公里,这就更加提高了计算模型的运算量。其次,在高速的运算过程中,各个CPU之间的通讯量也非常巨大,整个系统需要有高性能的通讯网络。另外,气象预测具有实时性的特点,整个预测系统需要定时定点运行,无需人工干预,具有良好的管理控制性能。

  本次针对苏州气象局的应用需求,曙光公司将已获得广泛好评的曙光TC4000A机群系统与AMD公司新推出的巴塞罗那处理器相结合,为苏州气象局提供了一整套完善的解决方案。

  高端配置的曙光TC4000A

  曙光公司本次为苏州气象局配置的TC4000A机群系统由20台计算节点、2台I/O节点、1台管理节点和1台登陆节点组成,系统采用Infiniband作为计算网络/数据传输网络,同时配备千兆以太网作为管理维护网络,各配件设施的完美组合,奠定了整体系统高达25600亿次/秒的运算能力。

  天气预报具有很高的时效性,要求在规定的时间内得到预测结果,因此机群系统的运算能力就需要面对海量气象数据的挑战。曙光公司在苏州气象局的机群系统中,用最新2.0GHz的AMD巴塞罗那四核处理器为系统打造了强大的浮点、定点运算能力。这些作为运算核心的高性能处理器,镶嵌在作为计算节点的曙光天阔A820r-F中,每个节点在2U的机架空间内集成了四路四核的体系架构,且均可进行并行计算,形成了强大的处理能力,完全可满足系统的运算需求。

  为提高机群系统的整体性能,机群系统的I/O性能也是需要突破的一大瓶颈,否则机群的运算能力将会受到制约,无法显现四核处理器高速、流畅的运算性能。曙光公司在该系统中将用于计算数据通讯的网络和管理、登陆网络分开搭建,不同用途的数据分流传输,解决了管理系统数据与运算数据争抢带宽资源的窘况。

  在计算数据网络中,双路双核配置的曙光天阔A620r-F担当了系统中的I/O节点,其通过心跳线做成了高可用系统,可为整个系统提供持续的I/O服务。在I/O节点中,Infiniband网络作为接入数据网络,其提供了高达20Gb/s的双向带宽,延迟只有几个微秒。并且,每台I/O节点配置了1块4Gb/s的光纤HBA卡,分别和具备2个4Gb/s主机通道的光纤磁盘阵列柜相连,为系统提供了超强的存储空间和强大的I/O能力。

  在管理和登陆通讯网络中,节点也同样采用天阔A620r-F,加上专用的千兆网,承担起和其它网络的通讯以及系统管理、监控的责任。作为管理、登陆节点,速度不再是苛求的目标,长期平稳的运算性能是用户更为关心的特质。因此,在管理节点机的配置中,设计者别具匠心的在A620r-F中采用了可提供病毒防护功能的高性能BIOS;可以选单/双通道SCSI RAID配置,支持在线恢复RAID阵列;多网卡冗余体系,保证系统稳定均衡的处理网络负载。各种配置,为管理节点提供了细致入微的高可靠性。

  在机群的操作系统中,配有曙光公司独家设计的第二代监控系统,采用并发机制,能够按用户的需求伸缩管理配置功能,可对新增节点提供配置、管理的功能,使其自动纳入管理范围。该种采用模块化形式设计的管理系统,大大提高了系统可靠性和可管理性。

  另外,整个机群的机柜系统采用符合工业标准的41U机柜,内部含网络布线系统,支持强电和弱电分离,可以实现整个机群内24个节点100ms自动分时上电,减少了因集中上电对电源系统造成的冲击,为系统提供了更好的安全性能。

  成熟科学的解决方案

  曙光4000A超级计算机机群系统是一款成熟的产品,在实际应用中的曙光4000A,平均无故障时间(MTBF)突破了25万小时大关,其高稳定性和可靠性已经得到了实际应用的证实。在本次为苏州气象局设计的超级计算机解决方案中,曙光公司将成熟的产品与当前信息技术的发展趋势相结合,在整个方案中体现了优异的先进性、扩展性、兼容性和完整性。

  先进性

  在江苏气象局的信息化解决方案中,无论是在硬件还是软件方面都体现了曙光公司产品的技术先进性,其顺应信息化产业的主流发展趋势,集合新产品和曙光公司的技术优势,为用户提供了更高性能的新世代产品。

  在硬件方面,该解决方案的先进性主要体现在其所配置的“巴塞罗那”四核处理器上。同以往的双核处理器相比,该款AMD新推出的四核处理器,不仅仅增加了CPU Core的数量,其在每一个CPU Core内部,将SSE执行单元加宽至128位,极大的提高了单核心的浮点处理性能,平均性能提高了54%。同时,巴塞罗那处理器沿袭了AMD独特设计的集成内存控制器,使CPU到内存的路径更短,并在内存带宽上采用了一系列优化技术,使得在不做其他改动的前提下,内存性能比双核皓龙提升50%,它们是构建苏州气象局高可用性信息化系统的奠基石。

标签: 安全 标准 服务器 国内服务器 企业 网络 信息化 信息技术 行业 用户

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:AMD核心数学库更新优化巴塞罗那

下一篇:AMD对Barcelona延期的“非官方”声明