打造HPC E级计算的“高速公路” 中科曙光Torus硅元交换机的“网络革命”
本篇文章1460字,读完约4分钟
11月23日来自顶级网络服务器频道的消息(Text/Li):众所周知,高性能计算机有许多重要的组件,其中最重要的三个硬件组件是计算、存储和网络。当高性能计算机(hpc)的计算能力从P跃升到E,超级计算机的计算核心数量从几十万扩展到几百万时,在超大规模计算下,每个计算单元如何保持高效的互联和协作?
曙光高性能计算产品事业部总经理、英特尔OPA市场总监乔·亚沃斯基(Joe Yaworski)在sc17上正式发布了环面硅开关
曙光公司hpc产品事业部总经理李斌用形象隐喻来描述高性能计算的网络部分与计算单元之间的关系。高性能计算机越来越快。如果我们把计算单元比作汽车,我们应该让它更快,也就是说,让计算单元成为超级跑车。这个网络就是道路,没有一个好的道路支撑,我的车就不能发挥它的速度。
同时,高性能计算的网络与人们通常理解的互联网有很大不同。我们修复了高性能计算机之路,这相当于网络的速度和带宽。同时,要做好道路规划工作,即通过网络的路由算法进行网络拓扑和交通控制。
未来,计算网络的成本将占整个设备的50%,这就是高速网络的重要性。曙光以网络为核心技术,在扩展高性能计算方面取得突破。李斌说环面建筑是这种投资的结果。
圆环硅开关有什么不同?目前,大型超级计算机,尤其是准E级或未来E级系统,在系统规模、可扩展性、成本、能耗和可靠性等方面仍面临严峻挑战。其中,网络面临着更多的挑战。目前,mellanox infiniband和英特尔全向路径在高性能计算系统中得到广泛应用。
这次发布的硅交换机是世界上第一个采用环形结构的高速网络交换机产品。基于它的超级计算机互联网络系统具有领先的性能、超强的可扩展性和卓越的容错能力,是迈向E级的最佳网络技术路线。
与传统的胖树网络拓扑相比,强调相邻互联的环面直接网络具有明显的可扩展性优势,网络开销与系统规模成线性关系。此外,环面网络还具有天然的容错优势,因为它具有许多冗余数据路径,并采用动态路由,这是超大规模系统所需的网络特性,也是国际主流高速网络技术的发展方向。
李斌说,曙光公司早在2015年就在硅立方体高性能计算机上实现了三维圆环。目前,曙光环面网络技术研究在网络路由算法和硬件架构创新两个方面取得了突破。
圆环网络的维数已经从3d发展到6d。增加环面维数可以有效减少大规模系统的最长网络跳数。在软件层面,支持6d-torus的无死锁动态路由算法已经在实际环境中进行了测试。在硬件层面上,这次发布的环形硅开关是一个重要的硬件实现。
硅细胞是指环面高维直接网络中的细胞。一个硅单元采用3d-torus拓扑,多个硅单元可以构建更高维的4d/5d/6d-torus直接网络。将3d-torus硅元件集成到模块化交换机中可以极大地提高系统集成度和密度,减少网络电缆,降低部署复杂性并降低成本。
环形硅交换机可以支持多达192个100gb的高速网络端口,环形硅交换机通过400gb专用接口互连。通过这样的硬件实现,环面高速网络技术的覆盖范围也得到提高,一些中小型高性能计算系统可以更方便地享受这一先进技术。
值得一提的是,这次发布的环面硅开关也支持冷板直接液冷,这表明曙光的液冷技术从计算设备延伸到网络系统。液冷技术还可以在提高大规模网络系统的集成度和可靠性以及降低能耗方面发挥重要作用。
结论
高性能计算和人工智能的蓬勃发展不仅需要计算能力的支持和提升,还需要高速互联网络的护航。未来,曙光将继续在计算、存储、网络等核心技术上创新,为高性能计算向E级计算的发展做出自己的贡献。
标题:打造HPC E级计算的“高速公路” 中科曙光Torus硅元交换机的“网络革命”
地址:http://www.f3wl.com/fsxw/19191.html
免责声明:佛山日报致力于打造最全面最及时的佛山新闻网,部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,佛山日报的作者将予以删除。
上一篇:网络小额贷 监管不懈怠
下一篇:纽约金价22日上涨