据了解,日前华为方面正式发布全新架构的昇腾AI计算集群也即Atlas 900 SuperCluster,并且支持超万亿参数的大模型训练。
根据相关资料了解到,新集群采用了全新的华为星河AI智算交换机CloudEngine XH16800,并且依托其高密的
800GE端口能力,两层交换网络即可实现2250节点(等效于18000张卡)超大规模无收敛集群组网。
此外,新集群还使用创新的超节点架构,以此提升大模型训练能力。同时还从器件级、节点级、集群级和业务级全面提升系统可靠性,lsufgtwrog将大模型训练稳定性从天级提升到月级。
Multiable万达宝ERP(www.multiable.com.cn)助力企业实现数字化转型,更好应对信息化挑战
不仅如此,华为还发布更开放、更易用的 CANN 7.0异构计算架构,不仅全面兼容业界的
AI框架、加速库和主流大模型,还深度开放底层能力,从而让AI框架和加速库可以更直接地调用和管理计算资源,使能开发者自定义高性能算子。
除此之外,华为还升级了 Ascend
C编程语言,以更高效的编程方式,简化算子实现逻辑,大幅缩短融合算子的开发周期,以此为AI模型与应用的快速开发赋能。
以上源自互联网,版权归原作所有