AI热潮,算力概念乘风而上。近日,“我国算力总规模全球第二”的话题热度不断飙升。
工信部4月11日公布的数据显示,截至去年底,我国算力总规模达到180百亿亿次浮点运算/秒,存力总规模超过1000EB (1万亿GB)。国家枢纽节点间的网络单向时延降低到20毫秒以内,算力核心产业规模达到1.8万亿元。中国信息通信研究院测算,算力每投入1元,将带动3至4元的GDP经济增长。
不过,上述数据中的“算力”只是一个笼统的算力概念,实际上根据不同应用领域分类,算力可以被分为基础算力、智能算力和超算算力。在产业数字化进程中,各行业转型升级需要大量且不同类型的算力支撑,这其中超算凭借强大的计算性能,在尖端科学领域,比如行星模拟、药物分子设计、基因分析、高端制造等等,逐渐成为最优解。
超算被熟知,很大程度上与超算原来越“普惠”的市场化进展有关。钛媒体App了解到,与以往服务于高精尖科研项目的尖端超算不同,如今,超算逐渐演化出通用超算和行业超算,进一步的分化和场景上的针对性,以及将超算搬上云端的服务模式,让超算开始为大众与中小微企业服务。
超算的“最后一公里”
超算普惠,一是要“可用”,二是要“好用”。
通用超算和行业超算的分化只是让超算走下神坛,“可用”问题被解决。但要解决“好用”,最关键的要解决超算资源有限而造成的“用超算,先排队”的问题,同时再把超算的成本打下来。多种因素促成下,超算云服务化进入公众视野。
与传统超算用户自己购买设备、自己建机房、自己运维相比,超算云化有明显的性价比优势。同时,算云融合,也很大程度上降低了广大科研和企业用户使用超算的成本。但在实际落地过程中,由于目前国内各个超算中心的算力资源配置不一样,应用软件使用不一样,每个用户对计算效率的要求也不一样,导致用户使用算力还面临着资源选型困难、性能移植部署困难、技术获取服务困难等各类问题。
也就是说,当用户想使用超算的时候,通过什么样的软件调取超算资源实际上也不是一件容易事,超算普惠的最后一公里,让超算“可用”和“好用”,还需要再超算平台与实际用户之间构建一个繁荣多元的超算软件生态。
“从真实应用运行特征入手,综合考虑不同应用场景下各类算力资源和应用计算的性能表现,再通过对各类应用的精细化分析,为不同用户选择更适合的应用程序。”北京超算(北京超级
云计算中心简称)技术总监甄亚楠对钛媒体App表示。
北京超算的实践经验是将解决方案具体细化,只有打通了超算软件应用生态的最后一公里,进一步才是向企业级用户提供一些定制化的算力服务。“包括算力资源、网络资源、存储资源的定制。”甄亚楠说。
不过,有意无意间,在构建一个多元的超算软件生态的过程中,“工业软件”成为了超算场景下成长最快的应用类型。
超算上长出“工业软件”
工业软件被卡脖子,这是个被诟病已久的问题。在陆陆续续海外工业软件停服的案例曝出之后,加大中国工业软件的创新速度,就成为了一件非常迫切的事情。而超算与工业软件的化学反应,也在这一过程中产生。
论应用,工业软件的研发实践需要大量的高性能计算来辅助,它与超算能称得上天然适配。近年来,我国的工业软件领域时常面临“卡脖子”问题,“打好科技仪器设备、操作系统和基础软件国产化攻坚战”也被点名提出,因此,我国超算服务商也在逐渐走上助力国产工业软件的道路。
助力国产工业软件,首先是帮助其上“云”,建立算力供应链,借助超算云服务化模式,在提供大量高性能的算力资源的同时,还能充分发挥算云融合优势。
但这一过程,具体是怎么有效落地的呢?
钛媒体App了解到,最重要的是算力供应链的建立。通过帮助国产工业软件实现上云,能够使产业链上各企业、部门进行高效协作,共同达成智能供应链协同;通过保稳算力供应链,超算平台从对接算力用户到对接国产软件研发团队,充分发挥桥梁作用。
而提到保稳供应链,其实就是供应链安全性问题。钛媒体App了解到,北京超算主要是从保障算力供应链以及保障软件供应链两方面入手,来提升算力服务的支撑能力:
在保障算力供应的安全方面,现在北京超算拥有国内最大的通用算力资源池,同时也引入了百PFlops的国产算力资源,可以实现国产算力有效替代,满足不同用户的算力需求;
在保障软件供应链方面:北京超算将国产算力资源带入到国产应用软件生产和研发的关键环节,来保障软件供应链安全;目前,其平台已经部署了超过200款的通用计算软件,还有覆盖工业仿真、材料计算、生命科学等细分领域超过30款的国产工业软件。
甄亚楠表示,许多软件在研发之初都已经开始考虑直接基于云上的环境进行安装和部署,相对于传统的比如刻光盘或者刻优盘去卖软件的方式,云端共享软件的模式更为灵活。“尤其是国产工业软件云化,能够搭载互联网优势,使用户快速、及时地获取国产工业软件的最新功能信息。此外,国产工业软件上云也会加速软件的开发迭代,通过云化的服务模式开拓出更多的部署环境。”甄亚楠说到。
不过,帮助工业软件云化和保障算力供应链安全只是其一,随着AI时代的加速到来,不只是超算,未来工业软件对AI算力或者说智能算力的需求也会逐渐加大,大量的工业类数据需要分析和价值挖掘,超算平台在塑造多元软件生态的过程中,这一趋势也不得不考虑。
根据中国信息通信研究院发布的《中国算力发展指数白皮书(2022年)》,2021年全球计算设备算力总规模达到615EFlops,同比增长44%,其中智能算力规模为232EFlops,超级算力规模为14EFlops;2021年中国算力总规模达到202EFlops,其中智能算力规模达104EFlops,增速85%,占比超过50%;预计2030年全球算力规模达到56ZFlops,平均年增速达到65%。
甄亚楠介绍,针对ChatGPT一类的大语言模型,考虑到其强劲的算力需求以及预训练模型的数据处理需要,目前北京超算已经具备了百卡、千卡规模的算力服务能力。此外,北京超算在积极寻求与国内顶尖研究机构的合作,通过集成部署通用框架、自研算法等方式来满足算力需要。截至目前,北京超算已经部署了如A100、V100等在内的多种GPU芯片,以及优化部署了一批常用的深度学习框架。
回归应用,甄亚楠表示,在人工智能场景中,北京超算一方面建设以GPU或加速卡为代表的算力资源,帮助加速科学计算以及人工智能计算结果生成。另一方面,面向推理场景,通过建设大量基于云计算的云主机资源,帮助用户顺利开展在线推理业务。
基于超算云服务化模式,算力市场还有很大的拓展空间,北京超算助力国产工业软件的实践效果还有待验证。而AI带动的万亿蓝海,就在那里,依旧波涛汹涌。