全球对人工智能计算的需求使得数据中心耗电量就像兄弟会喝啤酒一样。但明尼苏达大学的研究人员可能有一个极具创新性的解决方案,即使用一种全新的设备来抑制人工智能对电力的日益渴求,这种设备有望实现极高的能源效率。
研究人员设计了一种新型“计算随机存取存储器”(CRAM:computational random-access memory)原型芯片,与目前的方法相比,它可以将人工智能应用的能源需求降低1,000 倍甚至更多。在一次模拟中,CRAM 技术显示出令人难以置信的 2,500 倍节能效果。
传统计算依赖于已有数十年历史的冯·诺依曼架构,该架构由独立的处理器和内存单元组成,需要不断来回移动数据,这是一个耗能过程。明尼苏达团队的 CRAM 完全颠覆了该模型,它使用称为磁隧道结 (MTJ) 的自旋电子器件直接在内存内部进行计算。
自旋电子设备并不依赖电荷来存储数据,而是利用电子自旋,为传统的基于晶体管的芯片提供了更有效的替代品。
《自然》杂志发表的论文合著者 Ulya Karpuzcu 表示:“作为一种极其节能的数字内存计算基板,CRAM 非常灵活,可以在内存阵列的任何位置执行计算。因此,我们可以重新配置 CRAM,以最好地满足各种人工智能算法的性能需求。”他补充说,它比当今人工智能系统的传统构建块更节能。
通过消除逻辑和内存之间耗电的数据传输,类似这种原型的 CRAM 技术对于在人工智能能源需求激增的时代大幅提高其能源效率至关重要。
国际能源署 3 月份预测,全球用于人工智能训练和应用的电力消耗可能会增长一倍以上,从 2022 年的 460 太瓦时增至 2026 年的 1,000 多太瓦时——几乎相当于日本全国的用电量。
研究人员表示,这一突破的基础已经酝酿了 20 多年,可以追溯到工程学教授王建平在使用 MTJ 纳米设备进行计算方面的开创性工作。
王承认,他们最初提出的抛弃冯·诺依曼模型的提议在二十年前“被认为是疯狂的”。但明尼苏达团队坚持了下来,在王的专利 MTJ 研究的基础上,开发出了磁性 RAM (MRAM),目前这种技术已用于智能手表和其他嵌入式系统。
当然,与任何此类突破一样,研究人员仍需应对可扩展性、制造和与现有硅片集成方面的挑战。他们已计划与半导体行业领导者进行演示合作,以帮助将 CRAM 变成商业现实。
研究人员开发出最先进的设备,使人工智能更加节能
明尼苏达大学双城分校的工程研究人员展示了一种最先进的硬件设备,它可以将人工智能 (AI) 计算应用的能耗降低至少 1,000 倍。
这项研究发表在《自然》杂志的同行评议科学期刊 《npj Unconventional Computing》上。研究人员拥有该设备所用技术的多项专利。
随着人工智能应用需求的不断增长,研究人员一直在寻找方法来创建更节能的流程,同时保持高性能和低成本。通常,机器或人工智能流程在逻辑(系统内处理信息的地方)和内存(存储数据的地方)之间传输数据,消耗大量的电力和能源。
明尼苏达大学科学与工程学院的一组研究人员展示了一种数据永远不会离开内存的新模型,称为计算随机存取存储器(CRAM)。
明尼苏达大学电气与计算机工程系博士后研究员、论文第一作者杨吕说:“这项工作是 CRAM 的首次实验演示,其中数据可以完全在存储器阵列内处理,而无需离开计算机存储信息的网格。”
国际能源署(IEA)于2024年3月发布了全球能源使用预测,预测人工智能的能源消耗可能会从2022年的460太瓦时(TWh)增加一倍至2026年的1,000 TWh。这大致相当于日本整个国家的电力消耗。
据新论文作者称,基于 CRAM 的机器学习推理加速器估计可实现 1,000 量级的改进。另一个例子显示,与传统方法相比,能源节省了 2,500 倍和 1,700 倍。
这项研究已经进行了二十多年,“我们 20 年前直接使用存储单元进行计算的最初想法被认为是疯狂的”,该论文的资深作者、明尼苏达大学电气与计算机工程系杰出 McKnight 教授兼 Robert F. Hartmann 主席王建平 (Jian-Ping Wang) 说道。
王说:“自 2003 年以来,随着学生群体的不断发展,以及明尼苏达大学建立起一支真正的跨学科教师团队——从物理学、材料科学与工程、计算机科学与工程到建模和基准测试以及硬件创建——我们能够取得积极的成果,现在已经证明这种技术是可行的,并且已经准备好融入技术中。”
这项研究是王教授及其同事长期不懈努力的一部分,该研究以磁隧道结 (MTJ) 器件的开创性专利研究为基础,MTJ 器件是一种纳米结构器件,用于改进硬盘、传感器和其他微电子系统,包括磁性随机存取存储器 (MRAM),已用于微控制器和智能手表等嵌入式系统。
CRAM 架构实现了真正的在内存中进行计算,打破了传统冯·诺依曼架构中计算与内存之间的瓶颈——冯·诺依曼架构是一种存储程序计算机的理论设计,是几乎所有现代计算机的基础。
“作为一种极其节能的数字内存计算基板,CRAM 非常灵活,可以在内存阵列的任何位置执行计算。因此,我们可以重新配置 CRAM,以最好地满足各种 AI 算法的性能需求,”计算架构专家、论文合著者、明尼苏达大学电气与计算机工程系副教授 Ulya Karpuzcu 表示。“它比当今 AI 系统的传统构建块更节能。”
Karpuzcu 解释说,CRAM 直接在存储单元内执行计算,有效利用阵列结构,从而无需缓慢且耗能的数据传输。
最高效的短期随机存取存储器 (RAM) 设备使用四到五个晶体管来编码 1 或 0,但 MTJ(一种自旋电子器件)可以以极低的能量执行相同的功能,速度更快,并且能够适应恶劣环境。自旋电子器件利用电子自旋而不是电荷来存储数据,为传统基于晶体管的芯片提供了更高效的替代方案。
目前,该团队一直计划与明尼苏达州等半导体行业领导者合作,提供大规模演示并生产硬件以推进人工智能功能。