AMD、博通、思科、谷歌、HPE、英特尔、Meta和微软等组成UALink推广小组,目标是制定新的行业标准,连接数据中心的AI加速器芯片。这个小组将定义和建立一个开放的行业标准,使 AI加速器能够更有效地通信。通过创建基于开放标准的互连,UALink 将使系统 OEM、IT 专业人员和系统集成商能够为其 AI 连接的数据中心创建一条更轻松的集成、更大的灵活性和可扩展性的途径。
Ultra Accelerator Link (UALink) 是一种高速加速器互连技术,可提高下一代 AI/ML 集群的性能。上述八家科技大厂正在组建一个开放的行业标准机构,以制定技术规范,促进新兴使用模式的突破性性能,同时支持数据中心加速器的开放生态系统。
推动 AI 工作负载的扩展
随着对 AI 计算的需求不断增长,拥有一个强大、低延迟且高效的扩展网络至关重要,该网络可以轻松地将计算资源添加到单个实例中。为扩展功能创建开放的行业标准规范将有助于为 AI 工作负载建立开放的高性能环境,从而提供最高的性能。
这就是 UALink 和行业规范变得至关重要的地方,它们可以为下一代 AI 数据中心和实施标准化 AI 和机器学习、HPC 和云应用程序的接口。该小组将制定一项规范,以定义 AI 计算舱中加速器和交换机之间扩展通信的高速、低延迟互连。1.0
规范将支持在 AI 计算舱内连接多达 1,024 个加速器,并允许在舱内连接到加速器(如 GPU)的内存之间进行直接加载和存储。 UALink 发起人小组已成立 UALink 联盟,预计该联盟将于 2024 年第三季度成立。1.0 规范预计将于 2024 年第三季度推出,并提供给加入 Ultra Accelerator Link (UALink) 联盟的公司。
AI加速器市场主导者英伟达并未加入UALink小组,可能因其已有专有互连技术。UALink的成立对希望减少对英伟达依赖的公司尤为重要,它们正发展自己的AI芯片,如微软的Cobalt和Maia,可能用于连接训练AI模型的超级计算机。