博通震撼AI网络领域,推出Thor Ultra网络接口卡
博通震撼AI网络领域,推出Thor Ultra网络接口卡
作者:航标
来源:IT精选
|
在大规模 AI 训练中,网络基础设施已成为性能瓶颈,博通 在过去三年里致力于构建一个 AI 网络产品组合,旨在解决这一问题。 在过去几个月里,该公司推出了用于扩展网络的 Tomahawk 6 交换机和用于数据中心间互联的 Jericho 4。今天,博通 正在迈出下一步,推出专为 AI 后端网络量身定制的 800G Ethernet 网络接口卡——Thor Ultra。
Thor Ultra 代表了一款全新的网络接口卡设计,而不是 博通 之前的 Thor 2 产品的演进。Thor 2 是一款 400G 网络接口卡,服务于多个市场,包括企业市场,而 Thor Ultra 则是一个全新的架构,专注于 AI 扩展部署。该网络接口卡实现了 Ultra Ethernet 联盟(UEC)1.0 规格,并引入了硬件加速功能,以现代化 RDMA。 博通 软件产品与生态系统负责人 Hasan Siraj 向《Network World》表示:“我会说这不是最后一块拼图,而是我们在过去三年中一直致力于的、并在过去三到四个月内交付的完整产品组合中的一块非常重要的拼图。你们要记住的是,这款网络接口卡完全符合 Ultra Ethernet 特性,工作在 800G,而行业中没有任何产品能够满足这一要求。” 扩展(Scale-out)与升级(Scale-up):理解市场细分 Thor Ultra 针对的是一个特定的网络领域,和 GPU-to-GPU 互联的基本方式不同。 在单个机架内,GPU 通过 NVLink 等技术连接,这属于 博通 所说的“扩展(scale-up)”领域。这通常涵盖 72 到 256 个 XPU,直接访问彼此的内存。而 Thor Ultra 解决的是“扩展(scale-out)”连接性,即连接不同机架的网络,以创建跨越数十万 XPU 的集群。它与 Nvidia 的以太网产品(Spectrum-X 交换机和 BlueField NICs)以及 InfiniBand 解决方案竞争,而不是与 NVLink 竞争。 Hassan 解释道:“当你需要离开这个机架,并且需要将多个机架连接在一起时,你就需要扩展。这就是这款网络接口卡的使用场景。” 该网络接口卡提供两种 SerDes 配置。100G 版本提供八条 100G 通道,200G 版本则提供四条 200G 通道。两者都通过 16 条 PCIe Gen 6 通道提供 800G 的总带宽。双配置策略适应了当前的 100G 生态系统和新兴的 200G 部署。 突破 RDMA 架构限制 传统的 RDMA 协议承载着二三十年前起源的设计局限性。它们不支持多路径,无法处理乱序包的交付,并且依赖于 Go-Back-N 重传。在 Go-Back-N 协议下,一个丢失的包会强制重传该包及后续所有包。 这些限制在大规模应用中变得尤为关键。网络拥塞增加了包丢失的概率,而 Go-Back-N 协议通过向已拥塞的链路发送冗余重传,进一步加剧了问题。Thor Ultra 实施了四项架构变更,突破了这些限制。 ● 包级多路径:该网络接口卡将八条 100G 通道划分为不同的网络平面。来自单个消息的包可以分配到所有平面进行负载均衡。标准的 RDMA 要求一个流中的所有包必须经过单一路径,无法进行此类优化。 ● 乱序数据放置:Thor Ultra 在包到达时直接将其写入 XPU 内存,而不考虑顺序。该网络接口卡不缓存等待按序交付的包,而是跟踪包的状态,并立即将每个包放置到正确的内存位置。 ● 选择性确认与重传:Thor Ultra 用选择性确认替代了 Go-Back-N。当包序列 1 到 8 中的第 3 和第 6 个包丢失时,网络接口卡发送一个 SACK,指明哪些包已到达,哪些包丢失。发送方只重传第 3 和第 6 个包。 ● 可编程拥塞控制:该网络接口卡实现了一个硬件管道,支持多种拥塞控制算法。目前提供两种方案:基于接收方的拥塞控制(接收方向发送方发送信用)和基于发送方的方案(发送方计算往返时间以确定传输速率)。该可编程管道可以适应未来的 UEC 规格修订或定制的超大规模算法。 性能与功耗 Thor Ultra 的功耗约为 50 瓦。这与类似 Nvidia BlueField 3 DPU 等产品的 125-150W 相比,功耗较低。这个功耗差异源于架构选择,而非工艺技术。 DPUs 旨在支持多个使用场景,包括前端网络(需要深度包检查和加密)、存储卸载和安全功能。它们集成了 ARM 核心、大型内存子系统和广泛的加速引擎。Thor Ultra 剔除了 AI 后端网络所不需要的所有部分。 总体来说,博通 预计通过高效的负载均衡、乱序交付和选择性重传,作业完成时间将提高 10-15%。公司认为,这一改善足以证明网络投资的价值。 “我们相信可以实现至少 10% 到 15% 的作业完成时间改善。无论是在构建 8,000 节点的集群,还是 100,000 节点的集群时,网络大约占成本的 10-15%。”Hassan 说道,“因此,通过这种创新,网络本身就能支付其成本。” Thor Ultra 正在进行采样,未来将推出 PCIe 和 OCP 3.0 形式的产品。博通 预计这两种形式在未来两年内的出货量大致相同。除了标准卡片形式外,博通 还提供三种额外的消费模式。客户可以购买离散芯片用于定制板设计,XPU 或 GPU 制造商可以将 Thor Ultra 作为芯片模块集成。博通 将以知识产权授权的方式提供该设计。 |

商情
