AI/HPC 集群处理着海量的价值数据,已成为现代基础设施的关键组成部分,因此必须在所有可能面临潜在威胁的层面对其提供保护。网络安全是其中的核心环节,旨在提供:
• 访问控制 – 仅允许授权节点或用户访问计算系统。
• 数据机密性 – 对传输中的数据进行加密,并防止加密密钥被破解。
• 数据隔离 – 针对属于不同应用、任务或用户的数据,使用不同的安全域和加密密钥。
• 威胁检测 – 能够识别对数据和关键网络报头(header)的篡改,并识别数据包重放或延迟等异常情况。
由于每个 AI/HPC 系统的规模巨大且成本高昂,因此需要支持极高的利用率以确保投资回报。这就要求网络安全功能必须与 AI/HPC 系统的整体目标保持一致:
• 高吞吐量 – 理想状态下达到全线速
• 极低的延迟影响
• 高效支持系统规模(包括端口数量、节点数量及安全域数量)
• 合理的芯片面积与功耗成本
专为 AI 与 HPC 打造的超以太网
超以太网联盟(Ultra Ethernet Consortium)成立于2023年。该组织汇聚了高性能计算及连接领域的领先企业,旨在通过标准化高性能以太网堆栈,满足AI/HPC的需求,从而提升以太网的能力。
2025 年 6 月公开发布的 UEC v1.0 规范定义了一种传输协议(UET)。该协议能够实现数据在网络与应用内存之间的直接传输,无需软件参与,这种方式被称为“远程直接内存访问(RDMA)”。这一全新的传输协议对目前广泛使用的 RoCE v2(基于融合以太网的 RDMA)进行了多项增强,且两者将在未来一段时间内并存。在传输协议保护方面,UEC 定义了传输安全子层(TSS)。TSS 借鉴了 IPsec 和 PSP(谷歌开源安全协议)的概念,以高效支持大规模的多样化应用场景。作为一种新协议,TSS 与此前定义的任何协议均不兼容,但其在实现方式上与线速 MACsec 及 IPsec 解决方案有许多共同之处。
TSS 协议的设计初衷是保护载荷并支持对网络报头进行可选认证,同时确保路由和负载均衡信息仍可被访问。此外,TSS 还允许以明文形式保留部分 UEC 传输报头,以便于检查与调试。这意味着交换机架构无需处理 TSS 层,其在数据包中的存在对网络运行是透明的。因此,TSS 将仅被部署在智能网卡(SmartNIC)上,市场也将随之出现两类 SmartNIC:一种是仅支持 UEC 的(仅需 TSS 提供安全防护),另一种是同时支持 UEC 和 RoCE 的(除 TSS 外,还需支持 IPsec,必要时还需支持 MACsec)。
适用于超以太网 TSS 的 Rambus 安全 IP
Rambus 凭借在数据中心、企业及基础设施市场广受认可的线速 MACsec 与 IPsec 产品,现针对 TSS 协议保护下的 UET 传输推出两款全新的安全解决方案:
• UET-TSS-IP-69:一款串联多通道 TSS 转换引擎,速率高达 1.6Tbps。该产品适用于已经具备分类功能(classification)和策略数据库(policy databases)的客户。
• UET-TSS-IP-369:一款高性能、多通道串联数据包引擎,可提供完整的 TSS 层功能,速率高达 1.6Tbps。该产品内置了 UET-TSS-IP-69 作为处理数据通路,并补充了分类、SDKDB、密钥管理及统计功能。
UET-TSS-IP-369 框图
这两款 UET-TSS IP 解决方案预计将广泛应用于 SmartNIC(智能网卡)和网卡小芯片(NIC chiplets),并在未来成为基于 UET 的 NVMe-oF 存储控制器的重要组成部分。凭借在安全技术领域三十多年的深厚积累,Rambus 提供业界最广泛且性能最卓越的安全 IP 解决方案组合,并由 Rambus 资深安全专家提供世界一流的技术支持。如需了解更多详情,请访问 Rambus 安全 IP 页面。