Versal™ HBM ACAP 融合了高速存储器、安全连接和自适应计算,可消除内存受限、计算密集型工作负载(如机器学习、数据库加速、新一代防火墙和高级网络测试器)的处理与内存瓶颈。它是零基础构建,可适应不断发展的算法、协议和数据速率。
Versal HBM 系列集成了 HBM2e DRAM,与 DDR5 相比,存储器带宽1提高 8 倍、功耗降低 63%。Versal HBM 系列在经量产验证的 Versal Premium ACAP 系列的基础上构建,集成了广泛的多太比特( multi-terabit )网络连接、功耗优化型链接内核、112Gb/s PAM4 收发器,以灵活适应不断演进的算法和新兴协议。Versal HBM ACAP 在将收发器速度提高一倍的同时,可使用内建加密引擎为网络基础架构的每一层提供安全保护。有了可编程片上网络 (NoC),高达 2.2Tb/s 的片上连接可缓解所有引擎之间的路由拥塞。此外,Versal HBM ACAP 还可提供比上一代 HBM 解决方案高 1 倍的逻辑密度,从而可为不断演进的算法和协议最大限度提高性能。
1. 基于带有四个 DDR5-6400 组件的典型系统实现方案
该系列集成了 HBM2e 技术,可提供 820GB/s 存储器带宽和 32GB 容量,为计算密集型应用降低功耗、时延、外形尺寸。与商用内存解决方案 DDR5 相比,Versal HBM ACAP 通过将堆叠内存放置在紧邻计算结构的位置,使存储器带宽提高 8 倍、功耗降低 63%。集成的 HBM 可通过可编程 NoC,从全球任何地方访问设备。通过集成的内存控制器和增强的硬化交换机功能,可从任何端口访问任何内存位置。
Versal HBM 系列由 58G/112Gb/s PAM4 和 32Gb/s NRZ 收发器组成,具有高度可扩展的收发器,可提供高达 5.6Tb/s 的串行 I/O 带宽。112G PAM4 收发器有助于行业推出 800G 及单信道 100G 容量的基础架构。 对于 400G 的提升与部署,58G PAM4 收发器可针对最大带宽密度实现最新一代接口。 对于电源优化的主流 100G 接口,32Gb/s NRZ 收发器最为理想。可扩展的串行带宽
Versal HBM 系列可提供前所未有的电源优化硬 IP 集成,相当于 14 个 Virtex® UltraScale+™ FPGA 的逻辑密度。Versal HBM ACAP 具有高速以太网、Interlaken 以及支持 DMA 的 PCIe®Gen5,可提供几太字节的连接,为一系列协议和数据速率带来高度的灵活性。Versal HBM ACAP 具有高速以太网、Interlaken,以及内置 DMA 的 PCIe® Gen5,为各种协议和数据速率提供了多太比特( multi-terabit )网络连接。线速高速加密引擎可以完全保护网络流量。
灵活应变的引擎加载了各种各样的片上内存元件,与可编程 I/O 紧密耦合,可提供海量并行处理和定制化功能,这对于许多具有大型数据集的计算密集型工作负载而言至关重要。作为上一代技术的增强版本,DSP 引擎向后兼容于 UltraScale+ FPGA 和 SoC 设计。
DSP 引擎支持多种操作系统和数据类型,包括单精度和半精度浮点以及复杂的 18x18 运算。因此,用户获得最大的计算性能,既可利用现有的库,也可更新其设计。您可利用现有的库或更新设计以获得最大的计算性能。
三种标量处理器可支持不同的应用需求。应用处理单元非常适合操作系统支持的复杂应用,实时处理单元非常适合时延敏感型应用。单独的平台管理控制器管理系统启动、安全性、功耗管理和调试。
了解更多有关 Xilinx 存储器解决方案的信息
了解更多有关 Versal HBM 系列的详情
加入 Versal ACAP 通知列表,即可第一时间获取最新的新闻和信息。
在传统计算架构中,当多个 CPU 内核同时工作时,由于数据从外部内存移动的速度不足而且最终会达到极限,因此系统会停止运行。在传统计算架构中,当多个 CPU 内核同时工作时,由于数据从外部内存移动的速度不足而且最终会达到极限,因此系统会停止运行。相比之下,Versal™ HBM 系列通过灵活应变的引擎和智能引擎提供海量并行处理能力,并通过集成型 HBM 提供极高的存储器带宽。 因此,Versal HBM 系列能够为许多 AI/ML 处理(如余弦相似度和 Louvain 模块化)实现更快速度的精确数据洞察。通过一系列广泛的 Vitis™ 统一软件平台的性能优化库,基于 Versal HBM ACAP 的解决方案可以为快速发展的数据中心及云计算人工智能提供更高的 AI/ML 性能与效率。
预处理数据对于从固定函数计算器件获得最佳结果至关重要。真实 ML 模型的数据集大小很容易超过太字节。因此,目标加速器需要大型数据预处理框架来高效处理这些数据集。使用灵活应变的引擎和 820GB/s 的 HBM 带宽,Versal HBM ACAP 可删除不需要的数据,转换选定的数据,并增强数据,从而可为目标加速器创建强大的预测输入。Versal HBM 系列配备高速 112G PAM4 收发器,能够以低时延最大限度提高吞吐量和系统性能。
网络运营商希望实现不间断的智能管理并提供稳健的网络,以保护数据并避免对企业网络的攻击。
Versal HBM 系列可实现无与伦比的可扩展性,有助于实现从物理层和数据链路层到 VPN,再到传输层安全级别的多层网络安全性,从而可通过定制策略及控制实现数以千万计的同时会话。此外,多个 400G 集成型高速加密 (HSC) 引擎允许系统在不影响性能的情况下,保持行速率吞吐量和低时延。使用 32G HBM,新一代防火墙可以管理多个查找表,无需访问外部内存来缓冲网络流量并对其进行重新排序。112G PAM4 收发器可实现对最新可扩展光学标准和协议的支持,带来新一代防火墙所需的更高吞吐量。灵活应变的引擎有助于 ML 算法针对新兴威胁为安全架构实现现代化。
随着数据中心、云计算和人工智能网络开始为 800G 光网连接做准备,许多数据中心网络和云计算服务提供商需要利用尖端测试设备,才能为计算密集型应用确保互操作性和稳健的网络基础架构。
Versal HBM 器件中的 112G PAM4 收发器是最重要的构建模块之一,可帮助数据中心网络及云计算服务提供商构建能够适应新兴协议和光学互操作性的网络。专用信道化多速率以太网内核提供可单独访问的 HSC、MAC、PCS 和 FEC 模块以及 32G HBM 和可编程 NoC,可为 L4-L7 测试设备的海量流量缓冲、高效数据移动、智能数据流控制、跟踪与报告实现最复杂的测试逻辑。
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
HBM DRAM (GB) | 8 | 16 | 32 | 16 | 32 |
总体模块 RAM (Mb) | 89 | 89 | 89 | 132 | 132 |
UltraRAM (Mb) | 366 | 366 | 366 | 541 | 541 |
总 PL 存储 (Mb) | 509 | 509 | 509 | 752 | 752 |
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
DSP 引擎 | 7,392 | 7,392 | 7,392 | 10,848 | 10,848 |
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
系统逻辑单元 (K) | 3,837 | 3,837 | 3,837 | 5,631 | 5,631 |
LUTs (M) | 1.75 | 1.75 | 1.75 | 2.57 | 2.57 |
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
应用处理单元 | 双核 Arm® Cortex -A72、48KB/32KB L1 高速缓存支持奇偶校验和 ECC,1MB L2 高速缓存支持 ECC | ||||
实时处理单元 | 双核 Arm® Cortex -R5F、32KB/32KB L1 高速缓存以及支持 ECC 的 256KB TCM | ||||
存储器 | 支持 ECC 的 256KB 片上内存 | ||||
连接功能 | Ethernet (x2); UART (x2); CAN-FD (x2); USB 2.0 (x1); SPI (x2); I2C (x2) |
VH1522 | VH1542 | VH1582 | VH1742 | VH1782 | |
---|---|---|---|---|---|
32.75Gb/s 收发器 | 68 | 68 | 68 | 68 | 68 |
GTM 56G (112G) | 20 (10) | 20 (10) | 20 (10) | 60 (30) | 60 (30) |
CCIX & PCIe® (带有 DMA) (CPM) | 2 | 2 | 2 | 2 | 2 |
PCIe | 8 | 8 | 8 | 8 | 8 |
高速加密引擎 | 2 | 2 | 2 | 3 | 3 |
100G Multirate Ethernet MAC | 4 | 4 | 4 | 6 | 6 |
600G Ethernet MAC | 1 | 1 | 1 | 3 | 3 |
600G Interlaken | 0 | 0 | 0 | 1 | 1 |
Versal™ HBM 系列目前处于早期访问阶段。联系本地销售代表,申请加入抢先体验计划,或访问联系销售页面。欢迎利用以下资源进一步了解 Versal ACAP 架构的设计工具和设计方法。
Versal ACAP 采用固有的软件可编程芯片基础架构,其设计自始至终都是以软件为导向的。增强型 Xilinx® Vivado® Design Suite 引入全新系统设计方法和开发环境,如流量分析仪、NoC 编译器和数据流建模等。一个紧密结合的高速、统一调试环境可加速跨灵活应变的标量智能引擎的调试与跟踪。
下载 Vivado Design Suite >
Xilinx Vitis™ 统一软件平台提供了全面的核开发套件,以及使用硬件加速技术的库。该平台提供从云端到边缘的高效、便捷、统一的软件环境。作为开源社区中引以为傲的一员,Vitis 统一软件平台不仅免费,而且还提供一系列性能优化的广泛开源库,这些库可提供开创性加速,对于现有应用而言,代码修改很少,甚至无需修改。
下载 Vitis 统一软件平台 >
面向 Versal HBM 器件的设计人员现在可使用 Versal Premium VPK120 评估套件启动设计。Versal HBM 器件基于与 Versal Premium 系列相同的架构,具有各种通用架构模块,如标量引擎(Arm® 处理子系统)、灵活应变引擎(可编程逻辑)、DSP 引擎、可编程片上网络 (NoC) 和连接块(包括 PCIe®)、400G 高速加密引擎、600G 以太网 MAC、100G 多速率以太网 MAC、600G Interlaken 内核以及 DDR4 控制器等。评估套件拥有启动设计所需的一切,包括执行系统测试、评估关键接口以及采用 ACAP 设计方法的功能。
现在可抢先体验 Versal Premium VPK120 评估套件。联系本地销售代表,申请加入抢先体验计划,或访问联系销售页面。
Xilinx 培训和学习资源提供了实用的实践技能和基础知识,可助力开发者在下一个开发项目中充分发挥生产力。
Xilinx Versal™ ACAP 平台快速上手
使用 Versal ACAP 进行设计 - 电源和开发板设计
使用 Versal ACAP 进行设计:架构和方法
使用 Versal ACAP 进行设计:可编程片上网络