大规模加速您的工作负载
面向每个数据中心的 HPC 集群
利用现有数据中心服务器基础架构在 RoCE v2 和 DCBx 上扩展架构
在多个卡之间共享工作负载和内存
MPI 支持在多个节点之间实现 Xilinx 自适应计算的超并行性
软件开发人员和数据科学家通过借助 Vitis™ 平台实现应用和集群的高层次可编程性,从而能够充分发挥 Alveo 和自适应计算的优势。
Xilinx Vitis™ 统一软件平台 包括一组广泛的、性能优化的开源库,这些库提供了即开即用的加速功能,并且对现有应用实现最小化代码更改或零更改。
Vitis HPC集群库
Alveo U55C卡加速的应用
图形数据库分析加速
Alveo U55C卡能够把推荐引擎的查询和预测时间从数分钟缩短到数毫秒。与基于CPU 的集群相比,U55C 凭借优异的计算能力和内存带宽,能够将图形查询速度提升 96 倍,同时将分数质量提高多达 35%。
这样的改进能大幅提升置信度,将误报几率降低到较小的个位数。
世界上可扩展程度最高的图形数据库 TigerGraph 采用 Xilinx 技术加速其基于软件的图形分析解决方案。
TigerGraph利用多个 Alveo U55C 卡,充分发挥 Xilinx 大规模集群优势,从而能够为余弦相似度和 Louvain 模块化这两种最常用的驱动图形推荐引擎的算法加速。
与在 CPU 上运行 TigerGraph 余弦相似度推荐引擎相比,本次测试中的 Alveo U55C 卡运行速度提升了 96 倍,在几毫秒内就能从数百万份患者记录中获得结果。
借助在 Alveo U55C 卡上运行的 TigerGraph 图形分析数据库,Louvain 集群算法能够将数百个银行账户欺诈检测速度提升 45 倍。
有限元法加速
矩阵的维度 - 1200 万
以秒为单位的时间:JPCG 求解器方程运行时间
CPU: Intel Xeon E5-2665
Ansys LS-DYNA是一种通用的有限元程序,能够仿真复杂的实际问题。LS-DYNA让设计人员和工程师能够创建具有无限复杂度的仿真。
在这个测试里,LS-DYNA利用 Alveo U55C 卡的扩展架构和非层级内存结构,从而能够实现比其他解决方案快 5 倍的求解速度。
实时信号处理加速
英联邦科学与工业研究组织 (CSIRO) 的平方公里阵列 (SKA) 是世界最大的射电天文望远镜天线阵列——该阵列依靠 Alveo U55C 卡对 15Tbps 的输入数据开展端到端信号数据包处理,从而生成实时数据流。
基于 Alveo 卡的集群让 CSIRO 能够解决庞大的计算任务,比如从 13.1 万根天线中实时聚合、筛选、准备和处理数据。通过支持 P4 的 100Gbs 交换机实现完全连接的 420 个 Alveo U55C 卡可在整个信号处理集群上提供 460GB 的 HBM2 带宽。
边缘上的传感器爆发式增长加速了实时数据处理需求。
运行流传感器数据集群的普通 GPU 完全无法匹敌 Alveo U55C 卡所能提供的价格、性能和功耗。
云端或本地的轻松评估