面向 AI 推断的 VCK5000 Versal 开发卡

概述

产品描述

Xilinx® VCK5000 Versal™ 开发卡基于 Xilinx 7nm Versal™ ACAP 架构构建,旨在满足需要高吞吐量 AI 推断和信号处理计算性能的设计需求。

相较于当前服务器级 CPU,VCK5000 的计算能力提升了 100 倍,相较于当前服务器级 GPU,VCK5000 的 MLPerf 推断性能更佳,并且支持标准化开发流程,VCK5000 是云计算加速和边缘计算应用的理想开发平台。

VCK5000 完全由 Vitis™ AI 开发环境提供支持,包含优化的 IP、工具、库、模型和示例设计等。它采用高效易用的设计理念,可在 VCK5000 上充分发挥人工智能加速的潜力。您可以使用 Python 或 C++ API 在几分钟内运行 Tensorflow、Pytorch 或 Caffe 模型,无需事先掌握任何 FPGA 硬件知识。


主要特性与优势

优异的 AI 推断平台

  • 145TOPS (Int8) @ $2,495
  • 使用 AI 引擎进行 AI 推断,在 MLPerf 1.0 上优于 nVidia T4 的性能
VCK5000 吞吐量图表

随时可用的解决方案

  • 带两个 DPU 变体解决方案的 Vitis AI 1.3(384 和 288 个 AIE 内核)
  • 支持具有 50 多个模型的专区
  • 自然语言 (BERT) 演示
  • MLPerf 提交 ResNet-50 演示(性能比 T4 高 11%)
  • 使用 Vitis AI 启动设计,开发板用户指南

云 <-> 本地 

  • 将解决方案部署在云端或本地,可互换
  • 可扩展,满足应用需求
规格

开发板特性

功耗与热量
卡规格 VCK5000
器件 VC1902
计算 有源 无源*
INT8 TOPs(峰值) 145 145
尺寸
高度 完整 完整
长度 完整 3/4
宽度 双插槽 双插槽
存储器
片外内存容量 16 GB 16 GB
片外总带宽 102.4 GB/s 102.4 GB/s
内部 SRAM 容量 23.9 MB 23.9 MB
内部 SRAM 总带宽 23.5 TB/s 23.5 TB/s
接口
PCI Express Gen3 x 16 / Gen4 x 8 Gen3 x 16 / Gen4 x 8
网络接口 2x QSFP28 (100GbE) 2x QSFP28 (100GbE)
逻辑资源
查找表 (LUT) 899,840 899,840
最大总功率 225W 225W
散热 活跃 无源

* 我们只提供有源开发板。如果按照 VCK5000 Versal 开发卡安全站点上的硬件安装指南从 VCK5000 卸下风扇,则该风扇将变为无源状态。

技术文档
Default Default 标题 文件类型 日期
开始设计

按照以下步骤使用 VCK5000 启动设计:

步骤 1:请按照 VCK5000 Versal 开发卡安全站点的硬件安装指南在 X86 主机上安装 VCK5000

步骤 2:在 X86 主机上安装 AI 1.3.1 docker

             docker pull xilinx/vitis-ai-cpu:latest

步骤 3:请按照 VCK5000 Versal 开发卡安全站点上的指令,运行 51 VCK5000 AI 模型。

若有任何有关 VCK5000 启动的问题,请联系 vck5000-aie_sponsor@xilinx.com