Versal AI Core 系列

Versal AI Core 系列凭借集成型 AI 引擎实现了突破性 AI 推断和无线加速,与当今的服务器级 CPU 相比,可提供超过 100 倍的计算性能

产品优势

拥有产品组合的最高计算能力,可实现最大的 AI 和工作负载加速

自适应 SoC AI Core 芯片图

标量引擎

Versal™ 自适应 SoC 中提供了三种标量处理器类型,可支持各种应用需求。应用处理单元适合 OS 支持的复杂应用,而实时处理单元则完美适合需要低延迟、确定性和实时控制的应用。单独的平台管理控制器管理系统引导、安全性和调试。

自适应引擎

可编程逻辑可实现为不断变化的算法开发自定义计算模块。Versal 自适应 SoC 中重新排列的逻辑使每个 CLB 的密度提高 4 倍,从而减少了对昂贵全局路由的需求。这些灵活应变的引擎加载了各种广泛的内存元件,并与可编程 I/O 紧密耦合,允许用户为任何应用创建强大的加速器。

智能引擎

AI 引擎为基于矢量的算法提供高达 5 倍的计算密度。AI 引擎针对实时 DSP 和 AI / ML 计算进行了优化,可提供确定性的性能。

增强的 DSP 引擎为新操作和数据类型提供支持,包括单精度和半精度浮点以及复杂的 18x18 操作。

 

下一代 I/O

Versal AI Core 系列结合了PCIe® Gen4/Gen5 合规性、CCIX 支持、高性能 GPIO 和支持各种以太网配置的多速率以太网 MAC,以最大程度地提升连接功能能和灵活性。此外,Versal AI Core 系列器件还具有重配置的低延迟 32.75Gb/s 收发器。

视频解码器单元

功率优化的强化视频解码器单元 (VDU) 包括多个视频解码器引擎 (VDE),支持 H.264 和 H.265,从每个引擎单个 4Kp60 流到多达 32 个 720p15 流。VDU 是许多图像处理应用的理想选择,其中多个视频输入为中央集线器提供解码和执行高级 ML 算法。

可编程的片上网络

可编程片上网络 (NoC) 在 Versal 自适应 SoC 架构中的不同计算引擎与集成 IP 模块之间提供了优化的多兆位互连,从而简化了时序收敛并节省了逻辑资源。NoC 编译器不仅提供优化的编程体验,同时还允许用户管理时延和 QoS,可确保关键数据路径为优先级。


了解 AMD FPGA 和自适应 SoC 如何实现 AI 推断加速

AI 推断

查看 Versal AI Core 系列评估套件

开发板与套件

联系 AMD 销售代表,加入抢先体验计划

联系销售
应用

Versal AI Core 系列器件针对计算密集型应用进行了优化,特别是数字信号处理、人工智能和机器学习

 

5G 无线电与波束形成

5G 无线电与波束形成

波束成形导致巨大的信号处理需求,这些需求需要实时处理。自适应引擎处理状态控制和数据格式化时,AI 引擎和 DSP 引擎正在处理定点和浮点信号处理工作负载,以实现高性能并行处理。


数据中心计算

随着卷积神经网络的不断发展,只有通过 Versal™ AI Core 系列器件才可解决不断增长的计算密度要求,Versal AI Core 系列器件的 AI 引擎经过优化,可有效地交付计算密度,既节省成本又节省能源。

数据中心计算

智能城市

面向智能城市的视频处理

Versal AI Core 系列器件支持在智能城市边缘部署大量新的视频处理应用,其中 AI 引擎驱动实时车牌、面部识别或对象分类、用于视频转码的视频解码器单元和用于视频缩放、压缩和自定义的自适应引擎 。


医疗图像处理

Versal AI Core 系列可加速并行波束形成和实时图像处理,以创建更高质量的图像和基于机器的图像分析,从而使医生和放射科医生能够更快、更准确地进行诊断。

医疗图像处理

雷达处理

雷达处理

将功能强大的、基于矢量的 DSP 引擎与较小尺寸的 AI 引擎相结合,可实现先进的雷达,例如有源电子扫描阵列。AI Core 系列器件在单个封装中提供每秒兆位的天线带宽。


无线测试设备

实时 DSP 被广泛用于无线通信测试设备中。Versal AI 引擎架构完美适合处理所有类型的协议实现,包括从数字前端到波束成形和基带的 5G。

无线测试设备
产品表

Versal™ AI Core 系列功能简介

标量引擎功能

VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
应用处理单元 双核 Arm® Cortex -A72、48KB/32KB L1 高速缓存支持奇偶校验和 ECC,1MB L2 高速缓存支持 ECC
实时处理单元 双核 Arm® Cortex -R5F、32KB/32KB L1 高速缓存以及支持 ECC 的 256KB TCM
存储器 支持 ECC 的 256KB 片上内存
连接功能 以太网 (x2)、USB 2.0 (x1)、UART (x2)、SPI (x2)、I2C (x2)、CAN-FD (x2)

智能引擎功能

VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
AI 引擎 198 304 300 400 0 0
AI 引擎-ML 0 0 0 0 152 304
DSP 引擎 1,032 1,312 1,600 1,968 984 1,312

灵活应变的引擎功能

VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
系统逻辑单元 (K) 815 981 1,586 1,968 820 1,139
LUT 372,352 448,512 725,000 899,840 375,000 520,704

平台功能

VC1502 VC1702 VC1802 VC1902 VC2602 VC2802
NoC 主 / NoC 从端口 21 21
28 28 21 21
DDR 内存控制器 3 3
4 4 3 3
CCIX & PCIe® (带有 DMA) (CPM) 1 x Gen4x16,
CCIX
1 x Gen4x16,
CCIX
1 x Gen4x16,
CCIX
1 x Gen4x16,
CCIX
2 x Gen5x8,
CCIX
2 x Gen5x8,
CCIX
PCI Express® 4 x Gen4x8 4 x Gen4x8 4 x Gen4x8 4 x Gen4x8 4 x Gen5x4 4 x Gen5x4
100G Multirate Ethernet MAC 3 4 4 4 2 2
视频解码器引擎 (VDE) - - - - 2 4
GTY 收发器 32 44 44 44 0 0
GTYP 收发器 0 0 0 0 321 321

1. 16 GTYP 收发器仅在使用 PCI Express 时用于 CPM5。

技术文档

技术文档


Versal 设计指南和文档

AMD 提供各类文档、资源和设计方法,以协助您使用 Versal 架构进行开发。 如果您未曾使用 Versal 自适应 SoC 进行开发,您可以使用提供交互式指导的设计流程助手来制定您的开发策略。 设计流程中心按设计流程组织和显示所有 Versal 文档,以便您立即获得所需的信息。


Default Default 标题 文件类型 日期
开始设计

面向所有开发者的集成型软硬件平台

Versal™ 自适应 SoC 采用固有的软件可编程芯片基础架构,其设计自始至终都是以软件为导向的。增强型 Vivado™ ML 版引入全新系统设计方法和开发环境,如流量分析仪、NoC 编译器和数据流建模等。一个紧密结合的高速、统一调试环境可加速跨灵活应变的标量智能引擎的调试与跟踪。
下载 Vivado ML 版 >

Vitis™ 统一软件平台提供了全面的核开发套件,以及使用硬件加速技术的库。该平台提供从云端到边缘的高效、便捷、统一的软件环境。Vitis 统一软件平台是开源社区引以为傲的一份子,完全免费、开源。
下载 Vitis 统一软件平台 >

Versal AI Prime 系列

 

AMD Vitis Model Composer 是一款基于模型的设计工具,可在 Simulink® 和 MATLAB® 环境中快速进行设计探索。它可促进 AI 引擎 ADF 图形开发和系统级测试,允许用户将 RTL 和 HLS 块与 AI 引擎内核和/或图形整合在相同的仿真中。如需了解如何将 Versal AI 引擎与 Vitis Model Composer 结合使用,请访问 AI 引擎资源页面​。

下载 Vitis Model Composer >


Versal 自适应 SoC 评估套件

欢迎率先体验 Versal 自适应 SoC 架构,从零开始构建,实现原生的软件可编程性。通过一系列工具、软件、库、IP、中间件和构架,自适应 SoC 可通过业界标准设计流程实现各种定制化的加速计算解决方案。Versal AI Core 系列 VCK190 评估套件提供快速启动设计所需的一切。

了解更多有关 Versal AI Core 系列 VCK190 评估套件的信息 >


培训课程


Versal 设计指南和文档

AMD 提供各类文档、资源和设计方法,以协助您使用 Versal 架构进行开发。 如果您未曾使用 Versal 自适应 SoC 进行开发,您可以使用提供交互式指导的设计流程助手来制定您的开发策略。 设计流程中心按设计流程组织和显示所有 Versal 文档,以便您立即获得所需的信息。

视频

重要视频


所有视频

Default Default 标题 日期