Versal™ 自适应 SoC 中提供了三种标量处理器类型,可支持各种应用需求。应用处理单元适合 OS 支持的复杂应用,而实时处理单元则完美适合需要低延迟、确定性和实时控制的应用。单独的平台管理控制器管理系统引导、安全性和调试。
可编程逻辑可实现为不断变化的算法开发自定义计算模块。Versal 自适应 SoC 中重新排列的逻辑使每个 CLB 的密度提高 4 倍,从而减少了对昂贵全局路由的需求。这些灵活应变的引擎加载了各种广泛的内存元件,并与可编程 I/O 紧密耦合,允许用户为任何应用创建强大的加速器。
AI 引擎为基于矢量的算法提供高达 5 倍的计算密度。AI 引擎针对实时 DSP 和 AI / ML 计算进行了优化,可提供确定性的性能。
增强的 DSP 引擎为新操作和数据类型提供支持,包括单精度和半精度浮点以及复杂的 18x18 操作。
Versal AI Core 系列结合了PCIe® Gen4/Gen5 合规性、CCIX 支持、高性能 GPIO 和支持各种以太网配置的多速率以太网 MAC,以最大程度地提升连接功能能和灵活性。此外,Versal AI Core 系列器件还具有重配置的低延迟 32.75Gb/s 收发器。
功率优化的强化视频解码器单元 (VDU) 包括多个视频解码器引擎 (VDE),支持 H.264 和 H.265,从每个引擎单个 4Kp60 流到多达 32 个 720p15 流。VDU 是许多图像处理应用的理想选择,其中多个视频输入为中央集线器提供解码和执行高级 ML 算法。
可编程片上网络 (NoC) 在 Versal 自适应 SoC 架构中的不同计算引擎与集成 IP 模块之间提供了优化的多兆位互连,从而简化了时序收敛并节省了逻辑资源。NoC 编译器不仅提供优化的编程体验,同时还允许用户管理时延和 QoS,可确保关键数据路径为优先级。
波束成形导致巨大的信号处理需求,这些需求需要实时处理。自适应引擎处理状态控制和数据格式化时,AI 引擎和 DSP 引擎正在处理定点和浮点信号处理工作负载,以实现高性能并行处理。
随着卷积神经网络的不断发展,只有通过 Versal™ AI Core 系列器件才可解决不断增长的计算密度要求,Versal AI Core 系列器件的 AI 引擎经过优化,可有效地交付计算密度,既节省成本又节省能源。
Versal AI Core 系列器件支持在智能城市边缘部署大量新的视频处理应用,其中 AI 引擎驱动实时车牌、面部识别或对象分类、用于视频转码的视频解码器单元和用于视频缩放、压缩和自定义的自适应引擎 。
Versal AI Core 系列可加速并行波束形成和实时图像处理,以创建更高质量的图像和基于机器的图像分析,从而使医生和放射科医生能够更快、更准确地进行诊断。
将功能强大的、基于矢量的 DSP 引擎与较小尺寸的 AI 引擎相结合,可实现先进的雷达,例如有源电子扫描阵列。AI Core 系列器件在单个封装中提供每秒兆位的天线带宽。
实时 DSP 被广泛用于无线通信测试设备中。Versal AI 引擎架构完美适合处理所有类型的协议实现,包括从数字前端到波束成形和基带的 5G。
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
应用处理单元 | 双核 Arm® Cortex -A72、48KB/32KB L1 高速缓存支持奇偶校验和 ECC,1MB L2 高速缓存支持 ECC | |||||
实时处理单元 | 双核 Arm® Cortex -R5F、32KB/32KB L1 高速缓存以及支持 ECC 的 256KB TCM | |||||
存储器 | 支持 ECC 的 256KB 片上内存 | |||||
连接功能 | 以太网 (x2)、USB 2.0 (x1)、UART (x2)、SPI (x2)、I2C (x2)、CAN-FD (x2) |
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
AI 引擎 | 198 | 304 | 300 | 400 | 0 | 0 |
AI 引擎-ML | 0 | 0 | 0 | 0 | 152 | 304 |
DSP 引擎 | 1,032 | 1,312 | 1,600 | 1,968 | 984 | 1,312 |
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
系统逻辑单元 (K) | 815 | 981 | 1,586 | 1,968 | 820 | 1,139 |
LUT | 372,352 | 448,512 | 725,000 | 899,840 | 375,000 | 520,704 |
VC1502 | VC1702 | VC1802 | VC1902 | VC2602 | VC2802 | |
---|---|---|---|---|---|---|
NoC 主 / NoC 从端口 | 21 | 21 |
28 | 28 | 21 | 21 |
DDR 内存控制器 | 3 | 3 |
4 | 4 | 3 | 3 |
CCIX & PCIe® (带有 DMA) (CPM) | 1 x Gen4x16, CCIX |
1 x Gen4x16, CCIX |
1 x Gen4x16, CCIX |
1 x Gen4x16, CCIX |
2 x Gen5x8, CCIX |
2 x Gen5x8, CCIX |
PCI Express® | 4 x Gen4x8 | 4 x Gen4x8 | 4 x Gen4x8 | 4 x Gen4x8 | 4 x Gen5x4 | 4 x Gen5x4 |
100G Multirate Ethernet MAC | 3 | 4 | 4 | 4 | 2 | 2 |
视频解码器引擎 (VDE) | - | - | - | - | 2 | 4 |
GTY 收发器 | 32 | 44 | 44 | 44 | 0 | 0 |
GTYP 收发器 | 0 | 0 | 0 | 0 | 321 | 321 |
1. 16 GTYP 收发器仅在使用 PCI Express 时用于 CPM5。
Versal™ 自适应 SoC 采用固有的软件可编程芯片基础架构,其设计自始至终都是以软件为导向的。增强型 Vivado™ ML 版引入全新系统设计方法和开发环境,如流量分析仪、NoC 编译器和数据流建模等。一个紧密结合的高速、统一调试环境可加速跨灵活应变的标量智能引擎的调试与跟踪。
下载 Vivado ML 版 >
Vitis™ 统一软件平台提供了全面的核开发套件,以及使用硬件加速技术的库。该平台提供从云端到边缘的高效、便捷、统一的软件环境。Vitis 统一软件平台是开源社区引以为傲的一份子,完全免费、开源。
下载 Vitis 统一软件平台 >
AMD Vitis Model Composer 是一款基于模型的设计工具,可在 Simulink® 和 MATLAB® 环境中快速进行设计探索。它可促进 AI 引擎 ADF 图形开发和系统级测试,允许用户将 RTL 和 HLS 块与 AI 引擎内核和/或图形整合在相同的仿真中。如需了解如何将 Versal AI 引擎与 Vitis Model Composer 结合使用,请访问 AI 引擎资源页面。
欢迎率先体验 Versal 自适应 SoC 架构,从零开始构建,实现原生的软件可编程性。通过一系列工具、软件、库、IP、中间件和构架,自适应 SoC 可通过业界标准设计流程实现各种定制化的加速计算解决方案。Versal AI Core 系列 VCK190 评估套件提供快速启动设计所需的一切。
AMD 培训和学习资源提供了实用的实践技能和基础知识,可助力开发者在下一个开发项目中充分发挥生产力。
使用 Versal ACAP 进行设计:架构和方法
使用 Versal ACAP 进行设计:片上网络
使用 Versal ACAP 进行设计 - 电源和开发板设计
使用 Versal AI 引擎进行设计 1 :架构与设计流程
使用 Versal AI 引擎进行设计 2:使用 AI 引擎内核进行图形编程
使用 Versal AI 引擎进行设计 3 – 内核编程和优化