2021 年 10 月 20 日
编者注:本文由赛灵思芯片市场营销总监 Manuel Uhm 撰写
2021 年 4 月,赛灵思取得了令人激动的阶段性成果,即宣布业界领先的 Versal™ AI Core 和 Versal Prime 系列器件实现全面量产和付运。但是如同我们的宇宙一样,Versal™ 生态系统也在继续迅速扩张,包含更多:
关于这点,我想藉此机会向大家介绍 Versal AI Core 系列的最新扩展。
Versal AI Core 系列的最新扩展为新增两个 VC2xxx ACAP,即 VC2802 和 VC2602。如果您认为 VC2xxxx 器件肯定意味着 AI Core 系列中增添了某些重要的新的硬化 IP 特性,恭喜您答对了!VC2xxx 系列带来了三大激动人心的新特性,正如下方标红部分所示:
AIE-ML 及其与 VC1xxx 器件内的 AI 引擎的差异,详见 Xilinx.com 上的AI 引擎技术页面中的详细介绍。
简单地说,AIE-ML 使用的是与 AI 引擎相同的基础架构和工具流,但通过添加对 INT4、BFLOAT16 的原生支持,将每个 AI 引擎的本地数据存储器容量倍增至 64KB,并新增与 AIE-ML 阵列直接耦合的 512KB 存储器块(即无需将自适应引擎中的邻近可编程逻辑( PL )用于存储器缓存),AIE-ML 还能针对机器学习进行进一步优化。这样一来,与 AI 引擎相比,AIE-ML 的 AI 计算密度提高 4 倍,时延降低一半,与 GPU 相比单位功耗性能增加 4 倍。每个 AIE-ML 大约等同于 100 个 DSP58、2000 个 LUT,以及 16 个 PL 的块 RAM,使用基于 PL 的实现方案能节省 33% 的功耗。
VDU 能够支持单路 4Kp60 流的 H.264 和 H.265 编解码或最多 32 路 720p15 流及两者之间的所有编解码。如果要想在 PL 中实现上述内容,那么每单元需要 12 万个 LUT、50 个 DSP58 和 3 个块 RAM。使用硬化 VDU 后,每个 VDU 的功耗可降低 3.6W。这使其非常适用于众多智能视频应用,在这些应用中,多部视频摄像头向中央枢纽馈送数据,中央枢纽负责解码并执行先进 ML 算法。
况且,PCIe Gen5 还新增了对最先进的 PCI Express 标准的支持。该标准即将在数据中心内部署,以在云端实现更大带宽和更高智能。增加硬化 PCIe Gen5 支持能带来可观的效益,在节省 30 万 LUT的同时,每核心可节省 3W 的功耗。
VC2802 和 VC2602 ACAP 中的所有这些新特性自然必有其用处。它们能够让数量极其繁多的新“智能”应用部署在边缘,部署在世界各地的数据中心。其中一个示例就是智慧城市应用。这类应用使用多个视频摄像头监测车流或行人,并使用实时 ML 算法评估实时流量或边界安全。
另一种智能应用是零售领域的损失预防应用。视频摄像头可以用在商场和店铺里,在销售点实时监控商品失窃或商品贴标错误。缩水是零售业的一大难题,智能零售应用能够显著降低缩水率。
这些只是 Versal 生态系统通过扩张,支持新市场和新用例的一小部分示例。
如果您已准备好立即加入 Versal 生态系统,我想推荐两种评估与原型制作平台作为您的起点。一个是 VCK190 套件,也是首款 Versal AI Core 系列评估套件。另一个是 SmartLynq+模块,为实现高速调试与追溯而构建,提供包含 AI 引擎在内的对 Versal 架构的完整可见性。
此外,我们还提供了丰富的文档、示例、参考设计、资源和方法,为您在评估平台上的开发工作提速。如果您刚刚开始接触 Versal ACAP,也无需担心!您可以先使用我们的设计流程助手启动开发规划,然后使用我们的设计流程中心,按设计流程轻松地找出全部文档。此外,我们还在赛灵思 Github 上提供了大量的 Versal 和 Vitis 开源示例和有针对性的参考设计。
VC2802 和 VC2602 的加入,为 AI Core 系列带来了激动人心的新功能,而未来还会有更多令人兴奋的消息。欢迎登录查看 Versal ACAP 通知清单,最新动态一睹为快!
必威体育客户端app Adapt 中国站
Xilinx Adapt中国站线上大会将于11月16日至12月14日举行,共设9大主题40+演讲。期间将介绍Versal的最新动态和应用实例。更多详情请点击下方图片,查询大会议程。