立即注册
查看: 582|回复: 1

[资料] 芯科|silicon labs Versal:第一个自适应计算加速平台(ACAP)

已绑定手机
发表于 2022-10-26 16:36:50 | 显示全部楼层 |阅读模式 来自 广东省深圳市
推出 Versal ACAP,这是一个完全软件可编程的异构计算平台,它结合了标量引擎、自适应引擎和智能引擎,与当今最快的 FPGA 实现相比,性能显着提升高达 20 倍,与当今最快的 CPU 实现相比,性能提升超过 100 倍——适用于数据中心 、有线网络、5G 无线和汽车驾驶辅助应用

介绍
半导体工艺中最近的技术挑战阻碍了传统“一刀切”的 CPU 标量计算引擎的扩展。 如图 1 所示,半导体工艺频率缩放的变化迫使标准计算元件变得越来越并行 [参考文献 1]。

图 1:处理器性能与时间

图 1:处理器性能与时间

图 1:处理器性能与时间

因此,半导体行业正在探索替代的特定领域架构,包括以前归入特定极端性能领域的架构,例如基于矢量的处理(DSP、GPU)和完全并行可编程硬件(FPGA)。问题变成了,哪种架构最适合哪种任务?
 标量处理元素(例如 CPU)在具有多种决策树和大量库的复杂算法中非常有效,但在性能扩展方面受到限制。
 矢量处理元素(例如,DSP、GPU)在更窄的可并行计算功能集上更有效——但由于不灵活的内存层次结构,它们会遇到延迟和效率损失。
 可编程逻辑(例如,FPGA)可以针对特定的计算功能进行精确定制,这使得它们在延迟关键的实时应用(例如,汽车驾驶员辅助)和不规则的数据结构(例如,基因组测序)中表现最佳——但算法传统上,更改编译需要数小时而不是几分钟。

图 2:计算引擎的类型

图 2:计算引擎的类型

图 2:计算引擎的类型

为了回答这个问题,Xilinx 推出了一种革命性的全新异构计算架构,即自适应计算加速平台 (ACAP),它提供了所有三个领域中最好的——与下一代可编程逻辑 (PL) 紧密耦合的世界级矢量和标量处理元件 ,所有这些都与高带宽片上网络 (NoC) 捆绑在一起,它提供对所有三种处理元素类型的内存映射访问。 这种紧密耦合的混合架构允许比任何单独的实现更显着的定制和性能提升。 请参见图 3。

图 3:三种可编程引擎的异构集成

图 3:三种可编程引擎的异构集成

图 3:三种可编程引擎的异构集成


性能的如此显着提高需要对专注于易用性的工具进行类似的显着改进。 ACAP 专门设计用于开箱即用,无需 RTL 流程。 ACAP 本身是软件可编程的,支持基于 C 和基于框架的设计流程。这些设备具有一个集成外壳,其中包含一个缓存一致的主机接口(PCIe® 或 CCIX 技术),具有集成的 DMA、一个 NoC 和集成的内存控制器,从而消除了对 RTL 工作的需求。

新的 ACAP 架构还显着提高了易用性。它提供了一个完全集成的内存映射平台,用于通过统一的工具链进行编程。 Xilinx 工具链支持各种类型的开发人员的多种输入方法。例如,某些应用程序(例如 AI 机器学习推理)可以在框架级别(例如 Caffe、TensorFlow)进行编码;其他可以使用预先优化的库(例如,5G 无线电的过滤器)在 C 中编码。传统硬件开发人员仍然可以通过传统的 RTL 入口流程将他们现有的 RTL 移植到 ACAP。

本白皮书回顾了推动基于 CPU 的传统计算模型发生变化的需求,详细探讨了其他选项,并推出了业界首个异构计算平台 Xilinx Versal ACAP。

ACAP 的三大优势包括:
1. 软件可编程性——通过软件抽象工具链快速开发优化应用程序的能力。
2. 加速——人工智能、智能网络接口卡、高密度存储、5G 无线、自动驾驶汽车、高级模块化雷达和太比特光学网络等广泛应用的指标。
3. 动态自适应重新配置——重新配置硬件以在几毫秒内加速新负载的能力。

更多内容请查看附件
游客,如果您要查看本帖隐藏内容请回复



已绑定手机
发表于 2022-10-27 07:49:18 | 显示全部楼层 来自 江苏省徐州市
谢谢分享
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

合作/建议

TEL: 19168984579

工作时间:
周一到周五 9:00-11:30 13:30-19:30
  • 扫一扫关注公众号
  • 扫一扫打开小程序
Copyright © 2013-2024 一牛网 版权所有 All Rights Reserved. 帮助中心|隐私声明|联系我们|手机版|粤ICP备13053961号|营业执照|EDI证
在本版发帖搜索
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表