借助第二代 AMD VERSAL 实现先进医疗成像

07q4_赛灵思 2024-12-04 91

医疗电子

431人已加入

描述

诊断医疗成像设备必须能够产出高质量图像、实现所需的扫描深度，以及显示实时结果。设备中采用的最优片上系统（ SoC ）必须提供所需的应用性能、目标帧率并实时显示结果。SoC 也必须恰当结合高速接口的类型、速率和数量。放眼未来，这类设备中的大部分还需要支持 AI 功能的执行和加速，例如感兴趣区域（ ROI ）选择、图像分类和其他 AI 任务。

第二代 Versal 自适应 SoC 配备的处理系统可提供比前代至高多出 10 倍的标量算力性能1，同时支持 DDR5 内存。第二代 Versal AI Edge 系列中的新 AI 引擎能提供与前代相比至高 3 倍的每瓦 TOPS2 。它们非常适合执行高级波束成形算法、图像重建和其他高性能功能。下一代连接（如 PCIe Gen5、32G 高速收发器、10GbE 和 USB 3.2 ）允许高速数据传输，既可用于信号采集，也可用于高效数据迁移。

主要优势

异构处理的单芯片集成能够降低系统级功耗

利用 AI 引擎加速复杂的神经网络，例如用于检测重大疾病的感兴趣区域选择

结合 DSP 块和 AI 引擎，以解决重要的数字信号处理挑战，如 MR 中的 2D-FFT、CT 中的反投影，以及用于超声的高级波束成形

借助 AMD Vitis 统一软件平台，使用 C、C++ 或 Python 快速开发自定义算法

采用 Vitis Model Composer 和 Simulink 部署 MATLAB 算法

亮点:

借助下一代处理器系统实现至高 10 倍的标量算力1

8 核 Arm Cortex-A78AE – 至高 200,000 DMIPS

10 核 Arm Cortex-R52 – 至高 23,000 DMIPS

DDR5 内存支持至高 5600-DDR5、8533-LPDDR5X，支持 ECC

下一代高性能 AI 引擎

与前代相比至高 3 倍的每瓦 TOPS2

增加对 MX6、MX9、FP8 和 FP16 数据类型的支持

利用增加的 DDR 带宽实现更高的神经网络推理和信号处理工作负载性能

集成的视频处理

图像信号处理器（ ISP ）

视频处理管线（ VPP ）

视频编解码器单元（ VCU ）用于 4k60 HEVC/AVC3

图形处理单元（ GPU ），具备至高 256 GFLOPS

高速连接

32G 高速收发器

专用高速接口，用于 USB 3.2、10GbE、PCIe Gen5、NVMe、UFS 和 HSM（无需 FPGA 软 IP ）

目标应用

医疗超声

诊断医疗车超声系统广泛用于通用成像和妇产科，而且正在迅速扩展到心脏和放射学功能。对于 3D-4D 可视化、具备高质量图像输出的波束成形图像、实时信号处理、ROI 和使用 AI 的 IR 的种种挑战性要求正在加大商用扫描仪的算力负担。

第二代 Versal AI Edge 系列具有 Arm 多处理器的异构架构、基于 SIMD-VLIW 的 AI 引擎、可编程逻辑和高速接口，非常适合医疗超声。该器件能满足先进的高端放射学和心脏成像超声系统对图像质量、帧速率、多维可视化和 AI 处理的要求。

CT 扫描仪和 MRI

CT 扫描仪和 MRI 是大型、高度同步的医疗诊断机器，用于查看人体组织、器官和骨骼结构的细节。它们还能识别异常组织。尽管存在根本性差异（ CT 使用 X 射线，MRI 使用无线电波），但这两种技术都需要相当大的算力，并且需要在各种子系统之间传输大量数据。

第二代 Versal 自适应 SoC 提供的异构算力能够加速图像重建算法、MRI 中的 2D-FFT 功能和 CT 中的反投影。此外，更小巧的第二代 Versal 器件可以执行数据采集和机架控制、梯度放大器中的逆变器控制、射频接收中的信号处理和使用 PL 的传输等功能。

内窥镜系统

诊断性胃肠内窥镜和一些外科内窥镜系统的摄像头控制单元对视频处理管线的要求正在迅速提升。在高端系统中，摄像头传感器分辨率从 2K 快速增长到 4K，而且现在 4K 3D 甚至 8K 也在迅速普及。集成用于诊断辅助的 AI-机器学习推理使系统要求变得更加复杂。对如此复杂的视频管线进行低时延乃至实时预处理，正需要第二代 Versal 产品组合中提供的异构架构类型。

1.基于 AMD 内部对采用 8 个 2.2 Ghz 的 Arm Cortex-A78AE 应用核心和 10 个 1.05 Ghz 的 Arm Cortex-R52 实时核心配置的第二代 Versal AI Edge 系列和 Versal Prime 系列处理系统的总 DMIPS 的硅前性能估计，与发布的第一代 Versal AI Edge 系列和 Versal Prime 系列处理系统的总 DMIPS 进行比较。第二代 Versal AI Edge 系列和 Prime 系列工作条件：最高可用速度等级、0.88V PS 工作电压、分离模式操作、支持的最大工作频率。第一代 Versal AI Edge 系列和 Prime 系列工作条件：最高可用速度等级、0.88V PS 工作电压、支持的最大工作频率。实际 DMIPS 性能将在最终产品的市场发布时有所不同。（VER-027）

2.基于 AMD 内部对使用 MX6 数据类型的第二代 Versal AI Edge 系列 AIE-ML v2 计算块架构的性能和功耗预测，与使用 INT8 数据类型的第一代 Versal AI Edge 系列 AIE-ML 计算块架构的性能规范和 AMD 电源设计管理器功耗结果进行比较。假设：2 行 8 列子阵列。工作条件：1 GHz FMAX、0.7V AIE 工作电压、100℃ 结温、典型工艺、60% 矢量负载、激活%= 0 < 10%。实际性能将在最终产品的市场发布时有所不同。性能预测截至 2024 年 3 月。（VER-023）

3.视频编解码器加速（至少包括 HEVC (H.265)、H.264、VP9 和 AV1 编解码器）在不包含/未安装兼容媒体播放器的情况下受限而且无法运行。（GD-176）

打开APP阅读更多精彩内容