英特尔助力东软PACS&RIS赋能三维可视化与AI辅助诊断

描述

“随着智慧医院建设的推进,PACS/RIS系统正在承载着越来越多的影像数据,并融合了三维可视化、AI等创新技术,这对于系统性能带来了极高的要求。新一代系统通过采用英特尔 至强 可扩展处理器,并进行软件优化,我们有效了提升了系统性能,在此基础上,我们将以一体化、智能化、专科化为理念,以PACS/RIS产品能力为核心向外延伸,构建智慧医学影像解决方案。”

概 述

医学影像不仅是临床诊断的重要依据、医学决策的重要指导,同时也有助于帮助患者消除不确定性,提升护理质量。近年来,基于人工智能(AI)、三维可视化等技术的智慧医学影像系统得到了快速发展,相较于传统医学影像系统,其能够显著提升医学影像的质量,运用智能技术优化预约、候诊、检查、结果发放等流程,从而辅助医生提高医生工作效率、降低患者的等待时间并提升患者体验。

东软推出了基于英特尔 架构的智慧医学影像信息系统PACS/RIS,该系统提供了覆盖检查预约、到诊排队、用药管理、检查管理、影像诊断等在内的一体融合全医学影像管理能力,可辅助医生更好地开展工作。在新一代的PACS/RIS产品中,东软扩展了AI与可视化等高级能力,并利用第五代英特尔 至强 可扩展处理器支持三维可视化应用,利用英特尔 高级矩阵扩展(英特尔 AMX)及英特尔 发行版OpenVINO 工具套件加速AI推理,助力医院构建高性能、高可扩展的影像系统。

背景:医学影像系统的三维可视化、智能化转型

通过医学影像的三维可视化处理,并融合影像分析、影像重建等技术,医务人员可以通过图像增强、分割、量化、放大缩小、旋转观察等方式,从多角度清晰了解到医学影像中各结构之间的空间位置关系,在疾病诊断的可视化、术前评估、手术规划、手术实时指导等方面发挥重要价值。

融入AI技术的PACS/RIS系统能够为医学影像提供智能诊断、质量控制、结构化报告等能力的支撑,可帮助降低对于智能医学影像检查设备的依赖,不仅能够为医务人员提供智能诊断建议,而且还有助于提供结构化的知识库,用于质控、科研和教学工作等环节中。

基于三维可视化和智能化的新一代PACS/RIS系统为智慧医院的构建提供了有力支撑,但同时也在算力、成本等层面带来相应挑战。

• 三维可视化、AI推理等工作负载会带来巨大的性能开销,未经过专门优化的算力平台很难满足上述负载在吞吐、时延等方面的要求,因此采用更高性能,且面向AI优化的新一代算力平台势在必行。

• 在CPU与GPU的选择方面,GPU在性能方面通常具备一定的优势,但是会带来额外的成本。因此,在成本敏感的场景,部署面向AI推理进行优化的新一代CPU有助于降低成本;同时,部分PACS/RIS场景的AI推理具备批处理特性,对AI推理时延性能不敏感,适合采用CPU进行推理。

在此背景下,东软智慧医学影像信息系统PACS/RIS希望采用基于CPU的方案,运行三维可视化、AI推理等工作负载,并通过指令集、软件等方式进行性能优化,在满足性能需求的同时,提升系统整体的灵活性并降低总体拥有成本(TCO)。

采用英特尔 技术加速PACS/RIS新型工作负载运行

东软智慧医学影像信息系统PACS/RIS推荐采用基于第五代英特尔 至强 可扩展处理器的基础设施。除了支持数据管理、数据分析等负载之外,东软还利用第五代英特尔 至强 可扩展处理器的指令集、英特尔 AMX,以及OpenVINO 工具套件加速三维可视化、AI推理等新型负载。

第五代英特尔 至强 可扩展处理器拥有更可靠的性能,更出色的能效。它在运行各种工作负载时均可实现显著的每瓦性能增益,在AI、数据中心、网络和科学计算的性能和总体拥有成本(TCO)方面亦有更出色的表现。相较上一代产品,第五代英特尔 至强 可扩展处理器可在相同功耗范围内提供更高的算力和更快的内存。此外,它与上一代产品的软件和平台兼容,因此部署新系统时可大大减少测试和验证工作。

英特尔

图1.第五代英特尔 至强 可扩展处理器具备更强大性能

三维可视化效率提升2.45倍6

东软智慧医学影像信息系统PACS/RIS的三维可视化模块主要采用了体渲染(Volume Rendering)技术,并采用OpenMP与Streaming SIMD Extensions4(SSE4)指令集支持光线合成的实现。SSE4指令集除扩展Intel 64指令集架构外,还加入有关图形、视频编码及处理、三维成像及游戏应用等指令,令涉及音频、图像和数据压缩算法的应用程序大幅受益。在执行三维可视化任务时,东软发现其产品在部分应用中的性能明显不足。为了化解瓶颈,东软基于Intel VTune Profiler,确定了瓶颈函数SafeGradz,该函数主要利用SSE4指令集进行三线性插值从而实现光线上点的梯度计算,通过对于该函数的代码进行优化,东软提升了三维可视化应用的性能。

东软测试了在不同英特尔 至强 可扩展处理器上,PACS/RIS系统的三维重建应用的运行效率。测试数据如图2所示,在处理器开通4并发8线程时,英特尔 至强 铂金8592+处理器(第五代)的性能相较于英特尔 至强 金牌6430处理器(第四代)和英特尔 至强 银牌4210R处理器(第二代)均有明显提升,其中相比第二代的提升幅度高达2.45倍7。

英特尔

图2.PACS/RIS系统的三维重建应用运行效率比较

AI推理性能提升高达8.49倍8

东软智慧医学影像信息系统PACS/RIS融合了广泛的AI算法,以提供AI辅助诊断支持与合理化建议,从而辅助提升诊断效率。为了加速英特尔 至强 可扩展处理器执行AI推理的效率,东软智慧医学影像信息系统PACS/RIS采用了处理器内置的英特尔 AMX加速器以及OpenVINO 工具套件。

英特尔 AMX针对广泛的硬件和软件优化,它进一步增强了前代技术—矢量神经网络指令(VNNI)和BF16,从一维向量发展为二维矩阵,以便最大限度地利用计算资源,提高高速缓存利用率,以及避免潜在的带宽瓶颈。OpenVINO 工具套件基于最新一代的人工神经网络,包括卷积神经网络(CNN)、递归网络和基于注意力的网络,可跨英特尔 硬件扩展计算机视觉和非视觉工作负载,从而大幅提高性能。

东软在第二代/第四代/第五代英特尔 至强 可扩展处理器上测试了两个参数大小不同的模型在同步和异步下的性能表现(测试时3种配置CPU均锁定8核心的内核),其中第四代和第五代处理器均启用了英特尔 AMX。

测试数据如图3所示,在使用参数量为342,978的较小模型时,以BF16精度在异步模式下执行推理为例,英特尔 至强 铂金8592+处理器(第五代)的性能相较于英特尔 至强 银牌4210R处理器(第二代),推理性能提升高达2.55倍;在使用参数量为31,185,568的较大模型时,以BF16精度在异步模式下执行推理为例,英特尔 至强 铂金8592+处理器(第五代)的性能相较于英特尔 至强 银牌4210R处理器(第二代),推理性能提升高达8.49倍。

英特尔

图3. BF16精度下的异步推理性能比较

收 益

基于英特尔 架构的东软智慧医学影像信息系统PACS/RIS能够为用户带来如下价值:

• 通过融合三维可视化、AI辅助诊断等高级能力,能够助力医生提高工作效率,改善患者体验。

• 系统提供全面的业务、质量、绩效和教科研管理功能,有助于医院切实加强影像质量安全管控,实现多维度绩效考核,支撑影像教科研发展。

• 系统采用了英特尔 至强 可扩展处理器,在满足更高性能需求的同时,具备更高的部署与应用灵活性,可以承担更广泛的负载、更有效地控制系统的总体拥有成本(TCO)。

展 望

基于英特尔 架构的东软智慧医学影像信息系统PACS/RIS具备高性能、高安全、高可靠等特征,支持高效地运行三维可视化、AI辅助诊断等应用。英特尔、东软将持续深化合作,从新一代算力平台构建和AI应用性能优化等方面进行深度合作,加速医学影像数据的挖掘和应用,释放医学影像数据的巨大价值。

附录1:硬件推荐配置(高配)

英特尔

附录2:硬件推荐配置(中配)

英特尔

 

1 与第四代英特尔 至强 处理器相比的平均性能提升,以SPEC CPU rate、STREAM Triad和LINPACK的几何平均值为衡量标准。请参阅 intel.com/processorclaims上的 [G1]:第五代英特尔 至强 可扩展处理器。结果可能有所差异。 

2 与第四代英特尔 至强 处理器相比,取得1.19倍到1.42倍的性能提升(ResNet50v1.5、BERT-Large、SSD-ResNet34、RNN-T(仅BF16)、Resnext101 32x16d、MaskRCNN(仅BF16)、DistilBERT)。请参阅 intel.com/processorclaims 上的[A15-A16]:第五代英特尔 至强 可扩展处理器。结果可能有所差异。 

3 请参阅intel.com/processorclaims上的[G12]:第五代英特尔 至强 可扩展处理器。结果可能有所差异。 

4 请参阅intel.com/processorclaims上的[G11]:第五代英特尔 至强 可扩展处理器。结果可能有所差异。 

5 使用内置加速器在AI、数据和网络工作负载上进行测量,取得1.46到10.6倍的每瓦性能提升。请参阅intel.com/processorclaims上的[A19-A25]、[D1]、[D2]、[D5]和[N16]:第五代英特尔 至强 可扩展处理器。结果可能有所差异。

6,7 东软截止至2024年2月的内部测试结果。测试配置:基准配置—英特尔 至强 银牌 4210R 处理器 @ 2.40 GHz,128 GB总内存;新配置1—英特尔 至强 金牌 6430 处理器 @ 2.10 GHz,512 GB总内存;新配置3—英特尔 至强 铂金 8592+ 处理器 @ 1.90 GHz,512 GB 总内存;4并发4线程下图像尺寸为512*512*111,4并发6线程下图像尺寸为 512*512*936,4并发8线程下图像尺寸为512*512*5000。英特尔并不控制或审计第三方数据。请您审查该内容,咨询其他来源,并确认提及数据是否准确。 

8 东软截止至2024年2月的内部测试结果。测试配置:基准配置—英特尔 至强 银牌 4210R 处理器 @ 2.40 GHz,128 GB 总内存;新配置1—英特尔 至强 金牌 6430 处理器 @ 2.10 GHz,512 GB总内存;新配置3—英特尔 至强 铂金8592+ 处理器 @ 1.90 GHz,512 GB总内存。英特尔并不控制或审计第三方数据。请您审查该内容,咨询其他来源,并确认提及数据是否准确。

本文仅用于宣传英特尔和合作伙伴的科技技术。英特尔不以任何方式宣传或介绍医疗机构、医疗服务,也不为任何药品、医疗器械、保健食品等做推荐或证明。 

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分