0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GPU引擎增强了超声检测到的大脑运动计算

星星科技指导员 来源:嵌入式计算设计 作者:嵌入式计算设计 2022-10-26 14:30 次阅读

多普勒超声是一种医学超声模式,用于观察沿超声探头发出的轴或由此类探头扫描的平面区域的运动。虽然多普勒超声通常用于检查血流,但它也可用于检测组织微搏。这种组织脉动起源于低速血液灌注,其周期性且与每次心跳同步。研究人员报告了亚微米水平的运动敏感性。了解这些脑组织脉动可能有助于识别大脑中的出血或缺血(缺乏血流)。

测量组织位移

科学家经常使用换能器来发射和检测高频声波。将高压发射脉冲施加到换能器内部的压电晶体上,以产生短脉冲的超声波能量。当这种超声波脉冲在组织中传播时,它会遇到不同组织结构之间的界面。在这些结点处,超声波脉冲中的一些能量被反射为回声,而另一些则继续传播到组织更深处。每个波分量的相对大小是组织之间声阻抗不匹配程度的函数。具有相似成分的组织区域具有低程度的不匹配,因此允许更多的超声脉冲穿透更深。

在这项研究中,我们使用2 MHz超声波来检查大脑。这个频率足够低,可以穿透颅骨,但又足够高,可以提供来自血流和组织的容易检测到的回声。2 MHz处的波长(λ)约为0.8 mm,这比我们观察到的组织运动大一个数量级以上。识别随时间推移的相位变化允许在微米级用该波长检测组织运动。π的相变导致多普勒样品体积的位移为λ/4,或约0.2 mm。可以轻松完成分辨率为 π/1,000 的角度测量,从而产生等于或低于微米的位移分辨率。

本应用中使用的系统工作在2 MHz载波频率和以6.25 kHz脉冲重复频率发射的八周期发射突发。透射脉冲串尺寸导致轴向分辨率(样品体积)约为3 mm。轴向分辨率不应与上一段中讨论的位移计算的角度分辨率混淆。当超声波脉冲在组织中传播时,它跟踪散射体的运动。重要的是,样品体积尺寸不能与独立移动的组织元件的大小不匹配;否则,多个移动组织单元可能导致净位移为零。此外,由于散射体在一组超声脉冲中的去相关,小样品体积中的大组织偏移将产生不确定性。

每个脉冲重复周期的多普勒频移信号是通过放大接收到的回波并使用16位A/D转换器以32 MSps的速度将其数字化,然后在现成的DSP卡(TigerSHARC引擎)中解调和抽取来获得的。因此,每个脉冲周期从 5,120 个回波样本开始,并转换为 320 个解调的 IQ 值,以 0.4 mm 的间隔均匀分布(即载波的 λ/2)。然后将这 320 个 IQ 值重新采样到 64 个 IQ 样本中,这些样本以 1.1 mm 的间隔对 20 至 90 mm 的深度范围进行分层。以这种方式,在每个栅极深度以6.250 kHz的频率对复杂的多普勒频移信号进行采样。

64 个门中每个门的局部大脑运动都是通过夹克在 MATLAB 中通过夹克使用具有夹克数据类型的 NVIDIA GTX 280 显卡计算的。位移由使用公式1计算的IQ信号的未包装瞬时相位推导出来。等式2捕获了相位和位移之间的关系。

等式 1

pYYBAGNY1AKAfQRvAAAO7zhtK1I415.jpg

等式 2

poYBAGNY1AOADbOqAAAOQs-fbYc959.jpg

图1所示的16个门以4.5 mm的间隔距离探头20至90 mm。这些门是64个样品门的子集,每个门都处理成位移波形。图1中的所有位移波形共享一个公共x轴,该轴以秒为单位表示时间。y 轴以微米为单位显示每条曲线的局部位移大小。

图 1:随着时间的推移,可以使用2 MHz超声束检测大脑位移,并通过夹克在MATLAB中计算。

pYYBAGNY1AWAObigAAE8VdYIi3Q066.jpg

图1的左上角显示了Marc 600头架,该头架将换能器(a)牢固地放置在进入大脑的时间声学窗口上。换能器显示在典型大脑的MRI图像旁边,并叠加了与超声束路径相邻的主要前动脉路径的描绘。从威利斯环分支的动脉包括右中动脉(RMCA),右前脑动脉(RACA),左前脑动脉(LACA)和左中脑动脉(LMCA)。右侧显示了距离探头20至90 mm的多普勒门的位移波形(在y轴处以微米为单位)与时间(在x轴处以秒为单位)。

这些脑移位图具有很强的心脏周期存在。这些曲线还显示位移值低至20微米,用于在舒张末期和收缩期峰值后不久测量的总偏移量。(请注意,心脏在舒张期放松,在收缩期泵血。随着每个心脏周期,大脑通常从收缩期开始沿一个方向移位,然后从收缩期结束时向相反方向移动。在任何给定时间内观察所有深度,都会显示具有不同大小的正位移和负位移值,表明心脏周期中组织运动的异质性。

计算性能的基础

本研究中使用的 GTX 280 GPU 具有 1 GB 的片上 RAM 和 240 个处理内核,能够处理 1,000 个 GFLOPS。对于此应用,我们将数据分成 64 个多普勒门乘以 2 秒数据矩阵,从而得到 64 x 12,800 个复杂数据值的输入矩阵。在使用 MATLAB 的 CPU 和使用夹克进行比较的 GPU 中计算位移(使用等式 1 和 2)。报告的计时测量结果在50项试验中取平均值。

平均而言,GPU 在 51.50 毫秒内计算出位移,而 CPU 在 621.5 毫秒内执行计算。凭借其高度并行的架构,GPU 的性能比 CPU 高出 12 倍。梳理GPU计时测量结果进一步显示,CPU和GPU之间的内存传输需要41毫秒(总时间的80%),而实际计算只需要10.5毫秒(总时间的20%)。

在使用 Jacket 和 GPU 技术获得积极成果后,我们预计该软件将为远远超过最先进的 DSP 性能的计算性能奠定基础。该特征对于实时处理组织微脉搏作为深度函数至关重要,这是我们研究的基本目标。我们还希望使用Creack软件将提高我们以有效方式设计和测试算法的能力,并有助于降低开发成本。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 转换器
    +关注

    关注

    27

    文章

    8703

    浏览量

    147183
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4740

    浏览量

    128951
收藏 人收藏

    评论

    相关推荐

    《CST Studio Suite 2024 GPU加速计算指南》

    GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH发布的有关CST Studio Suite 2024的GPU计算指南。涵盖GP
    发表于 12-16 14:25

    TDC1000是否对超声换能器有要求?

    使用示波器已检测到正常的start stop trigger信号,TX1也检测到相应的发射信号,相对应的,RX1也在相应时间被拉高到VCOM,但是没有检测到接收到的超声信号,TDC72
    发表于 12-11 07:36

    使用 AMD Versal AI 引擎释放 DSP 计算的潜力

    “Versal AI 引擎可以在降低功耗预算的情况下提高 DSP 计算密度,”高级产品营销经理 Udayan Sinha 表示。这种效率使 Versal AI 引擎能够在严格的功耗预算内处理最苛刻
    的头像 发表于 11-29 14:07 499次阅读

    GPU加速计算平台是什么

    GPU加速计算平台,简而言之,是利用图形处理器(GPU)的强大并行计算能力来加速科学计算、数据分析、机器学习等复杂
    的头像 发表于 10-25 09:23 251次阅读

    GPU计算主板学习资料第735篇:基于3U VPX的AGX Xavier GPU计算主板 信号计算主板 视频处理 相机信号

    GPU计算主板学习资料第735篇:基于3U VPX的AGX Xavier GPU计算主板 信号计算主板 视频处理 相机信号
    的头像 发表于 10-23 10:09 278次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>计算</b>主板学习资料第735篇:基于3U VPX的AGX Xavier <b class='flag-5'>GPU</b><b class='flag-5'>计算</b>主板 信号<b class='flag-5'>计算</b>主板 视频处理 相机信号

    检测到信赖:一步步了解运动音响如何通过气密性检测仪赢得市场

    运动音响气密性检测仪在当今科技与工业快速发展的时代,气密性检测仪已成为众多行业不可或缺的设备之一,特别是在运动音响领域,其重要性更是不言而喻。本文将深入探讨
    的头像 发表于 08-09 11:50 174次阅读
    从<b class='flag-5'>检测到</b>信赖:一步步了解<b class='flag-5'>运动</b>音响如何通过气密性<b class='flag-5'>检测</b>仪赢得市场

    VL53L8CX TOF开发(5)----运动阈值检测

    调整用于检测运动的最小和最大距离。其次,一旦在传感器的视野中检测到运动,并且该运动的强度超出了预先设置的阈值,那么这种情况将被认为是一个有效
    的头像 发表于 06-19 10:45 1295次阅读
    VL53L8CX TOF开发(5)----<b class='flag-5'>运动</b>阈值<b class='flag-5'>检测</b>

    超声波无损检测原理及应用

    超声波无损检测(Ultrasonic Non-Destructive Testing,简称UT)是一种利用超声波在材料内部传播的特性,检测材料内部缺陷和结构的无损
    的头像 发表于 05-24 16:48 5553次阅读

    无损检测超声检测原理是什么

    无损检测超声检测原理是一种利用超声波在材料中传播的特性来检测材料内部缺陷的检测方法。它具有
    的头像 发表于 05-24 16:45 1665次阅读

    进一步解读英伟达 Blackwell 架构、NVlink及GB200 超级芯片

    引入英伟达机密计算技术,在不影响性能的情况下,增强了大规模实时s生成式人工智能推理的安全性。该架构还具有新的解压缩引擎和用于人工智能预防性维护的可靠性引擎,有助于诊断并预测潜在的可靠
    发表于 05-13 17:16

    GPU:量化理论计算的新引擎

    计算资源和时间。传统的CPU(中央处理单元)在处理这些计算时速度较慢,限制了研究人员的计算能力。近年来,随着GPU(图形处理单元)的迅速发展,这一局面发生了变化。G
    的头像 发表于 04-16 08:27 477次阅读
    <b class='flag-5'>GPU</b>:量化理论<b class='flag-5'>计算</b>的新<b class='flag-5'>引擎</b>

    modustoolbox在正常编译中通过工程下增强了全局变量数组的长度后报错了怎么解决?

    客户使用modustoolboxdevelpcy8c6245azi-s3D72,在正常编译中通过工程下增强了全局变量数组的长度,结果编译报导不错,初始化是内存超越了。通过对比发现.bss的大小最小是25292,如附件描述,请帮忙确认识别本原因并提供解决方案,谢谢谢谢!
    发表于 01-25 06:58

    维修安捷伦54621A示波器无法检测到信号案例

    近日山东某企业送修安捷伦示波器54621A,客户反馈无法检测到信号,对仪器进行初步检测,确定与客户描述故障基本一致。本期将为大家分享本维修案例。 下面就是安捷伦-54621A维修情况   安捷伦
    的头像 发表于 01-17 17:33 993次阅读
    维修安捷伦54621A示波器无法<b class='flag-5'>检测到</b>信号案例

    GPU:大数据时代的强力引擎

    精度和方案开发速度。无论是图像识别、语音文字处理、机器翻译(MT),还是自动驾驶、虚拟现实(VR)和增强现实(AR)等行业应用,GPU在大数据存储、清洗、预处理以及
    的头像 发表于 01-04 08:27 690次阅读
    <b class='flag-5'>GPU</b>:大数据时代的强力<b class='flag-5'>引擎</b>

    AI引擎内核与计算图编程指南

    电子发烧友网站提供《AI引擎内核与计算图编程指南.pdf》资料免费下载
    发表于 01-03 10:50 0次下载
    AI<b class='flag-5'>引擎</b>内核与<b class='flag-5'>计算</b>图编程指南