英特尔研究院发布全新AI扩散模型，可根据文本提示生成360度全景图-电子发烧友网

英特尔研究院宣布与Blockade Labs合作发布LDM3D（Latent Diffusion Model for 3D）模型，这一全新的扩散模型使用生成式AI创建3D视觉内容。LDM3D是业界领先的利用扩散过程（diffusion process）生成深度图（depth map）的模型，进而生成逼真的、沉浸式的360度全景图。LDM3D有望革新内容创作、元宇宙应用和数字体验，改变包括娱乐、游戏、建筑和设计在内的许多行业。

“

生成式AI技术旨在提高和增强人类创造力，并节省时间。然而，目前的大部分生成式AI模型仅限于生成2D图像，仅有少数几种可根据文本提示生成3D图像。在使用几乎相同数量参数的情况下，不同于现存的潜在扩散模型，LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计中的标准后处理方法相比，LDM3D能够为图像中的每个像素提供更精准的相对深度，并为开发者省去了大量用于场景开发的时间。

--Vasudev Lal

英特尔研究院人工智能和机器学习研究专家

”

封闭的生态系统限制了规模。英特尔致力于推动AI的真正普及，通过开放的生态系统让更多人从这项技术中受益。计算机视觉领域近年来取得了重大进展，特别是在生成式AI方面。然而，当今许多先进的生成式AI模型只能生成2D图像。与通常只能根据文本提示生成2D RGB图像的现有扩散模型不同，LDM3D可以根据用户给定的文本提示同时生成图像和深度图。与深度估计（depth estimation）中的标准后处理（post-processing）方法相比，LDM3D在使用与潜在扩散模型Stable Diffusion几乎相同数量参数的情况下，能够为图像中的每个像素提供更精准的相对深度（relative depth）。

这项研究有望改变我们与数字内容的互动方式，基于文本提示为用户提供全新的体验。LDM3D生成的图像和深度图能够将诸如宁静的热带海滩、摩天大楼、科幻宇宙等文本描述转化为细致的360度全景图。LDM3D捕捉深度信息的能力，可以即时增强整体真实感和沉浸感，使各行各业的创新应用成为可能，包括娱乐、游戏、室内设计、房产销售，以及虚拟博物馆与沉浸式VR体验等。

6月20日，在IEEE/CVF计算机视觉和模式识别会议（CVPR）的3DMV工作坊上，LDM3D模型获得了“Best Poster Award”。

LDM3D是在LAION-400M数据集包含一万个样本的子集上训练而成的。LAION-400M是一个大型图文数据集，包含超过4亿个图文对。对训练语料库进行标注时，研究团队使用了之前由英特尔研究院开发的稠密深度估计模型DPT-Large，为图像中的每个像素提供了高度准确的相对深度。LAION-400M数据集是基于研究用途创建而成的，以便广大研究人员和其它兴趣社群能在更大规模上测试模型训练。

为了展示LDM3D的潜力，英特尔和Blockade的研究人员开发了应用程序DepthFusion，通过标准的2D RGB图像和深度图创建沉浸式、交互式的360度全景体验。DepthFusion利用了TouchDesigner，一种基于节点的可视化编程语言，用于实时互动多媒体内容，可将文本提示转化为交互式和沉浸式数字体验。LDM3D是能生成RGB图像及其深度图的单一模型，因此能够节省内存占用和降低延迟。

备注：

¹地址：https://huggingface.co/docs/diffusers/main/en/api/pipelines/stable_diffusion/ldm3d_diffusion

²地址：

https://arxiv.org/abs/2305.10853

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英特尔

英特尔

+关注

关注
61

文章
9974

浏览量
171825
cpu

cpu

+关注

关注
68

文章
10870

浏览量
211901

原文标题：英特尔研究院发布全新AI扩散模型，可根据文本提示生成360度全景图

文章出处：【微信号：英特尔中国，微信公众号：英特尔中国】欢迎添加关注！文章转载请注明出处。

使用英特尔AI PC为YOLO模型训练加速

之后，情况有了新的变化，PyTorch2.5正式开始支持英特尔显卡，也就是说，此后我们能够借助英特尔 锐炫显卡来进行模型训练了。

发表于 12-09 16:14 •314次阅读

使用<b class='flag-5'>英特尔</b><b class='flag-5'>AI</b> PC为YOLO<b class='flag-5'>模型</b>训练加速

英特尔推出全新英特尔锐炫B系列显卡

英特尔锐炫B580和B570 GPU以卓越价值为时新游戏带来超凡表现。 > 今日，英特尔发布全新英特尔锐炫 B系列显卡（代号Battle

发表于 12-07 10:16 •771次阅读

<b class='flag-5'>英特尔</b>推出<b class='flag-5'>全新</b><b class='flag-5'>英特尔</b>锐炫B系列显卡

英特尔发布全新企业AI一体化方案

近日，英特尔正式推出了全新的企业AI一体化方案。该方案以英特尔至强处理器和英特尔Gaudi 2D AI

发表于 12-03 11:20 •233次阅读

英特尔发布全新企业AI一体化解决方案

加速器等先进硬件。此外，它还结合了OPEA开放软件平台，确保了方案的灵活性和兼容性。作为该方案的首个落地实践，英特尔携手新华三共同发布了新华三AIGC灵犀一体机。这款一体机充分利用了英特尔的

发表于 12-02 10:48 •513次阅读

NVIDIA推出全新生成式AI模型Fugatto

NVIDIA 开发了一个全新的生成式 AI 模型。利用输入的文本和音频，该模型可以创作出包含任意

发表于 11-27 11:29 •361次阅读

IC China 2024北京开幕：英特尔分享洞察，促智能计算应用落地

计算技术发展趋势的洞察，介绍了英特尔如何通过产品和技术创新，加速从云到端的智能计算落地，以推动数字经济发展和产业转型升级。 英特尔研究院副总裁、英特尔中国

发表于 11-19 16:22 •233次阅读

英特尔发布AI创作应用AI Playground，将于今夏正式上线！

的AI PC入门应用程序AI Playground，让广大用户在本地即可快速实现AI个性化创作。 英特尔Xe2 GPU架构，带来50%的性能提升英

发表于 06-14 09:44 •486次阅读

已有超过500款AI模型在英特尔酷睿Ultra处理器上得以优化运行

近日，英特尔宣布在全新英特尔 酷睿 Ultra处理器上，有超过500款AI模型得以优化运行。

发表于 05-11 09:31 •730次阅读

英特尔重磅发布全新AI战略，携手生态共同释放企业AAI潜力

在近期举行的Intel Vision 2024大会上，英特尔重磅发布其开放的、可扩展的全新AI战略，同时公布了英特尔®至强®6处理器的品牌焕

发表于 04-28 11:11 •569次阅读

Intel Vision 2024大会: 英特尔发布全新软硬件平台，全速助力企业推进AI创新

发布AI开放系统战略，展示与新客户、合作伙伴跨越AI各领域的合作。新闻亮点 •英特尔发布了为企业客户打造的

发表于 04-12 14:52 •551次阅读

英特尔发布AI PC加速计划，确立AI PC新标准

同时，英特尔也自定了更为简化的AI PC定义，即CPU、GPU和NPU均应具备专属AI加速能力，这恰恰反映了其最新力作Meteor Lake及其后继产品的设计理念。按照这种设计，不同组件可根据

发表于 03-27 10:10 •458次阅读

英特尔酷睿Ultra通过全新英特尔vPro平台将AI PC惠及企业

近日，英特尔在2024年世界移动通信大会（MWC 2024）上宣布，全新英特尔®vPro®平台将AI PC的优势惠及商用客户。

发表于 03-18 15:07 •527次阅读

英特尔推出全新vPro平台，将AI PC的优势延伸至商用领域

在2024年世界移动通信大会（MWC 2024）上，英特尔宣布了其全新英特尔®vPro®平台的发布，旨在将AI PC的先进功能带给商用客户。

发表于 03-03 15:47 •1180次阅读

英特尔发布全新边缘平台，充分满足企业AI部署需求

英特尔发布两款全新芯片——Sierra Forrest 和 Granite Rapids-D，还宣布一个全新边缘平台全面上市。这些产品旨在满足运营商和企业在可持续发展和

发表于 03-01 18:26 •991次阅读

谷歌推出AI扩散模型Lumiere

近日，谷歌研究院重磅推出全新AI扩散模型Lumiere，这款模型基于谷歌自主研发的“Space-

发表于 02-04 13:49 •1043次阅读