0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

商汤绝影真·端到端自动驾驶解决方案UniAD上车首秀

商汤科技SenseTime 来源:商汤科技SenseTime 2024-04-28 18:23 次阅读

近日,商汤科技发布全新升级的“日日新SenseNova 5.0”大模型,广受好评!

6000亿参数的“日日新5.0”采用混合专家架构(MOE),具备更强的知识、数学、推理及代码能力,成为国内首个全面对标甚至超越GPT-4 Turbo的大模型,多模态能力领先GPT-4V。基于端云结合的架构,商汤端侧大模型大幅超越同量级大模型,越级比肩7B、13B大模型,更适合车端部署

依托“日日新SenseNova 5.0”行业领先硬核实力,商汤绝影打造了一系列大模型车端产品,并在2024北京车展“上车”首秀。

本届车展,商汤绝影参展的核心关键词是:原生态大模型、真·端到端自动驾驶UniAD“上车” 、多模态场景大脑和全新3D交互,带来AGI时代的全新出行体验。

智驾方面,商汤绝影首次向公众展示了面向量产的真·端到端自动驾驶解决方案UniAD(Unified Autonomous Driving)的道路测试表现。

作为全球首个提出感知决策一体化自动驾驶通用模型的公司,商汤绝影的技术落地速度也“绝速引领”。

商汤绝影还带来了以多模态场景大脑为核心的AI大模型座舱产品矩阵以及全新座舱3D交互演示,以通用人工智能(AGI)技术,驱动灵活自适应、深度个性化、安全可信赖、有人文关怀的未来出行全新体验。

商汤科技联合创始人、首席科学家、绝影智能汽车事业群总裁王晓刚表示:“未来汽车智能化的竞争,本质上是通用人工智能技术融合应用的比拼。商汤绝影致力于成为加速智能汽车驶入AGI时代的核心技术伙伴,给智能汽车产业带来生产效率和交互体验的双重革新,将携手合作伙伴提供通用人工智能技术驱动的智能汽车全新体验,共同定义未来出行。”

像人一样开车!

真·端到端自动驾驶解决方案UniAD上车首秀

2023年,商汤及其联合实验室提出的行业首个感知决策一体化自动驾驶通用模型UniAD荣获CVPR 2023最佳论文,引发行业轰动!

仅一年后,UniAD已经“上车”!

真·端到端,无需高精地图,仅靠视觉感知

无论是复杂城市道路还是无中线的乡村道路上,车辆都能搞定一系列高难度操作——大角度左转上桥、避让占道车辆、施工区域、绕行跑步行人……做到“像人一样开车”!

0a4b7d5c-03c8-11ef-a297-92fbcf53809c.png

今年以来,受特斯拉FSD V12版本的端到端自动驾驶方案影响,行业号称“端到端”智驾方案不断涌现,但大多由感知和决策两个模型组成的 “两段式”架构,存在信息传递过滤或丢失的问题。

UniAD将感知、决策、规划等模块都整合到一个全栈Transformer端到端模型,实现感知决策一体化的真·端到端自动驾驶。

0a51ce46-03c8-11ef-a297-92fbcf53809c.png

UniAD真·端到端:感知决策一体化的通用模型

为什么端到端智驾方案如此重要且紧迫?

一方面是智驾场景(尤其城区场景)计算的复杂度呈指数级增长,另一方面传统方法人力成本高且难以应对长尾路况(corner case),而端到端技术可高效、低成本应对这些问题。

具体而言,商汤绝影端到端模型泛化能力强、迭代效率快,可以帮助车企低成本快速开城,纯视觉感知的无图方案,进一步降低系统的软硬件成本,助力智驾普及

在端到端系统基础上,商汤绝影还在车展期间带来了新一代自动驾驶大模型DriveAGI,推动自动驾驶从数据驱动向认知驱动的跃迁。

0a5ec38a-03c8-11ef-a297-92fbcf53809c.png

新一代自动驾驶大模型DriveAGI:

可感知、可交互、可信赖

依托多模态大模型,DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案,向完全无人驾驶迈出重要一步。

多模态场景大脑

让智能座舱“真”懂你!

前不久上市的小米SU7将AI大模型带进座舱,而商汤“日日新”大模型也全面助力小爱同学车载语音场景应用。

本次车展,商汤绝影展示了以多模态场景大脑为核心的一系列全景感知、主动关怀且富有创造力的大模型座舱产品

多模态场景大脑让智能汽车可以高效准确地全景感知和深度理解用户需求和周围环境,打通不同应用,将离散的单点功能聚合在一起。

0a657176-03c8-11ef-a297-92fbcf53809c.png

多模态大模型可以准确感知并识别车外信息

比如,可以基于地理位置推荐符合用户喜好的餐厅,介绍用户感兴趣的外部自然景物,准确感知识别车型、标志性建筑物等车外信息,打破座舱本身的限制,让用户享受更为自由无束缚的出行体验。

以商汤“大医”医疗健康大模型为桥梁的“旅医”,让用户在座舱内就可以获得专业及个性化的健康管理服务,让出行更安心。

而基于AIGC大模型技术的“神笔”,可以把用户简单的绘画线条转变成具有美感的艺术作品,增添驾乘乐趣。

去年Apple Vision Pro的问世展现了3D交互的创新体验和应用潜力,本次车展,商汤绝影将3D Gaze高精视线交互和3D 动态手势交互这两大全新座舱3D交互演示带到现场,带来如同“Vision Pro”裸眼上车、更符合人类直觉的自然交互体验。

0a909324-03c8-11ef-a297-92fbcf53809c.gif

3D Gaze高精视线交互是商汤绝影全球首创的能够通过视线定位与屏幕图标进行交互的智能座舱技术,让用户无需点按屏幕,通过眼神即可精准控制中控图标,完成多种交互操作

0a9e5b44-03c8-11ef-a297-92fbcf53809c.gif

3D 动态手势交互是行业领先的支持动态手势和手部微动作识别的智能座舱技术,用户通过手势“隔空”实现各类座舱精细化的交互,打破传统按键和屏幕触控方式的繁琐和局限

商汤绝影还在进一步探索舱驾融合,实现智能驾驶和智能座舱在硬件、软件及应用层面的全面融合,提升用户体验、降低系统成本,进一步打破舱内外的界限和束缚,涌现更多创新功能,带来更安全、更加全方位,更具人文关怀的新体验。

加速智能汽车驶入AGI时代

商汤绝影与哪吒汽车全面深化战略合作

AGI的突破掀起技术范式的革新,坚实的核心研发能力成为行业竞争的关键。商汤绝影率先构建了四大技术基座,正在成长为加速智能汽车驶入AGI时代的核心技术伙伴。

SenseCore商汤大装置是行业领先的AI基础设施,能够以高达12,000 petaFLOPS的丰沛算力支持商汤绝影系列原生态大模型的高效迭代;

商汤绝影为智能汽车前瞻构建了UniAD、DriveAGI以及面向座舱的多模态场景大脑等系列原生态大模型,加速端到端自动驾驶和大模型在智能座舱场景的落地;

端云协同和舱驾融合的创新软硬件架构,让智能汽车降本增效、涌现创新功能;

全栈的数据生产管线,实现大模型的高质量训练。

车展上,哪吒汽车官宣与商汤绝影全面深化战略合作,双方将开启合作新篇章。商汤绝影将以大算力和原生态汽车垂类大模型更好地助力哪吒汽车智能化发展,共同探索更前沿的智能驾驶技术以及多模态场景大脑带来的全新智慧出行体验。

0ac71fa2-03c8-11ef-a297-92fbcf53809c.png

未来一到两年,智能汽车处在一个关键的时间节点,它与通用人工智能的深度融合将开启一个全新的时代,车企需要强有力的核心技术伙伴携手共进。

商汤绝影正是行业稀缺的同时具备“算力+算法+量产经验”全栈技术领先的核心供应商,是一匹应势而跃的千里马,能够助力合作伙伴在AGI时代持续领先。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    784

    文章

    13806

    浏览量

    166435
  • 人工智能技术

    关注

    2

    文章

    216

    浏览量

    10550
  • 大模型
    +关注

    关注

    2

    文章

    2442

    浏览量

    2685

原文标题:2024北京车展丨商汤绝影真·端到端自动驾驶解决方案UniAD上车首秀

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    特斯拉带火“”智驾,国内车企加速上车

    2024年1月,特斯拉开始大规模推送FSD V12,从此“”智能驾驶在汽车行业兴起。小鹏、理想、智已、商汤等公司也纷纷推出自家的
    的头像 发表于 12-02 08:45 1593次阅读
    特斯拉带火“<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”智驾,国内车企加速<b class='flag-5'>上车</b>

    自动驾驶技术研究与分析

    编者语:「智驾最前沿」微信公众号后台回复:C-0450,获取本文参考报告:《自动驾驶行业研究报告》pdf下载方式。 自动驾驶进入202
    的头像 发表于 12-19 13:07 154次阅读

    从车企实践看自动驾驶解决方案

    中的重要性日益凸显,这也促使众多汽车制造商加快了智能化技术的研发和工程投入,未能跟上智能化步伐的汽车品牌可能会逐渐失去市场竞争力,自动驾驶技术的发展已然进入关键阶段,其中概念的提
    的头像 发表于 11-19 10:55 533次阅读
    从车企实践看<b class='flag-5'>自动驾驶</b><b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>解决方案</b>

    连接视觉语言大模型与自动驾驶

    自动驾驶在大规模驾驶数据上训练,展现出很强的决策规划能力,但是面对复杂罕见的驾驶场景,依然
    的头像 发表于 11-07 15:15 239次阅读
    连接视觉语言大模型与<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>

    Waymo利用谷歌Gemini大模型,研发端自动驾驶系统

    迈新步,为其机器人出租车业务引入了一种基于谷歌多模态大语言模型(MLLM)“Gemini”的全新训练模型——“多模态自动驾驶模型”(EMMA)。
    的头像 发表于 10-31 16:55 1060次阅读

    Mobileye自动驾驶解决方案的深度解析

    自动驾驶技术正处于快速发展之中,各大科技公司和汽车制造商均在争相布局,试图在这个新兴领域占据一席之地。Mobileye作为全球自动驾驶技术的领军企业之一,凭借其独特的
    的头像 发表于 10-17 09:35 361次阅读
    Mobileye<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b><b class='flag-5'>解决方案</b>的深度解析

    智驾进程发力?小鹏、蔚来模型上车

    转型的关键时期,而智能驾驶技术的发展被视为这场变革的核心动力。作为自动驾驶的支撑技术之一,大模型凭借其感知、规划和控制的一体化能力,大
    的头像 发表于 09-26 09:19 274次阅读
    智驾进程发力?小鹏、蔚来<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>模型<b class='flag-5'>上车</b>

    实现自动驾驶,唯有

    ,去年行业主流方案还是轻高精地图城区智驾,今年大家的目标都瞄到了(End-to-End, E2E)。
    的头像 发表于 08-12 09:14 730次阅读
    实现<b class='flag-5'>自动驾驶</b>,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?

    商汤在行业率先实现原生多模态大模型的车部署

    “基于原生多模态大模型,商汤正在打造一系列全新的车载智能化产品,推动智能汽车向超级智能体进化。”商汤科技联合创始人、首席科学家、
    的头像 发表于 07-23 10:52 582次阅读
    <b class='flag-5'>商汤</b><b class='flag-5'>绝</b><b class='flag-5'>影</b>在行业率先实现原生多模态大模型的车<b class='flag-5'>端</b>部署

    理想汽车加速自动驾驶布局,成立“”实体组织

    近期,理想汽车在其智能驾驶领域迈出了重要一步,正式成立了专注于“自动驾驶”的实体组织,该组织规模超过200人,标志着理想在
    的头像 发表于 07-17 15:42 1351次阅读

    广汽丰田携手Momenta推出全场景智能驾驶方案

    在近日举行的广汽丰田科技开放日上,一场引领未来的智能驾驶技术盛宴吸引了全球目光。广汽丰田携手国内领先的自动驾驶解决方案提供商Momenta,共同推出了
    的头像 发表于 06-29 17:36 1668次阅读

    商汤大模型C助力LEVC全新智慧出行体验

    大模型上车,翼L380更是为用户打造了创新的智能座舱体验。作为中国智能座舱的领军企业,商汤与LEVC翼
    的头像 发表于 06-26 15:00 1341次阅读

    智行者联合清华完成国内套全栈式自动驾驶系统的开放道路测试

    近日,智行者与清华大学车辆学院李克强院士、李升波教授领导的研究团队,完成了国内套全栈式自动驾驶系统的开放道路测试。
    的头像 发表于 04-22 09:24 777次阅读
    智行者联合清华完成国内<b class='flag-5'>首</b>套全栈式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>系统的开放道路测试

    佐思汽研发布《2024年自动驾驶研究报告》

    自动驾驶是直接从传感器信息输入(如摄像头图像、LiDAR等)控制命令输出(如转向、加减速等)映射的一套系统,最早出现在1988年的A
    的头像 发表于 04-20 11:21 3204次阅读
    佐思汽研发布《2024年<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>自动驾驶</b>研究报告》

    康谋方案 | 基于场景的硬件在环(HiL)测试智能解决方案

    。同时,针对不同传感器进行协同工作,模拟不同的驾驶环境和交通状况,测试和验证自动驾驶车辆的算法和决策策略,从而确保其安全性和可靠性。 方案特点 针对ADAS/AD系统进行基于场景的
    的头像 发表于 01-31 17:17 777次阅读
    康谋<b class='flag-5'>方案</b> | 基于场景的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>硬件在环(HiL)测试智能<b class='flag-5'>解决方案</b>