0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软发布PhI-3-Vision模型,提升视觉AI效率

微云疏影 来源:综合整理 作者:综合整理 2024-05-28 11:35 次阅读

5 月 28 日,微软在 Build 2024 大会上推出了最新的 Phi-3 系列成员——Phi-3-vision。这一工具主打视觉应用,能有效处理图片文字信息,且在移动设备上也能运行自如。

Phi-3-vision 是一种小型多模式语言模型(SLM),主要适用于本地人工智能场景。其模型参数高达 42 亿,上下文序列包含 128k 个符号,可满足各种视觉推理和其他任务需求。

Microsoft 通过一篇新发表的论文[PDF]展示了 Phi-3-vision 的强大实力。与其他模型如 Claude 3-haiku、Gemini 1.0 Pro 相比,Phi-3-vision 毫不逊色。

此外,Microsoft 还对 Phi-3-vision 进行了多项测试,并将其与其他竞品模型进行了比较,包括字节跳动的 Llama3-Llava-Next(8B)、微软研究院与威斯康星大学、哥伦比亚大学联合开发的 LlaVA-1.6(7B)以及阿里巴巴通义千问 QWEN-VL-Chat 模型等。结果表明,Phi-3-vision 在多个项目中的表现均十分出色。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6594

    浏览量

    104054
  • 人工智能
    +关注

    关注

    1791

    文章

    47259

    浏览量

    238431
  • 语言模型
    +关注

    关注

    0

    文章

    523

    浏览量

    10277
收藏 人收藏

    评论

    相关推荐

    Meta发布AI模型Meta Motivo,旨在提升元宇宙体验

    Meta公司近日宣布,将推出一款名为Meta Motivo的全新人工智能模型。该模型具备控制类似人类的数字代理动作的能力,有望为元宇宙的用户体验带来显著提升。 Meta Motivo的发布
    的头像 发表于 12-16 10:34 278次阅读

    微软预览版Copilot Vision AI功能上线

    微软公司近日宣布,将面向美国地区的Copilot Pro用户推出预览版的Copilot Vision AI功能。这一创新功能旨在通过人工智能技术,进一步提升用户的网页浏览体验。 Cop
    的头像 发表于 12-09 14:38 267次阅读

    AI干货补给站04 | 工业AI视觉检测项目实施第三步:模型构建

    在当今智能制造的浪潮中,AI视觉检测技术凭借其高效、精准的特性,已然成为提升产品质量和生产效率的重要工具。为了助力从业者更好地理解和实施AI
    的头像 发表于 11-29 01:04 180次阅读
    <b class='flag-5'>AI</b>干货补给站04 | 工业<b class='flag-5'>AI</b><b class='flag-5'>视觉</b>检测项目实施第三步:<b class='flag-5'>模型</b>构建

    微软发布Azure AI Foundry,推动云服务增长

    。 Azure AI Foundry为用户提供了一个更为便捷的平台,使得在支持人工智能的大型语言模型之间切换变得轻松自如。这一创新工具的发布,无疑将极大地降低AI应用的开发门槛,进一步
    的头像 发表于 11-21 11:32 426次阅读

    在英特尔酷睿Ultra7处理器上优化和部署Phi-3-min模型

    2024年4月23日,微软研究院公布Phi-3系列AI模型,包含三个版本:mini(3.8B参数)、small(7B参数)以及medium(14B参数)。
    的头像 发表于 08-30 16:58 599次阅读
    在英特尔酷睿Ultra7处理器上优化和部署<b class='flag-5'>Phi-3</b>-min<b class='flag-5'>模型</b>

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    本帖最后由 jf_40317719 于 2024-6-18 17:39 编辑 视觉语音大模型 AI 开发套件( CSK6-MIX )是围绕 CSK6011A 芯片设计的具备丰富语音图像功能
    发表于 06-18 17:33

    英特尔机器视觉AI解决方案助力生产力升级

    5月21日-22日,北京机器视觉助力智能制造创新发展大会在北京国际会议中心圆满举行。本次大会以“Vision+AI引领新质生产力”为核心主题,聚焦“3D视觉与精准成像、
    的头像 发表于 05-30 17:14 532次阅读
    英特尔机器<b class='flag-5'>视觉</b>与<b class='flag-5'>AI</b>解决方案助力生产力升级

    英特尔联手微软,推动移动设备低功耗计算及AI解决方案

    据报道,微软于4月至5月间相继推出了多款Phi-3小型语言模型(SLM),这些模型以其“轻便易携且能在移动设备中运行”以及强大的视觉处理能力
    的头像 发表于 05-27 15:59 366次阅读

    微软发布视觉AI模型Phi-3-vision

     据悉,Phi-3-vision 作为微软 Phi-3 家族的首款多模态模型,继承自 Phi-3-mini 的文本理解能力,兼具轻巧便携特性
    的头像 发表于 05-27 15:56 486次阅读

    英特尔优化AI产品组合,助力微软Phi-3家族模型

    近日,英特尔宣布针对微软Phi-3家族开放模型,成功验证并优化了其跨客户端、边缘及数据中心的AI产品组合。这一重要举措旨在提供更为灵活和高效的AI
    的头像 发表于 05-27 11:47 665次阅读

    英特尔与微软合作在其AI PC及边缘解决方案中支持多种Phi-3模型

    近日,英特尔针对微软的多个Phi-3家族的开放模型,验证并优化了其跨客户端、边缘和数据中心的AI产品组合。
    的头像 发表于 05-27 11:15 577次阅读

    微软开发新AI语言模型MAI-1,挑战行业巨头

    据最新消息,微软正积极开发一款新型AI语言模型MAI-1,以提升在快速发展的AI市场中的竞争力。
    的头像 发表于 05-08 10:27 454次阅读

    NVIDIA加速微软最新的Phi-3 Mini开源语言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的 NVIDIA GPU 上运行的大语言
    的头像 发表于 04-28 10:36 563次阅读

    微软发布phi-3AI模型,性能超越GPT-3.5

    微软称,带有38亿参数的phi-3-mini经过3.3万亿token的强化学习,其基础表现已经超过Mixtral 8x7B及GPT-3.5;此外,该模型可在手机等移动设备上运行,并在phi
    的头像 发表于 04-23 14:32 541次阅读

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型开发效率提升10倍

    的潞晨科技Colossal-AI系统,用户可实现在本地算力平台一键训练、微调、推理、部署大模型,将大模型开发效率提升10倍以上,并将算力
    的头像 发表于 03-01 09:43 488次阅读
    潞晨科技Colossal-<b class='flag-5'>AI</b> + 浪潮信息AIStation,大<b class='flag-5'>模型</b>开发<b class='flag-5'>效率</b><b class='flag-5'>提升</b>10倍