电子说
快科技2月18日消息,日前,打造了ChatGPT的人工智能公司OpenAI发布了首个文生视频模型Sora,用户通过一句话,就能生成长达1分钟的高清视频。
在Sora发布后,OpenAI的估值正在大幅飙升。
市场预计,在最新一轮由风投公司Thrive Capital牵头融资中,OpenAI的估值有望超过800亿美元(约合5755亿元人民币)。
作为对比,OpenAI去年年初发布ChatGPT的时候,该公司的估值大约为290亿美元(约合2086亿元人民币),如今却飙升了275%
800亿美元的估值,还意味着该公司成为全球市值第三高的科技初创公司,仅次于字节跳动(2250亿美元)和埃隆·马斯克领导的太空运输公司SpaceX(1500亿美元)。
文生视频对比实测:Sora从“动图”升级到“短片”
“一个时髦的女人走在东京的街道上,街道上充满了温暖发光的霓虹灯和生动的城市标志。她穿着一件黑色的皮夹克,一件红色的长裙,一双黑色的靴子,还带着一个黑色的钱包。她戴着太阳镜,涂着红色的口红。她自信而随意地走着。街道是潮湿和反光的,创造了一个五颜六色的灯的镜面效果。许多行人走来走去。”这是OpenAI官网介绍Sora时,出现的第一组提示词。
在OpenAI推出Sora之前,文生视频领域的创业公司主要包括Pika、Runway等,为了验证Sora的能力,新京报贝壳财经记者将上述同样的提示词输入Pika文生视频模型,以及Runway旗下的Gen-2video文生视频模型进行了实测。
在相同提示词下,新京报贝壳财经记者使用Pika生成的视频截图。
在相同提示词下,新京报贝壳财经记者使用runway旗下Gen-2video生成的视频截图。
OpenAI官网上Sora生成的视频。
贝壳财经记者发现,在相同的提示词下,Pika仅能生成3秒的视频,Gen-2video则可以生成4秒的视频。其中,Pika的视频为“时髦女人”的背影,无法体现她“戴着太阳镜,涂着红色的口红”的描述,不过对于提示词中“潮湿反光的街道和五颜六色灯的镜面效果”体现得较好,但整体上视频较为模糊。
Gen-2video则跳出了“无法输入这么多提示词”的弹窗,并根据能够输入的部分生成了一个4秒的视频,该视频相比Pika显然精细很多,也符合提示词描述的人物形象,包括“街道、人群、黑钱包”等。
但可以发现,无论是Pika还是Gen-2video,都忽略了“一件红色的长裙”这个细节,且贝壳财经记者通过观看视频发现,这两段视频仍能看出AI生成的影子,特别是Gen-2video的人物脸部,有细微的形变,这正是AI生成视频的特点之一:难以始终保持同一人物的连贯性。
而Sora不仅体现了提示词中的全部细节,而且还很好地保持了人物的连贯性,使得该视频几乎可以“以假乱真”。当然,如果仔细观察,可以发现该视频中人物的脚步在某几个帧会出现不自然的扭曲,以及该视频中的背景广告牌虽然酷似日文,但由于目前AI还无法直接在视频中“认识”文字,其只能生成似是而非的“日文”,这都是AI生成视频的特点之一。
但即便如此,Sora还是用事实显现出了同其他文生视频大模型的代差。
在谷歌(141.76, -2.18, -1.51%)和推特都有从业经历的AI创业者Gabor Cselle也发布了使用相同提示词,在其他四个文生视频模型中“复现”Sora“穿过下雪、樱花飞舞的东京街道……”的场景,并表示“其他模型达不到能和Sora比较的效果”。
Gabor Cselle社交账号截图。
Sora助推OpenAI估值飙升275%!跃升至全球第三大独角兽
Sora发布后,与OpenAI分道扬镳的早期创始人、特斯拉CEO马斯克也在转发网友的帖子时评论称:“gg humans”,gg为网络用语good games的缩写,常用于表达输家输得心服口服的感叹。
360创始人周鸿祎也表示,Sora的诞生意味着AGI的实现可能从10年缩短至两年左右。
审核编辑 黄宇
全部0条评论
快来发表一下你的评论吧 !