据报道,2023年5月14日,OpenAI正式公布其最新人工智能模型GPT-4o,预计其将于数周内在OpenAI的各类产品中逐步实现集成。尤其值得关注的是,GPT-4o将向所有用户免费开放。
OpenAI首席技术官穆里·穆拉蒂(Muri Murati)指出,GPT-4o具备与GPT-4相同的智能水平,且在文本、图像及语音处理方面有显著进步。他在OpenAI总部的主题演讲中表示:“GPT-4o能整合语音、文本和视觉信息进行推理。”GPT-4是OpenAI先前的旗舰模型,擅长处理图像和文本混合信息,如从图像中提取文字或描述图像内容等任务;而GPT-4o在此基础上增加了语音处理功能。
GPT-4o的运行速度将得到极大提高,其中最大亮点为其语音交互模式采用了创新技术。OpenAI一直致力于使用户能以语音方式与ChatGPT进行交流,如同与真人对话一样。然而,早期版本因延迟问题影响了对话的沉浸感。GPT-4o采用全新技术,使得聊天机器人的响应速度大幅度提升。
IT之家观察到,发布会现场OpenAI展示了GPT-4o进行语音对话的实例。演示者提问后,GPT-4o几乎能立即作出回应,并通过文本转语音功能进行朗读,使对话更具真实感。
另一演示展示了GPT-4o根据需求调整语调的能力,GPT-4o能根据指令改变声音,从夸张戏剧到冰冷机械,表现出卓越的可塑性。最后,演示还展示了GPT-4o的歌唱功能。
过去,OpenAI发布新版ChatGPT模型时,往往将其设为付费服务。此次GPT-4o将对所有用户免费开放,付费用户则享有五倍的调用额度。
此外,OpenAI还发布了桌面版ChatGPT和新的用户界面。穆拉蒂表示:“我们意识到这些模型正在变得日益复杂,因此我们希望用户与人工智能模型的交互体验更为自然、轻松,让他们能专注于与模型的协作,而不必过多关注界面本身。”
全部0条评论
快来发表一下你的评论吧 !