微软研究院近期公开发布了Phi-3系列AI模型,该系列包括mini版(38亿参数)、small版(70亿参数)以及medium版(140亿参数)。
微软称,带有38亿参数的phi-3-mini经过3.3万亿token的强化学习,其基础表现已经超过Mixtral 8x7B及GPT-3.5;此外,该模型可在手机等移动设备上运行,并在phi-2模型(27亿参数)的基础上,进一步融合了严格筛选的网络数据与合成数据。
尽管phi-3-mini在语言理解和推理方面已能匹敌大参数模型,但在TriviaQA等特定任务中仍受限于模型规模。
值得注意的是,phi-3-small和phi-3-medium两款模型在MMLU测试中的得分分别达到了75.3和78.2。
全部0条评论
快来发表一下你的评论吧 !