作为此前的“开源一哥”,Meta凭借在开源模型上的优异表现而一度股价飙升。但DeepSeek的横空出世,狠狠地打了唯算力论们一巴掌。
为了重回宝座,Meta也是在这个月月初上线了LIama 4模型。其引入的MoE架构,让该模型在多项测试上都十分亮眼,帮助Meta重新夺回了开源模型第一的宝座。但发布后不久,这款模型就陷入了舆论当中。
原因很简单,用户在体验过LIama 4模型后,纷纷吐槽其糟糕的表现。且不说数学推理能力,即使是图片理解功能也比较糟糕,体验甚至不如友商在去年发布的一些模型。可之前Meta在宣传过程中,可是着重宣传了LIama 4的图像理解能力的,为何体验与实际相差这么多呢?
虽然LIama 4在各大测试数据排行榜排在前列,可当我们将目光转向来自用户反馈的第三方榜单,其口碑就崩成了倒数。随后更是有人在留学论坛上爆料,说LIama 4是在测试前提前“刷题”了。
其实作弊这个事儿是有先例的,去年OpenAI也测被爆料提前训练了常见的数字基准测试,还被爆与某协会有关联。不过在爆料出现后,论坛是随即又有Meta的员工站出来否认了此事,让整起事件更加扑朔迷离。
不过,即便可能是谣言,该爆料在论坛上仍旧被不少人相信,甚至还被搬运到reddit等知名论坛上。其实说到底,是因为deepseek在此前的表现太过亮眼,让人们对于此前各大科技巨头的模型产生了不信任感。而为了重新夺回用户心智,Meta为首的科技巨头们也十分急于反击,否则先前大量投入岂不是会被人质疑。
但可惜的是,LIama 4糟糕的实测表现反倒加剧了人们的反应,这才导致了后面的一系列闹剧。
发表评论 取消回复