标题:Meta Llama 4发布36小时差评如潮:员工匿名爆料拒绝署名技术报告,真相大白?
随着Meta最新基础模型Llama 4的发布,评论区却呈现出一种“差评如潮”的画风。短短36小时,这款备受期待的大模型却引发了诸多质疑和批评,这其中究竟隐藏着怎样的真相呢?本文将结合专业文献和匿名员工的爆料,对这一现象进行深入剖析。
首先,让我们关注到的是代码能力的问题。经典“氛围编程”小球反弹测试中的小球直接穿过墙壁掉下去了,这无疑反映出代码能力的不足。而在第三方基准测试中,Llama 4的表现大多直接逆转,排名末尾,这不禁让人质疑这个竞技场排名是否是数据过拟合,还是刷票现象。
更令人惊讶的是,一则有关Llama 4的匿名爆料突然引起轩然大波。有网友称已向Meta GenAI部门提交辞职,并要求不要署名在Llama 4的技术报告上。此爆料尚未得到证实,但有人搬出Meta GenAI负责人Ahmad Al-Dahle的帖子,至少能看出在Llama 4大模型竞技场里运行的是特殊版本模型。这让人对Meta在模型训练过程中的投入和产出产生质疑。
那么,这些质疑的背后是否隐藏着更深层次的问题呢?让我们将目光转向EQBench测评基准的长文章写作榜。在这个榜单中,Llama 4系列直接垫底。分析其原因,测试非常简单,模型需要先完成一个短篇小说的头脑风暴、反思并修改写作计划,最终每轮写1000字,重复8轮以上。而Llama 4的低分表现则表现在写作非常公式化,以及内容重复性较高。
针对这一现象,有人提出一个猜想,即版权诉讼导致Meta删除了网络和书籍数据,使用了更多的合成数据。这可能是解释Llama 4在长文章写作榜上表现不佳的原因之一。然而,这也引发了另一个问题:Meta在数据采集和使用上是否遵循了相关法律法规?
此外,这场诉讼也让许多作家发现自己的作品可能被用于AI训练,甚至到伦敦的Meta办公室附近发起抗议。这不禁让人思考:Meta在利用AI技术推动创新的同时,是否也充分考虑了相关利益方的权益?
回顾整个事件,从代码能力到数据采集,再到利益相关方的权益,我们不难发现Meta在Llama 4的研发过程中存在诸多问题。这也引发了我们对AI研发的更深层次的思考:如何在推动技术发展的同时,兼顾各方利益,实现真正的公平与共赢?
总之,Meta Llama 4发布36小时差评如潮的现象值得我们深入思考。我们需要更多的透明度和公开对话来确保AI技术的发展符合公众利益,同时也需要更多的监管和规范来确保技术的公正性和公平性。只有这样,我们才能真正实现人工智能的健康发展。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )