Llama 4遭质疑:AI发展停滞?NYU教授断言规模化时代已终结

   时间:2025-04-09 01:00 来源:ITBEAR作者:沈瑾瑜

近期,人工智能领域掀起了一场关于Llama 4模型的热烈讨论,多位业界领袖和学者纷纷发声,对Llama 4的表现提出了质疑,并探讨了其对AI未来发展的影响。

一位知名AI公司CEO深入剖析了Llama 4存在的五大疑点,引发了广泛共鸣。他指出,Llama 4所宣称的突破并未如愿带来显著的智能提升,反而暴露出一系列问题。同时,有圈内人士悲观地认为,Llama 4的表现或许标志着单纯依靠模型规模扩大(Scaling)来提升AI能力的时代已经结束,大型语言模型(LLM)在推理能力上的欠缺依然难以弥补。

Anthropic公司的CEO Dario也制作了一段长视频,详细列举了Llama 4的六大疑点。他逐一剖析了Llama 4在性能、发布时机、测试数据等方面的争议,指出其可能存在的夸大宣传和测试作弊等问题。Dario的剖析进一步加剧了业界对Llama 4真实能力的怀疑。

纽约大学教授马库斯则在博客中总结了当前AI领域的现状,直言不讳地表示,Scaling时代已经结束,模型仍然无法可靠推理,金融泡沫正在破裂,GPT-5的推出遥遥无期,对不可靠语言模型的过度依赖已经让世界陷入了困境。他此前做出的多项预测,如今看来一一应验。

马库斯强调,大语言模型并非解决问题的万能钥匙,我们需要探索更可靠的方法。他指出,像OpenAI和Anthropic这样的公司,虽然致力于推动AI技术的发展,但面对高昂的研发成本,它们的资金储备显然难以为继。如果投资者对经济衰退的预期增强,AI领域的投资将进一步缩减,从而导致AI进展放缓。

Dario在之前的采访中曾提到,战争可能是阻止AI进步的一个因素。然而,如今看来,系统的另一种混沌状态似乎已经提前到来。他预测,如果技术无法继续向前发展,资本化不足将成为AI进步的重大阻碍。Llama 4的争议无疑加剧了这一趋势。

关于Llama 4的具体疑点,首先在于其所谓的业界领先的一千万个token的上下文窗口是否名副其实。有对比数据显示,早在Llama 4发布之前,Gemini 1.5 Pro就已经达到了这一标准,并且在长上下文深度理解基准测试中表现优异,而Llama 4的中等模型和小模型则表现不佳。

其次,Llama 4选择在周六发布也引发了诸多猜测。这一非典型的发布时间,以及模型训练数据截止时间的滞后,都让人怀疑meta是否在刻意避开公众视线,试图掩盖模型的不足。关于Llama 4在LM Arena上是否存在作弊行为的质疑也甚嚣尘上,尽管LM Arena已经公开了测试数据并表示将重新评估排行榜,但这一事件依然对Llama 4的声誉造成了不可磨灭的影响。

Llama 4在编码基准测试中的糟糕表现,也与其宣传的“取代中级程序员”的言论形成了鲜明对比。在ADA的Polyglot编码基准测试中,Llama 4 Maverick的得分惨不忍睹,远低于Gemini 2.5 Pro等竞争对手。这一系列争议和质疑,无疑给Llama 4的前景蒙上了一层阴影。

 
 
更多>同类内容
推荐图文
推荐内容
点击排行
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群