豆包大模型智源评测大放异彩，国产AI能否领跑未来？-业界资讯-虎科技

豆包大模型智源评测大放异彩，国产AI能否领跑未来？

时间：2024-12-20 18:16 来源：ITBEAR作者：沈瑾瑜

近期，智源研究院揭晓了一项涉及国内外100多个开源与商业闭源大模型的全面评测结果，引起了业界的广泛关注。在备受瞩目的大语言模型评测能力榜单中，一款名为豆包通用模型pro（Doubao-pro-32k-preview）的国产大模型，在主观评测环节脱颖而出，荣获榜首。

据悉，智源研究院的Flageval评测平台，已纳入全球超过800个开闭源大模型，并与国内十余所高校及机构合作，共同构建评测方法与工具。此次评测中，大语言模型的主观评测尤为注重模型的中文处理能力。豆包通用模型pro凭借其卓越表现，赢得了专家评审团的高度认可。

不仅如此，在多模态模型评测榜单的视觉语言模型分类中，豆包·视觉理解模型（Doubao-Pro-Vision-32k-241028）同样表现出色，仅次于GPT-4，成为得分最高的国产大模型。这一成绩不仅彰显了豆包大模型在视觉语言理解领域的深厚实力，也为其在更多应用场景中的拓展奠定了坚实基础。

在Flageval大模型角斗场榜单中，豆包通用模型pro同样不负众望，位居大语言模型榜单的第二名，仅次于OpenAI的o1-mini。这一成绩再次证明了豆包大模型在业界的领先地位，以及其在处理复杂语言任务方面的卓越能力。

随着使用量的不断攀升，豆包大模型也迎来了全新的升级。数据显示，自今年5月发布以来，豆包大模型的日均tokens使用量已超过4万亿，增长了33倍之多。这一增长不仅推动了豆包大模型在不同应用场景中的广泛应用，也为其性能的持续优化提供了有力支撑。

此次升级后，豆包通用模型pro在综合处理能力上提升了32%，推理能力提升了13%，指令遵循能力提升了9%，代码处理能力提升了58%，数学能力提升了43%，专业知识领域能力也提升了54%。这一系列显著的提升，使得豆包大模型在处理复杂任务时更加游刃有余。

与此同时，豆包·视觉理解模型也在FORCE原动力大会上正式对外发布。该模型能够理解用户输入的文本和图片信息，并给出准确的回答。凭借其强大的内容识别、理解和推理能力，以及细腻的视觉描述能力，豆包·视觉理解模型在教育、旅游、电商等场景中具有广泛的应用前景。

为了更好地帮助企业开拓大模型的创新应用场景，豆包·视觉理解模型还提供了极具竞争力的价格。每千tokens仅需0.003元，比行业平均价格降低了85%。这一举措无疑将大大降低企业使用大模型的门槛，推动AI大模型应用的普及与落地。

更多>同类内容

高鑫零售换帅李卫平，盒马基因注入，能否引	任正非谈AI：从未来趋势到应用价值，深度剖
京东“TGT燃力之旅”启幕，与青年技术人才	饿了么更名淘宝闪购：阿里即时零售战略升级