阶跃星辰登顶LiveBench，国产大模型实力超越国际主流-关于我们-虎科技

在人工智能的大模型技术领域，阶跃星辰公司正逐渐崭露头角，其底层基础模型能力备受业界认可。尽管这种认可主要局限于对该领域有深入了解的专业人士，但阶跃星辰近期在LiveBench榜单上的亮眼表现，无疑将其技术实力推向了公众视野。

LiveBench，被誉为“世界上第一个不可玩弄的LLM基准测试”，其权威性和公正性在业界享有盛誉。最新榜单显示，阶跃星辰自研的万亿参数语言大模型Step-2，在国产基座大模型中独占鳌头，成绩直逼OpenAI的顶尖模型，超越了包括GPT-4在内的多个国际主流模型。在全球排名中，阶跃星辰紧随OpenAI和Anthropic之后，位列第五，成为中国唯一进入前十的大语言模型。

此次榜单的发布，不仅是对阶跃星辰技术实力的有力证明，更是对中国大模型技术发展的一次重要肯定。在LiveBench的多项测评标准中，Step-2在IF Average（指令跟随）方面的表现尤为突出，以86.57的高分位居榜首，超越了包括OpenAI最新模型在内的所有国内外语言大模型。这一成绩，充分展示了Step-2在复杂指令理解和执行方面的卓越能力。

阶跃星辰的技术突破，并非一蹴而就。自2024年3月发布国内首个由创业公司研发的万亿参数语言大模型预览版Step-2以来，阶跃星辰一直在全力提升自身底层实力。从在中文大模型基准测评机构SuperCLUE上登顶国内多模态大模型榜首，到本次在LiveBench上获得中国大模型第一，阶跃星辰的技术进步有目共睹。

Step-2的成功，离不开其背后强大的技术支撑。阶跃星辰采用了创新的MoE架构，通过部分专家共享参数、异构化专家设计等创新设计，实现了对模型的高效训练。同时，阶跃星辰在系统能力方面也取得了显著突破，6D并行、极致显存管理、完全自动化运维等关键技术的突破，为Step-2的高效训练提供了有力保障。

除了Step-2之外，阶跃星辰的Step系列还包括Step-1.5V多模态大模型和Step-1X图像生成大模型。Step-1.5V在视频理解和感知能力方面表现出色，能够准确识别视频中的物体、人物和环境，理解视频的整体氛围和人物情绪。而Step-1X则具备更强的深度语义对齐能力和细节生成能力，能够生成与中国文化深度契合的高质量图像。

基于Step系列大模型的技术实力，阶跃星辰的产品开发也取得了显著进展。其C端产品跃问，通过引入图像交互“即拍即问”功能，解决了用户在文字和语音交互中难以准确描述的痛点，获得了用户的一致好评。目前，Step-2已经接入跃问APP和网页端，开发者可以通过API接入使用Step-2，进一步拓展了阶跃星辰的技术应用场景。

阶跃星辰的崛起，不仅为中国大模型技术的发展注入了新的活力，也为全球AI领域带来了新的竞争格局。随着技术的不断进步和应用场景的不断拓展，阶跃星辰正以其阶跃之力，向着更加广阔的星辰大海进发。