在人工智能的大模型技术领域,阶跃星辰公司正逐渐崭露头角,其底层基础模型能力备受业界认可。尽管这种认可主要局限于对该领域有深入了解的专业人士,但阶跃星辰近期在LiveBench榜单上的亮眼表现,无疑将其技术实力推向了公众视野。
LiveBench,被誉为“世界上第一个不可玩弄的LLM基准测试”,其权威性和公正性在业界享有盛誉。最新榜单显示,阶跃星辰自研的万亿参数语言大模型Step-2,在国产基座大模型中独占鳌头,成绩直逼OpenAI的顶尖模型,超越了包括GPT-4在内的多个国际主流模型。在全球排名中,阶跃星辰紧随OpenAI和Anthropic之后,位列第五,成为中国唯一进入前十的大语言模型。
此次榜单的发布,不仅是对阶跃星辰技术实力的有力证明,更是对中国大模型技术发展的一次重要肯定。在LiveBench的多项测评标准中,Step-2在IF Average(指令跟随)方面的表现尤为突出,以86.57的高分位居榜首,超越了包括OpenAI最新模型在内的所有国内外语言大模型。这一成绩,充分展示了Step-2在复杂指令理解和执行方面的卓越能力。
阶跃星辰的技术突破,并非一蹴而就。自2024年3月发布国内首个由创业公司研发的万亿参数语言大模型预览版Step-2以来,阶跃星辰一直在全力提升自身底层实力。从在中文大模型基准测评机构SuperCLUE上登顶国内多模态大模型榜首,到本次在LiveBench上获得中国大模型第一,阶跃星辰的技术进步有目共睹。
Step-2的成功,离不开其背后强大的技术支撑。阶跃星辰采用了创新的MoE架构,通过部分专家共享参数、异构化专家设计等创新设计,实现了对模型的高效训练。同时,阶跃星辰在系统能力方面也取得了显著突破,6D并行、极致显存管理、完全自动化运维等关键技术的突破,为Step-2的高效训练提供了有力保障。
除了Step-2之外,阶跃星辰的Step系列还包括Step-1.5V多模态大模型和Step-1X图像生成大模型。Step-1.5V在视频理解和感知能力方面表现出色,能够准确识别视频中的物体、人物和环境,理解视频的整体氛围和人物情绪。而Step-1X则具备更强的深度语义对齐能力和细节生成能力,能够生成与中国文化深度契合的高质量图像。
基于Step系列大模型的技术实力,阶跃星辰的产品开发也取得了显著进展。其C端产品跃问,通过引入图像交互“即拍即问”功能,解决了用户在文字和语音交互中难以准确描述的痛点,获得了用户的一致好评。目前,Step-2已经接入跃问APP和网页端,开发者可以通过API接入使用Step-2,进一步拓展了阶跃星辰的技术应用场景。
阶跃星辰的崛起,不仅为中国大模型技术的发展注入了新的活力,也为全球AI领域带来了新的竞争格局。随着技术的不断进步和应用场景的不断拓展,阶跃星辰正以其阶跃之力,向着更加广阔的星辰大海进发。