面壁智能刘知远:AGI征途,理想与现实的持久较量

   时间:2025-03-04 19:17 来源:ITBEAR作者:柳晴雪

在人工智能领域,DeepSeek的迅速崛起如同一颗炸弹,让中国的大部分大模型团队措手不及。然而,面壁智能这家公司却因其在底层技术和AGI(通用人工智能)路径上与DeepSeek的相似性,在这场风暴中得以幸存。

面壁智能,作为中国最早的大模型团队之一,成立于2022年8月。其创始团队早在2021年就开始参与北京智源人工智能研究院的“悟道”项目,训练出多个百亿、千亿参数规模的大模型,并成立了开源社区OpenBMB。他们是国内最早提出“平民版大模型”并推动大模型开源的团队之一。

尽管面壁智能在技术和AGI理解上表现出色,但在2022年至2023年大模型浪潮初起时,却遭遇冷落与误解,未能享受到首轮红利。2023年,面壁智能在训练出千亿参数规模的基础模型后,因早期融资不足且千亿模型难以落地,决定转向训练参数规模更小、算力更低但性能更强的端侧模型。这一决策虽然使他们在国内大模型创业团队中脱颖而出,但也让他们错过了DeepSeek V3等在与Llama 3、GPT-4等同级别基础大模型上验证“更低成本训练更强模型”的机会。

面壁智能的发展为大模型创业热潮提供了另一种视角。当ChatGPT引爆市场后,资本纷纷对标OpenAI,对强调技术创新的差异化路线反应冷淡。这种认知滞后揭示了中国科技投资的深层困境:在技术演进中,资本往往成为后验的追随者而非先验的引领者。

2024年,多位投资者对面壁智能的评价是:“这个团队技术很好,但给人感觉太过高雅,如果在国内做To B业务,我不知道他们能否与B端客户建立紧密关系。”DeepSeek在硅谷的成功以及国产动漫电影《哪吒 2》的大热,使2025年被称为“理想主义者的胜利”。那么,作为大模型圈中的典型理想主义者,面壁智能是否也迎来了他们的胜利?

事实上,AGI比我们想象的要复杂得多,胜利的到来或许还很遥远。在与雷峰网AI科技评论的深入交流中,面壁智能的创始人、清华大学副教授刘知远博士多次引用毛主席的《论持久战》来解释他们在AGI路上的思考。他认为,AGI的胜利需要战略上的持久战和战术上的速决战。

刘知远指出,大模型技术还远未收敛,反而在加速前进。AGI是一场关于“智力”的持久战,真正的胜利不在于短期估值的高低,而在于能否实事求是地追寻理想主义。站在2025年的门槛回望,面壁智能的历程折射出中国创新生态的复杂图景,包括资本市场的认知滞后、技术路线的摇摆争议以及商业化与理想主义的碰撞。

刘知远还分享了面壁智能在融资过程中的挑战。最初,许多投资者对大模型的概念并不了解,对其商业价值持怀疑态度。随着ChatGPT的爆火,市场热情高涨,但面壁智能因团队商业化经验不足和融资节奏问题,错过了最佳融资时机。尽管如此,刘知远认为,高价值的团队和产品最终会通过时间的检验获得应有的认可。

对于面壁智能的竞争优势,刘知远强调,他们认为大模型技术仍在快速演进,最先进的技术要么是他们做出来,要么是别人做出来后他们能够迅速融合到自身体系中。这种创新能力是面壁智能的核心优势。

在战略选择上,面壁智能决定专注于端侧模型的发展。刘知远认为,随着技术的进步和成本的降低,端侧模型将在未来发挥重要作用。他们希望通过在端侧模型上的突破,赢得更多资源和市场认可。

对于未来,刘知远表示,面壁智能将继续坚持技术创新和理想主义精神,努力在AGI领域取得更多突破。他们相信,通过一场又一场的胜利,最终能够迎来AGI时代的真正到来。

面壁智能的故事不仅是一个关于技术创新和理想主义的故事,也是一个关于如何在复杂环境中坚持自我、追求梦想的故事。他们的经历为中国的大模型创业团队提供了宝贵的经验和启示。

 
 
更多>同类内容
推荐图文
推荐内容
点击排行
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群