沈向洋IDEA大会发布DINO-X:通用视觉大模型,万物皆可识

   时间:2024-11-23 15:09 来源:ITBEAR作者:顾雨柔

在近期举办的IDEA大会上,美国国家工程院外籍院士、IDEA创院理事长沈向洋以一句幽默而现实的话语引起了广泛关注:“谈卡伤情,无卡更无情。”这句话不仅逗乐了在场观众,也深刻反映了沈向洋对未来AI时代的乐观态度。

随着AI技术的不断发展,大模型的热度已不再像ChatGPT初现时那般迅猛增长。进入人类探索AGI(通用人工智能)的第二阶段,大语言模型的迭代速度明显放缓,而AI应用与落地则成为全球关注的焦点。沈向洋指出,尽管GPT-5尚未面世,但算力的增长仍呈现乐观态势。据EPOCH AI数据统计,大模型对算力的需求每年都呈现出四倍以上的增长趋势。

在大会上,沈向洋详细阐述了黄仁勋提出的“黄氏定律”,该定律以模型训练来衡量算力的增长。若按每年算力增长四倍的速度恒定发展,未来十年或将见证100万倍的算力需求增长。然而,这一预测仍需时间验证。沈向洋强调,大模型的进步不仅要求参数和模型规模的扩大,对训练和数据量的需求也在同步增长。算力需求与参数之间呈现出平方关系,这意味着算力需求将急剧增加。

沈向洋进一步指出,AI的发展离不开“算力、算法、数据”这三大要素。在大会上,他围绕这三个方向,介绍了IDEA的最新进展。IDEA最新发布的通用视觉大模型DINO-X,具备真正的物体级别理解能力,能够在开放世界中实现目标检测,无需用户提示即可检测所有物体,包括罕见的长尾物体。这一能力将大大拓展模型的落地场景。

DINO-X在自动驾驶、智能安防、工业检测等领域也将发挥重要作用,能够应对各种复杂场景,识别出传统模型难以检测的物体。IDEA团队还推出了行业平台架构,通过一个大模型基座,结合通用识别技术,使模型能够边用边学,满足多种多样的B端应用需求。沈向洋表示,“用一个模型解决一百万个问题”是这次模型发布的关键理念。

然而,随着模型体量的增大,高质量数据已成为制约AI发展的瓶颈。沈向洋指出,当前人工智能的发展已经耗尽了人类社会的大部分高质量数据。为解决这一问题,IDEA团队发布了自研的语境图谱技术,该技术通过引入“指导手册”,以图谱为纲,指导用于合成的语境采样,解决了过往文本数据合成方案多样性匮乏的问题。

实验结果显示,IDEA团队的方案能够持续为大模型带来能力提升,表现超过目前的最佳实践,同时平均节约成本85.7%。IDEA在AI应用落地方面也取得了显著进展。今年,IDEA公布了多个垂直领域的应用探索,包括化学领域专家大模型、科研数据处理平台以及AI编程工具等。

其中,IDEA研发的化学领域专家大模型在分子属性预测和化学反应预测能力上达到了业界领先水平。新发布的化学文献多模态大模型则与晶泰科技联合发布了专利数据挖掘平台PatSight,将药物领域的专利化合物数据挖掘时间从数周缩短至1小时。同时,IDEA研究院的MoonBit团队展示了其开发的云原生AI编程工具MoonBit,该工具具备完备的多后端支持和跨平台能力,将于12月正式开放。

在硬件层面,IDEA也取得了显著进展。坐落在大湾区的IDEA拥有得天独厚的硬件产业基础和优势,与腾讯、美团和比亚迪等知名企业展开了合作。其中,IDEA与腾讯合作在深圳福田区、河套深港科技创新合作区落地建设福田实验室,聚焦人居环境具身智能技术;与美团合作探索无人机视觉智能技术;与比亚迪合作拓展工业化机器人智能应用。

IDEA还发布了《低空经济发展白皮书3.0》,并发起共建OpenSILAS创新联合体,与17家首批发起单位携手,共同打造一个开放共享、技术领先、不断迭代的系统和平台。沈向洋在大会最后表示,AI的发展不仅要追求经济增长,更要转化为人类的最大福祉。这是IDEA研究院及其合作伙伴在人工智能发展道路上必须思考的问题。

 
 
更多>同类内容
推荐图文
推荐内容
点击排行
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群