CMU周衔揭秘:物理引擎Genesis的诞生愿景与未来蓝图

   时间:2025-01-15 17:57 来源:ITBEAR作者:赵云飞

在人工智能与机器人技术的交汇点上,一个名为Genesis的开源项目正悄然引领着具身智能的新风潮。该项目由卡内基梅隆大学(CMU)机器人研究所的博士生周衔领导,联合了18个研究机构共同打造,旨在通过生成式物理引擎为机器人技术及其他领域提供全自动数据生成解决方案。

Genesis的核心团队由12位青年华人学者组成,他们重新设计和构建了一个通用物理引擎,将各种物理求解器及其耦合集成到一个统一的框架中。这个框架通过更高层次的生成式智能体得到进一步增强,能够自动生成机器人技术所需的大量数据。

与传统模拟平台相比,Genesis具备多个显著优势。它原生支持Python,包括前端界面和后端物理引擎,全部采用Python语法开发,底层则由GPU加速的DSL taichi提供支持。这使得安装过程变得极为简便,API设计也极其友好。Genesis的并行模拟速度空前,是世界上最快的物理引擎之一,模拟速度比现有的GPU加速机器人模拟器快出一个多数量级,且并未在模拟精度和保真度上做出妥协。

Genesis还支持各种最先进的物理求解器,能够对大量材料和物理现象进行建模,并具备优化性能的逼真光线追踪渲染。更重要的是,Genesis旨在与可微模拟完全兼容,目前已有部分求解器实现了可微性,其他求解器的可微性也将很快添加。

Genesis不仅能够生成4D物理世界,如机器人操作和运动策略、开放世界铰接式物体、角色运动等,还能通过语言提示生成各种模态的数据,包括交互式场景、任务提议、奖励、资产、角色动作、策略、轨迹、相机运动以及物理精确的视频等。这使得Genesis在机器人学习、强化学习等领域具有广泛的应用前景。

然而,在Genesis受到广泛关注和赞誉的同时,也面临着一些质疑。有人对其精确度和速度表示怀疑。为此,Genesis团队更新了一份详细技术报告,测评了各种场景下和主流并行仿真器的速度对比,并开源了所有测试代码以证明其优势。

作为Genesis项目的领导者,周衔的学术背景和研究经历颇为丰富。他本科就读于新加坡南洋理工大学的机械工程系,以最高荣誉毕业后进入CMU读博,成为导师Katerina Fragkiadaki组里首位研究机器人学习的PhD。在MIT-IBM Watson AI Lab实习期间,他与淦创等学者合作,开始了Genesis项目的研究。

周衔表示,他们最初只是想做一个仿真器,但受到ChatGPT等语言模型的启发,他们意识到可以利用语言或视觉模型的推理能力来自动生成机器人学习的任务、环境、奖励函数等,从而实现数据收集的规模化扩展。这一思路与后来谷歌和英伟达发布的类似项目不谋而合。

在谈到Genesis的亮点时,周衔强调了易用性、速度与功能三个方面。他精心设计了整套可视化方式和简洁的API接口,以降低用户的学习和理解成本。同时,Genesis在速度上实现了显著提升,为开发新的强化学习训练方案提供了可能。在功能上,Genesis支持多种物理性质物体的求解和不同求解器间的交互,为机器人领域的研究者提供了强大的工具。

对于开源的热情,周衔表示这源于他个人的强烈动机。他认为计算机图形学领域的人才和技术对于机器人领域具有巨大的价值,但以往两个领域之间存在巨大的割裂。因此,他希望通过打造一个完全透明、底层全开源、易于访问、理解和贡献的平台来推动两个领域的融合和发展。

在谈到Genesis项目中遇到的最大困难时,周衔表示这主要来自于系统庞大且涉及诸多方面的开发,以及合作形式的松散和缺乏经费激励。然而,他们还是坚持下来并完成了项目。在这个过程中,他们不仅学习到了如何设计、搭建和整合各个模块,还深刻体会到了团队合作和“为爱发电”的重要性。

对于Genesis发布后收到的质疑声音,周衔表示他们一直在进行各种测试以证明其速度和精确度的优势。他认为仿真和真机两条路都要走,仿真能够提供大量数据让机器人建立与物理世界交互的基本认知,而真机则能够提供更精准的数据来优化机器人的性能。因此,他们希望将Genesis打造成一个对机器人最友好的平台,并借助开源社区的力量将其维护好。

 
 
更多>同类内容
推荐图文
推荐内容
点击排行
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群