在机器人学习领域的顶级会议CoRL 2024上,清华大学高阳团队凭借其杰出研究荣获X-Embodiment Workshop最佳论文奖,该奖项代表了前沿技术与重大突破。
高阳团队的研究聚焦于数据规模定律在机器人操作模仿学习中的应用。他们通过大量实验探索了如何通过合适的数据量实现零样本泛化,这一成果对机器人技术的进一步发展具有重要意义。
研究过程中,团队收集了超过4万次演示,并进行了1.5万次以上的机器人实测,以严谨的科学态度确保了研究结果的可靠性。他们发现,策略的泛化能力主要受到环境和物体多样性的影响,而不仅仅是演示的数量。
基于这一发现,高阳团队设计了一种高效的数据收集方案。令人惊讶的是,仅需四名采集者花费一个下午的时间,就能收集到足够的数据,使两个任务在新环境和新对象上的成功率达到约90%。这一成果无疑为机器人技术的实际应用提供了强有力的支持。
为了验证其研究的实用性,团队还将机器人部署在了各种真实环境中,包括火锅店、咖啡馆等日常生活场景。结果显示,模型在这些新环境中展现出了出色的泛化能力,超出了研究人员的预期。
高阳团队还深入探讨了策略泛化能力与训练物体数量、环境数量等因素的关系。他们发现,这些因素与策略的泛化能力之间呈现出幂律分布的关系,这一发现为未来的机器人学习研究提供了新的思路。
高阳团队的研究成果不仅获得了学术界的认可,也为机器人技术的实际应用开辟了新的道路。他们的努力将为未来机器人学习领域的发展注入新的活力。