ChatGPT 标志着生成式 AI 的大爆炸时刻正在开启。在刚刚过去的CES2025上,NVIDIA (英伟达)创始人兼CEO黄仁勋在演讲中提到,人形机器人的时代即将到来。
作为全球领先的算力提供商,NVIDIA在机器人领域投入布局巨大,着手迎接“通用机器人的ChatGPT时刻”。
当前,生成式 AI 发展火热,但 AI 在人形机器人、工厂和其它工业系统设备中的具象化体现尚未达到突破点。这阻碍了运输和移动、制造业、物流和机器人等行业的发展。
三大驱动力:机器人技术需求的源泉
相关数据显示,未来二十年,预计人形机器人市场将达到 380 亿美元。为了满足这一巨大需求,尤其是工业和制造业领域的需求,NVIDIA 发布了一系列机器人基础模型、数据管线和仿真框架,以加速下一代人形机器人的开发进程。
在2025年的技术浪潮中,机器人正迅速成为解决社会和产业需求的关键工具。NVIDIA机器人与边缘计算副总裁Deepu Talla在近期分享中,深刻阐述了机器人技术发展的驱动力、技术突破与未来应用,揭示了这一领域的巨大潜力与挑战。
Deepu Talla认为,指出,机器人技术的快速发展背后有三大核心驱动力:
1. 危险工作:在采矿等高危环境中,机器人可以替代人类承担风险,确保人员安全。
2. 劳动力短缺:社会职业结构的变化导致劳动力逐步减少,机器人可以填补这一空白。
3. 养老需求:随着全球平均寿命的延长,对护理和陪伴机器人的需求日益增长,机器人能够成为有效的“社会伴侣”。
这三大需求共同推动机器人技术成为现代社会不可或缺的组成部分。
关键突破:机器人技术发展的转折点
Deepu Talla强调,过去12个月中,机器人技术经历了两大关键突破:
1. 生成式AI(GenAI)的引入:两年前,大型语言模型(LLMs)颠覆了数字应用,如今这些技术被应用到机器人领域,成功连接了数字与物理应用。
2. 仿真环境的成熟:以NVIDIA Omniverse为代表的仿真技术提供了高精度的虚拟环境,使机器人测试从依赖真实世界转向虚拟测试,大幅降低了成本和时间消耗。
这些技术突破显著加快了机器人开发的进程,也为更多企业投入机器人研发提供了契机。
三台计算机,解决机器人挑战
为了真正解决机器人领域的挑战,我们需要三台计算机。” Deepu Talla如是说。
第一台计算机用于训练:这是用于训练AI模型的系统。训练通常在云端、数据中心或像NVIDIA DGX这样的强大系统上进行。这是构建机器人“大脑”的关键步骤。
第二台计算机用于仿真:一旦训练完成,就需要进行测试。以往的标准是物理测试,但这种方式既慢又昂贵,还存在风险。更好的解决方案是引入一个“仿真层”,即“数字孪生”(Digital Twin),在虚拟环境中完成测试。仿真允许在大规模、快速且安全的条件下运行数千种场景测试,无需受到真实世界时间或成本的限制。
第三台计算机用于部署:它安装在机器人内部,就是操作物理机器人的“大脑”。对NVIDIA来说,这可以通过像Jetson或AGX这样的系统来实现。
通过将训练、仿真、部署的循环过程,使得机器人技术进步从50年缩短到了5年,显著缩短机器人的开发周期。Deepu Talla对此解释,在将机器人部署至现实世界前,利用仿真系统开展成千上万次测试,可有效加速整个开发流程。倘若某个设计在现实应用中表现欠佳,便可返回仿真环境对模型进行优化,之后再次测试。
这种开发方法也解释了机器人技术相较于自动驾驶技术难度更高的原因。自动驾驶主要聚焦于躲避障碍物和保障行驶安全,无需与物理物体产生直接交互。而机器人领域则涉及与物体的接触、碰撞以及复杂的物理互动,这些环节的测试与优化难度极大。
仿真并非一个新概念。在芯片领域,仿真就早已进入了大规模生产之中,因为芯片设计一旦出现错误,可能会导致项目延误数月,造成数百万甚至数十亿美元的损失。所以,这样来看,给机器人仿真,也具备一定可行性。
不过,在机器人领域,仿真的主要的挑战在于 “仿真与现实的差距”(sim-to-real gap),即仿真结果与实际表现之间存在差异。在过去,由于仿真技术精度有限,该技术并未得到广泛应用。然而,诸如 Omniverse 等技术的出现,显著缩小了这一差距。尽管目前这一差距尚未完全消除,但技术的改进程度已足以使仿真成为机器人开发中可行且有效的工具。
据了解, NVIDIA 并不直接参与机器人的制造环节,而是选择与所有投身于机器人制造以及机器人解决方案开发的专业人员展开合作。当前,NVIDIA 正在搭建一个综合性平台,该平台涵盖了训练、仿真、部署三种计算系统,以及与之相关的软件工具和工作流程。其目的在于助力机器人专家、研究人员、机械工程师和测试人员能够更为便捷地开发机器人解决方案,通过简化流程和提高效率,加速机器人技术的研发进程。
机器人技术的另一个核心挑战在于数据的获取与生成。Deepu指出,与自动驾驶汽车依赖现有车辆生成海量数据不同,当前机器人的数量远不足以满足训练需求。为此,NVIDIA采用了以下解决方案:
1. 合成数据生成:通过工具(如NVIDIA Cosmos)创建逼真的虚拟环境,生成多样化的机器人交互数据。
2. 结合真实与合成数据:整合少量真实数据与大规模合成数据,形成高效的数据工作流,满足训练与测试需求。
3. 仿真与现实结合的优化:克服“仿真与现实的差距”(sim-to-real gap),通过高精度仿真提升现实应用的准确性。
这一数据生成与整合方案不仅解决了数据稀缺问题,还大幅加快了机器人技术的开发进程。
在分享会上,银河通用创始人、CTO王鹤分享了其在与英伟达合作取得的进展。他表示,我们使用NVIDIA Isaac系列以及现在的Omniverse等,积极探索使用仿真器合成大量的机器人操作数据,并将其转化为机器人的模型。我们将各种 3D 固体资产、环境以及各类材质和纹理素材相互融合,模拟机器人的运行场景,探讨机器人如何操作物体。
银河通用凭借具身大模型,已经成功涉足众多行业,涵盖零售、酒店、接待、养老以及工业制造等领域。在北京奔驰的工厂里,我们可以看到银河通用的人形机器人在人工装载天窗玻璃及转运过程中发挥着重要作用。在这个过程中,天窗玻璃在吸起和放下时容易出现错误摆放,一旦出现这种情况,以往需要人工终止转运并进行修正。而现在,人形机器人基于视觉闭环和从仿真中学到的操作技能,经过良好训练后,能够快速发现错误并进行有目的的纠正。大家可以观看这个视频,视频中人形机器人在搬运场景中的表现十分出色,面对 3×3×327 箱紧密排列的设备,人形机器人能够在货箱间高效搬运。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。