NVIDIA发布GR00T N1基础模型等方案，人形机器人开发效率显著提升

发布：2025-03-21 01:30:21

电子发烧友网报道（文 / 吴子鹏）日前，在 NVIDIA 的 GTC 大会上，该公司发布了一系列助力人形机器人开发的重要方案，其中包括首个开源人形机器人基础模型 Isaac GR00T N1、新一代开源物理引擎 Newton，以及用于合成数据生成的全新 Omniverse Blueprint 和开源数据集。这些方案旨在帮助人形机器人方案公司攻克开发门槛高、物理仿真精度低、应用拓展难(nán)以(yǐ)及(jí)行(xíng)业(yè)标(biāo)准(zhǔn)缺(quē)失(shī)等(děng)难(nán)题(tí)。

开(kāi)启(qǐ)人(rén)形(xíng)机(jī)器(qì)人(rén)开(kāi)发(fā)效(xiào)率(lǜ)革(gé)命(mìng)

人形机器人构建的是一个“人 - 机 - 环境”深度交互的复杂生态系统。现阶段，针对每一项具体且精细的动作任务，都需单独开发并调校相应的算法模型，这导致不同组件或子系统之间兼容性与互操作性欠佳，严重影响人形机器人的整体性能与运行效率。此外，由于软硬件解耦难度大，使得人形机器人的调试周期漫长，还容易出现动作延迟或精度损失的情况。

NVIDIA 发布的 GR00T N1 基础模型，作为首个完全可定制的人形机器人基础模型，具备通用技能，如多步操作、物体转移等，还拥有推理能力。开发者无需从头开始训练，可直接基于该模型快速开(kāi)发(fā)适(shì)用(yòng)于(yú)物(wù)流(liú)、清洁等特定场景的应用。

在此过程中，GR00T N1 基础(chǔ)模(mó)型(xíng)借(jiè)鉴(jiàn)了(le)人(rén)类(lèi)认(rèn)知(zhī)原(yuán)理(lǐ)，提(tí)供(gōng)了(le)一(yī)套(tào)双(shuāng)系(xì)统(tǒng)架(jià)构(gòu)方(fāng)法(fǎ)论(lùn)。其(qí)中(zhōng)，“系(xì)统(tǒng) 1” 是(shì)一(yī)个(gè)快(kuài)速(sù)思(sī)考(kǎo)的(de)动(dòng)作(zuò)模(mó)型(xíng)，反(fǎn)映(yìng)人(rén)类(lèi)本(běn)能反应或直觉(jué)。“系(xì)统(tǒng) 2” 则是慢思考模型，用于进行深度思考后的决策制定。系统 2 由视觉语言模型提供支持，它会对所处环境及接收到的指令进行推理，进而规划行动。随后，系统 1 将这些规划转化为精确、连续的机器人运动。系统 1 是基于人类演示数据以及 NVIDIA Omniverse™平台生成的海量合成数据进行训练的。

正如 NVIDIA 创始人兼 CEO 黄仁勋所说：“通用机器人的时代(dài)已经来临，借助 NVIDIA Isaac GR00T N1 以及新的数据生成和机器人学习框架，全球机器人开发者将开启 AI 时代的全新篇章。”

实现物理仿真精度的重大突破

在人形机器人开发过程中，高精度仿真能够模拟真实物理环境中的力学、运动学特性，例如关节扭(niǔ)矩(ju)、重(zhòng)心偏移等，确保机器人动作符合物理规律，避免因动力学误差导致实际测试失败。一(yī)个(gè)优秀的仿真平台允许在虚拟环境中反复优化机械结构，如材料强度、关节自由度，以及控制系统，如步态算法，从而降低物理原型机的重复制造和调试成本。

为此，NVIDIA 宣布与 Google DeepMind 和 Disney Research 展开合作，共同开发开源物理引擎 Newton。这一引擎能让机器人以更高精度处理复杂任务。据悉，Newton 基于 NVIDIA Warp 框架进行优化，支持复杂任务的高精度模拟，并且兼容 MuJoCo 等现有框架，未来还将集成迪(dí)士尼的物理技术。Google DeepMind 正在与 NVIDIA 合作开发 MuJoCo-Warp，预计可将机器人机器学(xué)习(xí)工作负载的处理速度提升 70 倍以上，并将通过 Google DeepMind 的 MJX 开源库和 Newton 提供给开发者。

物理仿真精度是人形机器人实现 “设计 - 开发 - 部署” 闭环的核心支撑，直接关系到开发效率、算法可靠性以及规模化落地能力。物理引擎 Newton 针对机器人学习进行优化，可精确模拟关节扭矩、摩擦力、碰撞反馈等物理特性，提升运动控制算法，如双足平衡、步态规划的鲁棒性，降低实际部署中硬件损伤的风险。

更好地满(mǎn)足机器(qì)人(rén)后(hòu)训(xun)练(liàn)数(shù)据(jù)需(xū)求(qiú)

人(rén)形机器人要实现落地应用，后训练环节至关重要。机器人后训练数据指的是模型在预训练基础上，针对特定任务、场景或硬件进行微调(diào)所(suǒ)需(xū)的(de)专项数据。这类数据直接影响模型的泛化能力、任务精度以及落地效率。

目前，人形机器人行业发展面临两大困境。一是数据(jù)规(guī)模(mó)严(yán)重(zhòng)不(bù)足(zú)，若(ruò)采用(yòng)传(chuán)统(tǒng)方(fāng)式(shì)获(huò)取(qǔ)人(rén)机(jī)交(jiāo)互(hù)数(shù)据(jù)，成(chéng)本(běn)极(jí)高(gāo)；二(èr)是(shì)数(shù)据(jù)质(zhì)量(liàng)参(cān)差(chà)不(bù)齐(qí)，第(dì)三(sān)方(fāng)数(shù)据(jù)供(gōng)应(yīng)商(shāng)提(tí)供(gōng)的(de)原(yuán)始(shǐ)数(shù)据(jù)经(jīng)筛(shāi)选(xuǎn)后(hòu)，实(shí)际(jì)可(kě)用(yòng)率(lǜ)常(cháng)常(cháng)不(bù)足(zú) 10%。低(dī)质(zhì)量(liàng)数(shù)据(jù)不(bù)仅(jǐn)无(wú)法(fǎ)提(tí)升(shēng)模(mó)型(xíng)性(xìng)能(néng)，甚(shén)至(zhì)可(kě)能(néng)引(yǐn)入(rù)噪(zào)声(shēng)，导(dǎo)致(zhì)训(xun)练(liàn)崩(bēng)溃(kuì)。

NVIDIA Isaac GR00T Blueprint 在(zài)解(jiě)决人形机器人后训练数据不足问题上优势显著。该蓝图基于 Omniverse 和 NVIDIA Cosmos Transfer 世界基础模型构建。通过少量人类演示，短短 11 小时内就能生成 780,000 个合成轨迹，相当于 6,500 小时，即(jí)连续九个月的人类演示数据。将合成数据与真实数据结合后，GR00T N1 的任务成(chéng)功(gōng)率(lǜ)提升了 40%，充分证明合成数据能有效弥补真实数据的局限性。同时，合成数据可用于预训练，真实数据用于微调，从而平衡模型(xíng)的(de)通(tōng)用性与实际场景适配性。

结语

《2024 全球机器人市场报告》显示，人形机器人领域研发投入年增速已达 38%，但开发周期长、数据获取成本高仍是行业痛点。随着 NVIDIA 发布 GR00T N1 基础模型、Newton 物理引擎及合成数据方案，人形机器人的开发效率和物理仿真精度得到显著提升，后训练数据获取也更为高效，有力地加速了人形(xíng)机(jī)器(qì)人(rén)的(de)商(shāng)业(yè)化(huà)落(luò)地(de)进(jìn)程(chéng)。此(cǐ)外(wài)，GTC 还(hái)宣(xuān)布(bù)推(tuī)出(chū) NVIDIA DGX Spark，这(zhè)是(shì)一(yī)款(kuǎn)个(gè)人(rén) AI 超(chāo)级(jí)计(jì)算(suàn)机(jī)，为(wèi)开(kāi)发(fā)者(zhě)提(tí)供(gōng)一(yī)站(zhàn)式(shì)系(xì)统(tǒng)，可(kě)将(jiāng) GR00T N1 的功能拓展至新机器人、任务和环境，且无需进行大量自定义编程。