21
2025
-
03
NVIDIA发布GR00T N1基础模型等方案,人形机器人开发效率显著提升
浏览:477
发布:2025-03-21 01:30:21
电子发烧友网报道(文 / 吴子鹏) 日前,在 NVIDIA 的 GTC 大会上,该公司发布了一系列助力人形机器人开发的重要方案,其中包括首个开源人形机器人基础模型 Isaac GR00T N1、新一代开源物理引擎 Newton,以及用于合成数据生成的全新 Omniverse Blueprint 和开源数据集。这些方案旨在帮助人形机器人方案公司攻克开发门槛高、物理仿真精度低、应用拓展难(nán)以(yǐ)及(jí)行(xíng)业(yè)标(biāo)准(zhǔn)缺(quē)失(shī)等(děng)难(nán)题(tí)。

开(kāi)启(qǐ)人(rén)形(xíng)机(jī)器(qì)人(rén)开(kāi)发(fā)效(xiào)率(lǜ)革(gé)命(mìng)
人形机器人构建的是一个“人 - 机 - 环境”深度交互的复杂生态系统。现阶段,针对每一项具体且精细的动作任务,都需单独开发并调校相应的算法模型,这导致不同组件或子系统之间兼容性与互操作性欠佳,严重影响人形机器人的整体性能与运行效率。此外,由于软硬件解耦难度大,使得人形机器人的调试周期漫长,还容易出现动作延迟或精度损失的情况。
NVIDIA 发布的 GR00T N1 基础模型,作为首个完全可定制的人形机器人基础模型,具备通用技能,如多步操作、物体转移等,还拥有推理能力。开发者无需从头开始训练,可直接基于该模型快速开(kāi)发(fā)适(shì)用(yòng)于(yú)物(wù)流(liú)、清洁等特定场景的应用。
在此过程中,GR00T N1 基础(chǔ)模(mó)型(xíng)借(jiè)鉴(jiàn)了(le)人(rén)类(lèi)认(rèn)知(zhī)原(yuán)理(lǐ),提(tí)供(gōng)了(le)一(yī)套(tào)双(shuāng)系(xì)统(tǒng)架(jià)构(gòu)方(fāng)法(fǎ)论(lùn)。其(qí)中(zhōng),“系(xì)统(tǒng) 1” 是(shì)一(yī)个(gè)快(kuài)速(sù)思(sī)考(kǎo)的(de)动(dòng)作(zuò)模(mó)型(xíng),反(fǎn)映(yìng)人(rén)类(lèi)本(běn)能反应或直觉(jué)。“系(xì)统(tǒng) 2” 则是慢思考模型,用于进行深度思考后的决策制定。系统 2 由视觉语言模型提供支持,它会对所处环境及接收到的指令进行推理,进而规划行动。随后,系统 1 将这些规划转化为精确、连续的机器人运动。系统 1 是基于人类演示数据以及 NVIDIA Omniverse™平台生成的海量合成数据进行训练的。
正如 NVIDIA 创始人兼 CEO 黄仁勋所说:“通用机器人的时代(dài)已经来临,借助 NVIDIA Isaac GR00T N1 以及新的数据生成和机器人学习框架,全球机器人开发者将开启 AI 时代的全新篇章。”
实现物理仿真精度的重大突破
在人形机器人开发过程中,高精度仿真能够模拟真实物理环境中的力学、运动学特性,例如关节扭(niǔ)矩(ju)、重(zhòng)心偏移等,确保机器人动作符合物理规律,避免因动力学误差导致实际测试失败。一(yī)个(gè)优秀的仿真平台允许在虚拟环境中反复优化机械结构,如材料强度、关节自由度,以及控制系统,如步态算法,从而降低物理原型机的重复制造和调试成本。
为此,NVIDIA 宣布与 Google DeepMind 和 Disney Research 展开合作,共同开发开源物理引擎 Newton。这一引擎能让机器人以更高精度处理复杂任务。据悉,Newton 基于 NVIDIA Warp 框架进行优化,支持复杂任务的高精度模拟,并且兼容 MuJoCo 等现有框架,未来还将集成迪(dí)士尼的物理技术。Google DeepMind 正在与 NVIDIA 合作开发 MuJoCo-Warp,预计可将机器人机器学(xué)习(xí)工作负载的处理速度提升 70 倍以上,并将通过 Google DeepMind 的 MJX 开源库和 Newton 提供给开发者。
物理仿真精度是人形机器人实现 “设计 - 开发 - 部署” 闭环的核心支撑,直接关系到开发效率、算法可靠性以及规模化落地能力。物理引擎 Newton 针对机器人学习进行优化,可精确模拟关节扭矩、摩擦力、碰撞反馈等物理特性,提升运动控制算法,如双足平衡、步态规划的鲁棒性,降低实际部署中硬件损伤的风险。
更好地满(mǎn)足机器(qì)人(rén)后(hòu)训(xun)练(liàn)数(shù)据(jù)需(xū)求(qiú)
人(rén)形机器人要实现落地应用,后训练环节至关重要。机器人后训练数据指的是模型在预训练基础上,针对特定任务、场景或硬件进行微调(diào)所(suǒ)需(xū)的(de)专项数据。这类数据直接影响模型的泛化能力、任务精度以及落地效率。
目前,人形机器人行业发展面临两大困境。一是数据(jù)规(guī)模(mó)严(yán)重(zhòng)不(bù)足(zú),若(ruò)采用(yòng)传(chuán)统(tǒng)方(fāng)式(shì)获(huò)取(qǔ)人(rén)机(jī)交(jiāo)互(hù)数(shù)据(jù),成(chéng)本(běn)极(jí)高(gāo);二(èr)是(shì)数(shù)据(jù)质(zhì)量(liàng)参(cān)差(chà)不(bù)齐(qí),第(dì)三(sān)方(fāng)数(shù)据(jù)供(gōng)应(yīng)商(shāng)提(tí)供(gōng)的(de)原(yuán)始(shǐ)数(shù)据(jù)经(jīng)筛(shāi)选(xuǎn)后(hòu),实(shí)际(jì)可(kě)用(yòng)率(lǜ)常(cháng)常(cháng)不(bù)足(zú) 10%。低(dī)质(zhì)量(liàng)数(shù)据(jù)不(bù)仅(jǐn)无(wú)法(fǎ)提(tí)升(shēng)模(mó)型(xíng)性(xìng)能(néng),甚(shén)至(zhì)可(kě)能(néng)引(yǐn)入(rù)噪(zào)声(shēng),导(dǎo)致(zhì)训(xun)练(liàn)崩(bēng)溃(kuì)。
NVIDIA Isaac GR00T Blueprint 在(zài)解(jiě)决人形机器人后训练数据不足问题上优势显著。该蓝图基于 Omniverse 和 NVIDIA Cosmos Transfer 世界基础模型构建。通过少量人类演示,短短 11 小时内就能生成 780,000 个合成轨迹,相当于 6,500 小时,即(jí)连续九个月的人类演示数据。将合成数据与真实数据结合后,GR00T N1 的任务成(chéng)功(gōng)率(lǜ)提升了 40%,充分证明合成数据能有效弥补真实数据的局限性。同时,合成数据可用于预训练,真实数据用于微调,从而平衡模型(xíng)的(de)通(tōng)用性与实际场景适配性。
结语
《2024 全球机器人市场报告》显示,人形机器人领域研发投入年增速已达 38%,但开发周期长、数据获取成本高仍是行业痛点。随着 NVIDIA 发布 GR00T N1 基础模型、Newton 物理引擎及合成数据方案,人形机器人的开发效率和物理仿真精度得到显著提升,后训练数据获取也更为高效,有力地加速了人形(xíng)机(jī)器(qì)人(rén)的(de)商(shāng)业(yè)化(huà)落(luò)地(de)进(jìn)程(chéng)。此(cǐ)外(wài),GTC 还(hái)宣(xuān)布(bù)推(tuī)出(chū) NVIDIA DGX Spark,这(zhè)是(shì)一(yī)款(kuǎn)个(gè)人(rén) AI 超(chāo)级(jí)计(jì)算(suàn)机(jī),为(wèi)开(kāi)发(fā)者(zhě)提(tí)供(gōng)一(yī)站(zhàn)式(shì)系(xì)统(tǒng),可(kě)将(jiāng) GR00T N1 的功能拓展至新机器人、任务和环境,且无需进行大量自定义编程。
相关新闻