怎么刚开工, 我就看到宇树的机器人在模仿科比?
创始人
2025-02-11 10:20:58

要说今年过年最出风头的科技企业,那除了整天服务器繁忙的 DeepSeek ,估计就得数宇树科技了。

就是春晚上拿机器人扭秧歌的那个。

看着挺牛逼是吧,结果年才过了没几天,大正月的他们又整出个新活,英伟达、卡内基梅隆大学团队用宇树 G1 研究出来一个项目, 拿机器人复刻科比。。。

看看这动作,这后仰跳投,是不是还挺有那味的?

别说你是詹蜜,经典的霸王步人家也学了。

有差友可能会问,我是年轻人,不懂规矩,不看球也不看 nba ,我咋能知道这机器人到底什么水平呢?

也别慌,各位熟知的 “NBA 大使 ” 的经典铁山靠,人家也能学。。。

有一说一,给机器人编程早就不是啥新鲜事了,你坤哥这种招牌动作,粉丝内部甚至还有用简单机械机构就能实现的。所以宇树这次要是只能复刻这种的话,那还算不上啥科技狠活。

那么这波这个展示真正牛波儿的地方在哪呢,大过年的人家总不会就是为了唱跳 rap 打篮球吧。

于是哥们去翻了翻人家的论文,才发现这里面还真暗藏玄机, 人家这一手看似是全明星模仿,实际上是机器人训练技术的一个重大突破。

至于咱为啥这么说,那就得先聊聊现在的机器人是咋训练的。

众所周知,机器人这玩意甭管外表多酷炫,骨子里还是算法在跑。

所以你要想让一个机器人学会打篮球的话,最简单的办法就是先测量出机器人的各方面数据,比如关节扭矩、连杆质量分布啥的;再拿这些数据去搞个 动力学建模,就是在电脑里模拟机器人的运动。

但问题在于,要一点点把各种参数都调到完美,这是个特别肝的活儿,需要大量时间,还得是专业人士才能搞;

而且就算你在模拟器里调好了,现实里也不一定就是那么回事儿就好比你在 NBA 2K 里练出一代乔丹,但上了真球场,可能连球都运不利索。

虚拟世界再真,跟现实的参数维度也不是一个量级的,像什么篮球的手感、弹性,空气阻力、风向风速,甚至其他球员的肘击,模型都没法面面俱到。

所以这种传统 SysID 搞出来的机器人,在实验室里看着花拳绣腿,一到真实场景,就像我爱发明里面的人机对抗一样,要开始拉了。

既然真实环境这么复杂,有的科学家就开始反向操作了:与其死磕完美模型,不如直接把机器人丢进各种 “ 奇葩 ” 环境里去练级。

比如有时候地面很滑,有时候篮球很重,有时候篮筐很高。。。 反正就让机器人在各种极端条件下自己迭代,找到最优策略。

这种骚操作,有个听起来玄乎的名字,叫 域随机化( Domain Randomization , 简称 DR )

听着好像有点道理,可这也有问题。这种方法就跟 “ 盲人摸象 ” 似的,机器人就算见识了各种情况,但要总结出真正的规律还是很难,而且很容易 “ 用力过猛 ” 。

再加上 为了适应各种极端情况,机器人就得求稳,于是动作就很保守、不灵活,比如运球的时候总是小心翼翼的,投篮的时候不敢放开手脚。

一句话,这些传统方法训练机器人,要么全靠建模调参,费时费力;要么动作僵硬缓慢,没法完成复杂动作,纯纯摆件。

可要想让机器人真的参与到生活里,不说代替咱们打工,起码像人一样的灵活性总得有吧,要是多少都沾点人工智障,那不白期待了嘛。

那么宇树这波到底是咋做到让机器人这么灵敏的呢,重点来了。

论文里说,他们用了一个叫 ASAP ( Aligning Simulation and Real Physics ,对齐模拟与真实物理框架 )的东西。

按文章里的说法,这个技术要先 “ 利用这些经过处理的人类运动数据在仿真环境中训练一个 基于相位的运动跟踪策略” ,再 “ 通过强化学习训练一个 残差动作模型补偿仿真与现实之间的差异 ” 。

听起来很绕,但你先别急,这玩意的实际思路还挺简明的,其实就是把咱上面说的传统功夫,用化劲整合起来,搞了个机器人训练速成班。

简单来说,这个速成班分两步走,咱先说第一步:就是给机器人 打基础,搞模拟预习

而要搞预习,你得有教材。这里就是要先下载一堆视频,打篮球的也行,其他视频也行,重点是视频里得有人;

然后通过一个叫 TRAM 的运动重建工具,把视频里面的人类动作都扒出来,转换成三维运动轨迹,这样机器才能看得懂这些动作;完事再把这些动作放到一个虚拟环境里来训练, 目的是让机器人学会精确模仿视频里的动作数据。

拿打篮球这个动作来说,你得先找一堆打球视频,记录下运球、投篮的动作,把这些动作数据处理好,再把这些数据扔到模拟器里,让机器人先在模拟器里云练球,相当于先做好模拟再考试。

所以速成班的第二步就得 真枪实弹的来,三年模拟完了,是时候五年高考了。

虽然之前的数据已经是从现实中提取的了,但等到机器人被拉到真球场上的时候,它就会发现云玩家还是差点意思,真实环境里的位置、速度、加速度、关节角度等数据,跟仿真里还是有一定差别。

于是这时候工程师就会利用机器人身上的传感器收集这些数据,再把这些数据跟之前在虚拟环境里训练的数据对比,用强化学习搞一个误差修正模型出来,这个就是所谓的 残差( delta )动作模型

有了这个残差动作模型,这下机器人在模拟器里的运动,就跟在现实里大差不差了,然后工程师再把当中的少量参数微调一下,机器人就能做到跟视频里人类运球一样敏捷流畅了。

但你要把这个 ASAP 框架的两步放一起看,就会发现这玩意搞的效果虽然看着挺牛逼的,比传统方案练出来的机器人好多了,但思路其实跟咱上面说的传统训练思路差的没那么大。

原理也很简单嘛,纯建模训练不真实还费时间,纯现实训练动作不灵活,那把这两个方案结合起来:

用现实数据去帮助建模,再把建模的成功放在现实里校正,虚实结合,不就两难自解~

实际上,这种用现实数据搞虚拟建模,再把在虚拟建模里完成的工程搬到现实,其实也算是很英伟达的操作了。

之前他们就有一个 Cosmos 平台,号称是世界模型,目的就是像这次这样把现实里的物理现象搬到电脑里去模拟,这样就能大大节省工程师们的研发时间。

这玩意对机器人、 AI 、自动驾驶啥的意义都挺大,毕竟这可就不用再像以前一样戴着各种传感器,花那么多时间慢慢搜集现实数据。

训练时长大幅缩短,结果最后训练效果还更好了,这不妥妥的黑科技嘛。

哦对了,最后还有一个彩蛋:今天这篇论文的主要作者,英伟达 GEAR 团队成员、现在在卡内基梅隆大学留学的 B 站 up 主何泰然,他小时候的梦想还真就是造一个电影《 铁甲钢拳 》( 设定是人类操控机器人打拳 )里的机器人。

对一个理工男来说,把儿时的梦想变成现实,我觉得这太酷了。

撰文:纳西

编辑:江江 & 面线

美编:萱萱

图片、资料来源

ASAP: Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body Skills

HumanoidLocomotion and Manipulation: Current Progress and Challenges in Control, Planning, and Learning

Adaptive Kinematic Modelling for Multiobjective Control of a Redundant Surgical Robotic Tool

微博,bilibili等,部分图源网络

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

荣耀600系列发布会定档5月2... 【CNMO科技消息】5月14日,荣耀正式官宣全新数字系列新品——荣耀600系列,并宣布新机将于5月2...
推荐iPhone 17,主要是... 推荐iPhone 17,主要是因为它这次升级很实在,性价比高!标准版4499元起,用上了A19芯片,...
助力低空安全 浙江移动发布低空... 5月15日,在2026浙江省信息通信行业“5·17”电信日主题活动上,浙江移动发布了低空智联网“4S...
黄金跳水 连续四日下挫!今日跌... 财联社5月15日讯(编辑 王蔚)今日,黄金价格跳水,日内跌幅超2%,已连续四个交易日走低,截至发稿日...
佳源服务股东大会全票反对重选阮... 观点网讯:5月15日,佳源服务控股有限公司召开2026年股东周年大会,其中重选阮红女士为非执行董事的...
小米开源自动驾驶模型 Xiao... 5月14日消息,小米正式开源自动驾驶模型Xiaomi OneVL。小米CEO雷军亲自解读了该模型的技...
李彦宏首提 DAA,需问 DA... 5 月 13 日,Create2026 百度 AI 开发者大会在北京开幕。李彦宏在开幕演讲中提出了一...
跨境贸易便利化行动再升级!国际... 5月15日凌晨,一批来自孟加拉国达卡的3150公斤服装产品,在双流国际机场空侧快速完成换单后,直接搭...
股价位列A股第四!科创板“新秀... 财联社5月15日讯(编辑 梓隆),今日(5月15日),联讯仪器长阳攀升,截至收盘,其大涨超6%,盘中...
八年后,他再次站在甲醛仪前,关... 我干了八年空气检测,钻过上千户人家的新房子,拧开过几万支采样管。今天,我想讲几个故事,关于那些“免费...