4月10日,灵初智能正式发布新一代具身大模型Psi-R2与Psi-W0,并宣布开源首批1000小时人类手部操作全模态数据集。该数据集总储备达10万小时,为当前行业最大的开源人类手部操作数据集,标志着具身智能从实验室走向产业化的关键一步。
Psi-R2是首个使用10万小时量级人类数据预训练的World Action Model,输入图片和语言即可输出预测的未来视频和机器人动作。基于"The Bitter Lesson"理念,模型直接通过运动学将人类关节与机器人对齐,让模型从海量数据中自主学习。实验表明,仅需不到100条轨迹的真机数据微调,即可完成手机装配、工业包装、叠纸盒等长程精细操作,大幅降低企业部署成本与落地周期。
Psi-W0作为Action-Conditioned World Model,核心功能是对Policy进行评估与提升,并通过强化学习将人类数据的dynamic迁移至机器人dynamic,与Psi-R2形成数据飞轮:在Psi-W0中微调生成机器人数据,筛选高质量数据重新加入训练,实现能力持续迭代提升,完成从人类经验到机器人能力的快速转化。
此次开源的数据集具备三大亮点:全模态覆盖视觉、语言、关节角度、触觉四类信息;通过自研外骨骼手套采集,3D轨迹精度达亚毫米级;涵盖工业装配、生活操作、物体抓取等多场景任务。该数据集可广泛应用于智能制造、物流仓储、商业服务等商业化场景,加速具身智能在千行百业的落地应用。
目前,灵初智能正与北京石景山区共建数采基地,与腾讯云达成深度合作,并携手觅蜂科技、智域基石等头部数据服务商构建产业生态。灵初智能以"数据+模型"双轮驱动,推动具身智能从Demo走向规模化商用,助力产业智能化升级。