基于视觉扩散架构，成都人形机器人创新中心发布新模型_

6月24日，红星新闻记者从成都人形机器人创新中心了解到，该中心近日发布了中国首个基于视觉扩散架构的人形机器人任务生成式模型R-DDPRM（Raydiculous-Denoise Diffusion Probabilistic Robot Model）。

“大家所熟知的文生视频模型OpenAI SORA、SVD，文生图模型SD，OpenAI Dall-E等业界知名模型，就是基于扩散架构的垂直模型。”张睿睿介绍，这些模型都拥有强大的理解、推理和生成能力。扩散架构应用于人形机器人核心技术研发，将重构人形机器人底层架构，释放人形机器人的决策技能，使其在操纵和泛化方面达到前所未有的高度。他称，目前全球范围内仅有少数人形机器人团队发布相关阶段性成果。

据介绍，目前业界的人形机器人任务生成式模型主要基于VAE、AC Transformer、LSTM等架构，这类架构下的人形机器人通常在规划动作时考虑单一约束类型，例如物体抓持稳定性或规避障碍物路径规划，这就需要针对每种细分情况都要对应开发和执行一系列单独的垂直模型（并联线性），遇到执行问题需要局部调整试错来缓慢推进任务进程，推理效率低、执行速度慢且大量消耗算力。R-DDPRM模型的创新之处在于能够让人形机器人跨越多个约束进行泛化，创造了真正的人形机器人“大脑”——能够毫不犹豫“丝滑”地处理各种复杂任务。

张睿睿表示，该模型具有同时确定拿起物体的最佳抓持位姿、移动物体最佳路线、能耗最少最佳等多要素全局规划思维能力，并能在人为破坏任务进程时迅速进行决策修正和调整执行方式，接续完成任务。该模型的泛化能力能让人形机器人自主流畅地完成各种复杂任务。

据了解，成都人形机器人创新中心是我国中西部地区首个人形机器人创新中心，是四川省人工智能一号创新工程的首个原点项目，致力于打造具有国际领先水平的“有脑子”的人形机器人。

红星新闻记者叶燕王俊峰

编辑李钰仪