智源研究院王仲远:机器人“泡沫”与“人形必要性”

智源研究院王仲远:机器人“泡沫”与“人形必要性”
2025年03月30日 07:48 21世纪经济报道

21世纪经济报道记者孔海丽 北京报道

在人工智能浪潮席卷全球的当下,AI大模型与具身智能是产业界和投资界当仁不让的焦点。

中关村论坛期间,智源研究院院长王仲远在接受21世纪经济报道记者采访时,分享了关于大模型幻觉问题的解决路径、具身智能训练数据获取、算力何去何从、人形机器人投资泡沫等热点话题。

“幻觉”阻碍大模型从实验室走向产业落地

王仲远指出,大模型技术虽取得显著进展,但幻觉问题成为其从实验室迈向产业落地的绊脚石。解决这一难题,需要提升基础模型与推理能力,借助通用向量、检索增强等手段。

他提到,智源研究院近两年推出的BGE模型有效针对大模型幻觉问题,并且采用开源形式,在hugingface上的下载量居于高位。

多模态大模型和世界模型是通往AGI的必经之路

在大模型发展方向上,多模态大模型与世界模型被视为未来的重要趋势。王仲远强调,真实世界中的多模态数据极为丰富,仅靠大语言模型处理文字信息远远不够。

“目前大语言模型已经在理解和推理能力上达到了非常高的水平,甚至在某些领域可以接近硕士或博士水平,但它依然没办法感知到这个世界真正的运行规律。”王仲远举例说明。

他表示,多模态大模型和世界模型是实现真正AGI的必经之路,能让人工智能更好地感知和理解世界。​

具身智能:从数字世界迈向物理世界的桥梁​

具身智能作为大模型从数字世界进入物理世界的关键方向,目前仍有诸多挑战。

王仲远表示,基础模型碰到了一些瓶颈,比如当前文本数据逐渐耗尽,大语言基础模型性能提升放缓,于是,多模态大模型与物理世界硬件的结合成为必然。

他提到,具身智能概念出现的时间比较早,传统研究者对于具身智能的理解,和从AI大模型领域转向具身智能的研究者,并没有在技术路线上完全达成共识。

传统机器人训练依然在大量使用强化学习,通过重复练习,教机器人学抓杯子、倒水、写毛笔字等,这种类型的人形机器人,泛化性会弱一些。

“但是大模型技术,尤其是多模态大模型技术,会给整个具身智能带来一些新的变量。”王仲远表示,这些技术有助于机器人更快、更高效地拥有“大脑”,从而具备更强的智能。

3月29日下午,智源研究院发布了跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain,可实现跨场景多任务轻量化快速部署与跨本体协作,推动单机智能迈向群体智能,为具身智能的发展提供底层技术支持。

机器人的“泡沫”与“人形必要性”

行业里有观点认为,当前70%的场景并不需要机器人具备“人形”,所以“机器人做成人形”的必要性是否不够充分。此外,多家公司挤在人形机器人赛道里,行业未来走势会如何?

王仲远在一定程度上认同这一观点,他举例说明,行业内也有不少机器人公司已开始迭代轮式构型机器人,以克服双足机器人稳定性欠佳的问题。

“不过,从长远来看,人形机器人具有独特优势,因其与人的构型相似,能更好地适应社会基础设施,从互联网数据中学习人类技能,推动具身智能和具身大脑模型的迭代。”王仲远表示。

然而,短期内,人形机器人在产业落地方面仍面临诸多挑战,许多机器人尚处于“能走”阶段,向“走得快、走得稳”的目标迈进仍需时日。​

数据与算力:AI产业发展的“双引擎”​

数据获取与算力支撑是AI产业发展的核心要素。王仲远提到,随着文本数据的逐渐枯竭,可通过后训练、合成数据、利用多模态数据等方式解决数据问题。尽管获取高质量多模态数据和合成数据成本较高,但可借助工程化技术和算力提升来降低成本。​

提及近期对于算力的争议,王仲远认为,虽然DeepSeek技术有助于在有限算力下训练出与GPT4相当的大模型,但算力依然不够用,大模型技术还远远没有到尽头。

工程优化为大规模参数模型的训练创造了条件,若scaling law有效,模型性能有望进一步提升。​

产业落地与投资:短期挑战与长期机遇并存​

对于具身智能产业的投资,部分投资人持悲观态度,认为存在泡沫。王仲远从研究机构的视角出发,对具身智能的长期发展充满信心。他预测,今年人工智能应用有望迎来大爆发,尤其是大语言模型的落地应用,中国海量的应用场景将加速这一进程。

然而,多模态大模型目前仍处于相对早期阶段,实现广泛意义上的AGI可能还需5-10年甚至更长时间,这取决于本体能力、世界模型构建和数据等多方面因素。​

在技术路线上,具身智能存在多种观点,如无人驾驶领域的端到端大模型和分模块解决方案。王仲远指出,具身智能的发展相对复杂,当前许多具身智能模型的泛化性有限,实现完全端到端的具身智能可能需要较长时间。

0条评论|0人参与网友评论
最热评论

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部