从2000年ASIMO启发全球机器人热潮,到如今AI与机器人技术的深度融合,二十载光阴荏苒,中国的机器人研究走过了一段充满挑战与坚守的历程。在这场漫长的技术革命中,清华自动化系教授赵明国就像一盏始终未熄的灯,在最寂寞的时刻坚持照亮前路。
“二十年过去,仍在坚持的仅有我一人。”这句话背后,是一位学者对科研事业近乎执着的坚守。从2004年开始独立研究,到2014年终获认可,赵明国教授经历了整整十年的默默耕耘。在机器人研究最冷寂的年代,他选择了一条看似寂寞的道路:深耕双足机器人控制系统,探索被动动力学行走,尝试将类脑计算引入机器人领域。
从2000年在清华大学开启机器人研究生涯,到后来担任优必选北京研究院院长,他始终站在中国机器人研究的前沿阵地。同时作为清华大学自动化系教授、加速进化联合创始人,赵明国不仅是一位坚守者,更是一位具有前瞻眼光的开拓者。早在强化学习成为显学之前,他的团队就在双轮自行车项目中尝试过这一技术路线。虽然当时选择暂缓推进,但这种审慎而不盲从的研究态度,恰恰体现了一位资深学者的远见。
在这次深度对话中,赵教授首次系统回顾了自己的研究历程,从最初的孤军奋战,到如今与众多同行携手并进。这个过程,某种程度上也是中国机器人研究从跟跑到并跑的缩影。通过这次访谈,我们不仅能了解机器人技术的演进轨迹,更能感受到科研工作者在寂寞坚守中守望远方的执着与信念。
▊ 要点速览
关于行业发展现状:目前,我国人形机器人产业已发展到50至100家企业的规模。在学术界,声称从事人形机器人研究的高校教授已超过30位。
关于圈子与生态:机器人控制领域的研究团队虽然众多,但各自采用不同的技术路线,导致研究成果难以共享和复用。即便是高水平团队的研究成果,其影响力也往往局限于小范围学术圈。
关于AI的影响:机器人发展不能仅依赖于AI技术的迁移,简单地将AI应用于机器人并不等同于实现真正的具身智能。
关于机器人商业化:这就像互联网商业领域,即使是小型企业,只要找准细分市场,建立独特优势,同样可以在京东、阿里、腾讯、百度等巨头主导的商业生态中占有一席之地。
关于科研价值追求:切忌追求表面容易或短期利益的项目,如果一个机会看似过于简单或收益太过明显,往往暗藏风险。
......
01 二十载光阴,跨过机器人至暗时刻
李梦佳:您已经在足式仿生机器人领域深耕20多年,20年间机器人的研究有哪些演进轨迹和范式转变?
赵明国:1997年本田公司发布ASIMO人形机器人之时,我便开始关注。2000年左右,我到访清华大学,恰逢我国开始兴起对机器人的研究,我有幸结识了清华陈恳老师,他邀请我到清华从事博士后研究机器人项目,我欣然接受。于是2000年我进入清华后,开始专注于人形机器人控制系统的研究工作。
在人形机器人研究的早期阶段,本田的ASIMO是主要的参考对象。回顾当时的情况,中国在机器人技术领域整体处于起步阶段:工业机器人主要依赖进口,国内仅有少数院校进行过相关研究。机器人技术的应用范围有限,主要集中在某些具体应用和算法研究上,与现今的技术水平有较大差距。
在研究人形机器人的过程中,面临着认知和技术两个层面的挑战:一是对人形机器人系统整体架构的理解不够深入;二是在具体技术实现上遇到诸多困难。
2005年是人形机器人发展史上的重要里程碑。这一年,康奈尔大学的Collins团队在Science杂志上发表了关于被动动力学行走的开创性研究。同期,本田的ASIMO机器人在运动速度上取得重大突破,实现了6-9公里/小时的行进速度。另一个重要进展是波士顿动力公司推出了液压驱动的四足机器人BigDog,其在冰面上展现出的极强的平衡能力和环境适应性,带来的技术冲击堪比1997年本田机器人发布时的影响,其重要性可与后来AlphaGo在AI领域的突破相媲美,只是当时的传播范围相对有限。
波士顿动力和本田的机器人在能量效率上存在挑战。康奈尔大学团队利用被动动力学原理,提出了提升能量效率的方法,并在《Science》杂志上发表了成果。这一发现促使业界关注技术整合以提高效率和性能。同时,也激发了业界对被动行走技术研究的广泛兴趣。
2006年初,我也开始研究被动行走技术。这项技术无论从力学原理还是控制理论的角度都具有深刻的研究价值,且与我的研究理念高度契合,我也在2007年至2008年期间作出了一些成绩。
2010年左右,全球人形机器人研究团队数量减少,主要有两个原因:一是波士顿动力的技术领先导致其他团队转向其他研究领域,如Martijn Wisse教授从人形机器人研究转向农业机械;二是该技术偏重理论研究,商业应用尚远。到2011年,该领域理论创新放缓,基础研究和应用开发都遭遇瓶颈。
2013年和2015年连续举办的两届DARPA机器人挑战赛(DRC)标志着人形机器人科研的一个小高潮。比赛实践证明,传统的简单控制方法难以满足复杂环境下的实际应用需求。相比之下,基于优化的方法,如整体行为控制(WBC, Whole Body Control)和模型预测控制(MPC, Model Predictive Control)展现出显著优势。这些方法不仅能够有效解决实际问题,在理论框架上也更加完备。
随着技术趋势的发展,我从2015年开始研究优化控制方法,并计划将其应用于开发高性能的机器人集群力控制系统。在与优必选科技合作时,我们在北京研究所进行了一系列优化控制研究。得益于宽松的研究环境和没有短期目标压力,我们能够按自己的节奏深入研究,探索了力控关节设计、WBC算法开发和MPC方法应用等多个技术方向。
其实这些方法的理论基础早已确立,当前工作主要集中在工程实施上。随着计算能力增强,这些方法现在能够实际应用并取得成效,这是一个重大进步。不过,这些方法技术要求高,需要专业团队整体把控。
近年来,苏黎世联邦理工学院(ETH Zurich)在四足机器人领域使用强化学习取得了显著进展,导致这一技术方向在2020年左右受到了广泛关注。那段时间,由于疫情影响以及需要完成优化控制和类脑计算项目的研究工作,我们当时并未涉足这一领域。最近,我重新开始从学习的角度探索相关研究,发现当前的学习方法已经更加成熟。
关于跨学科交叉研究,我在2016、2017年将目光放在了类脑计算领域,我们将类脑芯片应用于机器人平台,并将之前在机器人控制领域的研究方法放到类脑计算领域重新开始。2021年起,我们参与了国家脑计划项目,致力于整合类脑感知、定位和控制功能。考虑到类脑感知和定位已有专门团队负责,我带领团队专注于类脑控制的研究。
近期,我们在这个领域有了新的突破,设计了新型模仿生物神经系统的脉冲神经网络(SNN),将其分为多个功能回路,并计划使用脉冲神经网络构建机器人系统,特别是应用于足式机器人,目的是通过构建多层控制网络,实现在线学习功能,解决机器人在负载变化、关节误差以及其他不确定性因素方面的适应性问题。
02 破冰启航,人形机器人的拓荒之路
李梦佳:将视角拉回中国,我国的人形机器人研究有哪些重要时刻?
赵明国:最早应该是国科大的马宏绪教授,随后哈尔滨工业大学也有相关的研究。国内的系统性研究始于1998年,当时清华大学利用"985工程"第一批专项经费,设立了一个机器人研究重大项目。同期,北京理工大学也开展了相关研究。2003年后,清华因为研究方向调整,人形机器人研究暂时搁置。北理工在黄教授带领下逐渐发展成为该领域的最重要研究力量。2009年后,浙江大学开始布局机器人研究。熊蓉教授等开发了能打乒乓球的"悟空"机器人。
到2015年后,国内人形机器人研究的格局逐渐明晰:黄教授和熊教授的团队主要依托国家科研经费开展研究,而我们团队则通过与优必选的产学研合作获得商业支持。到2020年左右,全国专注于人形机器人研究的主要是我们三个团队。我和熊教授都是通过机器人竞赛起步,逐步积累,在这个领域逐渐有了一些影响力。
其实,在那个阶段,由于研发投入大、技术难度高,从事人形机器人研究的团队相对较少。特斯拉发布人形机器人计划后,引发了全球对这一领域的关注。我国相关部门也随之调整了战略布局,工业和信息化部、科学技术部等部委加大了对人形机器人领域的支持力度。这些政策和资金支持催生了大量研究团队和企业进入这一领域,使原本相对冷门的人形机器人研究迎来了快速发展期。目前,我国人形机器人产业已发展到50至100家企业的规模。在学术界,从事人形机器人研究的高校教授已超过30位。
目前,许多省份和城市都在积极推动人形机器人的发展,将其视为一项重要任务。无论是学术界还是产业界,这一领域都呈现出蓬勃发展的态势。我认为,这一趋势的核心逻辑在于有了大量的资金投入。
李梦佳:2005年至今已近二十载,当时本田和波士顿动力的技术水平如何?与当前技术水平相比,差异是否显著?
赵明国:从技术发展的时间跨度来看,即使本田 30 年前的机器人技术与当下相比仍具有相当的竞争力。虽然技术路线有所不同,但需要从多维度评估。
本田从上世纪80年代开始研发机器人,至今已有 40 年历史。1997 年发布的 P2 和 P3 机器人就实现了稳定的行走功能,到 2005 年更是达到了小跑和单脚跳跃的水平。从核心技术指标来看,包括行走速度、运动能力、跑跳等基础功能,以及产品整体设计,能够超越当年本田技术水平的企业依然很少。
回顾 2005-2010年期间本田开发的 ASIMO 机器人,其性能,特别是在稳定性方面,当前技术要达到相同水平仍需相当时间。在 2020 年之前,双足机器人研发仍是少数机构的专属领域。这主要受限于两个关键要素:一是高质量硬件设备,二是核心技术原理的掌握。而在 2020 年后,随着技术门槛的降低,双足机器人的研发逐渐开放给更广泛的研发团队。
03 寻找答案,机器人发展的裂变时刻
赵明国:我一直在思考一个问题:为什么计算机和AI技术发展如此迅速,而机器人技术的发展相对缓慢?除了机器人涉及硬件研发这个显而易见的因素外,我认为还存在另一个重要原因 —— 研发路径的差异。
计算机领域往往会选择具有全球共识的标准性问题作为突破口。以计算机视觉为例,当深度神经网络等关键技术在某个节点取得突破性进展后,全球顶尖的研究机构和企业便会集中资源投入这一领域。通过三到五年的持续攻关,他们不仅解决了视觉理解这一核心问题,还在研发过程中衍生出新的技术分支。这种集中优势资源、聚焦关键问题的发展模式,使得计算机领域能够持续突破技术瓶颈。语音识别技术的发展、GPT等大型语言模型的出现,都印证了这一点。
与计算机领域不同,机器人技术的发展面临着特殊的挑战。首先是研究领域的分散性:即便是同在机器人领域的研究者,由于研究方向、技术路线和系统架构的差异,相互之间的学术交流和技术借鉴都比较有限。机器人控制领域的研究团队虽然众多,但各自采用不同的技术路线,导致研究成果难以共享和复用。即便是高水平团队的研究成果,其影响力也往往局限于小范围学术圈。尽管机器人技术现今备受关注,研究依然呈现碎片化特征。这种分散的研究模式难以形成规模效应,最终影响了整个领域的发展速度。
机器人行业正在经历重大变革。尽管规模不及AI领域,但最近的变化非常大,吸引了许多优秀人才和资金。这种变化加速了技术进步。以前,即使是大公司如本田,创新也较慢。现在,新发明和成果频繁出现,机器人行业开始像计算机和AI那样快速发展,形成了良好的创新循环。
在智源具身智能峰会上,我强调机器人领域要在保持创新势头的同时,注重自身技术的突破。机器人发展不能仅依赖于AI技术的迁移,简单地将AI应用于机器人并不等同于实现真正的具身智能。如果仅是这样,只能证明AI技术的强大,而非机器人技术的进步,所以机器人研究人员需要在本领域实现实质性创新。
李梦佳:如何促进 AI 领域和传统机器人领域的融合与协作?
赵明国:五年前的我可能持有不同的观点,现在我的思考也在改变。对待新技术,我认为要打破领域界限,采取务实态度。以AI为例,当强化学习等方法已被验证可行时,我们可以先直接应用,在实践中逐步加深理解和认知。
从整体发展趋势来看,机器人领域的研究者应该主动拥抱AI技术,需要根据AI的发展重构研究框架。机器人领域的从业者也需要转变思维方式:不再局限于传统的控制理论和最优化视角,而是要从数据驱动和机器学习的角度重新思考问题。在未来3到5年,随着机器学习方法的深入应用,加上充足的研究资源投入,我们期待看到的不仅是表层的技术应用,更是深层的创新突破。
李梦佳:如何理解大模型给具身智能带来的新思考?
赵明国:相比传统的计算机视觉等技术路线,基于大模型的解决方案具有独特优势。大模型生态系统提供了更丰富的内容资源,可以加快研发进程,降低技术门槛,同时促进行业协作与资源共享。但从目前的发展来看,大模型并未在认知能力上实现质的突破,其优势更多体现在生态系统的完整性和开放性方面。
李梦佳:如何理解当前的大模型生态?
赵明国:计算机视觉(CV)领域已形成了完整的技术生态系统,相比手动编写算法,开源社区提供的解决方案往往具有更好的性能。在传统CV开发中,我们需要深入理解项目的核心概念,并结合相机参数等硬件因素进行调优,这对开发者的专业技术水平要求较高。
而大模型的出现大大降低了这一门槛。开发者只需要掌握大模型的调用接口,就能处理复杂的视觉任务。传统方法中,要同时处理视觉、语言和视频等多模态任务往往需要多个领域专家协作。但在大模型时代,一个熟悉大模型操作的工程师就能胜任,这极大地提高了开发效率。
因此,大模型作为基础设施,为各类应用开发提供了强大的底层支持。这个新的技术生态系统相比传统架构具有明显优势:它不仅提供了更强大的功能,还显著提升了开发效率。这种技术变革让研发团队得以将重心从底层实现转移到业务逻辑和应用创新上。开发人员不再需要深入处理底层算法编写和繁琐的参数调优,而是可以专注于核心业务逻辑的优化,这极大地提高了项目质量和效率。
然而,这也引发了一个值得深思的问题:尽管我们拥有了如此先进的工具,但在某些领域的实际进展似乎并未达到预期。
李梦佳:大模型技术对机器人领域的本质启发有哪些?
赵明国:对我来说,机器人系统设计可以从Transformer模型中的token机制和注意力机制中获得灵感。以“按开关”为例,我们可以分析人类如何在这个过程中使用多种感官和分配注意力:
1.接近时:操作的注意力集中在视觉和本体的感觉上。
2.接触时:触觉启动,对运动控制的注意力减少,对触觉的注意力增加。
3.操作时:主要控制力度,通过听声音(如开关声)确认操作完成,不只依赖触觉。
4.反馈时:视觉再次主导,检查操作结果(如灯是否亮)。
许多日常设计都显示了处理多种信息的能力。以前我们用“权重”或“优先级”来描述不同信息的重要性,但这些可能不完全准确。Transformer模型的“注意力机制”提供了新思路:我们能否在机器人的多模态控制中使用这种机制?比如,在按开关时,触觉注意力是否最集中?听到声音时,听觉注意力是否最高,其他感官的注意力是否降低?这种方法能否优化操作?
04 定向深耕,人形机器人的创业探索
李梦佳:我想了解更多您创业的情况。您创业的动机是什么?贵公司的主要愿景是什么?
赵明国:我目前依然全心投入学术研究,并持开放态度看待产业化。我并不认为研究只能局限于学术界。例如,如果“踢足球”的项目只停留在理论层面,它的作用有限。但如果能将其产业化,就能发掘其更深层次的价值。
我的许多学生已经在业界积累了丰富经验,他们希望将这些经验与研究成果结合,因此成立了一家公司,并邀请我加入。起初,我建议团队专注于计算技术的研发,因为我认为在人形机器人和所有复杂机器人系统中,计算能力是关键。团队同意这一方向,并开始相关工作。然而,经过市场实践,我们发现单独发展计算技术在当前阶段存在较大挑战。因此,我们调整了战略,将重点放在人形机器人的核心技术研发上,以机器人的整体开发为主。
市场实践显示,市场最关注的是机器人本体的研发能力。如果不能掌握本体技术,就难以获得整机制造商的认可,核心零部件也难以在市场上得到应用。
我们的目标是在未来十年内,通过专注于一个具体领域来实现机器人技术的产业化。目前,我们决定选择一个特定场景,比如机器人足球,来深化技术发展和探索商业模式,希望形成可持续发展。我们相信,只有在一个领域取得突破,才能将成功的技术和商业模式扩展到其他领域。
在团队的深入讨论后,我们一致认为,以我们目前的能力,不宜同时处理多个技术挑战和应用场景,因为这超出了我们的能力范围。
我们选择切入点时,主要考虑技术实现的可行性。一是这与我们团队的专业技能高度相关;二是这为未来的扩展打下了坚实的基础。一个宏伟的目标,需要通过实际可行的第一步来启动这个过程。
李梦佳:我还注意到,加速进化重现了波士顿动力的一些动作。
赵明国:那不是个技术难题,我们团队仅用三天就完成了开发。因为我们之前已经具备了必要的技术储备,包括合适的机器人构型和连续运动控制能力。
在那款机器人研发过程中,构型选择是一个关键决策点。基于多年的研究经验,我对各类机器人构型都有深入的了解。我们的设计原则是避免重复使用被广泛使用的方案,而是在现有构型范围内寻找创新空间。
我们选择从小型机器人起步。当波士顿动力采用相似方案时,我们迅速决定展示自己的技术实力,通过复现并优化相关动作,团队仅用很短时间就完成了这个演示项目,其实这更多展现了我们的快速响应能力,而非技术突破本身。
目前,机器人足球的竞技水平尚未达到能够吸引广泛观众的程度,因此,我们团队正在寻找其他途径来保持项目的可见度。从更广阔的视角来看,我们真正关注的是如何通过足球项目来推动具身智能等尖端技术的进步和创新,以及如何将机器人足球发展成一个全新的商业模式,开拓一个前所未有的市场。
对于科技公司来说,它们的核心价值通常体现在技术创新和商业价值这两个关键领域。如果不能在技术和商业模式上提供独特的优势,那么与已经建立起完整产业链的公司如特斯拉、小米等竞争将变得异常艰难。
在人形机器人这一新兴领域,仅仅模仿现有的模式是不够的,因为这样的做法很难带来实质性的突破。如果只是在运营层面上竞争,面对那些已经拥有丰富资源和先发优势的企业,新公司很难实现超越。然而,人形机器人行业仍有很大的发展空间,通过选择一个创新的方向并深入研究,新公司完全有机会在未来与行业领导者并肩竞争。这就像商业领域,即使是小型企业,只要找准细分市场,建立独特优势,同样可以在京东、阿里、腾讯、百度等巨头主导的商业生态中占有一席之地。关键不在于企业规模,而在于能否对行业产生实质性贡献,形成差异化竞争力。
李梦佳:您谈到了对行业发展的贡献,特别是推广具身智能的新理念。具体来说,我们如何理解这些新理念?
赵明国:我从技术角度解答如何理解新理念。当前机器人领域面临的一个核心挑战是长序列任务的处理。在语言模型中,我们关注的是处理token的能力,而在机器人操作中,则需要处理一系列连续的动作序列,例如抓取和放置物体等复杂行为。目前,机器人领域短序列任务的处理已经相对成熟,业界正在探索利用新理念,主要是大模型来解决长序列任务的挑战。大模型可以为复杂任务提供执行序列的规划,但关键问题在于如何实现机器人的自主决策能力。
我们希望来年实现一个完全基于深度学习的端到端机器人决策系统。当前系统存在视觉感知范围受限、预设行为模式过于简单、决策逻辑依赖先验知识等局限。为突破这些限制,我们正在探索新的方法,简单而言有以下尝试:改变传统的任务分解方式,避免将复杂任务简单地分解为固定步骤;摒弃传统的决策树和状态机方法;采用大模型直接从图像识别和决策,取代传统的计算机视觉算法。这种方法将为机器人的智能决策带来新的可能性,使其能够更灵活地应对复杂环境中的挑战。
05 逆流而上,科研探索的坚守传承
李梦佳:关于科研人才培养,您作为培养出优秀研究人员(如程昊博士)的导师,同时也在带领研究团队,请问您对年轻研究人员有哪些学术发展建议和经验分享?
赵明国:我个人倾向于独立思考,坚持己见。多年经验让我深刻认识到:不要轻视任何细节,即便是看似微不足重的环节,都值得投入时间深入研究。在他人普遍质疑的领域,更要坚持探索。切忌追求表面容易或短期利益的项目,如果一个机会看似过于简单或收益太过明显,往往暗藏风险。以我的自行车研究项目为例:在初期几乎没有人看好,但通过不懈努力,最终研究成果登上了《Nature》杂志封面。
李梦佳:当时是如何找到自行车这个切入点的?
赵明国:在这项研究中,施路平教授是项目的主要负责人。我主要承担实验实施和验证环节,而施教授团队则专注于机器人芯片架构的开发。研究起源可以追溯到2014年我与百度无人驾驶团队的合作。当时,由余凯博士带领的团队规模尚小,但已开始布局无人驾驶汽车领域。考虑到中国作为自行车大国的特殊国情,他们提出开发无人驾驶自行车的构想。经过倪凯等人的深入调研,最终选择与我们清华团队展开合作。
到2016年,我们已完成包括车辆跟踪、语音识别等全部核心功能的开发。当时,这些实验在校园内进行时引起了不少关注,也有人记录分享相关视频。后来,施路平教授建议将他研发的芯片应用于我们的实验平台,用于验证芯片性能。尽管此前双方并不了解对方的研究方向,但经过探讨后发现研究具有很强的互补性,随即开展了持续到2019年的深入合作。
这段经历让我深刻认识到:人的认知往往有限,很多决策的价值无法立即显现。我选择与施教授合作,既不是出于私交,也不是基于短期利益的考量,而是对其学术洞察力的认可与信任。这种基于专业判断的科研合作最终取得了丰硕成果。
实际上,我所做的一切工作都未曾白费。我们很早就在双轮平衡车上应用过强化学习,但当时选择了暂缓推进。当时我对强化学习一直持谨慎态度,直到许多人在这方面取得了进展,我才重新投入研究。
其实,许多事情的成功并非源于明确的动机,但最终结果往往令人满意。在人形机器人领域尚未兴起之时,我在机器人学界的知名度主要依赖于我在自行车项目上的成果。然而,人形机器人的兴起出乎许多人的预料。因此,我不建议人们仅仅因为某个领域看似热门就急于投身其中,而应该深思熟虑,明确自己投身该领域的初衷,追随更长远的目标。
06 越界融通,机器人研究的智能蝶变
李梦佳:您自身如何定位?是否为传统的机器人控制与优化领域的学者?
赵明国:今年之前我认为是的,但现在观念发生了变化。本科到博士阶段专注机电一体化,后来深入控制理论,在被动控制领域,我深入研究了力学方向,并在控制优化方面进行了探索。我自己没有太多包袱,不会纠结于身份或专业标签。在这个时代,专业之间的界限并不明显,机械工程师可以投身AI,计算机科学家也能精通工程设计。
以机器人领域为例,我认为其核心任务是解决问题,比如手臂要解决操作问题,双腿要解决移动问题。过去移动问题难以解决,只能依靠机械方法和简化模型,现在随着技术进步,人们转向优化技术,认为它能更有效地解决问题。所以要真正解决这些问题,需要学习并应用优化技术,或者采用自己创新的方法,不用局限于专业限制。正如炊具从铁锅进化到电饭煲,面对新技术的发展,学习和适应是必然选择。
李梦佳:在研究生涯中,您能否分享一个最令您满意研究成果?
赵明国:一是“虚拟斜坡行走”方法,结合了被动行走和控制理论的实践经验。这项技术具有独特性,其性能指标超过了同类研究,并影响带动了后续众多相关研究。
二是无人驾驶自行车项目,属于跨领域合作,我们与芯片设计专家施路平老师合作,将创新芯片架构应用在自行车控制系统中,取得了良好的展示效果。
值得一提的是,自行车控制项目揭示了计算架构在控制系统中的关键作用。我们成功将原本需要三台计算机的功能集成到单个芯片上,验证了类脑计算在控制系统集成方面的优势。这带给我重要的启发,促使我开始关注机器人系统中的计算架构问题。我曾与计算所的同行探讨如何通过单一SoC(片上系统)解决机器人的所有计算需求。这个设想至今仍具前瞻性,但要真正实现还需要在芯片设计和操作系统等复杂领域投入更多研究。
三是2019年我们在《Nature》上以封面文章发表以“面向人工通用智能的异构天机芯片架构”在思想层面具有重要意义。
四是我们正攻关基于脉冲神经网络的控制系统,新颖之处是融合了类脑计算和机器学习的方法,预计明年初达到可以公开发表的阶段。
五是随着具身智能理念重新受到关注,我正将其与足式机器人竞赛项目(RoboCup)结合,并推广这一研究方向。若能在2025-2026年实现足式机器人的具身智能应用,这将是一个重要的研究成果。
2024年7月我访问苏黎世联邦理工学院时,RoboCup和机器人领域专家Marco Hutter说:“目前全球进行人形机器人足球研究的,包括你以及UCLA的Dennis Hong团队在内,仅有3-4个团队。”但今年7月份的RoboCup 2024机器人世界杯带来的研究进展,让许多研究者的态度都发生了转变:人形机器人足球是验证具身智能的理想平台,它涉及技术迭代、学习方法革新、仿生材料等多个领域,有助于我们深入理解智能的本质和物理实现。这是一个值得持续投入的长期研究方向。
CMU的前教授Veloso曾提出建议:将机器人比赛整合为统一的人形机器人竞赛活动。虽然这一提议被认为较为激进,但在AI和人形机器人技术快速发展的今天,这个方向值得重视。从AlphaGo到AlphaFold的发展历程给我们重要启示:AI技术需要在特定领域逐步验证和完善。若直接在最终应用场景中测试,可能因不完善而产生负面影响。相比之下,在竞赛等相对可控的环境中验证技术更为合适。例如,围棋比赛的失败可证明人类更强,而蛋白质预测的失误可能导致对整个技术方向的质疑。所以当一项技术在特定领域取得突破性进展,证明其超越人类能力后,其他领域就能以更大的信心采用和深化这项技术。这正是通过机器人竞赛验证技术的价值所在。
于我而言,想把“踢足球”作为切入点研究具身智能,并做好。如果有一天,人们意识到这是一个绝佳的创意,并且确实取得了显著成果,这将是我的欣慰。我并不期望自己必须亲自实现这一目标,若他人后来实现,我们也会感到高兴。
李梦佳:您当时是如何想到“踢足球”这个场景的?
赵明国:机器人足球的构想可追溯至1993年。当时在深蓝与卡斯帕罗夫的国际象棋挑战赛期间,一些加拿大学者提出了五个关键问题,并探讨AI在现实世界中的应用,其中就包括让机器人踢足球这一设想。
1996年,随着深蓝即将战胜人类棋手的预期,研究者们成立了RoboCup联盟。1997年,在当时AI领域最具影响力的IJCAI会议上,首次举办了机器人足球比赛。索尼、本田等日本企业作为主要赞助商,大力支持这项赛事。索尼更是免费提供四足机器人,微软也提供了重要赞助。然而,2008年的全球金融危机导致大企业削减赞助,使得这项赛事的发展受到影响。
07 探索边界,机器人形态的价值探讨
李梦佳:通过比赛想实现的目标是什么?
赵明国:"像人一样踢足球"可作为具身智能领域的标志性任务之一。足球运动代表了双足运动能力的最高水平,是极具挑战性的研究方向。从人形机器人的具身智能研究来看,可将其划分为三个主要类别:下肢运动控制、手臂及精细操作、全身协调运动。如果在每个类别中突破几个典型任务,将标志着具身智能研究的重要进展。
李梦佳:是否有必要使机器人的形态与人类高度相似?仿人设计的实际价值是什么?
赵明国:从功能角度看没太大意义。
如全自动化的黑暗工厂,机器人是否具有人类外观并不重要,因为那里没有人欣赏它们,可以根据实际需求选择三指或六指等不同方案。然而,在非全自动化的环境中,机器人的外观就显得较为重要,因为人们会直接与机器人互动。以足球为例,观众不仅希望看到胜利,还希望看到精彩的比赛。人类的基本行为和思维方式也影响了我们对机器人的期望,这解释了为什么像《西部世界》这样的作品会如此受欢迎。人们倾向于将机器人和AI想象成《西部世界》中的场景,这也反映了我们对自我认知的哲学探索:我们是谁?我们从哪里来?我们要去哪里?我们是否可能是机器人?我们是否被创造?等等。
以“踢足球”为例,人们关注的不是足球本身,而是机器人能否像人一样踢球。一旦相关技术成熟,它就可以被应用到其他领域。这个问题可以分为两个方面:一是技术发展过程中,可以解决其他问题,属于实验性应用;二是人形机器人能吸引观众,因为人们喜欢看表演。从古罗马角斗士到现代奥林匹克,人类对竞技的热爱一直存在。科技发达的今天,机器人运动会,包括足球,是一个新的发展方向。机器人体育比赛可能有两个重点:一是作为技术验证的实验场景,为未来应用打基础;二是技术成熟后,机器人体育竞技成为商业场景。
李梦佳:机器人模仿人类的外观和行为,不仅仅是出于技术上的需要,更多的是因为观赏性和认知兼容性的考量?
赵明国:我不认为机器人必须模仿人类技术。技术不是唯一的衡量标准。比如,人可以用双腿上台阶,自行车也能到达同样的地方。这不是简单的比较优劣或真假的问题。讨论机器人时,人们常提到能在陡坡上行走的岩羊,强调足式机器人在轮子无法到达的地方的必要性。同样,在红牛赞助的很多双轮的极限运动,足式也无法企及。我认为重要的是完成某事的代价,而不是能否做到。
我们发明飞机,不是简单模仿鸟类,而是利用飞行原理飞得更远。在具身智能领域,我们不仅模仿人类动作,还思考技术为何未达到人类水平。我相信机器会在某些方面超越人类,如计算器在计算上超越人类。未来,机器也会在复杂任务上超越人类。
未来体育将分为机器人体育和人类体育:机器人体育让人们观赏,人类体育追求极限和完美。机器在速度上可能超过人类,但在双足跑步上,目前的机器人还比不上人类。我们应尝试制造高速双足机器人,这是技术探索的一部分。
我们往往过于实用主义,我们应该改变这种思维,更深层次思考问题。探索可能带来多领域的进步,不应因担心技术不赚钱而不去尝试。即使不是所有人都对机器人足球感兴趣,只要有一部分人群认为这是可接受的,我们就应该继续推进,并将这项技术放在更长远的时间尺度中去考量。这项技术也可能不会直接产生商业价值,但可以为其他领域提供理论和方法。如果机器人足球能成为商业场景,那就更好了。
我更看重技术能否转化为商业,而不是规模大小。即使足球市场不大,能创造一亿价值也是进步,因为它代表从无到有的转变。目前机器人足球还没有形成商业版图,但非常有潜力,至于未来能否达到更大的规模,这需要时间来验证。
李梦佳:百米赛跑中,机器人用足式跑步会比轮式快吗?会有跑得比人还快的情况吗?
赵明国:将来一定会有人研发出能够跑得比人类快的双足机器人。 百米短跑是一种节奏性很强的运动,只包括起跑加速和保持速度两个阶段,运动员只需全力冲刺到终点。与需要分配体力的马拉松不同,百米赛跑不需要考虑能量的回收和释放,机器人只需能够快速启动、加速,并在100米内保持速度。
因此,百米赛跑的挑战在于是否有足够的爆发力来达到极限速度。相比之下,马拉松则需要更多的能量管理和储备。百米赛跑不需要大量的能量储备,甚至可以不用电池,只依靠超级电容器来快速释放所需的能量。然而,使用现有的电机技术来实现这种快速的能量释放是不可取的,因为它们无法满足这种高效率和高能量的需求。同样,现有的机器人构型也不适合这种高速运动。
回顾2008年残奥会,有一位被称为“刀锋战士”的运动员(皮斯托瑞斯),他因双腿截肢而使用碳纤维假肢。如果设计得当,他的假肢甚至可能使他跑得比健全人更快。这是因为假肢的设计可以使得摆动频率更高,而且由于不需要模拟真实脚部的复杂结构,假肢可以更轻,从而提高运动效率。
在机器人设计中,我们可以借鉴这一理念,利用被动原理来设计机器人的脚部形状和腿部重心。对于机器人,我们可以严格依据生物力学原理进行计算,以调整到最优结果,并据此调整技术配置。经过一定的努力,包括结构调整,我相信机器人的性能可以得到显著提升。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有