记者探访揭秘人形机器人“上岗”要过几道关？_

记者探访揭秘人形机器人“上岗”要过几道关？

智能人形采摘机器人在展示摘水果。新京报记者李木易摄

D11智能人形机器人在生产线搬运物料。受访者供图

8月22日，2024世界机器人大会机器人博览会，一名小朋友在和人形机器人比拼体力。新京报记者李木易摄

北大计算机学院情感与认知智能机器人实验室主任王韬。受访者供图

　　2024世界机器人大会上，27款人形机器人进行了整机展示，数量创历届之最。记者在现场发现，几乎任何一个有人形机器人的展位，都围满了嘉宾与观众，不论是老年人还是青少年，都被具备与人相似外形的机器人所吸引。

　　除了与人外表相似之外，人形机器人在工业和商业等场景已有广泛应用。人形机器人为何能在不同场景中完成工作任务？机器人与人的互动又是如何实现的？在上岗前，它们又需要经过哪些“考试”？新京报记者就此进行了探访。

　　上岗工作

　　通过基于模型的运动控制、模仿学习完成工作

　　2024世界机器人大会上，中国兵器装备集团自动化研究所有限公司展出了D11智能人形机器人，这款机器人具备拟人的形态、拟人的移动能力和拟人的操作能力，今年7月进入一家3C智能制造企业产业园内的5G+工业互联网生产线上，承担物料搬运和扫码、贴标等工作。

　　“以工业制造场景中常见的扫码、贴标工序为例，人形机器人通过视觉对目标物进行识别，并反馈位置信息，控制机器人的手臂进行抓取、粘贴、扫描等一系列动作。”中国兵器装备集团自动化研究所有限公司工程师张啸甫表示，人形机器人有两种方式完成这些操作，一种是基于模型的运动控制，另一种则是通过模仿学习进行训练。

　　“基于模型的运动控制，需要设计一些程序让机器人完成识别、抓取、放置等动作，属于硬编码，关键在于算法控制精度、环境感知精度等方面。”张啸甫介绍，人形机器人通过这种方式完成任务的稳定可靠性较高，但在泛化性方面有所局限，即一旦工作场景和任务内容改变，就需要重新编码设计，且面对较复杂的操作任务时，开发任务较繁重。

　　模仿学习在跨任务推广、复杂技能泛化方面优势突出，但前期数据采集和稳定训练难度较大，目前难以稳定、可靠地完成任务。模仿学习前期通过遥操作等方式，让人形机器人在复杂场景下完成演示任务，并收集过程数据，“比如关节数据、图像数据等，将这些信息积累成庞大的数据集，再用数据集进行训练，让机器人‘理解’如何在不同场景中完成操作任务。只要将这个模型训练出来，人形机器人就能较快投入到对应工作场景中。但是要实现高泛化性和高成功率，数据采集的成本目前非常高。”张啸甫说，这两种方式业内都在研发，“长远来看，人形机器人执行复杂操作任务，模仿学习会是未来发展的趋势，只是目前由于一些限制，无法完全把优势发挥出来。”

　　与人交互

　　识别指令并调用大模型是与人交互的关键

　　在教育、文旅、商业等领域，人形机器人能和人打招呼，并针对特定领域进行交流。例如，大会上展出的青少年孪生人形机器人“跃迁”，有着孩童的外观，可以在儿童的启蒙教育阶段提供有情绪价值的问答内容。EX仿生人形机器人中有一款外形是苏轼的交互型仿生人形机器人，通过对古代文学、历史知识、人物经历的深度学习，能够复现苏轼的诗文和思想，可以在历史文化景区和游客进行互动。来自上海清芸机器人有限公司的“清宝”机器人，不仅可以快速地根据问题给出答案，还能在接收到指令后动嘴唱歌，并挥舞双手做出舞蹈动作。

　　上海清芸机器人有限公司副总裁张杰东告诉新京报记者，对大模型的调用，是人形机器人实现与人交互的关键。在语音交互过程中，人形机器人接收人的语音指令，将其转化成为文本指令，再调用大模型中的文本指令，最后通过语音输出，达成与人对话的目的。交互中伴随的表情和动作，也是相同的实现路径。

　　“这个过程虽然有好几个步骤，但我们人形机器人的反馈速度很快，大模型的调用通常能在1秒左右完成，如果网络存在延迟，可能会是2秒左右，基本上和人在交流中的反馈速度相当。”张杰东表示，“大模型需要不断修正和完善，我们的人机交互技术已经经过三年的迭代，达到行业内优秀水平。”

　　岗前考试

　　“上岗”前要对关节等重要部位开展一系列测试

　　人形机器人“上岗”之前需要完成一系列“考试”。和人一样，关节、手指等都是人形机器人身体的重要部位，要让机器人“健康”，每一个部位的“考试”都得达标。

　　记者从北京具身智能机器人创新中心了解到，人形机器人一体化关节作为机器人运动系统的核心部件，其性能直接影响机器人的整体表现，包括动作精准度、灵活性、安全性及能效等，因此技术人员要对机器人的关节开展一系列的测试，包括绝对定位精度、重复定位精度、稳态误差等。

　　当前技术下，人形机器人一体化关节的绝对定位精度普遍较高，一般而言，高端机器人关节的绝对定位精度可达到0.01°至0.1°之间。这种高精度确保了机器人在执行精细操作时的准确性和可靠性。在现有技术条件下，人形机器人一体化关节的重复定位精度通常优于绝对定位精度，高端机型的重复定位精度可达到0.005°以内。这意味着机器人在多次执行相同动作时，能够保持极高的位置一致性，从而提高工作效率和产品质量。

　　随着机器人产业的不断发展，机器人的手从曾经的抓夹，到柔性抓夹，再到在本次机器人大会上亮相的可自动形变的抓夹，手部越来越灵活。测试人员对机器人“手”的测试也十分严格，测试主要包括抓握力量、动作精度和灵活性。通过对这些指标的测试和优化，可以显著提升人形机器人的任务执行能力、精度和适应性，扩展其应用领域和场景。

　　“天工”是本次机器人大会的明星，其引人瞩目的能力是可以稳定地小跑，还能爬坡。在这些能力的背后，机器人需要完成一系列运动控制测试，比如行走能力、奔跑能力、攀越、跳跃、蹲起、转弯能力、可通行性和腿部灵活性。人形机器人不仅要走得稳，还得走得巧，这就意味着机器人得学会转弯。在机器人的转弯能力测试中，包括特定转弯的转弯宽度和类型，比如U型转弯、三点转弯和L型转弯。

　　人形机器人“上岗”前有了新“考场”

　　人形机器人岗前考试的“考场”既可以在研发机构，也可以在测评中心。国家机器人检测与评定中心（总部）北京测评中心在本次机器人大会期间全新亮相，它同样是人形机器人“上岗”前的“考场”之一。

　　该中心负责人柴熠介绍，北京测评中心智能化评价试验室一期建成了智能感知、认知决策和交互试验室。目前感知试验室可依据相关标准要求，开展机器人视觉算法测试和视觉模拟测试。“视觉是机器人重要的感知方式。视觉算法测试是通过连接被测样品，导入算法模型，依据被测样品的应用场景，选择对应测试数据集进行视觉算法测试，测试系统会自动输出视觉算法智能等级测试结果。”

　　移动能力是不同应用场景中机器人最重要的认知决策能力。在认知决策试验室，机器人将进行移动算法测试和移动实物测试。

　　交互能力对人形机器人或室外移动机器人都至关重要。在交互试验室，人形机器人将开展交互能力的测试评价，包括上肢测试系统和下肢测试系统。柴熠介绍，上肢测试系统可测试人形机器人在与人类交互时的操作交互性能、力控性能及柔顺性能等，通过一系列参数指标，评估人与人形机器人交互的安全性、柔顺性和智能化。

　　对话

　　专访北大计算机学院情感与认知智能机器人实验室主任王韬：

　　当机器人被赋予人类情感，如何应对？

　　8月22日，在2024世界机器人大会期间，北京具身智能机器人创新中心首发了具身智能服务机器人“天轶”。值得关注的是，“天轶”搭载了具身智能情感大模型，其中的情感模型源于北京大学计算机学院情感与认知智能机器人实验室主任王韬研究员带队研发的情感与认知技术，也就是说，“天轶”可以对人类情感进行反应。

　　在本次机器人大会上，众多人形机器人集中亮相。未来是否能将情感模块赋予更多人形机器人？一旦机器人拥有跟人类一样的情感，是否需要探讨情感机器人的伦理边界？新京报记者就此对王韬进行了专访。新京报记者吴婷婷

　　谈人形机器人情感建设

　　需在机器人“大脑”里建模来提高其“智商”和能力

　　新京报：8月22日发布的“天轶”机器人搭载了具身智能情感大模型，这让机器人实现了什么功能？

　　王韬：北京大学计算机学院情感与认知智能机器人实验室成立于2017年，一直研究如何让机器人更具有情感能力、交互能力，让它通过认知环境，更重要的是认知人，成为跟人打交道的机器人。这种类型的机器人一定要能读懂人的心理或者心情，读懂人的喜怒哀乐，也就是人们常说的察言观色，还能感知到人们更加细微和丰富的情感与认知状态。这是我们实验室一直在研究的方向，我们称其为情感计算。

　　机器人的情感计算有很多重要应用场景。举几个简单例子，搭载了情感计算模型的机器人如果陪伴我们去市场买菜，它可以捕捉到我们的表情和注意目标，分析出我们更喜欢哪种蔬菜；它也可以在家陪伴老人，如果发现老人闷闷不乐，它会做出一些正确的应对反应，排解老人不快的情绪。其实还有很多别的类型的应用，例如可以“看出”对面人的心率变化等生理指标，可以用作某些特殊情景的判定，甚至还可以用作健康监控。

　　今年6月起，我们与北京具身智能机器人创新中心合作，成立情感智能应用联合实验室，已使“天轶”具有情感交互能力，使得它能更好地服务人。

　　未来我们希望有更多的情感机器人，它们会像人一样拥有比较细腻的情感识别与反应能力。

　　新京报：工业机器人需要不断地学习掌握各种工作技能，要让机器人拥有情感，也需要学习吗？

　　王韬：我们人类是怎么学会情感的？如果一个小孩从来没有在人类社会生活，那么恐怕他的情感能力是缺失的。从这个角度来讲，机器人也一样，它一定要学习。但是这种学习跟我们现在看到的机器人学习抓取物品不太一样，它需要特殊的学习方法，也需要建模来提高它的“智商”和能力。

　　举个例子，我们常说“读书千遍，其义自见”，但具体到每个人，真的能做到“其义自见”吗？比如熟读李白诗选，真的能成为像李白一样出口成章的优秀诗人吗？恐怕大多数人都不行。对于机器人也是一样，如果仅仅是靠“堆数据”，那么它学习千万遍，可能也无法拥有“高智商”和丰富的情感。所以，我们需要在机器人的“大脑”里建模，不能仅仅对机器人进行数据驱动，更好地建模，使其能够更好地理解和学习是必要的。

　　机器人的情感在这方面更加突出，因为人的情感非常复杂，也不存在大规模的具有全面情感标注的数据集，所以我们才要不断地在这一领域进行研究。

　　谈人形机器人伦理边界

　　机器人的伦理，是与研发机器人息息相关的人的伦理

　　新京报：如果将人形机器人赋予情感功能，是否需要探讨其伦理边界？

　　王韬：首先，我们要明确情感分成三个方面，第一个方面是例如那些长得非常像人的机器人，它们是能够表达情感的机器人，现在很多机器人在这方面做得很好。第二个方面是机器人对人的情感识别，它能知道“眼前”的人是什么情感，比如悲伤、生气、高兴、沮丧等。第三个方面是机器人的“情商”。比如它识别出来这个人心情不好，那么它应该怎么应对，才能让这个人心情变好？

　　在上述三个方面中，机器人的情感识别和“情商”非常难，但是我们也一直在研究这一领域，希望在今年年底或者明年年初能够有所突破。

　　其次我们要讨论伦理边界的问题。当机器人能够识别人类情感的时候，它可以做出自己的反应，比如当发现一个人心情不好时，机器人是表现出贴心的关怀，还是说教，或者其他的方式？这其中就涉及机器人设计者的伦理。

　　我一直认为，机器人的伦理不是机器人本身的伦理，而是设计者、数据工程师、设计架构人员等与研发机器人息息相关的人的伦理。这跟我们教育孩子是一样的，家长的思想、伦理影响孩子的成长。

　　对机器人来讲，即使到了通用人工智能阶段，设计者的伦理都很重要，尤其对于情感机器人来说更重要，这体现了设计者的水平，也体现了设计者的伦理道德。

　　新京报：你刚才谈到情感机器人对于人类具备的伦理，那么人类对于情感机器人是不是也同样需要伦理边界？

　　王韬：这是相互的影响。情感机器人如果对人类的情感产生反应，这个时候我们就需要注意了，尽管情感机器人能够读懂人的情感并且用情商进行反应，但就目前而言，机器人还不存在像人类一样的“内心情感”。所以我们需要关注一个问题：机器人的情感模型，尤其是神经网络模型，往往并不完全清楚模型内部发生了什么，而更多地是看到普通情况下模型对外的表现形式，那么机器人有没有可能在模型内部产生一种不好的反应？这是需要我们特别关注的问题。当然，这又回到了刚才的话题，也就是设计者的伦理和技术水平。所以至少从目前来看，设计者是非常重要的。

　　新京报：人形机器人对人工智能的伦理会带来哪些挑战，如何来应对？

　　王韬：人形机器人是人工智能的一个载体，人工智能的挑战和伦理就是人形机器人的挑战和伦理。当然，如果有一天人形机器人的外形与真人外形无限接近，甚至产生了混淆，那将会带来一些新的挑战。

　　谈人形机器人拟人化

　　与人打交道的机器人，我认为最好还是人形

　　新京报：在这次的机器人大会上，我们看到很多以真人为原型的机器人。人形机器人需要逼真的拟人化吗？

　　王韬：机器人可以分成两类，一类不怎么和人打交道的机器人，比如说工业机器人。从科技发展角度来讲，工业机器人不一定都是人形机器人。第二类，与人打交道的机器人，我认为最好还是人形。

　　其中有两个原因，一方面是人类天然地对人形的产物沟通效率更高，另一方面，机器人要跟人一起生活，或者服务于人，并且要在人的环境中进行交互，如果它不太像人的话，可能很难适应这个环境。

　　说完了什么情况需要人形，那么我们再来谈是否需要逼真的拟人化。人形机器人设计成什么样的外貌，说到底还是设计者的问题。有位科学家提出了“恐怖谷效应”，提出机器人长到与人接近的时候，是很恐怖的，但是如果一旦突破了边界，机器人将不再恐怖。从现阶段以真人为原型的人形机器人的外观来看，还没有突破“恐怖谷效应”，所以有志于机器人全面拟人化的研发人员还需要不断探索。就我个人而言，我还是喜欢长得像科幻电影或者动画片里面那些可爱机器人的样子，事实上“天轶”机器人就没有逼真拟人化。

　　新京报记者叶红梅吴婷婷