全球语言人工智能“高考”放榜，武大“织女”夺冠_

本文转自：长江日报

长江日报大武汉客户端4月28日讯（记者周劼通讯员吴江龙）在电商平台购买了商品，感觉不太满意，你给客服留言：店主，你们家东西真好。正好客服是机器人，它该怎么理解你的意思是喜欢还是不喜欢？这就是人工智能自然语言处理模型要做的事情，模拟日常生活中的各种场景来真正理解人类语言、文字的意义。

研发人员对“织女”模型进行测试。

日前，武汉大学-京东可信人工智能联合研究中心团队构建了“织女Vega　v1”模型，在全球该领域顶级测试中以总平均91.3分的成绩夺冠，再次刷新自然语言理解技术世界纪录，超越同场竞技的微软、Facebook、斯坦福大学等企业和高校团队。

“织女”研发团队合照。

这个名为“骨碌”（GLUE）的全球开放性通用语言理解评估系统，可谓人工智能语言处理领域的“高考”，有九门考核科目，代表着人工智能语言处理的技术难点和发展方向。全球任何工业界和学术界的团体，只要从事相关研究，都可以参与这个测试，像手机性能“跑分”，考试永远都在，大家随时可以提交答案，成绩排行马上出来。

GLUE榜单排名。

4月27日，记者采访了该团队核心成员钟起煌，他说团队只用了三个月的时间就搭建了“织女”的自然语言深度学习和处理的模型。

他介绍，“织女”其实就是一个包含了十五亿参数链的超大容量模型。和传统模型相比，“织女”就如同一部电影和一帧画面的关系。

参数链越多，代表着人工智能的“神经元”越多，处理各种复杂语言问题就越轻松。“织女”模型在这次测评的九个子任务中的四个单项均位列第一，包括情感分类、语义相似度、问句语义等价和指代消解任务，尤其在情感分析和指代消解中首次超越人类智能水平。

钟起煌以情感分析举例，人们通常感觉机器人要么冷冰冰，要么呆萌，就在于它们不能很好地分辨语言中的情感。日常生活对话、网络发帖除了叙事外，还包含很多情绪因素，“织女”模型通过深度学习，可以很好地理解含有情感的语言的真正意义，判断要表达的情感是积极的还是消极的，是喜欢还是厌恶的，这一点已经和人类相似了。

“织女”的“高考”成绩单。

现在参与的是英语环境的测评，目前“织女”模型也以英语深度学习为主。钟起煌表示，在开发之初，“织女”就预留了更通用语言环境、多语种的学习模式。不久之后的2.0、3.0版就会推出中文的学习模式。硕博连读、即将步入博士阶段的钟起煌展望说，“织女”作为一个通用的语言处理模型，只需要一个很少量的数据集就可以进行微调，它的应用非常广泛，可以作为网络后台，变身有温度的“机器客服”；也可以人机对话，变成有情感的“互动话痨”；还可以运用到自动驾驶，根据乘客的指令做出准确判断，变为“高超驾驶员”。

正因为“织女”模型巨大，需要一个超大规模的计算机集群来运行，源自京东探索研究院的超大规模计算集群——天琴α正好满足这一条件，在“天琴”的支持下，“织女”实现了大规模训练。而“织女座”是“天琴α”的别称，“织女”模型，这个带有神秘和浪漫色彩的名字，正是这么来的。

据悉，武汉大学-京东可信人工智能联合研究中心是由武汉大学与京东联合成立的科研机构，以从基础理论层面实现颠覆式创新为目标，共同开展科学研究与人才培养，研究领域包括可信人工智能、量子机器学习、超级深度学习及其他人工智能涉及的理论与技术。