OpenAI o1与360 CoE：前瞻者们的不谋而合_

本文作者：董董

版式设计：姜姜

200多年前，第一次工业革命，以蒸汽机作为动力机被广泛使用为标志。

因此，改良了蒸汽机的瓦特，被认为是工业革命之父。但另一种观点则认为，这个名号，应归属于阿克莱特。

因为，同样改良了蒸汽机的他，所推动的规模化生产正是工业革命的本质。

但无论是瓦特还是阿克莱特，作为前瞻者的他们，在那个关键节点上，不谋而合。

200多年后，这样的不谋而合，再一次出现。

9月13日，OpenAI发布了具有推理能力的人工智能模型“o1”，它通过模仿人类的思维过程，强化学习和“思维链”技术，引导模型自主解决问题。

而在一个多月前，360集团创始人周鸿祎曾在ISC 2024大会上宣布，360将“用基于智能体的框架打造慢思考系统，从而增强大模型的慢思考能力”。

周鸿祎在近期，还多次强调，将“利用智能体框架，让大模型从快思考转成慢思考模式，把多个大模型组合起来解决业务问题”。

正如马克·吐温所说的那样：历史不会重复，但会押韵。

“思维链”和“慢思考”，也许，正是当下人工智能发展里程碑上，那个发音相同的韵脚。

而作为这场AI引发的科技变革的亲历者，OpenAI和360，在研判未来趋势的那条道路上，这一次，都瞄准了同一个方向，站在了同一条起跑线上。

周鸿祎和360，抢跑一个身位

有意思的是，在这次比赛中，360，似乎抢跑了。

是的，当人们震惊于人工智能模型o1所展现出的强大推理能力时，早在2024年7月底，360首创的CoE（Collaboration-of-Experts,专家协同）架构中，就已经强化了推理的使用。

这一个身位的差距，似乎再一次证明了，在人工智能赛道上，以360为代表的中国队，和美国队的距离并没有想象中的那么大。

在解读o1时，周鸿祎就曾表示，GPT类大模型通过训练大量知识，主要学习的是快思考能力，这也是为什么GPT类大模型脱口而出的答案质量不够稳定，“就像人一样，不假思索出口成章而不出错非常难实现”。

而慢思考则是缓慢、有意识、有逻辑性，需要分很多步骤。周鸿祎解释，“这一次o1拥有了人类慢思考的特质，在回答问题前会反复地思考，拆解、理解、推理，可能会自己问自己1000遍，然后才能给出最终的答案。”这也就是为什么其“思维链（CoT）”能呈现出如此强大的效果的根本原因。

那么，“思维链（CoT）”是不是已经能满足当下的现实需求了呢？

显然，现在的它，还有很多不足。

有报道称，o1存在着像幻觉问题、运行速度较慢及成本高昂等问题，而这些问题最突出的表现，就是限制了其的应用范围。

而抢先一步的360，显然在应对这些问题上，已经找到了突破口。

360AI 对不同领域的问题使用不同模型进行回答

360首创的CoE架构，能让多个模型分工协作、并行工作，执行多步推理。并且，360将CoE架构和混合大模型的设计，应用在了360 AI搜索、360 AI浏览器等多款产品中，实现了对“慢思考”的落地实践。实践证明，这种方式可以在处理简单问题时，调动精准的小模型来提高回答的准确性，进而节约推理资源，加快响应速度。

以360AI搜索的“深入回答”模式为例，每一次启动，就会涉及7-15次的大模型调用。比如，可能会涉及1次意图识别模型调用，1次搜索词改写模型调用，5次搜索调用，1次网页排序调用，1次生成主回答调用，1次生成追问调用。

当一个用户想让360帮他把一首古诗词翻译成英文，路由模块就会调用起翻译、反思等多个模型，让这些模型分工配合、共同完成任务。

“柴多火焰高”，模型多，办法就好。

可见，这一步之遥，至少在落地应用上，360已经拉开了和OpenAI的差距。

仍存差距，但已具备弯道超车潜力

作为人工智能领域里当之无愧的领头羊，OpenAI的技术实力在OpenAI o1上已经得到了足够的体现。

其首席执行官山姆奥特曼表示，o1是“迄今为止功能最强大，最具有一致性的模型。”

OpenAI宣称，o1系列模型可以推理复杂的任务并解决比以前的科学、编码和数学模型更难的问题。

让我们来看看其公布的一系列测试数据，其中，国际数学奥林匹克的资格考试（AIME）中，GPT4o准确率为13.4%，o1则是83.3%，成功进入了美国前500名学生的行列。

在代码竞赛中，GPT4o准确率为11.0%，o1则是89%。

面对博士级科学问题 (GPQA Diamond)时，GPT4o是56.1，人类专家水平是69.7，o1达到了恐怖的78%。

虽然与o1仍存在差距，但值得欣慰的是，有媒体报道近期已经有国内技术团队采用CoE协同工作模式，选择任意三个模型协同工作达到了和OpenAI o1-preview类似的反思决策效果。经过21道复杂逻辑推理题测试结果显示，其效果与OpenAI o1-preview相当，完全超越GPT-4o，有时还能超越o1-preview。这说明，360在大模型领域的持续创新和深度探索，已经并肩了当下的行业领军者。同时，360所呈现出的技术解决方案，以及其标准化的参考框架，也为国内的同行者们，提供了参考样本。