OpenAI o1：对未来的 10 个启示_

编者按：虽然具备推理能力的OpenAI o1推出已有一段时间了，但对这个模型对于未来的潜在影响的讨论还不够透彻，这里就有一篇深度思考，可供诸位参考。文章来自编译。

我 9 月份发表过一篇长文大家还记得吗，这篇文章介绍了 OpenAI 的新模型 o1 系列（o1-preview 与 o1-mini）。我想就此谈两点。

首先，o1 属于一种新型人工智能的最原始版本。用种子的价值来判断新范式没有意义。得让它开花结果。得让它发芽再说。

其次，该文章最后一部分要付费还能看。里面讨论的是其“对长远未来的 10 个影响”。我觉得这一节应该向公众开放，所以我取消了付费墙。

为了给读者提供必要的背景信息，上述十大影响大致就是我在这篇文章介绍所提出问题的答案：

推理人工智能对于生成式人工智能来说意味着什么（这东西到底算不算生成式）？

用户怎么跟能思考的人工智能模型建立联系并进行互动？

如果让推理模型思考几个小时、几天甚至几周的话，它们能做什么？

作为计算的结果，推理模型会如何实现性能的扩展？

公司在训练和测试流程中该如何分配算力？

所有这些对于人工智能的最终目标意味着什么？

这与 GPT-5 有何关系（如果有的话）？

下面我们就来分析一下 OpenAI o1 系列对未来的潜在影响，并且介绍一下新的测试时间尺度定律，以及能够推理的 AI 新范式。

正在发生的事情要比 OpenAI 发布的模型大——大得多。这个东西超越了尺度定律、超越了新范式、超越了生成式人工智能。本节既是今天的总结，也是明天的故事。

1. 生成式人工智能作为人工智能领先范式的时代已经结束。对于大多数对人工智能的关心仅限其用途的用户来说，这也许是最重要的影响。生成式人工智能关乎的是新数据的创建。但推理式人工智能并不关心这个。推理式人工智能的目的是解决难题，而不是产生垃圾。此外，OpenAI 还将推理的标记（token）给藏起来了。其他人也会这样做。你仍可以用生成式人工智能工具来生成东西，但最好的人工智能不会以生成为中心，而会以推理为中心。这个东西完全不一样，我们还不太了解怎么用。

2. 聊天机器人的时代也结束了。大家还会用来闲聊，但它们不再是最好的人工智能。人工智能公司的精力会放在其他地方。OpenAI、DeepMind 和 Anthropic 会在推理这条道路上探索、拓展，聊天机器人这条路线会降为次要优先事项。只要当前的聊天机器人服务能继续提供经常性收入来源，他们就不会投入太多资源来做出超过市场需求的改进。

3. 一直认为自己特别适合的任务上，人类会日益觉得已经没法跟人工智能平起平坐了（最终会差过人工智能）。用户与人工智能关系平等（如在工作方面）的想法已成过去。相反，我们将心怀敬畏或恐惧地见证人工智能越走越深、越走越远，令我们望尘莫及。在过去，我们是这个世界的建筑师和建造者，但后来机械出现了，我们不再是建造者。我们也快做不成建筑师了。

4. 旧的尺度定律（所有算力均专门用来预训练和后训练）已被新的尺度定律（算力要分摊给训练和推理，好让模型实时推理）取代。从现在开始，之后发生的事情已经无法预测，因为在过去四年我们一直在应用众所周知的启发式方法。是时候升级了。

5. OpenAI 终于将过去 20 年人工智能研究最重要的两个范式融合在一起：大语言模型（OpenAI 的 GPT）与深度强化学习系统（DeepMind 的 Alpha）。所以他们才最终决定放弃 GPT 这个名字。就这个意义而言，在漫长的5年之后，o1 系列又重启了该公司的研究。

6. 用户会出现一个新类型：AI 富人与AI 穷人。AI 模型的价格上涨速度会快于企业找到降低成本的优化方法的速度。很快将出现新的定价层次，会高到只有少数特权阶层才能负担得起获得尖端 AI 模型的好处。其它人只能算底层的 AI 穷人。

7. 我们以为自己对人工智能所了解的一切都变了。OpenAI 富有创造力、很有思想深度的匿名研究员 Roon是这么说的：“所有的公共辩论基本论述都要重写了。关于平台期和扩展道德，关于自回归模型中的错误是累积性的还是自我恢复的，关于语言能否带来真正的智能，以及关于通用智能的边界在哪里。”我同意。

8. 这种新型人工智能对用户没有价值主张。大多数人都不知道该如何利用能推理的人工智能。这个事实很残酷，与其说其揭示的是人工智能，不如说揭示的是人类的局限。要弄清楚去哪里应用一个可以花一整天思考一个问题的人工智能并非易事。

9. 这不是 ChatGPT 时刻。这玩意儿还不知道怎么用，但意义深远。深远到大多数人都意识不到。ChatGPT 的主要特点是便利性（免费、易于使用、直观）。GPT-3 的主要特点是令人惊讶的功能——但你得努力才能找到它们。o1 更像 GPT-3，所以大多数用户没法理解它的价值（尤其是考虑到每个查询的等待时间以及当前的消息数限制）。

10. 这跟 GPT-5 有什么关系？新的基础模型还没推出。o1 基于 GPT-4o，这意味着如果他们改变底层大模型的话，还有很大的改进空间。GPT-5 会利用这种新范式，但同样地，只有一小部分受众能认识到它的价值。但是，你现在还是应该尝试去跳一下。o1 适合科学和数学，对你来说可能没那么有用。但最终目标是 JARVIS，然后是通用人工智能，再然后就不知道了。你可能会认为现在切换不值得，但这个选择会很短视：OpenAI 等公司会继续开发这种新范式，因为这样才有可能实现这个领域的最终目标。

译者：boxi。