上周,我觉得很重要的一件事是:在美国云市场有最大市场份额、但在 AI 领域落后于其他云服务商的亚马逊,终于进军多模态 AI。
这里有一个大背景是:去年亚马逊曾推出过第一批大模型 Titan,但仅支持文本,也没引起客户的太大关注。之后,亚马逊的 AI 战略我将其简单总结如下:
与 Anthropic 结成类似于“微软-OpenAI“的联盟,然后利用它和 Anthropic 的关系来增强它在 AI 方面的资质,并向其 AWS 客户提供 Anthropic 的模型。而所有这一切,都将确保资金会从 Anthropic 回流到亚马逊,以帮助提高 AWS 的增长率。
为此刚刚过去的 10 月里,亚马逊宣布再另外向 Anthropic 注资 40 亿(总计 80 亿美元),以增加它在 Anthropic 公司的股份;而 Anthropic 则承诺:将使用亚马逊 AWS 数据中心的服务来满足其部分计算需求,并将使用由 AWS 设计的 AI 芯片。这一起交易,也使亚马逊成为了 Anthropic 的主要云伙伴与培训合作伙伴。
不过,亚马逊并没有止步于此,它还希望内部的 AI 模型能获得 AWS 客户的青睐,以减少对 Anthropic 的依赖——上周亚马逊被披露:其已开发出一种能处理文本、图像与视频的新 AI 模型(代号为 Olympus),可以帮客户用简单的文本提示就能在视频档案中搜索某些场景。
这意味着亚马逊已经进军多模态 AI。或许亚马逊的 AI 模型在生成文本与解决复杂问题方面不如 OpenAI 与 Anthropic,但是别忘了亚马逊在云领域有“规模优势”,它有可能会提供更低的价格。
借此机会,我推荐大家阅读美国云领域著名投资机构 BVP 有关“垂直 AI”报告系列文章中的第二篇《多模态 AI 解锁新机会》,该文章指出了 AI 初创公司可以如何利用多模态来做垂直行业的 AI 应用和 Agents。其系列文章的第一篇请见这里,以下是我的翻译简写:
第二部分:多模态能力解锁垂直 AI 的新机遇
过去 12 个月里,出现了许多新模型,它们在理解语境、减少幻觉以及整体推理能力方面取得了重大进步。我们看到,某些模型在语音识别、图像处理与语音生成方面的表现正在接近(某些情况下甚至超越)人类的能力,这为 AI 开辟了许多新用例。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有