“绝大多数企业 AI 转型太慢了,十天就能完成的项目拖了六个月。”
作者 | Eric Harrington
AI 创业潮,从理论突破到实际应用往往是最具挑战的一跃。近日,人工智能领域的标志性人物吴恩达(Andrew Ng)用行动诠释了如何跨越这道鸿沟:他发布的开源项目「aisuite」在 GitHub 上迅速积累了近 8600 颗星标。这个工具以简洁优雅的设计打通了各大 AI 模型平台,展现了他一贯主张的理念——真正有价值的 AI 创新在于化繁为简,让技术能够轻松落地。
这种务实的创新思维,在他最近于迪拜的一场演讲中得到了系统性的阐述。“人工智能就像电力一样,是一种通用技术,但其价值必须通过具体应用才能实现。”吴恩达指出,当前 AI 领域的讨论过分聚焦于底层技术栈,而最关键的应用层创新却未受到应有的重视。从开源工具的推出到这场演讲的真知灼见,都指向一个核心命题:如何让 AI 技术真正服务于现实需求。
虽然这次演讲的主题是教阿联酋的土豪们怎么用 AI,但吴恩达其实也全面地、系统性地分享了他对企业 AI 转型的思考,提出了几个格外引人关注的观点:
区分技术(底层 AI 模型)和真正的应用,我们应该治理的是应用,不是技术!
智能体 AI(Agentic AI)如何突破传统 AI 应用的局限
企业如何将 AI 项目开发周期从 6 个月压缩到 10 天
“任务导向”帮助企业找准 AI 落地切入点
传统行业如何借助 AI 实现价值倍增
以下是演讲全文:
让全村用上“电”
很高兴来到迪拜。这是我第一次来到这个国家,我一直在寻找与各方交流的机会。希望这次访问将成为未来更多交流的开端。今天我想与大家分享一些人工智能领域令人振奋的机遇。
我想特别分享为什么我对阿联酋的机遇如此兴奋。你们可能听我在其他场合说过,人工智能就像电力一样。这意味着人工智能也是一种通用技术(general purpose technology),可以应用于许多不同的领域。比方说,让你讲一讲电力有什么用途,这个问题几乎难以回答,因为它太过普及。因此,我们面前的重要工作就是要识别并构建新的机遇,利用现在人工智能技术所能实现的可能性来开发新的应用。
人们经常问我,人工智能最大的机遇在哪里?让我和大家分享我理解的人工智能技术栈:在最底层是半导体层,上面是云计算层,再上面是基础模型训练层。每当出现新的技术浪潮时,媒体和各方的关注往往都集中在技术栈的这些层面上。这没什么问题。
但事实上,对于所有这些工作来说,几乎根据定义,还有另一个层面,即应用层(application layer),它必须变得更有价值。因为我们需要构建的应用能够产生更多收入,这样才能负担得起技术栈下层的成本。
说到人工智能领域正在发生的诸多变革,如果让我选择一个最重要的技术趋势,那就是智能体 AI(agentic AI)的崛起。如果你要记住一件关于人工智能技术的事,我建议你关注智能体 AI。
让我解释一下这个概念。我们很多人可能都在使用基于云的大语言模型,比如 ChatGPT、Gemini 或 Claude,我们会输入提示词,让它给出回应。在这种情况下,人工智能会从第一个词开始写答案,一直写到最后一个词,中间完全不能回头修改。尽管被迫以这种线性方式写作很困难,但人工智能的表现已经相当出色。
但事实证明,如果允许更具迭代性的工作流程,人类和人工智能都能做得更好。在智能体工作流程中,我们可能会先让它写一个特定主题的大纲,然后询问是否需要做网络研究。如果需要,我们就下载一些网页内容并将其放入人工智能的输入上下文中。然后询问哪些部分需要修改或进一步研究,接着让它写出初稿,阅读自己的初稿进行评判,修改草稿,如此循环往复。
这种工作流程看起来更像是这样:先思考,然后修改,再思考,如此反复。事实证明,通过多次循环这个过程,它能产生比非智能体工作流程好得多的输出结果。我的团队收集了来自不同研究组在使用人工智能编写代码方面的数据。在一个编程基准测试中,当要求从第一个字符到最后一个字符输出代码时,GPT-3.5 的正确率为 48%,也就是说 40% 的时间能写出可工作的程序。GPT-4 是一个更好的模型,正确率达到 67%。但有趣的是,从 GPT-3.5 到 GPT-4 的提升,远小于 GPT-3.5 使用智能体工作流程带来的提升。而 GPT-4 配合智能体工作流程的效果会更好。
我们在各个领域都看到了这种变化。在 Coursera,我们使用智能体工作流程帮助开发者定制他们的课程或为学习者提供建议。在我领导的 AI Fund,我们看到智能体工作流程在医疗诊断辅助、复杂合规文书填写或理解复杂法律文件方面发挥着重要作用。我的多个团队开发的许多应用,如果没有智能体工作流程,根本就不可能实现。
这是一个新兴的人工智能技术栈,在基础模型和应用之间有一个新的编排层(orchestration layer)。在计算机科学中,编排意味着我们协调多个用户,在这种情况下是基础模型。
编排层控制底层的功能已经存在了几年,但现在编排层正在变得越来越具有主动性。这并不改变我一开始说的结论,即大部分价值必须在应用层。但我看到的是,智能体编排层使得在其上构建应用变得更加容易。
我的团队 DeepLearning.AI 和 Coursera 与几乎所有领先的生成式人工智能公司合作进行开发者培训。如果你列出排名前 10 的生成式人工智能公司,我们实际上在与其中的 10 家全部合作。我认为这让我们处于一个特殊的位置,能够从所有前沿生成式人工智能公司获取知识,并与全世界分享。这也帮助我们洞察人工智能的未来发展趋势。
十天干完六个月构建的系统
让我分享一些你们可能感兴趣的重要趋势。一个有趣的趋势是生成式人工智能(generative AI)正在使原型开发变得非常高效。这正在改变企业、大学以及初创公司创新的方式。
在生成式人工智能之前,如果使用预测性人工智能、深度学习或监督学习,这是我和许多其他团队用来构建许多有价值的人工智能系统的工作流程:我们收集数据,训练人工智能模型,然后可能将模型部署在云服务上。这需要我们花 6 到 12 个月才能完成。这没什么问题,我们用这种方式构建了一些非常有价值的人工智能系统。
但事实证明,有许多人工智能系统过去需要我和优秀的人工智能团队花 6 到 12 个月才能构建的,现在有数十万个团队可以在大约 10 天内完成。我们可以在几天内写几个提示词,然后在一周内部署到生产环境中。
值得注意的是,构建一个软件有很多步骤,不仅仅是人工智能部分。你需要产品设计、用户研究、数据集成、防护措施、合规性等。只有其中的一个部分加快了速度,这就是为什么许多企业观察到有很多人工智能原型还没有投入生产的原因。这是因为其他部分仍然需要和以前一样长的时间才能完成。
但当人工智能部分可以构建得如此之快时,我看到许多企业系统地构建多个原型,作为发明新事物的方式。因此,企业创新流程正在发生变化,因为你现在可以非常低成本地构建 20 个原型,看看什么有效。在我居住的硅谷,“快速行动,打破常规”(move fast and break things)这个口号因为确实打破了东西而名声不佳。
我想分享一个我们团队工作过的创业案例,并介绍我们的流程,因为我希望这对阿联酋的企业在利用人工智能新机遇方面也会有所帮助。
几年前,三井集团(Mitsui Corporation)来找我。作为一家全球贸易公司,三井集团在日本运营着大型远洋船队。他们提出我们应该研究使用人工智能来提高船舶燃料效率。在筛选想法时,我的团队通常会花大约一个月的时间验证是否存在市场需求,以及技术上是否可行。如果可行,我们就会招募一位 CEO 来帮助我们建立这个企业。
我们招募了连续创业者 Dylan Kyle,他之前已经有过一次成功退出的经历。我们通常会与 CEO 一起花三个月时间构建技术原型。如果这个阶段成功了,我们就会开出支票投资这家公司。这让他们可以招聘团队、获得真正的客户,并继续发展和扩大规模。
这个案例的结果是,Bering AI现在已经在600多艘远洋船舶上运行,通过使用全球风况和洋流数据为船舶提供建议,指导它们如何航行以安全、准时地到达目的地,每艘船每年节省约50万美元的燃料成本,同时减少约10%的燃料消耗和二氧化碳排放。
我想强调这个例子的原因在于,作为一个人工智能从业者,我永远不会想到这个想法,因为我对全球海运业知之甚少。但是通过三井集团对这个行业的深入了解,以及我的团队对人工智能的认识,我们共同识别并建立了这个应用。我认为这仅仅是成千上万甚至数十万个尚待识别和构建的人工智能机会中的一个。
我的团队 AI Fund 经常与企业合作伙伴一起识别、构建和执行人工智能机会。让我简要分享一个似乎很有效的工作方法。我们认为重要的是要为企业高管提供一些关于人工智能技术的基础培训。去年 Coursera 上增长最快的课程是“面向所有人的生成式人工智能”(Generative AI for Everyone)。这门课程提供了对人工智能的非技术性的商业层面理解,包括它能做什么,不能做什么等内容。
我们发现,只要有一点点人工智能技术方面的高管培训,往往就能带来非常富有成效的人工智能项目头脑风暴。每个与我们合作的企业最终都会产生很多关于人工智能的想法。团队会有各种想法,但我想与大家分享一个特别有成效的方法,叫做“基于任务的工作分析”(Task-Based Analysis of Jobs)。这个方法是由我的朋友,斯坦福大学教授 Eric Brynjolfsson 和他的一些同事首创的。
这个方法源于这样一个观察:尽管我们担心人工智能会自动化就业岗位——这确实是政府、社会和学术界需要讨论的重要话题——但从商业角度来看,更有用的是将人工智能视为自动化任务的工具。因为工作岗位是由许多不同的任务构成的。当我们看看我们的员工在做什么,并将其分解成任务时,就能帮助我们识别出哪些任务人工智能可以自动化或增强。
区分技术和应用
在我与世界各地的政府和董事会讨论人工智能治理时,经常被问到:我们如何治理人工智能?我想传达的关键信息是,我认为必须区分技术和应用,我们应该治理应用,而不是技术本身。
在技术领域,我们必须区分技术本身(比如电动机就是一种技术)和应用(比如将电动机用在搅拌机、车辆、透析机或者制导炸弹中)。其中一些应用是我们想要更多的,有些可能是我们想要更少的。事实证明,技术指的是可以用多种方式解决问题的工具,而应用则是技术的具体实现,旨在满足特定的客户需求。
人工智能技术也是如此。一个人工智能模型可以用于医疗设备、社交媒体信息流、聊天机器人等等,其中有些应用是积极的,有些可能不太积极。事实证明,风险更多地取决于应用,而不是技术本身。因此,对像电动机或人工智能这样的通用技术进行管理只会扼杀创新,而不会增强安全性。
因为如果你去找一个电动机制造商,让他们保证没有人会把他们的电动机用在武器或有害的应用中,这对电动机制造商来说是不可能的。这种技术根本不存在。但是,如果我们去找搅拌机制造商,或者电动车制造商,或者医疗设备制造商,我们可以弄清楚我们在医疗设备中想要什么和不想要什么,并确保它是安全的。
在过去的一年半里,我对美国和欧盟的一些大公司的游说活动感到惊讶。这些公司投入了大量资金创建大型人工智能模型,不希望与免费的、开源的模型竞争。我对他们为通过扼制性法规而进行的游说力度感到吃惊,这些法规试图关闭开源或开放方式的人工智能模型(指团队在互联网上免费发布供任何人使用的人工智能模型)。
幸运的是,我们已经击退了最严厉的法规(SB-1047 法案),但仍然在不断有人试图通过这些法规。如果他们成功了,包括阿联酋在内的许多国家将失去访问权或发现更难获取前沿人工智能的机会。因此,我认为除了少数几家反对开源和开放方式模型的科技公司外,几乎所有人的利益都在于确保这些法规不会通过。
让我总结一下。作为一种通用技术,人工智能创造了许多构建应用的机会,并且正在扩大人工智能可以完成的任务范围。随着人工智能带来的所有变革,我们需要新的技能来为企业和个人做好准备,迎接人工智能将与我们并肩工作的未来工作方式,因为工作角色正在发生变化。
最后,正如你们今天早上看到的,阿联酋在阿拉伯世界人工智能就绪指数排名第一,全球排名第八。我认为阿联酋在人工智能时代有很好的发展定位。因此, Coursera 和我的其他团队,包括 DeepLearning.AI、AI Fund,我们都很感激有这个机会参与其中,也希望未来能与在座的各位有更多合作。
参考链接:https://www.youtube.com/watch?v=SN-BISKo2lE
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有