作者 | 褚杏娟
“今天,全球所有顶尖科技公司都很关注智能体,但像百度这样把智能体作为最重要战略方向的并不多。”李彦宏在最新的演讲用了很大的篇幅来讲百度对智能体的想象。百度给智能体的定位是 AI 应用最主流的形态,是 AI 原生时代新的内容、信息和服务载体。那百度到底怎么玩转智能体生意的呢?
解决智能体落地技术难题
“智能体去年刚出来时特别火,但是很快一盆冷水泼下来,大家发现很难用起来。”百度智能云千帆 AppBuilder 产品负责人朱广翔说道。
经过一年多“退烧”后,智能体已经不是当时被叫嚣会“杀死”众多创业公司的超级王牌了,但这条赛道依然活跃,只是人们以一种更加务实的方式来探索。
当前的智能体主要存在三个问题:容易随意发挥,不受控制;短期记忆,长期就失忆;能力欠缺,用户体验差。这些问题阻碍了人们使用智能体,极力推广智能体的百度必须解决。
对此,千帆 AppBuilder 团队进行了系列技术优化。针对不受控的问题,百度 通过人工编排、人机协作等来为大模型幻觉兜底,跨场景情况下灵活跳出及拉回。知识注入让智能体更快学会专业知识,在知识上变得更可控。但这不是训练,而是一个非常轻量级的运营工具,不需要研发上手。记忆方面,百度提供了三种记忆形式,把记忆准确率提高到 96%,并且在任务拆解上把规划调度准确率提高至 95%,再通过提供各种组件来丰富智能体能力,进而改善体验。
“发现智能体很难落地后,我们就不能用‘裸 Agent’。”朱广翔从开发层面将智能体分为了两类。一类是自主规划智能体(无套路版)用于自主思考智能规划。这类智能体的开发非常简单,填表、选择想用的组件后点击即可,其中这些组件是为了方便调用各种 APP 接口,比如百度搜索、百度地图等而进行的工具化措施。智能体连接不同 APP,但 APP 之间的数据不会交叉,对于开发团队来说,APP 就像是黑盒工具。
另一类则是工作流智能体(有套路版),主要用于解决复杂场景问题,这类智能体对流程是高可控的,比如将客服、营销流程分成三大步,每步里面又分三小步,每一小步遵循哪些 SOP 等都有大的流程框架,但具体怎么沟通留给大模型发挥。
“做智能体比较好的都在研究工作流,因为工作流相当于智能体技术突破到真实的 AGI 状态之前的中间态,而这个中间态是必不可缺的。”朱广翔强调。
而在多智能体的发展上,百度自己也推出了代表产品,即明年第一季度发布的秒哒,这是一个由大模型和智能体组成的全新软件,李彦宏称其为“迄今为止人类历史上最复杂的多智能体协作工具”。
在李彦宏演示的“给萝卜快跑新技术发布会打造一个活动邀请系统并把邀请函分享给他人收集反馈”的案例中,共出现了 5 个智能体,其中 0 号智能体是小组长的角色,作为整个智能体团队的核心,负责规划调度;1 号智能体是策划智能体,负责对任务进行更进一步的拆分;而随后出现的 2 号智能体、3 号智能体、4 号智能体分别担任了编辑、程序员、质检员的角色,2 号智能体写文字内容,3 号智能体写代码来制作网页,4 号智能体则负责检查 3 号智能体写的代码是否存在 bug、能否跑通等。
实现上述操作的背后是多智能体要有不错的自主感知、学习、决策和行动能力,具体效果要等到上线后验证了。
千帆 AppBuilder 开发流程
商业模式与分发
创建好智能体,接下来是如何用智能体赚钱的问题。
目前百度生态中,智能体盈利模式依然是高流量带来付费转化的方式。比如情感咨询领域的若涵老师智能体,既为用户提供免费咨询,也支持 1 对 1 付费人工服务,并且通过情感智能体专属的打赏功能已收获了许多用户的有偿咨询,反过来进一步拓展了自身影响力。
具体看,智能体的开发者们开发完后如何才能获得流量?如何才能获得更多的流量呢?对于第一个问题,百度是靠智能体分发平台进行流量分配。智能体分发平台无法依靠传统的匹配逻辑来实现分发。“我们可以把智能体当成一个‘数字人’,分发的核心就变成为这个‘数字人’找到合适的‘工作’。”百度智能体业务首席架构师黄际洲介绍道。
智能体分发系统是基于大模型的生成式系统,模型的输入主要包括四部分:用户的需求表达、智能体分发池、理解与评价信息,以及给大模型设定的多目标打分指令。
具体说来,首先对智能体进行理解和评估,包括对智能体的基础能力和其领域能力的全面刻画,如智能体擅长什么领域、能解决哪些类型的需求等;接下来,对智能体的能力进行全面评估,核心是看它能否针对特定领域问题给出优质回答;完成理解和评估后,系统会给出基本的评价结果,以此决定智能体是否符合进入分发系统的条件。这些工作完成后,用户在百度搜索中输入 Query 后,分发系统就会基于智能体的综合能力维度与用户需求的匹配情况,最终将符合条件的智能体展示给用户。
在百度搜索“旅游攻略”,页面下方有相关主题的智能体推荐。可以看出,同领域的不同智能体之间有着不同的使用量。
那么,如何才能获得更多的流量?百度目前的做法是提供新人扶持和优质加权,同时推出了聚合 & 推荐的产品形态。
百度正在构建一个普惠的流量扶持机制,所有新的智能体,只要内容优质就能获得更多分发机会。而在普惠性的冷启动流量之后,表现不佳的新智能体会被逐步淘汰,效果良好的新智能体则会进一步获得流量加持。
黄际洲介绍,百度会重点加速分发以下三类优质智能体:高轮次、高留存以及高转化。高轮次的智能体表明用户有强烈的互动意愿;高留存的智能体表明用户持续多次使用、复访意愿强;高转化的智能体表明用户愿意为之付费。这代表着平台的导向:不要求智能体在每个领域都能表现出色,只需在某一个领域上表现突出,就有机会获得更多流量。
智能体聚合方面,百度选择将多个智能体的回答聚合展示,使用户能在一个地方同时获取多个智能体的优质回答,从而提高信息获取的效率和全面性。与此同时,通过用户与智能体的真实互动和反馈,分发系统也可以更精准地筛选出表现优异的智能体,给其更多流量机会。智能体推荐方面,百度则为用户推荐最能解决其问题的多个智能体,通过多轮对话帮助其逐步获得所需信息或服务。
根据介绍,通过以上分发策略,平台分发量级实现了大幅度增长。与年初相比,总分发量上涨了 16 倍,有分发的智能体数量更是增长了 22 倍。相较今年 7 月,有变现的智能体涨幅接近 4 倍。
此外,百度推出了“智能体代表作”功能,开发者要首先构建一个集成了行业知识和专家经验的智能体,然后平台会自动基于该智能体为多个不同的问题生成答案(百度内部称为智能体 GC),作为创作的底稿。开发者可以对这些底稿进行审阅和编辑,例如优化内容、添加图片等,以此创作出能够展示智能体能力的代表作。
文心智能体平台上有五大商业组件功能:链接挂载、商品转化、线索转化、联盟广告和胶囊位组件,其中胶囊位组件提供付费支持,联盟广告可以赚取广告分成。根据官方数据,文心智能体平台已有超过 10 万个智能体应用了商业组件,与今年 7 月相比,实现收入转化的智能体数量增长了 395%,单个智能体的单次转化最高收入达到了 10 万元。
结束语
“我们现在的应用客户里九成是 RAG,一成是智能体。” 朱广翔表示。但他预测,明年和后年智能体会逐渐超过 RAG 应用,因为 RAG 场景比较少,但是智能体可以实现客服、营销、企业调度、一站式平台,它的天花板更高。
未来,在智能体上下大注的百度如何将智能体价值最大化发挥出来,我们拭目以待。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有