应用驱动是AI发展的第一性原理

应用驱动是AI发展的第一性原理
2024年11月26日 00:01 任泽平

文:任泽平团队

1、 AI应用驱动下一轮洗牌:跨越AI发展冷静期,发展AI向实

人工智能领域正在进入大模型浪潮以来第一段“冷静期”。

一方面,OpenAI的下一代语言模型Orin遭遇重大瓶颈,效果不及内部预期。其2024年初主推的多模态模型Sora的发布日期也持续推迟。

另一方面,AI行业的“Scaling Law”似乎正在失效,大模型的性能不再随着参数量、数据量、计算资源的增加而产生指数提升。

AI需要新驱动力,应用驱动将成为第一性原理。进入“冷静期”符合行业发展的规律,就像历史上许多次技术浪潮一样,在度过最初的高期望阶段之后,泡沫不可避免产生。当技术没有达到高期望时,行业会进入一段冷静期,等待新技术和应用变革带来大洗牌。

2、 海外和中国两条路线发展,以AI应用殊途同归

海外AI发展曾经以技术驱动,实现AGI(通用人工智能)等同于实现AI企业的终极商业价值。ChatGPT让产业界看到了以AGI为目标的技术驱动的潜力,但经过两年发展,行业意识到AGI仍然遥远,纯技术驱动还不具备客观条件。海外AI巨头在2024年逐步调整方向,开始以应用开发、产业结合为当前阶段重点。OpenAI转向盈利性商业化运营,谷歌、微软等都开始以To C、企业端、开发者社区合作为聚焦点。

中国AI发展特点是应用驱动。2023年ChatGPT浪潮掀起“百模大战”,积累了早期中国AI市场基础。根据《全球数字经济白皮书》,截止2024年11月,中国的大模型数量高达478个,约占全球总数量的36%。中国市场投入大量资源开发基础大模型,在一定程度上导致AI深层技术发展整体滞后。但另一方面也提高了生成式AI的社会认知和接受度,进而促进个人和企业去关心AI产品与市场的契合度,打下了应用驱动AI发展的“弯道超车”基础。

原生AI企业是推动行业技术进步和产业化的引擎。2024年11月,沙利文发布《2024年全球AI生态全景概览》,其中原生AI巨头有谷歌、百度、OpenAI三家。通过原生AI企业的技术、产业创新实现“冷静期”跨越有迹可循。比如,谷歌在2017提出了Transformer架构,成为推动预训练模型进化为大模型落地的最关键技术。2023年OpenAI发布ChatGPT,通用大模型首次进入公众视野,唤醒沉寂多年的AI赛道。2024年百度世界大会召开,开创性主张“AI应用向实”,中国AI发展正式进入弯道超车阶段。

3、 重视AI行业的“新三要素”:幻觉消除、开发加速、智能体发展

3.1 大模型欠缺真实感,消除智能幻觉是首要任务

大语言模型(Large Language Model)中的“幻觉”现象指的是模型生成的内容虽然看似合理,但实际存在事实错误;或者AI生成的文字、图片、视频在直觉上不符合人类认知,欠缺真实感。“幻觉”主要有逻辑谬误、捏造事实、数据偏见三类。通常是因为模型的推理能力欠缺,算法框架存在漏洞,数据压缩、数据不一致性等原因导致。

多模态大模型领域兴起,图像、音频、视频类模型也出现幻觉现象。比如,OpenAI的Sora大模型虽然在视频生成领域表现优异,但也存在生成的视频违背物理规律,时空关系错乱等情况。这也是正式版Sora无法上线的主要原因之一。

业内解决“幻觉”问题的方式是采用RAG技术,(Retrieval-Augmented Generation)即检索增强生成,通过结合阶段和增强生成,减少学习数据中的“负样本”,以此来减少大模型的幻觉现象。但这也仅限于在LLM领域。在多模态领域,百度开发了基于图像的iRAG(Image based RAG)技术,将搜索引擎的亿级图片资源与文心基础模型能力进行结合,在强化学习生成下,输出各种真实的图片,整体效果远超传统的“文生图”的原生系统,有效的消除了“AI味”。未来,以iRAG技术为代表多模态RAG将成为业内缓解AI“幻觉”现象的主要方向,为更成熟、更真实的多模态应用发展提供更准确的能力。

3.2 编程AI应用加速行业走向下个爆发奇点

AI编程应用将加速AI迭代进程,赋予企业和个人更强的开发能力。全球AI企业已经进入“效率时代”,由于软件应用开发的成本高、周期长,算法工程师昂贵且稀缺,通过开发辅助编程AI来提高开发者效率、缩短开发周期成为方向。

一种是企业内部用AI直接辅助开发任务。比如,亚马逊将Amazon Q用于公司内部的软件升级任务,为其节省了相当于“4500 名开发人员一年的工时”,并且还提高了准确性和安全性,降低了基础设施成本。

或是与开发者社区联合开发编程AI助手,提高个人写代码效率。比如,GitHub Copilot由GitHub、OpenAI和微软Azure团队联合推出,可以提供代码建议和自动补全功能,帮助开发者更快地编写代码。

甚至是直接省去人工代码步骤,由AI完成开发全流程2024百度世界大会发布的“秒哒”是里程碑式的开发工具,不同于前两种辅助编程工具,使用秒哒不需要任何代码能力,通过自然语言就能实现软件开发,人人都将拥有程序员的能力。其实现是通过将任务拆解成核心需求、内容结构、工程开发、数据需求四个步骤,再采用多个智能体协同来完成,这也是迄今为止,最复杂的多智能体协作工具。以后随着基础模型能力提升,以及智能体本身的技术能力迭代,秒哒将能完成更复杂的开发诉求,实现系统级开发能力。

百度在AI编程应用上迈出的这一步不仅消除了未来成为开发者的门槛,更是对AI时代商业模式的一次革新这意味者实现商业创意或不再需要组织人员架构,智能体就能充当项目经理、设计师、开发工程师,凭借AI工具和创意,个人就能开发产品和创造商业模型。

3.3 智能体是LLM的进化,是可以反思、进化、使用的工具

智能体会变成AI时代内容、信息和服务的新载体,是下一个爆发点。大模型是AI应用的初期形态,具备一定的通用性,但在深度方面欠缺。大模型作为应用发展的下一步是智能体(AI Agent),不但能基于LLM进行任务推理和解决,还具备记忆、规划功能和更强的自我学习能力,并且能使用特定的行业知识完成更复杂、更高质量的任务。

第一类具身智能体(Embodied AI),典型代表有智能驾驶汽车、通用人形机器人。如英伟达CEO黄仁勋所言,具身智能体是AI进入物理世界的超级智能形态。L3以上的高阶智能驾驶是第一步,目前以国内的百度Apollo和美国的特斯拉RoboCab为代表。第二步是通过自动驾驶的大范围应用铺开,积累智驾算法的数据和经验,再构建虚拟环境去训练人形机器人算法,帮助其实现量产落地。比如人形机器人领域领先的特斯拉Optimus,采用的就是其FSD智能驾驶算法。

第二类是平台智能体(Platform AI),为工具、企业、角色、行业、产业等提供AI赋能升级和定制化解决方案。

工具智能体,在个人的工作和兴趣应用场景中拥有强大的创造力和价值,将成为AI界的新质生产力代表。如AI写作、Canva设计助手、logo生成器等等,都是典型的代表。工具智能体的核心在于AI的“自由性”——能通过连接公域(公开数据、搜索引擎内容、社交平台内容)和私域(个人数据、音频、图像、文字)来生成符合用户期望的内容,解锁“创造性”和“独特性”。比如,百度发布的自由画布就是由文心多模态大模型加持的创造力工具,具备输入自由、编辑自由、创作自由三大属性,覆盖从创意绘画、AI写作到专业报告领域等使用场景,帮用户完成从找资料、到编辑、再到生成和分享的全部任务。

企业类智能体相当于人工智能时代的公司官方AI,具备官网+服务一体的系统化能力。由于传统的企业官网通常信息庞杂、专业术语难懂、视觉观感上易疲劳,检索方式复杂、服务效率较低,已无法满足用户的需求变化。而AI企业智能体则具备了定制化推荐、及时化响应、高效化服务的能力。在汽车零售领域,比亚迪官网是成熟的企业智能体案例,对于不懂术语的用户,智能体能像人类客服一样为用户找出匹配的参数,一键式提供清晰明了的对比,省去手动筛选步骤,给出符合用户期待的建议。

角色类智能体,也就是AI数字人,拥有自己的背景、设定、知识库。可以是基于现实真人、特定职业进行在线服务的AI角色,也可以是虚拟角色。以往的虚拟数字人,大部分存在声音口型不匹配、肢体动作机械、神情呆板等问题。在LLM和多模态的技术加持下,角色智能体能呈现出更高度拟人化的表情、神态、情感。可以充当辅导老师,健康咨询师,网络娱乐主播等,通过与人互动提供知识和价值。实际上,当前的数字人直播在许多场景下已经超过真人直播的转化率,具备可观的商业价值。

行业类智能体,为用户打破信息不对称,提供对应领域的专业服务,在法律、医疗健康、金融、体育、旅行等领域潜力巨大。比如,法律行业的智能体——法行宝就是普通人的专业法律助手,从案件分析、条文引用、赔偿计算、诉讼起草,实现了全流程免费服务。上线半年多以来,百度推出的法行宝为940万多人提供了高效、可信的法律服务。

产业类智能体,为不同产业中、不同分工的公司,提供商业决策中各环节解决方案。比如,餐饮产业的选址和售后服务是两大难题。国内的餐饮龙头百胜集团选择与百度合作,基于大模型能力进行选址评估,提高了上千家门店的选址效率与销售效果。初期的赋能成功后,百胜又对全线业务进行了数字化升级,大模型每天调用量的峰值达到数百万,AI客服的问题解决率提升到了90%。为传统行业转型提供AI升级,还只是产业类智能体的应用探索第一步,未来随着模型学习能力更具深度,数据训练更庞大,产业类智能体甚至有潜力成为公司战略的核心决策者

4、 立足于AI浪潮之中:理想主义、聚焦人才是AI进步的引擎

科技进步的原力是理想主义,前沿的技术浪潮最早都是由少数个人的理想主义来推动的,这一点在AI领域尤其突出。2024年的诺贝尔物理学奖颁给了约翰·霍普菲尔德和杰弗里·辛顿,一方面表彰两位学界先驱对于AI理论研究和产业化的贡献;另一方面,是对两位在深度学习路线受到冷落的30余年,仍然坚定该研究方向的理想主义精神致以敬意。

30年来,推动美国AI产业发展成型是学术界的辛顿团队和产业界的微软、谷歌团队,将这一成果转换为商业化浪潮的是OpenAI和英伟达。其背后根本是以辛顿、伊利亚、苏莱曼等为代表的学者和以马斯克、奥特曼、黄仁勋为代表的企业家以个人理想主义推动行业进步。

中国的AI产业发展和未来趋势亦是如此,有AI理想主义的企业家是推动行业进步的关键。早在2012年,李彦宏就瞄准人工智能领域,率先意识到AI发展的转折点到来,发起计划收购刚完成AlexNet的辛顿团队。该团队中还包括了后来的“ChatGPT之父”伊利亚·苏茨克维。彼时参与拍卖的还有谷歌、微软、DeepMind,而百度在竞标中一直出价最高,直涨到4400万。尽管因为辛顿的身体条件等原因,最终未能与百度合作,但这场改变人工智能革命的舞台上,中国企业的世界眼光和视角高度让AI学术界感叹。“AI教父”、深度学习发起人之一杨立昆感叹:百度是最早部署商业化深度学习系统的大型公司之一,甚至领先于谷歌和微软。

十年来,李彦宏作为企业家一方面将百度的十年布局聚焦在AI领域,另一方面作为个人也在不断传播他的理想主义,无论是对国家领导、企业家、媒体,还是对朋友、学生、极客,他从不放过任何“布道”AI的机会。在连续8年的“两会”中,李彦宏提出了13份AI相关提案。在坚持十年的“布道”和产业落地中,越来越多的企业也看到了AI技术的价值并开始重视对AI的投入,互联网科技公司转向发展人工智能的信心也更加坚定。

AI理想主义从理念到落地,根基是聚焦人才培养。2013年,李彦宏组建了成立百度深度学习实验室,担任院长。这是世界上首个以“深度学习”命名的企业级实验室。至此,中国AI领域开始招贤纳士,打稳根基,踏上10年的探索之路。2014年,谷歌猫牵头人吴恩达加入百度深度学习,担任首席科学家,负责百度大脑项目,培养了众多中国AI界的核心技术骨干。2017年,王海峰接棒吴恩达,搭建AIG(AI技术平台体系)后来发展为深度学习技术及应用国家工程研究中心。2023年,王海峰发布百度人才培养星河计划,宣布为社会再培养500万大模型人才的愿景。

十年来,百度不但实现从0到1的AI技术人才骨架逐渐成型,打稳了中国AI发展的人才基本盘,也让人工智能的理想主义队伍不断壮大,为中国AI行业在下一次变革性浪潮中做好了准备。2021年,李彦宏在致股东信中提到:“百度有定力,有耐心。因为我们深知,最前沿的技术浪潮是等不来的,你必须提前10年、20年去布局”。当下看,不仅提前10年布局的百度做到了生态领先,中国AI行业也做到了立足于全球人工智能的大浪潮中。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部