AI原生时代,李彦宏的两张王炸

AI原生时代,李彦宏的两张王炸
2023年10月18日 18:09 秋水笔弹

记得星标关注呀,在这里抽刀断水,看清水面下的科技商业暗流。

商业世界的价值链重新排位,AI冠冕,未来十年,是每个个人、企业、国家都不能错过的十倍速变革机遇。——水哥

今天街知巷闻的明星概念GPT背后的算法内核——人工神经网络算法,可以追溯到20世纪50年代,但是经历了漫长的寒冬,研发进展缓慢得近乎停滞。

直到2012年春夏之交,辛顿和他的两名学生取得了突破:他们证明了,神经网络能够以超越其他任何技术的精度识别常见的物体。他们在那年秋天发表了一篇9页的论文,并向全世界宣布,这项技术就像辛顿长期以来所宣称的那样强大。

几天之后,辛顿收到了一封电子邮件,邮件来自百度。为了招募辛顿团队,百度参与竞拍,给出了优厚的条件,虽然,因为个人腰椎问题无法长途跋涉,辛顿最终选择了美国的谷歌,而非百度,但是百度已经意识到深度学习的重要性。

在过去的10年里,深度学习改变了人工智能,也改变了世界。参与那场竞拍的大部分人今天都还活跃在科技的舞台上。2019年,杰夫·辛顿获得了计算机领域的最高奖——图灵奖。他的两名学生之一是Alex Net最主要的贡献者,另外一名学生后来与马斯克等人联合创立了今天已经名声远扬的OpenAI。

就在上个月9月7日晚,《时代》周刊发布了首届全球百大AI人物,百度创始人、董事长兼首席执行官李彦宏、Open AI CEO萨姆·奥特曼同时跻身全球AI领袖。《时代》肯定了李彦宏对AI的长期投入及百度在AI方面取得的多项成就,“李彦宏是中国最杰出的未来主义者,长期投身于AI发展的浪潮”。

在今年年初与AI浪潮一样如同病毒一样迅速流行开来的一本书《深度学习革命》以这个百度掀起的AI项目收购竞拍故事作为开篇,以OpenAI的通用人工智能信仰作结,写出了掀起深度学习革命浪潮的群像,其中来自中国的AI公司百度,从一开始,就站在浪潮之巅,这也成为了中美人工智能产业长期角力的开端。

一、十年坚持,一直到战略性转折的出现

早在2018年,李彦宏就已经登上过一次《时代》(亚洲版)封面。封面里,李彦宏看向远方,最左侧是两个硕大的英文单词:THE INNOVATOR(创新者)。

《时代》杂志肯定了李彦宏和百度在人工智能领域的投入,以及这些投入对于中国科技事业追赶硅谷步伐的意义,称其“正帮中国在21世纪赢得胜利”。当时,中美两国人工智能技术和产业发展之间的差距正在快速缩小,中美被认为是全球人工智能的“两极”。

但是2018年的AI产业却被卷入了质疑声的漩涡当中。AlphaGo带来的振奋已经是两年前的事情,商业化依然看似遥遥无期,多年停滞不前的人工智能开始被嘲笑为人工智障;Uber AI前负责人、AI专家Marcus在这一年发表了长达27页的论文质疑深度学习,AI的方向是不是就错了?一时间愁云惨淡,笼罩住了人工智能的前途。

沧海横流方显英雄本色。悲观情绪迅速蔓延,行业从业者开始踌躇不前,甚至挥袖离场,李彦宏作为AI技术的信奉者与布道者的本色,开始逐渐水落石出,在过去的许多年,AI产业屡屡陷入低潮,但李彦宏对 AI 的信仰从未改变。百度在 AI 技术上的追求一直是国内顶尖,技术人员的投入上也是国内最前列。

《纽约时报》知名科技记者凯德·梅茨(Cade Metz)生动翔实地讲述了这段历史:一群少数派学者,在长期不被主流学术圈认可的情况下,坚信深度神经网络会改变世界,终于推动了人工智能技术在语音识别、图像识别、自然语言理解、博弈论、生物制药、搜索、推荐和自动驾驶等诸多领域取得改变世界的突破性进展。

在李彦宏基于前瞻性战略的推动下,百度也走过了十多年不被主流商界所认可的道路,坚定推动中国人工智能产业的发展。

从新技术产品投入生产到大规模产业化之间的鸿沟被称之为“达尔文之海”,在事后诸葛亮看来,李彦宏赌对了,非常幸运地抓住了GPT的风口,跨越了 “达尔文之海”,但是事实上并非如此,企业家的创新精神,才是跨越这个死海的唯一方舟。

在经济学家熊彼特看来,经济的繁荣本身,就是企业家批量出现,所推动的商业创新的繁荣。

在水哥看来,硬件条件从来不是决定一个企业竞争力的第一要素,相反,拥有具备创新的精神、愿景以及信仰的企业家才是一个企业的首要竞争力。

所谓英雄所见略同,李彦宏似乎也是这么看的,在全球供应链不稳的背景下,很多人以为算力会是制约中国人工智能发展的核心因素,但是其实不然。李彦宏在今年5月4日的一次内部演讲中提到他最近看到的一个数据:“说全球算力规模,美国占34%,中国占33%,算力差不多。我要说的是,算力不能保证我们能够在通用人工智能技术上领先,算力是可以买来的,创新的能力是买不来的,是需要自建的。”

创新愿景的的落地,有赖于长期的团队能力的建设。如果你等到GPT出现,再去学深度算法,招募人才,当然黄花菜都凉了。所以李彦宏也说,即使是五年、十年见不到什么商业的回报,“但如果你觉得它在更长的时期内能够会对这个社会、对人们产生一个正向的影响的话,我们还是能够做得起。”

厚积薄发,才是创新唯一的终南捷径。2020 年 GPT-3 火时,除了学术圈,没有太多人关注到这项技术的价值,但百度仍分配了大量资源给文心团队。2022 年年底 ChatGPT 爆火后,人们争先恐后宣布研发大模型,百度已率先发布大模型成果。

百度此次甩出文心4.0和AI原生应用两张王炸,在行业还在“卷大模型”时就率先冲线,卷出十几款AI原生应用,在快鱼吃慢鱼的时代,已经领先了很多还在踌躇不前的企业。

二、 “AI教父”背后的中国人工智能技术骨架

2020 年的《致股东信》中,李彦宏称,百度是一家技术公司的另一含义是:百度培养技术人才,并输出技术文化,让更多企业看到技术的价值,并重视对技术的投入。多年来,百度坚持在深度学习、对话式人工智能操作系统、自动驾驶、AI 芯片等前沿领域投入,搭建起了中国互联网的技术骨架,这是一件意义非凡的事情。“当你去翻一翻各大互联网公司CTO的履历时,可能会发现他们中许多人都曾经在百度工作过,经历过百度技术文化的历练”,提到这一点,李彦宏显露的更多是自豪而非失落。

搜索与广告是百度的支柱业务,主要涉及文本信息检索与推荐,与自然语言处理等技术的终极追求天然契合,这让李彦宏意识到,人工智能技术可以解决搜索问题,并带领百度在搜索基础上实现了自然语言处理、图像、语音等 AI 技术的突破。他认为,最前沿的技术浪潮是等不来的,必须提前 10 年、20 年去布局。

过去十年,百度如同一块强力磁石,引来群星璀璨的人工智能人才,向全球招揽知名人才,给予高规格的待遇。百度研究院历来的掌舵人,CTO王海峰,都是 NLP 领域的科学家。

但是这样还不够,要长远发展,必须形成有层次的完整的产业人才梯队。所以,李彦宏创立百度之初,曾希望像硅谷一样招5年左右工作经验的工程师加入,但当时中国市场上还没有能为互联网所用的技术人才,只招到了清一色的毕业生。这也倒逼百度形成独特人才培养“熔炉机制”。除了成名的资深专家,百度还启动了“少帅计划”,面向全球招募人工智能领域 30 岁以下的年轻研究人员。

也正是因为李彦宏对AI的长期投入,百度培养出王海峰、吴甜、吴华等一批内生性AI人才,让百度成为中国AI人才高地,本次《时代》周刊评选百大人工智能人物中,吴恩达、Dario Amodei 等人也入选其中。

百度内部的一批技术人才纷纷成长成为NLP、语音、深度学习等诸多AI领域技术专家,至2023年,信通院调研报告显示,百度以85.5分超越其他企业和各大高校,位居“AI产业创新人才”全国第一,在预训练大模型、深度学习、自然语言处理等七大领域均排名第一。最近五年,百度 AI 人才的 AI 专利申请量和授权量连续五年位居全国第一。

百度之所以能第一时间推出“文心一言”,也和其在算法、人才以及硬件基础各方面的长期积累是分不开的,百度在芯片、框架、模型、应用四个层面做到全栈布局。后来,这一由百度首创的概念成为业内主流的技术趋势。

正是在这些前瞻性布局的基础上,文心一言破石而出,一鸣惊人。根据第三方机构IDC发布的《人工智能大模型技术能力评估报告,2023》,文心大模型3.5拿下12项指标的7个满分,综合评分、算法模型和行业覆盖都排名第一。在AGIEval、C-Eval等中英文权威测试集和MMLU英文权威测试集中,文心大模型3.5也取得了超过ChatGPT和LLaMa、ChatGLM等其他大模型的分数表现,在中文评测中甚至有超越GPT-4的表现。

聚是一把火,散是满天星,十余年来,百度研究院为百度和 AI 行业培养出了数千名 AI 领军人物百度CTO王海峰在今天百度世界大会现场还公布了百度AI人才培养的最新数据。百度在2020年提出5年为全社会培养500万AI人才,截至目前,百度已经培养了420万AI人才。王海峰发布了百度人才培养星河计划,他表示,“我们将与产学研各界密切合作,深化产教融合,为社会再培养500万大模型人才,让人工智能科技的‘创新之花’,结出更多‘产业之果’”。这种人才培养体系,也为中国人工智能产业的发展与创新提供了坚实的人才基础。

三、互联网重新排位,百度以多重先发优势,独占鳌头

离数据、算法、算力最近的百度、谷歌依然是AI新技术浪潮的的发源地,也依然是今天AI浪潮当中举足轻重的参与者,百度更是以其多年的技术积累,商业应用以及产业实践,成为了中国这次AI浪潮的引领者、思想发源地以及技术高地。

但是并非所有鸭子都会提前预知并且等到春天的到来。

36氪最近对李彦宏的专访提出了这样一个问题:你曾说过百度是在全球大厂中第一个发布类ChatGPT产品的,领先于微软,因为微软调用的是OpenAI的接口,META、Google没有发布真正同类型的产品,为什么会这样?其实大模型这件事并不是巨头想做就能做。李彦宏表示,生成式AI,你提一个提示词,它根据提示词发挥,甚至发挥错了都有可能,这个方向早期并不被大厂看好,积累也没有特别深厚。

另外,搜索业务与自然语言处理技术的孪生关系也决定了百度与谷歌的早期优势,2018 年,谷歌大脑团队开启了全球 NLP 的预训练语言模型时代;2019 年,百度紧随其后,发布中国最早的预训练语言模型成果,为后来文心大模型的研发奠定了基础。

相比ChatGPT姗姗来迟的多模态能力,百度文心一言的文生图能力在推出时间上来看,是遥遥领先的,这也是李彦宏颇为自豪的百度优势,在他看来,文生图能力,是百度打磨多年的结果,从这个角度看来“ChatGPT落后百度,文心一言早就有这个能力了”。如今,百度最新发布了文心大模型4.0,已不逊于GPT-4。

百度的竞争力与信心是建基于多年来对于应用层、模型层、框架层、芯片层四层端到端的投入与优化,大语言模型才能够有竞争力,芯片、框架等等这些都加起来的话,百度十年投了上千亿元。如果没有那些投入,根本就不可能出现文心一言这个模型。芯片层,百度有昆仑芯;框架层,百度有飞桨;模型层,百度有文心大模型;应用层,百度基于文心开发了文心一言,重构了如流、搜索、地图、网盘等等产品。

IT 时代,技术栈由芯片层、操作系统层与应用层三层组成,而 AI 时代则变为芯片、框架、模型、应用四层,百度是全球少数全栈布局与自研的科技企业,这些都奠定了百度深厚的技术优势。

如果说过去百度对生成式AI长期投入以及多层次软硬件能力的建设,早已经与其他大厂拉开了差距,今天百度依然在持续强化这种相对优势,在今天(10月17日)的百度世界2023上,百度首席技术官王海峰表示,文心大模型4.0的理解、生成、逻辑、记忆四大人工智能核心基础能力都有显著提升。

其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。

此外,为了解决让业界头疼非常的大模型推理黑盒,以及输出幻觉问题,文心大模型4.0在输入和输出阶段都进行知识点增强。在搜索引擎、知识图谱、数据库中查找准确知识,最后把这些找到的知识组装进Prompt送入大模型;另一方面,对大模型的输出进行反思,从生成结果中拆解出知识点,然后再利用搜索引擎、知识图谱、数据库,以及大模型本身进行确认,进而对有差错的点进行修正。这些都大幅提高了大模型输出的准确率以及效率。

在强大的基础大模型的基础上,百度进一步研制了智能体机制,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并一定程度上将思考过程白盒化。

文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了近30%。训练算法效率自3月以来已累计提升3.6倍。文心大模型4.0基本技术架构与3.0和3.5版本一脉相承,并在多个关键技术方向上进一步创新突破。

这种体系化的技术领先优势,也已经巩固为百度在大模型产品在消费者市场以及应用生态方面的竞争优势。8月31日文心一言面向全社会开放至今,用户规模已经达到4500万,开发者5.4万,场景4300个,应用825个,插件超过500个。

四、李彦宏带领百度全速前进:AI原生时代,应用生态耸起为战略高地

到今天,很多业内人士都已经认同,未来十年内,AI原生应用当中,将会诞生10倍于微信、抖音app价值的机会。

今年上半年,美国诞生了超过1000家AI创业公司,绝大多数都是在应用层,市场上已经涌现出了非常成熟和受欢迎的原生应用,比如说机器人律师DoNotPay、设计工具Stability AI、Midjourney、在线语言学习平台Duolingo等等。

在落地AI原生应用层面,移动支付、搜索、电商、共享单车、外卖、快递、医疗,都可以进行AI化。应该清醒认识到,无论是AI时代,还是移动互联网时代,美国都依然扮演着技术引领者的角色。但从应用层面,在广阔的市场优势加持之下,中国已经拥有了与美国平分秋色的实力,特别是在移动互联网时代,甚至已经开始向海外输送影响力以及服务。

中国企业逆转形势的机会,依然是在应用层面,但是这个机会也是有时间窗口期的,这个机会建立在,大模型基础研发上不被美国拉开代差的基础之上。

在百度世界2023上,李彦宏宣布,文心大模型4.0正式发布,并开启邀请测试。这是迄今为止最强大的文心大模型,它实现了基础模型的全面升级,理解、生成、逻辑和记忆四大能力,都有了明显提升,综合水平与GPT4相比已经毫不逊色。这四大能力是一切AI原生应用赖以生存的基础。同样,没有构建于基础模型之上的丰富 AI 原生应用,大模型就一文不值。大模型的竞争,已经从参数之争,逐渐演变到以人工智能应用和产业落地为主的生态之争,向外部提供大模型全栈能力也是百度的更大的机会跟战场,应用开发者开始成为了决定行业走向的关键先生。

李彦宏年初已经表示,“百度正在用AI原生思维重构所有的产品、服务和工作流程,百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构。”简单点说就是,AI原生应用不是简单地重复一下在移动或者PC时代的软件,而得是以AI交互逻辑原生的应用。他提到“AI原生应用”,有点类似“云原生”:AI原生应用应该满足三个条件,用自然语言交互,能充分利用理解-生成-逻辑-记忆四大AI核心能力,以及,每个应用交互不超过两级菜单。

最高层战略快速被传递到业务线的每一个人。百度旗下包括百度文库、百度搜索、百度输入法、百家号和百度地图等产品已经开始大模型能力重构之旅。百度移动生态内部正在进行一场“赛马”运动,让用户投票,哪个产品用户量大、留存长,就加大“重构”的投入力度。

从今年3月开始,百度团队和外部客户加紧大模型共创。为了繁荣开发者生态,抢占市场先机,李彦宏在10月17日的百度世界大会做演讲,演讲主题是他自己定的——“手把手教你做AI原生应用”。这很显然是面向开发者发出的邀请信号。

作为百度年度最重要的战略、技术、产品发布会,百度世界大会自2006年以来已连续举办17年,今年10月17日举办的百度世界2023的核心只有一个,那就是AI原生应用和AI原生思维,主题为“生成未来 PROMPT THE WORLD”看,更重要的是这场发布会带来了超20款AI原生应用,是观察中国头部AI公司在原生应用进展与分享产业思考的重要场合。

从这个大会披露的核心内容来看,百度整个人工智能战略路径已经非常明确,同时进程也已经全面提速——在推出综合实力强劲的大模型基础上,携手广大开发者,形成平台型的应用生态优势,同时通过以AI重构百度产品,探索全新的AI产品形态,扩大自身产品梯队,带来了20多款AI原生应用,通过加快应用开发,淬炼技术能力、方法论以及市场竞争力,同时向外部输出人工智能方案、产品以及技术,进一步扩大强化其产业基本盘,强化云计算以及各种传统产业的竞争优势。

可以说,生成式AI与搜索是天作之合。搜索,虽然还是从那个简单的框开始,但接下来的一步步,都已超越、重构了原来的搜索模式,不仅提升了搜索质量,而且突破了搜索的应用范围、扩大了产品边界。

这也是首个AI互动式搜索APP,将引领搜索行业的代际变革, AI重构后的搜索,有三大新能力——极致满足:更准确理解意图,给出最佳回答;推荐激发:搜索在满足用户需求后,会优先推荐优质个性化的内容流,激发用户探索和需求;多轮交互:搜索会总结全网优质内容,与用户多轮交互逐步明确用户需求。

百度世界2023还发布了全新的国内首个生成式商业智能产品——百度GBI。百度GBI(生成式商业智能),支持通过自然语言的对话式交互,执行数据查询与分析任务,为企业客户建立“对话即洞察”的数据分析新范式。更重要的是,它可以把商业分析师十几天才能完成的数据分析、撰写报告的工作,缩短到分钟级。时间就是金钱。

除了这些,百度还做了非常多的产品探索,譬如,百度文库基于对10亿优质文档的理解,写出真正实用、清晰的文稿,完成了从“内容工具”到“生产力工具”的进化。重构后的百度地图,不只是导航,更是出行向导。

这次全新推出的百度网盘“云一朵”是业界乃至全球首个个人云智能助理。截至10月17日,云一朵用户已经达到2000万。

中国和美国研发的大模型数量占全球总数的80%以上,中国与美国从大模型的彼此角逐来看,是各有胜场的,但是从应用端来看,特别是基于AI逻辑重构的原生应用生态,中国还是相对薄弱很多的,这一点中国巨头也显然有着清醒的认知,并且正在这个领域重点发力,其中百度已经发布了50多个AI原生应用,在百度世界2023上面更是带来了20多个原生应用,表明中国在AI应用领域同样有着不可小窥的广阔潜力。

五、更多行业降本增效,对全球竞争格局影响深远

今天AI已经显然对各行业都已经产生了广泛的影响,在生产力这方面已经所向无敌。

2023年6月,百度营销发布AIGC商业创意平台“擎舵”,通过多模态内容生成 ,突破创意生产力瓶颈,可轻松实现文案生成、图片生成和数字人视频制作三大创意生产能力,为客户在营销过程中提质增效,重构商业营销生态。2分钟生成100条创意文案,3分钟生成一个数字人建模,5分钟即可制作一支完整的数字人口播视频。文本创作专注于营销场景,创意文案制作效率提升1000倍。部分行业转化成本下降20%+,制作效率从2天到分钟级。

可以看到,内容创意产业已经出现了广泛、深度的变革,生产成本降低到接近于零,对于整个社会生产力的提升是不可估量的,其带来的商业空间,也同样不可估量。

除了创意产业,在中国具有更为广袤的市场空间的,非制造业莫属。

很显然,李彦宏已经盯上了云计算这块大蛋糕,而且正在驱动百度的全面AI化,试图撬动整个市场的竞争格局。

在他看起来,目前的自身公司的应用,只是整个AI故事的极小一部分,更大的故事其实是在云计算。芯片层也发生了变化,从CPU到GPU,在框架层也发生变化。百度在芯片层、框架层、模型层、应用层每一层都可以说是提早了很多年来布局,“当你这些能力都很完整的时候,未来人们再去开发应用,基于百度智能云是最方便的。”,让李彦宏真正兴奋的正是这个机会。

百度已经在这个更广阔的市场的战略位置布子。

百度正在大力推动数字技术与实体经济的深度融合。其大模型技术已应用在制造、能源、电力、化工、交通等实体产业中,用智能巡检降低安全隐患、用智能调度缩短交付周期、用智能决策提升企业效率、智能信控解决交通拥堵…大模型正成为新型工业化的重要推动力。

人工智能技术呈现出很强的通用性,正在广泛渗透进经济生产活动的主要环节,制造业在中国经济结构中的比重更大,体系也更为庞大,也为AI提供了广阔的市场。正如李彦宏所分析,如果我们能挤上牌桌,获得竞赛入场券,中国将拥有更壮大的数字化产业,数字经济规模将获得巨大增长。

从对人工智能产业的人才、技术以及产品的贡献,到今天百度已经体系化的将AI能力输送到各行各业,与中国各行业数智化进程相共振,已经成为了今天中国在人工智能产业更上一步,同时让社会生产力,个人产出效率再上一步,其实已经打开了一个非常好的窗口。

在人工智能爆发的黑夜,2020 年的一封《致股东信》中,李彦宏写道:“每当百度徘徊在十字路口,我都会问自己,什么能够让你真正致胜未来?我认为就是两方面:一是你信仰什么,What do you really believe in;一是你有多大的决心,your determination。从过去到现在,我们的信仰没有变,我们相信技术可以改变世界。我们也有决心,有耐心。我们熬得过万丈孤独,藏得下星辰大海。”

到今天,百度显然已经走过了万丈孤独,但是要抵达星辰大海,实现个人、企业到国家竞争力的升级,需要更多的长期主义者以及创新者,唯有看到长期愿景,穿越没有鲜花与掌声的幽暗,我们每个人、企业与我们的国家,才有拥有鲜花与掌声的机会。

如果说,今年上半年,大家都还沉浸在狂热、迷乱的大模型革新带来的兴奋当中,那么,今年下半年,整个行业已经由怀疑、观望、跃跃欲试,转向了广泛、快速、残酷的技术革命浪潮当中,很多行动迟缓、保守的守成派,事实上已经远远落在了AI巨轮掀动的波澜之外。

而一批更具前瞻视野,勇立潮头的技术创新弄潮儿,譬如百度、OpenAI,也越过了质疑、傲慢与偏见的山丘,进入了人工智能时代的旷野,成为了这次浪潮当中的布道者以及开道先锋。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部