大模型亟待产业化落地，百度文心解法有何启示？_

2022年AI绘画成了现象级应用，其背后是AI圈正火的AIGC以及预训练大模型。在预训练大模型驱动下，AI在“感知”文字、图片、声音等内容外，还具备了“认知”能力去创作内容。

2021年3月OpenAI发布人工智能绘画产品DALL·E，现已升级到DALL·E 2；谷歌、META、百度、阿里等互联网巨头也推出了支持生成内容的AI大模型以及对应产品，如百度基于文心大模型推出了AI艺术与辅助创作平台文心一格，百家号平台则已实现文字转视频功能，今年高考期间度晓晓挑战高考作文得分超过了75％的高考考生。在11月30日举行的WAVE SUMMIT+2022峰会上，百度文心一格迎来了能力升级，除可以创作更具“中国风”的画作外，还支持以图生图、二次编辑、一键生成视频。

AIGC应用背后的AI甚至还有了一个专门的名字：生成式AI（Generative AI），也就是利用学习海量数据后创造新内容的技术。

生成式AI的兴起让大众感知到AI技术的一日千里，这使得大模型的威力让人“大受震撼”。作为继深度学习后最具革命性的AI技术，AI大模型正在推动AI技术的效果走上新台阶，并加速AI技术走向产业成为基础设施。

虽然AIGC在短时间内还无法取代人工创作者，但一些人人可体验的应用如AI作画却让大众感知到了AI技术的智能程度，进而了解到其背后功臣AI预训练大模型的价值。

AlphaGo战胜李世石成为深度学习突飞猛进的里程碑事件，AIGC应用的爆红也将推动预训练大模型的落地走向新的阶段，因为“大众感知度”的提升往往是一项技术从小众走向大众的征兆。

技术奇点：AI大模型的AlphaGo事件即将发生

深度学习是AI的基石技术。在WAVE SUMMIT+2022峰会上，百度CTO同时也是AI技术大牛的王海峰将AI大模型放在了跟深度学习同级的位置上，他认为深度学习平台与大模型是产业智能化升级的“双子座”：“深度学习加上大模型，贯通从硬件适配、模型训练、推理部署到场景应用的AI全产业链，夯实产业智能化基座，将进一步加速产业智能化升级。”大模型给人工智能发展带来新机遇，牵引深度学习平台的发展方向。

大模型对AI产业的重要性已在行业内形成共识。相较于传统的需要人工标注的模型训练而言，AI大模型通过堆叠数据集“贪婪式”地训练模式，拥有更强的通用性，理论上可泛化到多种应用场景，而小样本或零样本的技术实现，则可让应用开发者快速基于其构建工程应用。除泛化能力强、研发过程标准化程度高外，大模型最大的优势还是在于“效果好”，其通过给模型“填喂”大数据提高其自学习能力，进而具有更强的智能程度，比如在自然语言处理上表现更佳。百度、谷歌等巨头的探索表明，基于预训练大模型的NLP技术的效果已超过过去最好的机器学习能力。

适应场景更广泛、开发过程更标准、智能程度更强大，三大特性让大模型更适应AI工业化阶段，因而日益受宠。深度学习驱动AI 十余年的发展，成功地让AI从实验室走向商业化；今天基于深度学习的AI大模型正在掀起AI产业的第二波技术浪潮。

当然，任何技术从面世到广泛应用都会经历一个过程，大模型技术当前所在的位置，像极了2016年的深度学习，彼时谷歌、百度、Facebook等巨头在AI上已走出很远，甚至已将AI应用到搜索等核心业务上，但AI依然没有走出科技圈。正是AlphaGo对李世石的惊天一击，让全世界都开始关注起了AI特别是深度学习技术，AI技术也从科技巨头等少数派专享逐渐走向了各行各业。因为有AI产业的多年积累，AI大模型的落地比深度学习要快一些，百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜此前曾指出，2022年是AI大模型落地关键年。

我们也看到，2022年，AI圈的大模型玩家主要沿着两个方向在努力：

一个是“卷”参数，从“巨无霸”到“超级巨无霸”，2021年谷歌发布了1.6万亿参数规模的超级语言模型Switch Transformer，很快阿里达摩院就推出了“全球首个突破10万亿参数”的多模态大模型M6。除参数规模越来越大外，AI大模型们也积极参与各项任务测试竞赛，力争最强。

另一个则是“拼”落地，只有应用到真实场景的技术才是真正的好技术。苹果不会在发布会上强调最新的A系列芯片比友商的强多少，甚至不会“刷跑分”，但却会指出A系列芯片让最新的iPhone性能提升了多少倍，并展示玩儿《原神》的画面流畅度。而从结果来看，苹果A系列芯片与友商最顶级的消费级芯片已不分仲伯。我认为，不比“跑分”比落地，也是AI大模型的头等大事，任何技术都需要通过产品给用户/客户带来好的体验或者创造新的价值来体现其价值。

新技术积累到一定时候就会迎来大规模爆发的临界点。从AIGC应用、生成式AI的爆发来看，AI大模型“AlphoGo战胜李世石之于深度学习”这样的临界点即将来临。那么，如何让AI大模型更早地落地到千行百业？作为我国AI大模型的头部玩家，百度文心的最新解法，我认为是“产品化”。

技术产品化：百度文心推动大模型落地的新解法

相较于一些“卷”参数的大模型而言，百度文心大模型更强调两大差异化特性：知识增强与产业级，前者是因为百度在NLP、知识图谱、语义理解等认知型AI上有着多年技术积累，且有搜索这样的“锤炼场景”；后者则是因为百度多年来持续推动产业智能化，依托百度飞桨、智能云等业务实现AI to B。

在WAVE SUMMIT+2022峰会上，百度文心大模型的升级依然在强化知识增强与产业级这两大特征，比如发布了包括知识增强轻量级大模型ERNIE 3.0 Tiny在内的5个基础大模型，而更多的升级则体现在“产业级”特征上，它正在进一步降低AI大模型的应用门槛，让其可被不同规模的企业组织与所有开发者快速、低成本、标准化、规模化应用。

王海峰在演讲中也指出，百度文心大模型已摸索出一条大模型产业化路径：“具有算法、算力和数据综合优势的企业，可以将模型生产的复杂过程封装起来，通过低门槛、高效率的生产平台，为千行百业提供大模型服务，从而形成一条大模型产业化路径。”

“产品”概念首次被引入到百度文心全景图中。在“产品与社区”层，除原有的大模型创意与探索社区“旸谷”和AI艺术与辅助创作平台“文心一格”外，百度文心全新发布了“文心百中”产品，这款产品体现出百度文心大模型以“产品化”来推动技术加速落地的思路。

文心百中由百度搜索与文心大模型联合研制，这是一个to B的产业级搜索系统，相较于“索引-搜索”的经典搜索系统不同，文心百中采用纯神经搜索架构加数据驱动搜索效果优化策略设计而成，将搜索与索引融合在一起变成大模型的端到端训练与学习，搜索原理是数据驱动优化而不再是基于统计规则。在文心百中，被搜索的海量内容与用户的需求均是大模型的训练参数，通过训练学习它可以更好地理解内容，也可以精准地理解用户的搜索需求。

在搜索表现上，文心百中具备极简、强大与高效的特性，特别是在语义理解上更胜一筹。据吴甜介绍，文心百中已在百度的部分垂类、开发者搜索、企业搜索等业务中被应用，从数据来看，其在结果相关性、对不同搜索请求的理解（如数字、英文、非语言文字、否定、反义、丢词、多词、主需求识别、语序）上都有显著提升，展现出强大的语义理解能力。

搜索引擎是百度的本业，此时此刻，百度文心发布基于AI大模型的产业级搜索系统有着多重意义：

1、企业级搜索是重要的产业智能化场景。

搜索每天被我们使用，以至于很多人忽视搜索对产业的价值。除通过百度App这样的消费级应用给人们提供信息与服务的连接外，搜索也是很多企业的生产力工具，比如“内搜”支持内网的统一搜索、文件搜索、知识库搜索，此外一些中小型开发者的应用也需要用第三方搜索系统。在百度面向企业级的智能办公套件中，也有“统一搜索”功能，可以让客户在App内部署企业级统一搜索。当然，谷歌也有企业级搜索解决方案Google Search Appliance（以下简称GSA），可支持政府、企业、高校、协会等机构对自己拥有的网页、文档、数据库等相关信息进行高效安全的通用搜索。

正如惠普的一位工程师所说：“在我们平均查找信息所花费约12分钟的时间里，如果能减少一分半到两分的时间，那就意味着浪费也减少了10-15%。”说到底，更好的搜索可以加速信息流通进而提高企业组织协作效率，这也是数智化的目标之一。由此可见，百度文心推出的产业级搜索系统是有清晰的使用者与场景的，而且相较于传统搜索而言，它可以提供更智能的新一代搜索，助力企业降本增效。

此外文心百中还具有极简特征，因此更适合不懂或无力搭建搜索系统的第三方网站、App以及企业，它们可在业务中快速构建新一代智能搜索。据吴甜介绍，文心百中的效率相比经典搜索系统有明显提升，应用起来极其简便，仅需三步即可在线完成搜索引擎的构建，且其具备从0到1的高效建设能力，相比传统搜索系统可减少人力成本90%以上；同时，基于小样本学习能力极强的文心大模型，文心百中也仅需少量的数据，即可实现不同行业的搜索效果优化，十分高效。展望未来，文心百中可成为百度AI to B的基础组件，或许还可与如流、智能云等业务组合在一起，成为智能化解决方案的一部分。

2、搜索引擎是AI最核心的应用场景。

百度2010年成立多个AI相关团队的目的均是为了改进搜索，是最早做AI+搜索场景的，此后多年也一直在AI+搜索上深耕，也正是在AI驱动下，百度搜索构建起了强大的用户体验与内容生态优势，牢牢稳住了在行业的位置。大模型是AI的第二次技术浪潮，百度将其应用到搜索引擎也是水到渠成的事。

根据吴甜介绍，文心百中已在百度搜索等业务中应用，且展现出更强大的语义理解能力。对科技巨头来说，将经过核心业务锤炼的技术再开放出来也是常规路径，比如云计算，AI to B均是如此。现在文心百中也可以被视作是百度将AI大模型与搜索结合的应用成果开放出来的举措。

3、搜索引擎可强化文心大模型的知识增强特性。

搜索引擎的基础技术是NLP（自然语言处理）、知识图谱、语义理解等“认知型AI”，正因为此，搜索引擎可以成为AI的黄金场景，也可以锤炼出领先的AI技术。当AI大模型被应用在搜索场景时，它也将获得更多的知识、更多的训练、更多的反馈，进一步强化“认知”属性。因此，文心百中将会让百度文心大模型的知识增强特性更强。

对于开发者来说，基于大模型开发AI应用可能还是有一定难度。但如果一个大模型可以“内化”到一个搜索系统中，开发者可在产品中以低代码的方式嵌入一套搜索系统，实际上也应用到了大模型的能力。今年很多开发者可在短时间内基于开源AI绘画大模型推出AI绘画应用，也是一样的道理。

显然，百度文心“技术产品化”的思路，可大幅降低AI大模型的应用门槛。除AI作画平台文心一格与产业级搜索系统文心百中外，百度文心未来还可以推出更多基于AI大模型驱动的产品，服务更多用户和开发者。通过技术产品化的方式，推动AI大模型以搜索这样的产品形态更快地走向产业，百度文心这个思路对行业还是很有启发的。

文心模式：不能落地的大模型不是好的AI技术

技术只有通过商业应用走向真实场景，才能释放其价值，也才能得到更快的发展。AI的发展历程足以证明这一点：人工智能的开创历史可追溯到1956年8月31日发起的达特茅斯会议，机器学习的算法、理论和应用在20世纪80年代就已获得巨大成功，深度学习课题在2006年就已变热，但AI随着深度学习走向爆发却是2016年前后，在谷歌、百度等科技巨头推动下AI加速应用到各行各业，并在场景反馈中实现更快的进化。AI从理论到大规模应用花了60年。

随着AI大模型的开源，这一技术已从实验室、从论文中走出来。不过，由于AI大模型技术门槛更高，开发过程更复杂，对算力有很高要求，因此只是开源并不能让其从阳春白雪变为普惠的“下里巴人”，这正是百度文心大模型“产业级”的意义，它在降低AI大模型应用门槛上的实践值得关注，具体来说有如下几点：

1、行业大模型。今年5月20日百度文心大模型首创推出“行业大模型”，其基于通用数据训练，再加上行业应用场景中大量存在着行业特有的大数据和知识，结合行业相关的创新算法设计，行业大模型更适合在对应行业进行AI工业级应用，比如联合国家电网研发知识增强的电力行业NLP大模型国网-百度·文心，联合浦发银行研发了知识增强的金融行业NLP大模型浦发-百度·文心。在WAVE SUMMIT+2022峰会上，百度又联合多家企业和机构重磅发布5个行业大模型，包括深燃-百度·文心、吉利-百度·文心、泰康-百度·文心、tcl-百度·文心和辞海-百度·文心。截至目前文心已累计发布11个行业大模型，涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域。

2、开箱即用的工具套件支持。大模型开发需要用较多专业工具，比如深度学习平台、开发平台等。针对此，百度文心大模型提供了大量的工具套件，形成了“工具与平台”层。除数据标注与处理、大模型轻量化、大模型部署等基础工具外，还有两大“神器”：一个是飞桨企业版EasyDL，另一个是BML大模型全功能AI开发平台。在WAVE SUMMIT+2022峰会上，文心大模型开发套件全面升级，发布了行业大模型定制工具，同时提供更加完备的场景化建模工具、更为丰富的模型精调工具，以及大模型可信学习工具，让大模型开发训练更加灵活高效；文心API服务支持多种模型尺寸的精调，体验专区提供更多可体验能力，同时基于大规模集群算力分布式推理加速能力，可满足大规模高性能产业级调用。此外，飞桨也发布了端到端大模型开发套件PaddleFleetX，助力开发者应对大模型训练与推理部署相关挑战。

3、技术产品化。使用语音助理的用户不需要理解AI技术的运作原理，在App嵌入语音交互服务的开发者也不需要懂。技术门槛高，只有懂技术的才能用。但当技术转化到产品中，就可以被更多不懂技术或者不那么懂技术的人使用，比如AI大模型技术产品化，当其内化到“文心百中”，“文心一格”中，就可以被更多开发者甚至普通人更轻松地使用。

4、与业务协同。这也是科技巨头做技术开放的一大优势，相较于没有业务的技术服务商而言，它们可以将技术拿到业务中“锤炼”，在业务发展中也会形成技术的“溢出效应”。百度就将文心大模型应用到搜索等核心业务，同时通过百度智能云等平台全面开放，在海量产业场景中“锤炼”，在这一过程既可以基于开发者、企业客户、个人用户的反馈不断改进，也可以得到更多数据进行高强度训练，进而实现螺旋式上升。

应该说，在AI大模型的落地上，百度文心有着相当多的独特实践，趟出了一条大模型落地之路。而从效果来看，百度文心大模型在“大模型落地关键年”也取得了不错的成果，经过2022年“大模型落地元年”的努力后，文心大模型正在加速落地，已成为应用门槛最低的AI大模型IP。

当然，重视落地不等于不重视“跑分”，百度文心大模型也在不断夯实技术能力。算上在WAVE SUMMIT+2022峰会上发布的11个全新大模型，文心大模型的模型总量已增至36个，已构建起业界规模最大的产业大模型体系，其大模型在基础能力上依然在不断进步，比如最新发布的知识增强轻量级大模型ERNIE 3.0 Tiny是以ERNIE 3.0千亿参数大模型为师，通过多任务知识蒸馏手段将千亿多任务大模型的所学迁移至轻量级模型中，训练了10亿级、亿级、千万级不同体量大小的轻量级大模型，其具备非常优秀的泛化能力，同时相对于超大参数模型，推理速度提升数十倍到百倍，能够显著降低超大参数模型落地的成本。而据吴甜介绍，AI大模型未来依然有许多进化方向，包括向着多模态、多语言、多任务统一建模发展，跨模态大模型，以及与行业更加深度的结合上，百度文心大模型也将继续向着这些方向去做技术探索创新。

写在最后：

珠穆朗玛峰顶的雪山融化的水会流到山脚汇成河，灌溉农田。互联网行业立于新技术高地，新技术能力外溢到产业，就跟雪山消融灌溉农田一样，各行各业不再需要挖井找水，只需直接享用，同时付出合适的代价。AI大模型就是峰顶的雪，现在它正在百度文心等头部玩家的“加热”下“融化”，溢出到更多产业场景，加速AI工业大生产进程，让AI更强大，让更多人受益。