「百模大战」,华为为何静悄悄?

「百模大战」,华为为何静悄悄?
2023年06月06日 14:57 ToB深度观察

来源  /ToB行业头条  (ID:wwwqifu)

作者 /海阳

近日,一则“华为即将发布「盘古Chat」”的重磅消息,引起了市场的广泛关注与探讨。据媒体6月3日报道,华为将发布的「盘古Chat」,是一款对标ChatGPT的多模态千亿级大模型产品,预计会在7月7日举行的华为云开发者大会上(HDC.Cloud 2023)公开对外发布以及内测,主要将面向ToB/G政企端客户。消息一经发布,市场迅速引起广泛关注,大众纷纷就「盘古Chat」的发布将会对华为业务发展产生什么样的影响而展开讨论。然而,伴随着大众的讨论持续发酵,华为云计算Marketing部部长董理斌就这一消息对媒体回复称“假的”。不仅如此,华为内部人员也向媒体透露,最新的大模型不会有「盘古Chat」此类命名,也不“对标”业界产品。与之相互验证的行为是,近期华为申请注册了两枚“HUAWEI NETGPT”商标,国际分类为科学仪器、网站服务。

但是话说回来,在大模型的热浪翻滚的当下,身为科技界顶流的华为真的要独自逆行,忽略这波大势吗?或许并不尽然……

01

做AI大模型:

起了个大早,赶了个晚集

华为虽然辟谣将发布「盘古Chat」,但对于日后推出一盘古通用大模型,这是可以预料到的行为。

第一,目前市场由于AI大模型在市场掀起热浪,已经推动大众来到了智能化的大门前。AI通用大模型的智能、简洁、轻便的能力,让其成为打开这扇大门的最佳钥匙,因此要将其收入囊中,已成为当下诸多企业的共识。

作为国内科技届的明星企业,华为一定会在当下这个走向智能化的阶段有所作为,这不是一个选择题,而是华为被时代浪潮所裹挟下,必须作答的必答题。

第二,华为早已开始布局大模型领域,其在2020年便察觉到AI大模型可通过小样本、零散数据的数据学习,收获极强的应用能力,并与各行各业有极高的适配性,能在保证开发成本低的情况下,迅速推动AI进入大规模可复制的产业落地阶段。

其中包括,AI大模型可以与传统科学计算领域渗透融合,为传统的气象、海洋、农业、地球科学、航空航天等领域,贡献从偏微分方程的方法拓展到 AI 方法,带来更实时、准确的效果反馈,推动业务更好地发展。

也是由于观察到AI大模型这一特性,在2020年期间华为云内部就完成了盘古大模型的立项,展开了对AI大模型的探索,而此时,远在太平洋彼岸的OpenAI也才刚刚推出ChatGPT3.0,尚未获得市场的广泛关注。所以,当本次华为云将推出基于盘古大模型的具象产品「盘古Chat」的消息出来后,市场上大多数的人都选择了直接相信。毕竟其之前作出的如此多准备,都意味着华为云对AI大模型的期许。可为什么华为云迟迟没有发布通用AI大模型呢?有关这个问题的答案,或许从华为在AI大模型的实践方向上可以找到。华为云人工智能领域首席科学家田奇透露,过去的2022年,华为盘古大模型主要是AI for Industry(AI赋能产业),希望为煤矿、水泥、电力、金融、农业等行业创造更多产业价值。这意味着盘古大模型是面向工业场景做服务,而工业场景的复杂度颇高,各行业的工业场景逻辑各有不同,这让其迅速打造一个面向ToB/ToG的通用AI大模型的难度极大。更何况,华为盘古大模型还有三个要求:模型要大,可以吸收海量数据;网络结构要强,能够真正发挥出模型的性能;具有优秀的泛化能力,可以真正落地到各行各业的工作场景。而这,进一步提升了华为打造出一个面向ToB/ToG的通用AI大模型的难度。所以,在如此高要求的难度之下,华为可能不敢铤而走险地用质量换速度,从而选择通过对各个行业场景做定向攻克,最后再将其整合成一个ToB/ToG的通用AI大模型路径。现实的走向貌似也是如此。公开资料显示,自完成立项之后,华为云分别在2021年9月,发布了盘古药物分析大模型;2022年6月,发布了盘古矿山大模型;2022年11月,发布盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型等。可以发现华为云每一次都是只发布细分行业的AI大模型服务,而每次发布都至少有6个月及更久的准备时间。随后,等华为云在各行各业的服务沉淀达到了一个临界点,此时刚好是将这些能力进行整合和重构,从而去打造了一个在现阶段令自己满意的ToB/ToG的通用AI大模型产品的阶段,到这同样需要一定时间。因此,在选择面向工业场景提供服务的前提下,结合要考虑到产品性能稳定性的情况,华为云发布通用大模型产品的时间,不可避免的将会错过最早一批面向公众的阶段。

02

抢占风口,

华为云争渡能有几分胜算?

在科技界,先发优势一直都极为重要。纵观各个科技领域,往往都是先发者在日后成为了不可动摇的赛道领头企业。

这也带出了一个问题,对于现在还未拿出确定通用AI大模型产品的华为云来说,在这次AI大模型军备竞赛中,是否会因为起步晚而导致争渡失败呢?对此,答案极有可能为“不会”。毕竟对于华为云来说,发挥自身优势点进而后来居上,可是其拿手好戏。

展开来说,华为云做通用AI大模型存在多方面的发展优势:

以技术角度来看,据市场流传的信息来看,华为盘古大模型涉及千亿参数,其自然语言处理(NLP)系列是业界首个千亿级生成与理解中文NLP大模型,且在2019年的中文语言理解评测基准 CLUE 榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新了三项榜单世界历史纪录。

不仅如此,华为云为训练盘古大模型,曾调用了超过2000块的昇腾910,花费2个月时间训练,昇腾 910是业界算力最强的AI处理器,基于自研华为达芬奇架构3D Cube 技术,可实现业界最佳AI性能与能效。

也因为技术能力的强横,上海证券分析师陈宇哲在了解之后,也毫不隐晦地在研报中称,盘古大模型未来有望成为国内最强的Chat GPT应用。

以服务方向的角度来看,基于之前华为云推出的多为面向ToB/ToG业务的大模型服务,再配合华为云人工智能领域首席科学家田奇,曾在人工智能大模型技术高峰论坛上发言到:“华为云盘古大模型推动人工智能开发从作坊式到工业化升级,AI for Industries是人工智能新的爆发点。”

由此,不难看出盘古通用大模型的主要面向场景,极有可能如传言一般是以工业场景为基础,而面向ToB/ToG业务的产品。

值得一提的是,在这一方面,华为云的客户资源、服务经验、产业链建设等方面有着极深的沉淀。

例如在客户资源方面,华为云当下IaaS服务已经是国内市场份额第二的存在,而观察其客户画像,不难发现其政府、政企、工业企业的占比颇高。

随着华为云推出盘古通用大模型,基于服务一体化、产品一体化原则,这些IaaS客户也将更容易接受推出的盘古通用大模型服务,让其迅速收获一批客户。

服务经验方面,也由于在IaaS领域服务的积累,华为云在面向工业场景的ToB/ToG机构、企业上,有着熟悉的沟通服务经验,懂得这类企业关注的服务重心,利于之后盘古通用大模型产品获得其初步信任。

产业链建设方面,华为云也懂得这部分企业极其关注信创安全。因此在这方面也有慎重布局。其中包括近期宣布实现自主可控的 MetaERP 研发,并完成对旧ERP系统的替换,以及将于6月7日推出全新GaussDB数据库产品,是国内首个软硬协同全栈自主的数据库等。

不仅如此,在盘古通用大模型的算力、硬件、应用、基础软件等方面合作上,选择的都是像麒麟信安、中国软件、神州数码、海量数据、易华录、航天宏图、万达信息、拓维信息、诚迈科技等有国资背景或在信创服务领域有极高市场认同度的合作伙伴,以满足普遍工业场景的ToB/ToG机构、企业所担心的安全问题。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部