大模型加速商业化背后,是商汤的长线投入和集中爆发

大模型加速商业化背后,是商汤的长线投入和集中爆发
2024年05月06日 11:41 真探AlphaSeeker

©️深响原创 · 作者|何理

大模型这把火,烧了一年多。目前,各界对AI热情依旧,但也多了些理性。最明显的表现是,大家越来越关心大模型的商业化问题,甚至还因此引发过理想主义和务实主义的争论。

有没有一种可能,是公司既追求大模型技术理想,同时兼备又快又稳的商业化步伐?

商汤就属于这类公司。在近期的发布会上,商汤推出了新升级的大模型体系——日日新5.0。在主流客观评测上,日日新5.0达到或超越了GPT-4 Turbo版本;同时,商汤发布了行业首个“云、端、边”全栈大模型产品矩阵,并请来金山办公、海通证券、小爱同学等头部客户站台,介绍合作成果。

结合公司此前的财报数据(2023年,商汤生成式AI业务收入达12亿元,同比增长200%)来看,商汤大模型的商业化已经进入快车道。理解商汤的商业化进展,其实就是在理解大模型热潮将涌向何方。

系统理解商汤的商业化进展

一年多时间,在诸多厂商的探索中,大模型商业化的逻辑越来越清晰。公司要走通大模型商业化路径,需要具备三方面的能力:大模型本身能力的出众、落地不同场景的能力和灵活贴合不同客户需求的能力。

  • 大模型本身的能力

在行业“百模大战”的背景下,大模型已经不是“有没有”的问题,而是是否出色、各方面能力是否扎实的问题。只有表现可靠的大模型,才能得到客户和用户的青睐。

根据发布会的信息,日日新5.0主要聚集增强了知识、数学、推理及代码能力——文科方面,日日新5.0的创意写作能力、推理能力以及总结能力均大幅提升;理科方面的数理能力、代码能力及推理能力也达到业内领先水平;此外,商汤多模态大模型的图文感知能力达到全球领先水平,多模态能力也落地到产品层面,相关产品支持长图解析、文生图以及跨文档知识抽取及总结问答展示。

商汤多模态大模型在多模态大模型权威综合基准测试MMBench和多个知名多模态榜单取得领先成绩图源:商汤

发布会上,商汤科技董事长兼CEO徐立现场演示了日日新5.0在高考作文、解数学题、复杂中文场景、文生图等方面的表现,从结果来看,日日新5.0的表现相较GPT-4 Turbo等大模型均有亮点。而种种提升意味着,日日新5.0有能力赋能教育、内容、金融、数据分析等行业场景,对客户有足够的吸引力。

“日日新5.0”和GPT-4回答趣味推理问题:“妈妈给圆圆冲了一杯咖啡,圆圆喝了半杯后,将它加满水,然后她又喝了半杯后,再加满水,最后全部喝完。问圆圆喝的咖啡多,还是水多?”,“日日新5.0”回答正确。图源:商汤

  • 落地不同场景的能力

当然,大模型落地在实践中还要考虑更多因素。落地不同场景的能力,对应的是公司是否有成熟的大模型产品矩阵。

大家平时关注的各种大模型,多是云端大模型。但在实际落地中,大模型需要根据不同的场景进行“产品化”。例如,以AI手机为代表的AI硬件,需要的是规模可控但性能优秀的端侧大模型,以及高效的端云协同;金融、代码、医疗、政务等行业则对可独立部署的边缘侧AI应用有强需求。

商汤拥有“云、端、边”全栈大模型产品矩阵,场景覆盖广且能力突出。发布会上,商汤推出了1.8B的SenseChat-Lite版本端侧⼤模型。该模型在中端手机和旗舰手机的推理速度都实现了“业界最快”,遇到需要端云协同的复杂场景时,商汤也通过智能化判断能力提升输出效率,降低推理成本。

根据徐立的表述,该端侧模型在测试中超越了MiniCPM-2B、Phi-2等同量级的大模型,性能和7B、13B等尺度更高的模型相比也不逊色,即“同等尺度性能最优,跨级尺度全面领先”。

日日新·端侧大模型性能出众 图源:商汤

针对金融、代码、医疗、政务等行业的边缘侧AI应用需求,商汤则推出了高性价比、开箱即用、数据安全、全国产化的企业级应用一体机。在政务场景,一体机能帮助客户理解用户的问题,还能提供答案的参考来源,可以明显提升政务服务的智能化水平。

简而言之,商汤提供的系列产品覆盖了多数落地场景,客户可以直接按需选用,而不是反要“迁就”大模型厂商。这也是商汤得到头部客户认可的重要原因。

  • 贴合不同客户需求的能力

目前,业界能看到的各种AI应用,更多是集中在解决个人或企业的“点状”需求。但大家对AI其实有更高的期待。新技术应该作为更底层的支持,去为不同公司的不同经营环节提效,渗透到工作流中。

类比互联网,今天没有人会说“业务的某个环节用了互联网”,因为互联网已经完全渗透到工作生活里。同样的,AI应用也一定会不断参与到工作生产中的更多环节。

从合作伙伴的反馈来看,商汤的大模型正在加速参与到不同行业的生产经营中。

谈及AI和办公的结合时,金山办公CEO章庆元分了两个场景:个人场景和企业场景。个人场景用AI做PPT,或者写请假申请,企业场景则是希望做到“办公自动化”。在他看来,“AI要真正提高生产力的话,一定要能够写代码,做一个Copilot。只有能调各种各样的API,才能对企业生产力产生巨大的影响。”

具体到和商汤的合作,章庆元表示近期WPS发布的Copilot Pro就是基于日日新大模型做的应用。Copilot Pro可以帮助企业做数据分析、调用API、写代码。和过去相比,Copilot Pro不需要员工有代码能力或者懂各种API,而是可以“通过对话的形式,生成各种办公自动化的应用”。他同时评价,“在办公应用场景内,商汤大模型的表现十分出色。”

金山办公CEO章庆元分享和商汤的合作成果 图源:商汤

海通证券副总经理兼首席信息官毛宇星分享了公司和商汤的合作实现智能问答、智能研发、智能研报能力。在其看来,海通证券和商汤的合作是“业务+技术”全面的战略合作——“通过与商汤合作,我们利用大模型技术实现了海通证券数智化转型。未来,我们还将结合全栈式AI能力,进行业务流程、交互变革与数智化业务系统重构。”

商汤和海通证券发布金融行业多模态全栈式大模型图源:商汤

小米集团小爱总经理王刚着重讲了商汤大模型响应速度快、时间性能力强(即呈现生成结果来源,确保内容可靠)等特点,并介绍了商汤大模型在特定场景中的精细化表现(例如,在车内场景,商汤大模型能生成简洁清晰的内容,更符合用户的交互习惯)

AI落地汽车场景是行业热门话题。分享的最后,王刚还讲了一段关于小米汽车的小故事——雷军对于小爱同学在小米汽车智能座舱上的表现要求很高。当时,小爱同学把需求发给商汤,“商汤的同学两三天内就把所有需求干完了”,且后续的体验和演示“效果非常不错”。

小米集团小爱总经理王刚和商汤科技联合创始人、首席科学家王晓刚对话 图源:商汤

如何兼顾速度和质量

总的来看,商汤的大模型商业化兼顾速度和质量,在技术、产品、客户层面均有领先态势。而要理解商汤为何能取得如此进展,我们同样可以从三个维度入手:过往的积累、对技术和商业的认识、前瞻的“非共识”布局。

过往的积累指的是商汤此前沉淀的客户资源和行业经验,以及在感知智能层面、大语言模型方面的技术积累。这些积累让商汤在大模型时代能更快启动商业化。徐立曾分享过,商汤在端侧(移动端、车端、IoT端)的赋能经验和技术储备,可以协同大模型,复用拓展到更多终端场景。行业的应用反馈将帮助公司找到优势场景,推动大模型的落地。

对技术和商业的认识,表现为商汤的务实态度。一直以来,商汤关于AI价值的思考是,AI应该帮助传统产业提高生产效率,而不是颠覆传统产业。合作赋能始终是商汤的发力方向。当业界都在讲大模型三要素(算力、算法、数据),商汤持续强调“场景”作为第四要素的价值,这体现的是商汤对于“技术-商业”关系的差异化洞察。

前瞻的“非共识”布局,指的是商汤的“大模型+大装置”双轮驱动路线。

从2017年后,商汤就在着手建设大装置的原型系统。2020年,商汤决定投入56亿元建设大装置,这个耗资巨大的非共识决策,一度引发不少争议。徐立的逻辑是,做更通用的模型必须有更大的算力支持,建设大装置可以让AI的商业化不再依靠密集的人力。

这套逻辑是前瞻的,但也因为前瞻,商汤需要顶着压力去做。直到ChatGPT出现,大模型的逻辑得到验证,大装置算力的价值才获得更多认可。而“大模型+大装置”路线跑通之时,商汤的商业化进展也会随之提速。今天业界看到的商汤大模型商业化进展和领先优势,更多是“长线投入后的集中爆发”。

务实和理想的平衡

作为人工智能头部公司,商汤每一个动态都会影响市场对AI的看法,这次也不例外。

市场总是很矛盾,人们既相信AI是新的技术变革,但又总是希望快点看到商业回报,想要“短平快”的发展曲线。这几乎是没有可能的。所有能被称为“变革”的技术发展,都需要经历一个投入和摸索的过程。即使是大家熟知的“移动互联网造富”故事,前期也有通信技术突破、大范围建设基础设施的过程。只有投入到位、路线正确,才可能迸发出各种成果。

因为着眼于未来、努力在务实和理想之间把握平衡,商汤这些年来的决策不总是符合行业共识。如今,商汤承受住了时间的考验,公司的商业化成果证明了前期投入的价值。它的经历有助于唤起市场的信心和耐心,因为那个“技术变革催生商业增长”的美妙故事,现在依然成立。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部