年终展望:2025年,生成式AI投资十大风向标

年终展望:2025年,生成式AI投资十大风向标
2025年01月26日 19:32 界面

文|硅兔赛跑 Cora Xu

编辑|Zuri

十大焦点引领生成式AI投资风向!2025投资机会早知道

2024年,AI重新定义了一切。

英伟达成为最会赚钱的“卖铲人”,不声不响地将公司市值推向3.5万亿美元高点,其数据中心业务更是在12个月内创下近1000亿美元收入。

相对应地,Microsoft、Meta、Amazon、Google四大科技巨头先后在AI领域砸入1500多亿美元,资本支出增长超50%。

AI热潮之下,风险投资家们也没闲着,PitchBook数据显示,截至12月中旬,2024年AI初创公司获得810亿美元投资,AI初创投资占据美国所有投资的41%。

同时,2024年科技企业通过要约收购筹集资金超过了通过IPO筹集资金,IPO荒漠依然持续。更多科技创企选择在私人市场寻求资本,而非冒险公开上市。

2024年我们回望科技周期下的时代巨变,2025年投资者们将继续积极寻找下一个百亿级、千亿级平台级企业。

在新年伊始之际,我们对2025年生成式AI投资机会给出十大展望:

1、AI将会释放PGC、UGC内容创作潜力,使内容消费更加丰富多元化。

2、AI将逐渐改变人与人、人与信息交互的方式,形成新的流量入口,提高消费者体验以及互动体验。

3、AI搜索、推荐改变信息的分发方式,将会创造新的商业机会。

4、企业用户对GenAI态度将从尝试转向大规模采用,AI代码、AI客服支持、企业级搜索和AI会议工具将成为首批落地应用的场景。

5、企业级AI应用正从Copilot向Agent转变,AI Agent应用将从试验品阶段走向产品阶段,进入实际的应用场景并为用户带来效率提升。Coding Agent、GTM Agent(销售智能体)可能会成为其中发展最快的两个场景。

6、AI SWE将会逐渐从Pilot产品转变为开发团队生产环境中使用的产品,并产生收入。

7、垂直AI应用将逐步渗透至行业内部。

8、视频生成模型将成为AI认识物理世界的引擎,为用户提供可实时交互的视效体验。

9、AI数据基建价值凸显,掌握高质量数据集将成为模型能力分化的关键点。

10、机器人数据解决方案将在2025年或更长一点时间内取得一定突破。

AI将会释放PGC、UGC内容创作潜力使内容消费更加丰富多元化

我们曾在2024年年底较为详细讲述了AI在消费级AI应用领域的机会。具体而言,落到电商、音乐、社交、游戏、旅行和教育等直接To C领域中,各有生成式AI原生应用的创新机会。

以旅行为例,Wanderboat是面向消费者的AI旅行规划工具,也是旅游内容分享社区。它构建了一个chatbot,可以根据用户需求推荐、定制目的地及各类娱乐体验活动,还可以主动学习用户的兴趣,定制专属行程。基于创始人此前在微软的经验,构建了一些很有趣的小工具,比如用户在查看地图时也可以与AI互动,实时获取一些信息和建议。在零付费推广的情况下,该公司的月活用户数量达到了6位数。

在教育方向,Speak此前就是教育软件公司,拥抱GenAI之前就已经拥有超10万名付费 户。基于 户数据库,Speak推出了专有语 识别的模型Whisper,专门 于理解10多种 语的说话者发出的重 英语,并推出AI 语言导师功能。

该公司于2016年成 ,2022年获得了OpenAI、Founders Fund投资,Speak 前在全球40多个国家/地区拥有超过1000万 户。今年6 最新的 轮融资中,该公司估值达到了5亿美 。

视频方向,Runway成 于2018年,是最早的 波做AI视频 成的公司之 。Runway最初业务是AI视频编辑,转向到视频渲染 成。2023年2 ,Runway发布了第 代视频 成模型Gen-1,估值也达到15亿美 。

Runway是一个基于人工智能和机器学习的创意工具平台,专注于为创作者提供各种AI功能,简化创意表达过程并提升工作效率。它集成了多个AI模型,支持视频编辑、图像处理、文本生成、音频处理等多种功能。今年6 ,Runway旗下最新版本Gen-3 Alpha模型发布,最新 轮估值或达到40亿美 。

视频 成领域投融资是GenAI领域最活跃赛道之 ,大厂企业和初创公司共同瞄准这一细分方向。面对拥有更丰富资源、更完整生态的大厂,初创企业在创新功能、创新产品上的优势常常会被模范以及超越,初创企业需要尽早找到自己的立足根本,逐渐成长为百亿级企业。同时,新AI产品也会释放PGC、UGC内容创作潜力,让内容消费更加丰富多元化。

AI将逐渐改变人与人、人与信息交互的方式形成新的流量入口提高消费者体验以及互动体验

据观察,随着AI基石模型的进化,从消费侧思考的B2C销售、营销、客服等企业,都在持续产生新的AI故事。

首先是多模态AI营销,从文字延展到音频、视频,形式从单点chatbot延展到具有操作执行能力的agent,并且准确率和对于边缘案例的覆盖力随着基石模型推理能力的提升增强。

此外,如果生成式AI运用得当,销售、营销、客服对消费者的洞察进一步提高,可以创造更加个性化的服务、定制化体验。

代表企业:GigaML、Proactive、Para、HeyGen、AdsGency

GigaML:是YC孵化的一家AI客服初创,成立于2023年,它帮助企业以安全的方式在自己的服务器上部署类似GPT-4的强大LLM,而无需将敏感信息发送到外部服务器。GigaML还提供AI驱动客户支持代理,利用LLM自动化响应并提供个性化帮助。GigaML发现将基石模型切换至o1-preview,加上大量评估、调优之后,错误率大幅下降,从70%降至5%,并能够解决80%的边缘案例,补上了AI客服在不常见的问题上无法回应的短板,提高企业升级的动力。

Proactive:是UpHonest投资的,为商家打造高情商、高智能的AI客服,先从服务健身房、餐饮等实体连锁商家切入市场。GPT、Llama等模型具备基础推理和生成能力,但在自然、高情商交互方面有所欠缺,Proactive旨在增强AI模型的自然、高情商交互能力,创造全新体验,改变客服工具机械、僵化的现状。该公司创始团队有非常丰富的AI学术研究和产品开发经验,CEO曾在雅虎、领英、谷歌、Meta担任高管,曾担任Tinder前CTO,首席科学家是麦吉尔大学教授,曾在Tinder、三星AI中心担任首席科学家。

Para:是声音营销企业的典型案例,利用AI生成个性化定制的声音营销电话,帮助品牌激活用户,帮助球队活跃粉丝;HeyGen:是AI视频营销的典型案例,其AI视频营销收入快速增长,据悉今年的年化ARR超过2000万美元,估值已达到5亿美元。

AdsGency:则是一个利用AI用户数据洞察,实现精准广告营销的公司,创始人此前曾在滴滴、亚马逊从事广告、营销相关的产品工作。它的业务核心是广告和用户数据,为客户提供了一个全栈AI营销工具,覆盖内容创意、创作、投放、归因等流程。AdsGency也代表了现在AI营销的一个发展趋势—— 从Point Solution,到整个GTM的全流程自动化解决方案。

AI搜索、推荐改变信息的分发方式将会创造新的商业机会

搜索,作为线上流量的第一入口,已经久无战事,生成式AI引入了新变量,不但出现了原生的生成式AI搜索企业,例如Perplexity,2年时间公司价值90亿美元。而且,GenAI使垂直领域的搜索引擎加速普及,瓜分通用搜索引擎的注意力。亚马逊、沃尔玛也均加强电商搜索引擎建设,先后推出来搜索助手,Agent智能体等工具。

我们先看一些AI原生搜索的最新动向。大公司方向,Meta近期正在加速研发搜索引擎,希望降低用户对谷歌和Bing的依赖。OpenAI在7月发布AI搜索工具SearchGPT,其付费用户均可使用。

创企方面,AI搜索初创You. Com专注于用 AI 提升搜索体验的平台。它不仅可以更精准地理解你的自然语言搜索,还能提供各种AI工具。近期该公司完成5000万美元融资,价值7亿美元。

同时,我们正在看到更多垂直领域生成式AI搜索引擎出现,越来越多创企专注打造某一细分赛道的搜索引擎。

以企业知识数据库、电商购物以及科研领域方向为例:

垂直于企业知识数据库的搜索

Glean:成立于2019年,是一家提供企业级AI搜索服务的公司,其主要产品是企业AI搜索工具,旨在帮助企业员工高效地查找和管理企业内部信息。Arvind Jain担任Glean创始人和CEO,曾在谷歌工作11年,担任杰出工程师,领导过谷歌搜索、地图和YouTube等多个团队。该公司于2024年9月份2.6亿美元E轮融资,估值达到46亿美元,据悉,该公司近两年中ARR翻倍增长。

垂直于电商购物的搜索

DayDream:种子轮拿到了5000万美元投资,Forerunner、Index联合领投。DayDream链接了超过2000+品牌,支持自然语言检索,根据用户提供的时间、地点、场合等信息给予相关产品推荐。

Encore:是YC24新一期孵化项目,是一个LLM驱动的针对二手商品购物的搜索引擎,链接美国多个二手商品网站,支持自然语言搜索&按照主题的搜索。

垂直于科研场景的搜索

Consensus:与Perplexity有共同的投资人Nat Friedman和Daniel Gross,专注打造服务科研的搜索引擎,改变人们获取和使用学术文献的方式。2024年收入增长了600%,月活40万用户,ARR近200万美元。

我们认为,明年会出现更多令人眼前一亮的垂直领域的AI搜索创新。

企业用户对GenAI态度将从尝试转向大规模采用AI代码、AI客服支持、企业级搜索和AI会议工具将成为首批落地应用的场景

生成式AI应用将从实验走向落地,根据Menlo Ventures统计数据,2024年企业中AI相关支出达到了138亿美金,相比2023年的23亿美金增长了6倍以上。在这其中,虽然模型支出占据主要部分,但是应用支出增速最快,从2023年的6亿美金增长到了今年的46亿美金。

显然,生成式AI正在从一个新兴的技术转变为一个使用工具。在众多应用中,最具价值的应用场景分别是:AI代码、AI客服支持、企业级搜索和AI会议工具。

我们认为在2025年,企业对于AI支出将保持增长。据统计,目前企业60%的AI支出来自创新业务的预算,未来企业将划分更多传统开支预算到AI应用上。由此,我们也会看到更多GenAI初创达到1亿美金ARR的里程碑。

企业级AI应用正从Copilot向Agent转变,AI Agent应用将从实验品转向产品进入实际的应用场景并为用户带来效率提升

AI快速发展同时,企业也迅速借助技术力量转型升级。就当下企业的采用情况而言,出于安全性、准确性、稳定性等因素的考量,企业更倾向于使用AI提高人在工作流中的效率,而不是直接采用端到端的流程自动化。

我们认为,在未来几年会逐渐从AI赋能人工作,到人监管指导AI完成工作,转向AI自主完成工作。

OpenAI CEO Sam Altman也同样提到,当下正处于AGI演进过程中第二阶段后期转向第三个阶段前期的状态。他认为Level 3的Agent智能,将能够自主与环境交互、收集信息,具备持续规划并执行多步骤、长时间任务的能力,并能在遇到问题是与人类交互共同解决复杂任务。

并且,如果接下来我们能够看到推理能力、逻辑能力更强的模型出现,可能是o1的下一个版本、也能是对标o1的开源模型。同时,行业内出现了更强Agent Infra(智能体基础设施),也就是除了模型以外,支持AI Agent(智能代理)运行和开发的各种基础设施。那么,我们认为,在2025年,AI Agent应用将从试验品走向产品,进入实际的应用场景并为用户带来效率提升。其中,Coding Agent、GTM Agent(Go To Market Agent)可能是发展最快的两个场景。

代表创企:/dev/Agents

公司成立于2024年10月,联合创始人兼首席执行官David Singleton曾任谷歌工程副总裁和Stripe首席技术官;联合创始人兼首席技术官Ficus Kirkpatrick曾负责Android 1.0版本的开发;联合创始人兼首席产品官Hugo Barra曾担任小米全球副总裁前谷歌安卓系统产品管理副总裁。

目前公司主要打造开发一个专为人工智能代理(AI Agents)设计的操作系统,对标AI界的“安卓系统”。/dev/Agents 在2024年11月完成了5600万美元的种子轮融资,估值达5亿美元。

此外,在最新一期YC中,我们也看到了不少专为AI代理设计打造可观测性和开发工具平台的初创公司。

AI SWE将会逐渐从Pilot产品转变为开发团队生产环境中使用的产品,并产生收入

AI SWE将扩大开发者人群的规模上限。

从今年企业应用以及Agent落地情况来看,代码方向的企业和应用发展速度非常快。这是因为:

软件开发本质上天然能够将复杂任务拆解成更小、更易于管理子任务。并且,受益于大模型推理能力的升级,现阶段用于模型训练、Agent训练的数据比较充足。

同时,软件开发和代码任务的结果可验证性强,开发者能够可以客观、定量的去衡量输出的准确性和可靠性。

此外,软件工程师用户群体天然离科技前沿更近,更愿意为效率的提升去尝试、去付费。

在今年行业发展中,我们看到从最早仅有Github Copilot平台,现在已经有了一屏都放不下的 Logo Map。

我们认为2025年:SWE-bench Verified测评分数有望突破现有最高分55%,超过70%。这也意味着AI SWE会逐渐从Pilot产品转变为开发团队生产环境中使用的产品,并产生收入。

在SWE-bench之前,HumanEval曾是衡量模型代码能力的标准,当其榜单上平均水平达到70%以上时,以Copilot为代表的代码补全应用具备了商业上可行的技术基础。

此外,如果我们将目光放得更长远一些的话,AI SWE将扩大开发者人群的规模上限。

更多没有代码经验专业人士有机会获得软件开发的能力,并使用这个能力去开发适合自己的效率工具或者是娱乐应用。我们也看到了很多公司正为非开发专业人群构建工具。

代表企业:Cosine

Cosine成立于2022年,专注于开发类人自主人工智能软件公司,其核心产品是自主AI工程师Genie,能够执行复杂的编码任务,如代码重构、搭建功能以及修复Bug。Alistair Pullen担任首席执行官,他自小对编程感兴趣,9岁时发布了并商业化了他的第一个软件应用程序。Yang Li担任首席运营官,曾经历1次企业IPO、2次企业收购以及3家独角兽企业。

Cosine在2024年8月获得了250万美元的种子轮融资,本轮融资由UpHonest Capital和SOMA Capital领投。同时,Cosine是OpenAI模型Finetune团队的重要合作伙伴,并且研发出了一个独特的数据管道。

垂直AI应用将逐步渗透至行业内部

可以看到,今年在医疗、金融、法律等领域都出现不少明星初创公司。虽然这些行业本身对于科技采用速度较慢,但是生产式AI通过直接交付成果取代传统交付软件模式,让垂直行业迅速看到了AI带来的效率提升。

2025年,我们认为垂直行业AI应用依然是很好的创业方向。

在通用场景的方向创业,势必会面临基石模型厂商、头部科技公司的竞争,一些垂直行业虽然属于细分赛道但整体规模仍然非常可观,大部分垂直领域在传统巨头的垄断下变化缓慢。

一些垂直领域专家对行业的工作流有深入认知的创业者,结合不断进化GenAI基础设施,是有机会迅速抢占用户,形成行业数据壁垒的。

我们特别强调关注传统行业AI升级机会。数字化渗透率低传统行业,甚至有可能跳过软件阶段,直接进入AI阶段,类似新兴市场从使用现金直接转向移动支付机会。如今,传统制造业、家庭服务行业存在较大的市场空白。

视频生成模型将成为AI认识物理世界的引擎为用户提供可实时交互的视效体验

今年随着Sora发布出圈,我们看到了很多视频生成模型初创公司的涌现。一些原从事3D图像生成的企业如Luma AI、Genmo AI,今年也转向了视频生成赛道。

2025年,我们认为将视频生成模型作为AI认识物理世界的引擎,为用户提供可实时交互的视效体验。

其中,游戏应用场景将会是变化较快的场景。其中,视频生成模型作为游戏引擎,可以根据用户的输入输出响应游戏内容,让每次的体验都有所不同。

但现阶段,这些demo的画质和帧率并不高,题材也相对单一。我们认为,随着大量的资金和类似马斯克、蔡浩宇这类大佬进入这个领域,底层模型的性能会迎来迅速的提升。底层模型提升后,会迎来更多游戏之外应用想象空间。

代表企业:Decart

公司成立于2023年9月,主要专注于开发能够实时生成视频游戏和世界模型的平台,提供AI驱动的“开放世界”应用程序。其产品包括面向企业的GPU优化工具和面向消费者的AI游戏“Oasis”,其产品形态与Minecraft相似,但是完全由视频模型驱动。

Dean Leitersdorf联合创始人兼首席执行官,23岁在以色列理工学院获得博士学位。Decart在2024年12月完成了3200万美元的A轮融资,该轮融资后,Decart的估值已超过5亿美元。

AI数据基建价值凸显,掌握高质量数据集将成为模型能力分化的关键点

对于基石模型来讲,掌握高质量的数据集或将成为模型能力分化的关键点,对于应用来讲,无论是消费级、企业级AI应用,构建专有数据集的能力是重要的护城河。

目前,业内公开、可爬取的互联网数据几乎都被用于模型训练,基石模型厂商需要寻找全新、未使用高质量、人类生成的训练数据用以构建更先进AI系统。

OpenAI专门成立了一支团队,研究如何解决训练数据匮乏问题。那对于初创来说,数据更是他们不可或缺的护城河。数据代表了初创可以再多大程度上提升AI模型在实际应用中的准确度和覆盖应用的能力。

我们从两个角度观察现有的AI数据基建的价值:通用基石模型数据和垂直AI模型数据。

在通用底层模型/基石模型方向,OpenAI专门成立了一支团队,研究如何解决训练数据匮乏问题。有报道称,GPT-5训练过程中使用了部分GPT-4和其他模型生成数据,导致GPT-5在一些方面难以避免产生了与这些模型相似性。

创企方面,Scale AI和AI创企Turing也凭借着优质数据集快速发展。从CV数据标注起家的数据服务商Scale AI,预计今年产生9.5亿美元收入,估值高达138亿美元。该公司主要为OpenAI、Anthropic等头部AI模型厂商提供专业人员标注和生成的数据集,今年收入翻倍增长,估值超过20亿美元。

2019年创立的AI创企Turing,主要利用数据科学和人工智能相结合的方法,帮助企业进行招聘、审查和管理工具,打造一款AI企业招聘平台,也是UpHonest投资的创企之一。

a16z、Benchmark投资人同样关注垂直赛道的机会。相较于通用模型方向,垂直赛道企业数字化渗透率较低,其生成式AI应用有潜力快速渗透,一旦形成数据飞轮,垂直赛道的创企可以积累自己的专有数据壁垒,当然如果创始人具备该垂直领域的深厚经验,更加有利于打造产品、构建壁垒。

代表企业:Lily、Casetext、Centaur Labs

Lily AI:成立于2018年,专注挖掘电商数据价值,主要借助AI打造电商优化产品推荐和搜索体验的SaaS平台。它通过分析产品数据和客户行为,为产品描述、搜索结果和营销活动注入自然、以客户为中心的语言,从而提升购物体验和转化率。该公司认为电商搜索面临的一大问题是消费者语境和商家语境的错位,为此搭建了零售行业最大的商品数据集,覆盖8000多万产品、具备几十亿标签数据,基于此优化商家的搜索表现。Lily AI于2022年8月完成 2000万美元B1轮融资。

Casetext:专注法律数据价值,其创始人律师出身,在公司早期阶段打造了一个开源的法律案例数据库,在接入GPT-4之前,本身积累了丰富专有数据,通过反复试验、纠错、调试,打造了自己专有的模型微调数据集,极大减少了基石模型在实际工作中幻觉。并且,该公司还打造了用于法律研究和诉讼的AI驱动工具CoCounsel,律师客户对其产品准确度非常满意。该公司在2023年被汤森路透以6.5亿美元的价格收购。

Centaur Labs:则是一家专注于医疗数据标注的公司,拥有一个由数万名医生和学生组成的标注团队,主要提供高质量的医疗数据标签,以推进医疗人工智能的发。该公司的服务包括医学图像(如X射线、CT/MR、皮肤科、眼科、病理学)、视频(如手术视频、超声波)、文本(科学文本、医学笔记)和音频记录(心肺音)的标注。2024年10月9日,Centaur Labs 完成了1600万美元的B轮融资,由SignalFire领投,Matrix、Susa Ventures、Samsung Next和Alumni Ventures参。

总结来说,我们认为有以下三点数据相关的机会值得关注:

一是挖掘更多类型、更多模态数据集的价值,包括用爬虫扩展数据体量、非结构化数据处理等;

二是通过数据筛选、清洗、标注,提供高质量的数据集;

三是从数据版权授权、数据集交易等方面入手,扩充数据量同时解决版权问题。

2025年或3年内Embodied AI将迎来GPT-2时刻,数据解决方案&模型架构的创新是推动因素之一

回顾2024年,我们看到了大量的前沿学者和专家投身到了具身智能(EmbodiedAI)的创业浪潮中,资本也是投入重金支持。今年我们也做了相关的主题分享,并整理50家具身智能初创的图谱。(智能革命:50家公司,26张图,看完具身智能现状)

业内最明星的团队Physical Intelligence在近期发布了他们第一代的模型π0,专为高度灵活、复杂且需要长时间规划的任务设计。在Demo中能够完成洗衣服,从烘干机中取出衣服,折叠衣服的任务。

Physical Intelligence在模型架构和训练数据这两方面都完成了一定程度上的突破,π0(只需要短时间的微调)可以执行一些预训练数据中没有出现过的任务,可以说是表现出了一定的泛化性能。

但是论文的一作者仍表示,尽管π0取得了一定的进展,但仍没有达到GPT-2那样变革性的水平。相比与GPT-2的训练数据集,机器人的训练数据规模远远不够,在数量、多样性、质量上都不足。

因此,我们认为在2025年或者更长一点的时间中,机器人数据的解决方案会取得一定的突破。在数据和模型设计的共同迭代下,Scaling Law在Embodied AI领域发生的碰撞与变化是值得期待的。

当基石模型能力达到一定程度时,我们也将看到更多通用机器人落地的场景,目前预测,在C端家庭场景的进展是最快的,在B端则是物流仓储零售的进展比较快。

AI热潮涌动,科技创新不止

作为观察和研究硅谷科技创新和创业投资的一线,硅兔君一直在见证着最新前沿科技进展,并且及时分享我们日常的一些行业观察。

回顾过去的科技周期,可以看到每一波平台级的机会下,都会诞生出诞生出百亿美金、千亿美金级别的公司。当基础设施完善后的5年应用公司的黄金发展期。我们也一直关注在不同技术周期下,技术平台对消费级和企业级应用的赋能。

如果大家想了解更多AI初创的信息,中文内容欢迎关注公众号硅兔君,英文内容可以订阅我们的Newsletter Morning VC,会有新鲜的初创融资和投资总结。

新的一年,硅兔君与各位继续同行。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部