李开复:推理成本每年降十倍,今年是大模型“落地为王”元年

李开复:推理成本每年降十倍,今年是大模型“落地为王”元年
2025年03月29日 19:54 南方日报

3月29日,2025中关村论坛“未来人工智能先锋论坛”在京举行。零一万物 CEO、创新工场董事长李开复出席并发表主题演讲。

他说,AI 2.0 是一场科技革命与平台革命,大模型走出实验室,穿透各行各业成为驱动实体经济的新质生产力。

与此同时,大模型的推理成本在以每年降低十倍的速度快速下降,这为AI-First应用爆发提供了非常重要的条件;两年前推理成本太贵的模型,现在已经是“白菜价”了。AI-First 应用(将人工智能置于应用开发的核心位置)很快将井喷,2025 年将会是 AI-First 应用爆发、大模型“落地为王”的元年。

李开复说,结合新的技术创新,模型训练过程变得非常有意思:先训练一个“文科生”,让模型阅读所有的书籍,然后再向理科方向训练,让模型能够证明数学题、会写代码,最终得到的“文理双全”的模型会非常厉害。

与此同时,模型性能的提升其实在加速,而不是在放缓。从 GPT-2 到 GPT-3、从 GPT-3 到 GPT-4.5,每一次升级都花了大约两年的时间,本质上还是人在训练模型,是人来规划新的算法、新的模型架构、再搭配更多 GPU、再投入更多数据,最终推动模型性能的提升。而当下进入了一个非常有意思的“AI 教 AI”的时代。从 OpenAI 发布 o1 到 发布 o3,中间只隔了三个月。 DeepSeek-R1 也是在 OpenAI o1 发布的两个月之后就正式发布,并且可能很快就会发布 R2。一个重要的原因就是现在很大程度上已经不再单单依靠人来发明新算法、发明模型架构,而是 AI 借由慢思考具备了反思的能力,能够自我迭代、自我进步,也就是“AI 教 AI”,AI进入到自我演进范式。

他也分享一下对 DeepSeek 的四个观察。第一个观察,DeepSeek破解并开源推理模型的思考训练过程,进一步缩小与美国的差距。DeepSeek 很快让模型具备了 Reasoning (推理)慢思考的能力。相比之下, OpenAI o1 一直隐藏着思维链,就是防止友商复现。

第二个观察是,DeepSeek 极其高效的工程效率,走出了一条与OpenAI天量级融资的底层逻辑迥然不同的中国道路。在同样标准下进行比较,DeepSeek-R1 要比美国的类似模型更快,也更便宜了 5 到 10 倍,这背后是工程能力的巨大进步。

第三个观察,DeepSeek 证明了开源模型能力追赶上闭源模型,进一步推进SOTA模型的商品化。在美国的开源社区和社交媒体,很多人都在热情拥抱 DeepSeek,过往很少有中国软件在海外收获如此广泛的欢迎。这很大程度上就来自于与闭源的 OpenAI 相比,DeepSeek 更为开放。

第四个观察,中国迎来了属于自己的“DeepSeek Moment”,将大幅加速大模型在中国的全面落地。今天 DeepSeek 完成了对中国 ToB、ToC市场的市场教育, AI-First 应用爆发又多了一个强有力的支撑。

DeepSeek 如果要落地企业生产力场景,还有一些卡点需要克服。很多企业希望能够本地部署、安全部署,因为部分企业出于数据安全考虑不希望数据上网;很多公司需要有更好的联网搜索、Deep Research(深度研究) 等功能,也需要用 RAG技术(检索增强生成,Retrieval-augmented Generation)链接企业数据库,如ERP、CRM等系统。此外还有企业希望能够在基座模型基础上开发应用、打造企业专属智能体。最后还有很多企业需要基于 DeepSeek 模型进行模型微调,甚至需要继续预训练,从而让DeepSeek 等基座模型持续进化,最终成为能在企业专属的“行业大脑”。

基于上述考量,零一万物也已全面拥抱 DeepSeek,将 DeepSeek 优质基座模型转变为企业级 DeepSeek 部署定制解决方案——可以类比为零一万物在打造AI 2.0时代的Windows系统,而DeepSeek就是驱动Windows的内核,区别于普通软件公司或系统集成商提供的浅层方案。

李开复还表示,随着全世界开始拥抱 ChatGPT、DeepSeek另一个问题开始浮现——对于小语种而言,很多基座模型表现并不好。以俄语为例,在 Llama 的训练语料中俄语占比仅 0.13%,因此 Llama 在俄语上的表现并不好,在东南亚、中东、中亚、非洲等国家和地区的小语种表现上更是表现不佳。

“我一个朋友是斯坦福语言学教授,他认为目前大模型基本忽视了 7000 多个小语种,可能会加速这些语言的灭绝。”李开复说,康奈尔大学的研究也显示,每个国家和地区之间的价值观是存在不小的偏差。让每个国家和地区都有机会训练自己语言的模型、训练出符合自身价值观的模型,不仅必要而且是这些国家和地区的刚需。

没进去,零一万物推出小语种模型,基于每个国家可优化出不同的模型对齐策略,让更多国家能够拥有自主可控的大模型。

李开复说,零一万物今年的一个焦点应该是:Make AI Work,让大模型真正赋能千行百业。

南方+记者 郜小平

【作者】 郜小平

【来源】 南方报业传媒集团南方+客户端

0条评论|0人参与网友评论
最热评论

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部