法国:AI大革命

[作者] 亦帆, Lian

太长不看板:

  • 历史总由少数人书写: AI大模型的背后是数学天才

  • 海淀出做题家,法国出数学家(并虐我千百遍)

  • 欧洲AI大模型诞生于法国并非偶然:美国、伦敦的法国数学牛人开始回国创业了

  • Mistral, HuggingFace, h.ai, SnowFlake, PhotoRoom...

  • 欧洲作为AI第三级,和中国的合作大于竞争

01 底层大模型创业:数学天才的时代

真理总是掌握在少数人手里。

而且,历史也是由少数人书写的。

AGI大模型创业也是如此。

这轮AI创业看起来很奇怪:

  • 明星公司都是底层基础模型,应用层公司大多昙花一现,所以投资人也不敢投。

  • 只要卡够钱够,卷人数好像用处不太大:Mistral~20人团队照样完爆无数大厂。

从另一个角度,找PMF(Product Market Fit)非常难:

  • 即使看到了一个可能的机会,创业公司自己也没能力做出来

  • 要么等到开源模型的能力更新,机会马上变成红海

  • 要么是ChatGPT更新,瞬间机会就被碾压没了

归根结底,是因为大多数AI公司都不拥有底层技术:拿到的开源模型也只是黑箱,自己并不知道怎么能真正做得更好,只能在现有模型上随机调优原地打转……

我们越来越发现:AGI大模型的底层技术,只掌握在少数天才的手里。而且,天才的重要性要大于人数和组织能力。

大模型公司中研究的领军人物通常都拥有计算机/数学/物理博士学位,且深耕学术研究多年。而且我们都知道,计算机/物理/经济学……一切需要计算的学科中,最牛的人往往是数学最好的。比如前OpenAI灵魂人物Ilya Sutskever在本科阶段主修数学,Anthropic的CEO Dario Amodei从本科到博士都主修物理(数学也很重要)……

所以说,盛产数学天才的地方,才是AGI创业的真正沃土。

所以今天要特别聊聊法国。

国人对法国的概念主要停留在艺术文化和奢饰品,但了解过Concours(法国高考)的朋友都知道,法国社会对于数学的重视程度一点不亚于海淀;数学和哲学作为Concours必考题目,才是这个国家精英眼中真正的明珠。教育基础也孕育了社会文化:除了吐槽法国政府之外,哲学-数学-历史-文学-艺术都是巴黎酒吧咖啡馆的重要下酒菜;而且,这类问题也是法国各类商业-政治沙龙的无形门槛。

回到法国数学教育本身:重理论轻计算——基本都是证明题。以个人为参照,本来以为北大物理系的数学应该不算太差,但到了法国一样被虐得很惨。才发觉,原来我本科学的叫“算术”,不叫“数学”……所以说,海淀可以量产“做题家”,但真正的“数学家”却出在法国。

但不得不说,数学天才们在法国挣得太少了。所以我们看到无数法国数学牛人去美国做算法/数据/IT,也知道很多在伦敦的量化交易公司的官方语言是法语……这些人的回流,正是当下法国AI生态的主力。

“数学理论的分支与关系”,亨利-庞加莱研究院 Institut Henri Poincaré

02 法国:数学家的摇篮

法国的数学研究历史底蕴深厚。中学数学到高等数学的课本中反复出现,虐我千百遍的名字原来那么多法国人!

从解析几何创始人笛卡尔(Descarte),到“数论先锋”费马(Fermat),从在微积分、复变函数和微分方程中大量冠名的柯西(Cauchy),到随处可见的傅里叶(Fourier)级数和傅里叶变换,乃至21岁决斗而亡的“群论之父”天才伽罗华(Galois),以及“最后一位数学全才”庞加莱(Poincaré),力学、天文学中有大量存在感的拉普拉斯(Laplace)、拉格朗日(Lagrange)……

17到19世纪的数学可谓群星闪耀,这与这一阶段法国统治者们(路易十四1654-1715在位,路易十五1715-1774在位,拿破仑1804-1815在位)热爱数学(都有专职数学老师)、大力投资数学、并从全欧洲挖角数学人才是密不可分的。

20世纪以来,法国数学仍是世界一流。素有数学界“诺贝尔奖”之称的菲尔茨奖,每四年一次,仅颁发给2至4名未满40岁作出突出贡献的数学家。而从1936年至今的69名的获奖者中,法国(13人)几乎和美国(15名)并驾齐驱,并超过俄罗斯+苏联(9名)。要知道法国人口只有6700万,而美国有3.3亿。

有如此多大师坐镇的法国,如今仍是数学学习和研究者的向往之地。巴黎-萨克雷大学(Université Paris-Saclay, 包含巴黎综合理工École Polytechnique) 数次摘得数学专业世界排行榜第一,还有索邦大学(Sorbonne University, 包含巴黎六大),巴黎文理研究大学(Paris-PSL,包含巴黎高师ENS)、亨利-庞加莱研究所(Institut Henri Poincaré)等享誉世界的学校和研究机构。

03  AI届的法国大佬们

如今的AI领域,无论是学术界还是科技公司,都活跃着这些有扎实数学基础的法国人才,以下仅列出部分知名大佬:

04 Mistral: 欧洲顶级大模型

美国以外最引人注目的大模型创业公司之一,无疑是法国的Mistral AI。当前重要AI创业公司估值如下:

  • OpenAI = 800亿美元 (24年2月)

  • Anthropic = 184亿美元 (24年3月)

  • Mistral AI = 65亿美元 (24年6月)

  • 月之暗面、Minimax、智谱 = 25-30亿美元

Mistral系列是当前仅次于Llama3系列的,最重要的开源模型。提供Mistral7B,Mixtral8x7B, Mixtral8x22B三个选择。

从Mistral 7B (23年9月27日)发布,到Llama3(24年4月10日)发布之间6.5个月里,Mistral系列一直被认为是开源模型的首选。而且,与Llama系列相比,Mistral使用宽松的Apache License 2.0;而且实测下来MoE架构的推理性价比真的很香。让我们期待Mistral下一代开源模型的发布。

在支持开源的同时,Mistral也在24年2月发布了闭源大模型Mistal Large 和对标Chatgpt的产品 "Le Chat"(翻译="猫")。Mistral Large在发布时是当时最接近GPT4的产品(24年3月末被Anthropic的Claude3系列超越)

Mistral的开局如其名“冬日北风”一样发展迅速。23年4月三个创始人才在巴黎的咖啡馆确定“法国人也要有自己的ChatGPT”的愿景,6月就锁定1.13亿美元的种子轮融资。3个月后,不到20人的小团队,仅使用几百张A100做训练,快速发布开源模型Mistral 7B。

快速出成果的背后是人才。CEO Arthur Mensch曾参与Deepmind的Chinchilla等知名项目,包括CTO Guillaume Lample在内的很多团队成员都来自原Meta AI巴黎的Llama团队。(这里要感谢Meta的Yann Lecun在巴黎的投入:Llama背后有很多法国人)

Mistral背后的资本是法国本土+美国的混合。带着“成为欧洲AI领导者”的愿景,Mistral的1.13亿美元的种子轮就吸引了不少法国投资者,包括德高JCDecaux Holding,Xavier Niel(法国电信运营商Free创始人),Rodolphe Saadé(航运公司CMA CGM的CEO),Motier Ventures(老佛爷百货所有者Moulin-Houzé 家族办公室)等法国亿万富翁和家族办公室。在此后的A轮和B轮融资中,CMA CGM, Bpifrance(法国国家队),法国巴黎银行BNP Paribas也加入融资。当然,美国的风投机构(General Catalyst, a16z, Lightspeed Venture)和大厂们(英伟达, 三星,IBM,Salesforce)也在投资者之列。

Mistral的意义是深远的。

首先,欧洲有了顶级大模型。于是,欧洲手里多了一张牌,可以在站队压力可控时做出独立选择,保持一定的外交独立性。

第二,Mistral的号召力盘活了法国的AI生态。围绕Mistral和HuggingFace,法国当前的AI创业生态非常繁荣,这样可以进一步聚集AI人才,也给投资人信心,走入良性循环。

05  不止Mistral,法国的AI“隐形冠军”们

5.1 Hugging Face: 模型平台

Github是代码的平台,HuggingFace(HF)是模型的平台,也是AI开源在全球扛大旗的。HF最大的想象空间,是成为“模型调用模型”的平台与规则制定者。于是,HF在23年5月发布Transformer Agent 1.0, 并在24年5月升级到2.0,做的就是这件事。官方宣称基于Llama3-70B-Instruct在GAIA Leaderboard测试中,比基于GPT4的Agent有更好表现。

Hugging Face其实是一家“法国-美国”公司

  • HuggingFace在2016年由三位法国人Clément Delangue, Julien Chaumond和 Thomas Wolf在巴黎创立。公司初始想法是“面向青少年的AI驱动的聊天机器人”,当时在法国难以获得风投,于是搬到纽约以获得第一轮融资

  • 2019年,在Google发布BERT模型后,公司逐渐将聊天平台转化为开发者社区,并逐步形成了全网最大的自然语言处理开源模型数据库,获得Google、Amazon、Nvidia、Salesforce等多个巨头的战略投资

  • 目前HuggingFace约180名员工中三分之二在欧洲,其中70人位于巴黎

HuggingFace的重要性在于,它本身就是生态。它正在成为一个创业工厂,从中已经产生了Adaptive ML(详情见下), Contextual和Arcee等AI初创公司。

5.2. H.ai: Mistral之外第二家底层模型公司

如果说,Mistral是Meta系,H.ai就是Deepmind-Google系。

【创始团队】法国人Charles Kantos聚集了四位来自Deepmind的强化学习、博弈论和多智能体领域的专家,其中Laurent Sifre和Julien Perolat是法国人

【产品定位】开发“能动性”或“以行动为导向”的AI模型,这些模型能够推理、规划和协作解决问题,超越当前的语言模型;围绕行业的企业提供这些AI Agent,以推动生产力和人机协作

【融资】种子轮融资2.2亿美元(2024年5月),分别来自

      VC:Accel、Bpifrance(法国国家队)、Creandum、Elaia Partners等

      家办:Eric Schmidt(前Google CEO和主席)、Xavier Niel(法国电信运营商Free创始人)、Bernard Arnault(LVMH董事长)等

      大厂:亚马逊、三星和UiPath的战略投资

      5.3 Adaptive ML: LLM企业个性化部署

      【创始时间】2023年,总部位于纽约,但在巴黎有一个强大的技术团队

      【创始团队】5位法国人Julien Launay, Daniel Hesslow, Baptiste Pannier, Alessandro Cappelli和Axel Marmet共同创立,他们都曾一起在开源的Falcon LLM项目上工作,并且三个人此后在HuggingFace工作

      【产品定位】帮助企业将大型语言模型(LLMs)适应于他们的特定用例,并根据用户互动不断改进模型

      【融资】种子轮2000万美元

      5.4 Dust:AI助手

      【创始时间】2023年

      【创始团队】2位法国人,Gabriel Hubert和前OpenAI员工Stanislas Polu

      【产品定位】用来自Notion、Slack、Google Drive等的内部数据,使用带有检索增强生成(RAG)的LLM来为公司客户构建一个内部AI助手平台;在OpenAI、Cohere和AI21等公司的现有LLM之上构建应用程序

      【融资】4500万美元+

      5.5 Giskard:AI系统的安全

      【创始时间】 2021年

      【创始团队】2位法国人包括前Dataiku员工Alex Combessie和Jean-Marie John-Mathews,以及Andrey Avtomonov

      【产品定位】开发一个开源AI测试框架,作为“市场上最好的大语言模型杀毒软件”,来保护AI系统安全

      【融资】450万欧元

      5.6 Photoroom: 电商图片生产

      【创始时间】2019年

      【创始团队】2位法国工程师背景的创始人,Matthieu Rouif和Eliot Andres

      【产品定位】基于AI的图片编辑软件,让用户无需经过大量训练就能创造出令人印象深刻的图像;开发了自己的自定义基础模型“Photoroom ID”

      【融资】6400万美元

      5.7 Owkin:药物发现&临床优化

      【创始时间】 2016年

      【团队】法国临床研究医生Thomas Clozel和生物学领域的人工智能先驱Gilles Wainri

      【产品定位】开发用于药物发现、临床试验优化和人工智能诊断的技术;主要产品MSIntuit CRC - 一款在欧盟获得批准的人工智能诊断工具,用于预先筛选结直肠癌患者的生物标志

      【融资】3亿美元(其中1.8亿美元来自赛诺菲)

      除了最新的AI创业公司之外,更久一些法国人的科技创业故事是创立数据/SaaS/AI公司,获得美国风投,然后在美国上市。

      5.8 Snowflake:云原生数字平台

      12年在美国加州,由两个法国人Benoit Dageville和Thierry Cruanes,与Marcin Zukowski共同创立

      • 20年上市,当前估值约550亿美元

      • 23财年总收入为26.2亿美元,截至24年1月,Snowflake在全球拥有7,004名员工,并在福布斯全球2000强榜单中拥有691家世界最大上市公司的客户

      5.9 Datadog:用于云应用的监控和分析平台

      • 10年在纽约,由两位法国人Olivier Pomel和Alexis Lê-Quôc共同创立

      • 19年在纳斯达克上市,当前估值约370亿美元

      • 23年收入超过20亿美元,拥有超过5,200名员工,为全球27,300名客户提供服务

      5.10 Dataiku:人工智能和数据科学公司

      • 13年在纽约,四位法国人Florian Douetteau, Clément Stenac, Thomas Cabrol和Marc Batty共同创立

      • 22年8月E轮融资中筹集了4亿美元,公司估值达46亿美元

      • 23年营收约2.3亿美元,拥有约1400名员工和600多个全球客户

      06  挑战与机遇

      最后,法国AI究竟有多强?有超过中国吗?

      我觉得答案还是明确的:AI第一强国是美国,第二是中国。因为无论是从总AI论文数量还是研究者数量,中国都比法国要高出一个数量级。我们也看到假以时日,国产模型们也一步步逼近GPT4的水平。但问题是,我们的这些大脑是否用在了真正技术前进的方向,还是用在了完成内部KPI的雕花上?以及在这个天才创业的时代,个别天才是有可能改变历史命运的。

      法国AI行业的瓶颈,一个是人才数量,另一个是半导体工业。

      人才瓶颈目前主要由东欧和北非在补,但如何培养出更多的AI人才正在给法国当前的教育体系提出巨大挑战。以及,法国的高级AI算法人才的工资明显低于美国和中国:这一方面对于创业公司是成本优势,但另一方面也造成了国家层面的人才外流。

      芯片相关的半导体工业的短板更加难补。目前芯片工业体系主要在美国和东亚,消费电子在中国更是有巨大优势。欧洲可能需要再造一个“空中客车计划”,才有可能在AI浪潮中立住根基。

      最后,当“反华”成为美国的政治正确,欧洲作为AI第三极有着更多与中国合作的空间。法国-欧洲的AI发展有着众多痛点缺陷,如果我们有能力提供一部分价值,那么机遇也自然会向我们招手。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部