雷军挖角的95后“天才少女”是何方神圣?

雷军挖角的95后“天才少女”是何方神圣?
2024年12月31日 00:55 成都商报

  国产大模型DeepSeek在全球火了,并带火了一个95后AI“天才少女”罗福莉。

  最近,中国头部量化私募公司幻方量化旗下专注于AI大模型研究开发的Deepseek(深度求索公司),宣布旗下的全新系列模型DeepSeek-V3首个版本上线并同步开源。

  DeepSeek-V3是深度求索自研的MoE模型(混合专家大模型),不仅以卓越的性能超越或媲美全球顶级的开源及闭源模型,更重要的是训练成本极低,被称为“AI界的拼多多”,以史无前例的性价比被国内外一众圈内大佬点赞,引发广泛关注。

  与DeepSeek一起进入大家视野的,是95后AI“天才少女”罗福莉。她曾在DeepSeek参与了DeepSeek-V2的研发,是这款模型的关键开发者之一。在DeepSeek-V3发布前几天,有媒体报道称,小米创始人雷军已开出千万年薪,将罗福莉招至麾下,罗福莉将就职于小米AI实验室,领导大模型团队。

  公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。2019年,还在北大读硕士的她在人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),登上了知乎热搜。罗福莉用本人知乎账号回应称,“这次投稿ACL是我近一年的产出,所以我认为自己是付出了足够的努力的,当然也可能也有运气成分加持。”

  硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

  今年5月,在DeepSeek-V2发布以后,罗福莉在知乎上撰文,发表了对于DeepSeek-V2的看法。她表示,“单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队”,“外加1元/百万输入Tokens的价格,只有GPT4价格的1/100,性价比之王”。

  事实上,罗福莉被重金招入小米,是小米全面发力AI大模型的其中一个动作。

  2023年4月,小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势,并以开放的态度与合作伙伴开拓更多机会。今年11月,小米成立了专门的AI平台部,小米的元老级技术大牛张铎为负责人。张铎本硕毕业于清华计算机系,曾被雷军公开称赞是“小米的大神”,送以“铎神”的称号。

  兵马未动,粮草先行。除了招募人才以外,最近,媒体报道称小米正着手搭建自己的GPU万卡集群,并在过去几个月里持续提升算力储备,为大模型研发提供更充分的算力供给。雷军在公开演讲时曾表示,小米做大模型的思路和很多公司不太一样,选择主力突破的是轻量化和本地部署。对于小米这样无论在手机还是造车上都讲究“性价比”的公司而言,如何在烧钱的大模型业务中平衡成本,无疑是雷军考虑的核心问题。而这,或许也是拥有DeepSeek-V2研发背景的罗福莉被雷军看中的原因。

  证券时报记者 周春媚

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部