01
从浙江大学毕业之后,您都进行了哪些尝试,又如何开始的创业之路?
梁文锋:毕业后,我没有像大多数同学那样,投身大厂成为安稳的码农。
在一个简陋的空间里,开始研究用计算机赚钱的各种途径,整日与代码和数据相伴,累了就趴在桌上小憩。
在探索过程中,接触到量化投资。当时,量化投资在国内还是新鲜事物,但我坚信自己能在这个领域闯出一片天地。
量化投资,简单来说,就是利用数学模型和计算机技术,对金融市场的数据进行分析和预测,从而制定投资策略,即通过计算机取代人,以数量化方式程序化发出买卖指令。
这是一个融合金融、数学和计算机科学的交叉领域,需要具备深厚的专业知识和强大的技术能力。
为掌握量化投资的核心技术,我开始疯狂学习金融知识,购置大量金融书籍,从经典金融理论著作到最新量化投资研究报告,同时,报名参加各种金融培训课程,学习国内外顶尖量化投资机构的经验与方法。
量化投资的数学模型复杂难懂,金融市场波动变幻莫测,每一次尝试与失败都让人感到沮丧和迷茫。
但每当想要放弃时,总会想起量化投资之父西蒙斯的一句话:“一定有办法对价格建模。”这句话如同一束光,给予我黑暗中坚持下去的勇气。
2010年,沪深300股指期货正式推出,犹如春风唤醒沉睡的量化投资市场。2013年,我将人工智能AI与量化交易结合,和浙江大学校友徐进等人创立了以德国数学家卡尔·雅可比命名的投资公司——杭州雅克比投资管理有限公司。
2015年,共同创立杭州幻方科技有限公司,也就是今天的浙江九章资产管理有限公司,次年又成立了宁波幻方量化投资管理合伙企业(有限合伙)。
经过几年发展,幻方量化在国内迅速崛起。2016年10月,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行。
在量化投资领域积累了强大的技术实力和算力资源,幻方量化也以强大的算力支持闻名。
到2017年底,几乎所有量化策略都采用AI模型计算。2019年,幻方量化管理规模突破百亿,成为国内量化私募“四巨头”之一。
2021年,幻方量化因业绩不佳向投资者致歉,承认误判了市场走向。
后来,行业又遭遇挫折,中国金融监管机构严厉打击量化交易,认为这类交易助长羊群效应,加剧市场波动。
创业就是这样,从来没有坦途。
02
没有人能随随便便成功,量化交易与常规投资不同,您如何能够异军突起,又如何看待量化投资的未来?
梁文锋:我们的核心团队,连我自己,一开始都没有量化经验,这一点很特殊。不能说是成功的秘密,但这是幻方的文化之一。
幻方某种程度上增强了我们对技术驱动型创新的信心,我们经历了一个漫长的积累过程。外部看到的是幻方 2015 年后的部分,但其实我们做了 16 年。
那么,量化和非量化,到底是怎么区分的?在投资决策的过程中,核心你是用数量化方法进行决策的,还是用人进行决策的。
所以区别不是交易,不是研究手段,而是决策方式。
量化公司有很多交易员和研究员,但是没有基金经理的,基金经理就是一堆服务器。人来做投资决策的时候,它是一种艺术,要凭感觉。程序来决策的时候,它是一种科学,它有最优解。
有人问,量化投资以后还需要人类吗?当然需要,需要大量的程序员和研究员。
量化交易共四种股票策略,最重要的是第一种日间量价模型。大家经常听说的多因子、alpha其实都是说日间量价模型,规模大概有两千亿。
第二种是日内回转模型,俗称股票T0,有大几百亿。第三种是基本面模型,第四种是事件驱动模型,目前都不是重点。
在传统上,所有的模型都是多因子模型,通过选股和择时来获取超额收益。在2017年以前,多因子模型是万能的,以前我们都希望模仿worldquant的模式,就是找很多的人来挖因子。同行里大家竞争的是谁的因子更加有效。
现在你要再挖出一些很有效的因子,已经很难了。
2017年之后,行业发生变化,传统的多因子框架逐渐被人工智能取代。2019年之后,又逐渐被更新的集成框架取代。作为私募,投资人对我们的期望是很高的,如果一年跑赢指数低于25%,投资人是不满意的。
私募之间的竞争很激烈。
每个星期都会拿到同行的业绩数据,这个星期谁跑赢了多少,大家放到一起来比,如果落后了客户就马上就会打电话来,所以我们压力很大的。
正是这样的压力,逼得我们不断地提升投资能力,加班改策略,因为一偷懒就落后了。当然我们向客户的收费也高,远远高于公募,所以这个业绩和压力也是公平的。
我们经常会被问:量化投资到底是赚了谁的钱?
其实答案很简单,量化赚了原来人类投资者赚的钱。人类投资者分两个流派,一种叫技术面,一种叫基本面。说得更具体一点,现在量化赚的是技术面流派原来赚的钱。
量化私募整个行业的进步,大致是符合摩尔定律的,每18个月投资能力翻一倍。但是这几年来,量化投资的平均收益率,差不多是没变化的,因为市场的有效性在不断提高。
这是符合逻辑的,因为投资能力提高一倍,市场的有效性还一样的话,赚的钱应该是原来的2倍才对。所以市场的有效性提高了。
预测中国量化投资的未来,一个办法就是看一下美国的现状。美国的资产管理有两个趋势:一个是共同基金逐渐指数化,另一个是对冲基金逐渐走向量化。
共同基金类似国内的公募基金,对冲基金相当于中国的证券私募。最初的对冲基金都不是量化的,这个表是2004年全球对冲基金资管规模排名的前10名,大部分都不是量化的。
2018年的排名,量化已经占了前面的多数,我们熟悉的桥水排名第一,AQR排名第二,文艺复兴排名第四。
从美国的经验来看,量化私募的管理规模可以做得很大。全球最大的对冲基金桥水的管理规模是一万亿人民币左右,而国内大的量化公司在100~200亿之间,我们可能还有几十倍的增长空间。
国外那么多量化公司,他们都在做什么,都在做高频吗?显然不是。高频容纳的钱很少的,并不是资产管理的主流。答案是所有策略都做,从宏观对冲,到股票基本面,到股票量价,到大宗商品,到债券,主战场是股票和债券。
全球最大的对冲基金桥水,是做宏观量化的,全球第二大对冲基金AQR是做股票基本面的。越是低频的策略,容量越大。
所有原来人类做的策略,现在量化都在做。而国内的对冲基金,现在大家主要都是做量价策略,我们整体上比美国是落后的。从美国的经验来看,在策略类型上面,我们应该还有很大的发展空间。
我们预计未来几年,中国的股票市场,有效性会进一步提高。这是历史趋势,不可阻挡。
未来量化投资的提升应该来自于多策略结合,总有一天技术面的波动会越来越小,技术的进步到达瓶颈,未来量化投资一定会去瓜分原来基本面流派的人赚的钱。
市场有效的时候,你直接买指数就可以了,指数就是真正的价值投资。

03
量化交易这么有“钱途”,为什么又开始进军人工智能大语言模型,您具体是怎么做的,如何实现赛道转换?
梁文锋:核心是好奇心的驱动,对 AI 能力边界的好奇。
对于渴望探索机器学习极限的工程师来说,将进军AI模型是自然而然的事情。
当初,幻方的主要班底里,很多人是做人工智能的。当时我们尝试了很多场景,最终切入了足够复杂的金融,而通用人工智能可能是下一个最难的事之一。
对很多行外人来说,ChatGPT 这波浪潮冲击特别大;但对行内人来说,2012年 AlexNet 带来的冲击已经引领一个新的时代。
AlexNet 的错误率远低于当时其他模型,复苏了沉睡几十年的神经网络研究。虽然具体技术方向一直在变,但模型、数据和算力这三者的组合是不变的。
特别是当 2020 年 OpenAI 发布 GPT3 后,方向很清楚,需要大量算力;但即便 2021 年,我们投入建设萤火二号时,大部分人还是无法理解。
从近处说,GPT4还有很多待解之谜。我们去复刻的同时,也会做研究揭秘。
只做复刻的话,可以在公开论文或开源代码基础上,只需训练很少次数,甚至只需finetune(微调)一下,成本很低。而做研究,要做各种实验和对比,需要更多算力,对人员要求也更高,所以成本更高。
从远处说,我们想去验证一些猜想。
比如我们理解人类智能本质可能就是语言,人的思维可能就是一个语言的过程。你以为你在思考,其实可能是你在脑子里编织语言。这意味着,在语言大模型上可能诞生出类人的人工智能(AGI)。
比如,其实从最早的1张GPU卡,到2015年的100张卡、2019年的1000张卡,再到一万张,这个过程是逐步发生的。
几百张卡之前,我们托管在IDC,规模再变大时,托管就没法满足要求了,就开始自建机房。很多人会以为这里边有一个不为人知的商业逻辑,但其实,主要是好奇心驱动。
对我们来说,这是一个怎么做的问题,而不是为什么做的问题。既然我们想做这个事,又有这个能力,这个时间点上,我们就是最合适人选之一。
我们做大模型,其实跟量化和金融都没有直接关系。我们独建了一个名为深度求索的新公司来做这件事。
幻方作为我们的出资人之一,有充足的研发预算,另外每年有几个亿的捐款预算,之前都是给公益机构,如果需要,也可以做些调整。
我们也在找不同出资方在谈。接触下来,感觉很多VC对做研究有顾虑,他们有退出需求,希望尽快做出产品商业化,而按照我们优先做研究的思路,很难从VC那里获得融资。但我们有算力和一个工程师团队,相当于有了一半筹码。
我们不会过早设计基于模型的一些应用,会专注在大模型上。我们要做的是通用人工智能,也就是AGI。
语言大模型可能是通往AGI的必经之路,并且初步具备了AGI的特征,所以我们会从这里开始,后边也会有视觉等。
04
人们常说,创新是第一动力,人才是第一资源,在人工智能的创业路上,人才如何创新,又扮演什么角色?
梁文锋:前期因为人手不够,会从幻方临时借调一部分人过去。
去年底ChatGPT3.5风靡时,我们就开始动手招聘了,不过我们依然需要更多的人加入。
当前,团队中并没有什么高深莫测的奇才,都是一些 Top 高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。
V2 模型没有海外回来的人,都是本土的。前 50 名顶尖人才可能不在中国,但也许我们能自己打造这样的人。
因为我们在做最难的事,对顶级人才吸引最大的,肯定是去解决世界上最难的问题。其实,顶尖人才在中国是被低估的。
因为整个社会层面的硬核创新太少了,使得他们没有机会被识别出来。我们在做最难的事,对他们就是有吸引力的。
在我看来,人才最重要的素质就是,热爱和扎实的基础能力。其他都没那么重要。
他们的热情通常会表现出来,因为他真的很想做这件事,所以这些人往往同时也在找你。
招人时确保价值观一致,然后通过企业文化来确保步调一致。当然,我们并没有一个成文的企业文化,因为所有成文东西,又会阻碍创新。更多时候,是管理者的以身示范,遇到一件事,你如何做决策,会成为一种准则。
我们的总结是,创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。
总体而言,在人才的选用育留,我们基本还是延续在幻方的人才模式。
幻方招人有条原则是,看能力,而不是看经验。我们的核心技术岗位,基本以应届和毕业一两年的人为主。
如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。从这个角度看,国内合适的候选人就不少。
做一件事,有经验的人会不假思索告诉你,应该这样做,但没有经验的人,会反复摸索、很认真去想应该怎么做,然后找到一个符合当前实际情况的解决办法。
事实上,第一年他们什么都做不出来,第二年才开始有点成绩。但我们的考核标准和一般公司不太一样。
我们没有 KPI,也没有所谓的任务。交给他重要的事,并且不干预他。让他自己想办法,自己发挥。
一家公司的基因是很难被模仿的。比如说招没有经验的人,怎么判断他的潜力,招进来之后如何才能让他成长,这些都没法直接模仿。
我们不会故意回避有经验的人,但更多是看能力。
拿销售这个岗位举个例子。我们的两个主力销售,都是这个行业的素人。一个原来做德国机械品类外贸的,一个是原来在券商做后台写代码。
他们进入这个行业时,没有经验,没有资源,没有积累。而现在我们可能是唯一一家能以直销为主的大私募。
我们不像一般公司,看重客户下单量,我们的销售卖多少和提成不是一开始就算好的,而会更鼓励销售去发展自己的圈子,认识更多人,产生更大影响力。
我们认为,一个让客户信任的正直的销售,可能在短时间内做不到让客户来下单,但可以让你觉得他是个靠谱的人。
05
从量化交易到人工智能,这是一个巨大的跨越,在您看来,做好一家人工智能公司,最重要的是什么?
梁文锋:不管是 Google 实验室,还是 OpenAI,甚至中国大厂的 AI Lab,都很有价值的。最后是 OpenAI 做出来,有历史的偶然性。
我觉得创新首先是一个信念问题。为什么硅谷那么有创新精神?首先是敢。
ChatGPT 出来时,整个国内对做前沿创新都缺乏信心,从投资人到大厂,都觉得差距太大了,还是做应用吧。但创新首先需要自信。这种信心通常在年轻人身上更明显。
创新就是昂贵且低效的,有时候伴随着浪费。所以经济发展到一定程度之后,才能够出现创新。很穷的时候,或者不是创新驱动的行业,成本和效率非常关键。OpenAI也是烧了很多钱才出来。
这个世界存在很多无法用逻辑解释的事,就像很多程序员,也是开源社区的疯狂贡献者,一天很累了,还要去贡献代码。
类似你徒步50公里,整个身体是瘫掉的,但精神很满足。不是所有人都能疯狂一辈子,但大部分人,在他年轻的那些年,可以完全没有功利目的,投入地去做一件事。
幻方时代,我们就很少自上而下地指派目标或任务。DeepSeek 也全是自下而上。而且我们一般不前置分工,而是自然分工。每个人有自己独特的成长经历,都是自带想法的,不需要主导他。
探索过程中,他遇到问题,自己就会拉人讨论。不过当一个想法显示出潜力,我们也会自上而下地去调配资源。
我们每个人对于卡和人的调动是不设上限的。如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人,只要对方也有兴趣。
我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特的经历,很有意思。很多人对做研究的渴望,远超对钱的在意。
06
当前,进入新一轮的科技革命,中美在人工智能不断暗中较量,国内各个大厂也掀起“百模大战”,您认为你们的优势是什么?
梁文锋:大厂肯定有优势,但如果不能很快应用,大厂也不一定能持续坚持,因为它更需要看到结果。
头部的创业公司也有技术做得很扎实的,但和老的一波AI创业公司一样,都要面对商业化难题。
比如,我们发布产品后, 5 天后智谱 AI 就跟进了,之后是字节、阿里、百度、腾讯等大厂。
智谱 AI 降的是一个入门级产品,和我们同级别的模型仍然收费很贵。字节是真正第一个跟进的。
旗舰模型降到和我们一样的价格,然后触发了其它大厂纷纷降价。因为大厂的模型成本比我们高很多,所以我们没想到会有人亏钱做这件事,最后就变成了互联网时代的烧钱补贴的逻辑。
无论大厂,还是创业公司,都很难在短时间内建立起碾压对手的技术优势。
因为有OpenAI指路,又都基于公开论文和代码,最晚明年,大厂和创业公司都会把自己的大语言模型做出来。
大厂和创业公司都各有机会。现有垂类场景不掌握在初创公司手上,这个阶段对初创公司不太友好。
但因为这种场景说到底也是分散的、碎片化的小需求,所以它又是更适合灵活的创业型组织的。
从长期看,大模型应用门槛会越来越低,初创公司在未来20年任何时候下场,也都有机会。
我们主要的精力在研究下一代的大模型。还有很多未解决的问题。 所有的套路都是上一代的产物,未来不一定成立。
拿互联网的商业逻辑去讨论未来 AI 的盈利模式,就像马化腾创业时,你去讨论通用电气和可口可乐一样。很可能是一种刻舟求剑。
我们认为当前阶段是技术创新的爆发期,而不是应用的爆发期。长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其它公司在 DeepSeek 的基础上构建 toB、toC 的业务。
如果能形成完整的产业上下游,我们就没必要自己做应用。当然,如果需要,我们做应用也没障碍,但研究和技术创新永远是我们第一优先级。
未来的世界很可能是专业化分工的,基础大模型需要持续创新,大厂有它的能力边界,并不一定适合。
技术没有秘密,但重置需要时间和成本。英伟达的显卡,理论上没有任何技术秘密,很容易复制,但重新组织团队以及追赶下一代技术都需要时间,所以实际的护城河还是很宽。
我们的目标也很明确,就是不做垂类和应用,而是做研究,做探索。
按照教科书的方法论来推导创业公司,在当下,他们做的事,都是活不下来的。
但市场是变化的,真正的决定力量往往不是一些现成的规则和条件,而是一种适应和调整变化的能力。
很多大公司的组织结构已经不能快速响应和快速做事,而且他们很容易让之前的经验和惯性成为束缚,而这波AI新浪潮之下,一定会有一批新公司诞生。
07
人工智能的竞争是公司的竞争,也是国家的竞争,您怎么看大模型创业公司的终局之战,又如何看待人工智能公司的未来?
梁文锋: 在美国每天发生的大量创新里,这是非常普通的一个。
他们之所以惊讶,是因为这是一个中国公司,在以创新贡献者的身份,加入到他们游戏里去。毕竟大部分中国公司习惯 follow,而不是创新。
过去三十年,我们都只强调赚钱,对创新是忽视的。创新不完全是商业驱动的,还需要好奇心和创造欲。我们只是被过去那种惯性束缚了,但它也是阶段性的。
创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但现在,你看无论中国的经济体量,还是字节、腾讯这些大厂的利润,放在全球都不低。我们创新缺的肯定不是资本,而是缺乏信心以及不知道怎么组织高密度的人才实现有效的创新。
你们发布过代码生成和数学的模型,也从 dense 模型切换到了 MOE,所以你们的 AGI 路线图有哪些坐标?可能是 2 年、5 年或者 10 年,总之会在我们有生之年实现。至于路线图,即使在我们公司内部,也没有统一意见。
但我们确实押注了三个方向。一是数学和代码,二是多模态,三是自然语言本身。
数学和代码是 AGI 天然的试验场,有点像围棋,是一个封闭的、可验证的系统,有可能通过自我学习就能实现很高的智能。
另一方面,可能多模态、参与到人类的真实世界里学习,对 AGI 也是必要的。我们对一切可能性都保持开放。
我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国 AI 和美国有一两年差距,但真实的 gap 是原创和模仿之差。
如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。
他们能看到下一代的技术趋势,手里有路线图。中国 AI 的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。
未来的终局之战, 可能活下来的公司也就 2 到 3 家。现在都还处在烧钱阶段,所以那些自我定位清晰、更能精细化运营的,更有机会活下来。
其它公司可能会脱胎换骨。有价值的东西不会烟消云散,但会换一种方式。
对于我们而言,短期内没有融资计划,我们面临的问题从来不是钱,而是高端芯片被禁运。
我经常思考的是,一个东西能不能让社会的运行效率变高,以及你能否在它的产业分工链条上找到擅长的位置。
只要终局是让社会效率更高,就是成立的,中间很多都是阶段性的,过度关注必然眼花缭乱。


财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有