最近,全球科技投资界的标杆机构发布的a16z榜单Top 50的AI产品中有近半是来自中国。要知道,只有投资价值极高的产品才会被收录其中。更值得注意的是,跻身web榜单前列的海螺AI(Hailuo AI)和APP榜前列的Talkie都是来自同一家中国AI公司。
本文作者:Mr.K,黄哲铿,知名数字商业顾问,「顿悟山丘」创始人,科技博主,曾担任海尔、中通快递、1药网技术高管,著有《技术人修炼之道》《技术管理之巅》。分享:个体成长、科技趋势、数字化转型、商业洞察。由「技术领导力」原创首发, 数字化企业经授权发布。
其中海螺AI更是力压可灵和OpenAI的Sora稳居全球视频生成赛道王座。这家公司就是国内大模型“六小虎”之一,MiniMax。而在较早之前的2025年1月,MiniMax还陆续发布了多款涵盖多领域的大模型。
模型发布后,很快就吸引了国内外专家、学者和AI爱好者的广泛关注。这比DeepSeek的爆火,早了一个多月,让中国AI技术在国际间引发了持续的回响。
01
MiniMax发布多款大模型
引爆全球AI圈
2025年开年,MiniMax连续发布多个大模型,这非常符合MiniMax“技术驱动”的作风:一旦出手,就是王炸。
1)视频新模型S2V-01。1月10日,MiniMax发布了S2V-01视频模型,通过单图主体参考架构,能够做到传统方案1%以下的输入和计算成本。你只需输入一张图片, 就可以得到细节还原精确的视频, 具有高自由度和组合性,而且用时大大缩短。

2)新一代开源模型MiniMax-01系列。紧接着,在1月15日发布了新一代MiniMax-01系列开源大模型,包含基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01。不同于Transformer传统架构的是,它采用了线性注意力机制,综合性能比肩GPT-4o、Claude-3.5等海外领军模型,并且能够高效处理高达400万token的输入,可输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。

MiniMax-01系列模型发布后,立刻引发国内外热议浪潮。海外AI从业者与媒体,对其技术架构路线、模型综合能力、技术创新性给予了高度肯定。被认为一个来自中国的可以与OpenAI“掰手腕”的顶尖开源模型。
3)语音模型T2A-01-HD。创新的步伐永不停歇,1月20日,MiniMax继续发布T2A-01系列语音模型,不仅支持17种语言的流畅表达和上百种预置音色,而且音质稳定清晰、韵律自然、情绪精准表达、准确度高,语音生成速度更快、能力更稳定。

4)图生视频模型I2V-01-Director。2月24日,MiniMax再度发力,新推出了图生视频模型I2V-01-Director。与此前「镜头控制」的文生图视频T2V-01-Director共同组成01-Director系列。「镜头控制」模型让普通用户也可以成为导演,无论是文生视频、图生视频,都能够灵活自主地控制镜头语言,释放你的创作潜能。T2V-01-Director、I2V-01-Director,现已对全球用户开放,在MiniMax开放平台和海螺视频均已上线。
02
押注非共识技术路线
“线性注意力”是未来
在技术创新方面,MiniMax始终保持着业界领先的地位,在底层模型算法上更是不走寻常路,打破Transformer的传统架构,押注非共识技术路线“线性注意力”。使得MiniMax-01的超长文本处理能力成为业界天花板。
1)Transformer的“稀疏注意力”,有其局限性。Transformer的二次复杂度一直是学界关注的问题,随着token长度增加,计算量与序列长度的平方成正比,导致算力增加迅速。
稀疏注意力的方案思想是采样注意力矩阵的部分数据来计算,避免全局计算来减少计算复杂度。但MiniMax认为这样是以有损的方案逼近Full Attention,而线性注意力的方案可以实现无损优化。
2)模型规模越大,“线性注意力”优势越明显。 在长文本领域,线性注意力比稀疏注意力更有优势,尤其当模型规模越大时,线性注意力在计算复杂度上的优化效果越明显,而且上限极高。而长上下文处理能力可以加强智能体的记忆和通讯,这将是在Agent时代的核心基建。
3)新的深度推理多模态模型,即将发布。笔者了解到,MiniMax将在4~5月份发布基于Linear Attention架构的深度推理多模态模型,模型的综合能力非常值得期待。
03
MiniMax真正的目标是
加速全球技术迭代
以上,笔者跟大家聊了MiniMax的硬核技术,技术的背后体现了公司的文化以及创始人的技术哲学理念。MiniMax之所以能够在强手如林的全球AI产业界保持领先位置,跟它的技术信仰是息息相关的。
1)坚持技术驱动的公司,才有生命力
在AI领域不管创业公司还是大厂,仍沿袭互联网产品的惯性思维,都还在用做推荐系统的方法来做大模型产品。“推荐” 的逻辑是,用户越多,反馈越多,推荐引擎越聪明。MiniMax创始人闫俊杰却不这么认为,他在接受媒体采访时说,“当技术与产品冲突时,技术优先”——他坚定地认为MiniMax为技术驱动型公司,强调技术迭代速度才是核心竞争力,而非短期用户规模或商业化指标。这一理念外化为两大实践:一是清晰定义模型能力分级,通过技术手段逼近目标,而非依赖用户反馈的被动优化;二是坚信“模型即应用”,即顶尖模型的突破直接催生颠覆性应用,而非通过用户数据反哺模型升级。
这一洞见不仅颠覆了传统互联网方法论,更揭示了AI技术革命的本质:以底层创新驱动上层爆发,而非在既有范式内做数据内卷。海螺AI的快速崛起与DeepSeek的爆火出圈,正是对这一理念的强有力佐证。
2)开源会加速技术进化
当谈到MiniMax为何选择开源时,闫俊杰给出了他的思考,如果重新选,第一天就应该开源。开源会加速技术进化,做得好的地方有鼓励,不好的地方会有很多批评,外面的人也会有贡献,这是MiniMax选择开源的最大驱动力。笔者认为,这是回归“第一性原理”的思考,但凡能够加速技术进化的事情,优先级是最高的。
开源的另一个好处,就是有助于技术品牌的建立,MiniMax非常重视技术品牌的打造,这源于闫俊杰对技术品牌的深刻认知,他认为技术品牌之所以重要,本质也是因为这个行业最大的驱动力是技术进化。
在AI领域有一种偏保守的思想认为,开源会影响公司的核心竞争力——因为你把核心技术都开源了,竞争对手很快就会迎头赶上。闫俊杰却不认同这种说法,他认为开源不会影响公司的核心竞争力,即便是OpenAI,今天也应该开源,因为它的核心能力已经不是模型比Claude或Gemini好多少,而是ChatGPT的品牌与心智。开源恰恰是对一家AI公司的技术品牌以及用户心智有好处的。
开源对于AI公司来说是一种长期策略,因为所有模型一年之后都会落后,只有技术的不断进步才能保持领先,基于这个判断,MiniMax的通用模型后面也会持续开源。
04
结束语
凯文·凯利说过:“技术想要什么?它想要进化。”
MiniMax选择了一条既深且远的道路,坚持“线性注意力”的非共识技术路线,相信技术驱动,选择开源。这或许正是科技文明的终极意义:不是独行者的领跑,而是同行者的共舞。
当硅谷仍沉迷于算力军备竞赛时,中国AI企业正以算法优化与工程效率重塑游戏规则。全球AI竞争的叙事已悄然改写,中国AI企业正以技术为笔墨,书写着开放、协作与普惠的新篇章。
在算法的星河中,每一次创新都在追问——我们能否以更低的熵增,抵达更远的未来?答案,或许就藏在下一行开源代码当中。


财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有