马斯克又又又开了一场“载入史册”的发布会。
上一次还是去年10月发布Cybercab的“We,robot”,那天马斯克让直播间里的全球观众等了一个半小时。
而这一次,马斯克在X平台重磅发布的“地表最强AI”Grok 3模型,仅仅迟到了18分钟。
“迟到人设”屹立不倒,观看体验倒是成倍提升。

值得注意的是,Grok 3的发布正赶上DeepSeek名声大噪之际,联想到马总对DeepSeek那股说不清道不明的在意——
喜欢5G冲浪的网友,经常能在质疑DeepSeek的言论下面,看到马斯克的身影:
比如Scale AI掌门人亚历山大·王说DeepSeek成本才没有那么低,他们有5万块英伟达H100芯片,只不过不能往外说。
马斯克就很捧场的表示:那可不

加上发布会上,Gork 3也多次提到自己的模型非常强大:
不仅击败了包括DeepSeek-V3和GPT-4o在内的竞争对手;推出了名为“DeepSearch”的智能搜索引擎;还有一张长得贼眼熟的UI界面……

导致大伙难免就把Grok 3和DeepSeek放在一起讨论:
有人质疑Grok 3是否真的如马斯克所说“聪明得吓人”“是最聪明的AI”?

也有人开始担心DeepSeek才走红不到一个月,就要被大力出奇迹的Grok“炸翻”……
具体结论是啥样的黑马不知道,但咱们可以先走一波Grok 3的发布会,看看到底是什么给了马斯克“地表最强”的自信?

20亿张H100堆出来的“地表最强”
先介绍一下马斯克的xAI,这家人工智能公司是马斯克在2023年7月创办的,其首个大模型Grok发布于同年11月。
2024年,xAI发布了Grok1.5和Grok 2。
Grok 3原本计划是在去年年底发布的,马斯克在社交平台上造足了势,称其是“聪明得吓人”“最聪明的AI”。
结果马斯克没想到,只是照例小小“跳票”了几个月,市场上就已经风云变幻——
先是OpenAI宣布开启算力基础建设的“星际之门”项目,另一边中国又出了个DeepSeek一口气把大模型成本打到一个让人难以置信的水平。

而这边马斯克的牛已经吹了出去,Grok 3夹在中间不上不下的,略显尴尬。
但这次在发布会上,马斯克公布了一个非常amazing的信息:
训练Grok 3的Colossus超级计算机,包含了20万张英伟达H100芯片;
也就是说,Grok 3是全球首个20万块GPU训练出的AI大模型,号称计算量是Grok 2的10倍。

怎么说呢,如果马斯克没有吹牛,Grok 3确实足够遥遥领先。
所谓大力出奇迹。
在xAI提供的多项基准测试中,Grok 3在数学、科学问答、编码上,都大幅度超越了DeepSeek-V3、Gemini-2 Pro、GPT-4o等模型。

在Chatbot Arena竞技场,Grok3直接拿下第一,分数也高得惊人。

不仅第一,还是目前唯一1400分以上的模型,直接把没火多久的Gemini2.0甩开一大截。
此外,Grok 3还推出了推理模型——Grok-3 Reasoning。
在聊天入口中同样可以选择深度思考(Grok-3中叫“Think”),同样也会显示模型“思考”的过程。

但马斯克表示,xAI 会稍微模糊思维,这样其他公司就不能直接复制xAI的聊天机器人。
而根据演示,Grok 3的可以做到推算出太空飞船从地球发射、到火星着陆、再到下一次发射返回地球的动画代码。
甚至还能推算宇航员出仓时间、火星探索的轨道运转等。

而马斯克表示,这就是Space X真实的探索轨道,并表示3年内,计算机就能打败人类。

写在最后
基于Grok 3强大的算力支持和跑分演示所展示的惊人效果,哪怕马斯克一再强调,目前Grok 3还处于测试版本,正式版还需要再等一周。
但吃瓜群众对于Grok 3的正式发布已经蠢蠢欲动——
是真牛逼还是吹牛逼,你先拉出来遛遛,

而马斯克表示,目前X平台上预先订阅用户已经可以体验Grok 3,但正式发布还需要等到一周后。
Grok 3网址为:grok.com。
支持语音功能,也会推出App(但最新版在网页端)
不同于DeepSeek的算法优化路径,仅用2048个H800 GPU,训练2788千小时就完成了深度学习;
Grok 3走的是强算力平推的火力覆盖路线——8个月20万块H100的训练成本,使得Grok 3在多个领域都表现出了强大的竞争力。

不过在黑马看来,Grok 3的出现在某种程度上其实是一件好事。
DeepSeek的价值在于打通了低成本大模型的技术路径,开源又进一步加速了国内AI发展进程。
低成本路径下,中小企业的成本得到了大幅度降低,AI应用有预期会迎来一波大的爆发,能够为AI模型提供更肥沃的生态土壤。
简而言之,DeepSeek作为推理模型而言,优劣都很突出,但其真正的价值并不局限在应用本身的推理能力,而是在于其对生态的反哺。

而Grok 3却是采用大量资源堆出来的超级推理模型,在应用体验上应该更加全面和智能。
只不过当前我们无法确认Grok 3是否真的如马斯克所说的那样amazing。
作为一个普通用户来说,黑马是希望能出现越来越多便宜、好用、算力充足的模型服务大众的。
(还是想吐槽一句,DeepSeek你真的太卡了)
而现在,就让子弹先飞一周,再见分晓吧。
撰文:柯然
编辑:小马哥








财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有