DeepSeek如一根针扎破了大模型这个泡_

2022年底chatGPT发布，2023年开始大规模炒作，2024年差不多达到最高峰。对于多模态通用大模型，我是花了点时间研究，2023年就出了一本书《chatGPT 大模型背后的技术与商业逻辑》，对于人工智能，我渐渐看清楚，它并不仅仅是大模型，而是由智能感应、信息存储、信息传输、信息处理（算力、算法、大模型）、信息终端共同构建起的一个系统，对于人类而言，人工智能才是刚刚开始，远不到我们完全看清时候，我们只要一点点往前推进就可以了。

对于多模态通用大模型的炒作，中国媒体是非常积极的，中国学术界也非常热衷，积极性非常高，普通网民，也有不少很有热情，除了大家关心技术，还有一个很重要的原因，最近这些年，在科技领域中国正在逼近甚至有超越美国的势头，虽然学术界还在坚持，中国和美国有很大差距，但是从高铁、移动通信、特高压等众多的领域，我们也看不出美国有多强，基础建设不如中国，这是肉眼可见的。说美国科技更强，让越来越多的中国人怀疑。所以他们只好把科技分成科学和技术，告诉大家，美国虽然技术不行了，但是科学还是很强的，远超中国。

问题是说美国科学强，强在哪里，没法证明，只能空口说美国强。

现在终于盼来的AI，加上美国进行芯片封锁，学术界和公知们终于盼来了一个美国越过中国的地方，而且这是一个看得见的技术。这算是美国为他们挽回了一点面子。

所以我们看到学术界不少人站出来，说中国在人工智能距离美国有巨大差距，永远追不上，盼望着美国一封锁芯片，中国在这个领域就一落千丈。

事实上就是人工智能领域，中国和美国并没有什么差距，而且全面超过美国，这基本上是肯定的，我说的人工智能5大组成部分，在智能感应、信息存储、信息传输和智能终端领域，美国和中国存在很大差距，而且是真的追赶不上，至于信息处理，算力、算法、大模型中国也谈不上多落后，因为AI最后并不是拼算力，它是需要多种能力一起实现信息处理能力，算力很重要，但是算力不是唯一。

美国开始推chatGPT，但是大模型从来不是信息处理唯一手段，而且这个模型是不断优化、提升，实现更好的效果，不仅是由算力决定，还是有算法、模型架构、各种算子、数据多方面形成的，最后实现效果。美国为了自己优先位置，用了最简单、粗暴的方式，就是堆算力，还希望通过封锁对中国芯片的出口，来实现算力的优先。当然中国有一批人跟在后面鼓吹，认为中国永远追不上。

事实上要实现大模型的高效，有多条路可以走，而且可以用较低的算力投入，也能实现较好的效果，几百万美元的投入，达到了几十美元投入的效果，能力清清楚楚地放在那儿，只是一个成立两年中国创业公司做的，而且这个团队没有什么海外回来的，就是中国本土的创业者，一群年轻的小朋友做出来的。

我这些年来，越来越不相信什么海外回来的，他们没什么技术，真正的技术和能力都是本土的小朋友熬出来的，他们做技术研发，脑子没有框框，组织能力更强，思考的更加全面，而且更有开拓能力，不受什么国外的框架影响，他们真进来干，很快就有突破，远比那些海外回来的干得好，工作效率更高，那是自然了。

一个DeepSeek震惊了世界，其实并不多复杂，这个世界没有什么神，只有努力的人，中国的年轻一代是真正掌握和技术能力人，他们会所向无敌。

多模态通用大模型，这只是一个大泡泡，DeepSeek一针就扎破了，人工智能还是中国强。不信可以再看5年，中国会依靠人工智能早已经起强大的社会能力，美国还是毫无作为。