DeepSeek如一根针扎破了大模型这个泡

DeepSeek如一根针扎破了大模型这个泡
2025年01月27日 08:02 飞象网项立刚

2022年底chatGPT发布,2023年开始大规模炒作,2024年差不多达到最高峰。对于多模态通用大模型,我是花了点时间研究,2023年就出了一本书《chatGPT 大模型背后的技术与商业逻辑》,对于人工智能,我渐渐看清楚,它并不仅仅是大模型,而是由智能感应、信息存储、信息传输、信息处理(算力、算法、大模型)、信息终端共同构建起的一个系统,对于人类而言,人工智能才是刚刚开始,远不到我们完全看清时候,我们只要一点点往前推进就可以了。

对于多模态通用大模型的炒作,中国媒体是非常积极的,中国学术界也非常热衷,积极性非常高,普通网民,也有不少很有热情,除了大家关心技术,还有一个很重要的原因,最近这些年,在科技领域中国正在逼近甚至有超越美国的势头,虽然学术界还在坚持,中国和美国有很大差距,但是从高铁、移动通信、特高压等众多的领域,我们也看不出美国有多强,基础建设不如中国,这是肉眼可见的。说美国科技更强,让越来越多的中国人怀疑。所以他们只好把科技分成科学和技术,告诉大家,美国虽然技术不行了,但是科学还是很强的,远超中国。

问题是说美国科学强,强在哪里,没法证明,只能空口说美国强。

现在终于盼来的AI,加上美国进行芯片封锁,学术界和公知们终于盼来了一个美国越过中国的地方,而且这是一个看得见的技术。这算是美国为他们挽回了一点面子。

所以我们看到学术界不少人站出来,说中国在人工智能距离美国有巨大差距,永远追不上,盼望着美国一封锁芯片,中国在这个领域就一落千丈。

事实上就是人工智能领域,中国和美国并没有什么差距,而且全面超过美国,这基本上是肯定的,我说的人工智能5大组成部分,在智能感应、信息存储、信息传输和智能终端领域,美国和中国存在很大差距,而且是真的追赶不上,至于信息处理,算力、算法、大模型中国也谈不上多落后,因为AI最后并不是拼算力,它是需要多种能力一起实现信息处理能力,算力很重要,但是算力不是唯一。

美国开始推chatGPT,但是大模型从来不是信息处理唯一手段,而且这个模型是不断优化、提升,实现更好的效果,不仅是由算力决定,还是有算法、模型架构、各种算子、数据多方面形成的,最后实现效果。美国为了自己优先位置,用了最简单、粗暴的方式,就是堆算力,还希望通过封锁对中国芯片的出口,来实现算力的优先。当然中国有一批人跟在后面鼓吹,认为中国永远追不上。

事实上要实现大模型的高效,有多条路可以走,而且可以用较低的算力投入,也能实现较好的效果,几百万美元的投入,达到了几十美元投入的效果,能力清清楚楚地放在那儿,只是一个成立两年中国创业公司做的,而且这个团队没有什么海外回来的,就是中国本土的创业者,一群年轻的小朋友做出来的。

我这些年来,越来越不相信什么海外回来的,他们没什么技术,真正的技术和能力都是本土的小朋友熬出来的,他们做技术研发,脑子没有框框,组织能力更强,思考的更加全面,而且更有开拓能力,不受什么国外的框架影响,他们真进来干,很快就有突破,远比那些海外回来的干得好,工作效率更高,那是自然了。

一个DeepSeek震惊了世界,其实并不多复杂,这个世界没有什么神,只有努力的人,中国的年轻一代是真正掌握和技术能力人,他们会所向无敌。

多模态通用大模型,这只是一个大泡泡,DeepSeek一针就扎破了,人工智能还是中国强。不信可以再看5年,中国会依靠人工智能早已经起强大的社会能力,美国还是毫无作为。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部