文 / 现代物流报记者 贾奥胜
近期,国产大模型领域呈现出“周周有新品、月月有突破”的井喷式发展格局,在通用模型、垂直场景及开源生态等方面均取得了显著成果,令人目不暇接。
(图源:deepseek官网)
今年的《政府工作报告》提出,持续推进“人工智能+”行动。
近日,交通运输部已启动综合交通运输大模型(简称交通大模型)建设工作,并组建工作专班,多次组织专题调研和论证,研究交通大模型架构和建设路径。
这一繁荣景象的背后,不仅有技术迭代的推动,更有政策与资本的双重助力,同时在交通、能源等多个行业也涌现出诸多创新应用案例。
国产大模型井喷式爆发
交通运输大模型建设采用“1+N+X”体系,即基于1个通用基础大模型,开发N个行业垂域模型,服务于物流调度、交通规划、应急响应等典型场景。对物流行业意义重大,有望推动物流行业的智能化升级,提高运输效率和服务质量。
这一建设工作的起步,实则是国产大模型蓬勃发展的有力见证。
2024年11月,深度求索DeepSeek-R1以数学推理和代码生成能力为核心,借助强化学习显著提升了性能,成为首个对标OpenAI o1的国产深度推理模型。
一时间,引燃AI热潮。
第三方即配平台顺丰同城成为首批接入DeepSeek大模型的物流企业,将依托DeepSeek低成本、高性能、高开放度的三重优势,为顺丰同城全场景业务和全生态链参与者提升智慧化赋能。
同期,阿里通义QwQ系列推出32B参数推理模型。12月,月之暗面Kimi-K1突破200万字长文本处理能力,重点优化法律合同解析与学术研究场景,成为长文本领域的标杆。
今年2月,阿里通义Qwen2.5-Max基于MoE架构的千亿级模型,在Chatbot Arena盲测中综合性能跻身全球前五,多模态能力显著提升。华为昇腾DeepSeek系列接入国家超算互联网平台,实现低成本推理服务,获微软CEO纳德拉公开认可其计算效率。
一季度,MiniMax-Text-01和首个全国产算力训练的深度推理模型讯飞星火X1相继问世。
助推物流业新生态构建
国产AI大模型的爆发式增长,背后是供应链全链路数字化升级的必然结果。
我国通过政策引导和资本投入,大力推动算力基础设施的规模化建设。如今,覆盖全国的智算中心和算力网络已初具规模,如合肥第二总部、中国移动“九天”大模型平台等。
(图源:新华社)
我国庞大的用户基数和丰富的应用场景,如电商、物流、工业等,产生了海量多模态数据,为AI大模型训练提供了丰富的“燃料”。同时,数据基础设施不断完善,MineData平台、国汽智图等通过数据脱敏、合规传输机制,有效解决了数据安全与隐私问题,加速了数据流通,使得数据能够更好地服务于模型训练。
国产AI企业纷纷通过“芯片-框架-模型-应用”全栈布局,形成闭环生态。京东物流超脑大模型与智能仓储硬件实现端到端调度,提高了物流运作的智能化水平。
供应链各环节的智能化需求倒逼大模型技术创新。在制造业,AI大模型用于需求预测,菜鸟“天机π”将交付周期缩短;在物流领域,智能调度和OCR识别技术得到广泛应用,百度地图物流大模型做到了运输成本的优化。
国务院国资委将出台专项支持政策,持续深化中央企业“AI+”专项行动,工信部“大模型产业化应用”政策等为技术研发和场景落地提供了有力的政策支持。例如,北京市车路云一体化项目通过政企合作探索数据共享机制,推动了AI大模型在智能交通领域的应用。
我国AI大模型的爆发是供应链全链路数字化升级的必然结果。上游算力与数据的突破、中游技术生态的整合、下游场景需求的拉动,叠加政策与资本红利,共同推动了国产AI大模型的快速发展。
狂欢背后的冷思考
AI大模型的爆发助推了我国全社会物流成本的有效降低。但在繁荣背后,也面临着诸多隐忧与挑战。
从技术层面来看,技术同质化与资源分散问题较为突出。当前,大多数机构研发的大模型集中于通用对话、代码生成等场景,导致在这些领域竞争激烈,而在部分垂直领域,如农业、能源等,仍缺乏高质量模型。这不仅限制了国产大模型在更多行业的应用,也造成了资源的浪费。
同时,尽管国产芯片适配率有所提升,但大部分头部模型仍依赖英伟达A100/H100进行训练。华为昇腾等国产算力集群虽然取得了一定进展,但尚未完全解决软件生态兼容问题,这使得国产算力在市场竞争中处于劣势。
训练资源的限制也是一大难题。据公开信息,训练GPT-4消耗了约2.4亿度电,使用2.5万块英伟达A100 GPU(每块功耗 400W),单次训练耗时3个月。
而国内拥有1万枚GPU的企业很少,且单枚GPU普遍弱于英伟达A100。由于英伟达A100及以上性能GPU被列入管制清单,中国企业能获取的替代品为英伟达A800,但A800也存在缺货和溢价的情况。这导致国内大模型训练面临硬件资源不足和成本高昂的双重困境。
商业化与可持续性难题同样不容忽视。多数厂商依赖API调用收费,但DeepSeek- R1等开源模型的出现挤压了付费空间,得部分创业公司因资金链断裂而退出市场。
(图源:小红书)
面对这些挑战,国产大模型需探索从“量”到“质”的转型路径。国产大模型在取得一定成绩的同时,需警惕低水平重复与资源分散问题。通过开源协作、数据共享与垂直深耕,推动从“量”到“质”的转型,才能实现可持续发展,在人工智能领域占据更有利的地位。


财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有