1月10日,澎湃新闻获悉,商汤正式推出 “日日新”融合大模型,深度推理与多模态信息处理能力均大幅提升。不止能达到人类“看”和“想”的水平,还可以解决更多复杂问题,看不清的字体、数据图表里的信息、文学创作与撰写等都可以实现。
据国内权威大模型测评机构SuperCLUE最新发布的中文大模型基准测评报告,商汤“日日新”融合大模型与 DeepSeek V3并列国内榜首。在一项多模态评测中,分数大幅领先于GPT-4o。
据悉,商汤在预训练阶段采用海量图文交错数据,通过逆渲染、基于混合语义的图像生成等合成大量融合模态数据,在图文模态间建立大量交互桥梁,增强了模型基座对模态之间丰富关系的理解。后训练阶段,商汤构建大量跨模态任务,包括视频交互、多模态文档分析、城市场景理解、车载场景理解等,把任务融入增强训练过程中,形成应用落地反哺基础模型迭代的闭环。(澎湃新闻记者 秦盛)
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有