无需多次唤起可流式交互,国内首个所见即所得模型亮相

无需多次唤起可流式交互,国内首个所见即所得模型亮相
2024年07月05日 13:55 京报网_北京日报官方网站

7月5日,在世界人工智能大会期间,商汤科技发布国内首个所见即所得模型“日日新5o”,实现了无需多次唤起,而是如同人与人之间实时交流的“流式交互”,对标GPT-4o。

“你知道我现在在哪吗?”当工作人员和“日日新5o”打了个招呼,它就自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出工作人员身处世界人工智能大会会场,并表示在这个地方可以“好好学习”。接下来,工作人员拿了一只小狗玩偶,“日日新5o”准确识别出并描述了小狗的外貌、表情以及重要穿戴。

随后,在镜头下,工作人员随便翻开一本书的任何一页,“日日新5o”都能娓娓道来进行介绍。这个过程中,系统并非简单地进行文字识别,而是识别图文后给出了普通人容易理解的总结,这些在瞬间就能完成,做到实时交互。

工作人员还现场发挥“画功”,随手画了一只简笔画小兔子,“日日新5o”直呼画得可爱,而在工作人员又画了一个微笑表情后,它从这个平静的表情中捕捉到了笑意,工作人员又改了一笔把嘴巴画大增添了舌头,“日日新5o”看到后立马说道,“这表情开心多了”。

能听会看,还会主动找话题,如同真人聊天一般的交流对话,工作人员介绍,这种交互模式特别适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,实现“对标GPT-4o”的交互体验。

为了让更多企业低门槛接入并使用“日日新”大模型体系,商汤于近期推出了“大模型0元Go”计划,凡是“日日新”的新注册用户,都可获得涉及调用、迁徙、训练等多项免费服务。同时,平台还将免费提供5000万Tokens包,并且提供专属搬家顾问,帮助OpenAI用户实现零服务成本迁移。

来源:北京日报客户端

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部