4B小模型逆袭671B大模型Jan-nano表现亮眼DAPO微调成关键__财经头条_

【4B小模型逆袭671B大模型##Jan-nano表现亮眼##DAPO微调成关键】4B小模型也能“以小博大”？最近热度很高的Jan-nano就是这么一个例子。在MCP智能体任务上，它居然超越了671B的DeepSeek-v3大模型，在SimpleQA测试里拿到了80.7%的高分。而它的底座模型，其实就是大家熟悉的Qwen3-4B。Jan-nano能逆袭的关键，是用上了字节和清华团队开源的DAPO微调方法（强化学习策略优化），加上对MCP协议的专门适配，让它能直接调用各种MCP服务器工具，整合执行力相当强。目前它的能力包括：在合适提示词下完成深入研究任务能从搜索结果中提取有效信息在金融、新闻等复杂场景中具备实用性背后团队Menlo Research也值得关注：是一个开源、强调用户自托管的AI研发组织创始人是斯坦福背景、曾在Google任职的夫妻档主推产品Jan，是一个可离线运行、替代ChatGPT的开源助手，主打自主执行、多应用切换、学习用户习惯等功能Jan-nano目前的表现只是一个起点，团队表示下个版本的目标是85%。虽然目前优势只体现在某一类任务上，但4B模型能打成这样，已经很能说明DAPO这类微调技术的潜力。模型开源链接已放出，有兴趣可以自行尝试。

头条号入驻

量子位追踪报道人工智能产品和技术新趋势

财经自媒体联盟更多自媒体作者

今日推荐优秀作者看点月榜

新浪财经头条意见反馈留言板

4000520066 欢迎批评指正

4B小模型逆袭671B大模型Jan-nano表现亮眼DAPO微调成关键

头条号入驻

AI打宝可梦

谷歌发布离线机器人模型Gemini Robotics On-Device

华科校友在港冲刺AI infra第一股！已是中国最能赚的独立边缘云服务商，王小川天使轮就投了

财经自媒体联盟更多自媒体作者

热文排行榜