4B小模型逆袭671B大模型Jan-nano表现亮眼DAPO微调成关键

4B小模型逆袭671B大模型Jan-nano表现亮眼DAPO微调成关键
2025年06月16日 17:40 量子位
【4B小模型逆袭671B大模型##Jan-nano表现亮眼##DAPO微调成关键】4B小模型也能“以小博大”?最近热度很高的Jan-nano就是这么一个例子。在MCP智能体任务上,它居然超越了671B的DeepSeek-v3大模型,在SimpleQA测试里拿到了80.7%的高分。而它的底座模型,其实就是大家熟悉的Qwen3-4B。Jan-nano能逆袭的关键,是用上了字节和清华团队开源的DAPO微调方法(强化学习策略优化),加上对MCP协议的专门适配,让它能直接调用各种MCP服务器工具,整合执行力相当强。目前它的能力包括:在合适提示词下完成深入研究任务能从搜索结果中提取有效信息在金融、新闻等复杂场景中具备实用性背后团队Menlo Research也值得关注:是一个开源、强调用户自托管的AI研发组织创始人是斯坦福背景、曾在Google任职的夫妻档主推产品Jan,是一个可离线运行、替代ChatGPT的开源助手,主打自主执行、多应用切换、学习用户习惯等功能Jan-nano目前的表现只是一个起点,团队表示下个版本的目标是85%。虽然目前优势只体现在某一类任务上,但4B模型能打成这样,已经很能说明DAPO这类微调技术的潜力。模型开源链接已放出,有兴趣可以自行尝试。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部