稀宇科技推出万亿MoE模型abab 6.5

稀宇科技推出万亿MoE模型abab 6.5
2024年04月17日 14:33 界面

4月17日,稀宇科技MiniMax正式推出abab 6.5系列模型。abab 6.5系列包含两个模型:abab 6.5和abab 6.5s。据介绍,abab 6.5包含万亿参数,支持200k tokens的上下文长度;abab 6.5s跟abab 6.5使用了同样的训练技术和数据,但是更高效,支持200k tokens的上下文长度,可以1秒内处理近3万字的文本。在各类核心能力测试中,abab 6.5开始接近GPT-4、Claude-3、Gemini-1.5等大语言模型。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部