MLX框架的开发者Awni Hannun发布了一个他在两台M2 Ultras上跑DeepSeek

MLX框架的开发者Awni Hannun发布了一个他在两台M2 Ultras上跑DeepSeek
2025年01月06日 08:55 蚁工厂
MLX框架的开发者Awni Hannun发布了一个他在两台M2 Ultras上跑DeepSeek v3的3bit量化版本的视频。速度能达到每秒17个token。671B 的大模型也可以跑了

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部