注册

新浪财经APP

Alex Cheema发布了一个用4台M4 Pro Mac Mini集群来跑70B参数大模型的视频…

Alex Cheema发布了一个用4台M4 Pro Mac Mini集群来跑70B参数大模型的视频…

2024年11月11日 20:15 蚁工厂

语音播报缩小字体放大字体微博微信 0

Alex Cheema发布了一个用4台M4 Pro Mac Mini集群来跑70B参数大模型的视频，没说多大内存的。现在的速度大概是每秒8个token。应该还可以继续优化。按@karminski-牙医的大语言模型推理专用显存天梯榜，4台M4 Pro Mac Mini集群的理论速度可以到每秒22.75个token。

头条号入驻

蚁工厂专业从事互联网大数据分析

财经自媒体联盟更多自媒体作者

今日推荐优秀作者看点月榜

新浪财经头条意见反馈留言板

4000520066 欢迎批评指正

关于头条 | 如何入驻 | 发稿平台 | 奖励机制版权声明 | 用户协议 | 帮助中心

Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司版权所有

新浪首页语音播报返回顶部