注册

新浪财经APP

在Cerebras上的推理速度 ‣ Llama3.1-70B：每秒处理450token…

在Cerebras上的推理速度 ‣ Llama3.1-70B：每秒处理450token…

2024年08月28日 09:10 新智元

语音播报缩小字体放大字体微博微信 0

#你好人工智能时代# 在Cerebras上的推理速度‣ Llama3.1-70B：每秒处理450token，比GPU快20倍‣ Llama 3.1 8B：每秒1,700token‣ 每百万个token的费用为60美分，价格仅为超大规模计算提供商的五分之一‣ 全16位精度，确保模型的完整准确性‣ 为开发者提供宽松的速率限制#AI探索计划# 立即试用：

头条号入驻

新智元智能+中国主平台领航中国新智能时

财经自媒体联盟更多自媒体作者

今日推荐优秀作者看点月榜

新浪财经头条意见反馈留言板

4000520066 欢迎批评指正

关于头条 | 如何入驻 | 发稿平台 | 奖励机制版权声明 | 用户协议 | 帮助中心

Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司版权所有

新浪首页语音播报返回顶部