演示了在其IPU上运行清华开源的大语言模型ChatGLM-6B的效果……

演示了在其IPU上运行清华开源的大语言模型ChatGLM-6B的效果……
2023年04月28日 12:33 蚁工厂
@Graphcore创新社区 演示了在其IPU上运行清华开源的大语言模型ChatGLM-6B的效果,每个token平均耗时仅有3.5毫秒,和AI对话几乎感觉不到延时。(更有智商被AI碾压的感觉了?)IPU是专门为AI等高性能计算设计的处理器。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部