从云端训练到云端推理 首款人工智能推理产品 “云燧i10”将面市

从云端训练到云端推理 首款人工智能推理产品 “云燧i10”将面市
2020年12月24日 16:17 投资快报

人工智能作为新一轮产业变革的核心驱动力,相关技术和应用的快速发展是全球趋势。而人工智能的发展,需要高性能和普惠的算力提供支撑。在技术链顶端的云端训练和推理领域此前一直处于高度垄断状态,目前国内企业也正对此发起冲刺。

燧原科技创始人CEO赵立东

12月21日,专注人工智能领域云端算力平台的燧原科技发布首款人工智能推理产品“云燧®i10”。这是一款面向云端数据中心的高性能推理卡。云燧i10是单槽位标准卡,支持PCIe 4.0,FP32算力达到17.6TFLOPS,BF16/FP16算力70.4TFLOPS。据介绍,云燧i10将于明年第一季度上市。

“继去年12月发布了首款面向数据中心的人工智能训练加速卡“云燧T10”,今天我们又推出针对云端推理市场的第一款人工智能推理加速卡“云燧i10”,以满足由于AI应用和落地场景迅速扩大,市场和客户对更高性价比以及国产化和差异化云端推理产品的需求。燧原科技也因此成为国内唯一一家同时拥有云端训练和推理加速产品的初创公司,形成业务闭环。”燧原科技CEO赵立东表示。

“云燧i10”拥有卓越的算力、出色的通用性以及优异的价值特性:

·高算力、多精度:FP32算力17.6TFLOPS,BF16/FP16算力70.4TFLOPS;采用自主指令集,支持从FP32到INT8等多种精度,而最大功耗仅为150W;

·高能效、高可靠性:采用动态调频调压(DVFS)技术,根据负载加速应用性能,支持RAS、ECC;

·设备虚拟化:实现多用户支持,最大可支持4个设备实例,具备计算与存储资源的独享性,多用户间安全隔离;单颗芯片上可同时部署不同的业务与负载,实现多任务并行,有效提高利用率;支持KVM、Xen等系统虚拟化平台;

·易编程、生态开放:开放C++和Python编程接口,支持CNN及NLP典型模型,支持主流机器学习框架,并通过SDK提供深度定制。

“云燧i10”推理系统

燧原科技同时推出针对推理产品的高性能神经网络模型推理引擎“鉴算TopsInference”,通过计算图优化、算子融合、模型压缩、量化等优化技术,可以为深度学习应用提供低延迟、高吞吐率的推理性能。通过TopsInference的推理加速,配合i10的高算力及虚拟化技术,数据中心可以高性价比地部署计算密集型深度学习工作负载。此外TopsInference除TensorFlow、PyTorch模型格式外,还支持ONNX通用模型格式,借助燧原GCU-CARA架构的可编程性,可以应对未来深度神经网络日益多样化、复杂的增长趋势。

中国作为人工智能的大国、强国,在算法和数据方面一直不落下风,唯独在算力方面很长一段时间都没有突破。“云燧i10”的面市,可以为中国人工智能产业发展提供算力普惠的从训练到推断的助益。

根据权威市场机构预测,云数据中心对于人工智能推理芯片的需求将从2022年开始超越对于训练芯片的需求,整个推理市场蓄势待发。云端推理解决方案更注重综合指标,包括算力、时延、成本等,也更为关注用户体验的优化。

据燧原科技CEO赵立东介绍,“当前全球科技产业特别是集成电路产业正在发生深刻变革,燧原科技会继续加速技术创新和产品迭代,拉近与世界先进水平的距离,构筑自主创新技术的护城河。与此同时,与上下游伙伴合作,加速业务落地,扩大市场规模。针对互联网数据中心、垂直行业(金融、保险、教育、医疗及运营商等)、新基建三大业务方向的应用场景,完善训练和推理软件栈、工具链和解决方案。通过产学研协作,共建国产化产业生态,助力中国人工智能和集成电路产业的发展。”

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部