在人工智能的飞速发展中,大语言模型(LLM)已成为推动智能应用的关键力量。然而,如何高效调度这些庞大模型,以优化推理性能、提高资源利用率并降低延迟,成为了一个重要课题。
会议议程
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有