大模型在可观测AIOps的探索和应用实践

大模型在可观测AIOps的探索和应用实践
2024年03月29日 13:17 AI科技大本营

在云原生时代,运维团队面临着数据质量波动、标注不足以及链路信息不完整等重大挑战,这些障碍严重影响了 AIOps(智能运维)的有效实施。监控数据的不确定性增加了运维任务的复杂度,使得从海量数据中提取有用信息并作出快速响应变得更加困难。

基于此,在 4 月 25、26 日举办的 2024 全球机器学习技术大会上,特邀请了来自阿里云的高级技术专家董善东给大家分享「大模型在可观测 AIOps 的探索和应用实践」主题演讲。

大模型强大的涌现能力和推理能力,为 AIOps 在复杂架构下提供更精准的数据关联和诊断提供了可能。阿里云可观测团队通过 AIOp 结合大模型应用, 探索了利用大模型进行知识问答和 PromQL 查询生成,极大地简化了对监控数据的查询与分析过程。此外,大模型在提供上下文明确的告警方面表现出色,通过与 ChatOps 机器人的整合,实现了更加自然和人性化的交互方式。这些实践不仅提高了诊断效率,也为系统异常的快速解决提供了有力支持。

然而,大模型作为 AIOps 实施中的双刃剑,同时也带来了一系列新的挑战,包括模型的解释性问题和与现有系统的集成问题。基于 ReAct 框架的 agent 协同诊断方案为这些挑战提供了可能的解决路径,使得 AIOps 不再局限于单一的自动化任务,而是朝着更加协同和自适应的方向发展。展望未来,我们预测大模型将继续在可观测性领域中扮演关键角色,推动 AIOps 技术的进一步发展和创新。

在本次全球机器学习技术大会上,来自阿里、微软、蚂蚁集团、小米、智谱、零一万物、面壁智能、复旦大学教授、智源人工智能研究院等大模型领域的专家将云集于此,与你共同探讨人工智能的前沿发展和行业最佳实践。

他们包括:

  • Kaldi 之父,IEEE Fellow,小米集团首席语音科学家 Daniel Povey

  • 复旦大学教授,博士生导师,MOSS大模型核心人员,前搜狗首席研究员 张奇

  • 微软亚研首席研究员和研究经理 刘树杰

  • 零一万物联合创始人,前字节跳动 AIGC 和视觉大模型 AI 平台负责人 潘欣

  • 北京智源人工智能研究院基础语言与软件组负责人 刘广

  • 新浪微博新技术研发负责人,中国中文信息学会理事 张俊林

  • 新加坡国立大学计算机系的校长青年教授,潞晨科技创始人 尤洋

  • 北京聆心智能科技有限公司联合创始人 CEO 郑叔亮

  • 微软亚洲研究院首席研究员和研究经理 刘树杰

  • 千芯科技董事长,人工智能、芯片专家 陈巍

  • 面壁智能 CTO,OpenBMB 开源社区联合发起人 曾国洋

  • 度小满金融技术委员会执行主席,数据智能应用部总经理 杨青

  • PPIO 联合创始人&CTO 王闻宇

  • 阿里巴巴达摩院资深算法专家,阿里巴巴通义实验室对话智能负责人 李永彬

  • 白海科技创始人兼 CEO,CCF 大数据专委常务委员和高性能专委委员 卢亿雷

  • 文因互联工程 VP 兼首席科学家,中国人工智能学会会员工委会副秘书长 宋

  • DeepWisdom 创始人兼 CEO,MetaGPT 项目作者 吴承霖

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部