在 2025 年的今天,我们必须承认,当我们要构建一个复杂的 AI 系统时,仅仅会写“你是一个 XX 专家”是远远不够的。我们面临着更本质的系统工程挑战:
记忆缺失:Agent 如何像人一样拥有“短期记忆”和“长期记忆”,而不是聊几句就忘?
检索瓶颈:RAG 不仅仅是向量搜索,面对海量非结构化数据,如何解决多租户、低成本与高精度的不可能三角?
认知固化:真正的智能体(AI Scientist)能否在任务执行中“自我反思”并动态更新策略,而不是机械执行?
Context Engineering(上下文工程) 正是大模型系统的“RAM”与“前额叶”。
为了确保内容的深度与硬核程度,在 AICon 北京站上,我们特邀 Zilliz 合伙人 & 研发 VP 栾小凡担任本专题的出品人。作为 LF AI & Data 基金会技术咨询委员会成员,并曾在阿里云(Lindorm)、Oracle 等顶级团队深耕多年的数据库与存储专家,他以其深厚的技术视野,对议题进行了层层甄选与严苛的质量品控,目标只有一个:剔除浅层的 Prompt 技巧,只交付能支撑 AI 系统理解与推理的工程架构。我们最终锁定了来自金山软件、Zilliz、腾讯、灵犀量子的四位技术专家。他们将从信息流转、湖仓一体、Spec-Coding 到动态认知进化,为你拼出一张完整的上下文工程技术地图。
1
金山软件:Agent 不是传声筒,而是“信息流转”的处理器
架构痛点
目前的很多 Agent 极其脆弱,本质上只是一个“大模型接口的封装”。在面对复杂业务时,它们缺乏对信息的“消化”能力——不知道什么该记入长期记忆,不知道如何组装短期上下文,导致任务执行混乱。
嘉宾解法
金山软件 AI 产品中心应用落地研发负责人陈斌,将从“信息流转的第一性原理”出发,分享 Agent 架构设计的工程规范。
核心观点:Agent 应当从被动的信息处理器,进化为能驱动复杂任务的智能力量。
关键技术:
记忆工程规范:深入拆解 External Memory(RAG/ 工具) 与 Working Memory(工作记忆) 的划分原理。
长短期记忆调度:探讨在实际业务中,如何平衡记忆检索的“速度”与“深度”,实现信息的高效流转与智能组装。
落地实践:分享在金山办公等真实业务场景中打磨出的上下文构建经验。
2
Zilliz:RAG 的下半场,是 Context Engineering 的基础设施
架构痛点
RAG(检索增强生成)已经成为标配,但核心挑战已从“这就跑通”变成了“大规模落地”。如何解决 Long Context 带来的昂贵成本?如何在多租户场景下平衡写入与查询的放大效应?
嘉宾解法
Zilliz 研发总监兼 Milvus 负责人刘力,将带来 Milvus 在 Context Engineering 中的湖仓一体实践。
核心观点:Informational Context 的核心矛盾在于“质量 vs 数量”。RAG 必须进化,解决非结构化数据全生命周期的管理问题。
关键技术:
搜索策略演进:既然单纯的向量搜索不够准,那就引入混合搜索、ColBERT、聚合搜索等新式方法,保证 Context 的“质”。
多租户挑战:揭秘在海量数据下,如何在写入和查询放大间取得平衡,实现性能与成本的最优解。
湖仓一体闭环:展示从 Data Mining 到 Model Training 再到在线服务的非结构化数据生命周期管理方案。
3
腾讯:拒绝模糊需求,用“上下文工程 2.0”重构开发流
架构痛点
企业级开发中最大的内耗来自“需求模糊”和“协作断层”。AI 辅助编程如果只是补全代码,无法解决核心的工程一致性问题。如何让 AI 理解整个项目的“上下文”?
嘉宾解法
腾讯资深技术产品专家汪晟杰将带来 CodeBuddy 的落地实战,提出 “Spec-Coding”的新范式。
核心观点:上下文工程 2.0 是将“需求→规则→实现”打通为可闭环链路。
关键技术:
Spec-Coding 引擎:利用 SpecKit 将自然语言需求结构化为任务、约束与验收标准。
自动化闭环:也就是 Rule Engine + Context Orchestrator。AI 不再是瞎写代码,而是基于工程规则库自动拆解任务、生成代码并执行测试。
实效数据:实践表明,该方案可使开发周期缩短 30%~50%,显著降低缺陷密度。
4
灵犀量子:迈向 AI Scientist,智能体的“自我进化”之路
架构痛点
通用大模型在面对医学科研等高度专业、长周期的任务时,往往表现出“知识固化”和“规划脆弱”。静态的 Prompt 无法应对动态的科研探索,AI 需要像科学家一样,从失败中学习。
嘉宾解法
灵犀量子医疗科技总经理王则远博士,将分享一种前沿的 AI Scientist 架构,聚焦于“动态上下文优化”。
核心观点:从 In-Context Learning 进化到 In-Task Learning。建立一个随任务进程自适应更新的“行动手册”。
关键技术:
“模式探索 - 过程反思”双循环:这是一个元认知系统。在线挖掘高价值行动模式,离线对失败路径进行因果归因(Process Reflection)。
动态重规划:规划器(Planner)不再是一次性的,而是根据环境反馈进行局部路径的动态调整与剪枝。
工具接地(Tool Grounding):AI 不再是简单调用 API,而是理解工具的副作用与参数语义,实现真正的 Tool Manipulation。
5
结语
从金山的信息流转架构,到 Zilliz 的数据底座;从腾讯的研发效能落地,到灵犀量子的前沿认知探索。
这四场演讲,代表了 Context Engineering 在不同维度的技术实践。如果你关注如何构建可信赖、可扩展、可控的复杂 AI 系统,这一场论坛绝对不容错过。👇 扫码报名,见证 AI 系统架构的代际升级。
4001102288 欢迎批评指正
All Rights Reserved 新浪公司 版权所有
