金山、Zilliz、腾讯、灵犀量子专家齐聚，揭秘 AI 记忆、RAG 演进与自我进化的工程实践

在 2025 年的今天，我们必须承认，当我们要构建一个复杂的 AI 系统时，仅仅会写“你是一个 XX 专家”是远远不够的。我们面临着更本质的系统工程挑战：

记忆缺失：Agent 如何像人一样拥有“短期记忆”和“长期记忆”，而不是聊几句就忘？
检索瓶颈：RAG 不仅仅是向量搜索，面对海量非结构化数据，如何解决多租户、低成本与高精度的不可能三角？
认知固化：真正的智能体（AI Scientist）能否在任务执行中“自我反思”并动态更新策略，而不是机械执行？

Context Engineering（上下文工程）正是大模型系统的“RAM”与“前额叶”。

为了确保内容的深度与硬核程度，在 AICon 北京站上，我们特邀 Zilliz 合伙人 & 研发 VP 栾小凡担任本专题的出品人。作为 LF AI & Data 基金会技术咨询委员会成员，并曾在阿里云（Lindorm）、Oracle 等顶级团队深耕多年的数据库与存储专家，他以其深厚的技术视野，对议题进行了层层甄选与严苛的质量品控，目标只有一个：剔除浅层的 Prompt 技巧，只交付能支撑 AI 系统理解与推理的工程架构。我们最终锁定了来自金山软件、Zilliz、腾讯、灵犀量子的四位技术专家。他们将从信息流转、湖仓一体、Spec-Coding 到动态认知进化，为你拼出一张完整的上下文工程技术地图。

金山软件：Agent 不是传声筒，而是“信息流转”的处理器

架构痛点

目前的很多 Agent 极其脆弱，本质上只是一个“大模型接口的封装”。在面对复杂业务时，它们缺乏对信息的“消化”能力——不知道什么该记入长期记忆，不知道如何组装短期上下文，导致任务执行混乱。

嘉宾解法

金山软件 AI 产品中心应用落地研发负责人陈斌，将从“信息流转的第一性原理”出发，分享 Agent 架构设计的工程规范。

核心观点：Agent 应当从被动的信息处理器，进化为能驱动复杂任务的智能力量。
关键技术：

记忆工程规范：深入拆解 External Memory（RAG/ 工具）与 Working Memory（工作记忆）的划分原理。

长短期记忆调度：探讨在实际业务中，如何平衡记忆检索的“速度”与“深度”，实现信息的高效流转与智能组装。

落地实践：分享在金山办公等真实业务场景中打磨出的上下文构建经验。

Zilliz：RAG 的下半场，是 Context Engineering 的基础设施

架构痛点

RAG（检索增强生成）已经成为标配，但核心挑战已从“这就跑通”变成了“大规模落地”。如何解决 Long Context 带来的昂贵成本？如何在多租户场景下平衡写入与查询的放大效应？

嘉宾解法

Zilliz 研发总监兼 Milvus 负责人刘力，将带来 Milvus 在 Context Engineering 中的湖仓一体实践。

核心观点：Informational Context 的核心矛盾在于“质量 vs 数量”。RAG 必须进化，解决非结构化数据全生命周期的管理问题。
关键技术：

搜索策略演进：既然单纯的向量搜索不够准，那就引入混合搜索、ColBERT、聚合搜索等新式方法，保证 Context 的“质”。

多租户挑战：揭秘在海量数据下，如何在写入和查询放大间取得平衡，实现性能与成本的最优解。

湖仓一体闭环：展示从 Data Mining 到 Model Training 再到在线服务的非结构化数据生命周期管理方案。

腾讯：拒绝模糊需求，用“上下文工程 2.0”重构开发流

架构痛点

企业级开发中最大的内耗来自“需求模糊”和“协作断层”。AI 辅助编程如果只是补全代码，无法解决核心的工程一致性问题。如何让 AI 理解整个项目的“上下文”？

嘉宾解法

腾讯资深技术产品专家汪晟杰将带来 CodeBuddy 的落地实战，提出 “Spec-Coding”的新范式。

核心观点：上下文工程 2.0 是将“需求→规则→实现”打通为可闭环链路。
关键技术：

Spec-Coding 引擎：利用 SpecKit 将自然语言需求结构化为任务、约束与验收标准。

自动化闭环：也就是 Rule Engine + Context Orchestrator。AI 不再是瞎写代码，而是基于工程规则库自动拆解任务、生成代码并执行测试。

实效数据：实践表明，该方案可使开发周期缩短 30%～50%，显著降低缺陷密度。

灵犀量子：迈向 AI Scientist，智能体的“自我进化”之路

架构痛点

通用大模型在面对医学科研等高度专业、长周期的任务时，往往表现出“知识固化”和“规划脆弱”。静态的 Prompt 无法应对动态的科研探索，AI 需要像科学家一样，从失败中学习。

嘉宾解法

灵犀量子医疗科技总经理王则远博士，将分享一种前沿的 AI Scientist 架构，聚焦于“动态上下文优化”。

核心观点：从 In-Context Learning 进化到 In-Task Learning。建立一个随任务进程自适应更新的“行动手册”。
关键技术：

“模式探索 - 过程反思”双循环：这是一个元认知系统。在线挖掘高价值行动模式，离线对失败路径进行因果归因（Process Reflection）。

动态重规划：规划器（Planner）不再是一次性的，而是根据环境反馈进行局部路径的动态调整与剪枝。

工具接地（Tool Grounding）：AI 不再是简单调用 API，而是理解工具的副作用与参数语义，实现真正的 Tool Manipulation。

结语

从金山的信息流转架构，到 Zilliz 的数据底座；从腾讯的研发效能落地，到灵犀量子的前沿认知探索。

这四场演讲，代表了 Context Engineering 在不同维度的技术实践。如果你关注如何构建可信赖、可扩展、可控的复杂 AI 系统，这一场论坛绝对不容错过。👇 扫码报名，见证 AI 系统架构的代际升级。

头条号入驻

InfoQ 有内容的技术社区媒体

财经自媒体联盟更多自媒体作者

今日推荐优秀作者看点月榜

新浪财经头条意见反馈留言板

4001102288 欢迎批评指正

金山、Zilliz、腾讯、灵犀量子专家齐聚，揭秘 AI 记忆、RAG 演进与自我进化的工程实践 | AICon

头条号入驻

“最悲伤的结局”？IBM豪掷110亿收购Confluent：Kafka开源焦虑升级，Flink流计算成最大赢家

运维大规模反向代理的教训

算力十年狂飙100000倍，他却每天担心破产！黄仁勋亲述：如何用“30天危机感”逆袭万亿AI市场

财经自媒体联盟更多自媒体作者

热文排行榜