明明刚给大模型说完对海鲜过敏的禁忌,转头就收到了它推荐的海鲜餐厅;明明刚表述完售后需求,随后就被要求重复描述问题和要求......
类似的问题在与AI的交互中变得常见,它极大地影响着用户的使用体验。而这些令人困扰的问题,折射出的正是当前通用大语言模型“记忆缺陷”的短板。
在人工智能技术飞速迭代的当下,大模型记忆机制的先天不足,也成为制约其从“工具级服务”迈向“认知级伙伴”的关键瓶颈。
12月,红熊AI推出旗下记忆科学开源产品——“记忆熊”(MemoryBear),一款专为AI应用设计的智能记忆管理平台。
“目前的模型,本质上还是‘答完就忘’。”红熊AI创始人兼CEO温德亮表示,主流大模型依赖的“长期记忆”机制存在天然缺陷——不该记的乱记,该强化的没强化,导致在B端严肃场景中很难使用。
温德亮认为应该赋予AI如同人类一样的记忆能力,因此推出了“记忆熊”。
它通过重构AI记忆的“感知-提炼-关联-遗忘”全生命周期的智能知识处理体系,破解当前大模型“健忘、幻觉、高耗、延迟”的核心痛点,开辟为人工智能认知升级新路径。

大模型“健忘”成行业痛点
当前大模型的记忆问题并非单一技术局限,而是多重挑战的叠加,影响其在商业场景中的落地效果。
亿欧网从红熊AI“记忆熊”产品发布会上了解到,当前通用大模型的“记忆缺陷”主要体现在三个方面。
首先是单模型知识遗忘。主流大模型的上下文窗口通常限制在100k-200k tokens,长对话中早期关键信息容易被“挤出”,出现“答后忘前”的情况。正如文章开头所述,当用户第一轮告知大模型自己“对海鲜过敏”,往往在第五轮咨询晚餐推荐时,模型已遗忘第一轮的关键禁忌。
其次是多Agent记忆断层。咨询、售后等不同智能体各自维护独立记忆,缺乏跨模块共享机制,导致用户需要重复提供信息。这种“数据孤岛”现象不仅影响用户体验,同时会增加tokens消耗。
最后就是语义解析失真。如果用户在对话中有模糊指代、口语化表达或多语种混用,常常会导致模型无法准确定位历史记忆。
这些问题直接影响着大模型在C端用户群中的使用体验,制约着AI向“认知级个性化服务”的演进,使得通用大模型在客服、医疗、教育等需要精准记忆的场景中难以充分发挥价值,解决大模型的“记忆缺陷”成为企业界需要直面和解决的难题。
给大模型装上“海马体”
解决大模型“记忆缺陷”的问题,Meta FAIR实验室曾联合高校团队通过参数微调的方式优化模型性能,并发表相关研究论文,但是因为新增参数容量有限,难以承载大量新知识,甚至可能导致模型“灾难式遗忘”。此外,美国和韩国的多个AI创业企业团队也曾对相关问题展开研究,仍未彻底解决记忆遗忘的问题。
但是,现有解决方案并未从根本上重构记忆系统,无法解决大模型应答“准确率低、成本高、幻觉多、延迟高”的四重瓶颈。

“记忆熊”瞄准上述瓶颈借鉴人类的记忆原理,构建了一套分层、动态、可演进的记忆体系。
红熊AI“记忆熊”记忆科学产品研发负责人孙科在发布会上介绍产品的核心技术时表示,“记忆熊”的突破在于其以人脑“海马体-皮层”协作机制为蓝本,复刻了人类感知记忆、工作记忆、显性记忆、隐性记忆、情绪记忆五大模块,形成了从“数据输入”到“认知输出”的完整闭环。

这意味着,“记忆熊”充当了大模型头脑中“海马体”的功能,掌管大模型在应答过程中的记忆形成与存储,减少模型幻觉,提高应答效率。
具体来看,在分层记忆体系中,显性记忆层通过结构化数据库存储可主动调用的信息,包括用户历史对话和行业知识库,支持精准查询与检索;隐性记忆层作为独立于大模型参数的外部组件,专门管理AI的行为习惯、任务技能与决策偏好,使其能“无意识”地高效处理重复任务,类似人类的肌肉记忆。这种设计既保证了关键信息的精准存储,也实现了行为模式的自主优化。
“记忆熊”的另一核心创新是动态语义网络,它突破了传统关键词匹配的局限,实现联想式记忆检索。例如,AI能从“咖啡”关联到用户“早晨通勤习惯”,再结合天气数据主动推荐冷热饮,真正理解用户隐含需求。这一技术源于记忆科学中的“语义网络模型”,通过建立记忆间的复杂关联,让AI具备类人的联想能力。
针对高耗低效问题,“记忆熊”研发了智能语义剪枝技术,在保持语义完整的前提下,精准剔除冗余信息,实现97%的token效率提升和72%的语境偏移率降低。
同时,通过语义锚点标注和多维检索引擎,有效抑制幻觉生成,模型幻觉率有效降低。在存储与检索层面,产品采用自我反思引擎,借鉴人类睡眠中强化记忆的原理,在离线周期中对记忆进行梳理,重排和重要度重估,从而提升长期表现。结合记忆遗忘引擎,系统能够在持续增量学习的同时保持稳定性,实现学习效率与抗遗忘能力之间的平衡。
跨Agent协作难题则通过记忆共享引擎也将得到彻底解决。“记忆熊”构建了统一的记忆中枢,打破不同智能体间的“数据孤岛”,当用户在咨询、售后、推荐等场景间切换时,对话状态、历史偏好、关键诉求等信息无缝传递,无需重复描述,真正实现“一次沟通,全程复用”。
在性能方面,目前“记忆熊”已取得多项认可。在权威的LOCOMO数据集测试中,“记忆熊”的核心指标全面超越Mem0、Zep、LangMem等现有主流方案,展现出压倒性技术优势。此外,“记忆熊”基于图谱的版本将搜索延迟p50控制在0.637秒,破解了“高准确必伴随高延迟”的行业魔咒。
值得注意的是,实际应用中,“记忆熊”已展现出强大的落地能力。红熊AI Agent互动服务平台接入该产品后,实现98.4%的AI自助解决率,70%的人工替代率,真正为企业创造可衡量的价值。
记忆功能赋能应用场景,创造实际商业价值
技术的终极价值在于场景落地。
“记忆熊”通过构建记忆知识图谱,精准匹配各场景下的记忆需求与结构,已在AI客服、精准营销、AI教育、数字医疗、电商、零售六大核心领域实现深度应用,为企业创造了可量化的商业价值。
在智能客服场景下,“记忆熊”为每位用户创建动态记忆图谱,通过回溯过往交互历史与情感状态,实现跨Agent记忆共享。客服人员借助实时上下文推荐,将服务从被动响应转变为主动关怀,显著提升用户满意度。
精准营销领域,产品从“猜你喜欢”升级为“我记得你喜欢”。通过构建用户兴趣记忆图谱,追踪从首次点击到复购的完整旅程,实现超个性化推荐。
AI教育场景中,“记忆熊”打造了拥有终身记忆的AI导师,能够记住学生的每一次答题、犹豫与偏好学习方式。真正实现因材施教。
在数字医疗领域,产品创建集中化的病史记忆,整合症状变化、过敏史、既往用药等关键信息,为医生提供全面的患者视图,有效解决病史分散、复诊重复沟通的行业痛点。
电商场景中,“记忆熊”通过记忆用户浏览深度、加购及退货行为,精准建模真实需求,实现秒级人货匹配。显著提升了购物体验与订单价值。
零售场景中,平台将线下互动数字化,为每位VIP客户创建持久记忆档案,记录尺码、风格偏好与过往购买记录。无论员工流动还是跨门店服务,都能即时访问客户记忆,为线下零售注入个性化服务能力。

目前,红熊AI正式开源了“记忆熊”核心技术框架,红熊AI创始人温德亮曾在接受媒体采访时表示:“开源不是放弃竞争力,真正的竞争力是持续创新、是抓住客户痛点的能力。”
下一步红熊AI还将推动记忆科学产品“记忆熊”在更多垂直领域的落地,深化与多模态大模型的融合,优化订阅制服务模式,为企业提供更灵活、高效的记忆解决方案。预计明年通过订阅制服务实现50倍业务增长,进一步扩大市场覆盖。
长期来看,红熊AI的愿景是让AI从“工具级服务”迈向“伙伴级服务”,实现“无处不在,又无处可见”的智能体验。
通过持续深耕记忆科学,红熊AI将推动人工智能向更高阶的认知智能迈进,让AI真正成为理解用户、持续学习、共同成长的可靠伙伴,为人类社会创造更大价值。
4001102288 欢迎批评指正
All Rights Reserved 新浪公司 版权所有
