跳到主要内容
版本:Next

记忆机制

一、为什么 Agent 需要记忆

如果 Agent 只能看到当前一句话,而不能延续上下文,那么制造场景中的很多分析都会很快失去连续性。

例如:

  • 用户刚刚确认过对象和时间范围
  • 本轮已经完成过趋势分析和对比分析
  • 用户长期偏好某种图表、某类指标或某个对象叫法
  • 系统上一轮已经发现了可疑工序、待验证线索或下一步动作

这些信息都不适合每次从零重新问一遍,因此产线军师需要记忆机制。

二、产线军师所说的“记忆”是什么

记忆不是单一存储,而是一组围绕上下文连续性组织起来的机制。

从产品层面看,可以把它理解为三层:

层级作用典型内容
工作记忆保存当前会话和当前任务最需要延续的状态已确认对象、时间范围、当前任务、下一步、未决问题
情景记忆保存与近期分析过程相关、可再次召回的事实关键工具结果、异常线索、阶段性结论、典型追问链路
长期记忆保存可跨会话延续的稳定事实或偏好表达偏好、常关注对象、稳定术语习惯、角色偏好

简单理解:

  • 工作记忆让 Agent “接得住这一轮”
  • 情景记忆让 Agent “记得住最近发生过什么”
  • 长期记忆让 Agent “越来越贴近用户和岗位习惯”

三、记忆解决的核心问题

1. 减少重复澄清

在同一轮或同一会话中,已经确认过的对象、时间和粒度,不需要每次重新确认。

2. 保持多轮连续分析

当用户从“昨天产量是多少”继续追问“为什么下降”“哪个工位影响最大”时,系统需要基于前文持续推进,而不是重新理解一个孤立问题。

3. 保留分析链路中的关键状态

复杂问题往往不是一步得到答案,而是要先看结果、再找异常、再追原因、再给建议。记忆机制能帮助系统延续这条链路中的中间状态。

4. 延续长期偏好

某些长期稳定的信息,例如用户偏好的表达方式、常关注的对象或术语习惯,可以帮助系统更快进入正确上下文。

四、记忆与知识的区别

记忆和知识经常一起出现,但不是同一件事:

维度记忆知识
归属更偏当前用户、当前会话或历史使用习惯更偏组织层面的案例、规则和经验
用途保持上下文连续性提供解释依据和可复用经验
时效性更强调近期和上下文相关性更强调长期沉淀和治理
触发方式在会话和分析过程中自动参与在检索、增强和沉淀链路中参与

简单理解:

  • 记忆让 Agent “接得住上下文”
  • 知识让 Agent “说得出依据”

五、记忆如何参与一次典型分析

在这个过程中,记忆的价值主要体现在:

  • 衔接上一轮已完成的分析
  • 保持对象、时间和拆分口径连续
  • 记住当前任务、下一步和未决问题
  • 避免因为上下文丢失而重复走弯路

六、为什么记忆不是“保存越多越好”

产线军师的记忆机制并不是把所有聊天内容、所有工具结果都长期保留,而是更强调“写回、召回、压缩、淘汰”四件事:

环节作用
写回把本轮高价值事实沉淀成更稳定的记忆条目
召回在下一轮只带回真正相关的内容,而不是全量回放
压缩对长会话做阶段性收敛,保住连续性而不是堆积噪声
淘汰让过期、失效或价值不高的记忆逐步退出主链

这也是为什么产线军师的记忆机制更强调“分层”和“晋升”,而不是无差别持久化。

七、哪些信息更适合进入记忆

更适合进入记忆的内容通常是:

  • 用户长期关注的对象或范围
  • 用户的表达偏好或图表偏好
  • 已经确认过、短期内仍有效的业务上下文
  • 对后续追问有帮助的稳定事实
  • 本轮分析中形成的关键结论、下一步动作和未决问题

而不适合长期保留的通常包括:

  • 一次性临时问题
  • 已经过期的短时状态
  • 缺乏确认的猜测信息
  • 大量原始工具明细和冗长过程噪声
  • 超出授权范围的敏感内容

八、为什么记忆需要治理边界

记忆并不是“保存越多越聪明”,而是要同时满足:

  • 相关:真的对后续分析有帮助
  • 稳定:不会把短时噪声当成长期事实
  • 可控:符合权限、租户和使用边界
  • 可清理:能够根据策略压缩、更新或淘汰

这也是为什么产线军师的记忆机制会和 上下文工程 配合使用。记忆负责“可被延续的事实”,上下文工程负责“这一轮到底带多少、带哪部分进模型”。

九、对业务的实际意义

从使用者视角看,记忆机制带来的直接体验是:

  • 多轮追问更连续
  • 重复说明更少
  • 系统更容易记住当前问题链路的上下文
  • 长期使用后,更容易形成贴近个人和岗位习惯的交互体验

这使得产线军师的 Agent 更接近持续协作的工业分析助手,而不是每轮都从零开始的聊天窗口。