版本：Next

记忆机制

一、为什么 Agent 需要记忆

如果 Agent 只能看到当前一句话，而不能延续上下文，那么制造场景中的很多分析都会很快失去连续性。

例如：

用户刚刚确认过对象和时间范围
本轮已经完成过趋势分析和对比分析
用户长期偏好某种图表、某类指标或某个对象叫法
系统上一轮已经发现了可疑工序、待验证线索或下一步动作

这些信息都不适合每次从零重新问一遍，因此产线军师需要记忆机制。

二、产线军师所说的“记忆”是什么

记忆不是单一存储，而是一组围绕上下文连续性组织起来的机制。

从产品层面看，这套记忆机制可以理解为三层：

层级	作用	典型内容
工作记忆	保存当前会话和当前任务最需要延续的状态	已确认对象、时间范围、当前任务、下一步、未决问题
情景记忆	保存与近期分析过程相关、可再次召回的事实	关键工具结果、异常线索、阶段性结论、典型追问链路
长期记忆	保存可跨会话延续的稳定事实或偏好	表达偏好、常关注对象、稳定术语习惯、角色偏好

简单理解：

工作记忆让 Agent “接得住这一轮”
情景记忆让 Agent “记得住最近发生过什么”
长期记忆让 Agent “越来越贴近用户和岗位习惯”

三、记忆解决的核心问题

1. 减少重复澄清

在同一轮或同一会话中，已经确认过的对象、时间和粒度，不需要每次重新确认。

2. 保持多轮连续分析

当用户从“昨天产量是多少”继续追问“为什么下降”“哪个工位影响最大”时，系统需要基于前文持续推进，而不是重新理解一个孤立问题。

3. 保留分析链路中的关键状态

复杂问题往往不是一步得到答案，而是要先看结果、再找异常、再追原因、再给建议。记忆机制能帮助系统延续这条链路中的中间状态。

4. 延续长期偏好

某些长期稳定的信息，例如用户偏好的表达方式、常关注的对象或术语习惯，可以帮助系统更快进入正确上下文。

四、记忆与知识的区别

记忆和知识经常一起出现，但不是同一件事：

维度	记忆	知识
归属	更偏当前用户、当前会话或历史使用习惯	更偏组织层面的案例、规则和经验
用途	保持上下文连续性	提供解释依据和可复用经验
时效性	更强调近期和上下文相关性	更强调长期沉淀和治理
触发方式	在会话和分析过程中自动参与	在检索、增强和沉淀链路中参与

简单理解：

记忆让 Agent “接得住上下文”
知识让 Agent “说得出依据”

五、记忆如何参与一次典型分析

在这个过程中，记忆的价值主要体现在：

衔接上一轮已完成的分析
保持对象、时间和拆分口径连续
记住当前任务、下一步和未决问题
避免因为上下文丢失而重复走弯路

六、为什么记忆不是“保存越多越好”

产线军师的记忆机制并不是把所有聊天内容、所有工具结果都长期保留，而是更强调“写回、召回、压缩、淘汰”四件事：

环节	作用
写回	把本轮高价值事实沉淀成更稳定的记忆条目
召回	在下一轮只带回真正相关的内容，而不是全量回放
压缩	对长会话做阶段性收敛，保住连续性而不是堆积噪声
淘汰	让过期、失效或价值不高的记忆逐步退出主链

这也是为什么产线军师的记忆机制更强调“分层”和“晋升”，而不是无差别持久化。

七、哪些信息更适合进入记忆

更适合进入记忆的内容通常是：

用户长期关注的对象或范围
用户的表达偏好或图表偏好
已经确认过、短期内仍有效的业务上下文
对后续追问有帮助的稳定事实
本轮分析中形成的关键结论、下一步动作和未决问题

而不适合长期保留的通常包括：

一次性临时问题
已经过期的短时状态
缺乏确认的猜测信息
大量原始工具明细和冗长过程噪声
超出授权范围的敏感内容

八、为什么记忆需要治理边界

记忆并不是“保存越多越聪明”，而是要同时满足：

相关：真的对后续分析有帮助
稳定：不会把短时噪声当成长期事实
可控：符合权限、租户和使用边界
可清理：能够根据策略压缩、更新或淘汰

这也是为什么产线军师的记忆机制会和上下文工程配合使用。记忆负责“可被延续的事实”，上下文工程负责“这一轮到底带多少、带哪部分进模型”。

九、对业务的实际意义

从使用者视角看，记忆机制带来的直接体验是：

多轮追问更连续
重复说明更少
系统更容易记住当前问题链路的上下文
长期使用后，更容易形成贴近个人和岗位习惯的交互体验

这使得产线军师的 Agent 更接近持续协作的工业分析助手，而不是每轮都从零开始的聊天窗口。

一、为什么 Agent 需要记忆​

二、产线军师所说的“记忆”是什么​

三、记忆解决的核心问题​

1. 减少重复澄清​

2. 保持多轮连续分析​

3. 保留分析链路中的关键状态​

4. 延续长期偏好​

四、记忆与知识的区别​

五、记忆如何参与一次典型分析​

六、为什么记忆不是“保存越多越好”​

七、哪些信息更适合进入记忆​

八、为什么记忆需要治理边界​

九、对业务的实际意义​