版本：Next

知识架构

一、为什么需要单独理解“知识库架构”

在产线军师里，“知识闭环”强调的是经验如何沉淀、审核、复用和持续演进；而“知识库架构”强调的是这些知识在系统里如何被归档、索引、检索、接入上下文并被治理。

两者相关，但不是同一个问题：

知识闭环 更偏“为什么要做、做成什么价值”
知识库架构 更偏“这些知识在系统里如何真正运转”

二、为什么知识库不等于“一个向量库”

如果把产线军师的知识系统理解成“上传文档，然后做 embedding 检索”，会漏掉几个关键事实：

原始文件会被单独归档，而不是只留下切块文本
知识目录和原文归档是两层结构，不是一个表
检索不是纯向量相似度，而是混合召回、意图判断和结果展开
知识结果并不总是直接塞进模型，而是会根据模式和预算进入不同链路
自动学习出的结构化知识还会经过草稿与审核环节

所以，对产线军师而言，知识库更接近“可治理的知识运行时”，而不是单一的 RAG 组件。

三、知识库架构可以分成哪几层

从产品视角，这套知识运行架构可以理解为五层：

层	作用
原文归档层	保存知识原始文件、来源和下载回溯关系
知识目录层	保存切块知识、结构化知识、关键词和索引状态
检索编排层	按问题意图组织向量召回、关键词召回、重排与原文展开
上下文接入层	决定知识结果以什么方式进入本轮分析
治理演化层	处理草稿、审核、重建、结构化抽取和元数据同步

这意味着知识库不是“存进去就结束”，而是一套持续运行的链路。

四、一条典型知识链路是什么样的

知识来源通常包括：

产品文档、说明书、SOP、报告
术语表、规则集、诊断映射
历史案例、复盘结论和专家经验
工具元数据和系统能力说明

五、为什么原文归档和知识目录要分开

这个设计对制造场景很重要，因为它解决了三个实际问题：

1. 可回溯

当系统引用一条知识时，能回到原文，而不是只剩下一段脱离上下文的切块文本。

2. 可重建

当切块策略、索引策略或结构化抽取方式变化时，可以基于原文重新建索引。

3. 可治理

原文、目录条目、草稿知识和正式知识可以有不同的生命周期，不会混成一层。

六、为什么检索不是“搜到就塞给模型”

在产线军师里，知识检索之后还要经过第二次判断：

这是不是当前问题真正需要的知识
应该作为工具结果返回，还是作为上下文提示进入本轮
是偏解释依据、诊断经验，还是术语补丁
当前上下文预算是否值得带入这部分知识

所以，知识系统和上下文工程是强耦合的。知识库负责“能不能找到”，上下文工程负责“这一轮到底带不带进去、带多少进去”。

七、知识库架构和知识闭环、记忆机制是什么关系

机制	更关注什么
知识闭环机制	经验如何沉淀、复用和长期演进
知识库架构	知识如何被归档、索引、检索、接入和治理
记忆机制	会话上下文和用户偏好如何连续延续

简单理解：

知识闭环回答“为什么要把经验沉淀下来”
知识库架构回答“这些知识在系统里怎么跑起来”
记忆机制回答“会话中的连续性怎么保住”

八、对产品的直接意义

知识库架构带来的直接价值，不只是“回答更丰富”，而是：

结果更可追溯：能回到原始资料和证据来源
系统更可治理：支持草稿、审核、重建和分类演化
解释更可复用：知识不再只是文档，而能被系统稳定调用
平台更可扩展：文档知识、结构化知识、工具知识都能进入统一体系

如果你想先理解为什么知识要长期沉淀，可先看闭环机制；如果想理解知识如何进入当前对话，还可以继续看上下文工程。

一、为什么需要单独理解“知识库架构”​

二、为什么知识库不等于“一个向量库”​

三、知识库架构可以分成哪几层​

四、一条典型知识链路是什么样的​

五、为什么原文归档和知识目录要分开​

1. 可回溯​

2. 可重建​

3. 可治理​

六、为什么检索不是“搜到就塞给模型”​

七、知识库架构和知识闭环、记忆机制是什么关系​

八、对产品的直接意义​