知识架构
一、为什么需要单独理解“知识库架构”
在产线军师里,“知识闭环”强调的是经验如何沉淀、审核、复用和持续演进;而“知识库架构”强调的是这些知识在系统里如何被归档、索引、检索、接入上下文并被治理。
两者相关,但不是同一个问题:
- 知识闭环 更偏“为什么要做、做成什么价值”
- 知识库架构 更偏“这些知识在系统里如何真正运转”
二、为什么知识库不等于“一个向量库”
如果把产线军师的知识系统理 解成“上传文档,然后做 embedding 检索”,会漏掉几个关键事实:
- 原始文件会被单独归档,而不是只留下切块文本
- 知识目录和原文归档是两层结构,不是一个表
- 检索不是纯向量相似度,而是混合召回、意图判断和结果展开
- 知识结果并不总是直接塞进模型,而是会根据模式和预算进入不同链路
- 自动学习出的结构化知识还会经过草稿与审核环节
所以,对产线军师而言,知识库更接近“可治理的知识运行时”,而不是单一的 RAG 组件。
三、知识库架构可以分成哪几层
从产品视角,这套知识运行架构可以理解为五层:
| 层 | 作用 |
|---|---|
| 原文归档层 | 保存知识原始文件、来源和下载回溯关系 |
| 知识目录层 | 保存切块知识、结构化知识、关键词和索引状态 |
| 检索编排层 | 按问题意图组织向量召回、关键词召回、重排与原文展开 |
| 上下文接入层 | 决定知识结果以什么方式进入本轮分析 |
| 治理演化层 | 处理草稿、审核、重建、结构化抽取和元数据同步 |
这意味着知识库不是“存进去就结束”,而是一套持续运行的链路。
四、一条典型知识链路是什么样的
知识来源通常包括:
- 产品文档、说明书、SOP、报告
- 术语表、规则集、诊断映射
- 历史案例、复盘结论和专家经验
- 工具元数据和系统能力说明
五、为什么原文归档和知识目录要分开
这个设计对制造场景很重要,因为它解决了三个实际问题:
1. 可回溯
当系统引用一条知识时,能回到原文,而不是只剩下一段脱离上下文的切块文本。
2. 可重建
当切块策略、索引策略或结构化抽取方式变化时,可以基于原文重新建索引。
3. 可治理
原文、目录条目、草稿知识和正式知识可以有不同的生命周期,不会混成一层。
六、为什么检索不是“搜到就塞给模型”
在产线军师里,知识检索之后还要经过第二次判断:
- 这是不是当前问题真正需要的知识
- 应该作为工具结果返回,还是作为上下文提示进入本轮
- 是偏解释依据、诊断经验,还是术语补丁
- 当前上下文预算是否值得带入这部分知识
所以,知识系统和 上下文工程 是强耦合的。知识库负责“能不能找到”,上下文工程负责“这一轮到底带不带进去、带多少进去”。
七、知识库架构和知识闭环、记忆机制是什么关系
| 机制 | 更关注什么 |
|---|---|
| 知识闭环机制 | 经验如何沉淀、复用和长期演进 |
| 知识库架构 | 知识如何被归档、索引、检索、接入和治理 |
| 记忆机制 | 会话上下文和用户偏好如何连续延续 |
简单理解:
- 知识闭环回答“为什么要把经验沉淀下来”
- 知识库架构回答“这些知识在系统里怎么跑起来”
- 记忆机制回答“会话中的连续性怎么保住”
八、对产品的直接意义
知识库架构带来的直接价值,不只是“回答更丰富”,而是:
- 结果更可追溯:能回到原始资料和证据来源
- 系统更可治理:支持草稿、审核、重建和分类演化
- 解释更可复用:知识不再只是文档,而能被系统稳定调用
- 平台更可扩展:文档知识、结构化知识、工具知识都能进入统一体系