跳到主要内容
版本:Next

知识库架构

一、为什么需要单独理解“知识库架构”

在产线军师里,“知识闭环”强调的是经验如何沉淀、审核、复用和持续演进;而“知识库架构”强调的是这些知识在系统里如何被归档、索引、检索、接入上下文并被治理。

两者相关,但不是同一个问题:

  • 知识闭环 更偏“为什么要做、做成什么价值”
  • 知识库架构 更偏“这些知识在系统里如何真正运转”

二、为什么它不是“一个向量库”

如果把产线军师的知识系统理解成“上传文档,然后做 embedding 检索”,会漏掉几个关键事实:

  • 原始文件会被单独归档,而不是只留下切块文本
  • 知识目录和原文归档是两层结构,不是一个表
  • 检索不是纯向量相似度,而是混合召回、意图判断和结果展开
  • 知识结果并不总是直接塞进模型,而是会根据模式和预算进入不同链路
  • 自动学习出的结构化知识还会经过草稿与审核环节

所以,对产线军师而言,知识库更接近“可治理的知识运行时”,而不是单一的 RAG 组件。

三、知识库架构可以分成哪几层

从产品视角,可以把它理解为五层:

作用
原文归档层保存知识原始文件、来源和下载回溯关系
知识目录层保存切块知识、结构化知识、关键词和索引状态
检索编排层按问题意图组织向量召回、关键词召回、重排与原文展开
上下文接入层决定知识结果以什么方式进入本轮分析
治理演化层处理草稿、审核、重建、结构化抽取和元数据同步

这意味着知识库不是“存进去就结束”,而是一套持续运行的链路。

四、一条典型知识链路是什么样的

知识来源通常包括:

  • 产品文档、说明书、SOP、报告
  • 术语表、规则集、诊断映射
  • 历史案例、复盘结论和专家经验
  • 工具元数据和系统能力说明

五、为什么原文归档和知识目录要分开

这个设计对制造场景很重要,因为它解决了三个实际问题:

1. 可回溯

当系统引用一条知识时,能回到原文,而不是只剩下一段脱离上下文的切块文本。

2. 可重建

当切块策略、索引策略或结构化抽取方式变化时,可以基于原文重新建索引。

3. 可治理

原文、目录条目、草稿知识和正式知识可以有不同的生命周期,不会混成一层。

六、为什么检索不是“搜到就塞给模型”

在产线军师里,知识检索之后还要经过第二次判断:

  • 这是不是当前问题真正需要的知识
  • 应该作为工具结果返回,还是作为上下文提示进入本轮
  • 是偏解释依据、诊断经验,还是术语补丁
  • 当前上下文预算是否值得带入这部分知识

所以,知识系统和 上下文工程 是强耦合的。知识库负责“能不能找到”,上下文工程负责“这一轮到底带不带进去、带多少进去”。

七、知识库架构和知识闭环、记忆机制是什么关系

机制更关注什么
知识闭环机制经验如何沉淀、复用和长期演进
知识库架构知识如何被归档、索引、检索、接入和治理
记忆机制会话上下文和用户偏好如何连续延续

简单理解:

  • 知识闭环回答“为什么要把经验沉淀下来”
  • 知识库架构回答“这些知识在系统里怎么跑起来”
  • 记忆机制回答“会话中的连续性怎么保住”

八、对产品的直接意义

知识库架构带来的直接价值,不只是“回答更丰富”,而是:

  • 结果更可追溯:能回到原始资料和证据来源
  • 系统更可治理:支持草稿、审核、重建和分类演化
  • 解释更可复用:知识不再只是文档,而能被系统稳定调用
  • 平台更可扩展:文档知识、结构化知识、工具知识都能进入统一体系

如果你想先理解为什么知识要长期沉淀,可先看 知识闭环机制;如果想理解知识如何进入当前对话,还可以继续看 上下文工程