RAG 与知识库
让 Agent 基于你的文档回答问题
把企业内部的文档、手册、法规导入知识库,Agent 就能基于这些内容回答问题——而且会标注每一条结论的出处。
多格式引擎
文档支持
支持 PDF、Word、Excel、PPT、Markdown、HTML、CSV 等格式。上传文件或输入网址即可导入。提供三种文档切分策略(固定长度、递归、语义),适配不同类型的文档结构。知识库内还可以直接创建 Markdown 文档。
.pdf
.docx
.xlsx
.pptx
.md
.html
.csv
.json
"如何审计采购?"
语义路径
通过向量相似度找到'审查采购订单'
关键词路径
在倒排索引中精确匹配'采购'
重排序模型
优选: 第 4.2 节 - 内部审计
精准检索
不是简单的关键词匹配。系统同时从“语义理解”和“关键词匹配”两个维度检索,再通过排序算法找出最相关的内容——语义向量检索捕捉含义相近但措辞不同的内容,关键词检索确保专有名词和编号的精确命中。两路结果融合排序后,再经过精排模型二次筛选。
无需部署额外的数据库服务——内置嵌入式向量库,零外部依赖。
结论可追溯
Agent 的每一条回答都会标注来源:
引用标记 [1][2] 指向具体的文档段落
引用对齐评分:评估回答与证据的匹配度
冲突检测:如果多个文档观点矛盾,系统明确标注
可信度评估:基于证据质量给出回答的置信分数
结构化引用面板展示完整的参考来源列表。让使用者可以验证 AI 的判断,而不是盲目信任。
溯源回答
[1] 超过 ¥50,000 的订单需要三个独立报价
证据
1
policy_v2.pdf98%
第 1.4 节: 订单阈值...
Knowledge Cluster
2,482 CHUNKSPolicy_Audit.pdfProcessed
Manual_v2.docxIndexing
知识库管理
完整的生命周期管理:创建、编辑、删除知识库。文档上传后后台异步处理,失败的文档可重试导入。支持查看、编辑和删除单个文档片段,片段内支持文本搜索。知识库可绑定到指定 Agent,Agent 运行时自动检索相关内容。
Semantic Chunking
专属的知识库详情页提供文档表格和片段浏览器,支持从列表页直接导航到文档和片段管理。