知识库

上传一份 PDF。
几分钟后,你的 AI 就能基于它回答问题了。

产品文档、帮助文章、保修条款,想丢什么丢什么。我们切片、向量化、存进 Qdrant,你的 AI 开始回答,并附上对应原文页码。不用写 prompt,不用再训练。

12+ 支持的格式
200MB 单文件上限
< 400ms p95 查询延迟
product-handbook-v3.pdf 3.2 MB 已索引
shipping-policy.md 42 KB 已索引
pricing-2026-q2.xlsx → pdf 1.8 MB 已索引
help.example.com/faq 网页 已索引

PDF、网页、Notion — 想到的都能上

手头有什么丢什么 — 不用重排格式,不用导出成专有结构。

PDF
.pdf · .pdf/a
单文件200 MB · 扫描件自动 OCR
产品手册、员工手册、保修文档、合同 — 基本上你发给客户的东西都可以。
Markdown
.md · .mdx
单文件 10 MB
工程 wiki、更新日志、一切你本来就用 Markdown 写的东西。
Notion
notion.so/...
工作区导出 页数不限
连上工作区,选中的页面自动同步进知识库 — 更新也跟着走。
网页
https://...
站点抓取 500 页 · 每日刷新
帮助中心、文档站、博客 — 按你设的节奏定期重抓。
Word / Excel
.docx · .xlsx
单文件 50 MB
销售话术、报价单、员工手册 — 原样上传,表格也读。
纯文本
.txt · .csv · .log
单文件 20 MB
从别的工具导出的、FAQ、聊天记录 — 门槛最低的格式。
API / JSON
POST /v1/kb/ingest
单次请求 2 MB · 自动分批
从你的 CMS、wiki 或内部系统同步 — 一个接口,幂等更新。

四步走完:上传到可回答

从把 PDF 拖进去到 AI 能拿它回答问题,一般不到五分钟。

01
丢文档进来 DROP

拖进一整个 PDF 文件夹,贴个帮助中心网址,或者连上 Notion。混着来也行。

把文件拖到这里 PDF、Markdown、Word、Excel、Notion、URL
02
我们切片 + 向量化 AUTO

提文字、图像 OCR、按语义切片、存进 Qdrant — 全自动,你一个字不用管。

已从 product-handbook-v3.pdf 提取 184 页
已 OCR 12 个表格和 6 张示意图
正在向量化第 312/506 个片段...
正在写入 Qdrant · 预计还剩 40 秒
03
直接测一测 TEST

直接在 dashboard 里问问题,看 AI 用的是哪个片段。答得好就上线,答得怪就往下看。

Velvet 2 的保修期多久?
标准保修 24 个月,涵盖材料和工艺缺陷;正常磨损不在保修内。
product-handbook-v3.pdf · p.47
04
错了就改 FIX

答得不对劲?点个踩,留句话,传份更好的源文件。AI 每一次被纠正都在变聪明。

发到加拿大一般 7–10 个工作日。
不太对 — 数据是 2024 年的
已修复:知识库新增 "canada-shipping-2026.md"

来源全程透明,一眼可见

每条回答都会附上来源文件。查不到就直说,不编。

丝绒拿铁里到底有啥?
AIMei · 咖啡师
丝绒拿铁以燕麦奶打底,加一小撮喜马拉雅盐,收尾用大溪地香草。无香精。 velvet-ingredients.pdf · p.2
能换燕麦奶吗?
AIMei · 咖啡师
可以。菜单上所有饮品都能换成燕麦、杏仁或豆乳,不加钱。点单时说一声就行。 barista-handbook-v7.pdf · p.14
你们散装卖豆子吗?按公斤那种。
AIMei · 咖啡师
这个我暂时还没资料。要我帮你转接人工吗?或者直接找我们团队问也行。 无来源命中 — 已提示转人工

检索增强,不是背诵

用户提问时,我们先在你的文档里搜最相关的片段,再把片段连同问题一起交给 AI — 所以回答来自你的内容,不是训练数据。

如果没有片段过置信度阈值,AI 直接说不知道。不编参数,不造价格,不"我觉得大概..."

每条回答都展示用了哪个片段。点一下引用,直接跳到原文 — 页码、章节、行号。

底层:Qdrant 向量检索,语义 + 关键词混合,p95 延迟低于 400ms

AI 的回答
丝绒拿铁用燕麦奶打底,加一小撮喜马拉雅盐,收尾用真正的大溪地香草。不喜欢燕麦也没关系,菜单上都能换成杏仁或豆乳。
1.4 秒生成 · 召回 2 个片段 · 置信度 0.87
文档原文
丝绒拿铁(招牌) 基底:燕麦奶(Oatly Barista) 风味:喜马拉雅粉盐、大溪地香草精 可替换奶:杏仁、豆乳 — 不额外收费 过敏源:含燕麦;香草精为酒精基
velvet-ingredients.pdf · 第 2 页,片段 14

真实内容一样管理

文档会过期,知识库不能。版本、更新、审计工具全部内置。

版本历史

每次上传都带版本号。新文档坏了某个回答?一键回滚。也能同时开两个版本做 A/B 测试。

v3.2 当前版本 6 分钟前
新增 2026 Q2 价格,更新保修条款
v3.1 新增欧盟和英国的运费政策 3 天前
v3.0 初始手册上传 2 周前

增量上传

随时加新文档,不用全量重建。只有改动的片段重新向量化,成本低,服务也不下线。

  • 单文件或整个目录上传 — 增量,不是全量重建
  • 差分感知:只有第 3 页改了,就只重建第 3 页
  • URL 来源按计划重抓 — 每天、每周或手动触发
  • 索引完成 webhook 回调,直接接进你的 CI

删除和复核

传错了文件,或者某份文档本身就不对?一键拿掉,所有引用它的历史回答同步失效。

  • 一键删除,秒级从检索和回答里撤下
  • 历史引用自动标记,方便你回头复核
  • 软删除保留 30 天,反悔随时能找回
  • 审计日志完整记录谁删了什么、什么时候删的

改进闭环

回答被踩,留一句反馈,你的团队就收到一条工单去修文档或补上缺的片段。下一个顾客得到更好的答案。

顾客提问对话里问
AI 回答附带引用
团队改进更新文档
反馈点赞 / 踩

上传前大家都会问的问题

索引要多久?
一份短 Markdown 大概 10 秒,一份 200 页的 PDF 也就几分钟。过程里 dashboard 有实时进度,离开一会儿也行,完成我们会发邮件提醒。
能处理图片和扫描件 PDF 吗?
文字没问题。图片和表格会自动 OCR — 扫描件 PDF、截图都行。手写字识别率一般,置信度低的片段我们会标出来让你确认。
源文档更新了会自动同步吗?
可以。URL 来源可以设每天、每周或手动重抓;文件类上传新版本后旧版自动归档,回答同步切到新版。
AI 找不到答案时会怎样?
如果文档里找不到答案,AI 会明确说不知道,并提示转人工,而不是瞎编。引用本身就是用来自证的。你也可以设置置信度阈值,低于这个值就交给人。
上传的文档谁能看到?
上传的文档全程加密。向量化在我们自己的 Qdrant 集群里跑 — 我们不会拿你的内容训练任何模型。详见 隐私政策
支持哪些语言?
英语、简体/繁体中文、日语、西班牙语、法语、德语、葡萄牙语,还有十几种。可以用一种语言问,AI 从另一种语言的源文档里取答案 — 引用仍然指向原文。
这和 Roleplay AI 有啥区别?
可以这样理解:知识库 是"是什么" — 事实、参数、政策。Roleplay 是"怎么说" — 语气、人设、听起来像谁。两者都要:有人设没知识是自信地胡说,有知识没人设像个搜索引擎。
能让不同人设用不同的文档吗?
当然可以。不同人设读不同的知识库 — 销售 bot 看得到价格表,客服 bot 看不到。在 人设设置 里配置就行。

搭配使用

知识库只是一块拼图。它怎么接入 Lane.Chat 其它部分。

把文档变成一个会好好回答问题的同事

拖进一份 PDF,贴一个网址,看着你的 AI 开始给出真答案。