知识库

上传一份 PDF。
几分钟后，你的 AI 就能基于它回答问题了。

产品文档、帮助文章、保修条款，想丢什么丢什么。我们切片、向量化、存进 Qdrant，你的 AI 开始回答，并附上对应原文页码。不用写 prompt，不用再训练。

上传第一份文档看怎么用

12+ 支持的格式

200MB 单文件上限

< 400ms p95 查询延迟

product-handbook-v3.pdf 3.2 MB 已索引

shipping-policy.md 42 KB 已索引

pricing-2026-q2.xlsx → pdf 1.8 MB 已索引

help.example.com/faq 网页已索引

可以上传什么

PDF、网页、Notion — 想到的都能上

手头有什么丢什么 — 不用重排格式，不用导出成专有结构。

PDF

.pdf · .pdf/a

单文件200 MB · 扫描件自动 OCR

产品手册、员工手册、保修文档、合同 — 基本上你发给客户的东西都可以。

Markdown

.md · .mdx

单文件 10 MB

工程 wiki、更新日志、一切你本来就用 Markdown 写的东西。

Notion

notion.so/...

工作区导出 页数不限

连上工作区，选中的页面自动同步进知识库 — 更新也跟着走。

网页

https://...

站点抓取 500 页 · 每日刷新

帮助中心、文档站、博客 — 按你设的节奏定期重抓。

Word / Excel

.docx · .xlsx

单文件 50 MB

销售话术、报价单、员工手册 — 原样上传，表格也读。

纯文本

.txt · .csv · .log

单文件 20 MB

从别的工具导出的、FAQ、聊天记录 — 门槛最低的格式。

API / JSON

POST /v1/kb/ingest

单次请求 2 MB · 自动分批

从你的 CMS、wiki 或内部系统同步 — 一个接口，幂等更新。

怎么用

四步走完：上传到可回答

从把 PDF 拖进去到 AI 能拿它回答问题，一般不到五分钟。

丢文档进来 DROP

拖进一整个 PDF 文件夹，贴个帮助中心网址，或者连上 Notion。混着来也行。

把文件拖到这里 PDF、Markdown、Word、Excel、Notion、URL

我们切片 + 向量化 AUTO

提文字、图像 OCR、按语义切片、存进 Qdrant — 全自动，你一个字不用管。

✓ 已从 product-handbook-v3.pdf 提取 184 页

✓ 已 OCR 12 个表格和 6 张示意图

→ 正在向量化第 312/506 个片段...

正在写入 Qdrant · 预计还剩 40 秒

直接测一测 TEST

直接在 dashboard 里问问题，看 AI 用的是哪个片段。答得好就上线，答得怪就往下看。

Velvet 2 的保修期多久？

标准保修 24 个月，涵盖材料和工艺缺陷；正常磨损不在保修内。

product-handbook-v3.pdf · p.47

错了就改 FIX

答得不对劲？点个踩，留句话，传份更好的源文件。AI 每一次被纠正都在变聪明。

发到加拿大一般 7–10 个工作日。

不太对 — 数据是 2024 年的

已修复：知识库新增 "canada-shipping-2026.md"

引用机制

来源全程透明，一眼可见

每条回答都会附上来源文件。查不到就直说，不编。

丝绒拿铁里到底有啥？

AIMei · 咖啡师

丝绒拿铁以燕麦奶打底，加一小撮喜马拉雅盐，收尾用大溪地香草。无香精。 velvet-ingredients.pdf · p.2

能换燕麦奶吗？

AIMei · 咖啡师

可以。菜单上所有饮品都能换成燕麦、杏仁或豆乳，不加钱。点单时说一声就行。 barista-handbook-v7.pdf · p.14

你们散装卖豆子吗？按公斤那种。

AIMei · 咖啡师

这个我暂时还没资料。要我帮你转接人工吗？或者直接找我们团队问也行。无来源命中 — 已提示转人工

检索增强，不是背诵

用户提问时，我们先在你的文档里搜最相关的片段，再把片段连同问题一起交给 AI — 所以回答来自你的内容，不是训练数据。

如果没有片段过置信度阈值，AI 直接说不知道。不编参数，不造价格，不"我觉得大概..."

每条回答都展示用了哪个片段。点一下引用，直接跳到原文 — 页码、章节、行号。

底层：Qdrant 向量检索，语义 + 关键词混合，p95 延迟低于 400ms。

AI 的回答

丝绒拿铁用燕麦奶打底，加一小撮喜马拉雅盐，收尾用真正的大溪地香草。不喜欢燕麦也没关系，菜单上都能换成杏仁或豆乳。

1.4 秒生成 · 召回 2 个片段 · 置信度 0.87

文档原文

丝绒拿铁（招牌）基底：燕麦奶（Oatly Barista）风味：喜马拉雅粉盐、大溪地香草精可替换奶：杏仁、豆乳 — 不额外收费过敏源：含燕麦；香草精为酒精基

velvet-ingredients.pdf · 第 2 页，片段 14

保持新鲜

当真实内容一样管理

文档会过期，知识库不能。版本、更新、审计工具全部内置。

版本历史

每次上传都带版本号。新文档坏了某个回答？一键回滚。也能同时开两个版本做 A/B 测试。

v3.2 当前版本 6 分钟前

新增 2026 Q2 价格，更新保修条款

v3.1 新增欧盟和英国的运费政策 3 天前

v3.0 初始手册上传 2 周前

增量上传

随时加新文档，不用全量重建。只有改动的片段重新向量化，成本低，服务也不下线。

单文件或整个目录上传 — 增量，不是全量重建
差分感知：只有第 3 页改了，就只重建第 3 页
URL 来源按计划重抓 — 每天、每周或手动触发
索引完成 webhook 回调，直接接进你的 CI

删除和复核

传错了文件，或者某份文档本身就不对？一键拿掉，所有引用它的历史回答同步失效。

一键删除，秒级从检索和回答里撤下
历史引用自动标记，方便你回头复核
软删除保留 30 天，反悔随时能找回
审计日志完整记录谁删了什么、什么时候删的

改进闭环

回答被踩，留一句反馈，你的团队就收到一条工单去修文档或补上缺的片段。下一个顾客得到更好的答案。

顾客提问对话里问

→

AI 回答附带引用

团队改进更新文档

←

反馈点赞 / 踩

常见问题

上传前大家都会问的问题

索引要多久？

一份短 Markdown 大概 10 秒，一份 200 页的 PDF 也就几分钟。过程里 dashboard 有实时进度，离开一会儿也行，完成我们会发邮件提醒。

能处理图片和扫描件 PDF 吗？

文字没问题。图片和表格会自动 OCR — 扫描件 PDF、截图都行。手写字识别率一般，置信度低的片段我们会标出来让你确认。

源文档更新了会自动同步吗？

可以。URL 来源可以设每天、每周或手动重抓；文件类上传新版本后旧版自动归档，回答同步切到新版。

AI 找不到答案时会怎样？

如果文档里找不到答案，AI 会明确说不知道，并提示转人工，而不是瞎编。引用本身就是用来自证的。你也可以设置置信度阈值，低于这个值就交给人。

上传的文档谁能看到？

上传的文档全程加密。向量化在我们自己的 Qdrant 集群里跑 — 我们不会拿你的内容训练任何模型。详见隐私政策。

支持哪些语言？

英语、简体/繁体中文、日语、西班牙语、法语、德语、葡萄牙语，还有十几种。可以用一种语言问，AI 从另一种语言的源文档里取答案 — 引用仍然指向原文。

这和 Roleplay AI 有啥区别？

可以这样理解：知识库 是"是什么" — 事实、参数、政策。Roleplay 是"怎么说" — 语气、人设、听起来像谁。两者都要：有人设没知识是自信地胡说，有知识没人设像个搜索引擎。

能让不同人设用不同的文档吗？

当然可以。不同人设读不同的知识库 — 销售 bot 看得到价格表，客服 bot 看不到。在人设设置里配置就行。

上传一份 PDF。
几分钟后，你的 AI 就能基于它回答问题了。

PDF、网页、Notion — 想到的都能上

四步走完：上传到可回答

来源全程透明，一眼可见

检索增强，不是背诵

当真实内容一样管理

版本历史

增量上传

删除和复核

改进闭环

上传前大家都会问的问题

搭配使用

把文档变成一个会好好回答问题的同事

上传一份 PDF。几分钟后，你的 AI 就能基于它回答问题了。

PDF、网页、Notion — 想到的都能上

四步走完：上传到可回答

来源全程透明，一眼可见

检索增强，不是背诵

当真实内容一样管理

版本历史

增量上传

删除和复核

改进闭环

上传前大家都会问的问题

搭配使用

把文档变成一个会好好回答问题的同事

上传一份 PDF。
几分钟后，你的 AI 就能基于它回答问题了。