Chat with Wiki - 如何用AI梳理文档知识

Answer

以下是关于如何用 AI 梳理文档知识的一些方法和步骤：

使用 Kimi 梳理文档：

Kimi 是月之暗面公司推出的类似 ChatGPT 的大模型聊天机器人，支持超长上下文，能输入长达 20 万字。
- 可以让 Kimi 梳理全书，与目录对照，脉络会更清晰。
- 能要求 Kimi 更细致地梳理，虽然目前不能生成思维导图，但可借助 MarkMap 获得。
- 针对具体章节或知识点，可让 Kimi 展开讲解，还能让其给出例子和代码。
- 可以让 Kimi 出题测试对知识点的掌握程度。

在网站上增加 AI 助手梳理文档：

上传文件：在百炼控制台的[数据管理]中的非结构化数据页签中点击导入数据，根据引导上传相关文档。
建立索引：进入[知识索引]，创建新的知识库并选择上传的文件，其他参数保持默认。
引用知识：完成知识库创建后，在[我的应用]中进行相关设置，打开知识检索增强开关、选择目标知识库，测试验证符合预期后点击发布。

AI 梳理文档的检索原理：

信息筛选与确认：对检索器提供的信息进行评估，筛选出最相关和最可信的内容，验证信息的来源、时效性和相关性。
消除冗余：识别和去除多个文档或数据源中的重复信息。
关系映射：分析不同信息片段之间的逻辑和事实关系。
上下文构建：将筛选和结构化的信息组织成连贯的上下文环境，包括排序、归类和整合。
语义融合：合并意义相近但表达不同的信息片段。
预备生成阶段：将整合好的上下文信息编码成适合生成器处理的格式。
大模型生成回答：大语言模型根据提供的信息来回答问题。

Content generated by AI large model, please carefully verify (powered by aily)

References

kimi：一些prompt技巧

这里的Kimi可不是王者荣耀背后的天美，而是月之暗面公司推出的、类似ChatGPT的大模型聊天机器人。kimi.moonshot.cn/它的特点就是支持超长的上下文，能输入长达20w字：真的假的？试一试就知道了：厉害??！一口气吞下整本书！看了一下这本书的出版信息，字数为“300千字”，超过20w了！[heading3]Kimi-梳理整本书[content]那么，就让Kimi来梳理全书，帮我快速复习一下：基本上跟目录一一对照（它将第8章的内容拆成了两部分，把“深度学习的应用案例”单列一章，合理）。这样的梳理还不够细致，能更细一点吗？整个脉络一下子就清清楚楚了。再细一点：能生成思维导图吗？现在还不行：借助MarkMap，就能得到这本书内容的思维导图，漂亮：[heading3]Kimi-知识点讲解[content]上面是让Kimi给我梳理和复习，是大纲概览性质的，方便“观其大略”。如果要深入某个具体的章节或者知识点，可以让Kimi展开讲讲。比如“神经网络”的核心概念：进一步让它给出例子和代码：可以随便与Kimi在某个主题上对话，从而获得深入的理解。[heading3]Kimi-给我出套题[content]当然，要获得对知识点掌握程度的了解，最直接的方式就是“做卷子”，这是我们从小到大学校教育根深蒂固植入脑海的。那么，就让Kimi出题吧：Kimi真是一个耿直boy，直接把题的答案一起给出来了。还是一道题一道题来吧：可以随时让它告诉你得分情况：或者随时终止测试：

10分钟在网站上增加一个AI助手

接下来，我们可以尝试让大模型在面对客户问题时参考这份文档，以产出一个更准确的回答和建议。1.上传文件：在百炼控制台的[数据管理](https://bailian.console.aliyun.com/#/data-center)中的非结构化数据页签中点击导入数据，根据引导上传我们虚构的百炼系列手机产品介绍：2.根据您上传的文档大小，百炼需要一定时间解析，通常占用1~6分钟，请您耐心等待。3.1.2.建立索引：进入[知识索引](https://bailian.console.aliyun.com/#/knowledge-base)，根据引导创建一个新的知识库，并选择刚才上传的文件，其他参数保持默认即可。知识库将为上一步骤中准备的文档建立索引，以便后续大模型回答时检索参考。3.选择向量存储类型时，如果您希望集中存储、灵活管理多个应用的向量数据，可选择ADB-PG。4.1.2.1.2.引用知识：完成知识库的创建后，可以返回[我的应用](https://bailian.console.aliyun.com/#/app-center)进入到刚才创建的应用设置界面，打开知识检索增强开关、选择目标知识库，测试验证符合预期后点击发布。Prompt中会被自动添加一段信息，以便大模型在后续回答时参考检索出来的信息。3.1.[heading3]4.2检验效果[content]有了参考知识，AI助手就能准确回答关于您公司的商品的问题了。

【AI+知识库】商业化问答场景，让AI回复更准确，一篇专为所有“小白”讲透RAG的实例教程（上篇）

1.信息筛选与确认：2.首先，系统会对检索器提供的信息进行评估，筛选出最相关和最可信的内容。这通常涉及到对信息的来源、时效性和相关性进行验证。3.消除冗余：4.在多个文档或数据源中，可能会有重复的信息。系统需要识别和去除这些冗余内容，以防在生成回答时出现重复或相互矛盾的信息。5.关系映射：6.系统将分析不同信息片段之间的逻辑和事实关系，如因果、对比、顺序等。这有助于构建一个结构化的知识框架，使得信息在语义上更加连贯。7.上下文构建：8.将筛选和结构化的信息组织成一个连贯的上下文环境。这通常包括对信息进行排序、归类和整合，使其形成一个统一的叙述或解答框架。9.语义融合：10.在必要时，系统可能会进行语义融合，即合并意义相近但表达不同的信息片段，以减少语义上的重复并增强信息的表达力。11.预备生成阶段：12.最后，整合好的上下文信息被编码成适合生成器处理的格式，如将文本转化为适合输入到生成模型的向量形式。④、大模型生成回答1、生成器：最终全新的上下文被一起传递给大语言模型。随后，大语言模型（LLM）根据提供的信息来回答问题。因为这个上下文包括了检索到的信息，因此大语言模型相当于同时拿到了问题和参考答案，通过LLM的全文理解，最后生成一个准确和连贯的答案。