以下是关于如何用 AI 梳理文档知识的一些方法和步骤:
使用 Kimi 梳理文档:
在网站上增加 AI 助手梳理文档:
AI 梳理文档的检索原理:
这里的Kimi可不是王者荣耀背后的天美,而是月之暗面公司推出的、类似ChatGPT的大模型聊天机器人。kimi.moonshot.cn/它的特点就是支持超长的上下文,能输入长达20w字:真的假的?试一试就知道了:厉害??!一口气吞下整本书!看了一下这本书的出版信息,字数为“300千字”,超过20w了![heading3]Kimi-梳理整本书[content]那么,就让Kimi来梳理全书,帮我快速复习一下:基本上跟目录一一对照(它将第8章的内容拆成了两部分,把“深度学习的应用案例”单列一章,合理)。这样的梳理还不够细致,能更细一点吗?整个脉络一下子就清清楚楚了。再细一点:能生成思维导图吗?现在还不行:借助MarkMap,就能得到这本书内容的思维导图,漂亮:[heading3]Kimi-知识点讲解[content]上面是让Kimi给我梳理和复习,是大纲概览性质的,方便“观其大略”。如果要深入某个具体的章节或者知识点,可以让Kimi展开讲讲。比如“神经网络”的核心概念:进一步让它给出例子和代码:可以随便与Kimi在某个主题上对话,从而获得深入的理解。[heading3]Kimi-给我出套题[content]当然,要获得对知识点掌握程度的了解,最直接的方式就是“做卷子”,这是我们从小到大学校教育根深蒂固植入脑海的。那么,就让Kimi出题吧:Kimi真是一个耿直boy,直接把题的答案一起给出来了。还是一道题一道题来吧:可以随时让它告诉你得分情况:或者随时终止测试:
接下来,我们可以尝试让大模型在面对客户问题时参考这份文档,以产出一个更准确的回答和建议。1.上传文件:在百炼控制台的[数据管理](https://bailian.console.aliyun.com/#/data-center)中的非结构化数据页签中点击导入数据,根据引导上传我们虚构的百炼系列手机产品介绍:2.根据您上传的文档大小,百炼需要一定时间解析,通常占用1~6分钟,请您耐心等待。3.1.2.建立索引:进入[知识索引](https://bailian.console.aliyun.com/#/knowledge-base),根据引导创建一个新的知识库,并选择刚才上传的文件,其他参数保持默认即可。知识库将为上一步骤中准备的文档建立索引,以便后续大模型回答时检索参考。3.选择向量存储类型时,如果您希望集中存储、灵活管理多个应用的向量数据,可选择ADB-PG。4.1.2.1.2.引用知识:完成知识库的创建后,可以返回[我的应用](https://bailian.console.aliyun.com/#/app-center)进入到刚才创建的应用设置界面,打开知识检索增强开关、选择目标知识库,测试验证符合预期后点击发布。Prompt中会被自动添加一段信息,以便大模型在后续回答时参考检索出来的信息。3.1.[heading3]4.2检验效果[content]有了参考知识,AI助手就能准确回答关于您公司的商品的问题了。
1.信息筛选与确认:2.首先,系统会对检索器提供的信息进行评估,筛选出最相关和最可信的内容。这通常涉及到对信息的来源、时效性和相关性进行验证。3.消除冗余:4.在多个文档或数据源中,可能会有重复的信息。系统需要识别和去除这些冗余内容,以防在生成回答时出现重复或相互矛盾的信息。5.关系映射:6.系统将分析不同信息片段之间的逻辑和事实关系,如因果、对比、顺序等。这有助于构建一个结构化的知识框架,使得信息在语义上更加连贯。7.上下文构建:8.将筛选和结构化的信息组织成一个连贯的上下文环境。这通常包括对信息进行排序、归类和整合,使其形成一个统一的叙述或解答框架。9.语义融合:10.在必要时,系统可能会进行语义融合,即合并意义相近但表达不同的信息片段,以减少语义上的重复并增强信息的表达力。11.预备生成阶段:12.最后,整合好的上下文信息被编码成适合生成器处理的格式,如将文本转化为适合输入到生成模型的向量形式。④、大模型生成回答1、生成器:最终全新的上下文被一起传递给大语言模型。随后,大语言模型(LLM)根据提供的信息来回答问题。因为这个上下文包括了检索到的信息,因此大语言模型相当于同时拿到了问题和参考答案,通过LLM的全文理解,最后生成一个准确和连贯的答案。