「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
RAG工作流搭建
RAG(检索增强生成)工作流搭建主要包括以下步骤: 1. 文档加载:从多种不同来源加载文档,如非结构化的 PDF 数据、结构化的 SQL 数据、代码等,LangChain 提供了 100 多种不同的文档加载器。 2. 文本分割:文本分割器把文档切分为指定大小的块,称为“文档块”或者“文档片”。 3. 存储: 将切分好的文档块进行嵌入转换成向量的形式。 将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法从向量数据库中找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 RAG 是一种结合了检索和生成的技术,其基本流程为:首先,给定用户输入,如问题或话题,从数据源中检索出相关文本片段作为上下文。然后,将用户输入和检索到的上下文拼接成完整输入传递给大模型,并包含提示指导模型生成期望输出。最后,从大模型输出中提取或格式化所需信息返回给用户。 此外,您还可以通过以下方式学习 RAG: 1. 观看视频演示,如: 2. 利用相关 Bot 进行学习,如: Query 改写效果对比 Bot:https://www.coze.cn/store/bot/7400553639514800182?panel=1&bid=6dkplh1r43g15 RAG 全流程学习 Bot:结合大模型,模拟 RAG 的离线存储和在线检索全流程。 您还可以参考如何使用 LangChain 开发一个简单的 RAG 问答应用。
2025-01-06
有哪些优化文章句子的app
以下是一些优化文章句子的 app: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体的 AI 写作助手,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于学生和写作人员的多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,可以帮助用户优化文章的语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可以根据输入生成符合要求的学术论文。 此外,还有一些 AI 文章排版工具: 1. Grammarly:不仅是语法和拼写检查工具,还提供排版功能,可改进文档整体风格和流畅性。 2. QuillBot:AI 驱动的写作和排版工具,能改进文本清晰度和流畅性,同时保持原意。 3. Latex:虽不是纯粹的 AI 工具,但广泛用于学术论文排版,使用标记语言描述文档格式,有许多 AI 辅助的编辑器和插件简化排版过程。 4. PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 5. Wordtune:AI 写作助手,重新表述和改进文本,使其更清晰专业,保持原始意图。 6. Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 而辅助写邮件的 AI 工具包括: 1. Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能,易于使用,支持多种平台和语言。网站:https://www.grammarly.com/ 2. Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句,界面简洁,重点突出,适用于改善写作风格和简洁性。网站:http://www.hemingwayapp.com/ 3. ProWritingAid:全面的语法和风格检查,提供详细写作报告和建议,功能强大,支持多种平台和集成,适合专业写作者。网站:https://prowritingaid.com/ 4. Writesonic:基于 AI 生成各种类型文本,包括电子邮件、博客文章、广告文案等,生成速度快,适合需要快速创作和灵感的用户。网站:https://writesonic.com/ 5. Lavender:专注于邮件写作优化,提供个性化建议和模板,帮助用户提高邮件打开率和回复率。
2025-01-06
知识库搭建流程
搭建知识库的流程通常包括以下几种情况: 本地部署大模型及搭建个人知识库: 1. 了解 RAG 技术:RAG 是利用大模型能力搭建知识库的应用,在需要依靠不在大模型训练集中的数据时,通过检索增强生成。其过程包括文档加载(从多种来源加载文档,如 PDF 等非结构化数据、SQL 等结构化数据及代码)、文本分割(把文档切分为指定大小的块)、存储(将切分好的文档块嵌入转换为向量形式并存储到向量数据库)、检索(通过检索算法找到与输入问题相似的嵌入片)、输出(把问题及检索出的嵌入片提交给 LLM 生成答案)。 2. 文本加载器:将用户提供的文本加载到内存中以便后续处理。 利用 Coze 搭建知识库: 1. 收集知识:确认知识库支持的数据类型,收集知识通常有三种方式,包括企业或个人沉淀的 Word、PDF 等文档,企业或个人沉淀的云文档(通过链接访问),互联网公开的一些内容(可安装 Coze 提供的插件采集)。 2. 创建知识库。 3. 创建数据库用以存储每次的问答。 4. 创建工作流。 5. 编写 Bot 的提示词。 6. 预览调试与发布。 信息管理与知识体系构建: 1. 信息源的选择:明确需求和兴趣点,选择相关信息源,保证信息质量和相关性。 2. 信息通路的建立:通过工具和方法,如浏览器插件、笔记应用等,建立稳定的信息获取和存储机制。 3. 知识结构化:使用笔记方法和工具,对收集的信息分类、标签化和链接,形成结构化知识体系,便于检索和应用。 4. 知识内化与应用:定期复习、思考和实践,将外部信息转化为个人知识,并在实际中应用解决问题。
2025-01-06
RAG与Agent如何结合应用
RAG 与 Agent 的结合应用可以通过以下步骤实现: 1. 数据加载:根据数据源类型选择合适的数据加载器,如网页可使用 WebBaseLoader 加载和解析,返回文档对象。 2. 文本分割:依据文本特点选择合适的文本分割器,将文档对象分割成较小的对象,如博客文章可用 RecursiveCharacterTextSplitter 分割。 3. 嵌入与存储:使用文本嵌入器和向量存储器将文档对象转换为嵌入并存储,根据质量和速度选择合适的,如 OpenAI 的嵌入模型和 Chroma 的向量存储器。 4. 创建检索器:通过向量存储器检索器,传递向量存储器对象和文本嵌入器对象作为参数,创建用于根据用户输入检索相关文档对象的检索器。 5. 创建聊天模型:根据性能和成本选择合适的聊天模型,如使用 OpenAI 的 GPT3 模型,根据用户输入和检索到的文档对象生成输出消息。 以餐饮生活助手为例,基于结构化数据来 RAG 实战: 1. 定义餐饮数据源:将餐饮数据集转化为 Langchain 可识别和操作的数据源,如数据库、文件、API 等,并注册到 Langchain 中,提供统一接口和方法供 LLM 代理访问和查询。 2. 定义 LLM 的代理:通过 Langchain 的代理(Agent)实现,代理管理器可让开发者定义不同的 LLM 代理及其功能和逻辑,提供统一接口和方法供用户交互。 以下是使用 LangChain 构建 RAG 应用的示例代码。
2025-01-06
RAG的经典应用场景
RAG(检索增强生成)的经典应用场景主要包括以下方面: 1. 构建智能问答客服:用户提出问题,RAG 模型从大规模的文档集合中检索相关的文档,然后生成回答。 2. 知识问答系统:用户提问后,RAG 从私有知识中检索到“包含答案的内容”,然后把“包含答案的内容”和用户提问一起放到提示词中,提交给大模型,大模型的回答会充分考虑到“包含答案的内容”。
2025-01-06
RAG技术基本了解
RAG(Retrieval Augmented Generation,检索增强生成)是一种结合信息检索和文本生成能力的技术,主要用于处理需要广泛知识的任务,如问答系统,能够提供详细而准确的回答。 其基本流程包括以下几个步骤: 1. 文档加载:从多种不同来源加载文档,如 PDF 在内的非结构化数据、SQL 在内的结构化数据以及 Python、Java 之类的代码等。 2. 文本分割:文本分割器把文档切分为指定大小的块,称为“文档块”或者“文档片”。 3. 存储:涉及将切分好的文档块进行嵌入转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法从向量数据库中找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 RAG 由两部分组成:一个“检索器”和一个“生成器”。检索器从外部知识中快速找到与问题相关的信息,生成器则利用这些信息来制作精确和连贯的答案。 在实际应用中,例如构建能够利用私有数据或实时数据进行推理的 AI 应用时,将相关信息检索并插入到模型的输入中,即检索增强生成,可以提高生成的质量和准确性。首先给定一个用户的输入,RAG 会从一个数据源中检索出与之相关的文本片段作为上下文,然后将用户的输入和检索到的上下文拼接成一个完整的输入传递给大模型,最后从大模型的输出中提取或格式化所需的信息返回给用户。
2025-01-06
如何应用提示词
以下是关于如何应用提示词的全面指导: 一、理解提示词的作用 提示词向模型提供上下文和指示,其质量直接影响模型输出的质量。 二、学习提示词的构建技巧 1. 明确任务目标,用简洁准确的语言描述。 2. 给予足够的背景信息和示例,帮助模型理解语境。 3. 使用清晰的指令,如“解释”“总结”“创作”等。 4. 对特殊要求应给予明确指示,如输出格式、字数限制等。 三、参考优秀案例 研究和学习已有的优秀提示词案例,可在领域社区、Github 等资源中获取。 四、实践、迭代、优化 多与语言模型互动,根据输出提高提示词质量。尝试各种变体,比较分析输出差异,持续优化提示词构建。 五、活用提示工程工具 目前已有一些提示工程工具可供使用,如 Anthropic 的 Constitutional AI。 六、跟上前沿研究 提示工程是当前前沿研究领域之一,持续关注最新成果和方法论。 七、在星流一站式 AI 设计工具中的应用 1. 在 prompt 输入框中输入提示词,可使用图生图功能辅助创作。 2. 了解提示词的定义:用于描绘想生成的画面,支持中英文输入。 3. 掌握写好提示词的方法: 内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等。 调整负面提示词,帮助 AI 理解不想生成的内容。 利用“加权重”功能,让 AI 明白重点内容。 可使用预设词组,小白用户可点击进行生图。 4. 善用辅助功能,如翻译功能、删除所有提示词、会员加速等。 精心设计的提示词能最大限度发挥语言模型的潜力,多实践、多学习、多总结,终可掌握窍门。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-06
如何写出高效提示词 prompt
以下是关于如何写出高效提示词 prompt 的一些建议: 1. 明确任务:清晰地定义任务,例如写故事时包含故事背景、角色和主要情节。 2. 提供上下文:若任务需要特定背景知识,在 prompt 中提供足够信息。 3. 使用清晰语言:尽量用简单、清晰的语言描述,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格要求,在 prompt 中明确指出。 5. 使用示例:若有特定期望结果,提供示例帮助 AI 理解需求。 6. 保持简洁:尽量使 prompt 简洁明了,避免过多信息导致困惑。 7. 使用关键词和标签:有助于 AI 理解任务主题和类型。 8. 测试和调整:生成文本后仔细检查结果,根据需要调整 prompt,可能需要多次迭代。 此外,还需注意以下几点: 对于星流一站式 AI 设计工具: 输入语言方面,不同基础模型对输入语言有不同要求,有的使用自然语言,有的使用单个词组,且支持中英文输入。 写好提示词可参考:利用预设词组、保证内容准确(包含人物主体、风格等要素)、调整负面提示词、利用“加权重”功能突出重点内容,还可使用辅助功能如翻译、删除所有提示词、会员加速等。 Prompt 的专场教程 基础篇: Prompt 是用于指挥 AI 生成所需内容的一段指令,每个单独的提示词叫 tag(关键词)。 支持英语和 emoji,可参考提示词字典。 语法规则包括用英文半角符号逗号分隔 tag,改变 tag 权重有两种写法,还可进行 tag 步数控制。
2025-01-06
提示词的模版化
以下是关于提示词模板化的相关内容: 提示词相关资源: Majinai: 词图: Black Lily: Danbooru 标签超市: 魔咒百科词典: AI 词汇加速器: NovelAI 魔导书: 鳖哲法典: Danbooru tag: AIBooru: 简单的提示词模板: 最终目标是把需求说清楚。例如: GPTs 提示词模板。 案例:Act like a SEO Professional Writer(你是一个 SEO 专家),I need a optimized blog post(我需要一篇优化的博客文章),you will research keywords and incorporate them naturally into the content(你将研究关键字并将它们自然地融入内容中),in the process,you should focus on readability,relevance and proper keyword placement(在这个过程中,你应该关注可读性、相关性和正确的关键词位置),please avoid keyword stuffing or overoptimisation(请避免关键字堆砌或过度优化),input the final result in a well structured format(以结构良好的格式输入最终结果),here is an example:title"Top 10 Tips for Effective SEO Writing:Boost Your Content's Visibility"(这里有一个例子:标题“有效 SEO 写作的 10 大技巧:提高你的内容的知名度”),完整 prompt:Act like a SEO Professional Writer,I need a optimized blog post,you will research keywords and incorporate them naturally into the content,in the process,you should focus on readability,relevance and proper keyword placement,please avoid keyword stuffing or overoptimisation,input the final result in a well structured format,here is an example:title"Top 10 Tips for Effective SEO Writing:Boost Your Content's Visibility" 提示词母体系列(2)的模板构成: 在掌握人物设计整体框架后编写提示词,可借鉴替换方式替换模板。 约束部分:规则放顶部加强约束,底部也有相应约束,整体约束包裹具体提示词以提示模型专注性。 模板结构: 基本信息:包含姓名、性别、年龄和职业,为其他特征奠定基础。 外貌特征:描述物理外观,创造视觉形象。 背景和经历:与基本信息相关,阐述成长环境和重要经历,提供行为和思维方式背景。 性格和价值观:包括性格特征、核心价值观和个人习惯,塑造内在世界。 爱好、特长和语言风格:融合兴趣爱好、特殊才能和表达方式,展现多面性。 人际关系和社交活动:描述社交圈,揭示社会定位和互动方式。 未来规划和目标:勾勒梦想和未来计划,赋予前进动力和方向。
2025-01-06
提示词的模版化
以下是关于提示词模板化的相关内容: 提示词相关资源: Majinai: 词图: Black Lily: Danbooru 标签超市: 魔咒百科词典: AI 词汇加速器: NovelAI 魔导书: 鳖哲法典: Danbooru tag: AIBooru: 简单的提示词模板: 最终目标是把需求说清楚。 示例:Act like a ) 提示词母体系列(2):再进阶,一分钟创建你的拟人化小助理 模板构成: 在掌握人物设计整体框架后编写提示词,可借鉴替换方式替换模板。 约束部分:规则放顶部加强约束,底部也有相应约束,包裹具体提示词以提示模型专注性。 模板结构: 基本信息:包含姓名、性别、年龄和职业,为其他特征奠定基础。 外貌特征:描述物理外观,创造视觉形象。 背景和经历:与基本信息相关,阐述成长环境和重要经历,提供行为和思维方式背景。 性格和价值观:包括性格特征、核心价值观和个人习惯,塑造内在世界。 爱好、特长和语言风格:融合兴趣爱好、特殊才能和表达方式,展现多面性。 人际关系和社交活动:描述社交圈,揭示社会定位和互动方式。 未来规划和目标:勾勒梦想和未来计划,赋予前进动力和方向。
2025-01-06