直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
如何部署本地知识库
以下是关于如何部署本地知识库的详细步骤: 一、硬件配置要求 运行大模型需要较高的机器配置,个人玩家可能负担不起。 生成文字大模型: 最低配置:8G RAM + 4G VRAM 建议配置:16G RAM + 8G VRAM 理想配置:32G RAM + 24G VRAM(如果要跑 GPT3.5 差不多性能的大模型) 生成图片大模型(比如跑 SD): 最低配置:16G RAM + 4G VRAM 建议配置:32G RAM + 12G VRAM 生成音频大模型: 最低配置:8G VRAM 建议配置:24G VRAM 二、RAG 技术 利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用。在进行本地知识库的搭建实操之前,需要先对 RAG 有大概的了解。 RAG 应用可抽象为 5 个过程: 1. 文档加载(Document Loading):从多种不同来源加载文档。LangChain 提供了 100 多种不同的文档加载器,包括 PDF 在内的非结构化的数据、SQL 在内的结构化的数据,以及 Python、Java 之类的代码等。 2. 文本分割(Splitting):文本分割器把 Documents 切分为指定大小的块,称为“文档块”或者“文档片”。 3. 存储:涉及将切分好的文档块进行嵌入(Embedding)转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. Output(输出):把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 三、部署本地知识库的具体步骤 1. 准备软件:如果想要对知识库进行更加灵活的掌控,需要一个额外的软件:AnythingLLM。 2. 安装和配置:安装地址:https://useanything.com/download 。安装完成后,会进入到其配置页面,主要分为三步: 第一步:选择大模型。 第二步:选择文本嵌入模型。 第三步:选择向量数据库。 3. 构建本地知识库: AnythingLLM 中有一个 Workspace 的概念,可以创建自己独有的 Workspace 跟其他的项目数据进行隔离。 首先创建一个工作空间。 上传文档并且在工作空间中进行文本嵌入。 选择对话模式。AnythingLLM 提供了两种对话模式: Chat 模式:大模型会根据自己的训练数据和我们上传的文档数据综合给出答案。 Query 模式:大模型仅仅会依靠文档中的数据给出答案。 4. 测试对话:当上述配置完成之后,就可以跟大模型进行对话了。 四、总结 看十遍不如实操一遍,实操十遍不如分享一遍。如果您也对 AI Agent 技术感兴趣,可以联系作者或者加作者的免费知识星球(备注 AGI 知识库)。
2025-02-10
如何创建一个应用于教学的各个环节,如备课体系、作业批改、出题建议、辅助出题等的智能体?
要创建一个应用于教学各个环节的智能体,您可以参考以下步骤和考虑以下方面: 1. 提前收集教育领域的需求,例如让云谷老师协助收集需求和案例,社群小伙伴帮助实现。这些需求可以包括办公提效的具体场景、家校沟通、个性化教育、心理疏导、备课体系、作业批改、出题建议、辅助出题、建立孩子的成长体系记录、孩子成长的游戏(如寻宝游戏)、朗读(模拟老师泛读,学生背诵,AI 评判)、文生图和文生视频在备课时的针对性、学科本身的教育辅助、分析学生行为并给出策略(基于教育心理学)、教师模拟培训、公开课备课辅助、指导新老师处理学生矛盾和家长问题以提高沟通能力等。 2. 明确最终交付物的形态和背后的思考,使需求描述更清晰。 3. 注册智谱 Tokens 智谱 AI 开放平台(https://bigmodel.cn/),获取资源包。新注册用户可获得 2000 万 Tokens,也可通过充值/购买多种模型的低价福利资源包,或者共学营报名赠送资源包。 4. 先去【财务台】左侧的【资源包管理】查看自己的资源包,本次项目可能会使用到 GLM4、GLM4VPlus、CogVideoX、CogView3Plus 等模型。 5. 进入智能体中心 我的智能体,开始创建智能体。为了照顾初学者,可以手把手进行编辑,完成一个简单智能体的搭建。 此外,在创建过程中,还可以考虑以下相关的产品和服务: 1. 具身智能的企业产品。 2. 3D 眼镜、AI 绘本、AI 图书等。 3. 学习机、飞书的多维表格、蚂蚁的智能体、Coze 的智能体等。 4. Zeabur 等云平台、0 编码平台。 5. 大模型如通义、智谱、kimi、deepseek 等。 6. 编程辅助、文生图工具(如可灵、即梦等)。 需要注意的是,创建这样的智能体需要综合考虑多方面的因素,并不断优化和改进,以满足教学的实际需求。
2025-02-10
如何训练一个辅助教学和备课的智能体
要训练一个辅助教学和备课的智能体,可以参考以下步骤和方法: 1. 利用大语言模型:例如 ChatGPT 等,探讨如何借助其辅助备课、解答学生疑问和生成教学材料。分享与大语言模型进行有效沟通的技巧,提升提问和指令的质量。 2. 注重教学应用:在训练过程中,考虑如何将智能体应用于教学的各个环节,如备课体系、作业批改、出题建议、辅助出题等。 3. 收集教育需求:提前收集教育领域的需求,包括办公提效、家校沟通、个性化教育、心理疏导等方面,让智能体能够针对性地提供服务。 4. 分析学生行为:基于教育心理学等,训练智能体能够分析学生行为,并给出相应的策略。 5. 模拟培训:如教师模拟培训、公开课备课辅助等。 6. 结合跨学科项目:像生物和信息科技老师合作带着学生训练 AI 模型。 7. 考虑多种教育场景:例如朗读、背诵评判,文生图、文生视频在备课时的针对性应用等。 同时,在与智能体交流时,要注意以下心得: 1. 把智能体当人看,用计算机神经网络模拟人脑工作,它表现得更像人,而不是准确的机器,也会不懂装懂,时对时错。 2. 智能体不需要休息,效率很高,但没有自驱力,被动回答。 此外,一些学校已经在行动,如北京市新英才学校的跨学科项目老师带着学生用 AIGC 做学校地图桌游,英语老师在 AIGC 的帮助下备课和授课等。
2025-02-10
怎么构建本地知识库
构建本地知识库的步骤如下: 1. 了解 RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。 大模型训练数据有截止日期,RAG 可解决依靠未包含在训练集中的数据的问题。 RAG 应用包括文档加载、文本分割、存储、检索和输出 5 个过程。 文档加载可从多种来源加载,包括非结构化、结构化和代码等。 文本分割将文档切分为指定大小的块。 存储包括将文档块嵌入转换为向量形式并存储到向量数据库。 检索通过算法找到与输入问题相似的嵌入片。 输出将问题和检索出的嵌入片提交给 LLM 生成答案。 2. 通过 Open WebUI 使用大模型: 访问相关网址,使用邮箱注册账号。 Open WebUI 一般有聊天对话和 RAG 能力(让模型根据文档内容回答问题)两种使用方式。 3. 进阶搭建: 安装 AnythingLLM 软件,其包含 Open WebUI 的能力并支持选择文本嵌入模型和向量数据库,安装地址:https://useanything.com/download 。 安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 在 AnythingLLM 中创建自己独有的 Workspace 与其他项目数据隔离。 首先创建工作空间,上传文档并进行文本嵌入,选择对话模式(Chat 模式会综合训练数据和上传文档数据给出答案,Query 模式仅依靠文档数据给出答案),最后测试对话。
2025-02-10
结合AI制作短视频
以下是关于结合 AI 制作短视频的相关内容: 使用 Fanbook 中的 niji6 模型及sref 指令,确定视频风格的一致性,尺寸选择 16:9。根据主题确定风格和时长,设定故事主线和镜头。按照场景、地点、镜号、画面描述、台词、音效等维度填充分镜头,精简人物对话,提炼重点。可借助语言大模型获取画面灵感,最终需自行思考选取和平衡画面联系。 除了上述方法,还可从以下路径获取故事: 1. 原创(直接经验):自身或周围人的经历、做过的梦、想象的故事等。 2. 改编(间接经验):经典 IP、名著改编、新闻改编、二创等。 剧本写作方面,编剧有一定门槛,建议先写和实践,再看书总结经验。短片创作可从自身或朋友经历改编、触动的短篇故事改编入手,多与他人讨论修改。 根据视频脚本生成短视频的 AI 工具有: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映分析并生成素材和文本框架。 2. PixVerse AI:在线多模态输入转化为视频的工具。 3. Pictory:可根据文本描述生成相应视频内容。 4. VEED.IO:提供 AI 图像和脚本生成器,规划视频内容。 5. Runway:将文本转化为风格化视频内容。 6. 艺映 AI:提供文生视频、图生视频、视频转漫等服务。 这些工具各有特点,适用于不同场景和需求。请注意内容由 AI 大模型生成,需仔细甄别。
2025-02-10
deepseek
DeepSeek 是一家具有独特特点和影响力的公司: 1. 其秘方具有硅谷特色: 早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。 它在硅谷受到关注和追逐并非近期之事,与硅谷有更好的对话和交流。 2. V3 可能是 DeepSeek 的 GPT3 时刻,未来发展充满未知但值得期待,它应能为全人类的人工智能事业做出更大贡献,且已是中国最全球化的 AI 公司之一。 3. 关于提升 DeepSeek 能力的提示词 HiDeepSeek: 效果对比:可通过 Coze 做小测试并对比。 使用方法:包括搜索网站、点击“开始对话”、发送装有提示词的代码、阅读开场白后正式开始对话等步骤。 设计思路:将 Agent 封装成 Prompt 并储存在文件以减轻调试负担,通过提示词文件实现联网和深度思考功能,优化输出质量,设计阈值系统,用 XML 进行规范设定等。 完整提示词:v 1.3。 特别鸣谢:李继刚的【思考的七把武器】提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。
2025-02-10
AI语聊,音频部分 一般有什么工具
以下是一些常见的用于 AI 语聊音频部分的工具: 1. 11labs:官网为 https://elevenlabs.io/ ,英文效果较好,但无法使用语速、情绪调节等控件,只能通过标点符号改变语音效果,抽声音卡有一定难度。 2. 魔音工坊:国内工具,可以使用情绪调节控件。 3. Speechify:https://speechify.com/ ,人工智能驱动的文本转语音工具,可作为多种平台应用使用。 4. Azure AI Speech Studio:https://speech.microsoft.com/portal ,提供支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供自定义语音模型。 5. Voicemaker:https://voicemaker.in/ ,可将文本转换为各种区域语言的语音,并允许创建自定义语音模型。 此外,在音频领域,配音员水平的 AI 已经成熟,对于一般商业场景足够。当有了多模态理解能力之后,带有感情的对话能力也会在 2024 年有突破。在 AI 陪聊场景中,人脸动作的细致刻画、人物微动作、低成本生成符合聊天内容的插画、加了特定感情输出的对话、真实的背景音与烘托感情的配乐等方面都会在 2024 年内逐步成熟。
2025-02-10
多人物场景,人物一致性如何保证
在多人物场景中保证人物一致性可以参考以下方法: 1. 在使用 Midjourney 出图时,多角色情况下,放弃参考角色(cref 提示),只用参考风格(sref 提示)。这样的好处是不会出现奇怪的组合,坏处是出图较随机。 2. 多用局部重绘,虽然具有随机性,但多试几次能得到一致性较好的图。 3. 出图时先只出一个主要角色和场景。当出现多角色场景时,把其他角色抠图粘贴过来。比如老虎向兔子认错的场景,若兔子和老虎不一致,可先出稳定的老虎,再粘贴兔子以保证一致性。 4. 按照“三个确定”的 SOP 处理: 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 确定图片角色一致性:在保证构图风格没问题的基础上,保证人物一致性。先保证构图再确认角色一致性,因为 MJ 在重绘时,将角色在镜头中的位置挪动处理较难,固定位置重绘局部内容相对容易,若先保证人物内容,会很依赖 MJ 抽卡,随机性大。
2025-02-10
如何安装DEEPSEEK
以下是安装 DEEPSEEK 的步骤: 1. 访问 DEEPSEEK 官网(https://www.deepseek.com/)。 点击“开始对话”。 若没有赠送余额,可选择充值,支持美元和人民币结算以及各种个性化充值方式。 创建一个 API key,注意 API key 只会出现一次,请及时保存。 2. 设置代码编辑器: 下载 cursor(https://www.cursor.com/)或 vscode(https://code.visualstudio.com/),只要代码编辑器可以下载插件即可。 以 cursor 为例,下载安装后,在插件页面搜索并安装 Roocline。 安装完后,打开三角箭头,选中 RooCline 并点击齿轮进入设置,依次设置: API Provider:选择 DeepSeek。 API Key:填入已创建的 key。 模型:选择 DeepSeekreasoner。 语言偏好设置。 记得把 HighRisk 选项都打开,最后点击 Done 保存修改。 3. 在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。
2025-02-10
生成3D模型的AI
以下是一些关于生成 3D 模型的 AI 相关信息: 3dfy.ai: 概览:是一家专注于将稀疏数据转化为逼真三维世界的公司,领导团队由计算成像领域资深专家组成,具有近四十年综合专业知识。 使用场景:数字 3D 互动体验流行度提升,但受 3D 内容可用性限制,其技术能利用稀疏数据自动创建高质量 3D 模型,在当前技术发展特定时期尤为重要。 目标用户:数字内容创作者和艺术家、游戏开发者和动画制作人、教育和培训行业专业人士、医疗行业、建筑和工程领域。 应用案例:暂未提及。 图片生成 3D 建模工具: Tripo AI:在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型。 Meshy:功能全面,支持文本和图片生成 3D 以及 AI 材质生成。 CSM AI:支持从视频和图像创建 3D 模型,具有实时手绘草图设计 3D 形象功能。 Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域。 VoxCraft:免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供多种功能。 在 2024 年度 AI 十大趋势报告中: 在 3D 模型生成中,AI 主要完成了对 3D 模型生成流程的“一步到位”,可直接生成一个可调整的 3D 粗模,大大提升效率。 在游戏测试环节,AI 存在 3 大模拟场景,在优化环节承担改善角色动画、编程与加速、自动化游戏测试等功能。 在游戏设计中,AI 依托自然语言生成用法,用于角色与故事生成、游戏机制创新等方面,训练智能 NPC。 在音乐与音效方面,AI 生成音乐有基于乐理规则的符号生成模型和基于音频数据的音频生成模型两种主流技术路线,开发者使用其填充游戏音效和音乐。 这些工具通常具有用户友好的界面,无需专业 3D 建模技能即可操作,广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。
2025-02-10