Navigate to WaytoAGI Wiki →
Home/All Questions
本地怎么构建知识库
以下是关于本地构建知识库的详细步骤和相关知识: 一、硬件配置要求 运行大模型需要较高的机器配置,个人玩家可能负担不起。 生成文字大模型: 最低配置:8G RAM + 4G VRAM 建议配置:16G RAM + 8G VRAM 理想配置:32G RAM + 24G VRAM(如果要跑 GPT3.5 差不多性能的大模型) 生成图片大模型(比如跑 SD): 最低配置:16G RAM + 4G VRAM 建议配置:32G RAM + 12G VRAM 生成音频大模型: 最低配置:8G VRAM 建议配置:24G VRAM 二、RAG 技术 利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用。在进行本地知识库的搭建实操之前,需要先对 RAG 有大概的了解。 RAG 是指检索增强生成(Retrieval Augmented Generation),当需要依靠不包含在大模型训练集中的数据时,通过以下 5 个过程实现: 1. 文档加载(Document Loading):从多种不同来源加载文档。LangChain 提供了 100 多种不同的文档加载器,包括 PDF 在内的非结构化的数据、SQL 在内的结构化的数据,以及 Python、Java 之类的代码等。 2. 文本分割(Splitting):文本分割器把 Documents 切分为指定大小的块。 3. 存储:涉及将切分好的文档块进行嵌入(Embedding)转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. Output(输出):把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 三、本地知识库搭建步骤 如果想要对知识库进行更加灵活的掌控,需要一个额外的软件:AnythingLLM。 1. 安装 AnythingLLM 安装地址:https://useanything.com/download 安装完成后,会进入到其配置页面,主要分为三步: 第一步:选择大模型 第二步:选择文本嵌入模型 第三步:选择向量数据库 2. 构建本地知识库 AnythingLLM 中有一个 Workspace 的概念,可以创建自己独有的 Workspace 跟其他的项目数据进行隔离。 首先创建一个工作空间。 上传文档并且在工作空间中进行文本嵌入。 选择对话模式。AnythingLLM 提供了两种对话模式: Chat 模式:大模型会根据自己的训练数据和上传的文档数据综合给出答案。 Query 模式:大模型仅仅会依靠文档中的数据给出答案。 测试对话:当上述配置完成之后,就可以跟大模型进行对话了。 四、写在最后 “看十遍不如实操一遍,实操十遍不如分享一遍”。如果对 AI Agent 技术感兴趣,可以联系作者或者加作者的免费知识星球(备注 AGI 知识库)。
2025-01-22
我想学习智能体搭建
以下是关于智能体搭建的相关知识: 智谱 BigModel 共学营第二期:把你的微信变成超级 AI 助理 1. 注册智谱 Tokens 智谱 AI 开放平台:https://bigmodel.cn/ 新注册用户,注册即送 2000 万 Tokens 充值/购买多种模型的低价福利资源包 直接充值现金,所有模型可适用:https://open.bigmodel.cn/finance/pay 语言资源包:免费 GLM4Flash 语言模型/ 多模态资源包: 多模态资源包: 所有资源包购买地址:https://bigmodel.cn/finance/resourcepack 共学营报名赠送资源包 2. 先去【财务台】左侧的【资源包管理】看看自己的资源包,本次项目会使用到的有 GLM4、GLM4VPlus、CogVideoX、CogView3Plus 模型。 3. 进入智能体中心我的智能体,开始创建智能体。此流程会手把手进行编辑,完成一个简单智能体的搭建,此智能体完成以下功能: 小众打卡地——优秀创作者奖 1. 智能体基本信息 名称:小众打卡地 链接:https://tbox.alipay.com/pro/share/202412APCyNn00194489?platform=WebService 2. 基本功能介绍:小众打卡地推荐,输入一个旅游目的地地点城市,给您推荐 3 个小众打卡地小红书类文案,适合分享或旅游参考,还有精美的旅行地配图。 3. 智能体核心价值 为用户发掘非大众化的特色景点,避开人流 提供个性化的旅行建议,并且有目的地的图片参考 帮助用户快速获取高质量的旅行参考信息 提供小红书文案,也适合发小红书 4. 智能体效果 输入一个目的地后,等待一小段时间,即可获得带图文案。从手机支付宝小程序更加方便,可以一键复制后获取。 5. 智能体搭建思路重点 录入了小红书的相关文案参考知识库 通过文本模型组成搜索词进行搜索,从搜索到的所有网页链接中,通过代码节点提取相关的 url 用代码节点滤除需要安全认证的网站,包括挑选一些非周边城市攻略推荐,并且尽量检查“小众”或“冷门” 通过 url 网页正文后,提取相关的小众地点输出,同时通过代码进行打卡点的字符串输出用于后续节点运用 根据需要搜索的小众旅行地进行图片搜索。此处代码节点随机提取一条图片的 url,注意此处在调试过程中发现有些图片搜索后的 url 打卡图片会失效,代码节点将部分失效的网站进行了过滤 最后的文案输出,非常适合小红书文案和旅行发布参考 智能体在品牌卖点提炼中的应用 1. 确定智能体的结构 按照市场营销的逻辑组织智能体的结构。 2. 搭建完整智能体 以品牌卖点提炼六步法为核心的流程,将其他的分析助手加入工作流中,包括: 品牌卖点定义与分类助手 品牌卖点提炼六步法 STP 市场分析助手 用户画像分析助手 触点收集助手 同时还包括一些结构中没有体现,但是在后续的品牌卖点应用过程中有效的分析工具: 用户需求分析的 KANO 助手 营销六层转化漏斗分析 超级转化率六要素
2025-01-22
1.Gpt在教育邻域的快速发展
GPT 在教育领域的快速发展表现为以下方面: 训练方式:包括预训练、有监督微调、奖励建模、强化学习等阶段,每个阶段都有相应的数据集、算法和模型。 在教育中的影响:以 ChatGPT 为代表的生成式人工智能技术的出现,为教育带来冲击。许多教育工作者认识到大模型技术的进步对教育的意义。但目前市场上虽看好 AI 对各行业的赋能,却尚未诞生出相关的 Super APP,存在对 AI 发展的不同看法和预期。
2025-01-22
SD模型
Stable Diffusion(SD)模型是由 Stability AI 和 LAION 等公司共同开发的生成式模型,参数量约 1B,可用于文生图、图生图、图像 inpainting、ControlNet 控制生成、图像超分等任务。 文生图任务是将文本输入到 SD 模型,经过一定迭代次数生成符合描述的图片。例如输入“天堂,巨大的,海滩”,模型生成美丽沙滩图片。 图生图任务在输入文本基础上再输入一张图片,模型根据文本提示重绘输入图片使其更符合描述,如在沙滩图片上添加“海盗船”。 输入的文本信息需通过“桥梁”CLIP Text Encoder 模型转换为机器数学信息。该模型作为 SD 模型中的前置模块,将输入文本编码生成 Text Embeddings 特征矩阵,用于控制图像生成。 目前 SD 模型使用的是中的 Text Encoder 模型,其只包含 Transformer 结构,由 12 个 CLIPEncoderLayer 模块组成,模型参数大小为 123M,输出 Text Embeddings 的维度为 77x768。 以下是相关资源获取方式: SD 模型权重:关注 Rocky 的公众号 WeThinkIn,后台回复“SD 模型”,可获得包含多种模型权重的资源链接。 SD 保姆级训练资源:关注 Rocky 的公众号 WeThinkIn,后台回复“SDTrain”,可获得包含数据处理、模型微调训练及基于 SD 的 LoRA 模型训练代码等全套资源。 Stable Diffusion 中 VAE、UNet 和 CLIP 三大模型的可视化网络结构图:关注 Rocky 的公众号 WeThinkIn,后台回复“SD 网络结构”,即可获得网络结构图资源链接。
2025-01-22
分析英文期刊论文的ai有哪些?哪个好用?
以下是一些可用于分析英文期刊论文的 AI 工具: 1. 文献管理和搜索: Zotero:结合 AI 技术,能自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,可提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,方便进行数据分析和可视化。 Knitro:用于数学建模和优化的软件,有助于复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化论文编写。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 此外,以下是一些常见的文章润色 AI 工具: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,优化文章语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可生成符合要求的学术论文。 在 AI 文章排版工具方面: 1. Grammarly:不仅是语法和拼写检查工具,还提供排版功能,改进文档风格和流畅性。 2. QuillBot:AI 驱动的写作和排版工具,改进文本清晰度和流畅性。 3. Latex:广泛用于学术论文排版的软件,使用标记语言描述格式,有许多 AI 辅助的编辑器和插件简化排版过程。 4. PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 5. Wordtune:重新表述和改进文本,使其更清晰专业。 6. Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的工具取决于您的具体需求,如文档类型、出版标准和个人偏好。对于学术论文,Latex 和 Overleaf 通常是受欢迎的选择;对于一般文章和商业文档,Grammarly 和 PandaDoc 等可能更适用。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-22
你这里有AI报告的合集吗
以下是为您提供的部分 AI 报告合集: 2024 年 5 月 9 日: 《》 《》 《》 《》 《》 2023 年 11 月 15 日: 《》 《》 《》 2024 年 12 月 23 日: 《 Fastdata 极数:《》 《》 清华大学五道口金融学院:《》 国盛证券:《》 托尼·布莱尔全球变化研究所:《》 腾讯云:《》 您可以在以下链接查看更多详细内容:
2025-01-22
DeepSeek R1和ChatGPT相比有什么优势?
DeepSeek R1 与 ChatGPT 的优势比较如下: 在数字乘法任务中,ChatGPT 和精简版的隐式 CoT 模型无法达到 100%的准确率,而从头开始训练的 DeepSeek R1 在将扩散采样步骤设置为 1 的情况下,能够保持显著的吞吐量同时达到 100%的准确率。 在数学问题求解常用基准测试中,GPT4 相对于 ChatGPT 表现出显著的改进,GPT4 在许多复杂问题中展示了更深入的理解,并能够应用适当的推理。而 ChatGPT 通常会采用低级启发式方法,提到与问题仅是表面相关的公式和概念,表明缺乏实际理解。
2025-01-22
智能制造
智能制造领域中,人工智能的应用主要包括以下方面: 1. 工业知识表达、工业知识图谱构建、工业场景大模型等标准研制,规范人工智能在工业领域的融合应用,围绕智能工厂、智慧供应链建设中的智能化技术要求。 2. 产品设计和开发:利用 AI 生成工具如 Adobe Firefly、Midjourney 等,根据文字描述快速生成产品的 3D 模型、渲染图、插图等设计元素,提高产品设计效率。 3. 工艺规划和优化:结合大语言模型的自然语言处理能力,自动生成制造工艺流程、设备选型、质量控制等方案,优化生产过程。 4. 设备维护和故障诊断:利用 AI 模型分析设备运行数据,预测设备故障,并自动生成维修建议,提高设备可靠性。 5. 供应链管理:AI 根据历史数据和市场变化,自动生成采购计划、库存预测、物流优化等内容,提高供应链管理效率。 6. 客户服务:基于对话模型的 AI 客服机器人,自动生成个性化的客户回复,提升客户体验。 总的来说,人工智能在智能制造领域的应用广泛,从产品设计到生产管理再到客户服务,都能发挥重要作用,提高企业的效率和竞争力。
2025-01-22
有什么ai 可以用来核实信息
以下是一些可以用来核实信息的 AI 相关内容: 马斯克认为真正的 AI 应能理解物理世界,比如能帮助人们在世界各地找到不同的事物。如果 AI 做不到像在机场找到咖啡这样的简单任务,那就不是一个好的 AI。 Twitter 上的很多数据可用于构建验证器。 存在能联网检索的 AI,例如 ChatGPT Plus 用户可开启 web browsing 功能实现联网,Perplexity 结合了问答和搜索引擎功能,Bing Copilot 可简化在线查询和浏览,还有 You.com 和 Neeva AI 等提供基于人工智能的定制搜索体验并保护用户数据私密性的搜索引擎。 但使用 AI 时需注意,它可能会“产生幻觉”生成错误内容,需要检查所有结果。AI 不会真正解释自己,给出的解释可能是编造的,且可能被不道德地用于操纵或作弊,用户要对其输出负责。
2025-01-22
对口型项目
以下是关于对口型项目的相关信息: 即梦 AI 对口型功能: 功能介绍:是即梦 AI「视频生成」中的二次编辑功能,现支持中文、英文配音。主要针对写实/偏真实风格化人物的口型及配音生成,为用户的创作提供更多视听信息传达的能力。可上传包含完整人物面容的图片,进行视频生成,待视频生成完成后,点击预览视频下的「对口型」按钮,输入台词并选择音色,或上传配音文件进行对口型效果生成。目前支持语言:中文(全部音色),英文(推荐「超拟真」内的音色)。 技巧:上传写实/近写实的人物单人图片,目前不支持多人物图片对口型;输入 prompt,选择参数,点击生成视频,尽量确保人物无形变等扭曲效果;确保人物生成的情绪与希望匹配的口型内容匹配;在生成的视频下方,点击【对口型】;输入或上传需要配音的内容,注意视频生成时长和配音试听时长尽量对齐,点击生成;先对口型,再超分补帧。 《摩尔弗斯》对口型视频制作流程: 1.出静态图 2.声音克隆 3.音频输出 4.口型视频:音频+静态图输出 5.动态视频:静态图输出 6.成片:口型视频+动态视频拼接在一起 其他声音克隆产品: PlayHT:https://play.ht/studio/ 包含预设音色,可免费克隆一个音色,如果想生成多个,把上一个音色删除就可以做新的。 Elevenlabs:https://elevenlabs.io/app 包含预设音色,新用户 1 美元开通一个月会员,可使用克隆音色。 魔搭社区:https://www.modelscope.cn/home 一个模型开源社区及创新平台,由阿里巴巴通义实验室(Institute for Intelligent Computing),联合 CCF 开源发展委员会,共同作为项目发起方。包含各种声音模型,有开发经验的朋友可使用。 Dubbingx:https://dubbingx.com/ 免费克隆音色,有桌面版,Mac、Window 均可用。 魔音工坊:https://www.moyin.com/ 对口型相关工具: Runway:静态图片+音频文件,可生成对口型视频;动态视频+音频文件,可生成对口型视频,但需要消耗 20 点。 Pika:静态图片+音频文件,可生成对口型视频。
2025-01-22