与知识库对话 - WayToAGI

直达「通往AGI之路」飞书知识库 →

首页/全部问答

集成LLM的工具

以下是关于集成 LLM 的工具的相关内容：一、“手臂和腿部”：赋予模型使用工具的能力 1. 从知识挖掘转向行动导向，增加模型使用工具的能力，有望在消费者和企业领域实现一系列用例。对于消费者，LLMs 可能给出菜谱建议并订购食材，或推荐早午餐地点并预订餐桌。在企业领域，创始人可接入 LLMs 使应用程序更易用，如在 Salesforce 等应用中，用户能用自然语言更新，模型自动更改，减少维护 CRM 所需时间。 2. LLM 虽对常见系统有复杂理解能力，但无法执行提取的信息。不过，公司在不断改善其使用工具的能力。老牌公司如必应、谷歌和初创公司如 Perplexity、You.com 推出搜索 API。 AI21 Labs 推出 JurassicX，解决独立 LLMs 缺陷。 OpenAI 推出 ChatGPT 插件测试版，允许与多种工具交互，在 GPT3.5 和 GPT4 中引入函数调用，允许开发者将 GPT 能力与外部工具链接。二、无需微调，仅用提示词工程就能让 LLM 获得 tool calling 的功能 1. 提示词工程主要由提示词注入和工具结果回传两部分代码组成。 2. 提示词注入用于将工具信息及使用工具的提示词添加到系统提示中，包含 TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT 三个部分。 TOOL_EAXMPLE 提示 LLM 如何理解和使用工具，编写时用无关紧要工具作示例避免混淆。 tools_instructions 是通用工具字典转换成 LLM 可读的工具列表，可动态调整。 REUTRN_FORMAT 定义调用 API 格式。 3. 工具结果回传阶段利用正则表达式抓取输出中的“tool”和“parameters”参数，对于 interpreter 工具使用另一种正则表达式提取 LLM 输出的代码，提高使用成功率。通过识别 LLM 返回的调用工具字典，提取对应值传入工具函数，将结果以 observation 角色返回给 LLM，对于不接受某些角色的 LLM 接口，可改为回传给 user 角色。通过以上提示词工程，可让无 tool calling 能力的 LLM 获得稳定的该能力。

利用gpt-4模型的AI工具有哪些

以下是一些利用 GPT4 模型的 AI 工具： 1. Kickresume 的 AI 简历写作器：使用 GPT4 语言模型自动生成简历，能为简历摘要、工作经验和教育等专业部分编写内容，并保持一致语调。 2. Rezi：受到超过 200 万用户信任的领先 AI 简历构建平台，使用先进的 AI 技术自动化创建可雇佣简历的各个方面，包括写作、编辑、格式化和优化。 3. Huntr 的 AI 简历构建器：提供免费的简历模板，以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。更多 AI 简历产品，还可以查看这里：https://www.waytoagi.com/category/79 。您可以根据自己的需要选择最适合的工具。此外，在生成式人工智能领域，GPT4 有以下突破点： 1. 赋予模型使用工具的能力，如 OpenAI 推出的 ChatGPT 插件测试版，允许与多种工具交互。 2. 在计划和解决问题方面具有一定能力，能通过玩游戏或模拟环境快速学习和从经验中学习。 3. 在许多任务上达到人类水平的表现，对人类的理解有所提升。 4. 但也存在一些限制，如架构中的自回归特性导致缺乏规划能力等。

gpt-4和文心一言

GPT4 是由 OpenAI 开发的先进且广泛使用的大型语言模型，在多种任务上表现卓越，如文本生成、理解、翻译及专业和创意写作等，通过大量数据学习，能处理复杂问题和理解上下文。文心一言是百度开发的语言模型，文心一言 4.0 有网页版和 API 版本。在 2023 年，百度的“文心 4.0”是国内能力较好的模型之一。除了 GPT4 和文心一言，还有其他重要的大型语言模型，如 Anthropic 公司的 Claude 3、谷歌的 Gemini、阿里巴巴的通义大模型等。在 2023 年度中文大模型基准测评报告中，对众多模型进行了评测和列举。2023 年中美在 AGI 技术上仍有差距，国内最领先的模型水平大概在准 ChatGPT3.5 的水平，和 GPT4 有差距。国内大厂在冲击 AGI 方面虽有资源，但实际效果尚不明确，且受多种因素影响。

SD大模型无法加载

SD 大模型无法加载可能有以下原因及解决方法： 1. LORA 方面： LORA 可以提炼图片特征，文件通常有几十上百兆，承载信息量远大于 Embedding。下载的 LORA 放在根目录的【……\\models\\Lora】文件夹下，使用时点击红色小书，找到 LORA 选项卡加载。使用 LORA 时要注意看作者使用的大模型，一般需配套使用，还可能需要加入特定触发词，如盲盒 LORA 需加入“full body, chibi”等提示词。 2. Hypernetworks 方面： Hypernetworks 主要针对画风训练，文件下载后放在根目录的【…\\models\\hypernetworks】，使用时点击红色小书，找到 Hypernetworks 选项卡加载。 3. 模型下载与安装方面：常用的模型下载网站有：。下载模型后需放置在指定目录，大模型（Ckpt）放入【models\\Stablediffusion】，VAE 模型放入【models\\Stablediffusion】或【models\\VAE】目录（有的大模型自带 VAE 则无需再加），Lora/LoHA/LoCon 模型放入【extensions\\sdwebuiadditionalnetworks\\models\\lora】或【models/Lora】目录，Embedding 模型放入【embeddings】目录。模型类型可通过检测。不会科学上网时，可在启动器界面直接下载模型，将下载的大模型放在根目录的【……\\models\\Stablediffusion】，在左上角模型列表中选择（看不到就点旁边蓝色按钮刷新）。旁边的 VAE 相当于给模型增加提高饱和度的滤镜和局部细节微调，可在启动器里下载，放在根目录的【……\\models\\VAE】。 Embedding 功能相当于提示词打包，下载 Embedding 可在 C 站通过右上角筛选 Textual Inversion 找到，放在根目录下的【embeddings】文件夹里。由于无法确定您大模型无法加载的具体原因，您可以根据上述内容逐一排查。

AI agent和智能体有什么区别

AI agent 和智能体在以下方面存在区别： 1. 概念侧重点：AI agent 更强调作为数字人的大脑，拥有记忆模块等，以实现更真实的交互；智能体则被视为智能的最小单元，是可以设定目标后主动完成任务的。 2. 能力构成：AI agent 主要通过接入大语言模型，并结合工具、记忆、行动、规划等能力来发挥作用；智能体不仅具备推理能力，还能执行全自动化业务，但目前许多相关产品仍需人类参与。 3. 实现方式：AI agent 目前行业里主要通过如 langchain 框架，在 prompt 层和工具层完成设计，将大模型与工具进行串接；智能体在实现上可能涉及更多复杂的技术和逻辑。

AGI 即通用人工智能（Artificial General Intelligence），是指具有人类水平的智能和理解能力的 AI 系统。它有能力完成任何人类可以完成的智力任务，适用于不同的领域，同时拥有某种形式的意识或自我意识。目前还只是一个理论概念，还没有任何 AI 系统能达到这种通用智能水平。 AGI 的发展有五个等级： 1. 聊天机器人（Chatbots）：具备基本对话能力，主要依赖预设脚本和关键词匹配，用于客户服务和简单查询响应。 2. 推理者（Reasoners）：具备人类推理水平，能够解决复杂问题，如 ChatGPT，能根据上下文和文件提供详细分析和意见。 3. 智能体（Agents）：不仅具备推理能力，还能执行全自动化业务，但目前许多产品在执行任务后仍需人类参与，尚未达到完全智能体的水平。 4. 创新者（Innovators）：能够协助人类完成新发明，如谷歌 DeepMind 的 AlphaFold 模型，可预测蛋白质结构，加速科学研究和新药发现。 5. 组织（Organizations）：最高级别的 AI，能够自动执行组织的全部业务流程，如规划、执行、反馈、迭代、资源分配和管理等。更多信息请见（AGI）。OpenAI 原计划在 2026 年发布的 Q 的下一阶段（最初被称为 GPT6，后重新命名为 GPT7），由于埃隆·马斯克最近的诉讼而被暂停。计划在 2027 年发布的 Q 2025（GPT8）将实现完全的 AGI。

最近有哪些 AI + 社交的应用

以下是一些近期的 AI + 社交的应用： 1. BOSS 直聘简历筛选功能：这是一个 AI 招聘简历筛选系统，运用自然语言处理和机器学习技术，市场规模达数亿美元。它能快速筛选简历，提高招聘效率，根据企业招聘要求提取关键信息，为企业推荐符合条件的候选人，比如筛选出有特定技能或工作经验的简历。 2. 贝壳找房租赁管理功能：这是一个 AI 房地产租赁管理系统，运用数据分析和自然语言处理技术，市场规模达数亿美元。它可以管理房地产租赁业务，提高效率，比如根据租客的需求和偏好自动推荐合适的房源。 3. 腾讯游戏社交平台：这是一个利用 AI 技术的游戏社交平台，运用数据分析和机器学习技术，市场规模达数十亿美元。它为玩家提供社交功能，如好友推荐、游戏组队、社区互动等，增强游戏体验，例如根据玩家的游戏历史和兴趣爱好推荐可能成为好友的玩家。 4. Butterflies AI：这是一款人类与 AI 共存的社交软件。 5. 对比流行的社交应用，即使是像 ChatGPT 这样的顶流，其首月用户留存度（56%）也不及社交应用的中位数（63%）。一些优秀的消费级社交应用，如 WhatsApp，DAU/MAU 比高达 85%，而生成式 AI 应用的中位数只有 14%，但 AI 陪伴类别除外。

chatgpt 是什么

ChatGPT 是一种基于 GPT（生成式预训练变换器）架构的人工智能模型，由 OpenAI 开发。其基本概念是从网络、书籍等来源获取大量人类创作的文本样本，然后训练神经网络生成“类似”的文本，能够从“提示”开始，继续生成“类似于训练内容”的文本。 ChatGPT 中的实际神经网络由简单元素组成，基本操作是为每个新单词（或单词部分）生成“输入”，然后将其“通过其元素”。它在生成文本方面表现出色，结果通常接近人类所产生的。但它最终是从积累的“传统智慧统计数据”中提取“连贯的文本线索”。 ChatGPT 目前有 GPT3.5 和 GPT4 两个版本。GPT3.5 是免费版本，GPT4 则需要升级到 PLUS 套餐，收费标准为 20 美金一个月。 ChatGPT 实质功能是“单字接龙”，长文由单字接龙的回归所生成。GPT 作为大脑需要通过材料学习不断形成模型，训练目的是学习“提问和回答的通用规律”，实现举一反三。但它不是搜索引擎的升级版，可能会出现“幻觉”，混淆记忆，无法直接查看和更新所学，且高度依赖学习材料，存在缺乏及时性和准确性的缺点。

ChatGPT 是通过从网络、书籍等来源获取大量人类创作的文本样本进行训练，以生成“类似”的文本。其基本概念相对简单，训练神经网络能够从“提示”开始，生成类似于训练内容的连贯人类语言文本。 ChatGPT 中的实际神经网络由大量简单元素组成，基本操作是为每个新单词（或单词部分）生成“输入”并通过其元素（无循环等）。然而，它能生成出色的文本，这表明人类语言（及背后的思维模式）的结构具有一定的“法律属性”，比想象中更简单，ChatGPT 已隐含地发现了这一点，或许我们可用语义语法、计算语言等明确揭示。 ChatGPT 在生成文本方面表现出色，接近人类所产生的，但它的工作方式与大脑并非完全相同。其基本人工神经网络结构基于大脑的理想化模型，人类生成语言时的许多方面与之相似。在训练方面，大脑和当前计算机的“硬件”不同，ChatGPT 采用的策略可能与大脑有较大差异且效率较低，其内部没有“循环”或“重新计算数据”，限制了计算能力。目前尚不清楚如何解决此问题以让未来的 ChatGPT 能做更多类似大脑的事，但它已能做到的事情令人兴奋，为我们理解人类语言和思维过程提供了动力。此外，还为您提供“10 分钟手搓一个 ChatGPT 语音对话机器人”的相关链接：https://b23.tv/JffIir4 。

数字营销是什么

数字营销是指借助数字技术和渠道来推广产品、服务或品牌的营销方式。以下为您介绍一些相关的数字营销工具和案例： Adsby：这是一个针对初创企业和小型企业的谷歌搜索广告转换工具。它利用人工智能创建、分析和扩展广告，为广告新手提供简化工具，也为专业人士提供强大功能，如通过智能 AI 驱动策略最大化广告支出回报（ROAS），提供每日优化、AI 生成的关键词建议、秒级的广告内容创作等服务，还有 14 天免费试用，以简单直观的平台指导用户设置广告活动。【甲子光年】Web 3.0 之数字人营销白皮书（2022）33 页：提供了关于数字营销的相关研究和分析。【国信证券】领先布局数字人营销，AIGC 赋予成长机遇：从证券角度探讨了数字人营销的布局和发展机遇。