直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
集成LLM的工具
以下是关于集成 LLM 的工具的相关内容: 一、“手臂和腿部”:赋予模型使用工具的能力 1. 从知识挖掘转向行动导向,增加模型使用工具的能力,有望在消费者和企业领域实现一系列用例。 对于消费者,LLMs 可能给出菜谱建议并订购食材,或推荐早午餐地点并预订餐桌。 在企业领域,创始人可接入 LLMs 使应用程序更易用,如在 Salesforce 等应用中,用户能用自然语言更新,模型自动更改,减少维护 CRM 所需时间。 2. LLM 虽对常见系统有复杂理解能力,但无法执行提取的信息。不过,公司在不断改善其使用工具的能力。 老牌公司如必应、谷歌和初创公司如 Perplexity、You.com 推出搜索 API。 AI21 Labs 推出 JurassicX,解决独立 LLMs 缺陷。 OpenAI 推出 ChatGPT 插件测试版,允许与多种工具交互,在 GPT3.5 和 GPT4 中引入函数调用,允许开发者将 GPT 能力与外部工具链接。 二、无需微调,仅用提示词工程就能让 LLM 获得 tool calling 的功能 1. 提示词工程主要由提示词注入和工具结果回传两部分代码组成。 2. 提示词注入用于将工具信息及使用工具的提示词添加到系统提示中,包含 TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT 三个部分。 TOOL_EAXMPLE 提示 LLM 如何理解和使用工具,编写时用无关紧要工具作示例避免混淆。 tools_instructions 是通用工具字典转换成 LLM 可读的工具列表,可动态调整。 REUTRN_FORMAT 定义调用 API 格式。 3. 工具结果回传阶段利用正则表达式抓取输出中的“tool”和“parameters”参数,对于 interpreter 工具使用另一种正则表达式提取 LLM 输出的代码,提高使用成功率。通过识别 LLM 返回的调用工具字典,提取对应值传入工具函数,将结果以 observation 角色返回给 LLM,对于不接受某些角色的 LLM 接口,可改为回传给 user 角色。通过以上提示词工程,可让无 tool calling 能力的 LLM 获得稳定的该能力。
2024-11-12
利用gpt-4模型的AI工具有哪些
以下是一些利用 GPT4 模型的 AI 工具: 1. Kickresume 的 AI 简历写作器:使用 GPT4 语言模型自动生成简历,能为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 2. Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的各个方面,包括写作、编辑、格式化和优化。 3. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 。您可以根据自己的需要选择最适合的工具。 此外,在生成式人工智能领域,GPT4 有以下突破点: 1. 赋予模型使用工具的能力,如 OpenAI 推出的 ChatGPT 插件测试版,允许与多种工具交互。 2. 在计划和解决问题方面具有一定能力,能通过玩游戏或模拟环境快速学习和从经验中学习。 3. 在许多任务上达到人类水平的表现,对人类的理解有所提升。 4. 但也存在一些限制,如架构中的自回归特性导致缺乏规划能力等。
2024-11-12
gpt-4和文心一言
GPT4 是由 OpenAI 开发的先进且广泛使用的大型语言模型,在多种任务上表现卓越,如文本生成、理解、翻译及专业和创意写作等,通过大量数据学习,能处理复杂问题和理解上下文。 文心一言是百度开发的语言模型,文心一言 4.0 有网页版和 API 版本。在 2023 年,百度的“文心 4.0”是国内能力较好的模型之一。 除了 GPT4 和文心一言,还有其他重要的大型语言模型,如 Anthropic 公司的 Claude 3、谷歌的 Gemini、阿里巴巴的通义大模型等。在 2023 年度中文大模型基准测评报告中,对众多模型进行了评测和列举。2023 年中美在 AGI 技术上仍有差距,国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 有差距。国内大厂在冲击 AGI 方面虽有资源,但实际效果尚不明确,且受多种因素影响。
2024-11-12
SD大模型无法加载
SD 大模型无法加载可能有以下原因及解决方法: 1. LORA 方面: LORA 可以提炼图片特征,文件通常有几十上百兆,承载信息量远大于 Embedding。下载的 LORA 放在根目录的【……\\models\\Lora】文件夹下,使用时点击红色小书,找到 LORA 选项卡加载。 使用 LORA 时要注意看作者使用的大模型,一般需配套使用,还可能需要加入特定触发词,如盲盒 LORA 需加入“full body, chibi”等提示词。 2. Hypernetworks 方面: Hypernetworks 主要针对画风训练,文件下载后放在根目录的【…\\models\\hypernetworks】,使用时点击红色小书,找到 Hypernetworks 选项卡加载。 3. 模型下载与安装方面: 常用的模型下载网站有:。 下载模型后需放置在指定目录,大模型(Ckpt)放入【models\\Stablediffusion】,VAE 模型放入【models\\Stablediffusion】或【models\\VAE】目录(有的大模型自带 VAE 则无需再加),Lora/LoHA/LoCon 模型放入【extensions\\sdwebuiadditionalnetworks\\models\\lora】或【models/Lora】目录,Embedding 模型放入【embeddings】目录。模型类型可通过检测。 不会科学上网时,可在启动器界面直接下载模型,将下载的大模型放在根目录的【……\\models\\Stablediffusion】,在左上角模型列表中选择(看不到就点旁边蓝色按钮刷新)。 旁边的 VAE 相当于给模型增加提高饱和度的滤镜和局部细节微调,可在启动器里下载,放在根目录的【……\\models\\VAE】。 Embedding 功能相当于提示词打包,下载 Embedding 可在 C 站通过右上角筛选 Textual Inversion 找到,放在根目录下的【embeddings】文件夹里。 由于无法确定您大模型无法加载的具体原因,您可以根据上述内容逐一排查。
2024-11-12
AI agent和智能体有什么区别
AI agent 和智能体在以下方面存在区别: 1. 概念侧重点:AI agent 更强调作为数字人的大脑,拥有记忆模块等,以实现更真实的交互;智能体则被视为智能的最小单元,是可以设定目标后主动完成任务的。 2. 能力构成:AI agent 主要通过接入大语言模型,并结合工具、记忆、行动、规划等能力来发挥作用;智能体不仅具备推理能力,还能执行全自动化业务,但目前许多相关产品仍需人类参与。 3. 实现方式:AI agent 目前行业里主要通过如 langchain 框架,在 prompt 层和工具层完成设计,将大模型与工具进行串接;智能体在实现上可能涉及更多复杂的技术和逻辑。
2024-11-12
什么是AGI
AGI 即通用人工智能(Artificial General Intelligence),是指具有人类水平的智能和理解能力的 AI 系统。它有能力完成任何人类可以完成的智力任务,适用于不同的领域,同时拥有某种形式的意识或自我意识。目前还只是一个理论概念,还没有任何 AI 系统能达到这种通用智能水平。 AGI 的发展有五个等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 更多信息请见(AGI)。OpenAI 原计划在 2026 年发布的 Q 的下一阶段(最初被称为 GPT6,后重新命名为 GPT7),由于埃隆·马斯克最近的诉讼而被暂停。计划在 2027 年发布的 Q 2025(GPT8)将实现完全的 AGI。
2024-11-12
最近有哪些 AI + 社交的应用
以下是一些近期的 AI + 社交的应用: 1. BOSS 直聘简历筛选功能:这是一个 AI 招聘简历筛选系统,运用自然语言处理和机器学习技术,市场规模达数亿美元。它能快速筛选简历,提高招聘效率,根据企业招聘要求提取关键信息,为企业推荐符合条件的候选人,比如筛选出有特定技能或工作经验的简历。 2. 贝壳找房租赁管理功能:这是一个 AI 房地产租赁管理系统,运用数据分析和自然语言处理技术,市场规模达数亿美元。它可以管理房地产租赁业务,提高效率,比如根据租客的需求和偏好自动推荐合适的房源。 3. 腾讯游戏社交平台:这是一个利用 AI 技术的游戏社交平台,运用数据分析和机器学习技术,市场规模达数十亿美元。它为玩家提供社交功能,如好友推荐、游戏组队、社区互动等,增强游戏体验,例如根据玩家的游戏历史和兴趣爱好推荐可能成为好友的玩家。 4. Butterflies AI:这是一款人类与 AI 共存的社交软件。 5. 对比流行的社交应用,即使是像 ChatGPT 这样的顶流,其首月用户留存度(56%)也不及社交应用的中位数(63%)。一些优秀的消费级社交应用,如 WhatsApp,DAU/MAU 比高达 85%,而生成式 AI 应用的中位数只有 14%,但 AI 陪伴类别除外。
2024-11-11
chatgpt 是什么
ChatGPT 是一种基于 GPT(生成式预训练变换器)架构的人工智能模型,由 OpenAI 开发。 其基本概念是从网络、书籍等来源获取大量人类创作的文本样本,然后训练神经网络生成“类似”的文本,能够从“提示”开始,继续生成“类似于训练内容”的文本。 ChatGPT 中的实际神经网络由简单元素组成,基本操作是为每个新单词(或单词部分)生成“输入”,然后将其“通过其元素”。 它在生成文本方面表现出色,结果通常接近人类所产生的。但它最终是从积累的“传统智慧统计数据”中提取“连贯的文本线索”。 ChatGPT 目前有 GPT3.5 和 GPT4 两个版本。GPT3.5 是免费版本,GPT4 则需要升级到 PLUS 套餐,收费标准为 20 美金一个月。 ChatGPT 实质功能是“单字接龙”,长文由单字接龙的回归所生成。GPT 作为大脑需要通过材料学习不断形成模型,训练目的是学习“提问和回答的通用规律”,实现举一反三。但它不是搜索引擎的升级版,可能会出现“幻觉”,混淆记忆,无法直接查看和更新所学,且高度依赖学习材料,存在缺乏及时性和准确性的缺点。
2024-11-11
chatgpt
ChatGPT 是通过从网络、书籍等来源获取大量人类创作的文本样本进行训练,以生成“类似”的文本。其基本概念相对简单,训练神经网络能够从“提示”开始,生成类似于训练内容的连贯人类语言文本。 ChatGPT 中的实际神经网络由大量简单元素组成,基本操作是为每个新单词(或单词部分)生成“输入”并通过其元素(无循环等)。然而,它能生成出色的文本,这表明人类语言(及背后的思维模式)的结构具有一定的“法律属性”,比想象中更简单,ChatGPT 已隐含地发现了这一点,或许我们可用语义语法、计算语言等明确揭示。 ChatGPT 在生成文本方面表现出色,接近人类所产生的,但它的工作方式与大脑并非完全相同。其基本人工神经网络结构基于大脑的理想化模型,人类生成语言时的许多方面与之相似。 在训练方面,大脑和当前计算机的“硬件”不同,ChatGPT 采用的策略可能与大脑有较大差异且效率较低,其内部没有“循环”或“重新计算数据”,限制了计算能力。目前尚不清楚如何解决此问题以让未来的 ChatGPT 能做更多类似大脑的事,但它已能做到的事情令人兴奋,为我们理解人类语言和思维过程提供了动力。 此外,还为您提供“10 分钟手搓一个 ChatGPT 语音对话机器人”的相关链接:https://b23.tv/JffIir4 。
2024-11-11
数字营销是什么
数字营销是指借助数字技术和渠道来推广产品、服务或品牌的营销方式。以下为您介绍一些相关的数字营销工具和案例: Adsby:这是一个针对初创企业和小型企业的谷歌搜索广告转换工具。它利用人工智能创建、分析和扩展广告,为广告新手提供简化工具,也为专业人士提供强大功能,如通过智能 AI 驱动策略最大化广告支出回报(ROAS),提供每日优化、AI 生成的关键词建议、秒级的广告内容创作等服务,还有 14 天免费试用,以简单直观的平台指导用户设置广告活动。 【甲子光年】Web 3.0 之数字人营销白皮书(2022)33 页:提供了关于数字营销的相关研究和分析。 【国信证券】领先布局数字人营销,AIGC 赋予成长机遇:从证券角度探讨了数字人营销的布局和发展机遇。
2024-11-11