与知识库对话 - 一句话阐述ai agent的原理。

回答

AI Agent 的原理主要包括以下几个方面：

其核心通常是大型语言模型（LLM）或大模型。
为 LLM 增加了工具、记忆、行动、规划这四个能力。
- 工具：如长期记忆，相当于给大模型一个数据库工具来记录重要信息。
- 记忆：提供长期记忆能力。
- 行动：将目标进行每一步的拆解，并输出不同的固定格式 action 指令给工具。
- 规划：在大模型的 prompt 层做逻辑处理，如目标拆解。
目前行业里主要用到的是 langchain 框架，它通过代码或 prompt 的形式将 LLM 与 LLM 之间以及 LLM 与工具之间进行串接。
心灵社会理论认为，智能是由许多简单的 Agent（分等级、分功能的计算单元）共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能，通过协作实现复杂的智能行为。
- 多重层次：从低层次的感知和反应到高层次的规划和决策，每个层次由多个 Agent 负责。
- 功能模块：每个 Agent 类似于功能模块，专门处理特定类型的信息或执行特定任务。
- 分布式智能：智能通过多个相互关联的 Agent 共同实现，提高系统的灵活性和鲁棒性。
AI Agent 包括 Chain（步骤，可接受输入变量并产生输出变量）、Router（通过判定让 Agent 走向不同的 Chain）、Tool（工具调用）等概念。同时，还需要 Responser Agent（主 agent，用于回复用户）、Background Agent（背景 agent，用于推进角色当前状态）、Daily Agent（每日 agent，用于生成剧本等）等不同类型的 Agent 协同工作。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

agent算是从年前到现在，比较火的一个概念了，也被很多人认为是大模型的未来的一个主要发展方向。首先我们看这个很经典的一张图看起来还是蛮复杂的，然后市面上的很多描述agent的文章写的也比较复杂，说智能体是啥智能的最小单元，相较于copilot，是可以给他设定一个目标后主动完成任务的等等。当然这些说法都没错，但是我觉得还是有些不好理解的。所以我们依然先从原理着手去理解下，agent是个什么东西。首先这张图里，中间的“智能体”，其实就是llm，或者说大模型。四个箭头，分别是我们为llm增加的四个能力。工具、记忆、行动、规划。那么这个是怎么新增的呢？目前行业里主要用到的是一个叫langchain的框架，这个框架可以简单理解为，他把llm和llm之间，以及llm和工具之间，通过代码或prompt的形式，进行了串接。这个其实也像是在rag的基础上再进了一步。因为我们知道rag其实是给了大模型一个浏览器工具来使用嘛，那agent，其实就是给了大模型更多的工具。比如像是长期记忆，其实就是给了大模型一个数据库工具让其往里记录重要信息。规划和行动，其实就是在大模型的prompt层做的些逻辑，比如让其将目标进行每一步的拆解，拆解完成后，每一步去输出不同的固定格式action指令，给到工具作为输入。当然langchain或者说agent还不止这些，也会有很多其他的代码逻辑体现在其中，不过其主要的主干逻辑，其实还是在prompt层和工具层，完成的设计。

AI-Agent系列(一)：智能体起源探究

核心思想：心灵社会理论认为，智能是由许多简单的Agent（分等级、分功能的计算单元）共同工作和相互作用的结果。这些Agent在不同层次上执行不同的功能，通过协作实现复杂的智能行为。多重层次：心灵社会将智能划分为多个层次，从低层次的感知和反应到高层次的规划和决策，每个层次由多个Agent负责。功能模块：每个Agent类似于功能模块，专门处理特定类型的信息或执行特定任务，如视觉处理、语言理解、运动控制等。分布式智能：智能不是集中在单一的核心处理单元，而是通过多个相互关联的Agent共同实现。这种分布式智能能够提高系统的灵活性和鲁棒性，应对复杂和多变的环境。同时，在《心灵社会》中，明斯基还详细描述了不同类型的Agent及其功能：专家Agent：拥有特定领域知识和技能的Agent，负责处理复杂的任务和解决特定问题。管理Agent：协调和控制其他Agent的活动，确保整体系统协调一致地运行。学习Agent：通过经验和交互，不断调整和优化自身行为，提高系统在不断变化环境中的适应能力。从达特茅斯会议开始讨论人工智能（Artificial Intelligence），到马文·明斯基引入“Agent”概念，到这里，“AI”和“Agent”就彻底聚齐了。往后，我们都将其称之为AI Agent。

皮皮：你的微信虚拟女友 - 李洛云

AI Agent：基于大型语言模型（LLM）和其他技术实现的智能实体，其核心功能在于自主理解、规划决策、执行复杂任务。AI Agent包括下面几个概念：Chain：通常一个AI Agent可能由多个Chain组成。一个Chain视作是一个步骤，可以接受一些输入变量，产生一些输出变量。大部分的Chain是大语言模型完成的LLM Chain。Router：我们可以使用一些判定（甚至可以用LLM来判定），然后让Agent走向不同的Chain。例如：如果这是一个图片，则a；否则b。Tool：Agent上可以进行的一次工具调用。例如，对互联网的一次搜索，对数据库的一次检索。总结下来我们需要三个Agent：Responser Agent：主agent，用于回复用户（伪多模态）Background Agent：背景agent，用于推进角色当前状态（例如进入下一个剧本，抽检生成增长的记忆体）Daily Agent：每日agent，用于生成剧本，配套的图片，以及每日朋友圈Responser AgentDaily AgentBackground Agent每隔一段时间运行一次（默认3分钟）分析期间的历史对话变更人物关系（亲密度，了解度等）变更反感度，如果超标则拉黑用户抽简对话内容，提取人物和用户的信息成为“增长的记忆体”按照时间推进人物剧本有概率主动聊天（与亲密度正相关，跳过夜间时间）[heading1]复杂的东西：中期记忆中的增长记忆体