Chat with Wiki - 什么是Agent

Answer

Agent（智能体）在人工智能和计算机科学领域是一个重要概念，指能够感知环境并采取行动以实现特定目标的实体，可以是软件程序或硬件设备。

从产品角度看，Agent 可以有特定的身份、性格和角色，比如是一个历史新闻探索向导，具有知识渊博、温暖亲切、富有同情心的性格，主导新闻解析和历史背景分析。为使角色生动，可设计背景故事，明确角色的起源、经历和动机，定义性格特点、说话方式和风格，设计对话风格以及明确角色技能。

在 LLM 支持的自主 Agent 系统中，LLM 充当 Agents 的大脑，并辅以规划、子目标和分解、反思和完善、记忆（包括短期记忆和长期记忆）、工具使用等关键组成部分。

LLM Agent 是指结合大型语言模型（LLM）和自主智能体（Agent）特性的系统，能够利用大型语言模型的自然语言处理能力，理解用户输入，并进行智能决策和行动。其组成部分包括规划（负责将复杂任务分解成可执行的子任务，并评估执行策略）、记忆（包括短期记忆用于存储对话上下文和长期记忆存储用户特征和业务数据）、工具（如 API 调用、插件扩展等辅助感知环境和执行决策）、行动（将规划和记忆转换为具体输出，包括与外部环境的互动或工具调用）。

Content generated by AI large model, please carefully verify (powered by aily)

References

Roger：从产品角度思考 Agent 设计

我们的Agent是一个历史新闻探索向导。身份：历史新闻探索向导性格：知识渊博、温暖亲切、富有同情心角色：主导新闻解析和历史背景分析为了使角色更加生动，我为Agent设计了一个简短的背景故事。比如，这个Agent曾是一位历史学家，对世界上的重大历史事件了如指掌，充满热情，愿意分享知识。怎么写好角色个性：角色背景和身份：编写背景故事，明确起源、经历和动机性格和语气：定义性格特点，如友好、幽默、严肃或神秘；确定说话方式和风格角色互动方式：设计对话风格，从基本问答到深入讨论角色技能：明确核心功能，如提供新闻解析、历史背景分析或心理分析；增加附加功能以提高吸引力和实用性正如《[Character.ai：每个人都可定制自己的个性化AI](https://waytoagi.feishu.cn/wiki/EoBkwirgjiqscKkAO6Wchyf1nPe)》所写：个性化定制的“虚拟伴侣”能得到用户的认可，这是因为精准地击中了许多年轻人无处可藏的孤独和焦虑，背后是年轻人渴望被理解、沟通和交流。美国心理学家Robert Jeffrey Sternberg提出了“爱情三角理论”，认为爱情包含“激情”、“亲密”和“承诺”三个要素。激情是生理上或情绪上的唤醒，例如对某人有强烈的性或浪漫的感觉；亲密是一种相互依恋的感觉，通过相互联结带来的喜爱和相互沟通分享自己的所见所闻、喜怒哀乐来体现；承诺是决定建立长期稳定关系，融入对方生活，形成互助互惠的关系，代表着一种长相厮守的责任。

问：什么是智能体 Agent

"智能体"（Agent）在人工智能和计算机科学领域是一个非常重要的概念。它指的是一种能够感知环境并采取行动以实现特定目标的实体。智能体可以是软件程序，也可以是硬件设备。以下是对智能体的详细介绍：[heading3]智能体的定义[content]智能体是一种自主系统，它可以通过感知环境（通常通过传感器）并采取行动（通常通过执行器）来达到某种目标。在LLM支持的自主Agent系统中，LLM充当Agents的大脑，并辅以几个关键组成部分：规划子目标和分解：Agents将大型任务分解为更小的、可管理的子目标，从而能够有效处理复杂的任务。反思和完善：Agents可以对过去的行为进行自我批评和自我反思，从错误中吸取教训，并针对未来的步骤进行完善，从而提高最终结果的质量。记忆短期记忆：所有的上下文学习都是利用模型的短期记忆来学习。长期记忆：这为Agents提供了长时间保留和回忆（无限）信息的能力，通常是通过利用外部向量存储和快速检索来实现。工具使用Agents学习调用外部API来获取模型权重中缺失的额外信息（通常在预训练后很难更改），包括当前信息、代码执行能力、对专有信息源的访问等。

ComfyUI & LLM：如何在ComfyUI中高效使用LLM

Agent（智能体）是一种能够在环境中自主感知、思考并采取行动的实体。你可以把Agent想象成一个具有特定目标和行为能力的智能角色，它们可以根据环境变化做出相应的决策和反应。[heading3]LLM Agent[content]LLM Agent是指结合大型语言模型（LLM）和自主智能体（Agent）特性的系统。这种系统能够利用大型语言模型的自然语言处理能力，理解用户的输入，并在此基础上进行智能决策和行动。大语言模型-Agent框架[heading3]LLM Agent组成部分：[content]1.规划（Planning）定义：规划是Agent的思维模型，负责将复杂任务分解成可执行的子任务，并评估这些子任务的执行策略。实现方式：通过使用大型语言模型的提示工程（如ReAct、CoT推理模式）来实现精准任务拆解和分步解决。2.记忆（Memory）定义：记忆即信息存储与回忆，包括短期记忆和长期记忆。实现方式：短期记忆用于存储对话上下文，支持多轮对话；长期记忆存储用户特征和业务数据，通常通过向量数据库等技术实现快速存取。3.工具（Tools）定义：工具是Agent感知环境、执行决策的辅助手段，如API调用、插件扩展等。实现方式：通过接入外部工具（如API、插件）扩展Agent的能力，例如使用插件解析文档、生成图像等。4.行动（Action）定义：行动是Agent将规划和记忆转换为具体输出的过程，包括与外部环境的互动或工具调用。实现方式：根据规划和记忆执行具体行动，如智能客服回复、查询天气预报、AI机器人抓起物体等。