Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何做自己的agent

Answer

要做自己的 Agent,可以按照以下步骤进行:

  1. 从基础案例入门
    • 三分钟捏 Bot
      • Step 1:(10 秒)登录控制台
        • 登录扣子控制台(coze.cn)。
        • 使用手机号或抖音注册/登录。
      • Step 2:(20 秒)在我的空间创建 Agent
        • 在扣子主页左上角点击“创建 Bot”。
        • 选择空间名称为“个人空间”、Bot 名称为“第一个 Bot”,并点击“确认”完成配置。如需使用其他空间,请先创建后再选择;Bot 名称可以自定义。
      • Step 3:(30 秒)编写 Prompt
        • 填写 Prompt,即自己想要创建的 Bot 功能说明。第一次可以使用一个简短的词语作为 Prompt 提示词。
      • Step 4:(30 秒)优化 Prompt
        • 点击“优化”,使用来帮忙优化。
      • Step 5:(30 秒)设置开场白
      • Step 6:(30 秒)其他环节
      • Step 7:(30 秒)发布到多平台&使用
  2. 进阶之路
    • 15 分钟做什么
      • 查看下其他 Bot,获取灵感
    • 1 小时做什么
      • 找到和自己兴趣、工作方向等可以结合的 Bot,深入沟通
    • 一周做什么
      • 了解基础组件
      • 寻找不错的扣子,借鉴&复制
      • 加入 Agent 共学小组
      • 尝试在群里问第一个问题
    • 一个月做什么
      • 合理安排时间
      • 参与 WaytoAGI Agent 共学计划
      • 自己创建 Agent,并分享自己捏 Bot 的经历和心得
  3. 在 WaytoAGI 有哪些支持
    • 文档资源
    • 交流群
    • 活动

此外,还可以借助开源社区的力量构建高质量的 AI 数字人。推荐使用像 dify、fastgpt 等成熟的高质量 AI 编排框架,它们有大量的开源工作者维护,集成各种主流的模型供应商、工具以及算法实现等。可以通过这些框架快速编排出自己的 AI Agent,赋予数字人灵魂。在开源项目中,使用 dify 的框架,利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,并且实现相对复杂的功能,比如知识库的搭建、工具的使用等都无需任何的编码和重新部署工作。同时 Dify 的 API 暴露了 audio-to-text 和 text-to-audio 两个接口,基于这两个接口就可以将数字人的语音识别和语音生成都交由 Dify 控制,从而低门槛做出自己高度定制化的数字人。如果有更加高度定制的模型,也可以在 Dify 中接入 XInference 等模型管理平台,然后部署自己的模型。此外,数字人 GUI 工程中仍然保留了 LLM、ASR、TTS、Agent 等多个模块,能够保持更好的扩展。

从产品经理角度思考 Agent 时,比如我们的 Agent 可以是一个历史新闻探索向导,其身份是历史新闻探索向导,性格是知识渊博、温暖亲切、富有同情心,角色是主导新闻解析和历史背景分析。为了使角色更加生动,可以为 Agent 设计一个简短的背景故事。写好角色个性需要注意角色背景和身份、性格和语气、角色互动方式、角色技能等方面。正如《Character.ai:每个人都可定制自己的个性化 AI》所写,个性化定制的“虚拟伴侣”能得到用户的认可,这是因为精准地击中了许多年轻人无处可藏的孤独和焦虑。美国心理学家 Robert Jeffrey Sternberg 提出了“爱情三角理论”,认为爱情包含“激情”“亲密”和“承诺”三个要素。激情是生理上或情绪上的唤醒,亲密是一种相互依恋的感觉,承诺是决定建立长期稳定关系。

Content generated by AI large model, please carefully verify (powered by aily)

References

1. 从基础案例入门

1.登录扣子控制台(coze.cn)。1.使用手机号或抖音注册/登录。[heading3]Step 2:(20秒)在我的空间创建Agent[content]1.在扣子主页左上角点击“创建Bot”。2.选择空间名称为“个人空间”、Bot名称为“第一个Bot”,并点击“确认”完成配置。如需使用其他空间,请先创建后再选择;Bot名称可以自定义。[heading3]Step 3:(30秒)编写Prompt[content]1.填写Prompt,即自己想要创建的Bot功能说明。第一次可以使用一个简短的词语作为Prompt提示词。[heading3]Step 4:(30秒)优化Prompt[content]1.点击“优化”,使用来帮忙优化。[heading3]Step 5:(30秒)设置开场白[heading3]Step 6:(30秒)其他环节[heading3]Step 7:(30秒)发布到多平台&使用[heading2]进阶之路[heading3]15分钟做什么[content]查看下其他Bot,获取灵感[heading3]1小时做什么[content]找到和自己兴趣、工作方向等可以结合的Bot,深入沟通阅读以下文章:文章1文章2文章3[heading3]一周做什么[content]了解基础组件寻找不错的扣子,借鉴&复制加入Agent共学小组尝试在群里问第一个问题[heading3]一个月做什么[content]合理安排时间参与WaytoAGI Agent共学计划自己创建Agent,并分享自己捏Bot的经历和心得[heading2]在WaytoAGI有哪些支持[content]文档资源交流群活动占位

AI 数字人-定义数字世界中的你

上述种种,如果都要自建代码实现各模块,开发工作量巨大,迭代难度也很高,对于个人开发者来讲不现实。因此我们推荐借助开源社区的力量,现在开源社区已经有了像dify、fastgpt等等成熟的高质量AI编排框架,它们有大量的开源工作者维护,集成各种主流的模型供应商、工具以及算法实现等等。我们可以通过这些框架快速编排出自己的AI Agent,赋予数字人灵魂。在笔者的开源项目中,使用了dify的框架,利用其编排和可视化交互任意修改流程,构造不同的AI Agent,并且实现相对复杂的功能,比如知识库的搭建、工具的使用等都无需任何的编码和重新部署工作。同时Dify的API暴露了audio-to-text和text-to-audio两个接口,基于这个两个接口就可以将数字人的语音识别和语音生成都交由Dify控制,从而低门槛做出来自己高度定制化的数字人(如下图),具体的部署过程参考B站视频:https://www.bilibili.com/video/BV1kZWvesE25。如果有更加高度定制的模型,也可以在Dify中接入XInference等模型管理平台,然后部署自己的模型。此外,数字人GUI工程中仍然保留了LLM、ASR、TTS、Agent等多个模块,能够保持更好的扩展,比如实现更加真实性感的语音转换、或者如果有更加Geek的Agent实现也可以选择直接后端编码扩展实现。

Roger:从产品角度思考 Agent 设计

我们的Agent是一个历史新闻探索向导。身份:历史新闻探索向导性格:知识渊博、温暖亲切、富有同情心角色:主导新闻解析和历史背景分析为了使角色更加生动,我为Agent设计了一个简短的背景故事。比如,这个Agent曾是一位历史学家,对世界上的重大历史事件了如指掌,充满热情,愿意分享知识。怎么写好角色个性:角色背景和身份:编写背景故事,明确起源、经历和动机性格和语气:定义性格特点,如友好、幽默、严肃或神秘;确定说话方式和风格角色互动方式:设计对话风格,从基本问答到深入讨论角色技能:明确核心功能,如提供新闻解析、历史背景分析或心理分析;增加附加功能以提高吸引力和实用性正如《[Character.ai:每个人都可定制自己的个性化AI](https://waytoagi.feishu.cn/wiki/EoBkwirgjiqscKkAO6Wchyf1nPe)》所写:个性化定制的“虚拟伴侣”能得到用户的认可,这是因为精准地击中了许多年轻人无处可藏的孤独和焦虑,背后是年轻人渴望被理解、沟通和交流。美国心理学家Robert Jeffrey Sternberg提出了“爱情三角理论”,认为爱情包含“激情”、“亲密”和“承诺”三个要素。激情是生理上或情绪上的唤醒,例如对某人有强烈的性或浪漫的感觉;亲密是一种相互依恋的感觉,通过相互联结带来的喜爱和相互沟通分享自己的所见所闻、喜怒哀乐来体现;承诺是决定建立长期稳定关系,融入对方生活,形成互助互惠的关系,代表着一种长相厮守的责任。

Others are asking
有关 ai agent 的科普文章
以下是为您提供的关于 AI Agent 的科普内容: AI Agent 是一个融合了多学科精髓的综合实体,包括语言学、心理学、神经学、逻辑学、社会科学和计算机科学等。它不仅有实体形态,还有丰富的概念形态,并具备许多人类特有的属性。 目前,关于 AI Agent 存在一些情况。例如,网络上对其的介绍往往晦涩难懂,让人感觉神秘莫测,其自主性、学习能力、推理能力等核心概念,以及如何规划和执行任务、理解并处理信息等方面,都像是笼罩在一层神秘面纱之下。 另外,以国与国之间的外交为例来解释相关协议。假设每个 AI 智能体(Agent)就是一个小国家,它们各自有自己的语言和规矩。各国大使馆试图互相沟通、做生意、交换情报,但现实中存在诸多问题,如协议各异、要求不同等。 如果您想了解更多关于 AI Agent 的详细内容,可访问: 。
2025-04-15
,AI agent 发展趋势,技术状态,商业模式
以下是关于 AI Agent 的发展趋势、技术状态和商业模式的相关信息: 发展趋势: 2024 年内,办公场景“AI 助手”开始有良好使用体验,实时生成的内容开始在社交媒体内容、广告中出现。 2025 2027 年,接近 AGI 的技术出现,人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 技术状态: 目标实现基于 ReAct、SFT、RAG、强化学习等实现自主规划能力的 AI Agent,构建具备认知、决策智能的 Agent 智能体框架。 专注文本/多模态大模型、AI Agent 技术创新与应用。 商业模式: 依据不同类型销售市场的特点,结合一站式 AI 搭建平台将销售部署的产品化和模版化,让企业更容易落地和应用 AI 能力。 销售智能体 Blurr.AI 占位交易环节,解决 2B 销售获客的痛点,且具有向前后端环节延展的势能。
2025-04-13
ai agent有哪些技术
AI Agent 涉及的技术包括以下方面: 1. 长期任务执行技术:能够将复杂、跨度长的任务分解为小步骤,并在执行中保持目标导向和适时调整策略。 2. 多模态理解技术:能同时理解文字、图像、声音等多种交流方式,通过多种感官理解世界和任务上下文。 3. 记忆与行动技术:通过先进的记忆机制积累经验,记住对话、操作步骤和效果,使行动更精准高效。 4. 自适应学习技术:从每次交互中吸取经验,不断完善策略,实现“智慧成长”。 在技术层面,AI Agent 的发展有两条技术路线: 1. 以自主决策为核心的 LLM 控制流,代表了 AGI 的探索方向。 2. 以工作流(Workflow)编排为重点的工具集成系统,加速了 AI 落地应用。 特别值得关注的是 Anthropic 提出的 MCP(Model Context Protocol),其本质是一个通用接口协议,能解决让 AI 模型以标准化、可扩展方式与外部世界交互的问题。 此外,强化学习(RL)也是 AI Agent 的重要技术,起初主要依托策略搜索和价值函数优化等算法,如 Qlearning 和 SARSA。随着深度学习技术兴起,深度神经网络与强化学习结合形成深度强化学习,赋予 Agent 从高维输入中学习复杂策略的能力,如 AlphaGo 和 DQN 等。但强化学习面临训练周期长、采样效率低和稳定性等问题。其特点是通过试错学习最优行为策略以最大化累积奖励,时间始于 20 世纪 90 年代至今,技术包括 Qlearning、SARSA、深度强化学习(结合 DNN 和 RL),优点是能够处理高维状态空间和连续动作空间,缺点是样本效率低、训练时间长。
2025-04-09
AI chatbot、agent、copilot区别
AI chatbot、agent、copilot 主要有以下区别: 1. 定义和角色: Copilot:翻译成副驾驶、助手,在帮助用户解决问题时起辅助作用。 Agent:更像主驾驶、智能体,可根据任务目标自主思考和行动,具有更强的独立性和执行复杂任务的能力。 Chatbot:具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 核心功能: Copilot:更多地依赖于人类的指导和提示来完成任务,功能很大程度上局限于在给定框架内工作。 Agent:具有更高的自主性和决策能力,能够根据目标自主规划整个处理流程,并根据外部反馈进行自我迭代和调整。 3. 流程决策: Copilot:处理流程往往依赖于人类确定的静态流程,参与更多是在局部环节。 Agent:解决问题的流程由 AI 自主确定,是动态的,不仅可以自行规划任务步骤,还能根据执行过程中的反馈动态调整流程。 4. 应用范围: Copilot:主要用于处理简单、特定的任务,更多是作为工具或助手存在,需要人类引导和监督。 Agent:能够处理复杂、大型的任务,并在 LLM 薄弱的阶段使用工具或 API 等进行增强。 5. 开发重点: Copilot:主要依赖于 LLM 的性能,开发重点在于 Prompt Engineering。 Agent:同样依赖于 LLM 的性能,但开发重点在于 Flow Engineering,即在假定 LLM 足够强大的基础上,把外围的流程和框架系统化。 以下是一些 Agent 构建平台: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具。 2. Mircosoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及部署 Copilot 到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景方面表现出色。 以上信息由 AI 大模型生成,请仔细甄别。
2025-04-07
有没有可以抓取公众号文章的 agent
以下是一些可以抓取公众号文章的方法和相关信息: 1. 可以通过读 SQLiteDB 或者获取 RSS XML 页面(http://127.0.0.1:4000/feeds/all.atom)来获取更新的公众号。个人选择在公众号订阅不太多时,建议使用分析 XML 页面,比较简单。可以写个程序获得公众号的更新文章,由于本地部署,无法直接将文章同步到 Coze,所以选择使用多维表格(当在线数据库,事实飞书多维表格后台也是使用类似 redis 或 TiDB 这样的数据库实现的)及飞书机器人 API 的方式来实现中间数据的传递。只要在多维表格中设置一个状态转换,就可以知道文章是否已经被解读和推送。 2. 可以通过文章链接订阅公众号,定时推送情报消息,并实现情报 CoT 问答。例如使用 Docker 浏览器打开:http://127.0.0.1:4000 也可以 http://wewerss 服务的 IP:端口为上面设置的外部端口。先点帐号管理,然后点“添加读书帐号”(即使用微信读书来实现公众号订阅),扫码添加帐号。然后在公众号源上,点添加。然后将想订阅的公众号的一篇文章链接粘贴并点确定即可订阅公众号文章。但建议不要短时间订阅太多公众号(经测试最好不要超 40 个)。 3. 瓦斯阅读平台可以抓取公众号的内容,但平台上公众号不太全。 4. GitHub 上的 WeWe RSS 工具可以通过微信读书的方式订阅公众号。
2025-04-05
dify工作流中agent节点怎么使用
在 Dify 工作流中使用 Agent 节点的步骤如下: 1. 搭建工作流框架: 进入 Coze,点击「个人空间工作流创建工作流」,打开创建工作流的弹窗。 根据弹窗要求自定义工作流信息,点击确认完成新建。 左侧「选择节点」模块中,根据子任务需要,实际用上的有插件(提供能力工具拓展 Agent 能力边界)、大模型(调用 LLM 实现文本内容生成)、代码(支持编写简单脚本处理数据)。 按照流程图在编辑面板中拖入对应的 LLM 大模型、插件、代码节点完成框架搭建。 2. 测试 Agent 节点功能: 完成任何一个节点的配置后,都需要进行试运行测试以验证节点的运行效果。 步骤一:点击「测试该节点」。 步骤二:按格式要求输入待测试的输入内容,如果是 array 等其他格式,请自行对话 AI 或搜索网络确认格式要求。 步骤三:点击「展开运行结果」,检查输入、输出项是否有误。如果有误,请依次检查“测试输入内容”、“节点配置”是否有误,以及优化“提示词”以提升对生成内容的约束力。当多次测试时输入与输出都符合预期,就可以进入下一个子任务的配置。
2025-04-05