Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我是一个AI Agent初学者,现在我想要捏一款Agent,目的是喂给Agent固定材料之后对其做提问,让Agent学习完我的材料之后,在不联网的情况下对我问出的问题做出贴切材料的回答,现在请你告诉我如何操作

Answer

以下是捏制一个满足您需求的 AI Agent 的操作步骤:

  1. 规划:
    • 制定任务的关键方法,总结任务目标与执行形式。
    • 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。
    • 设计每个子任务的执行方法。
  2. 实施:
    • 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。
    • 详细配置子任务节点,并验证每个子任务的可用性。
  3. 完善:
    • 整体试运行 Agent,识别功能和性能的卡点。
    • 通过反复测试和迭代,优化至达到预期水平。

AI Agent 相关概念:

  • AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。
  • Chain:通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作是一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。
  • Router:可以使用一些判定(甚至可以用 LLM 来判定),然后让 Agent 走向不同的 Chain。例如:如果这是一个图片,则 a;否则 b。
  • Tool:Agent 上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。

常见的 AI Agent 类型包括:

  • Responser Agent:主 agent,用于回复用户(伪多模态)。
  • Background Agent:背景 agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)。
  • Daily Agent:每日 agent,用于生成剧本,配套的图片,以及每日朋友圈。

Background Agent 每隔一段时间运行一次(默认 3 分钟),分析期间的历史对话,变更人物关系(亲密度,了解度等),变更反感度,如果超标则拉黑用户,抽简对话内容,提取人物和用户的信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。

Content generated by AI large model, please carefully verify (powered by aily)

References

一泽Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力

在上篇文章[Prompt工程|样例驱动的渐进式引导法:利用AI高效设计提示词,生成预期内容](https://mp.weixin.qq.com/s/3pFG_Tx7gcnnjOyqgM1P_w)中,我已经提到过Prompt工程的必备能力:通过逻辑思考,从知识经验(KnowHow)中抽象表达出关键方法与要求。这一理念同样适用在Coze中创建AI Agent。本文主要讨论工作流驱动的Agent,搭建工作流驱动的Agent,简单情况可分为3个步骤:1.规划:制定任务的关键方法总结任务目标与执行形式将任务分解为可管理的子任务,确立逻辑顺序和依赖关系设计每个子任务的执行方法2.实施:分步构建和测试Agent功能在Coze上搭建工作流框架,设定每个节点的逻辑关系详细配置子任务节点,并验证每个子任务的可用性3.完善:全面评估并优化Agent效果整体试运行Agent,识别功能和性能的卡点通过反复测试和迭代,优化至达到预期水平接下来,我们从制定关键方法与流程,梳理「结构化外文精读专家」Agent的任务目标。

一泽Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力

AI行业的终极目标是实现AGI(通用人工智能),期望仅凭简单指令就能用媲美或超越人类的智力执行任何任务。然而,当前的大模型在处理多步骤复杂任务时仍存在明显局限。以“数据分析图表、剧情游戏”或“本文结构化外文精读”等需要多个子步骤协调完成的任务为例,即便是最先进的ChatGPT-4o和Claude 3.5 sonnet,仅依靠单一Prompt指令也难以实现稳定执行。现阶段的AI Agent更像缺乏独立解决问题能力的职场新人,需要遵循mentor的指引,按照给定的SOP流程才能完成特定任务。本文将帮助你了解如何将一个复杂任务从需求雏形逐步落地,构筑为一个AI Agent,为你后续手捏Agent提供思路指引。

皮皮:你的微信虚拟女友 - 李洛云

AI Agent:基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。AI Agent包括下面几个概念:Chain:通常一个AI Agent可能由多个Chain组成。一个Chain视作是一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的Chain是大语言模型完成的LLM Chain。Router:我们可以使用一些判定(甚至可以用LLM来判定),然后让Agent走向不同的Chain。例如:如果这是一个图片,则a;否则b。Tool:Agent上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。总结下来我们需要三个Agent:Responser Agent:主agent,用于回复用户(伪多模态)Background Agent:背景agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)Daily Agent:每日agent,用于生成剧本,配套的图片,以及每日朋友圈Responser AgentDaily AgentBackground Agent每隔一段时间运行一次(默认3分钟)分析期间的历史对话变更人物关系(亲密度,了解度等)变更反感度,如果超标则拉黑用户抽简对话内容,提取人物和用户的信息成为“增长的记忆体”按照时间推进人物剧本有概率主动聊天(与亲密度正相关,跳过夜间时间)[heading1]复杂的东西:中期记忆中的增长记忆体

Others are asking
AI Agents(智能体)
AI 智能体(Agents)是人工智能领域中一个重要的概念: 1. 从 AGI 的发展等级来看,智能体不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 2. 作为大模型的主要发展方向之一,智能体中间的“智能体”其实就是大模型(LLM)。通过为 LLM 增加工具、记忆、行动、规划这四个能力来实现。目前行业里主要用到的是 langchain 框架,它把 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。 3. 从智能体的起源探究来看,心灵社会理论认为智能是由许多简单的 Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能,通过协作实现复杂的智能行为。心灵社会将智能划分为多个层次,每个层次由多个 Agent 负责,每个 Agent 类似于功能模块,专门处理特定类型的信息或执行特定任务。同时存在专家 Agent、管理 Agent、学习 Agent 等不同类型的 Agent 及其相应功能。从达特茅斯会议开始讨论人工智能,到马文·明斯基引入“Agent”概念,“AI”和“Agent”就彻底聚齐,往后被称之为 AI Agent。
2025-04-15
B端AI Agent
以下是关于 B 端 AI Agent 的相关知识: 一、概念定义 1. 智能体(Agent)简单理解就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。随着 ChatGPT 与 AI 概念的爆火,出现了很多相关新名词,如 bot 和 GPTs 等。AI 大模型是技术,面向用户提供服务的是产品,因此很多公司关注 AI 应用层的产品机会。 C 端案例:如社交方向,用户注册后先捏一个自己的 Agent,然后让其与他人的 Agent 聊天,两个 Agent 聊到一起后真人再介入;还有借 Onlyfans 入局打造个性化聊天的创业公司。 B 端案例:字节扣子和腾讯元器若为面向普通人的低代码平台,类似 APP 时代的个人开发者,那么帮助 B 端商家搭建 Agent 就类似 APP 时代专业做 APP 的。 2. 智能体开发平台:最早接触到的扣子 Coze 是通过一篇科技报道,如 2 月 1 日,字节正式推出 AI 聊天机器人构建平台 Coze 的国内版“扣子”,主要用于开发下一代 AI 聊天机器人。国内还有很多智能体开发平台,如 Dify.AI,但个人较常用的是扣子,所以常对比字节扣子和腾讯元器。 3. 关注智能体的原因:目前 AI Agent 的概念在市场上未达成共识,存在被滥用现象。AI Agent 指的是一种智能代理系统,接近人类大脑,可形成记忆、达成行动规划、自动交互、主动预测。其应用具有个性化、自主完成任务、多 Agent 协作等特点。目前 AI Agent 应用大多集中在 2B 场景,面向个人消费者的产品少,一方面是高度智能化的 Agent 能力需打磨,概念落地有距离;另一方面是 AI 和娱乐消费诉求结合少,主要带来生产方式和效率变革,个人消费者方向目前只看到“私人助理”场景。
2025-04-15
AI workflow在企业中是否比Agent应用价值和场景更多
AI workflow 和 Agent 在企业中的应用价值和场景各有特点。 Agentic Workflows 具有以下优势: 1. 灵活性、适应性和可定制性:能够根据任务难度进行调整和演变,通过组合不同模式实现定制,在需求和复杂性增长时进行迭代升级。 2. 在复杂任务上的性能提升:将复杂任务分解为更小、可管理的步骤,显著优于确定性的零样本方法。 3. 自我纠正和持续学习:能够评估自身行为,完善策略,从过去经验中学习,在每次迭代中变得更有效和个性化。 4. 操作效率和可扩展性:可以高精度自动化重复任务,减少人工操作和运营成本,还能轻松扩展。 Agentic Workflow 的应用场景包括原子设计模式的组合、与人类反馈循环集成等。例如,Agentic RAG 在检索增强生成流程中引入了一个或多个 AI Agents,在规划阶段可进行查询分解等操作,还能评估数据和响应的相关性和准确性。 一般来说,Workflow 是一系列旨在完成特定任务或目标的相互连接的步骤。最简单的工作流是确定性的,遵循预定义步骤序列。有些工作流利用大模型或其他 AI 技术,分为 Agentic 和非 Agentic 两类。非 Agentic 工作流中,大模型根据指令生成输出。Agentic Workflow 是由单个或几个 AI Agents 动态执行的一系列连接步骤,被授予权限收集数据、执行任务并做出决策,利用 Agents 的核心组件将传统工作流转变为响应式、自适应和自我进化的过程。 综上所述,不能简单地说 AI workflow 在企业中比 Agent 应用价值和场景更多,这取决于企业的具体需求和任务特点。
2025-04-09
常见的工作流与 Agent 开发平台
常见的工作流与 Agent 开发平台如下: AI Workflow 开发平台: Coze:新一代 AI Bot 开发平台,集成了丰富的插件工具,有国际版和国内版。 Dify:开源平台,支持自定义和插件。 腾讯元器。 FastGPT:国内知名,支持自定义流程。 影刀&zapier。 Leap。 Betteryeah:立足 RPA 场景,用 AI 将用户需求生成工作流,并通过 RPA 自动化,产品形态与 Coze 相似,是企业级的 AI 应用开发平台。 Flowise:快速实现智能体搭建。 BISHENG:主攻 tob 场景的开源 LLM 搭建平台,与 fastgpt 功能类似,但面向的客户不同,整体功能和部署成本更重。 Agent 构建平台: Coze:具有拓展强、好上手、不用出国等优点。 Mircosoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行设计良好的工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景。 钉钉 AI 超级助理:依托于钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 此外,Inhai 的 Agentic Workflow 将一整套工作流组合起来,每个工具在每一个节点执行一个任务。LangGPT 提示词框架应用了 CoT 完成从输入到思维链再到输出的映射。
2025-04-09
多模态Agent最新动态
以下是关于多模态 Agent 的最新动态: 《质朴发言:视觉语言理解模型的当前技术边界与未来应用想象|Z 研究第 2 期》 近期,生成式 AI 领域的浪潮催化了多模态模型的探索,研究人员不断尝试使用更多模态数据的编码,以训练出能够理解和处理多种类型数据的模型。本份研究报告集中讨论了基于 Transformer 架构的视觉语言模型,报告范围专注于视觉和语言之间的交互,不考虑单纯的视觉到视觉的计算机视觉任务。 从 2022 年 11 月 18 日到 2023 年 7 月 26 日,多模态 Agents 迅速增长。 LLM 多模态 agent 是将现有技术融合的新尝试,是一种集成了多种模态数据处理能力的 AI 技术。 优点:高度的灵活性和扩展性,可根据不同任务需求调用最合适的模型处理任务,适应多样化任务和数据类型,优化资源使用,提升效率;无需训练,系统开发周期快,成本低。 局限性:调试和工程化难度较高,维护和升级成本高;多个组件紧密耦合,单点故障可能导致整个系统风险增加;没有涌现出新的能力。 适用场景:需要综合处理视频、语音和文本等多种信息的复杂环境,如自动驾驶汽车;高度交互和灵活的用户界面,如客户服务机器人或交互式娱乐应用。 《2024 年度 AI 十大趋势报告》 随着大模型对图像和视频信息的处理能力快速提升,预计 2025 年将开始出现更为综合性的多模态交互,AI 能够通过物联网、特定信息等多种感知通道进行协同。 多模态输入和输出使 AI 交互性更强、交互频次更高,适用场景也更加丰富,AI 产品整体水平显著提升。 Agent 作为融合感知、分析、决策和执行能力的智能体,能够根据用户历史行为和偏好,主动提供建议、提醒并个性化执行能力,为用户提供高度个性化的任务。从 2025 年开始,AI Agent 即将广泛投入使用。 从个性化推荐到直接生成个性化内容,AIGC 能够使用户体验的个性化程度有明显提升,这将帮助产品进一步完善用户体验,并通过提高用户忠诚度和迁移成本,实现差异化定价和进一步的服务增值,对产品的差异化竞争有重大意义。目前,基于 AIGC 的高度个性化已经在 AI 教育、AI 陪伴、AI 营销领域有明显进展。在硬件端搭载的多款 AI 智能助手也已开始以高度个性的个人助理作为宣传重点。
2025-03-31
目前最好的AI Agent是哪一款
目前,在 AI Agent 领域,没有绝对意义上的“最好”的一款。以下为您介绍一些受到关注的 AI Agent: 1. AutoGPT 和 BabyAGI 是最早实现让 LLM 自己做自动化多步骤推理的开源智能代理,在去年 GPT4 刚发布时风靡全球科技圈。 2. Devin 是来自纽约华人创业团队 Cognition AI 的一款可以像人类程序员一样自动写代码的 Agent,但因演示视频过于科幻而被揭露造假。 3. Google 在今年的 Next 与 I/O 大会上发布了自己的 Agent 战略,如 Google Plan Search 能自动化多步骤执行搜索任务。 4. Cursor 中的 Agent 功能,只要给它一个模糊指令,它会自动规划和解决问题。Cline 作为一个 AI 助手,也有一定的能力,其新版本还推出了检查点功能。 需要注意的是,AI Agent 领域在不断发展,不同的 Agent 在不同的应用场景和任务中可能表现出不同的优势。
2025-03-30
有什么 prompt engineering 的好材料
以下是一些关于 prompt engineering 的好材料: 文本类 Prompt 网站: Learning Prompt:授人以渔,非常详尽的 Prompt 学习资源,包括 ChatGPT 和 MidJourney,网址: FlowGPT:国外做的最大的 prompt 站,内容超全面,更新快,网址: ChatGPT Shortcut:ChatGPT 提示词网站,提供了非常多使用模板,简单修改即可指定输出,网址: ClickPrompt:轻松查看、分享和一键运行模型,创建 Prompt 并与其他人分享,网址: Prompt Extend:让 AI 帮你自动拓展 Prompt,网址: PromptPerfect:帮你自动优化提示词,你可以看到优化前后的对比,网址: PromptKnit:The best playground for prompt designers,网址: PromptPort(支持中文):AI Prompt 百科辞典,其中 prompts 是聚合了市场上大部分优质的 prompt 的词库,快速的寻找到用户需求 prompt,网址: Prompt Engineering Guide:GitHub 上点赞量非常高的提示工程指南,网址: Claude 3.7 核心提示词相关: 您可以在中找到他们往期开源的更多系统提示词,涵盖了从 Claude 3 Haiku 到现在所有的模型。 一泽 Eze 整理的相关学习资料: Claude 3.5 sonnet 内置提示词详细拆解与解说:https://mp.weixin.qq.com/s/0R4zgH3Gc5TAfAPY1oJU4A Anthropic 的三位顶级提示工程专家聊《如何当好的提示词工程师》:https://mp.weixin.qq.com/s/VP_auG0a3CzULlf_Eiz1sw 往期 Claude AI 核心系统提示词:https://docs.anthropic.com/en/releasenotes/systemprompts Claude 官方用户手册 提示工程指南:https://docs.anthropic.com/en/docs/buildwithclaude/promptengineering/overview Claude 官方提示库:https://docs.anthropic.com/en/promptlibrary/library 基本概念: 简单的提示词可以包含指令、问题等信息,也可以包含上下文、输入或示例等详细信息,以更好地指导模型获得更好的结果。 当使用 OpenAI 的聊天模型时,可以使用 system、user 和 assistant 三个不同的角色来构建 prompt,system 有助于设定 assistant 的整体行为。 提示工程就是探讨如何设计出最佳提示词,用于指导语言模型帮助我们高效完成某项任务。
2025-04-12
我是一个AI Agent初学者,现在我想要捏一款Agent,目的是喂给Agent固定材料之后对其做提问,让Agent学习完我的材料之后,在不联网的情况下对我问出的问题做出贴切材料的回答
以下是为您提供的关于捏制 AI Agent 的相关知识: 一、手捏 AI Agent 的思路 在 Coze 中创建工作流驱动的 AI Agent,简单情况可分为 3 个步骤: 1. 规划 制定任务的关键方法。 总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。 二、AI Agent 的概念 AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。 AI Agent 包括以下几个概念: 1. Chain:通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作是一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。 2. Router:可以使用一些判定(甚至可以用 LLM 来判定),然后让 Agent 走向不同的 Chain。例如:如果这是一个图片,则 a;否则 b。 3. Tool:Agent 上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。 同时,需要三个 Agent: Responser Agent:主 agent,用于回复用户(伪多模态)。 Background Agent:背景 agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)。 Daily Agent:每日 agent,用于生成剧本,配套的图片,以及每日朋友圈。 三、Agent 的“明斯基时刻” 心灵社会理论认为,智能是由许多简单的 Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能,通过协作实现复杂的智能行为。 其特点包括: 1. 多重层次:心灵社会将智能划分为多个层次,从低层次的感知和反应到高层次的规划和决策,每个层次由多个 Agent 负责。 2. 功能模块:每个 Agent 类似于功能模块,专门处理特定类型的信息或执行特定任务,如视觉处理、语言理解、运动控制等。 3. 分布式智能:智能不是集中在单一的核心处理单元,而是通过多个相互关联的 Agent 共同实现。这种分布式智能能够提高系统的灵活性和鲁棒性,应对复杂和多变的环境。 同时,在《心灵社会》中,明斯基还详细描述了不同类型的 Agent 及其功能: 专家 Agent:拥有特定领域知识和技能的 Agent,负责处理复杂的任务和解决特定问题。 管理 Agent:协调和控制其他 Agent 的活动,确保整体系统协调一致地运行。 学习 Agent:通过经验和交互,不断调整和优化自身行为,提高系统在不断变化环境中的适应能力。
2025-03-23
我想找最新的关于大模型发展趋势的材料
以下是为您找到的关于大模型发展趋势的最新材料: 基础通识课中提到了 AI 模型及相关进展,包括视频生成模型、相关论文,以及 AI 在诺奖和蛋白质研究领域的应用等。还介绍了人工智能的发展历程,从早期到如今大模型和多模态模型百花齐放的阶段。同时提到大模型由数据、算法、算力构成,算法有技术架构的迭代,数据质量对生成理想的大模型至关重要,以及针对弱智 8 的问题对大模型进行测试等相关内容。 2023 年度中文大模型基准测评报告.pdf 中包含 2023 年国内大模型发展趋势、测评体系、方法说明、综合测评结果、SuperCLUE2.0 升级、四大维度测评分析及示例介绍、优秀模型案例介绍等内容。 2024 年历史更新(归档)中,有《探讨大模型未来:从 Scaling Law 到数据红利再到终极 Token 工厂》,探讨了大模型的未来,包括规模化法则、数据红利和 Token 工厂概念。还有《【AI 学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)》《智变时代/全面理解机器智能与生成式 AI 加速的新工业革命》《文生图大模型基准测评首期榜单公布,DALLE 3 取得最高 76.94 分》等相关文章。
2025-03-23
帮我找下提示词学习材料
以下是为您提供的提示词学习材料: 一、关于提示词的一般理解 提示词(Prompt)是给大语言模型的输入文本,用于指定模型应执行的任务和生成的输出。它发挥着“提示”模型的作用,设计高质量的提示词需根据目标任务和模型能力精心设计,良好的提示词能让模型正确理解需求并给出符合预期的结果。示例包括直接提问型、策略建议型、翻译型、算数型、概念解释型等。 二、系统学习 Stable Diffusion 提示词的步骤 1. 学习基本概念 了解 Stable Diffusion 的工作原理和模型架构。 理解提示词如何影响生成结果。 掌握提示词的组成部分(主题词、修饰词、反面词等)。 2. 研究官方文档和教程 通读 Stable Diffusion 官方文档,了解提示词相关指南。 研究来自开发团队和专家的教程和技巧分享。 3. 学习常见术语和范例 熟悉 UI、艺术、摄影等相关领域的专业术语和概念。 研究优秀的图像标题和描述,作为提示词范例。 4. 掌握关键技巧 学习如何组合多个词条来精确描述想要的效果。 掌握使用“()”、“”等符号来控制生成权重的技巧。 了解如何处理抽象概念、情感等无形事物的描述。 5. 实践和反馈 使用不同的提示词尝试生成各种风格和主题的图像。 对比提示词和实际结果,分析原因,总结经验教训。 在社区内分享结果,请教高手,获取反馈和建议。 6. 创建提示词库 根据主题、风格等维度,建立自己的高质量提示词库。 将成功案例和总结记录在案,方便后续参考和复用。 7. 持续跟进前沿 关注 Stable Diffusion 的最新更新和社区分享。 及时掌握提示词的新技术、新范式、新趋势。 三、Claude 3.7 核心提示词相关资源 Anthropic 定期对外更新 Claude AI 的核心系统提示词,为广大提示工程师提供了宝贵的学习资料。您可以在以下链接中找到更多相关内容: 1. 中找到他们往期开源的更多系统提示词,涵盖了从 Claude 3 Haiku 到现在所有的模型。 2. Claude 3.5 sonnet 内置提示词详细拆解与解说:https://mp.weixin.qq.com/s/0R4zgH3Gc5TAfAPY1oJU4A 3. Anthropic 的三位顶级提示工程专家聊《如何当好的提示词工程师》:https://mp.weixin.qq.com/s/VP_auG0a3CzULlf_Eiz1sw 4. 往期 Claude AI 核心系统提示词:https://docs.anthropic.com/en/releasenotes/systemprompts 5. Claude 官方用户手册 提示工程指南:https://docs.anthropic.com/en/docs/buildwithclaude/promptengineering/overview 6. Claude 官方提示库:https://docs.anthropic.com/en/promptlibrary/library
2025-03-15
AI音乐发布要准备哪些材料
发布 AI 音乐通常需要准备以下材料: 1. 音频文件:确保音频质量良好。 2. 歌词: 文本歌词需做成 TXT 格式上传。 可通过自带功能将文本歌词同步为逐字歌词 TRC,修正错别字后提交。 3. 描述音乐风格:如民谣、流行、嘻哈、国风等。 4. 若为人声歌曲,还需准备歌词:可以自己创作,也可让 AI 帮忙写作。 5. 选择音乐库中的合适音乐。 此外,在一些相关教程中还提到: 收藏过的满意音乐素材、音效素材以及抖音里收藏的音乐。 音效库方面,可通过搜索相应音效,如开门声,并添加到音轨。
2025-03-11
mpc相关材料
以下是关于 MPC 的相关材料: Claude 直接连接到 GitHub、创建新存储库并通过简单的 MCP 集成创建 PR。Anthropic 推出模型上下文协议(MCP),Claude Desktop 现在可以直接连接到 GitHub、创建新的存储库并创建 PR。 具身智能算法层中,模型预测控制(MPC)通过预测未来系统行为来做出决策,在未来的一个给定时间窗口内解决一个最优化问题,以寻找控制输入,最小化成本并满足约束。MPC 需要系统模型、成本函数、预测时间段、约束和反馈来运作,通过预测未来情况,机器人可产生相应动作进行“预判”,一定程度上加大机器人实用性。以足式机器人为例,可将 MPC 用于全身控制,能协调身体各部分,通过观测地面环境提前给出控制量,减缓欠驱动状态下系统的不稳定性,减少接触模态干扰,增强四足稳定性。此类路线的代表为波士顿动力,优点是传统算法可靠性高、可解释性强,缺点是对于 corner case(如光滑地面)处理不好。 11 月 25 日,Anthropic 发布开源 MCP 协议,其亮点是定义了一套标准且相对完善的协议,对大模型和应用的生态协同有很大指导意义,本质上是对 LLM 和 API 调用层的优化。
2025-03-09
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
学AI上钉钉
以下是在钉钉上学 AI 的相关内容: 从 AI 助教到智慧学伴的应用探索: 登录钉钉客户端,在右上角依次选择钉钉魔法棒、AI 助理、创建 AI 助理。进入创建 AI 助理页面后,填写 AI 助理信息,设置完成即可创建成功。 AI 领导力向阳乔木:未提及具体的在钉钉上学 AI 的操作方法。 基于 COW 框架的 ChatBot 实现步骤: 创建应用: 进入,登录后点击创建应用,填写应用相关信息。 点击添加应用能力,选择“机器人”能力并添加。 配置机器人信息后点击发布,发布后点击“点击调试”,会自动创建测试群聊,可在客户端查看。点击版本管理与发布,创建新版本发布。 项目配置: 点击凭证与基础信息,获取 Client ID 和 Client Secret 两个参数。 参考项目,将相关配置加入项目根目录的 config.json 文件,并设置 channel_type:"dingtalk",注意运行前需安装依赖。 点击事件订阅,点击已完成接入,验证连接通道,会显示连接接入成功。 使用:与机器人私聊或将机器人拉入企业群中均可开启对话。
2025-04-19
AI术语解释
以下是一些常见的 AI 术语解释: Agents(智能体):一个设置了一些目标或任务,可以迭代运行的大型语言模型。与大型语言模型在像 ChatGPT 这样的工具中的通常使用方式不同,Agent 拥有复杂的工作流程,模型本质上可以自我对话,无需人类驱动每一部分的交互。属于技术范畴。 ASI(人工超级智能):尽管存在争议,但通常被定义为超越人类思维能力的人工智能。属于通识范畴。 Attention(注意力):在神经网络的上下文中,有助于模型在生成输出时专注于输入的相关部分。属于技术范畴。 Bias(偏差):AI 模型对数据所做的假设。“偏差方差权衡”是模型对数据的假设与给定不同训练数据的模型预测变化量之间必须实现的平衡。归纳偏差是机器学习算法对数据的基础分布所做的一组假设。属于技术范畴。 Chatbot(聊天机器人):一种计算机程序,旨在通过文本或语音交互模拟人类对话。通常利用自然语言处理技术来理解用户输入并提供相关响应。属于通识范畴。 CLIP(对比语言图像预训练):由 OpenAI 开发的 AI 模型,用于连接图像和文本,使其能够理解和生成图像的描述。属于技术范畴。 TPU(张量处理单元):谷歌开发的一种微处理器,专门用于加速机器学习工作负载。属于技术范畴。 Training Data(训练数据):用于训练机器学习模型的数据集。属于技术范畴。 Transfer Learning(迁移学习):机器学习中的一种方法,其中对新问题使用预先训练的模型。属于技术范畴。 Validation Data(验证集):机器学习中使用的数据集的子集,独立于训练数据集和测试数据集。用于调整模型的超参数(即架构,而不是权重)。属于技术范畴。 Knowledge Distillation(数据蒸馏):数据蒸馏旨在将给定的一个原始的大数据集浓缩并生成一个小型数据集,使得在这一小数据集上训练出的模型,和在原数据集上训练得到的模型表现相似。在深度学习领域中被广泛应用,特别是在模型压缩和模型部署方面。可以帮助将复杂的模型转化为更轻量级的模型,并能够促进模型的迁移学习和模型集成,提高模型的鲁棒性和泛化能力。属于技术范畴。 RAG(检索增强生成):检索增强生成。属于技术范畴。 Forward Propagation(前向传播):在神经网络中,输入数据被馈送到网络并通过每一层(从输入层到隐藏层,最后到输出层)以产生输出的过程。网络对输入应用权重和偏差,并使用激活函数生成最终输出。属于技术范畴。 Foundation Model(基础模型):在广泛数据上训练的大型 AI 模型,旨在适应特定任务。属于技术范畴。 GAN(通用对抗网络):一种机器学习模型,用于生成类似于某些现有数据的新数据。使两个神经网络相互对抗:一个“生成器”,创建新数据,另一个“鉴别器”试图将数据与真实数据区分开来。属于技术范畴。 Generative AI/Gen AI(生成式 AI):AI 的一个分支,专注于创建模型,这些模型可以根据现有数据的模式和示例生成新的原创内容,例如图像、音乐或文本。属于通识范畴。 GPU(图形处理单元):一种特殊类型的微处理器,主要用于快速渲染图像以输出到显示器。在执行训练和运行神经网络所需的计算方面也非常高效。属于产品范畴。
2025-04-18
请推荐1~2款适合初学者的AI编程助手和编程学习工具
以下是 1 2 款适合初学者的 AI 编程助手和编程学习工具: v0:适合初学者,能为编程提供一定的辅助和支持。 Bolt:对新手友好,有助于初学者在编程过程中获得帮助和指导。 此外,还有一些其他常见的适合初学者的工具,如 GitHub Copilot,它支持多种语言和 IDE,能为程序员快速提供代码建议;通义灵码,提供行级/函数级实时续写、自然语言生成代码等多种能力。您可以根据自己的需求选择最适合您的工具。
2025-03-18
初学者教程
以下为您提供一些适合初学者的 AI 教程资源: Blender 相关: 新手免费入门教程:https://flowus.cn/share/bf6780f53c0a43999e6cdf4a9f48d52b Blender 插件的安装方法和汉化、包括疑难杂症解决:https://flowus.cn/share/79f8f60ac2e94d669a56572d2cda5641 Up B 站空间:https://space.bilibili.com/206992617?spm_id_from=333.1007.0.0 关于 Blender 找工作问题:https://flowus.cn/share/7000d5e84ca94f0cb493406b08c29e3f Blender 插件寻找与下载:https://flowus.cn/share/42a2af8dbaf04d1db309fe33dcb061d2 Blender 资产、贴图、等等免费网站:https://flowus.cn/share/606da95d9130451f96000fe3789e3a42 提升审美网站:https://flowus.cn/share/0f6bad6a46034b8082a27a8c69bb1caa 面向 AI 应用的同学: 微软的 AI 初学者课程:https://microsoft.github.io/AIForBeginners/ AI for every one(吴恩达教程):https://www.bilibili.com/video/BV1yL411u7q6 大语言模型原理介绍视频(李宏毅):https://www.bilibili.com/video/BV1TD4y137mP/ 谷歌生成式 AI 课程:目录:https://ywh1bkansf.feishu.cn/wiki/DTm0way7QiKyHckMXsjc00kIn6e ChatGPT 入门:目录:https://ywh1bkansf.feishu.cn/wiki/QddLw0teKi7nUCkDRIecskn3nuc 微信机器人共学教程第一天教程 COW 部署的配置环境: 刚才在这里保存的“外网面板地址”,点击打开。(有小伙伴反馈,命令输出的地址是 login 结尾的,点击打不开。那您只需要把 login 改成 http://xxx.xxx.xx.xxx:8888/tencentcloud 就可以了) 输入账号密码,即上图中的 username、password 第一次进入会让您绑定一下,点击免费注册,注册完成后,返回此页,登录账号。 首次会有个推荐安装,只安装第一个即可。其他的取消勾选。
2025-03-16
Coze 智能体 教程 初学者 3个月内的内容
以下是为初学者提供的 Coze 智能体相关教程,预计在 3 个月内可以完成学习: 1. 页面布局: 常见的左右、上下布局及嵌套方法,包括如何设置容器实现左右布局、调整大小分割等,强调外层高度设置的重要性。 溢出处理方式及内边距影响,建议初学者用固定宽高布局。 换行布局及元素分布设置,用于图片排版。 证件照应用搭建过程及布局设置,如创建应用、清理页面,设置第一个 div 容器,证件照基础界面为上下布局,分标题、示例、操作展示三块,需拖三个容器,顶部高度大概 100。 2. 证件照应用的用户界面搭建与业务逻辑构建: 用户界面搭建,包括各部分尺寸、布局、组件设置,如文本、图片、表单等。 业务逻辑搭建,创建工作流,添加图片理解、图像生成、智能换脸等插件,设置参数、提示词,并告知文档地址在社区智能体 1.3 共学里。 3. 工作流与代码(重度用户): 对于轻度用户,不需要工作流;对于重度用户,可参考官方文档:https://www.coze.cn/docs/guides/welcome 。 工作流的优势,如解决速度慢和可能出错的问题。 介绍主工作流和 AI Project 工作流,以及中间用到的 python 代码和结合工作流修改的「人设与回复逻辑」。 4. 基础通识课: 在 cos 主页有新手教程文档,可据此构建智能体。 工作流偏向节点调用,可通过 prompt 构建提示词并优化。 能调用多种插件,可添加图像流、触发器和知识库,知识库可上传多种格式内容及在线链接以沉淀知识。 Nimbus 介绍智能交互相关内容,包括有趣的智能体、插件商城、扣子案例、模型社区并答疑。 AI 编程课前准备及相关工具、账号注册说明,如注册阿里云账号、安装无影、注册 GitHub 账号等。
2025-03-12
初学者可以从哪些方面上手
对于初学者上手 AI,以下是一些建议: 1. 调度器和采样器方面:可以从 Euler 或 DDIM 开始,因为它们提供了良好的平衡点,便于快速了解生成过程。如果对生成过程中的稳定性和细节处理有严格要求,可以考虑 DPM++ SDE Karras、LCM 和 Dynamic Thresholding 这样的采样器。在需要快速生成图像的情况下,DPM fast、Euler 和 DDIM Fast 是不错的选择。如果希望生成更具创意或独特风格的图像,可以尝试 Heun、DPM++ 3M SDE Palefire 以及 Restart 采样器。对于高要求的图像生成任务,推荐使用 DPM++ 3M SDE Karras、DPM2 Exponential 和 LCM 这些经过优化的采样器。 2. 基本概念方面: 阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能及其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系,浏览入门文章。 在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程。通过在线教育平台(如 Coursera、edX、Udacity)上的课程按照自己的节奏学习。 选择感兴趣的模块深入学习,掌握提示词的技巧。 3. 实践方面: 理论学习之后进行实践,尝试使用各种产品做出作品。 在知识库分享实践后的作品和文章。 4. 体验方面: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 5. Prompt 方面: 认真写出自己的第一个 prompt,理解 GPT 的工作原理,至少先真正理解以下几个问题:GPT 说人话的能力是怎么来的、“涌现”的产生、prompt 的概念和意义、为什么现阶段我们不得不用 prompt。推荐两个课外阅读,即 B 站 UP Yjango(于建国博士)很早前发布的相关视频。 您还可以关注获取更多内容。
2025-03-11
Coze 智能体 教程 初学者
以下是为初学者提供的 Coze 智能体相关教程: 1. 可能是全网最好的 Coze 教程之一,能一次性带您入门 Coze 工作流。即使是非技术出身的爱好者也能上手跟学,一站式学会 AI Agent 从设计到落地的全流程方法论。 阅读指南:长文预警,请视情况收藏保存。 核心看点:通过实际案例逐步演示,用 Coze 工作流构建一个能够稳定按照模板要求,生成结构化内容的 AI Agent;开源 AI Agent 的设计到落地的全过程思路;10+项常用的 Coze 工作流的配置细节、常见问题与解决方法。 适合人群:任何玩过 AI 对话产品的一般用户(如果没用过,可以先找个国内大模型耍耍);希望深入学习 AI 应用开发平台(如 Coze、Dify),对 AI Agent 工作流配置感兴趣的爱好者。 注:本文不单独讲解案例所涉及 Prompt 的撰写方法。文末「拓展阅读」中,附有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容,以供前置或拓展学习。 2. 90 分钟从 0 开始打造您的第一个 Coze 应用: 智能纪要: 智能章节: 页面布局的常见方式与实际操作讲解:本章节主要介绍页面布局。先讲解常见的左右、上下布局及嵌套方法,演示如何设置容器实现左右布局、调整大小分割等,强调外层高度设置的重要性。接着说明溢出处理方式及内边距影响,建议初学者用固定宽高布局。最后介绍换行布局及元素分布设置,用于图片排版。 讲解证件照应用搭建过程及布局设置:本章节介绍证件照应用搭建。会魔法的大人让大家创建应用、清理页面,先设置第一个 div 容器方便后续操作。提到要 1:1 复刻其应用,讲解证件照基础界面为上下布局,分标题、示例、操作展示三块,需拖三个容器,因排列方向问题可能只看到两个,还提到顶部高度大概 100。 证件照应用的用户界面搭建与业务逻辑构建讲解:本章节主要讲解证件照应用的搭建。先介绍用户界面搭建,包括各部分尺寸、布局、组件设置,如文本、图片、表单等;后阐述业务逻辑搭建,创建工作流,添加图片理解、图像生成、智能换脸等插件,设置参数、提示词,并进行测试,还告知文档地址在社区智能体 1.3 共学里。
2025-03-09