Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

How Al Agentic workflows could drive more Al progress than even the next generation of foundation models

Answer

以下是关于您提出的“ How Al Agentic workflows could drive more Al progress than even the next generation of foundation models ”问题的相关信息:

吴恩达认为人工智能代理工作流程将在今年推动人工智能的巨大进步,甚至可能超过下一代基础模型。构建代理的设计模式框架包括反思、工具使用、规划和多代理协作。反思是指 LLMs 审视自身工作并提出改进方法;工具使用是指赋予 LLMs 如网络搜索、代码执行等工具以帮助其收集信息、采取行动或处理数据;规划是指 LLMs 制定并执行多步骤计划以实现目标;多代理协作则涉及多个 AI 代理共同工作,通过分工、讨论和辩论来提出比单个代理更好的解决方案。这些设计模式为构建高效的 AI 代理提供了指导,并将在下周进一步详细阐述并提供相关阅读建议。

此外,在医疗保健领域,为了产生真正的改变,AI 需要像我们一样学习。必须让这些专家 AI 接触到顶级从业人员的多样化视角,以避免复制危险的偏见。鉴于人工智能依赖的神经网络基础,这些专家 AI 可能通过元学习(或学会学习)比我们预期的更快地获得知识,并带着我们人类一同进步。

在 AI 进化方面,CNN 的结构基于两类细胞的级联模型,主要用于模式识别任务,在计算上比大多数其他架构更有效、更快速,在许多应用中,包括自然语言处理和图像识别,已经被用来击败大多数其他算法。我们每次对大脑的工作机制的认知多一点,神经网络的算法和模型也会前进一步。

Content generated by AI large model, please carefully verify (powered by aily)

References

AIGC Weekly #64

吴恩达认为人工智能代理工作流程将在今年推动人工智能的巨大进步——甚至可能超过下一代基础模型。这是一个重要的趋势,我呼吁所有从事人工智能工作的人都关注它。构建代理的设计模式框架包括反思、工具使用、规划和多代理协作。反思是指LLMs审视自身工作并提出改进方法;工具使用是指赋予LLMs如网络搜索、代码执行等工具以帮助其收集信息、采取行动或处理数据;规划是指LLMs制定并执行多步骤计划以实现目标;多代理协作则涉及多个AI代理共同工作,通过分工、讨论和辩论来提出比单个代理更好的解决方案。这些设计模式为构建高效的AI代理提供了指导,并将在下周进一步详细阐述并提供相关阅读建议。

为了在医疗保健中产生真正的改变,AI 需要像我们一样学习

必须让这些专家AI接触到顶级从业人员的多样化视角,以避免复制危险的偏见。但AI的黑盒性远不如大众想象中的那么强;我们今天依赖的人类决策,正如我以前[指出的](https://www.nytimes.com/2018/01/25/opinion/artificial-intelligence-black-box.html),可以说更加不透明。我们不能因为对传播人类偏见的恐惧而限制我们探索AI如何帮助我们民主化我们的人类专家知识的意愿,而这些专家是不幸地无法扩展的。鉴于人工智能依赖的神经网络基础,这些专家AI可能通过元学习(或学会学习)比我们预期的更快地获得知识,并带着我们人类一同进步。AI的性质让我们可以做一些我们无法对人做的事情;即将他们一部分一部分地拆解,并研究每一个小部分。通过构建系统以深入探索专家AI的内部工作机制,我们将创造一个学习的飞轮。最终,专家AI可能超越领域专家的角色,成为下一代专家——无论是人类还是AI——的教师。

机器之心的进化 / 理解 AI 驱动的软件 2.0 智能革命

CNN的结构是基于这两类细胞的级联模型,主要用于模式识别任务。它在计算上比大多数其他架构更有效、更快速,在许多应用中,包括自然语言处理和图像识别,已经被用来击败大多数其他算法。我们每次对大脑的工作机制的认知多一点,神经网络的算法和模型也会前进一步!

Others are asking
Gen - 3 Alpha
Gen3 Alpha 是 Runway 在为大规模多模式训练构建的新基础设施上训练的一系列模型中的第一个。与 Gen2 相比,在保真度、一致性和运动方面有重大改进,也是朝着构建通用世界模型迈出的一步。 官方介绍地址:https://runwayml.com/blog/introducinggen3alpha/ 创始人相关内容: 此外,在视频生成领域,一些小型参与者也有显著贡献,如 Runway 的 Gen3 Alpha 等模型。其他主要科技公司如 Meta、Google 等也在视频生成方面有重要进展。
2025-04-15
你知道有哪些擅长脚本写作的Al吗
以下是一些擅长脚本写作的 AI: 1. Kimi:免费好用,网址为 https://kimi.moonshot.cn/ 。 2. Claude:在脚本创作方面有优势,网址为 https://claude.ai/new 。 3. ChatGPT:老牌且功能更强大,网址为 https://chatgpt.com/ 。 在使用这些 AI 进行脚本写作时,您可以按照以下提示词结构:我要做什么样的视频+视频要包含哪些关键的元素+对脚本的输出有什么要求。例如,明确要做 30 秒时长的广告宣传片脚本、做一个孩子们喜欢的儿童绘本脚本等,并重点说出产品特性或想要的广告风格,同时可要求按照一定格式输出,如 Markdown 格式,方便后续操作。 此外,进行剧本写作时,您可以从原创(如自身或周围人的经历、做过的梦、想象的故事等)或改编(如经典 IP、名著改编、新闻改编、二创等)入手。对于短片创作,可从自身或朋友的经历改编,或对短篇故事进行改编,多与他人讨论故事以修改和进步。 例如,牛汉腾主要用 ChatGPT 和 ChatGLM 辅助剧本创作,mid、sd 生图,svd 做视频,能完成剧本—文案—生图—视频—剪辑的全流程。
2025-03-20
OpenAl 发布 Agent 工具包
OpenAI 刚发布了全新的 Agent 工具包,这标志着 AI 智能体进入了新时代。新推出的 Responses API 及相关工具,简化了开发者构建多功能 AI Agent 的流程,实现了自动化任务处理。其中,网络搜索、文件搜索及计算机使用工具相结合,使 AI 不仅能获取实时信息,还能执行复杂操作。这不仅是对 Assistants API 的全面升级,也意味着智能体进入统一接口、标准化开发的新阶段。OpenAI 表示,2025 年将是 Agent 的元年,让 AI 超越聊天框,成为工作中的“数字助理”与“数字同事”。开发智能体不再需要拼凑繁杂代码,只需 4 行代码即可实现。
2025-03-13
RuntimeError: All input tensors need to be on the same GPU, but found some tensors to not be on a GPU
以下是对您所遇到的报错“RuntimeError: All input tensors need to be on the same GPU, but found some tensors to not be on a GPU”的一些可能的解决方案: 1. 检查您的代码和模型设置,确保所有输入张量都被正确地分配到同一个 GPU 上。 2. 对于与显存相关的问题,如爆显存的情况,在训练时可以尝试调小批量大小,在推理时可以使用强制切片。 3. 调大虚拟内存,可能有助于解决一些与内存相关的报错。 同时,在处理与 AI 相关的报错时,还可能会遇到其他类似的问题,例如: 1. 页面文件太小,无法完成操作。解决方法是增大系统虚拟内存大小。 2. 出现“torch.cuda.OutOfMemoryError: CUDA out of memory”报错,通常是爆显存了。 3. 遇到“DataLoader workerexited unexpectedly”报错,可把虚拟内存再调大一点。 4. “CUDA error: CUBLAS_STATUS_NOT_INITIALIZED when calling 'cublasCreate'”报错,一般也是爆显存。 5. “'HParams' object has no attribute 'xxx'”报错,可能是无法找到音色,一般是配置文件和模型没对应,打开配置文件拉到最下面查看是否有训练的音色。 6. “The expand size of the tensor at nonsingleton dimension 0”报错,可把 dataset/44k 下的内容全部删除,重新走一遍预处理流程。 7. “Given groups=1, weight of size to have 256 channels, but got 768 channels instead”报错,可能是 vec256 的模型用了 vec768 的配置文件,反之亦然,请参考旧模型兼容,确认配置文件和模型维度对应。 8. “配置文件中的编码器与模型维度不匹配”报错,可能是在修改配置文件中的“speech_encoder”时修改错了,检查配置文件中的“ssl_dim”一项,如果这项是 256,那您需要确认配置文件和模型维度的对应关系。
2025-01-17
Al在未来会发展出自己的灵魂吗
目前关于 AI 在未来是否会发展出自己的灵魂,尚无明确的定论。 从一些研究和观点来看,多模型机制的新皮层由数以万计的皮质柱组成,每根柱子都会学习物体的模型,智能机器的“大脑”也应如此。大脑中的知识被储存在参考框架中,机器也需要学会一个世界的模型。 另外,AI 将从专用方案过渡到更多的通用方案,通用电脑因成效比好而占据主导,未来一些重要应用也需要通用方案的灵活性。但同时,AI 运营的公司会面临更高的极端风险,存在实际问题需要解决。 总之,对于 AI 是否会发展出灵魂,还需要更多的研究和探讨。
2025-01-09
Al发展到什么程度
目前 AI 的发展呈现出多方面的特点和趋势: 1. 千脑理论:新皮层由数以万计的皮质柱组成,每根柱子都会学习物体的模型,多模型设计发挥作用的关键是投票。智能机器的“大脑”也应由许多几乎相同的元素(模型)组成,并连接到各种可移动的传感器。大脑中的知识储存在参考框架中,机器也需要学会一个世界的模型。 2. 通用化趋势:AI 将从专用方案过渡到更多的通用方案。通用电脑因更好的成效比导致技术更快进步,更多努力用于加强受欢迎的设计和支持其生态系统,导致成本降低和性能提升。同时,一些重要的未来应用如探索火星等需要通用方案的灵活性,而当前专用的深度学习模型无法满足。 3. 游戏领域:随着生成式人工智能革命的进展,它将重塑用户生成内容(UGC),创造任何人都能构建游戏的世界,游戏创作将变得真正民主化,数以百万计的新游戏制作者将被创造出来。 4. 企业发展:OpenAI 公司成立于 2015 年,总部位于美国旧金山,早期是非营利机构,后来改成有限营利形式。其使命是推进人工智能技术发展,为全球创造更安全、智能的未来。关于 OpenAI 公司的时间线,可参考 Wiki(https://timelines.issarice.com/wiki/Timeline_of_OpenAI)和 OpenAI Blog(https://openai.com/blog/)。
2025-01-09
1. laptop 2. artificial intelligence 3. generative 4. log in 5. AI-driven 6. bluetooth headset 7. video call 8. platform Write some interesting sentences with these words
以下是为您生成的包含这些关键词的有趣句子: 当我使用配备强大 GPU 的 AI 笔记本电脑,如戴尔 Precision 移动工作站,通过蓝牙耳机关闭了周围的噪音,登录到专门的 AI 驱动平台,与远方的朋友进行视频通话,探讨生成式人工智能的奇妙之处,感觉真是太棒了! 在微星 Creator/Workstation 系列的 AI 笔记本上,我利用预装的深度学习框架,如 NVIDIA CUDA 和 cuDNN,进行着生成式模型的训练,同时通过蓝牙连接着蓝牙耳机,享受着不受干扰的创作过程,然后登录到特定的平台分享我的成果,这一切都由 AI 驱动,借助高速的网络实现了如同面对面的视频通话交流。 联想 ThinkPad P 系列的 AI 笔记本,拥有出色的散热和续航,让我能长时间专注于生成式项目的开发。我戴上蓝牙耳机,登录 AI 平台,与团队进行视频通话,共同推动项目前进,这一切都离不开 AI 驱动的强大力量。
2025-01-20
AI Agent和Agentic Workflow的区别
AI Agent 和 Agentic Workflow 存在以下区别: AI Agent: 基本框架:由“LLM + 规划 + 记忆 + 工具使用”构成,大模型 LLM 充当“大脑”。 规划方面:包括子目标分解、反思与改进,将大型任务分解为较小可管理的子目标,能对过去行动进行自我批评和反思,从错误中学习并改进未来步骤。 记忆方面:用于存储和调用相关信息。 Agentic Workflow: 驱动角色工作流变革:使用多智能体协作的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。 涉及人机协同关系:生成式 AI 的人机协同分为嵌入式、副驾驶、智能代理 3 种产品设计模式,在不同模式下,人与 AI 的协作流程有所差异。 重塑获取信息的方式:如搜索引擎和基于大模型的聊天机器人在获取信息上目标一致,ChatGPT 的出现被认为将对传统搜索引擎带来颠覆。 包含多种设计模式:如反思、工具使用、规划、多智能体协同等。反思是让 Agent 审视和修正自己生成的输出;工具使用指 LLM 生成代码、调用 API 等工具进行操作;规划是让 Agent 分解复杂任务并按计划执行;多智能体协同是多个 Agent 扮演不同角色合作完成任务。
2025-03-19
Agentic Workflow是什么意思
Agentic Workflow 指的是一种在生成式 AI 的人机协同中,通过不同模式(如 Embedding、Copilot、Agent)下的角色协作流程来完成任务的方式。 在 Agent 模式中,AI 完成大多数工作。它使用 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作。例如,作为产品经理,可将产品功能设计任务拆解为多个独立任务,遵循不同工作流,生成初步结果后再修改。 Agentic Workflow 还通过学会调用外部不同类型 API 来获取模型缺少的额外信息等。其动作的决策需要根据大模型结合问句、上下文规划、各类工具来确定。 从提升效率、提高质量、节省时间的角度思考,Agentic Workflow 可以将复杂任务分解成较小步骤,融入更多人类参与的规划与定义,减少对 Prompt Engineering 和模型推理能力的依赖,提高 LLM 应用面向复杂任务的性能。 吴恩达通过开源项目 ChatDev 举例,让大语言模型扮演不同角色相互协作开发应用或复杂程序。AI Agent 的基本框架包括“LLM +规划+记忆+工具使用”,其中 LLM 扮演“大脑”,规划包括子目标分解、反思与改进,记忆分为短期和长期,工具用于辅助完成任务。
2024-08-30
Agentic Workflow是什么
Agentic Workflow 是一种基于 AI 的工作流管理方式,它可以帮助人们更高效地完成各种任务。以下是关于 Agentic Workflow 的一些介绍: 1. 专家代理:Agentic Workflow 中的专家代理是指具有特定领域和工具专长的 AI 模型,它们能够以步骤化、理性的方式帮助用户达成目标。 2. 工作流程:Agentic Workflow 的工作流程通常包括收集信息、初始化专家代理、持续支持用户直到目标完成等步骤。 3. Tool Use:Tool Use 是指 Agent 通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。 4. Planning:Agent 通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。 5. Multiagent Collaboration:通过学会调用外部不同类型 API 来获取模型(通常在预训练后很难修改)中缺少的额外信息,代码执行能力,访问专有信息源等(例如获取此时此刻的天气、联网网搜索等)。 6. Action(动作):根据上述大模型结合问句(Query)、上下文的规划(Context)、各类工具,最终大模型才能决策出最终需要执行的动作是什么。 7. Productivity(效率):Agentic Workflow 通过将一个复杂的任务分解成较小的步骤,在整个过程中中融入了更多人类参与到流程中的规划与定义。它减少了对 Prompt Engineering 和模型推理能力的依赖,提高了 LLM 应用面向复杂任务的性能,更丰富、更精确。 总的来说,Agentic Workflow 是一种将 AI 技术应用于工作流管理的方式,它可以帮助人们更高效地完成各种任务。
2024-05-29
公共议题:AI如何助力HR业务? 研讨目标: 深入理解:深入探讨 AI在人力资源管理领域的应用、薪酬管理、员工关系、公司文化、包括人才获取与配置、学习与发展、组织与人才培、HR共享与HRIS等各模块的可应用场景 机会识别与场景落地:基于组织现状,识别出业务价值高、可落地的 A 应用场景; 研讨成果(输出物): 请输出10个业务价值高、具备可行性的AI应用场景介绍,并说明what(场景是什么)、why(为什么值得做)、How(如何落地);
以下是为您生成的 10 个业务价值高、具备可行性的 AI 应用场景介绍: 1. 人才招聘与筛选 What:利用 AI 技术对求职者的简历进行自动筛选和分析,评估其与岗位的匹配度。 Why:节省 HR 大量的时间和精力,提高招聘效率和准确性。 How:通过自然语言处理和机器学习算法,训练模型识别关键信息和技能。 2. 员工培训与发展 What:根据员工的技能水平和职业发展目标,定制个性化的培训计划。 Why:提升员工的能力和绩效,增强员工对企业的忠诚度。 How:利用大数据分析员工的工作表现和学习需求,推荐相关课程和学习资源。 3. 薪酬福利管理 What:运用 AI 预测市场薪酬趋势,为企业制定合理的薪酬策略。 Why:保持企业薪酬的竞争力,吸引和留住优秀人才。 How:收集和分析行业薪酬数据,结合企业的财务状况和战略目标进行优化。 4. 员工绩效评估 What:借助 AI 实时监测员工的工作表现,提供客观的绩效评估。 Why:减少人为偏差,确保评估的公正性和准确性。 How:利用工作流程数据和行为分析模型进行评估。 5. 员工关系管理 What:通过 AI 分析员工的情绪和满意度,及时发现问题并解决。 Why:营造良好的工作氛围,提高员工的工作积极性和创造力。 How:使用情感分析技术处理员工的反馈和交流信息。 6. 组织架构优化 What:利用 AI 分析企业的业务流程和人员配置,提供组织架构调整建议。 Why:提高企业的运营效率和灵活性,适应市场变化。 How:基于数据分析和模拟优化算法进行评估和推荐。 7. 人力资源规划 What:根据企业的战略目标和业务发展预测人力资源需求。 Why:提前做好人才储备和招聘计划,保障企业的正常运营。 How:运用数据分析和预测模型进行规划。 8. 企业文化传播 What:使用 AI 生成个性化的企业文化宣传内容,提高传播效果。 Why:增强员工对企业文化的认同感和归属感。 How:利用自然语言生成技术和个性化推荐算法。 9. 智能客服 What:在 HR 服务中引入 AI 客服,解答员工常见问题。 Why:快速响应员工需求,提高服务质量。 How:训练智能客服模型,涵盖常见的 HR 问题和解决方案。 10. 人才库管理 What:利用 AI 对人才库进行分类和更新,提高人才库的利用效率。 Why:方便快速找到合适的人才,降低招聘成本。 How:运用数据挖掘和分类算法进行管理。
2025-04-14
公共议题:AI如何助力HR业务? 研讨目标: 深入理解:深入探讨 AI在人力资源管理领域的应用、薪酬管理、员工关系、公司文化、包括人才获取与配置、学习与发展、组织与人才培、HR共享与HRIS等各模块的可应用场景 机会识别与场景落地:基于组织现状,识别出业务价值高、可落地的 A 应用场景; 研讨成果(输出物): 请输出3-5个业务价值高、具备可行性的AI应用场景介绍,并说明what(场景是什么)、why(为什么值得做)、How(如何落地);
以下是为您提供的 3 个业务价值高、具备可行性的 AI 应用场景介绍: 场景一:AI 在企业招聘中的应用 What:利用 AI 技术进行简历筛选、人才匹配和面试评估。 Why:能够快速处理大量简历,提高招聘效率和准确性,节省人力和时间成本,同时更精准地找到符合岗位需求的人才。 How:通过引入相关的 AI 招聘软件,与企业现有的招聘系统集成,对简历进行关键词提取和分析,利用机器学习算法进行人才匹配,并通过视频面试中的语音和表情分析辅助评估候选人。 场景二:AI 助力个性化人力资源管理 What:根据员工的个人特点和工作表现,提供个性化的培训计划、职业发展建议和绩效评估。 Why:能够充分发挥员工的潜力,提高员工满意度和忠诚度,促进企业的长期发展。 How:收集员工的工作数据、学习记录和绩效表现等信息,运用 AI 算法进行分析和预测,为员工制定专属的发展方案,并通过移动应用或内部系统向员工推送相关建议和培训课程。 场景三:AI 打造无人值守的 HR 平台 What:实现 HR 业务的自动化处理,如员工请假审批、薪酬计算和福利发放等。 Why:减少人工操作的错误和繁琐流程,提高 HR 工作的效率和准确性,使 HR 人员能够专注于更有价值的战略工作。 How:整合企业内部的各种 HR 系统和数据,利用 RPA 和 AI 技术实现流程的自动化,同时建立监控和预警机制,确保平台的稳定运行。
2025-04-14
How do children edit games with AI?
以下是一个用国产 AI 为孩子开发游戏的案例教程中的开发过程: 1. 元素设计: 狼:图片放进去,调整大小。 栅栏:图片放进去,调整大小。 洞:调整背景颜色,让 AI 提供,改进背景颜色。 槌子:点一下转动,最初 AI 给的代码未实现动画效果,简化为点一下马上旋转 90 度,放开时恢复,点击时洞的高度变短。 羊:生成 20 只羊时出现重叠问题,让 AI 调整每只羊间隔 10PX。控制羊的移动花费较多时间,重写多轮。 2. 图片生成: 直接让智普生成羊、狼、锤子、栅栏、胜利图片、失败图片。其中羊、狼、锤子、栅栏生成无背景的,用 PS 做成透明 PNG。栅栏生成多次以选择合适的效果,胜利和失败图片因 AI 无法理解需求生成多次。 3. 框架搭建: 让 AI 生成 HTML 的大框架,验证元素摆放位置,生成的 HTML 代码简洁符合期待,CSS 结构不错但 position 定位模式不对,修改为 position:fixed 修复 BUG。 4. 效果实现: 失败判断在羊的跑的动作中实现,羊跑光显示失败图像。 胜利判断在槌子事件中,洞全部修好即胜利。 第二关:胜利时多一个步骤跳转到第二页,复制代码并修改,如加入长相凶狠的狼,用 AI 作图。 5. 完成与测试: 2024 年 5 月 11 日 17:34:04 完成所有内容并上传服务器测试,存在小 BUG 但先凑合用。 需要注意的是,AI 生成的内容可能有 90%能用,但仍有 10%需要人工调整,多轮干预可能是必要的,AI 只是辅助,学习和专家指导仍很重要。
2025-02-23