Chat with Wiki - 一个尽可能完美的AGI时代的多Agents协同工作平台应该具备怎样的能力设计？

Answer

一个尽可能完美的 AGI 时代的多 Agents 协同工作平台通常应具备以下能力设计：

融合 RL（强化学习）与 LLM（大型语言模型）思想：在多 Agent 情境下，形成复杂多轮会话及协作行动过程，为系统二进行大规模的过程学习提供路径。同时，LLM 能从 RL 过程中习得新的、足够新颖的策略，例如像 AlphaGO 那样通过自博弈创新策略并快速反馈奖励，最终达成任务目标。
具备多项优势：
- 适配国内外主流开源及闭源大语言模型，支持多模型混合使用，构建企业级场景服务生态，提供场景化解决方案。
- 拥有灵活可视化无代码应用构建、Text-to-Agent 技术，构建便捷，上手简单，操作高效。
- 能够即时发布上线，支持发布为网页/小程序/API 等多种形态，快速部署 Agent 应用。
- 提供企业级安全访问控制，依据 Agent 权限控制数据访问，通信过程加密，防止数据泄露风险。
- 支持多 Agents 协作，构建知识工作者的人机协作流水线，满足复杂业务场景需求。
允许使用自然语言制定 Agent 及其交互规则，并引入低延时的 Realtime API：即使没有专业编程技能，只要能用清晰的自然语言描述出各个 Agents 具备的行为和功能，就可以快速制作多 Agents 应用或创建代理式工作流。例如在一个简单场景中，可设置接待员和写诗的 Agents 并实现交互。

Content generated by AI large model, please carefully verify (powered by aily)

References

①在Muti-Agent情境下，我们形成了复杂多轮会话以及协作行动过程，是的「过程数据」，是否意味着我们为系统二进行有效大规模的过程学习提供了一条路径，虽然在Muti-Agent下，每一步agent的交互协作均是其背后驱动的LLMs依据原有内化的知识来进行决策的，但我们发现通过多轮复杂决策生成的过程性内容记录，其数据整体所呈现出的语言结构与模型之前用来进行预训练或SFT的数据样本的整体分布和构象有着较大的不同，因此这种数据样本分布的不同对于模型来说也会必然捕捉到这种分布并加以学习，即过程学习，也是一种新策略的学习；②针对RL能否对LLMs起到增强和提升，主要取决于LLMs能否从RL过程中习得新的策略，新的策略的另外一种判别就是其新策略的生成不依赖于历史数据样本以及模型依据自身知识和泛化能力推理生成的内容，即足够新颖，如AlphaGO在训练过程后期就不会再依赖人类历史先前的棋局来进行参考，而是通过自博弈的方式快速创新着子策略，并快速反馈奖励，而AlphaGO最终的目标是赢得棋局；因此，从另一种RL运行模式的视角完整的来看，Muti-Agent在得到一个复杂的任务后（任务目标），是否每一次的Agent交互也是在像围棋着子一样在进行策略的尝试与搜索（注意：而这种每小一步的探索或者尝试可能是依据于上下文背景或者子目标的，而非整体目标！这意味着，从宏观目标上来看，这便是对于整体目标出现了新的泛化方向的尝试，不管这种未知的泛化在未来期间所呈现的过程、形态是什么，这里的泛化导向因受muti-agent影响，应该是朝着多步骤决策方向去的呼应①），而对于这个Muti-Agent来说，其最终奖励即是其最终任务结果达成目标。

受邀参加了智谱 AI Z Demo Day，让我再一次相信 AGI！

公司的核心产品是以自研Multi-Agent架构为基础的企业级AI Agent平台——“灵搭”平台，“灵搭”平台结合了大语言模型技术、检索增强生成技术、Multi-Agent技术等，能够理解并处理复杂的企业业务需求，提供企业场景化的Autonomous Agent、AI Copilot、Autopilot等解决方案。“灵搭”平台具有以下多项优势：-平台适配国内外主流开源及闭源大语言模型，支持多模型混合使用，构建企业级场景服务生态，为各类政企、行业客户等提供场景化解决方案；-灵活可视化无代码应用构建、Text-to-Agent技术，构建更便捷，上手更简单，操作更高效；-即时发布上线，支持发布为网页/小程序/API等多种形态，分钟内部署Agent应用；-企业级安全访问控制，依据Agent权限控制数据访问，通信过程加密，避免数据泄露风险-支持多Agents协作，构建知识工作者的人机协作流水线，满足复杂业务场景需求商业模式：我们已与阿里云、腾讯云、火山引擎、华为政企、智谱AI等企业达成深度合作，共同利用大语言模型为企业提供创新动力；主要服务电力能源行业，成功落地电网智能客服、合同审核、资讯助手、电网安全调度助手、故障报告生成等应用场景，赋能企业AI新范式。中财数碳项目简介基于内容增强型知识插槽技术的大模型应用服务商，主要落地场景包括双碳、财金等领域，已经落地多个应用场景，产品具有明显的价格优势。项目陈述

OpenAI又开源了！不用代码就能构建复杂多Agents实时语音协作系统

在以前，我们知道，要制定一个Agent、搭建多Agents应用、实现多Agents之间的交互，往往需要复杂的编程知识和大量的开发工作，比如MetaGPT、CrewAI、XAgent、微软的AutoGen。你不仅要精通各种编程语言、开发环境搭建，还需要对Agent规则制定等方面有一定的了解。而这个项目最大的亮点在于，它允许你使用自然语言来制定Agent以及它们之间的交互规则，并且引入了低延时的Realtime API。所以也就有了上面官方的承诺，20分钟构建一个多Agents实时语音应用。也就是说，即使你没有专业的编程技能，只要你能用清晰的自然语言描述出你想要的各个Agents具备的行为和功能，你就可以快速制作一个多Agents应用，或者是创建一个代理式工作流，一个工作流中的每个节点都有一个特定的Agent待命。好家伙，有嘴就行？话不多说，让我们先看一下官方提供的示例：在这个简单场景里，一共有两个Agent。一个叫greeter，可以理解为系统的接待员；另一个叫haiku，是一个专门写三行俳（pái）句诗（日本的一种古典短诗）的Agent。连接这个系统：1.接待员Agent greeter就会过来招呼你，问你是否需要来首俳句诗？2.你回答是的。3.这时候应用就切换到写诗的Agent haiku，向你打招呼，只要提供一个主题，它就可以为你写诗（上来第一件事就是为你写诗，有点子浪漫）。4.你回答AGI。5.于是，它就写下了上面的诗。那么，这个浪漫的系统是怎么定制的呢？其实只需要3步：