与知识库对话 - 购物推荐的aiagent 目前有好用的吗

回答

以下是一些好用的购物推荐的 AI Agent：

Auto-GPT GUI：其 GUI 已开放 waitlist，可在 https://news.agpt.co/ 注册。
MULTI·ON plugin by MULTI·ON：今年 2 月开始使用，能在笔记本电脑上自动执行许多任务。现开发了 ChatGPT 插件，功能强大。链接：https://www.multion.ai/ ，演示：https://twitter.com/DivGarg9/status/1648394059483054081 。
BabyBeeAGI：由 Yohei 本人开发，有更强的任务管理等能力，但速度较慢，适合处理复杂任务。链接：https://replit.com/@YoheiNakajima/BabyBeeAGI?v=1 。
MiniAGI：基于 GPT-3.5-Turbo/4 的最小通用自主代理，保留简单实用功能，可执行多种任务，如订比萨。链接：https://github.com/muellerberndt/mini-agi 。

此外，智谱的 AutoGLM 经过深度测试，展现出了较好的场景理解能力，如能准确区分“帮我买一杯咖啡”和“帮我买一包咖啡豆”并打开相应应用，但目前离好用还有一定距离，存在语音识别偏差、复杂界面操作稳定性待提升、只支持安卓等问题。

Cursor 虽然免费版只有 chat 功能，但其中的 Agent 功能只要给一个模糊指令，就会自动规划和解决问题。Cline 作为一个 AI 助手，能力有保障，长期霸榜 OpenRouter token 消耗榜，新版本还推出检查点功能。实际体验中，DeepSeek-V3 和 Gemini 2.0 Flash Thinking 可作为不错的候选。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

4月动态｜78个AI新产品

?Auto-GPT GUIAuto-GPT的GUI开放了waitlist，可在下方注册??https://news.agpt.co/⛓️MULTI·ON plugin by MULTI·ON今年2月，我开始使用MULTI·ON——在插件和代理之前，这个由AI驱动的工具已经实现了在笔记本电脑上自动执行许多任务，非常酷（当然也有点可怕）。现在MULTI·ON宣布开发了一个ChatGPT插件，根据演示，它的功能看起来非常强大——如果OpenAI批准了这个应用（现在可以称这些插件为应用程序了吧？！），那么它可能会成为能力超群的个人网络浏览器/任务执行器，如果与目前的一些AI代理结合，还可能会更酷！?https://www.multion.ai/?Demo-https://twitter.com/DivGarg9/status/1648394059483054081?BabyBeeAGI由Yohei本人开发的一个有缺陷、速度较慢但功能更强大的BabyAGI mod。具体来说，拥有更强的任务管理、依赖任务、工具、适应性和集成能力，适合处理更多更复杂的任务，但需要更高的计算能力。?https://replit.com/@YoheiNakajima/BabyBeeAGI?v=1?MiniAGI基于GPT-3.5-Turbo/4的最小通用自主代理，只保留了最简单实用的功能，但缺点是没有长时记忆（即不能通过长时间使用成为更个性化的工具），目前可以执行的任务包括但不限于创建游戏、分析股票价格、进行网络安全测试、创作艺术品、总结文档和...订比萨。另外，MiniAGI还可以开启批评（critic）模式，额外请求API以提高任务完成的准确性。?https://github.com/muellerberndt/mini-agi

【智谱AutoGLM】深度体验报告及原理分析

经过几天的深度测试，AutoGLM给我留下了深刻的印象。它让我看到了AI Agent真正落地的希望。还记得一年前，当我第一次尝试开发类似功能时，遇到的种种困境：API对接难、多模态识别差、操作不精准...这些问题让人觉得AI Agent离真正可用还很遥远。但AutoGLM用一种巧妙的方式解决了这些难题。它没有执着于传统的API集成路线，而是借助RPA的思路，通过模拟人类操作来实现跨应用的控制。这种方案虽然不完美，但确实让AI Agent从实验室走向了现实。在测试过程中，最让我惊喜的是它的场景理解能力。当我说"帮我买一杯咖啡"和"帮我买一包咖啡豆"时，它能准确地分别打开美团和淘宝。这不是简单的规则匹配能力可以实现的。它展现出了真正的智能理解能力，能够根据用户意图选择最合适的应用场景。当然，AutoGLM现在离好用还差很长的路。语音识别有时会出现偏差，复杂界面下的操作稳定性还需提升，只支持安卓也限制了不少用户。但这些都是可以通过技术迭代来解决的问题。重要的是，它已经证明了AI Agent落地是可行的。我特别欣赏智谱团队的产品思路。他们没有一上来就追求全能，而是选择了几个高频场景深耕细作。点外卖、写点评、看公众号，这些看似简单的日常操作，背后其实涉及复杂的技术难题。能把这些场景做好，已经足够证明产品的价值。展望未来，我觉得AutoGLM的发展空间还很大。随着多模态理解能力的提升，支持场景会越来越丰富；随着操作精准度的提高，用户体验会越来越自然。它的出现，或许会改变我们与手机交互的方式，就像当年第一款智能手机改变了我们的生活一样。

4款插件2个API，我把Cursor“迭代”成了满血超频版程序员

虽然现在已经有全系大模型之力了，但免费版的Cursor只有chat功能，相当于你在侧边栏加了个大模型对话界面，生成出来的代码还要自己复制黏贴，相当不智能。要说Cursor有啥核心功能，我相信Yolo模式、Agent、Tab代码自动补全绝对能排上号。Agent和提示词的差别在于你只要给Agent一个模糊的指令，不需要把上下文交代清楚，它会自动帮你去规划、去解决问题。再聊聊Yolo模式和Agent，它们的共同点是允许用户通过自动化的方式一次性完成一系列操作，而它们之间核心区别是Agent的执行过程中需要用户确认，Yolo是一路绿灯，直接告诉你执行结果。上一步安装的cline可不只是为了给openrouter腾位置，Cline的定位是一个AI助手，而且Cline的能力是有保障的。从它长期霸榜OpenRouter token消耗榜就能看出大家对它的喜爱了。新版本的Cline还推出了检查点功能，将Agent执行前后的状态保存起来。也就是说你还可以收获一个平替的Yolo模式，让模型大胆去做，我随时可以恢复上一步。从官方教程上看，它的效果一定程度依赖于Claude Sonnet 3.5的能力。但实际体验下来DeepSeek-V3和Gemini 2.0 Flash Thinking能够作为相当不错的候选。这时候支持全系模型的优点也来了，根本不愁缺模型用。