以下是一些好用的购物推荐的 AI Agent:
此外,智谱的 AutoGLM 经过深度测试,展现出了较好的场景理解能力,如能准确区分“帮我买一杯咖啡”和“帮我买一包咖啡豆”并打开相应应用,但目前离好用还有一定距离,存在语音识别偏差、复杂界面操作稳定性待提升、只支持安卓等问题。
Cursor 虽然免费版只有 chat 功能,但其中的 Agent 功能只要给一个模糊指令,就会自动规划和解决问题。Cline 作为一个 AI 助手,能力有保障,长期霸榜 OpenRouter token 消耗榜,新版本还推出检查点功能。实际体验中,DeepSeek-V3 和 Gemini 2.0 Flash Thinking 可作为不错的候选。
?Auto-GPT GUIAuto-GPT的GUI开放了waitlist,可在下方注册??https://news.agpt.co/⛓️MULTI·ON plugin by MULTI·ON今年2月,我开始使用MULTI·ON——在插件和代理之前,这个由AI驱动的工具已经实现了在笔记本电脑上自动执行许多任务,非常酷(当然也有点可怕)。现在MULTI·ON宣布开发了一个ChatGPT插件,根据演示,它的功能看起来非常强大——如果OpenAI批准了这个应用(现在可以称这些插件为应用程序了吧?!),那么它可能会成为能力超群的个人网络浏览器/任务执行器,如果与目前的一些AI代理结合,还可能会更酷!?https://www.multion.ai/?Demo-https://twitter.com/DivGarg9/status/1648394059483054081?BabyBeeAGI由Yohei本人开发的一个有缺陷、速度较慢但功能更强大的BabyAGI mod。具体来说,拥有更强的任务管理、依赖任务、工具、适应性和集成能力,适合处理更多更复杂的任务,但需要更高的计算能力。?https://replit.com/@YoheiNakajima/BabyBeeAGI?v=1?MiniAGI基于GPT-3.5-Turbo/4的最小通用自主代理,只保留了最简单实用的功能,但缺点是没有长时记忆(即不能通过长时间使用成为更个性化的工具),目前可以执行的任务包括但不限于创建游戏、分析股票价格、进行网络安全测试、创作艺术品、总结文档和...订比萨。另外,MiniAGI还可以开启批评(critic)模式,额外请求API以提高任务完成的准确性。?https://github.com/muellerberndt/mini-agi
经过几天的深度测试,AutoGLM给我留下了深刻的印象。它让我看到了AI Agent真正落地的希望。还记得一年前,当我第一次尝试开发类似功能时,遇到的种种困境:API对接难、多模态识别差、操作不精准...这些问题让人觉得AI Agent离真正可用还很遥远。但AutoGLM用一种巧妙的方式解决了这些难题。它没有执着于传统的API集成路线,而是借助RPA的思路,通过模拟人类操作来实现跨应用的控制。这种方案虽然不完美,但确实让AI Agent从实验室走向了现实。在测试过程中,最让我惊喜的是它的场景理解能力。当我说"帮我买一杯咖啡"和"帮我买一包咖啡豆"时,它能准确地分别打开美团和淘宝。这不是简单的规则匹配能力可以实现的。它展现出了真正的智能理解能力,能够根据用户意图选择最合适的应用场景。当然,AutoGLM现在离好用还差很长的路。语音识别有时会出现偏差,复杂界面下的操作稳定性还需提升,只支持安卓也限制了不少用户。但这些都是可以通过技术迭代来解决的问题。重要的是,它已经证明了AI Agent落地是可行的。我特别欣赏智谱团队的产品思路。他们没有一上来就追求全能,而是选择了几个高频场景深耕细作。点外卖、写点评、看公众号,这些看似简单的日常操作,背后其实涉及复杂的技术难题。能把这些场景做好,已经足够证明产品的价值。展望未来,我觉得AutoGLM的发展空间还很大。随着多模态理解能力的提升,支持场景会越来越丰富;随着操作精准度的提高,用户体验会越来越自然。它的出现,或许会改变我们与手机交互的方式,就像当年第一款智能手机改变了我们的生活一样。
虽然现在已经有全系大模型之力了,但免费版的Cursor只有chat功能,相当于你在侧边栏加了个大模型对话界面,生成出来的代码还要自己复制黏贴,相当不智能。要说Cursor有啥核心功能,我相信Yolo模式、Agent、Tab代码自动补全绝对能排上号。Agent和提示词的差别在于你只要给Agent一个模糊的指令,不需要把上下文交代清楚,它会自动帮你去规划、去解决问题。再聊聊Yolo模式和Agent,它们的共同点是允许用户通过自动化的方式一次性完成一系列操作,而它们之间核心区别是Agent的执行过程中需要用户确认,Yolo是一路绿灯,直接告诉你执行结果。上一步安装的cline可不只是为了给openrouter腾位置,Cline的定位是一个AI助手,而且Cline的能力是有保障的。从它长期霸榜OpenRouter token消耗榜就能看出大家对它的喜爱了。新版本的Cline还推出了检查点功能,将Agent执行前后的状态保存起来。也就是说你还可以收获一个平替的Yolo模式,让模型大胆去做,我随时可以恢复上一步。从官方教程上看,它的效果一定程度依赖于Claude Sonnet 3.5的能力。但实际体验下来DeepSeek-V3和Gemini 2.0 Flash Thinking能够作为相当不错的候选。这时候支持全系模型的优点也来了,根本不愁缺模型用。