Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

让AI帮我操作电脑

Answer

目前在让 AI 操作电脑方面,有以下相关信息:

  • 去年夏天在处理自动备份配置脚本的任务中,尽管对运维领域不熟悉且编写 Shell 脚本遇到困难,但 AI 可以作为很好的教练,通过请教如“请告诉我 rclone 命令的用法”“Shell 里面的循环怎么写”等具体问题,AI 能提供解决方案,甚至写出带详细中文注释的代码。
  • 4 月动态中有一些相关的 AI 新产品,如 Auto-GPT GUI 开放了 waitlist,MULTI·ON plugin 能在笔记本电脑上自动执行许多任务,BabyBeeAGI 有更强的任务管理等能力,MiniAGI 基于 GPT-3.5-Turbo/4 能执行多种任务。
  • 生成式 AI Studio 中,可定义场景让 AI 响应特定查询,如设定名字和身份后对 help desk 查询做出特定回应。还提到 Google 提供了 API 和 SDK 帮助构建应用程序,以及调整语言模型以提高响应质量,提示的设计会影响模型结果,但制作提示可能存在一定难度。
Content generated by AI large model, please carefully verify (powered by aily)

References

放下傲慢!停止自欺欺人!与其做 AI 的主人,不如做它的搭档

去年夏天,偶然有人请我们写一个自动备份配置的脚本。具体情况是:有若干台不同操作系统的服务器(Ubuntu,Debian)每个服务器上运行一些应用(基于Podman部署,但没有使用k 8 s)需要备份到云盘中,且定期清理当时,我们对运维领域不太熟悉(也就是没吃过苦、没背过锅的意思),想着这应该不难,就决定挑战一下Shell脚本。虽然事情不紧急,但还是花了断断续续的时间。我们花了大量时间熟悉Shell的语法和一些特殊用法。本以为Shell简单易上手,可以速战速决,结果却事与愿违,代码不仅难写,还不易交接给他人。这时,AI的作用就体现出来了,它可以教我们如何完成任务。虽然在过程中,我们并没有完全依赖AI来实现代码,但AI确实是很好的教练。我说你听的典型例子:请教AI具体问题:“请告诉我rclone命令的用法。”“Shell里面的循环怎么写?”“如何遍历一个文件夹的所有文件?”“如何让Shell输出的内容显示为绿色?”“如何让一个脚本每天自动运行?”其实,大多数人没必要真的深入了解Shell的语法,只需告诉AI你的目标即可,AI会提供解决方案。从结果来看,AI不仅写出了代码,还给出了详细的中文注释,帮助我们理解逻辑。即使代码部分看不太懂,光看注释也能大致了解。当然,我们也可以直接问AI有没有现成的工具推荐,或者干脆找专业的人来完成任务。

4月动态|78个AI新产品

? Auto-GPT GUIAuto-GPT的GUI开放了waitlist,可在下方注册?? https://news.agpt.co/⛓️ MULTI·ON plugin by MULTI·ON今年2月,我开始使用MULTI·ON ——在插件和代理之前,这个由AI驱动的工具已经实现了在笔记本电脑上自动执行许多任务,非常酷(当然也有点可怕)。现在MULTI·ON宣布开发了一个ChatGPT插件,根据演示,它的功能看起来非常强大——如果OpenAI批准了这个应用(现在可以称这些插件为应用程序了吧?!),那么它可能会成为能力超群的个人网络浏览器/任务执行器,如果与目前的一些AI代理结合,还可能会更酷!? https://www.multion.ai/? Demo - https://twitter.com/DivGarg9/status/1648394059483054081? BabyBeeAGI由Yohei本人开发的一个有缺陷、速度较慢但功能更强大的BabyAGI mod。具体来说,拥有更强的任务管理、依赖任务、工具、适应性和集成能力,适合处理更多更复杂的任务,但需要更高的计算能力。? https://replit.com/@YoheiNakajima/BabyBeeAGI?v=1? MiniAGI基于GPT-3.5-Turbo/4的最小通用自主代理,只保留了最简单实用的功能,但缺点是没有长时记忆(即不能通过长时间使用成为更个性化的工具),目前可以执行的任务包括但不限于创建游戏、分析股票价格、进行网络安全测试、创作艺术品、总结文档和...订比萨。另外,MiniAGI还可以开启批评(critic)模式,额外请求API以提高任务完成的准确性。? https://github.com/muellerberndt/mini-agi

9. 生成式 AI Studio 简介

10:32或响应格式。每次向模型发送请求时都会应用上下文。举个简单的例子,你可以定义一个场景,告诉AI如何响应help desk10:42查询。你的名字是罗伊。您是IT部门的技术支持人员。你只会回应“你试过把它关掉然后再打开吗?”任何查询。10:52可以在右边调参数,和设计提示时一样。要查看它是如何工作的,您可以在聊天框中键入我的电脑速度很慢,然后按回车键。11:02AI回应:你试过关掉它然后再打开吗?就像您告诉AI做的那样。很酷的是,Google提供了API和SDK来帮助您构建自己的应用程序。11:15您只需单击查看代码即可。首先,您需要下载适合您的编程语言(例如Python和Curl)的Vertex AI SDK。SDK代表软件设计工具包。11:26他们实现功能并为您完成工作。您可以像从代码中调用库一样使用它们。然后,您按照示例代码和API,将代码插入到您的应用程序中。11:38现在让我们看一下第三个特性,调整一个语言模型。如果您一直在使用大型语言模型制作原型,您可能想知道是否有一种方法可以提高响应质量,而不仅仅是提示设计。11:48因此,让我们学习如何调整大型语言模型以及如何从Generative AI Studio启动调整作业。快速回顾一下,提示是您传递给模型的文本输入。11:59您的提示可能看起来像一条指令……也许您会添加一些示例……然后将此文本发送到模型,以便它采用您想要的行为。12:09及时的设计允许快速试验和定制。而且由于您没有编写任何复杂的代码,因此您无需成为ML专家即可开始使用。但是制作提示可能很棘手。12:20措辞或词序的微小变化可能会以无法完全预测的方式影响模型结果。而且您无法真正将所有那么多示例放入提示中。

Others are asking
有哪些直接可以操作电脑的AI
以下是一些可以直接操作电脑的 AI: XiaoHu.AI 能通过图形用户界面操作电脑,执行如订餐、网购、填写表单等复杂任务。其功能亮点包括视觉感知(解析屏幕像素数据,理解状态)、推理规划(通过“思维链”技术动态调整任务计划)、操作执行(使用虚拟鼠标键盘完成任务)。但当前仅对美国 Pro 用户开放测试,未来将扩展更多任务场景。相关链接:https://www.xiaohu.ai/c/xiaohuai/openail3operator 。 此外,还有一些能联网检索的 AI: ChatGPT Plus 用户现在可以开启 web browsing 功能,实现联网功能。 Perplexity 结合了 ChatGPT 式的问答和普通搜索引擎的功能,允许用户指定希望聊天机器人在制定响应时搜索的源类型。 Bing Copilot 作为一个 AI 助手,旨在简化您的在线查询和浏览活动。 还有如 You.com 和 Neeva AI 等搜索引擎,它们提供了基于人工智能的定制搜索体验,并保持用户数据的私密性。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-08
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20