Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有哪些直接可以操作电脑的AI

Answer

以下是一些可以直接操作电脑的 AI:

  • XiaoHu.AI 能通过图形用户界面操作电脑,执行如订餐、网购、填写表单等复杂任务。其功能亮点包括视觉感知(解析屏幕像素数据,理解状态)、推理规划(通过“思维链”技术动态调整任务计划)、操作执行(使用虚拟鼠标键盘完成任务)。但当前仅对美国 Pro 用户开放测试,未来将扩展更多任务场景。相关链接:https://www.xiaohu.ai/c/xiaohu-ai/openai-l3-operator 。

此外,还有一些能联网检索的 AI:

  • ChatGPT Plus 用户现在可以开启 web browsing 功能,实现联网功能。
  • Perplexity 结合了 ChatGPT 式的问答和普通搜索引擎的功能,允许用户指定希望聊天机器人在制定响应时搜索的源类型。
  • Bing Copilot 作为一个 AI 助手,旨在简化您的在线查询和浏览活动。
  • 还有如 You.com 和 Neeva AI 等搜索引擎,它们提供了基于人工智能的定制搜索体验,并保持用户数据的私密性。

需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。

Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

能通过图形用户界面操作电脑,执行复杂任务,如订餐、网购、填写表单等。功能亮点:视觉感知:解析屏幕像素数据,理解状态。推理规划:通过“思维链”技术动态调整任务计划。操作执行:使用虚拟鼠标键盘完成任务。当前仅对美国Pro用户开放测试,未来将扩展更多任务场景。?[https://www.xiaohu.ai/c/xiaohu-ai/openai-l3-operator](https://www.xiaohu.ai/c/xiaohu-ai/openai-l3-operator)

XiaoHu.AI日报

能通过图形用户界面操作电脑,执行复杂任务,如订餐、网购、填写表单等。功能亮点:视觉感知:解析屏幕像素数据,理解状态。推理规划:通过“思维链”技术动态调整任务计划。操作执行:使用虚拟鼠标键盘完成任务。当前仅对美国Pro用户开放测试,未来将扩展更多任务场景。?[https://www.xiaohu.ai/c/xiaohu-ai/openai-l3-operator](https://www.xiaohu.ai/c/xiaohu-ai/openai-l3-operator)

问:有没有能联网检索的AI?

是的,存在能联网检索的AI。这些AI通过连接互联网,实时搜索、筛选并整合所需数据,以提供给用户更精准和个性化的信息。例如,ChatGPT Plus用户现在可以开启web browsing功能,实现联网功能。Perplexity,它结合了ChatGPT式的问答和普通搜索引擎的功能,允许用户指定希望聊天机器人在制定响应时搜索的源类型。Bing Copilot,作为一个AI助手,旨在简化您的在线查询和浏览活动。还有如You.com和Neeva AI等搜索引擎,它们提供了基于人工智能的定制搜索体验,并保持用户数据的私密性。这些AI搜索工具的出现,标志着在信息检索领域的一个重要发展,它们通过结合AI技术和搜索引擎,大幅提升了数据集命中预期,并为实际应用带来了更多可能性。内容由AI大模型生成,请仔细甄别。

Others are asking
让AI帮我操作电脑
目前在让 AI 操作电脑方面,有以下相关信息: 去年夏天在处理自动备份配置脚本的任务中,尽管对运维领域不熟悉且编写 Shell 脚本遇到困难,但 AI 可以作为很好的教练,通过请教如“请告诉我 rclone 命令的用法”“Shell 里面的循环怎么写”等具体问题,AI 能提供解决方案,甚至写出带详细中文注释的代码。 4 月动态中有一些相关的 AI 新产品,如 AutoGPT GUI 开放了 waitlist,MULTI·ON plugin 能在笔记本电脑上自动执行许多任务,BabyBeeAGI 有更强的任务管理等能力,MiniAGI 基于 GPT3.5Turbo/4 能执行多种任务。 生成式 AI Studio 中,可定义场景让 AI 响应特定查询,如设定名字和身份后对 help desk 查询做出特定回应。还提到 Google 提供了 API 和 SDK 帮助构建应用程序,以及调整语言模型以提高响应质量,提示的设计会影响模型结果,但制作提示可能存在一定难度。
2024-11-13
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
Ai在设备风控场景的落地
AI 在设备风控场景的落地可以从以下几个方面考虑: 法律法规方面:《促进创新的人工智能监管方法》指出,AI 的发展带来了一系列新的安全风险,如对个人、组织和关键基础设施的风险。在设备风控中,需要关注法律框架是否能充分应对 AI 带来的风险,如数据隐私、公平性等问题。 趋势研究方面:在制造业中,AI Agent 可用于生产决策、设备维护、供应链协调等。例如,在工业设备监控与预防性维护中,Agent 能通过监测传感器数据识别异常模式,提前通知检修,减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面,AI Agent 也能发挥重要作用,实现生产的无人化、决策的数据化和响应的实时化。
2025-04-20
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
我想找一个可以把服装图片用ai的方式直接‘穿’在另一张图片的模特身上
以下是两种可以将服装图片用 AI 的方式“穿”在另一张图片的模特身上的方法: 方法一:使用 ComfyUI GeminiAPI 1. 在 Google 的 AI Studio 申请一个 API key(需要网络环境),有免费的额度,网址为:https://aistudio.google.com/apikey?hl=zhcn 。 2. 安装相关依赖,根据使用的情况选择手动安装(如果使用 ComfyUI 便携版或自己的 Python 环境)或通过 ComfyUI Manager 安装。 手动安装:安装相关依赖。 通过 ComfyUI Manager 安装:在 ComfyUI 中安装并打开 ComfyUI Manager,在 Manager 中搜索“Gemini API”,然后点击安装按钮。 方法二:使用【SD】 1. 进行 SAM 模型分割:来到图生图中,提示词输入“蓝色毛衣”,蒙版区域内容处理改为“填充”,尺寸改为和图像一致,重绘幅度为 1。 2. 处理可能出现的问题:如蒙版区域较大导致的衔接问题,可以通过降低重绘幅度或添加一个 openpose 来控制人物的身体,得到正确的姿势。 3. 选择合适的重绘功能:除了使用图生图的局部重绘,还可以使用 controlnet 的局部重绘功能,控制模式选择“更注重提示词”,具体效果可自行试验选择。
2025-04-09
怎么使用AI根据一篇论文直接生成PPT
以下是使用 AI 根据一篇论文直接生成 PPT 的一些方法和步骤: 1. 利用 AI 摘要论文内容并生成大纲列表,或者让 AI 根据主题扩充成大纲列表乃至具体内容。 2. 可以使用特定的 AI 工具,如 Claude 和 Gamma.app 。Claude 能帮助快速寻找符合条件的论文、提取精炼论文中某部分信息,并找到适合的 PPT 制作工具及教会使用。 例如,通过与 Claude 对话解决学术网站的条件搜索问题,如“帮我搜索一下营销领域最权威的期刊是哪几本”等。 3. 给 AI 一段数据、描述信息媒介的进化史、总结文章全文等,让其进行可视化展示。 4. 模型选择方面,目前推荐 Claude 3.7 Sonnet ,可通过 POE 调用 Claude 等方式。 需要注意的是: 1. 别指望有一段提示词复制就能得到满意的结果,这是一个和 AI 互动的过程,需要反复尝试。 2. 使用 AI 生成“PPT”实际上是基于模型的 HTML 输出能力,并非真的 PPT 格式,目前无法在 PPT 里进行二次深度编辑。
2025-04-01
怎么根据一篇论文直接生成PPT
以下是根据一篇论文直接生成 PPT 的一些方法和建议: 1. 利用 Gamma app:将 Claude 的答案放到 Google Docs 中,再导入 Gamma app 可自动转成初始只有文字的 PPT,然后可给 Gamma app 发送指令进行美化。 2. 提取论文中的关键图表: 检查论文在线版本:有些期刊会发布数字版本,包含原文、数据、图表等,可在论文首页或期刊网站查找相关链接下载。 联系论文作者:通过网络查找作者联系方式,说明兴趣,可能获取电子版论文全文。 咨询研究数据库:大学和公共图书馆通常订阅研究文献数据库,可联系馆员请求帮助。 3. 对于生成 PPT 的其他方式,如将文件转换为 PDF 格式(其他格式也可,但 PDF 效果更好),注意处理图片(网络图片复制 url 用 markdown 格式写入文档,自己的图片使用图床服务托管生成公链)和视频(找到公网视频地址用 markdown 格式写入)。 4. 让 AI 帮忙摘要论文内容生成大纲列表,或根据主题扩充成大纲列表乃至具体内容,在特定场景下可直接使用生成的 PPT,如学生快速为小组展示配 PPT。同时,还有多种 PPT 模板可供选择,如子弹布局、带文本布局的图标、统计布局、金字塔布局等。
2025-04-01
用ai建立知识库和直接使用ai有什么区别、
用 AI 建立知识库和直接使用 AI 主要有以下区别: 直接使用 AI 时,AI 生成的内容可能较为笼统模糊,就像遇到只会说“很急,今天就要”却不提供具体指导的领导。若想让 AI 成为得力助手,需对复杂任务进行拆解,提供方法论和定义输出格式。 建立知识库就如同为 AI 准备了“教科书”。知识库灵活,但偶尔会出现查不到内容而“猜题”的情况。例如,将《梦想与颠覆》卡牌等相关内容导入作为 AI 可调用的知识库,后续在创作中激活知识库,AI 会根据场景自动匹配库内素材,使输出更具针对性。 相比之下,微调类似于让 AI“自己真的学会了整本书”,答题更快更准,但训练成本高。微调适合高精度、长期任务,而知识库更适合临时查找、快速问答。
2025-03-30
目前的AI设计软件,能直接生成课程海报吗
目前的 AI 设计软件能够直接生成课程海报。例如 Claude 这款工具,其 Artifact 功能强大,无需专业设计技能和代码编写,也无需使用 PS 等软件,仅通过输入提示词和对话交流,就能生成课程海报,还能根据需求进行修改,如合并课程、添加日历、调整色彩等。 此外,还有一些其他的 AI 海报生成工具: 1. Canva(可画):https://www.canva.cn/ ,提供大量模板和设计元素,AI 功能可协助选择颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ ,智能设计工具采用先进人工智能技术,自动分析和生成设计方案。 3. VistaCreate:https://create.vista.com/ ,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 另外,还有一个海报设计的案例分享——东阿阿胶。其步骤包括得到需求、提取元素、绘制线稿、用 controlnet 转绘上色、ps 优化、定稿。具体为:确定需求并提取元素,如风格要潮流插画、有唐代元素和国潮等;绘制线稿,根据需求调整元素,如将驴子换成琵琶等;拆分元素线稿,绘制单个元素使其更精致,方便后期替换;利用拼接好的线稿跑图抽卡,选出合适的进行 ps 优化;最后根据客户需求进行元素替换得到定稿。上色运用的大模型为 GhostMix 鬼混_V2.0,lora 模型为“盒子系列——平面国潮插画_v1.0:182ba9e2f576”,controlnet 模型为“Module:lineart_coarse,Model:contr”。
2025-03-26
flowith根据自然语言构建一个直接使用的工作流吗,如何向flowith提出要求
Flowith 可以根据自然语言构建工作流。即使没有专业编程技能,只要能用清晰的自然语言描述出想要的各个 Agents 具备的行为和功能,就可以快速制作多 Agents 应用或创建代理式工作流。 使用工作流的步骤如下: 1. 配置工作流: 在 Code 节点内使用 IDE 工具,通过 AI 自动生成代码或编写自定义代码逻辑,来处理输入参数并返回响应结果。 该节点支持 JavaScript、Python 运行时,需注意不同运行时的特定事项。 可在 IDE 底部单击尝试 AI,并输入自然语言设定代码逻辑,也可选中代码片段通过快捷键唤起 AI 并输入自然语言让其修改代码。 2. 通过工作流数据库节点操作数据表: 在工作流中添加数据库节点对数据表进行操作,可通过 NL2SQL 方式和代码方式进行调用,支持完整读写模式。 参考以下操作添加并配置工作流节点: 单击页面顶部的工作流页签,然后单击创建工作流。 输入工作流名称和使用描述,然后单击确认。 在基础节点页签下,将数据库节点拖入到工作流配置画布区域。 根据相关信息配置数据库节点,包括输入添加 SQL 执行中需要的参数,输入要执行的 SQL 语句,可单击自动生成使用大模型生成 SQL。 需注意不支持 Select语法、多表 Join 操作,最多返回 100 行数据。在配置数据库节点前,要确保已经搭建了一个 Bot,并在这个 Bot 中创建好了数据表。
2025-03-26