「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
什么是multi agent
多智能体(MultiAgent)是由多个自主、独立的智能体(Agent)组成的系统。在这个系统中,每个智能体都能够感知环境、进行决策并执行任务,同时它们之间可以进行信息共享、任务协调以及协同行动,以实现整体的目标。 随着大型语言模型(LLM)的出现,以 LLM 为核心构建的 Agent 系统近期受到广泛关注。Agent 系统旨在利用 LLM 的归纳推理能力,为不同的 Agent 分配角色和任务信息,并配备相应的工具插件,以完成复杂的任务。 目前,更常见的框架主要集中在单 Agent 场景下。单 Agent 的核心在于 LLM 与工具的协同配合。LLM 根据用户任务的理解,推理出需要调用的工具,并根据调用结果向用户提供反馈。在任务完成过程中,Agent 可能需要与用户进行多轮交互。 与此同时,越来越多的 Agent 框架开始关注多 Agent 场景。为了完成任务,多 Agent 会为不同的 Agent 指定不同的角色,并通过 Agent 之间的协作来完成复杂的任务。与单 Agent 相比,在任务完成过程中,与用户的交互可能会减少一些。 为构建一个多 Agent 框架,主要组成部分包括: 1. 环境(environment):所有 Agent 应处于同一个环境中。环境中包含全局状态信息,Agent 与环境之间存在信息的交互与更新。 2. 阶段(stage):为完成复杂任务,现有多 Agent 框架通常采用 SOP 思想,将复杂任务分解为多个子任务。 3. 控制器(controller):控制器可以是 LLM,也可以是预先定义好的规则。它主要负责环境在不同 Agent 和阶段之间的切换。 4. 记忆:在单 Agent 中,记忆只包括用户、LLM 回应和工具调用结果等部分。而在多 Agent 框架中,由于 Agent 数量增多,导致消息数量增多。同时,每条消息可能需要记录发送方、接收方等字段。 多智能体的核心交互流程包括: 1. 控制器更新当前环境状态,选择下一时刻行动的 Agent。 2. Agent 与环境交互,更新自身的记忆信息。 3. Agent 调用 LLM,执行动作并获取输出消息。 4. 将输出消息更新到公共环境中。 参考资料: 1. 《》 2. 《》
2025-03-03
如何用AI按照描述制作一张图片
以下是关于如何用 AI 按照描述制作一张图片的相关内容: 一、关键词和主题描述 1. 图片内容通常分为二维插画和三维立体两种表现形式。 2. 描述场景、故事、元素、物体或人物细节时,要清晰明确。对于场景中的人物,应独立描述,避免长串文字,以便 AI 识别。 3. 大场景中多个角色的细节较难通过关键词生成。 二、设计风格 1. 设计师难以直接表达设计风格时,可参考风格类关键词或垫图/喂图,让 AI 结合主题描述生成相应风格的图片。 2. 某些材质的关键词运用有较多门道,需针对特定风格进行“咒语测试”。 三、使用 Midjourney 生成图片 1. 图片描述可理解为以图生图,将设计参考图上传到 Midjourney 中,通过“参考图链接+文本描述”的方式生成图像。 2. 例如生成带有交互流程的 UI 界面图,先上传素材图,再用“参考图链接+node UI”等文字提示生成类似设计图,还可通过调整文字提示获得不同效果,如纯正面、扁平、手绘、黑白等风格。 3. 生成不同比例的图,需在文字描述中加入特定参数,如“aspect”或“ar”。 4. Midjourney 还可生成设计组件,探索多种设计风格的可能性,如扁平组件系统,关键词为“UI kit,flat design,outline,ar 16:9”。 四、AI 生成图片的著作权 1. 如 Stable Diffusion 模型根据文本指令生成图片,其生成的样子取决于使用者输入的提示词,非排列组合工作模式下难有相同图片。 2. 人工智能无自由意志,使用者通过增删提示词、修改参数得出不同图片并选定,体现使用者的创作,生成的具有独创性和智力投入的图片受著作权保护。 3. 相关法律适用包括《中华人民共和国著作权法》第三条和《中华人民共和国著作权法实施条例》第四条。案例中人工智能软件生成的图片著作权由使用者享有。
2025-03-03
用哪些指令能帮助我用AI写论文
以下是一些利用 AI 写论文的指令和方法: 1. 明确背景信息和具体要求:例如,“根据以下关于我的信息,写一篇四段的大学申请论文:我来自西班牙巴塞罗那。尽管我的童年经历了一些创伤性事件,比如我 6 岁时父亲去世,但我仍然认为我有一个相当快乐的童年。在我的童年时期,我经常换学校,从公立学校到非常宗教的私立学校。我做过的最‘异国情调’的事情之一是在爱达荷州的双子瀑布与我的大家庭一起度过六年级。我很早就开始工作了。我的第一份工作是 13 岁时的英语老师。在那之后,以及在我的学习过程中,我做过老师、服务员,甚至建筑工人。” 2. 确定论文主题:明确您的研究兴趣和目标,选择一个具有研究价值和创新性的主题。 3. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具来搜集相关的研究文献和资料。 4. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 5. 生成大纲:使用 AI 写作助手生成论文的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 6. 撰写文献综述:利用 AI 工具来帮助撰写文献综述部分,确保内容的准确性和完整性。 7. 构建方法论:根据研究需求,利用 AI 建议的方法和技术来设计研究方法。 8. 数据分析:如果论文涉及数据收集和分析,可以使用 AI 数据分析工具来处理和解释数据。 9. 撰写和编辑:利用 AI 写作工具来撰写论文的各个部分,并进行语法和风格的检查。 10. 生成参考文献:使用 AI 文献管理工具来生成正确的参考文献格式。 11. 审阅和修改:利用 AI 审阅工具来检查论文的逻辑性和一致性,并根据反馈进行修改。 12. 提交前的检查:最后,使用 AI 抄袭检测工具来确保论文的原创性,并进行最后的格式调整。 需要注意的是,AI 工具可以作为辅助,但不能完全替代研究者的专业判断和创造性思维。在使用 AI 进行论文写作时,应保持批判性思维,并确保研究的质量和学术诚信。
2025-03-03
有没有短视频的脚本prompt
以下是为您提供的一些短视频脚本 prompt 相关内容: 1. 使用 GPT 的视觉功能和 TTS API 处理和讲述视频:可以用大卫·阿滕伯勒的风格为视频制作画外音,使用相同的视频帧提示 GPT 给出简短脚本。 2. 编剧提示词 01——剧本创作:对于短视频,在提交创作偏好时需标注片长,比如明确这是个 3 分钟的短视频。其输出是分阶段的,几个来回就能搞定剧本。 3. 潘峰:Prompt 5 大通用方法中的扩写与改写法:自己要给出开头,让 AI 理解语言逻辑从而撰写下半部并包含必要内容。可以将生成的内容用不同写作技巧转换风格,多滚动几次能写出多样版本与风格,降低初稿修改时间。此外,还有反问法,比如让 AI 问您问题,能发现它思考更仔细,也能了解其逻辑并修正。示例中还包括让 AI 引导您完成能表现个人品牌专业度或创造社群话题的短视频脚本。
2025-03-03
数字人有网站能免费制作吗?
以下是一些可以免费制作数字人的网站及方法: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。上传后效果如图所示,My Avatar 处显示上传的照片。点开大图后,点击 Create with AI Studio,进入数字人制作。写上视频文案并选择配音音色,也可以自行上传音频。最后点击 Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的 Create vedio。选择人物形象,可以点击 ADD 添加照片,或者使用 DID 给出的人物形象。配音时,可以选择提供文字选择音色,或者直接上传一段音频。最后,点击 Generate vedio 就可以生成一段视频。打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI。 使用方法:点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。点击开始创作,选择自定义照片。配音时,可以选择提供文字选择音色,或者直接上传一段音频。打开绿幕按钮,点击背景,可以添加背景图。最后,点击生成视频。 此外,在剪映中也可以制作数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。剪映 App 会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成时间,然后可点击预览按钮查看效果。还可以为视频增加背景图片,删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,使其在整个视频播放时显示。
2025-03-03
AI生成思维导图
以下是一些与思维导图相关的 AI 工具: 1. GitMind:免费的跨平台思维导图软件,可通过 AI 自动生成,支持多种模式,如提问、回答、自动生成等。 2. ProcessOn:国内的思维导图+AIGC 工具,能利用 AI 生成思维导图。 3. AmyMind:轻量级在线 AI 思维导图工具,无需注册登录,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路,生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,输入需求即可由 AI 自动完成生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,有助于提升生产力。 此外,还有一些相关的应用案例,如 ChatMind 可利用 AI 自动生成思维导图,输入问题、文章、数据即可,能导出图片与 Markdown 文档两种格式。在读书会活动中,也可以通过如 kimichat 让 AI 拆解书籍内容生成 markdown,再粘贴到在线思维导图 Markmap 中一键生成思维导图并微调。
2025-03-03
AGI是什么
AGI 即通用人工智能(Artificial General Intelligence),指的是一种能够完成任何聪明人类所能完成的智力任务的人工智能。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 此外,GPT3 及其半步后继者 GPT3.5(在 2023 年 3 月升级为 GPT4 之前,它驱动了现在著名的 ChatGPT)在某种程度上是朝着 AGI 迈出的巨大一步。而像 GPT2 这样的早期语言模型实际上没有真正连贯回应的能力。
2025-03-03
教程
以下是为您提供的一些教程: 注册 GitHub 教程: 打开 https://github.com/ 。 点击 Sign up 。 输入自己的邮箱地址,输入完成以后,点击后面的 Continue 。 输入密码,尽量中英文混合,否则会提示太简单,换一个复杂的即可。 输入用户名,用户名可能会提示重复。 下一步设置邮箱是否接受广告等信息。 等待机器人验证通过,通过箭头调整机器人的朝向,和左边手指方向一致,点击下面的提交。 等待邮箱中的验证码。 录入完成,自动会跳到登录页面,用户名或者邮箱都可以。 成功以后,填写基本信息,也可以跳过设置,注册完成。 SD 做中文文字教程(持续更新中): 制作思路: Nenly 同学的视频教程:【“牛逼”的教程来了!一次学会 AI 二维码+艺术字+光影光效+创意 Logo 生成,绝对是 B 站最详细的 Stable Diffusion 特效设计流程教学!AI 绘画进阶应用哔哩哔哩】https://b23.tv/c33gTIQ 。 群友根据以下教程自己做了个视频教程非常详细: 将中文字做成白底黑字,存成图片样式。 使用文生图的方式,使用大模型真实系,作者用的 realisticVisionV20_v20.safetensorsControlNet 预设置。 输入关键词,如奶油的英文单词,Cream+Cake(加强质感),反关键词:Easynegative(负能量),反复刷机,得到满意的效果即可。 同理可输出 C4D 模型,可自由贴图材质效果,3d,blender,oc rendering 。 如果希望有景深效果,也可以打开 depth(增加阴影和质感)。 打开高清修复,分辨率联系 1024 以上,步数:2960 。 微信机器人大事件记录教程: 共学版本: ,大家只需要跟着这一篇文档学习,学完前三天的就能做出很不错的机器人了,强烈建议跟这个这个学习! Stuart:【入门级】教你用最简单的方式搭建微信机器人] 。 马上观看看:通过云服务器,dify,智能微秘书来免费搭建微信机器人] 。 Yaki:GPT/MJ 接入微信] 。 DIN:全程白嫖拥有一个 AI 大模型的微信助手] 。 熊猫大侠:基于 COW 框架的 ChatBot 实现步骤] 。 大雨:轻松上手 Docker:一站式指南助你成为容器化技术高手] 。
2025-03-03
智能画布好用吗
智能画布具有一定的优势和特点。例如,即梦智能画布将 midjourney、stablediffusion 和 Photoshop 的工作流一站式集中,支持多图层的 AI 可控能力,如边缘保持,还支持超清、重绘、抠图、扩图等丰富的后编辑能力。 此外,Miro 的 Intelligent Canvas 是一个基于人工智能的工作平台,能够将大脑风暴中的想法转化为产品简报和摘要,以推动工作进展。用户只需提供画布上的内容,Miro AI 就能自动处理后续步骤,节省了制作图表、简报和摘要的时间,还提供了预设的动作和快捷方式,以及与相关人员的即时协作。 不过,智能画布的好用程度可能因个人需求和使用场景的不同而有所差异。
2025-03-03
有哪些自动生成宣传海报的ai
以下是一些自动生成宣传海报的 AI 工具及相关方法: 1. 某些活动中开发的 AI 可以在提供配方的同时自动生成海报,例如鸡尾酒配方搭配生成的私人订制海报。 2. 国内的 AIGC 绘图平台,如无界 AI 可以用于快速制作海报底图并完成主题海报排版。大致流程如下: 确定海报主题后,借助 ChatGPT 等文本类 AI 工具协助完成文案。 选择想要完成的风格意向,根据文案和风格灵活调整画面布局。 使用无界 AI 输入关键词,生成并挑选一张满意的海报底图。 将上述素材进行合理排版,得到成品。排版同样可以参考 AIGC 海报成果。 3. 在无界 AI 中,还可以通过图生图的方式生成海报。首先准备一张真实照片作为样图,然后找到图生图功能,添加关键词,如果要改变画面内容,可调整相关参数和增加修饰词。
2025-03-03