Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

使用AI,comfyui是必学的吗?

Answer

ComfyUI 并非是使用 AI 时必学的。但如果您想在 AI 水平上有更高的提升,掌握 ComfyUI 的理论基础是很有帮助的。它在图像、视频等领域有诸多应用和发展,例如在差分算法、年龄渐变和特定内容替换、q 列模型、语言模型的迁移和发展、深度图检测和分层处理等方面具有优势。同时,了解其技术细节如 clip 的 skip 层、scheduler 和 sample 的区别、CFG 等能让您更灵活选择参数。ComfyUI 的生态发展稳定,节点和项目增多,相关大会也在多地举办。此外,其生态外的收费视频软件能用 API 节点接入所有体系,飞书大群方便交流,会同步课件及相关信息。

Content generated by AI large model, please carefully verify (powered by aily)

References

8月13日ComfyUI共学

[heading2]总结AI工具在图像、视频等领域的应用及发展利用互补工具完成工作:在传统工具未诞生时,通过SD3、SDXL等工具的互补来完成工作,如人效生成和姿势生成用SD3,人脸和姿势迁移用XL等。差分算法的优势:接受0-255的梯度图,重绘时按渐变效果生成,融合程度好,可应用于重绘相关工作。年龄渐变和特定内容替换:谷歌两三年前的算法可实现人的年龄渐变和特定内容如物体颜色、动物种类的准确识别与替换。q列模型的特点:对人像迁移较好,能保持人脸特征,实现多人脸融合和适应不同姿势,适用于对人物主体一致性要求强的工作。语言模型的迁移和发展:将詹姆丹1.5迁移到company i,避免对话框式交流,jumeline 1.5可分析视频和文件,与CM2结合可实现高度的agent。深度图检测和分层处理:可实现人物、物品的抠图分层处理,用于生成可控的分层视频,效果比直接用视频生成模型更好。工作流思维和生态发展:工作逻辑是先定目标,拆分成工作流、工作组,用模块和模组实现并串联。Confii生态发展稳定,节点和项目增多,但存在重复,实用的约60%,常用的节点不超1000。

8月13日ComfyUI共学

[heading2]总结关于康菲菲(Confii)的技术与生态发展康菲菲技术原理学习的必要性:若想在AI水平上有更高提升,掌握康菲菲的理论基础是必备的,只有这样才能更好地理解代码和论文,轻松应对各种情况。工作流搭建与原理的关系:了解采阳器、浅空间等原理,对搭建节点工作流更有感觉,不懂时可多搭几遍或查询研究。康菲菲的技术细节:如clip的skip层、scheduler和sample的区别、CFG等都有相关理论和解释,了解后能更灵活选择参数。康菲菲的生态发展:北美举办了config UI的leadership man峰会,国内也在深圳举办了相关大会,未来还将在东京举办,以促进其生态繁荣。康菲菲的未来展望:希望其成为开源载体,整合各种AI及传统模型算法,实现自动化和整合化操作,涵盖3D预览和生成等更多功能。关于学习活动安排与飞书群相关事宜视频软件可通过API接入:康菲菲生态外的收费视频软件能用API节点接入所有体系。新会议时间及后续学习安排:10点有新会议,接下来几天的学习在每晚8点开始,群内会发通知。飞书大群的优势与使用:飞书大群可容纳更多人,方便交流,群内会同步课件及相关信息,失效的链接可在会议中展示二维码,扫码进群,二维码有效期改为永久。

8月13日ComfyUI共学

[heading2]智能章节[52:23](https://waytoagi.feishu.cn/minutes/obcn38eo81342d3wa924dqhg?t=3143000)郭佑萌分享视频处理与AI应用的商业案例本章节郭佑萌介绍了去年的培训及学习计划,包括带相关部门学Web UI和AI绘图等。还提到今天上午列出学习计划,晚上未充分准备。展示了将视频中人物转变为动漫角色等案例,如视频局部重绘,并讲述与影楼企业合作把模特图片转成高精度AI写真的流程。[56:53](https://waytoagi.feishu.cn/minutes/obcn38eo81342d3wa924dqhg?t=3413000)高分辨率下保真的AI摄影工作流介绍本章节主要介绍了在接近8K的高分辨率下进行AI摄影的工作流,强调要保持画面内容尤其是人脸不动且保真,还提及工作流较简单,有自己设计的部分,同时存在投屏过曝的问题后续会修复。[59:10](https://waytoagi.feishu.cn/minutes/obcn38eo81342d3wa924dqhg?t=3550000)郭佑萌关于工作流及共学内容的介绍与统计本章节中,郭佑萌表示会手把手教大家做出可落地的工作流,此工作流有新增内容。还提到对群里小伙伴兴趣的统计,本期共学围绕config基础要求、康费工作流设计、实战案例构建,config环境会融在基础里讲,深度理解等在课表中。[01:00:54](https://waytoagi.feishu.cn/minutes/obcn38eo81342d3wa924dqhg?t=3654000)共学活动与高效完成插画任务的相关讨论

Others are asking
文字生图的必学知识
以下是关于文字生图的必学知识: 1. 开始方式: 本地部署:如果电脑是 M 芯片的 Mac 电脑(Intel 芯片出图速度慢,不建议)或者 2060Ti 及以上显卡的 Windows 电脑,可以选择本地部署,强烈建议在配有 N 卡的 Windows 电脑上进行。 在线平台:对于电脑不符合要求的小伙伴可以直接使用在线工具,在线工具分为在线出图和云电脑两种,前者功能可能会受限、后者需要自己手动部署,大家根据实际情况选择即可。 配台电脑:非常不建议一上来就配主机,因为大概率会变成游戏机或者吃灰(土豪请随意)。玩几个月后还对 AI 有兴趣的话再考虑配个主机。主机硬盘要大,显卡预算之内买最好,其他的随意。 2. 课程简述: 先验经验:需要熟练使用文生图、图生图;需要有一定的逻辑思考能力以及推理能力;适合炼丹新人、小白。 课程安排:课程大约 70 80%是理论和方法论的内容,大部分练习会在课外跟大家沟通、练习。只有少部分必要内容会在课上演示。 3. 学习路径:必学、必看内容是基础课,主要是为了解决环境问题和软件安装不上的问题;建炉是针对不同炼丹方式提供了不同的炼丹工具的安装教程;正式的内容部分分为了数据集预处理、模型训练以及模型调试及优化三个部分。 4. 写提示词: 通常的描述逻辑:人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。 辅助网站: http://www.atoolbox.net/:可以通过选项卡的方式快速地填写关键词信息。 https://ai.dawnmark.cn/:每种参数都有缩略图可以参考,可以方便更加直观的选择提示词。 C 站(https://civitai.com/):每一张图都有详细的参数,可以点击下面的复制数据按钮,然后直接粘贴到正向提示词栏里,然后点击生成按钮下的第一个按键,Stable Diffusion 就可以将所有的参数自动匹配。但要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会截然不同。也可以只取其中比较好的一些描述词使用,比如人物描写、背景描述、一些小元素或者是画面质感之类的。 5. Tusiart 简易上手教程(文生图): 定主题:确定要生成的图的主题、风格、表达的信息。 选择基础模型 Checkpoint:按照主题,找内容贴近的 checkpoint。一般喜欢用模型大佬麦橘、墨幽的系列模型,比如麦橘写实、麦橘男团、墨幽人造人等,效果拔群。 选择 lora:在想要生成的内容基础上,寻找内容重叠的 lora,帮助控制图片效果及质量。可以多看看广场上做得好看的帖子里面,他们都在用什么 lora。 ControlNet:控制图片中一些特定的图像,可以用于控制人物姿态,或者是生成特定文字、艺术化二维码等等。也是高阶技能,后面再学不迟。 局部重绘:下篇再教,这里不急。 设置 VAE:无脑选择 840000 这个即可。 Prompt 提示词:用英文写想要 AI 生成的内容,不用管语法也不要写长句,仅使用单词和短语的组合去表达需求。单词、短语之间用英文半角逗号隔开即可。 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,也是一样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。 采样算法:比较复杂,一般选 DPM++ 2M Karras 较多。最稳妥的是留意 checkpoint 的详情页上,模型作者是否有推荐采样器,使用他们推荐的采样器会更有保障。 采样次数:要根据采样器的特征来,一般选了 DPM++ 2M Karras 之后,采样次数在 30 40 之间,多了意义不大还慢,少了出图效果差。 尺寸:看个人喜欢和需求。
2024-11-18
comfyui工作流
ComfyUI 工作流主要包括以下内容: FLUX 低显存运行工作流:目的是让 FLUX 模型能在较低的显存情况下运行。分阶段处理思路为:先在较低分辨率下使用 Flux 模型进行初始生成,然后采用两阶段处理,即先用 Flux 生成,后用 SDXL 放大,有效控制显存的使用,最后使用 SD 放大提升图片质量。工作流的流程包括初始图像生成(Flux)的一系列操作,如加载相关模型、处理输入提示词、生成初始噪声和引导等,以及初始图像预览;图像放大和细化(SDXL)的一系列操作,如加载 SDXL 模型、对初始图像进行锐化处理等,还有最终图像预览。 工作流网站: “老牌”workflow 网站 Openart.ai:https://openart.ai/workflows/ 。流量比较高,支持上传、下载、在线生成,免费账户总共有 50 个积分,加入 Discord 可以再加 100 积分,开通最低的每个月 6 美元的套餐后,每个月会有 5000 积分。 ComfyWorkflows 网站:https://comfyworkflows.com/cloud 。支持在线运行工作流,从 workflow 的实际下载量和访问量来看,略少于 openart。 Flowt.ai:https://flowt.ai/community 。 绿幕工作流:包含两个组,即生成绿幕素材和绿幕素材抠图。因为 SD 无法直接生成透明背景的 png 图片,所以要先生成一张素材图,前景是重要的主体素材,背景是纯色(方便识别),选择绿幕是为了方便抠图。工作流文件可通过链接 https://pan.quark.cn/s/01eae57419ce 提取(提取码:KxgB),下载拖入 ComfyUI 中自动加载工作流进行学习。
2025-04-14
comfyui
ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI,可想象成集成了 stable diffusion 功能的 substance designer,将 stable diffusion 流程拆分成节点,实现更精准工作流定制和完善的可复现性。 其优势包括: 1. 对显存要求相对较低,启动和出图速度快。 2. 生成自由度更高。 3. 可以和 webui 共享环境和模型。 4. 能搭建自己的工作流程,可导出流程并分享,报错时能清晰发现错误所在。 5. 生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势有: 1. 操作门槛高,需要有清晰逻辑。 2. 生态没有 webui 多(但常用的都有),也有一些针对 Comfyui 开发的有趣插件。 官方链接:https://github.com/comfyanonymous/ComfyUI 。 安装部署方面: 1. 地址:https://github.com/comfyanonymous/ComfyUI ,可以下载安装包也可以直接 Git clone https://github.com/comfyanonymous/ComfyUI.git ,或者下载安装包 file:ComfyUI.zip ,下载安装包或者点击链接下载并解压至本地除 C 盘外的任意盘。然后找到文件名称为 run_nvidia_gpu 的文件双击并启动,启动完成即进入基础界面。 2. 节点存放目录:comfyUI 的节点包括后面安装的拓展节点都存放在 D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes 。 3. 模型存放目录: 大模型:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\checkpoints 。 Lora:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\loras 。 Vae:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\vae 。 4. 模型共用:已经安装了 SDWebUI 的同学可以通过修改文件路径和 WebUI 共用一套模型,找到已安装好的 ComfyUI 目录文件下的 extra_model_paths.yaml.example 文件,将后缀.example 删除,然后右键用记事本打开。 此外,还可以直接在 Comfy UI 中训练 LoRA 模型。默认情况下,训练结果直接保存在 ComfyUI lora 文件夹中,训练后只需刷新并选择 LoRA 就可以测试。
2025-04-13
comfyui漫画工作流
ComfyUI 漫画工作流包含以下内容: 1. 绿幕工作流:包含两个组,即生成绿幕素材和绿幕素材抠图。因为 SD 无法直接生成透明背景的 png 图片,所以要先生成一张素材图,前景是重要的主体素材,背景为纯色(方便识别),选择绿幕是为了便于抠图。工作流文件链接:https://pan.quark.cn/s/01eae57419ce 提取码:KxgB 2. 动画工作流: 啊朔提供的动画工作流文件,如:
2025-04-13
comfyui动画片工作流怎么构建
构建 ComfyUI 动画片工作流的步骤如下: 1. 打开 Comfyui 界面后,右键点击界面,找到 Comfyui LLM party 的目录。您可以学习手动连接节点来实现最简单的 AI 女友工作流,也可以将工作流文件拖拽到 Comfyui 界面中一键复刻提示词工程实验。 2. 从 ollama 的 github 仓库找到对应版本并下载。启动 ollama 后,在 cmd 中输入 ollama run gemma2 将自动下载 gemma2 模型到本地并启动。将 ollama 的默认 base URL=http://127.0.0.1:11434/v1/以及 api_key=ollama 填入 LLM 加载器节点即可调用 ollama 中的模型进行实验。 3. 若 ollama 连接不上,很可能是代理服务器的问题,请将 127.0.0.1:11434 添加到不使用代理服务器的列表中。 此外,还有以下相关工作流搭建的信息供您参考: 1. 搭建艺术二维码工作流:打开 ComfyUI 导入相应工作流。工作流所用到的节点包括大模型节点(可选择如 AWPainting、primemixanything、xxmix9realistic v40 等,并提供了相应链接)、关键词节点、Lora 节点、ControlNet 节点(选用 qrcode_monster V2 版本,下载链接:https://huggingface.co/monsterlabs/control_v1p_sd15_qrcode_monster/tree/main/v2 )、采样器节点(Step 选择高步数,35 50 即可,采样器默认的 euler a/dpmpp 2m sde )。 2. 搭建 ComfyUI 基础工作流:从零开始搭建时,首先准备加载大模型的节点,在工作区鼠标右键点击,选择 Add Node > 选择 loaders > 选择 Load Checkpoint,并选择对应的模型。然后加载 Conditioning(条件),在工作区鼠标右键点击,选择 Add Node > 选择 Conditioning > 选择 CLIP TEXT Encode,输入正反向提示词。添加采样器时,部分参数设置与 WEB_UI 有所不同,如 seed 值只有固定、随机、每次增加、每次减少这四个选项,采样器和调度器是分开的。
2025-04-13
comfyui如何本地安装
以下是在本地安装 ComfyUI 的详细步骤: 安装方式有两种,分别是安装到本地和安装到云端。本部分主要介绍本地安装方法。 本地安装方法: 1. 命令行安装: 这是普适性最强的方法,安装后二次遇到问题的概率相对较低,但对于不熟悉命令行以及代码的用户来说,可能会有一定的门槛。 ComfyUI 的源码地址在:https://github.com/comfyanonymous/ComfyUI ,安装方法写在了 Readme 中。您也可以按照 Readme 文档进行操作。 如果会 Git 请在 Terminal 运行以下代码: 如果不会用 Git,推荐使用 Github 的客户端(https://desktop.github.com/)拉代码。 下载并安装好 Github Desktop 后,打开该应用。 然后打开 ComfyUI 的 Github 页面(https://github.com/comfyanonymous/ComfyUI),点击右上角的绿色按钮,并点击菜单里的「Open with GitHub Desktop」,此时浏览器会弹出是否要打开 GitHub Desktop,点击「是」。 GitHub Desktop 会让您选择一个保存位置,按需调整,然后点击确定。看到下方特定界面,意味着完成了代码同步。 2. 安装包安装: 这种方法安装比较简单,下载就能用。 ComfyUI 的官方安装包:目前仅支持 Windows 系统,且显卡必须是 Nivida。下载地址是:https://github.com/comfyanonymous/ComfyUI/releases ,只需下载最新的版本,解压就能使用。 安装完成后: 1. 节点存放目录:comfyUI 的节点包括后面安装的拓展节点都存放在本目录下:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes 2. 模型存放目录: 大模型:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\checkpoints Lora:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\loras Vae:D:\\COMFYUI\\ComfyUI_windows_portable\\ComfyUI\\models\\vae 3. 模型共用:已经安装了 SDWebUI 的同学可以通过修改文件路径和 WebUI 共用一套模型即可,这样就不用重复下载模型了。找到您已经安装好的 ComfyUI 目录文件下的 extra_model_paths.yaml.example 文件,将后缀.example 删除,然后右键用记事本打开。 希望以上内容对您有所帮助。
2025-04-10
如何学习comfyui
以下是关于学习 ComfyUI 的相关内容: 学习资料网站: ComfyUI 官方文档:提供使用手册和安装指南,适合初学者和有经验的用户,网站为 https://www.comfyuidoc.com/zh/ 。 优设网:有详细的入门教程,适合初学者,介绍了特点、安装方法及生成图像等内容,地址为 https://www.uisdc.com/comfyui3 。 知乎:有用户分享部署教程和使用说明,适合有一定基础并希望进一步了解的用户,地址为 https://zhuanlan.zhihu.com/p/662041596 。 Bilibili:有一系列涵盖从新手入门到精通各个阶段的视频教程,地址为 https://www.bilibili.com/video/BV14r4y1d7r8/ 。 飞书学习群的共学内容:包括王蓉的基础搭建和转绘、唯有葵花向日晴的基础教程、工作流开发和实际应用场景等众多成员分享的基础教程、工作流搭建思路、各版本模型使用的优缺点、报错解决方式、模型训练等方面的内容。 学习 ComfyUI 的原因: 更接近 SD 的底层工作原理。 实现自动化工作流,消灭重复性工作。 作为强大的可视化后端工具,可实现 SD 之外的功能,如调用 api 等。 可根据定制需求开发节点或模块。 例如,有人为解决工作室抠图素材需求,基于相关项目创建了工作流,不仅能用于绿幕素材抠图,还能自动生成定制需求的抠图素材。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-29
stable diffusion是runway和goole联合开的吗
Stable Diffusion(简称 SD)不是由 Runway 和 Google 联合开发的,而是由初创公司 StabilityAI、CompVis 与 Runway 合作开发的。 Stable Diffusion 是 2022 年发布的深度学习文本到图像生成模型,其核心技术来源于 AI 视频剪辑技术创业公司 Runway 的 Patrick Esser 以及慕尼黑大学机器视觉学习组的 Robin Romabach。该项目的技术基础主要来自于这两位开发者之前在计算机视觉大会 CVPR22 上合作发表的潜扩散模型(Latent Diffusion Model)研究。 Stable diffusion 是一种基于潜在扩散模型(Latent Diffusion Models)的文本到图像生成模型,能够根据任意文本输入生成高质量、高分辨率、高逼真的图像。其原理包括使用新颖的文本编码器将文本输入转换为向量表示,利用扩散模型将随机噪声图像逐渐变换为目标图像,在扩散过程中根据文本向量和噪声图像作为条件输入给出变换的概率分布,最后使用超分辨率放大器将生成的低分辨率图像放大到更高的分辨率。 围绕 Stable Diffusion 等基础模型的兴奋和关注正在产生惊人的估值,但新研究的不断涌现确保新模型将随着新技术的完善而更替。目前,这些模型在法律方面也面临挑战,例如其训练所使用的大量内容数据集通常是通过爬取互联网本身获得的,这可能会引发法律问题。
2025-04-15
midjourney中文站和官方网站上的内容是一样的吗
Midjourney 中文站和官方网站的内容不完全一样。 Midjourney 官网具有以下特点和操作细节: 已向生成 100 张以上图片的用户开放使用权限,登录官网后,左侧为各种页面入口,顶部有生成入口(prompt 框)和搜索框。在社区作品、创作(Create)以及组织(Organize)页面中,随时可用 prompt 框和搜索框,无需频繁切换页面。 可通过点击 prompt 框最右侧的图标设置常用参数默认值,包括画面比例和个性化模型开关。 图片参考在官网上变得简单直观,点击 prompt 框最左侧的图片按钮或直接拖入图片即可,官网会记录所有使用过的图片,方便调用或删除。当鼠标悬停在图片上时,会看到 3 个小图标,从左到右分别是角色参考、风格参考、整图参考,如需多种参考逻辑可按住 shift 键点选多个图标。 创作页面的最大亮点是 prompt 的复用,可以直接点击画面描述或复制描述词到 prompt 框中,也可以直接点击下方横列菜单里的按钮,将包括参考图在内的完整 prompt 替换当前的 prompt。点击图片会进入单图调整模式,常用的操作指令集中在右下角的按键中,并且上线了全新的 Editor 编辑器功能。 此外,关于 Midjourney 还有以下相关内容: 有关于 Midjourney v5.1 的 AIGC Weekly23 相关介绍。 有 Midjourney 的隐私政策,包括适用范围、变更情况、定义等。
2025-03-18
有什么软件或者网站可以学习文档,然后根据文档内容生成完整的python代码程序的吗?免费的
以下是一些可以学习文档并根据文档内容生成完整 Python 代码程序的免费软件或网站: 1. :这是一个开源的 AI 开发助手,能根据产品需求生成完整的代码库,代码具有简单、安全、易于理解的结构,具备高度灵活性和定制性,适合开发人员使用。 2. 直接使用。
2025-03-13
有什么ai助手可以学习文档,然后根据文档内容生成完整的python代码程序的吗?
以下是一些可以学习文档并生成完整 Python 代码程序的 AI 助手: 1. Wing Python IDE Pro:由 Wingware 开发的专为 Python 编程设计的开发环境,集成了代码编辑、导航和调试功能,具备智能自动补全、代码重构、多选功能和代码片段工具。价格:年度许可证起价 179 美元/月。 2. Smol Developer:开源的 AI 开发助手,可以根据产品需求生成完整的代码库,具备简单、安全、易于理解的代码结构,同时高度灵活和定制。价格:开源项目,遵循 MIT 许可证。 3. Cody:Sourcegraph 的 AI 工具,能理解整个代码库,解答问题并编写代码,还能详细解释代码,定位特定组件,并提出修复建议。可通过 VS Code 扩展直接使用,个人使用免费。 4. FittenAI 编程助手:安装前需先安装 Python 的运行环境,安装步骤为点击左上角的 FileSettingsPluginsMarketplace。安装完成后左侧会出现 Fitten Code 插件图标,注册登录后即可开始使用。其功能包括智能补全(按下 Tab 键接受所有补全建议,按下 Ctrl+→键接收单个词补全建议)、AI 问答(通过点击左上角工具栏中的 Fitten Code–开始新对话打开对话窗口进行对话)、自动生成代码(Fitten Code 工具栏中选择“Fitten Code生成代码”,然后在输入框中输入指令即可生成代码)、代码转换(选中需要进行翻译的代码段,右键选择“Fitten Code–编辑代码”,然后在输入框中输入需求即可完成转换)。
2025-03-13
AI绘画,有免费的吗
目前有免费的 AI 绘画工具,例如 Imagen 3,其优势包括无需排队、免费使用、交互人性化、具有较好的语义理解能力以及灵活性等。此外,Stable Diffusion 也是主流的 AI 绘画软件,其优势在于开源免费、可以本地化部署、创作自由度很高,但需要较好的电脑配置。如果您想要了解更多关于 AI 绘画的信息,比如具体的安装方法,可以去看看 B 站的【秋葉 aaaki】这个 Up 主的视频。
2025-03-08
你这有关于 AI教育相关的吗
以下是为您提供的关于 AI 教育的相关内容: 可以使用人工智能来帮助教育,包括辅助自学、帮助教师让课程更有效等。您可以要求人工智能解释概念并获得较好结果,比如通过。但使用时要注意人工智能可能产生幻觉,关键数据需根据其他来源仔细检查。 Sam Altman 在 X 上发表的《The Intelligence Age》提到了人工智能在教育方面的一些观点,如孩子将拥有虚拟导师,能提供个性化教学,还提到了人工智能在增强人类能力、放大共享智慧、深度学习的可扩展性、实现全球繁荣和问题解决、计算和能源对实现人工智能民主化的重要性以及控制风险等方面的内容。 作者杨远骋 Koji 通过自己与 ChatGPT 的互动故事,探讨了 AI 时代下 AI 技术对教育的潜在影响。认为 AI 可以提供个性化、批判性和广泛的教育资源,改变传统教育方式,提到了 Khanmigo AI 这款产品能引导学生自己寻找答案,培养批判性思维能力,鼓励大家积极探索和应用 AI 教育。
2025-02-25
如何让企业微信可以接上 AI?让我的企业微信号变成一个 AI 客服
要让企业微信接上 AI 并变成一个 AI 客服,可以参考以下内容: 1. 基于 COW 框架的 ChatBot 实现方案:这是一个基于大模型搭建的 Chat 机器人框架,可以将多模型塞进微信(包括企业微信)里。张梦飞同学写了更适合小白的使用教程,链接为: 。 可以实现打造属于自己的 ChatBot,包括文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等功能,以及常用开源插件的安装应用。 正式开始前需要知道:本实现思路需要接入大模型 API 的方式实现(API 单独付费)。 风险与注意事项:微信端因为是非常规使用,会有封号危险,不建议主力微信号接入;只探讨操作步骤,请依法合规使用,大模型生成的内容注意甄别,确保所有操作均符合相关法律法规的要求,禁止将此操作用于任何非法目的,处理敏感或个人隐私数据时注意脱敏,以防任何可能的滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等;多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等等;多消息类型支持,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能;多部署方法,如本地运行、服务器运行、Docker 的方式。 2. DIN 配置:先配置 FastGpt、OneAPI,装上 AI 的大脑后,可体验知识库功能并与 AI 对话。新建应用,在知识库菜单新建知识库,上传文件或写入信息,最后将拥有知识库能力的 AI 助手接入微信。
2025-05-09
围棋AI
围棋 AI 领域具有重要的研究价值和突破。在古老的围棋游戏中,AI 面临着巨大挑战,如搜索空间大、棋面评估难等。DeepMind 团队通过提出全新方法,利用价值网络评估棋面优劣,策略网络选择最佳落子,且两个网络以人类高手对弈和 AI 自我博弈数据为基础训练,达到蒙特卡洛树搜索水平,并将其与蒙特卡洛树搜索有机结合,取得了前所未有的突破。在复杂领域 AI 第一次战胜人类的神来之笔 37 步,也预示着在其他复杂领域 AI 与人类智能对比的进一步突破可能。此外,神经网络在处理未知规则方面具有优势,虽然传统方法在处理象棋问题上可行,但对于围棋则困难重重,而神经网络专门应对此类未知规则情况。关于这部分内容,推荐阅读《这就是 ChatGPT》一书,其作者备受推崇,美团技术学院院长刘江老师的导读序也有助于了解 AI 和大语言模型计算路线的发展。
2025-05-08
什么AI工具可以实现提取多个指定网页的更新内容
以下 AI 工具可以实现提取多个指定网页的更新内容: 1. Coze:支持自动采集和手动采集两种方式。自动采集包括从单个页面或批量从指定网站中导入内容,可选择是否自动更新指定页面的内容及更新频率。批量添加网页内容时,输入要批量添加的网页内容的根地址或 sitemap 地址然后单击导入。手动采集需要先安装浏览器扩展程序,标注要采集的内容,内容上传成功率高。 2. AI Share Card:能够一键解析各类网页内容,生成推荐文案,把分享链接转换为精美的二维码分享卡。通过用户浏览器,以浏览器插件形式本地提取网页内容。
2025-05-01
AI文生视频
以下是关于文字生成视频(文生视频)的相关信息: 一些提供文生视频功能的产品: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多相关网站可查看:https://www.waytoagi.com/category/38 。 制作 5 秒单镜头文生视频的实操步骤(以梦 AI 为例): 进入平台:打开梦 AI 网站并登录,新用户有积分可免费体验。 输入提示词:涵盖景别、主体、环境、光线、动作、运镜等描述。 选择参数并点击生成:确认提示词无误后,选择模型、画面比例,点击「生成」按钮。 预览与下载:生成完毕后预览视频,满意则下载保存,不理想可调整提示词再试。 视频模型 Sora:OpenAI 发布的首款文生视频模型,能根据文字指令创造逼真且充满想象力的场景,可生成长达 1 分钟的一镜到底超长视频,视频中的人物和镜头具有惊人的一致性和稳定性。
2025-04-20
学AI上钉钉
以下是在钉钉上学 AI 的相关内容: 从 AI 助教到智慧学伴的应用探索: 登录钉钉客户端,在右上角依次选择钉钉魔法棒、AI 助理、创建 AI 助理。进入创建 AI 助理页面后,填写 AI 助理信息,设置完成即可创建成功。 AI 领导力向阳乔木:未提及具体的在钉钉上学 AI 的操作方法。 基于 COW 框架的 ChatBot 实现步骤: 创建应用: 进入,登录后点击创建应用,填写应用相关信息。 点击添加应用能力,选择“机器人”能力并添加。 配置机器人信息后点击发布,发布后点击“点击调试”,会自动创建测试群聊,可在客户端查看。点击版本管理与发布,创建新版本发布。 项目配置: 点击凭证与基础信息,获取 Client ID 和 Client Secret 两个参数。 参考项目,将相关配置加入项目根目录的 config.json 文件,并设置 channel_type:"dingtalk",注意运行前需安装依赖。 点击事件订阅,点击已完成接入,验证连接通道,会显示连接接入成功。 使用:与机器人私聊或将机器人拉入企业群中均可开启对话。
2025-04-19
AI术语解释
以下是一些常见的 AI 术语解释: Agents(智能体):一个设置了一些目标或任务,可以迭代运行的大型语言模型。与大型语言模型在像 ChatGPT 这样的工具中的通常使用方式不同,Agent 拥有复杂的工作流程,模型本质上可以自我对话,无需人类驱动每一部分的交互。属于技术范畴。 ASI(人工超级智能):尽管存在争议,但通常被定义为超越人类思维能力的人工智能。属于通识范畴。 Attention(注意力):在神经网络的上下文中,有助于模型在生成输出时专注于输入的相关部分。属于技术范畴。 Bias(偏差):AI 模型对数据所做的假设。“偏差方差权衡”是模型对数据的假设与给定不同训练数据的模型预测变化量之间必须实现的平衡。归纳偏差是机器学习算法对数据的基础分布所做的一组假设。属于技术范畴。 Chatbot(聊天机器人):一种计算机程序,旨在通过文本或语音交互模拟人类对话。通常利用自然语言处理技术来理解用户输入并提供相关响应。属于通识范畴。 CLIP(对比语言图像预训练):由 OpenAI 开发的 AI 模型,用于连接图像和文本,使其能够理解和生成图像的描述。属于技术范畴。 TPU(张量处理单元):谷歌开发的一种微处理器,专门用于加速机器学习工作负载。属于技术范畴。 Training Data(训练数据):用于训练机器学习模型的数据集。属于技术范畴。 Transfer Learning(迁移学习):机器学习中的一种方法,其中对新问题使用预先训练的模型。属于技术范畴。 Validation Data(验证集):机器学习中使用的数据集的子集,独立于训练数据集和测试数据集。用于调整模型的超参数(即架构,而不是权重)。属于技术范畴。 Knowledge Distillation(数据蒸馏):数据蒸馏旨在将给定的一个原始的大数据集浓缩并生成一个小型数据集,使得在这一小数据集上训练出的模型,和在原数据集上训练得到的模型表现相似。在深度学习领域中被广泛应用,特别是在模型压缩和模型部署方面。可以帮助将复杂的模型转化为更轻量级的模型,并能够促进模型的迁移学习和模型集成,提高模型的鲁棒性和泛化能力。属于技术范畴。 RAG(检索增强生成):检索增强生成。属于技术范畴。 Forward Propagation(前向传播):在神经网络中,输入数据被馈送到网络并通过每一层(从输入层到隐藏层,最后到输出层)以产生输出的过程。网络对输入应用权重和偏差,并使用激活函数生成最终输出。属于技术范畴。 Foundation Model(基础模型):在广泛数据上训练的大型 AI 模型,旨在适应特定任务。属于技术范畴。 GAN(通用对抗网络):一种机器学习模型,用于生成类似于某些现有数据的新数据。使两个神经网络相互对抗:一个“生成器”,创建新数据,另一个“鉴别器”试图将数据与真实数据区分开来。属于技术范畴。 Generative AI/Gen AI(生成式 AI):AI 的一个分支,专注于创建模型,这些模型可以根据现有数据的模式和示例生成新的原创内容,例如图像、音乐或文本。属于通识范畴。 GPU(图形处理单元):一种特殊类型的微处理器,主要用于快速渲染图像以输出到显示器。在执行训练和运行神经网络所需的计算方面也非常高效。属于产品范畴。
2025-04-18