「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
StableDiffusion 云服务
以下是关于 StableDiffusion 云服务的相关信息: 如果您的电脑配置较低,也可以通过云平台畅玩 StableDiffusion 并生成好看的图片。这里推荐使用“青椒云”,您可以点击以下链接下载:http://account.qingjiaocloud.com/signup?inviteCode=R0JJ9CHY 。 云平台的使用方法如下: 1. 点击上述链接,注册账号。 2. 下载并安装后,登录注册好的账户。 3. 点击右上角的个人中心进行实名认证。 4. 实名认证后回到主界面,点击新增云桌面。想玩 StableDiffusion 可以选“AIGC 尝鲜”,新注册一般会有优惠券,可免费试用。大多数云平台每小时费用约 2 3 元。 5. 在新弹出的框框中点击“开机”按钮,稍等之后点击“进入桌面”。进入桌面后弹出的全部框框可直接关掉。 6. 点击新打开桌面的“此电脑”,在 C 盘里找到 SD 的根目录,点击“A 启动器.exe”。 7. 点击右下角的“一键启动”即可进入 SD。 8. 用完云平台记得关机,否则会持续计费。 另外,SD 是 Stable Diffusion 的简称,它是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型,主要用于根据文本描述产生详细图像。其代码模型权重已公开发布,当前版本为 2.1 稳定版(2022.12.7),源代码库为 github.com/StabilityAI/stablediffusion 。 如果您要在本地安装部署 ComfyUI 副本,电脑硬件要求如下: 1. 系统:Windows 7 以上。 2. 显卡要求:NVDIA 独立显卡且显存至少 4G 起步。 3. 硬盘留有足够空间,最低 100G 起步(包括模型)。 同时,您需要依次下载并安装 python、Git、VSCode,安装过程中一直点击勾选对应选项,一直下一步。具体下载地址如下: 1. Python:https://www.python.org/downloads/release/python3119/ ,安装时选中“将 Python 添加到系统变量”。 2. VSCode:https://code.visualstudio.com/Download 。 3. Git:https://gitscm.com/download/win 。 4. 安装 CUDA:https://developer.nvidia.com/cuda1220downloadarchive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_network 。
2024-11-23
制作图片的AI工具,名字好像叫comfyUI
ComfyUI 是一个基于节点流程式的 stable diffusion AI 绘图工具 WebUI。 其优势包括: 1. 对显存要求相对较低,启动和出图速度快。 2. 生成自由度更高。 3. 可以和 webui 共享环境和模型。 4. 能搭建自己的工作流程,可导出并分享,报错时能清晰定位错误。 5. 生成的图片拖进后会还原整个工作流程,模型也会选择好。 劣势在于: 1. 操作门槛高,需要清晰的逻辑。 2. 生态不如 webui 丰富,但有针对其开发的有趣插件。 您可以从 github 上下载作者部署好环境和依赖的整合包,按照官方文档安装,官方链接为:https://github.com/comfyanonymous/ComfyUI 。 此外,有人认为如果 contornet 让 AI 绘画从玩具变成工具,那 ComfyUI 就是制作工具的工具。同时,藏师傅介绍了用 ComfyUI 三步制作任意公司周边图片的流程,整个流程分为获取 Logo 图片的描述、根据描述和生成意图生成图片提示词、将图片和提示词输入 ComfyUI 工作生成。
2024-11-23
如何安装
以下是关于不同软件安装的相关信息: Python 安装 FittenAI 编程助手: 配置 AI 插件前需先安装 Python 运行环境,可参考。 安装步骤:点击左上角的 File Settings Plugins Marketplace。 注册:安装完成后左侧会出现 Fitten Code 插件图标,注册登录后即可开始使用。 智能补全:按下 Tab 键接受所有补全建议;按下 Ctrl+→键接收单个词补全建议。 AI 问答:通过点击左上角工具栏中的 Fitten Code –开始新对话打开对话窗口进行对话。 自动生成代码:Fitten Code 工具栏中选择“Fitten Code 生成代码”,然后在输入框中输入指令即可生成代码。 代码转换:选中需要进行翻译的代码段,右键选择“Fitten Code –编辑代码”,然后在输入框中输入需求即可完成转换。 自动生成注释:Fitten Code 能够根据代码自动生成相关注释。 【SD】安装无需 Lora 的一键换脸插件 Roop: 安装时间较长,需耐心等待。 安装好后,打开 SD 文件目录下的相关文件夹,在地址栏输入“cmd”,然后回车。 在打开的 dos 界面里,粘贴“python m pip install insightface==0.7.3 user”,会自动开始安装 insightface。若此阶段出错,建议下载最新的秋叶 4.2 整合包(6 月 23 号更新),后台回复【SD】可下载。 安装完成后,重新打开启动器,后台会继续下载一些模型,需全程科学上网。完成这些后,Roop 插件可正常使用。 Python 安装灵码 AI 编程助手: 配置 AI 插件前需先安装 Python 运行环境,可参考。 安装步骤:点击左上角的 File Settings Plugins Marketplace。 登录:安装完成插件会提示登录,按要求注册登录即可。使用上和 Fitten 差不多。
2024-11-23
语音转文字
以下是关于语音转文字的相关信息: 推荐工具: OpenAI 的 wishper 相关链接: https://huggingface.co/openai/whisperlargev2 https://huggingface.co/spaces/sanchitgandhi/whisperjax 语音转文本(Speech to text)介绍: 语音转文本 API 提供了转录和翻译两个端点,基于开源大型v2 Whisper 模型。 可用于将音频转录为任何语言,将音频翻译并转录成英语。 文件上传限制为 25MB,支持的输入文件类型包括:mp3、mp4、mpeg、mpga、m4a、wav 和 webm。 快速入门: 转录:输入要转录的音频文件及所需输出格式的音频文字稿,默认响应类型为包含原始文本的 JSON,可通过添加更多带有相关选项的 form 行设置其他参数。 翻译:输入音频文件,输出为被翻译成英文的文本,目前仅支持英语翻译。 处理更长输入: 默认 Whisper API 仅支持小于 25MB 的文件。若音频文件更长,需将其分成小于 25MB 的块或使用压缩后格式,避免在句子中间断开声音。可使用 PyDub 开源 Python 软件包来拆分声频文件,但 OpenAI 对其可用性或安全性不作保证。 提示: 可提高 Whisper API 生成的转录质量。 模型会尝试匹配提示的风格,如大写和标点符号。 对模型经常错误识别的特定单词或缩略语,提示很有帮助。 用先前片段的转录引导模型可保留分段文件的上下文。 提示可避免转录中跳过标点符号。 提示可保留填充词汇。 对不同书写风格的语言,添加指示可改进处理问题。
2024-11-23
最新的AI资讯
以下是为您提供的最新 AI 资讯: 新手学习 AI 方面:AI 是快速发展的领域,新的研究成果和技术不断涌现。您可以关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 AIGC Weekly 32 方面: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器: 2024 人工智能报告方面: 全球芯片出口管制下,中国仍成重要市场。美国商务部长吉娜·雷蒙多警告英伟达,中国在美芯片制造商中所占的份额正在减少。字节跳动通过美国的甲骨文租用 NVIDIA H100 访问权限,而阿里巴巴和腾讯则与 NVIDIA 就在美国建立自己的数据中心进行谈判。与此同时,谷歌和微软直接向中国大型企业推销他们的云服务。 模型变得更便宜了。以前认为提供强大模型的成本过高,但现在提供这些模型的推断成本正在下降。OpenAI 更达到 100 倍下降!Google Gemini 生产了一种具有很强竞争力的定价系列!Gemini 1.5 Pro 和 1.5 Flash 的价格在推出后几个月内下降了 64%86%,而性能强劲,例如 Flash8B 比 1.5 Flash 贵 50%,但在许多基准测试中表现相当。注意:价格适用于<128K 令牌提示和输出。检索日期为 2024 年 10 月 4 日。考虑到计算成本很高,模型构建者越来越依赖与大型科技公司建立合作伙伴关系。反垄断监管机构担心这将进一步巩固现有公司的地位。
2024-11-23
那个文生视频或图生视频的AI可以生成融合变化的效果
以下是关于文生视频或图生视频的 AI 生成融合变化效果的相关信息: 在人工智能技术迅速发展的当下,AI“词生卡”技术兴起,它将文字描述转化为视觉图像,重塑了创意产业格局。AI 的多模态输出能力已基本成型,包括文生文、文生图、文生码、文生视频、图生视频等,但大多在某个维度能力强,跨界融合还不够。 从生成方式分类,AI 视频生成包含: 1. 文生视频、图生视频,如 Runway、Pika labs、SD + Deforum、SD + Infinite zoom、SD + AnimateDiff、Warpfusion、Stability Animation 等。 一些热门产品如 Luma AI,其 Dream Machine 目前支持 txt2vid 文生视频和 img2vid 图生视频两种能力,8 月底最新发布的 Dream Machine 1.5 增强了提示词理解能力和视频生成能力。Luma AI 的 img2vid 生成效果在多方面表现出色,如生成时长较长、运动幅度大、能产生相机多角度位移、运动过程一致性保持较好、分辨率高且有效改善模糊感等。
2024-11-23
怎么用ai制作由人变成动物的视频
以下是使用 AI 制作由人变成动物视频的方法: 一、创建视频内容 1. 准备内容 先准备一段视频中播放的内容文字,可以是产品介绍、课程讲解、游戏攻略等任何您希望推广让大家了解的文字。 您也可以利用 AI 来生成这段文字。 2. 制作视频 使用剪映 App 对视频进行简单处理。电脑端打开剪映 App,点击“开始创作”。 选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号,为视频添加一个文字内容的轨道。 在界面右侧将准备好的文字内容替换默认文本内容。 二、生成数字人 1. 生成数字人 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,如“婉婉青春”。 选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”,软件会根据提供的内容生成对应音视频并添加到当前视频轨道中。 左下角会提示渲染完成时间,完成后可点击预览按钮查看效果。 2. 增加背景图片 删除先前导入的文本内容。 点击左上角“媒体”菜单,点击“导入”按钮,选择本地一张图片上传。 点击图片右下角的加号将图片添加到视频轨道上(会覆盖数字人)。 点击轨道最右侧的竖线,向右拖拽直到视频最后,使图片在整个视频播放时都显示。 选中背景图片所在轨道,拖动图片的角将其放大到适合尺寸,并将数字人拖动到合适位置。 此外,如果您想创作一个生物融合成新物种的视频,例如猪和老鹰融合成一个新的物种,以 GPT4 为例的制作教程如下: 1. 故事情节的构思 构思一个吸引人的故事情节,比如新物种的起源故事,结合猪和老鹰的特点以及这种融合带来的独特能力和挑战,考虑添加神秘或奇幻元素增强阴暗风格。 2. 视觉效果的设计 使用 3D 建模和特效技术创造出既霸气又具有阴暗风格的新物种形象,高质量的视觉效果和流畅的动画能吸引更多观众并提高视频的分享率。 3. 音乐和声音设计 配置适当的背景音乐和声效,以增强视频的氛围,选择能激起观众情绪的音乐和声音效果,让视频更加引人入胜。 4. 社交媒体互动
2024-11-23
可以介绍下AGI的知识体系吗,从入门级开始
以下是为您介绍的 AGI 知识体系入门级内容: 首先,推荐您从以下几个方面开始了解: 1. 记忆相关基础知识,如 AI 的历史、基本术语、重要人物、方法和原理等。您可以通过以下链接获取详细信息: 其次,您可以先试用提示词练手,参加相关的 battle 活动,如 prompt battle、video battle 等,与大神交流。还可以关注最新活动,如 AI 春晚、AIPO 项目等,感兴趣的话可以报名参与执行导演、平面设计、商务统筹或运营等工作。 另外,“通往 AGI 之路”不仅是开源的 AI 知识库,更是连接 AI 学习者、实践者、创新者的社区,基于无边界组织完成了 AI 春晚、“离谱村”短片等共创项目。 市面上的【野菩萨的 AIGC 资深课】由工信部下属单位【人民邮电出版社】开设,是为数不多的值得推荐的 AI 课程之一,也是全网技术更新最快的课程!课程内容涵盖 AI 绘画、视听语言和 ChatGPT 等多个体系的知识。无论您是 AI 初学者还是进阶者,这门课程都能满足您的学习需求。您可以扫码添加菩萨老师助理,了解更多信息。
2024-11-23
AI分镜
以下是关于《李清照》AI 视频创作的分镜内容: |分镜|子分镜|分镜主视觉|配音|角色|配音|画面| |||||||| |8|0801<br>0802|嗯~谁在叫我<br>小姑娘,你从哪里来?你叫什么名字呀?|王维||| |9|0901 疑惑<br>0902 诗文|疑惑自言自语<br>疑惑的表情<br>看到明月松间照,清泉石上流惊喜|我叫什么名字呢?(疑惑)<br>哦~(惊讶)<br>李清照吟诵:明月松间照,清泉石上流。|少年李清照|| |10|1001 惊喜<br>1002 照清高亮|李清照灵机一动<br>墙上诗:明月松间照,清泉石上流。照和清高亮显示|背景音效:灵机一动|||| |11|11 得意|李清照脸部特写,惊喜表情|我叫李清照(高兴)|少年李清照|| |12|12 王维沉思|王维沉思|李清照~李清照,好名字、好名字|王维|| |13|13 夜景|明月下溪水潺潺|王维吟诵:明月松间照,清泉石上流。|王维|| |20|20|画面穿越到当代写字楼办公室|忙乱和电话铃声|背景声|| |21|21|面对电脑的李清照一脸茫然|||| |22|22|旁边两个同事聊天|你们打算什么时间要孩子?<br>要孩子,要什么孩子,我们是丁克家庭。|同事甲<br>同事乙|| |23|23|李清照满脑子疑惑,丁克是什么意思|疑问背景音|背景声|| |24|24|李清照查询丁克的意思,发现是不要孩子的家庭。|||| |25|25|旁边两个同事聊天|那你不打算结婚吗?<br>我才 30 岁,结哪门子婚,我的环游世界梦想还没有实现呢|同事甲<br>同事乙|| |26|26|李清照满脑子疑惑,为什么可以不结婚?怎么生活?|疑问背景音|背景声|| |27|27|李清照开始查阅资料|清照~清照~你不下班吗?<br>哦哦~我查点资料|同事甲<br>李清照|| |1||远景一个古装小女孩草丛中嬉戏|背景音乐:小女孩嬉戏声|||| |2|0201 欢快<br>0202 疑惑|李清照与蝴蝶对话:远景、特写|蝴蝶:你叫什么名字呀?(欢快)<br>李清照:嗯~嗯~我叫什么名字呢?(疑惑)|蝴蝶<br>少年李清照|| |3|0202 放大|李清照特写|||| |4|04 穿越唐代|李清照满是疑惑|画外音:这是什么地方?(疑惑)|少年李清照|| |5|《辋川别业》建筑|写有《辋川别业》的古代建筑|辋川别业、辋川别业,难到这是王维的住处!(恍然大悟)|少年李清照|| |6|06|《维摩诘诗集》特写|真的是王维(高兴)|少年李清照|| |7|07|李清照高兴奔向王维|王伯伯~王伯伯~(高兴)|少年李清照||
2024-11-23
学习AI
以下是针对新手学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,其上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库中有很多大家实践后的作品、文章分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识。 2. 尝试使用 AI 工具和平台: 使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-11-23