直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
文生图lora微调
以下是关于文生图 lora 微调的详细内容: 定主题:明确您需要生成的图片的主题、风格和要表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的 checkpoint,如麦橘、墨幽的系列模型,如麦橘写实、麦橘男团、墨幽人造人等。 选择 lora:基于生成内容寻找重叠的 lora,以控制图片效果和质量,可参考广场上优秀帖子中使用的 lora。 ControlNet:可控制图片中特定图像,如人物姿态、生成特定文字或艺术化二维码等,属于高阶技能。 局部重绘:下篇再教。 设置 VAE:无脑选择 840000 即可。 Prompt 提示词:用英文写需求,使用单词和短语组合,不用管语法,单词、短语间用英文半角逗号隔开。 负向提示词 Negative Prompt:同样用英文写要避免的内容,单词和短语组合,用英文半角逗号隔开。 采样算法:一般选 DPM++ 2M Karras 较多,也可参考 checkpoint 详情页上模型作者推荐的采样器。 采样次数:选 DPM++ 2M Karras 时,采样次数通常在 30 40 之间。 尺寸:根据个人喜好和需求选择。 以下是一个简笔水彩风格插画的示例: 使用大模型“Flat 2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复可拉到 11)。搭配两个 lora,“Chinese painting style”可增加中国画水彩风格效果,权重设为 0.4;“Crayon drawing”可添加简单线条和小孩子笔触,权重设为 0.8。将图片丢到标签器中反推关键词,发送到“文生图”。在正向提示词末尾添加这两个 lora,尺寸按参考图设置,重绘幅度开 0.5 让 AI 更自由发挥,若想更接近原图可降低数值。将图放入 ControlNet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。
2024-10-05
如何制作AI二次元动画
以下是一些关于制作 AI 二次元动画的方法和资源: 1. 您可以参考视频“”,其步骤为:通过 Midjourney 生成图像后,使用 let's enhance.io 增强图像质量,然后使用 Monster Mash 将图像转换为 3D,再导入 Cinema 4D 进行材质、光影以及场景布置,最后使用 After Effects 进行渲染和处理。 2. 对于构建数字人躯壳,开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎等驱动方式又更加轻量和简单。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D。 3. 如果您想制作 AI 海报,可使用无界 AI(网址:https://www.wujieai.cc/),其做图逻辑类似于 SD,优势在于国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。在制作二次元风格海报时,可选择皮克斯卡通模型,设定相关关键词类别,如场景(向日葵花田、面包店等)、氛围(温馨、温暖等)、人物(父亲和女儿、父亲和儿子等)、造型(发型、发色、服饰、配饰等)、情绪(笑得很开心、大笑、对视等)、道具(童话书等)、构图(半身、中景等)、画面(色彩明艳)等。
2024-10-05
免费的AI绘画制作软件
以下为您推荐几款免费的 AI 绘画制作软件: 1. 扣子 + ByteArtist 网址:https://www.coze.cn/home 优点:不需要?,无收费,可以直接生成 注册:手机号或抖音号或飞书号 操作步骤:需要在 coze 的 bot 里面添加绘图插件 时间:5min 2. MewXAI 网址:https://www.mewxai.cn/ 功能介绍: MX 绘画:拥有众多超火模型,上百种风格,只需一句话即可让文字变为艺术画作,支持文生图、图生图,可玩性极强。 MX Cute:自研的可爱风动漫大模型,融合了想象力和逻辑性,呈现出优秀的图片质感。 MJ 绘画:创意度和想象力极高,适用于多种场景。 边缘检测:可以对草图进行上色,有多种渲染风格可供挑选。 室内设计:上传空间图,可一键完成多种不同风格的室内/建筑设计。 姿态检测:通过姿态识别实现对人物动作的精准控制。 AI 艺术二维码:利用人工智能创建令人惊叹的下一代艺术二维码。 AI 艺术字:把光影文字、隐藏文字、艺术字融入艺术作品。 3. Midjourney 网址:https://www.midjourney.com/explore?tab=random 优点:图片和描述相关性更大,风格更加显著 限制:需要?,需要 gmail 注册,不免费,在 discord 上代理使用 时间:30 60min 价格:8$一个月/ 200 张图
2024-10-05
免费的AI工具
以下为您介绍一些免费的 AI 工具: 思维导图相关: GitMind:免费的跨平台 AI 思维导图软件,支持多种模式,可通过 AI 自动生成思维导图。 ProcessOn:国内思维导图+AIGC 的工具,能利用 AI 生成思维导图。 AmyMind:轻量级在线 AI 思维导图工具,无需注册登录,支持自动生成节点。 Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路,生成文章大纲。 TreeMind:“AI 人工智能”思维导图工具,输入需求由 AI 自动完成思维导图生成。 EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能。 会议内容转文字: 飞书妙记:飞书的办公套件之一。 通义听悟:阿里推出的 AI 会议转录工具。 讯飞听见:讯飞旗下智慧办公服务平台。 Otter AI:转录采访和会议纪要。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 绘制逻辑视图、功能视图、部署视图: Lucidchart:流行的在线绘图工具,支持多种视图创建,用户可拖放界面轻松创建架构图。 Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 ArchiMate:开源建模语言,与 Archi 工具配合使用,支持逻辑视图创建。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图创建。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 draw.io(现 diagrams.net):免费在线图表软件,支持多种类型图表创建。 PlantUML:文本到 UML 转换工具,通过编写描述性文本自动生成相关视图。 Gliffy:基于云的绘图工具,提供多种架构图创建功能。 Archi:免费开源工具,支持逻辑视图创建。 Rational Rose:IBM 的 UML 工具,支持多种视图创建。
2024-10-05
如何提交一个新的 AI 应用
提交一个新的 AI 应用通常需要以下步骤: 1. 了解相关的监管要求和指导:政府会与监管机构合作,为其提供支持和指导,以确保在应用原则时采取适当的措施,例如采用适度的方法促进增长和创新,考虑适度的措施解决优先风险等。 2. 参考相关案例:如“AI Fairness Insurance Limited”公司在当前相关监管要求的复杂情况下延迟了新 AI 应用的部署,新的监管框架可能会改善这种情况。 3. 对于代码相关的应用: 可以阅读如“https://cursor.com/blog/instantapply”等关于如何构建即时申请的信息。 使用 Cursor 的 Apply 功能,按聊天代码块右上角的播放按钮快速集成代码块建议。对于更复杂的 AI 驱动的代码更改,建议使用 Chat + Apply。 应用代码块后,可浏览差异并通过点击聊天代码块右上角的“接受”或“拒绝”按钮,或者使用 Ctrl/⌘ Enter 键接受、Ctrl/⌘ Backspace 键拒绝来决定是否接受更改。 4. 如果希望在 AI 应用方面继续精进,还需要了解以下知识: AI 背景知识:包括基础理论(人工智能、机器学习、深度学习的定义及关系)、历史发展(重要里程碑)。 数学基础:统计学基础(均值、中位数、方差等)、线性代数(向量、矩阵等)、概率论(条件概率、贝叶斯定理)。 算法和模型:监督学习(线性回归、决策树、支持向量机等)、无监督学习(聚类、降维等)、强化学习。 评估和调优:性能评估(交叉验证、精确度、召回率等)、模型调优(网格搜索等技术优化模型参数)。 神经网络基础:网络结构(前馈网络、卷积神经网络、循环神经网络)、激活函数(ReLU、Sigmoid、Tanh)。
2024-10-05
推荐一个制作ui的工具
以下为您推荐一些制作 UI 的工具: 1. Stable Diffusion WebUi:这是一个基于 Gradio 库的开源工具,由个人大神 automatic1111 开发,在全球开发者贡献下成为强大的主流生产工具。 懒人包:适用 Windows 平台,可参考 B 站赛博菩萨大佬@秋葉 aaaki 提供的懒人整合包及相关安装视频。 2. Diagram:专为 UI 而生的 AI 模型,其功能包括通过文本生成 UI 设计稿、在设计过程中自动给出建议、给出改善已有设计的方案、使用设计系统规范生成界面设计以及解答设计疑问,还能生成图表、图片、字体等一系列 UI 资产。 3. Plus:提供多项服务,包括实时网站截图、定制市场研究报告、自动生成客户报告、创建在线课程和培训材料、自动生成策略和研究报告等。 4. Graphy:AI 图表生成和美化应用,用自然语言输入需求后会自动创建对应的图表,也支持对上传的数据进行分析并给出结论。 5. DEXA:英语不好又想摄入英文播客时,这个工具不错,可以针对喜欢的播客跟机器人交谈获得播客内容的信息。 6. Dream 3D:位于纽约布鲁克林的软件公司推出的工具,将直观的界面与机器智能相结合,使任何人都能轻松创建美丽的计算机图形。 7. 即时设计:https://js.design/ ,可在线使用的「专业 UI 设计工具」,为设计师提供更加本土化的功能和服务,注重云端文件管理、团队协作,并将设计工具与更多平台整合,一站搞定全流程工作。 8. V0.dev:https://v0.dev/ ,Vercel Labs 推出的 AI 生成式用户界面系统,每个人都能通过文本或图像生成代码化的用户界面,基于 Shadcn UI 和 Tailwind CSS 生成复制粘贴友好的 React 代码。 9. Wix:https://wix.com/ ,用户友好的 AI 工具,可在没有任何编码知识的情况下轻松创建和自定义自己的网站,提供广泛的模板和设计供选择,以及移动优化和集成电子商务功能等功能。 10. Dora:https://www.dora.run/ ,使用 Dora AI,可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。支持文字转网站,生成式 3D 互动,高级 AI 动画。 请注意,部分内容由 AI 大模型生成,请仔细甄别。
2024-10-05
帮我查找logo是m的对话ai平台
以下是一些可能的 logo 是“m”的对话 AI 平台: 竹间: Poe AI 平台:是一个 AI 聊天网站,支持与多个智能 AI 机器人进行实时在线交流,包括 GPT4 等。官网地址是:https://poe.com/ ,可以在官网帮助中心上找到它的具体教程。
2024-10-05
克隆声音有声好的工具
以下是一些声音克隆的工具: XiaoHu.AI 日报中提到的,由 SenseVoice 和 CosyVoice 构成,仅需几秒音频样本就能进行声音克隆,无需额外训练数据,还能控制情绪情感、语速、音高。详细内容:https://xiaohu.ai/p/10954 项目地址:https://funaudiollm.github.io 在线演示:https://modelscope.cn/studios/iic/CosyVoice300M https://x.com/imxiaohu/status/1810239744812679271 ElevenLabs 推出的全自动化的 AI 配音或视频翻译工具,上传视频或粘贴视频链接,能在几十秒到几分钟内将视频翻译成 29 种语言,还能克隆原视频里面的声音。 豆包的音色模仿,读大概 20 个字的句子,5 秒就可生成非常像的音色,之后可用自己的声音读生成的文字内容。 剪映也出了新的声音克隆功能,效果不错。
2024-10-05
抖音数字人平台
以下是关于抖音数字人的相关信息: 剪映数字人的优势: 剪映作为字节跳动旗下产品,在抖音平台广泛应用于短视频创作和编辑。其海外版 CapCut 登顶过美国 App Store,在全球各国 App Store 和 Google Play 平台上的安装总量已超过 2.5 亿次,在美国市场内的安装总量接近 950 万次。 拥有六大 AI 功能,解决了用数字人做视频的痛点,在编辑器里就能完成脚本生成→语音克隆→数字人口播的环节。 制作流程: 1. 打开剪映,添加文本到文字轨道,修改好需要朗读的文字。 2. 点击朗读,进行声音克隆,念一句话即可完成克隆。 3. 克隆完成后,选择喜欢的数字人形象,并换上自己的克隆音色。 4. 一键智能生成字幕,自行调整文字样式并校准。 数字人“私有化”: 尽管剪映有很多公模数字人,但私模数字人更受欢迎。可通过以下步骤实现: 1. 打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费。点击红框对应的 URL 打开操作界面。 2. 点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 AI 数字人的类型和应用场景: 1. 二维/三维虚拟人:用于游戏、IP 品牌(柳夜熙)、内容创作()等。 2. 真人形象数字人:用于直播卖货,营销/投流广告视频录制(Heygen)、语言学习(CallAnnie)等等。 AI 数字人的价值: 1. 代替人说话,提升表达效率和营销效率。比如真人做不到 24 小时直播,但数字人可以。 2. 创造真实世界无法完成的对话或交流。例如 AI talk 的实验探索,复活故去的亲人等。 AI 数字人面临的问题: 1. 平台限制:目前数字人水平参差不齐,平台担心直播观感,有一定打压限制。比如抖音出台一些标准,而微信视频号容忍度更低,人工检查封号。 2. 技术限制:形象只是皮囊,智能水平和未来想象空间,依赖大模型技术提升。 3. 需求限制:直播带货算个落地场景,但不刚。“懂得都懂”的刚需场景,国内搞不了。目前更多是体验新鲜感。 4. 伦理/法律限制:声音、影像版权等,比如换脸、数字永生等等。 剪映下载地址: capcut 下载地址: 有关数字人使用上的问题,欢迎在底部评论区留言,一起交流。同时如果对数字人课程感兴趣的话,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程! 在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0 ?:aiwarts101
2024-10-05
如何学习使用AI?
以下是关于如何学习使用 AI 的全面指导: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。同时,建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 此外,关于如何用 AI 进行英语学习和数学学习: 英语学习 1. 智能辅助工具:利用 AI 写作助手(如 Grammarly)进行英语写作和语法纠错,帮助改进英语表达和写作能力。 2. 语音识别和发音练习:使用语音识别应用(如 Call Annie)进行口语练习和发音纠正,让 AI 提供实时反馈和建议。 3. 自适应学习平台:使用自适应学习平台(如 Duolingo)利用 AI 技术为您量身定制学习计划,提供个性化的英语学习内容和练习。 4. 智能导师和对话机器人:利用智能对话机器人(如 ChatGPT)进行英语会话练习和对话模拟,提高交流能力和语感。 数学学习 1. 自适应学习系统:使用自适应学习系统(如 Khan Academy)结合 AI 技术为您提供个性化的数学学习路径和练习题,根据您的能力和需求进行精准推荐。 2. 智能题库和作业辅助:利用智能题库和作业辅助工具(如 Photomath)通过图像识别和数学推理技术为您提供数学问题的解答和解题步骤。 3. 虚拟教学助手:使用虚拟教学助手(如 Socratic)利用 AI 技术为您解答数学问题、提供教学视频和答疑服务,帮助您理解和掌握数学知识。 4. 交互式学习平台:参与交互式学习平台(如 Wolfram Alpha)的数学学习课程和实践项目,利用 AI 技术进行数学建模和问题求解。 关于如何用 AI 学习一门外语: 1. 设定目标:明确学习目标和时间表,分阶段完成学习任务。 2. 多样化练习:结合听、说、读、写多种方式进行练习,全面提升语言技能。 3. 模拟真实环境:尽量多与母语者交流,或使用 AI 对话助手模拟真实对话场景。 4. 定期复习:使用 AI 工具的复习功能,根据记忆曲线定期复习已学内容,巩固记忆。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-05