直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
Lora模型训练
以下是关于 Lora 模型训练的相关内容: 一、用 SD 训练一套贴纸 LoRA 模型的要点 1. 训练数据集准备:包括训练素材处理、图像预处理、打标优化。 2. 训练环境参数配置:选择本地或云端训练环境,进行训练环境配置和训练参数配置。 3. 模型训练:基于 kohyass 训练模型。 4. 模型测试:通过 XYZ plot 测试模型。 二、郑敏轩:Flux 的 Lora 模型训练 1. 所需模型下载:t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。 注意事项: 不使用时,模型放置位置不限,只要知道路径即可。 训练时,建议使用 flux1dev.safetensors 版本的模型和 t5xxl_fp16.safetensors 版本的编码器。 2. 下载脚本: 夸克网盘链接:https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接:https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码:pfsq 三、100 基础训练大模型 1. 步骤一·创建数据集 进入厚德云模型训练数据集:https://portal.houdeyun.cn/sd/dataset 在数据集一栏中,点击右上角创建数据集,输入数据集名称。 可以上传包含图片+标签 txt 的 zip 文件,也可以只有图片(之后可在 c 站使用自动打标功能),或者一张一张单独上传照片。 Zip 文件里图片名称与标签文件应当匹配,例如:图片名"1.png",对应的达标文件就叫"1.txt"。 上传 zip 以后等待一段时间,确认创建数据集,返回到上一个页面,等待一段时间后上传成功,可点击详情检查,预览数据集的图片以及对应的标签。 2. 步骤二·Lora 训练 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 选择数据集,点击右侧箭头,选择上传过的数据集。 触发词可有可无,取决于数据集是否有触发词。 模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 训练参数可调节重复次数与训练轮数,厚德云会自动计算训练步数,若不知如何设置,可默认 20 重复次数和 10 轮训练轮数。 可按需求选择是否加速,点击开始训练,会显示所需要消耗的算力,然后等待训练,会显示预览时间和进度条。 训练完成后会显示每一轮的预览图,鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。
2024-10-22
go-to-market过程中AI可以提供什么帮助
在 gotomarket 过程中,AI 能够提供多方面的帮助: 1. 产品照片创作:像 Flair、Booth 和 Bloom 这样的工具可以帮助品牌创建引人注目的产品照片,例如将挂在衣架上的连衣裙的静态照片变成女人穿着裙子在花园里行走的形象,未来还可能实现极度个性化,如展示沙发摆放在您公寓中的照片。 2. 营销材料制作:AdCreative 和 Pencil 可以制作用于电子邮件或社交媒体的营销材料,Frase 或 Writesonic 可以编写经过 SEO 优化的产品描述。最终,用户有望仅通过描述期望的审美并点击按钮,就能创建一个完整的电商商店以及用于市场营销的材料。 3. 营销领域的 AI 工具: Synthesia:允许用户创建由 AI 生成的高质量视频,包括数字人视频,提供多种定价计划,可用于制作营销视频、产品演示等。 HeyGen:基于云的 AI 视频制作平台,用户可从 100 多个 AI 头像库中选择,并通过输入文本生成数字人视频,适合制作营销视频和虚拟主持人等。 Jasper AI:人工智能写作助手,可用于生成营销文案、博客内容、电子邮件等,提供多种语气和风格选择,写作质量较高。 Copy.ai:AI 营销文案生成工具,可快速生成广告文案、社交媒体帖子、电子邮件等营销内容,有免费和付费两种计划。 Writesonic:AI 写作助手,专注于营销内容创作,如博客文章、产品描述、视频脚本等,提供多种语气和行业定制选项。 更多的营销产品可以查看 WaytoAGI 网站:https://www.waytoagi.com/sites?tag=8 。总的来说,这些 AI 工具能够帮助营销人员高效创作各种营销内容,提高工作效率。用户可根据实际需求选择合适的工具。但需注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-22
有什么可以医生工作使用的AI吗
以下是一些可用于医生工作的 AI 应用: 1. 在医疗健康生物制药的研究方面,ChatGPT、Google Bard 等技术极大地加速了相关研究,AI 在抗癌、抗衰老、早期疾病防治等的研究应用中起着重要作用。例如,AI 能够提前三年诊断胰腺癌;两名高中生与医疗技术公司合作,利用 AI 发现了与胶质母细胞瘤相关的新靶基因;AI 还能帮助抗衰老,筛查出高效的药物候选物;在寻找阿尔兹海默症和早期诊断帕金森病的治疗方法上,AI 也发挥了作用。 2. 为了在医疗保健中产生真正的改变,应投资创建像优秀医生和药物开发者那样学习的模型生态系统。医生将把文档工作交给 AI 书记员,初级医疗服务提供者将依赖聊天机器人进行分诊,AI 还能加速药物开发。 3. 具体应用场景包括: 医学影像分析:用于分析医学图像,辅助诊断疾病。 药物研发:加速药物研发过程,识别潜在药物候选物和设计新疗法。 个性化医疗:分析患者数据,提供个性化治疗方案。 机器人辅助手术:控制手术机器人,提高手术精度和安全性。
2024-10-22
你是基于什么大模型做的知识库
以下是关于大模型和知识库的相关知识: 1. RAG(检索增强生成)技术:利用大模型搭建知识库是 RAG 技术的应用。大模型训练数据有截止日期,当需要依靠不在训练集中的数据时,可通过 RAG 实现。RAG 包括文档加载、文本分割、存储(包括嵌入和向量数据存储到向量数据库)、检索、输出(把问题及检索出的嵌入片提交给 LLM 生成答案)等 5 个过程。文档加载可从多种来源加载不同类型的文档,文本分割将文档切分为指定大小的块。 2. 硬件配置要求:运行大模型需要较高的机器配置。生成文字大模型最低配置为 8G RAM + 4G VRAM,建议配置为 16G RAM + 8G VRAM,理想配置为 32G RAM + 24G VRAM(跑 GPT3.5 差不多性能的大模型);生成图片大模型最低配置为 16G RAM + 4G VRAM,建议配置为 32G RAM + 12G VRAM;生成音频大模型最低配置为 8G VRAM,建议配置为 24G VRAM。 3. 实例:在一个设定中,使用阿里千问模型,设定角色为“美嘉”,知识库为《爱情公寓》全季剧情,实现问答。
2024-10-22
我想要个视频AI模糊变高清的工具
以下为您介绍两款可将视频 AI 模糊变高清的工具: 1. Topaz Video AI: 解压对应文件,推荐使用绿色版(安装包已在网盘,可直接下载)。 右键管理员运行 VideoAIportable.exe 文件。 导入处理好的视频。 主界面左边是原视频,右边是待处理视频,下面是对应的视频轨道。 右边部分是主要对视频处理的方式,预设部分主要有放大视频、提升画质、提升帧率等功能。 视频部分保持默认,稳定 AI 用于画面稳定和减少抖动,模式分为自动裁切和完整帧,强度在 60 左右,抖动需开启,次数一般选择 2。 消除运动模糊 AI 按字面意思操作,帧插值 AI 可识别帧之间进行修复替换,增强 AI 能选择不同模型对视频整体优化,包括面部、去噪、锐化提升等。 一般会选择稳定+运动模糊,若电脑配置不行,可一个一个操作,但速度较慢。 2. FMANet: 能将模糊低分辨率视频恢复为清晰高分辨率。 可解决快速移动物体或摄像机引起的视频模糊。 智能理解物体运动,改善画质,去除模糊。 相关网址:http://kaistviclab.github.io/fmanetsite/ 、https://x.com/xiaohuggg/status/1746160750610075689?s=20
2024-10-22
如何使用ai制作专业视频?
使用 AI 制作专业视频的流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 现阶段 AI 视频生成的应用场景包括: 1. 专业创作者(艺术家、影视人等):AI 生成能够为作品赋予独特风格和想象力,为创作者提供灵感,配合高超的剪辑技巧和叙事能力,便可以制作出超乎想象的效果。低成本动捕更是能够大幅降低后期制作的门槛和成本,自动识别背景生成绿幕、视频主体跟随运动等能够辅助视频编辑,为后期制作增加更多空间。目前该应用主要集中在音乐 MV、短篇电影、动漫等方向。一些 AI 视频平台也积极寻求创意合作,为创作者提供免费支持。 2. 自媒体、非专业创作者:这部分人群通常有着非常具体且明确的视频剪辑痛点。比如科技、财经、资讯类重脚本内容的视频在制作时需花费大量时间寻找视频素材、还需注意视频版权问题。一些产品(Invideo AI、Pictory)已经在发力脚本生成分镜、视频,帮助创作者降低视频素材制作门槛。Gamma AI 已经实现了文章高效转 PPT 的能力,若能结合 Synthesia、HeyGen AI、DID 等产品的 Avatar、语音生成能力也可快速转化为视频内容。不同平台适合不同内容形式,创作者想要将同一个素材在不同平台分发就意味着制作成本的升高。而 OpusClip 提供的长视频转短视频致力于解决这一痛点。 3. 企业客户:对于没有足够视频制作资金的小企业、非盈利机构来说,AI 视频生成可以为其大幅缩减成本。 制作视频的相关工具推荐: 最佳动画工具:用于在视频中为人脸制作动画的 DiD(https://www.did.com/)。用于从文本创建视频的 Runway v2(https://app.runwayml.com/) 最佳语音克隆:ElevenLabs(https://beta.elevenlabs.io/speechsynthesis) 同时需要注意,深度伪造是一个巨大的问题,这些系统需要合乎道德地使用。
2024-10-22
如何用AI生成PPT
以下是使用 AI 生成 PPT 的几种方法和步骤: 1. 使用 Process ON: 网址:https://www.processon.com/ 输入大纲和要点: 导入大纲和要点: 手动复制,相对比较耗时间。 导入方式: 1. 复制最终大纲的内容,到本地的 txt 文件后,将后缀改为.md。如果看不见后缀,可以自行搜索开启后缀。 2. 打开 Xmind 软件,将 md 文件导入 Xmind 文件中。 3. Process ON 导入 Xmind 文件。以导入方式新建思维导图,选择准备好的 Xmind 文件,导入成功。 输入主题自动生成大纲和要求:新增思维导图,输入主题,点击 AI 帮我创作,生成结束。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版,再点击下载。如果喜欢用 Process ON 的小伙伴,没有会员,可以某宝买个一天会员。 2. 使用闪击: 网址:国内网站,不需要魔法。地址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite 选择模版。 输入大纲和要点:由于闪击的语法和准备的大纲内容有一些偏差,可以参考下官方使用指南:https://zhuanlan.zhihu.com/p/607583650,将之前准备的大纲转换成适配闪击的语法。 生成 PPT:点击文本转 PPT,并且在提示框中选择确定,得到转换后的 PPT,在线编辑。 导出:导出有一些限制,PPT 需要会员才能导出。 3. AI 生成 PPT 的主要思路: 导入大纲到工具生成 PPT:以爱设计为例,其他工具基本上操作方式大同小异,都是基于 Markdown 语法的内容来完成 PPT 的生成。具体步骤,可以移步到 MindShow、闪击、爱设计等章节。 优化整体结构:按照公司要求,可以自行优化字体、图片等元素。针对下载后的 PPT,可以删改内容,以达到心理预期。
2024-10-22
做PPT目前最好的ai工具是什么
目前市场上有以下一些好用的做 PPT 的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 此外,还有以下工具: 1. 爱设计 2. 闪击 3. Process ON 4. WPS AI 目前市面上大多数 AI 生成 PPT 按照如下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-10-22
好用的ai工具有哪些
以下为您介绍一些好用的 AI 工具: 图生图产品: 1. Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,可将上传照片转换为芭比风格,效果佳。 AI 新闻写作工具: 1. Copy.ai:功能强大,提供丰富新闻写作模板和功能,可快速生成新闻标题、摘要、正文等内容。 2. Writesonic:专注写作,提供新闻稿件生成、标题生成、摘要提取等功能,算法智能,生成内容质量高。 3. Jasper AI:主打博客和营销文案,也可用于生成新闻类内容,写作质量较高,支持多种语言。 帮助建筑设计师审核规划平面图的 AI 工具: 1. HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型。 2. Maket.ai:面向住宅行业,在户型和室内软装设计方面有探索,能根据需求自动生成户型图。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,提供全新设计模式,可引入标准和规范约束设计结果。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,实现数据汇总与管理。 需要注意的是,这些 AI 工具都有一定局限性,如性能不稳定、生成内容不当等问题,且每个工具都有特定应用场景和功能,建议根据具体需求选择合适的工具。
2024-10-22
如何让微信bot以语音条格式回复消息?
要让微信 bot 以语音条格式回复消息,您可以参考以下步骤: 1. 找到高级下开场白,点击展开,填写开场白文案、开场白预置问题。 2. 勾选用户问题建议:在 Bot 回复后,根据 Prompt 提供最多 3 条用户提问建议。 3. 添加语音选择:让 Bot 不仅会写,还会通过语音跟您交流。 4. 点击“发布”,选择发布平台,其中包括 Bot Store、豆包、飞书、微信客服、微信公众号(服务号)、微信公众号(订阅号)、掘金等。微信客服是重点部分,相比其他平台发布到微信客服稍微复杂一些。 另外,对于零基础模板化搭建 AI 微信聊天机器人,还需注意: 1. 配置腾讯云轻量应用服务器。 2. 登录微信绑定 COW 组件,建议使用闲置微信号,避免使用日常使用的微信号,以免造成不必要的麻烦。按照以下操作进行登录:找到刚刚部署成功的 COW 服务对应的容器,点击日志按钮进入日志界面,将日志输出的界面滚动到最下面的位置,会看到登录微信的二维码,用闲置微信号扫码登录。若扫描二维码出现问题,可退回到容器配置处重启容器服务,再重新扫码登录。若想修改 COW 组件的配置,进入对应的编排模板的配置界面,点击模板编辑,修改对应的配置参数,保存后回到容器编排界面重新部署新的容器编排。
2024-10-22