Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

怎么训练自己的小说大纲模型

Answer

训练自己的小说大纲模型可以参考以下步骤:

步骤一:创建数据集

  1. 进入厚德云-模型训练-数据集,网址为:https://portal.houdeyun.cn/sd/dataset 。
  2. 在数据集一栏中,点击右上角创建数据集。
  3. 输入数据集名称。
  4. 可以上传包含图片+标签的 zip 文件,也可以只有图片没有打标文件(之后可在 c 站使用自动打标功能)。
  5. 也可以一张一张单独上传照片,但建议提前把图片和标签打包成 zip 上传。
  6. Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。
  7. 上传 zip 以后等待一段时间。
  8. 确认创建数据集,返回到上一个页面,等待一段时间后上传成功,可以点击详情检查,可预览到数据集的图片以及对应的标签。

步骤二:Lora 训练

  1. 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。
  2. 选择数据集,点击右侧箭头,会跳出所有上传过的数据集。
  3. 触发词可有可无,取决于数据集是否有触发词。
  4. 模型效果预览提示词则随机抽取一个数据集中的标签填入即可。
  5. 训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。
  6. 可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。
  7. 然后等待训练,会显示预览时间和进度条。训练完成的会显示出每一轮的预览图。
  8. 鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。

步骤三:Lora 生图

  1. 点击预览模型中间的生图会自动跳转到这个页面。
  2. 模型上的数字代表模型强度,可以调节大小,正常默认为 0.8,建议在 0.6 - 1.0 之间调节。
  3. 也可以自己添加 lora 文件,点击后会显示训练过的所有 lora 的所有轮次。
  4. VAE 不需要替换。
  5. 正向提示词输入写的提示词,可以选择基于这个提示词一次性生成几张图。
  6. 选择生成图片的尺寸,横板、竖版、正方形。
  7. 采样器和调度器新手小白可以默认不换。
  8. 迭代步数可以按照需求在 20 - 30 之间调整。
  9. CFG 可以按照需求在 3.5 - 7.5 之间调整。
  10. 随机种子 - 1 代表随机生成图。
  11. 所有设置都好了以后,点击开始生态,生成的图会显示在右侧。
  12. 如果有哪次生成结果觉得很不错,想要微调或者高分辨率修复,可以点开那张图,往下滑,划到随机种子,复制下来,粘贴到随机种子这里,这样下次生成的图就会和这次的结果近似。
  13. 如果确认了一张很合适的种子和参数,想要高清放大,则点开高清修复,可以选择想放大的倍数。新手小白可以就默认这个算法,迭代步数也是建议在 20 - 30 之间,重回幅度根据需求调整,正常来说在 0.3 - 0.7 之间调整。

今日作业 按照比赛要求,收集六个主题中一个主题的素材并且训练出 lora 模型后提交 lora 模型与案例图像。提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd 。

另外,直接在 Comfy UI 中训练 LoRA 模型的步骤如下:

  1. 确保后面有一个空格。然后将 requirements_win.txt 文件拖到命令提示符中(如果在 Windows 上;否则,选择另一个文件 requirements.txt)。拖动文件将在命令提示符中复制其路径。
  2. 按 Enter 键,这将安装所有所需的依赖项,使其与 ComfyUI 兼容。请注意,如果为 Comfy 使用了虚拟环境,必须首先激活它。
  3. 教程:
    • 图像必须放在一个以[number]_[whatever]命名的文件夹中。那个数字很重要:LoRA 脚本使用它来创建一些步骤(称为优化步骤…但别问我是什么^^’)。它应该很小,比如 5。然后,下划线是必须的。
    • 对于 data_path,必须写入包含数据库文件夹的文件夹路径。例如:C:\database\5_myimages ,必须写 C:\database 。
    • 对于参数,在第一行,可以从 checkpoint 文件夹中选择任何模型。据说必须选择一个基本模型进行 LoRA 训练。但也可以尝试使用微调。
Content generated by AI large model, please carefully verify (powered by aily)

References

10-0基础训练大模型

进入厚德云-模型训练-数据集https://portal.houdeyun.cn/sd/dataset[heading2]步骤一·创建数据集[content]在数据集一栏中,点a击右上角创建数据集输入数据集名称这个zip文件可以是包含图片+标签txt,也可以只有图片没有打标文件(之后你可以在c站使用它的自动打标功能)你也可以一张一张单独上传照片,但还是建议提前把图片和标签打包成zip上传Zip文件里图片名称与标签文件应当匹配例如:图片名"1.png",对应的达标文件就叫"1.txt"。上传zip以后等待一段时间确认创建数据集返回到上一个页面,等待一段时间后就会上传成功,可以点击详情检查可以预览到数据集的图片以及对应的标签[heading2]步骤二· Lora训练[content]点击Flux,基础模型会默认是FLUX 1.0D版本选择数据集,点击右侧箭头,会跳出你所有上传过的数据集触发词可有可无,取决于你的数据集是否有触发词模型效果预览提示词则随机抽取一个你数据集里的标签填入即可训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数如果不知道如何设置,可以默认20重复次数和10轮训练轮数可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力然后就可以等待训练了,会显示预览时间和进度条训练完成的会显示出每一轮的预览图鼠标悬浮到你想要的轮次模型,中间会有个生图,点击会自动跳转到使用此lora生图的界面。点击下方的下载按钮则会自动下载到本地

10-0基础训练大模型

上图中,点击预览模型中间的生图会自动跳转到这个页面模型上的数字代表模型强度,可以调节大小,正常默认为0.8,建议在0.6-1.0之间调节当然,你也可以自己添加lora文件点击后会显示你训练过的所有lora的所有轮次VAE不需要替换正向提示词输入你写的提示词可以选择基于这个提示词一次性生成几张图选择生成图片的尺寸,横板、竖版、正方形采样器和调度器新手小白可以默认这个不换迭代步数可以按照需求在20-30之间调整CFG可以按照需求在3.5-7.5之间调整随机种子-1代表随机生成图所有设置都好了以后,点击开始生态,生成的图会显示在右侧如果有哪次生成结果你觉得很不错,想要微调或者高分辨率修复,可以点开那张图往下滑,划到随机种子,复制下来粘贴到i机种子这里,这样下次生成的图就会和这次的结果近似如果确认了一张很合适的种子和参数,想要搞清放大则点开高清修复,可以选择你想放大的倍数新手小白可以就默认这个算法迭代步数也是建议在20-30之间重回幅度根据需求调整,正常来说在0.3-0.7之间调整[heading1]今日作业[content]按照比赛要求,收集六个主题中一个主题的素材并且训练出lora模型后提交lora模型与案例图像提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd

直接在Comfy UI中训练LoRA模型

确保后面有一个空格。然后将requirements_win.txt文件拖到命令提示符中(如果你在Windows上;否则,我假设你应该选择另一个文件requirements.txt)。拖动文件将在命令提示符中复制其路径。按Enter键,这将安装所有所需的依赖项,使其与ComfyUI兼容。请注意,如果你为Comfy使用了虚拟环境,必须首先激活它。教程在使用自定义节点之前,有一些要注意的事项:你的图像必须放在一个以[number]_[whatever]命名的文件夹中。那个数字很重要:LoRA脚本使用它来创建一些步骤(称为优化步骤…但别问我是什么^^’)。它应该很小,比如5。然后,下划线是必须的。其余部分不重--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------p/对于data_path,你必须写入包含数据库文件夹的文件夹路径。因此,在这种情况下:C:\database\5_myimages你必须写C:\database至于终极问题:“斜杠还是反斜杠?”…不用担心!Python在这里需要斜杠,但节点会自动将所有反斜杠转换为斜杠。文件夹名称中的空格也不是问题。参数在第一行,你可以从checkpoint文件夹中选择任何模型。然而,据说你必须选择一个基本模型进行LoRA训练。这是为什么我不得而知。但你完全可以尝试使用微调,没有任何阻碍。但如果你想遵循规则,请确保在checkpoint文件夹中有一个基本模型!

Others are asking
有论文大纲怎么ai生成一篇完整的论文且文献要真实
利用 AI 生成一篇完整且文献真实的论文,您可以参考以下步骤和建议: 1. 确定课题主题:明确您的研究兴趣和目标,选择一个具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎(如 Semantic Scholar)和文献管理软件(如 Zotero)来搜集相关的研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成课题的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述:利用 AI 工具(如 Quillbot)来帮助撰写文献综述部分,确保内容的准确性和完整性。 6. 构建方法论:根据研究需求,利用 AI 建议的方法和技术来设计研究方法。 7. 数据分析:如果课题涉及数据收集和分析,可以使用 AI 数据分析工具(如 Google Colab、Knitro)来处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具(如 Grammarly)来撰写课题的各个部分,并进行语法和风格的检查。 9. 生成参考文献:使用 AI 文献管理工具来生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具来检查课题的逻辑性和一致性,并根据反馈进行修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具(如 Turnitin、Crossref Similarity Check)来确保课题的原创性,并进行最后的格式调整。 需要注意的是,AI 工具可以作为辅助,但不能完全替代研究者的专业判断和创造性思维。在使用 AI 进行课题写作时,应保持批判性思维,并确保研究的质量和学术诚信。 在论文写作领域,以下是一些常用的 AI 工具和平台: 1. 文献管理和搜索: Zotero:结合 AI 技术,可以自动提取文献信息,帮助研究人员管理和整理参考文献。 Semantic Scholar:一个由 AI 驱动的学术搜索引擎,能够提供相关的文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,帮助提高论文的语言质量。 Quillbot:一个基于 AI 的重写和摘要工具,可以帮助研究人员精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化。 Knitro:一个用于数学建模和优化的软件,可以帮助研究人员进行复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:虽然不是纯粹的 AI 工具,但结合了自动化和模板,可以高效地处理论文格式和数学公式。 Overleaf:一个在线 LaTeX 编辑器,提供丰富的模板库和协作功能,简化论文编写过程。 5. 研究伦理和抄袭检测: Turnitin:一个广泛使用的抄袭检测工具,帮助确保论文的原创性。 Crossref Similarity Check:通过与已发表作品的比较,检测潜在的抄袭问题。 使用这些工具时,重要的是要结合自己的写作风格和需求,选择最合适的辅助工具。
2025-04-13
如何要求AI写一个论文初稿大纲
以下是要求 AI 写一个论文初稿大纲的方法: 1. 确定论文主题:明确研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具搜集相关研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的大纲。 5. 撰写文献综述:借助 AI 工具确保内容准确完整。 6. 构建方法论:根据研究需求,采用 AI 建议的方法和技术设计研究方法。 7. 数据分析:若涉及数据收集和分析,使用 AI 数据分析工具处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具撰写各部分,并检查语法和风格。 9. 生成参考文献:使用 AI 文献管理工具生成正确格式。 10. 审阅和修改:用 AI 审阅工具检查逻辑性和一致性,根据反馈修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具确保原创性,并做最后的格式调整。 需要注意的是,AI 工具只是辅助,不能完全替代研究者的专业判断和创造性思维,使用时应保持批判性思维,确保研究质量和学术诚信。
2025-04-12
我怎么让ai帮我写论文,在我有完整的数据内容和大纲的情况下
以下是在您有完整的数据内容和大纲的情况下,让 AI 帮您写论文的步骤和建议: 1. 确定论文主题:明确您的研究兴趣和目标,选择一个具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎和文献管理软件来搜集相关的研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成论文的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述:利用 AI 工具来帮助撰写文献综述部分,确保内容的准确性和完整性。 6. 构建方法论:根据研究需求,利用 AI 建议的方法和技术来设计研究方法。 7. 数据分析:如果论文涉及数据收集和分析,可以使用 AI 数据分析工具来处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具来撰写论文的各个部分,并进行语法和风格的检查。 9. 生成参考文献:使用 AI 文献管理工具来生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具来检查论文的逻辑性和一致性,并根据反馈进行修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具来确保论文的原创性,并进行最后的格式调整。 需要注意的是,AI 工具可以作为辅助,但不能完全替代研究者的专业判断和创造性思维。在使用 AI 进行论文写作时,应保持批判性思维,并确保研究的质量和学术诚信。 另外,还有一些相关的经验分享: 对于写作与内容创作,先确定一个明确的大主题,再细化出一系列小主题,形成文章大纲,在大纲要点下添加关键词提示。对着文章大纲,挨个语音输出。然后用 AI 组合成完整的文章,在 AI 合并出来的文章里插入一些配图,再稍微修改调整。 对于丰富细化,要让 AI 一段一段进行细节描写。为确保文章前后一致,可先让 AI 帮助写故事概要和角色背景介绍,并在其基础上按自己的审美略做修改。可以让 AI 以表格的形式输出细节描述,这样有打破 AI 叙事习惯、便于局部调整、确保内容具体等好处。 对于串联成文,把生成的表格依次复制粘贴,让 AI 照着写文章。 但也要注意,在修改过程中可能会遇到一些问题,比如某些 AI 模型可能会出现“失忆”等情况,导致修改不符合预期。
2025-04-09
我已经有了论文大纲,需要生成技术路线图,哪个AI可以实现
以下是一些可以帮助您生成技术路线图的 AI 工具和方法: 1. 利用 AI 写作助手生成课题的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 2. 使用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 3. 对于生成“延伸思考”的问题,可以让 AI 根据特定的参照(比如之前的产出或是新增的参考文案)输出具备更高关联度的内容。 4. 可以用同一段提示词对比不同模型的输出,择优深挖。 5. 在满意的内容节点上添加“文本编辑器显示”,对文本进行精加工。 6. 先确定整个调研报告的大纲目录,例如通过手机识别示例报告的目录截图。 7. 让 AI 总结语言风格,如将范文交给 Claude 2 总结语言风格。 8. 让 GPT4 按照目录逐步生成章节内容,设置循环结构,根据情况决定是否调用 webpolit 插件查询相关信息。 9. 在需要搜索网络信息的章节处打上标签,让 GPT4 自主搜索信息再来生成内容。 需要注意的是,AI 工具可以作为辅助,但不能完全替代您的专业判断和创造性思维。在使用 AI 进行相关工作时,应保持批判性思维,并确保成果的质量和学术诚信。
2025-04-08
我需要ai帮助我根据我的大纲生成一篇标准的论文
以下是为您根据大纲生成标准论文的一些建议和参考: 首先,确定论文大纲目录。您可以参考老师提供的示例报告,或者通过手机识别相关截图来获取。 其次,明确整体的语言风格和特色。调研报告通常要求“逻辑清晰、层层递进、条理分明”,您可以将范文提供给类似 Claude 2 的工具来总结语言风格,但注意不要过度限制 AI 的生成,以免影响效果。 然后,让 GPT4 按照目录逐步生成章节内容。可以在 workflow 中设置循环结构,在其生成一段章节内容后,您确认同意再进行下一章节,否则重新生成。在生成内容前,让 GPT4 判断某章节是否需要调用 webpolit 插件查询相关信息。对于需要搜索网络信息的章节,可以打上标签,让 GPT4 自主搜索信息后生成内容。 在写作过程中,您还可以利用以下常见的文章润色 AI 工具来提高论文质量: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,帮助优化文章的语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可根据输入生成符合要求的学术论文。 总之,生成论文需要综合运用各种方法和工具,根据自身需求选择合适的方式,不断优化和完善,以达到标准论文的要求。
2025-03-29
用deep seek撰写出小说大纲之后,怎么给提示词让其一章一章生成
以下是关于用 DeepSeek 撰写小说大纲后,如何给提示词让其一章一章生成的相关建议: 1. 模仿小说家写作:在提示词中描述特定小说家的文风特征,如鲁迅的文风特点等。 2. 控制创作字数:使用 O1 模型对 AI 创作的字数控制有一定效果,也可通过多轮对话让 AI 增删改查来调整字数。 3. 考虑引起共鸣和关注人类共性:用 DeepSeek 写小说要注重这方面,让好文字能引起生理和情绪共鸣。 4. 优化提示词: 模糊指令优化:如将宽泛需求“写小说”修正为“创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构”;将主观表述“写得专业些”修正为“符合 IEEE 论文格式,包含 5 项以上行业数据引用”。 迭代优化法:首轮生成获取基础内容,然后进行特征强化、风格调整和最终校验等步骤。 5. 结合其他模型:写理性文章时,可先与 DeepSeek 讨论思路,再用 Cloud 3.5 批量生成。 需要注意的是,DeepSeek 在写文方面全面领先,但长文会太发散,文风用力过猛,可能导致审美疲劳,且模型多样性不够,相同 prompt 提问多次答案雷同。
2025-03-25
大模型的系统提示词
大模型的系统提示词主要包括以下方面: 1. 在“五津:一键生成‘摸鱼打工猫’视频”中,针对用户选择的主题和回答,总结用户的创作意图,如“打工猫摸鱼的 2 小时,在巴厘岛能看一场日落”,并根据此生成 4 组体现幽默风趣、以宫崎骏风格描绘主角为摸秋刀鱼橘猫的绘图提示词,以数组形式输出到“tishici”,将用户意图输出到“biaoti”。 2. 在“云中江树:智能对决:提示词攻防中的 AI 安全博弈”中,系统提示词的相关防御措施分为输入侧、模型侧和输出侧三个部分。输入侧可进行意图识别、语义匹配等综合判断用户输入是否恶意;模型侧对于有能力的厂商应增强安全性并平衡性能,开发者则要在开发中带着安全意识优化系统提示词,加入安全引导和禁止内容等;输出侧可使用传统防御和内容过滤手段,并针对大模型特点进行私有数据泄露等检查。此外,还提到间接注入和提示词泄露的情况,间接注入常发生在应用获取依赖外部数据资源时,攻击者通过隐藏恶意指令完成攻击;提示词泄露指试图操纵模型输出获取部分或全部系统提示词,大模型输出内容可分为系统提示词、用户提示和助手提示词三段,通过攻击手段可获取系统提示词。
2025-04-18
通义千问Qwen2.5-VL、阶跃星辰step-1.5v-mini、Gemini-2.0-Flash,这3个视觉理解大模型哪个最厉害?
以下是对通义千问 Qwen2.5VL 模型的介绍: 版本:有 3B、7B 和 72B 三个尺寸版本。 主要优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 Qwen 特色文档解析:设计了更全面的文档解析格式,称为 QwenVL HTML 格式,能够精准还原文档中的版面布局。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 然而,对于阶跃星辰 step1.5vmini 和 Gemini2.0Flash 模型,目前提供的信息中未包含其与通义千问 Qwen2.5VL 模型的直接对比内容,因此无法确切判断哪个模型在视觉理解方面最厉害。但从通义千问 Qwen2.5VL 模型的上述特点来看,其在视觉理解方面具有较强的能力和优势。
2025-04-15
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
目前全世界最厉害的视觉理解大模型是哪个
目前在视觉理解大模型方面,较为突出的有 DeepSeek 的 JanusPro 模型,它将图像理解和生成统一在一个模型中;还有通义千问的视觉理解模型,其价格有较大降幅。此外,Pixverse V3.5 是全球最快的 AI 视频生成模型,在某些方面也展现出了出色的能力。但很难确切地指出全世界最厉害的视觉理解大模型,因为这取决于不同的评估标准和应用场景。
2025-04-15
大模型对话产品的优劣
大模型对话产品具有以下优点: 1. 具有强大的语言理解和生成能力。 2. 能够提供类似恋爱般令人上头的体验,具有一定的“想象力”和“取悦能力”。 3. 可以通过陪聊建立人和 AI 之间的感情连接,产品粘性不完全依赖技术优越性。 4. 能够为用户提供产品咨询服务,适用于有企业官网、钉钉、微信等渠道的客户。 5. 具有多种应用场景,如私有领域知识问答、个性化聊天机器人、智能助手等。 大模型对话产品也存在一些缺点: 1. 存在记忆混乱的问题。 2. AI 无法主动推动剧情,全靠用户脑补,导致用户上头期短,疲劳度高,长期留存低。 3. 无法回答私有领域问题(如公司制度、人员信息等)。 4. 无法及时获取最新信息(如实时天气、比赛结果等)。 5. 无法准确回答专业问题(如复杂数学计算、图像生成等)。
2025-04-14
这个网站的作用是什么?是通过这个网站更好的使用训练AI吗?
WaytoAGI 网站具有以下功能: 1. 和 AI 知识库对话:您可以在此询问任何关于 AI 的问题。 2. AI 网站:集合了精选的 AI 网站,可按需求找到适合您的工具。 3. AI 提示词:集合了精选的提示词,能复制到 AI 对话网站使用。 4. 知识库精选:将每天知识库的精华内容呈现给大家。 总之,WaytoAGI 网站和 WaytoAGI 知识库相互独立又有关联,希望成为您学习 AI 路上的好助手。
2025-04-13
想自学ai训练师 推荐哪个视频去学习
以下是为您推荐的自学 AI 训练师的视频: 1. 3 月 26 日|自由讨论|离谱视频切磋大会 猫先生介绍自己的背景和擅长领域 AI 学习与实践的重要性 AI 交流会:分享项目经验和技能 讨论比赛规则和资源分配 AI 工具学习与合作 广州 AI 训练师叶轻衣分享使用 AI 工具的经验和想法 组队提升工作效率 AI 技术在 3D 动画制作中的应用与优势 链接:https://waytoagi.feishu.cn/minutes/obcnc915891t51l64uyonvp2?t=0 2. AI 大神 Karpathy 再发 LLM 入门介绍视频 神经网络训练的目标:训练神经网络的目标是让模型学习 token 在序列中彼此跟随的统计关系,即预测给定上下文(token 序列)后,下一个最有可能出现的 token。 Token 窗口:训练时,模型从数据集中随机抽取固定长度的 token 窗口(例如 8000 个 token)作为输入。 神经网络的输入与输出:输入为 Token 序列(上下文),输出为预测下一个 token 的概率分布,词汇表中每个 token 都有一个概率值。 随机初始化与迭代更新:神经网络初始参数是随机的,预测也是随机的。训练过程通过迭代更新参数,调整预测结果,使其与训练数据中的统计模式相匹配。 损失函数与优化:训练过程使用损失函数来衡量模型预测与真实 token 的差距。优化算法(如梯度下降)用于调整参数,最小化损失函数,提高预测准确率。 神经网络内部结构:Transformer 包含注意力机制和多层感知器等组件,能够有效地处理序列数据并捕捉 token 之间的复杂关系。 链接:无
2025-04-12
想自学ai训练师
如果您想自学成为 AI 训练师,以下是一些相关的知识和建议: 一、AI 训练的基本概念 训练是指通过大数据训练出一个复杂的神经网络模型。这需要使用大量标记过的数据来训练相应的系统,使其能够适应特定的功能。训练过程需要较高的计算性能,能够处理海量的数据,并具有一定的通用性,以便完成各种各样的学习任务。 二、相关领域的知识 1. 机器学习:机器学习是人工智能的一个分支,是实现人工智能的途径之一,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。 2. 自然语言处理:自然语言(NLP)认知和理解是让电脑把输入的语言变成有意思的符号和关系,然后根据目的再处理。自然语言生成系统则是把计算机数据转化为自然语言,是人工智能和语言学领域的分支学科。 三、学习资源和实践 您可以参考以下的一些资源和实践方式: 1. 参加相关的线上交流会,例如 3 月 26 日的自由讨论活动,其中会分享项目经验、技能以及使用 AI 工具的经验和想法。 2. 了解一些健身的 AI 产品,如 Keep(https://keep.com/)、Fiture(https://www.fiture.com/)、Fitness AI(https://www.fitnessai.com/)、Planfit(https://planfit.ai/)等,虽然这些主要是健身领域的应用,但也能帮助您了解 AI 在不同场景中的应用和创新。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-12
怎么用把AI训练成自己的东西?
要将 AI 训练成自己的东西,可以参考以下方法: 1. 像马斯克提到的,对于公开的推文数据可以合理使用,但不能使用私人的东西进行训练。同时,要注重数据的质量和使用方式,高质量的数据对于训练效果至关重要。 2. 张梦飞的方法中,例如部署 LLama Factory 时,需要添加选中“identity”数据集,将训练轮数改成 15 等,并通过一系列操作进行训练和测试。但需要注意的是,训练大模型是复杂的过程,数据集和训练参数都会影响最终效果,需要反复调试和深入学习实践。 3. 在写作方面,我们可以根据自身需求选择人类驱动为主,利用 AI 进行修改完善,或者先由 AI 生成内容再进行修改以符合自己的风格。
2025-04-11
如何训练一个AI 阅读教练
训练一个 AI 可以类比为培养一位职场新人,主要包括以下三个阶段: 1. 规划阶段:明确目标 确定 AI 的具体任务,比如结构化外文精读等。 将任务拆解为可管理的子任务。 设计每个子任务的执行方法。 2. 实施阶段:实战指导 搭建工作流程。 为每个子任务设置清晰的操作指南。 像指导新员工一样,手把手引导 AI 完成任务,并及时验证其输出质量。 3. 优化阶段:持续改进 通过反复测试和调整,不断优化 AI 的性能。 调整工作流程和 Prompt 配置,直到 AI 能稳定输出高质量的结果。 当前大模型在处理多步骤复杂任务时存在明显局限,比如在“数据分析图表、剧情游戏”或“本文结构化外文精读”等任务中,仅依靠单一 Prompt 指令难以稳定执行,现阶段的 AI 更像缺乏独立解决问题能力的职场新人,需要遵循指引和给定的流程才能完成特定任务。如果您已经完全了解上述内容,不妨自己设定一个任务目标,动手构建一个专属于自己的 AI 。
2025-04-11
模型训练的基本名词和方法
以下是关于模型训练的基本名词和方法的介绍: 基本名词: 1. 过拟合&欠拟合:过拟合和欠拟合都是不好的现象,需要加以控制以让模型达到理想效果。解决方法包括调整训练集、正则化和训练参数等,过拟合可减少训练集素材量,欠拟合则增加训练集素材量。 2. 泛化性:泛化性不好的模型难以适应其他风格和多样的创作。可通过跑 lora 模型生图测试判断泛化性,解决办法与过拟合和欠拟合类似,从训练集、正则化、训练参数等方面调整。 3. 正则化:是解决过拟合和欠拟合情况、提高泛化性的手段,给模型加规则和约束,限制优化参数,有效防止过拟合,提高模型适应不同情况的表现和泛化性。 方法: 1. 全面充分采集训练素材:例如在角色训练素材中,应包含各种角度、表情、光线等情况的素材,确保模型具有较好泛化性。 2. 图像预处理:对训练素材进行分辨率调整、裁切操作,并对训练集进行打标签处理。 3. 参数调优:尽量将训练时长控制在半小时左右,过长易导致过拟合,通过调整参数控制时长。 4. 观察学习曲线:通过观察学习曲线来调整训练素材和参数。 5. 过拟合&欠拟合处理:测试训练好的模型,观察过拟合和欠拟合问题,进一步通过调整训练素材和正则化等手段优化。 此外,在模型训练中还需注意: 1. 数据集获取渠道:可通过网上收集、购买、使用无版权问题的如古画等,原则是根据生成图的需求找对应数据集,要清晰、主体元素干净、风格统一。 2. 数据集处理:包括基础处理如裁剪保证清晰和分辨率,更重要的是写标注。 3. 设置模型触发词:可自定义,完整形式可以是一句话,建议以王 flags 模型为主。 4. 统一标注风格与应用场景:例如未来高科技 3D 天然风格,用于互联网首页图像等,并概括主题内容、描述物体特征等。 5. 利用 GPT 辅助描述并人工审核:让 GPT 按要求描述,人工审核修改。 6. 模型训练的准备与流程:完成数据集描述后进入训练流程,选择模型训练分类和数据集,创建并上传数据集压缩包,注意数据名与图片命名一致。选择训练模式和参数,新手选用普通基础模式,训练集质量重要,训练参数中总步数与训练集图片数量相关,触发词设定要避免概念混乱。
2025-04-09
如何用AI写作一本番茄热门网络小说
以下是关于如何用 AI 写作一本番茄热门网络小说的相关内容: 首先,对于将小说做成视频的流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 其次,关于用 AI 写出比人更好的文字: 1. 可以命令模型写一种特殊格式的网络小说,尽量显式地描述想要的东西的特征。 2. 往 prompt 里面塞例子,这是一个暴力但是管用且流行的办法。 3. 运用一些技巧,如给模型一个简单的种子词语,引入随机的、负面的种子,例如“失去”,让 AI 给主角安排坏的命运,使故事更立体、真实、复杂。 4. 从场景出发裂变,如血月降临、电梯卡 bug 等新场景,打破旧有规则与世界。 5. 以现实生活中不存在的假设出发去衍生好看的故事。 6. 利用女频网络小说中常见的梗,如追妻火葬场、先婚后爱等作为种子。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。同时,对于 AI 创作的内容存在不同的看法,但其在写作方面仍有一定的价值和潜力。
2025-04-09
我想生成一个爆款小说描述词
以下是为您生成爆款小说描述词的一些建议: 1. 遵循“形容词+主语+环境+行为+构图+参考风格+渲染程度+后缀”的公式。例如,对人物的描述要包括情绪、发型、穿着等细节,对环境的描写要涵盖天气、地理位置等要素,还要对摄影、灯光和成像质量进行描述,并规定绘图比例。 2. 对于写小说本身,提示词相对简单。但要注意搜索相关思路,用上下文告诉模型需求中的概念含义,并将搜索结果结构化,方便模型理解。 3. 当为儿童创作简单易懂的绘画描述时,要符合逻辑且简单直白,有镜头描述,不增加额外元素。若主体为中国相关,要在描述中提及;未明确古代则默认为现代场景和人物。描述人物要涵盖多个维度,描述场景也要考虑多个方面,且要强调主体。
2025-04-08
ai写小说
以下是关于用 AI 写小说的相关内容: Stuart 分享的用 coze 写起点爆款小说《夜无疆》的工作流: 核心节点包括用 bing 搜索标题相关内容、将搜索结果结构化(此步骤可不熟悉程序的可忽略)、用大模型草拟大纲(标题、主旨、世界观、主要角色、小说背景、情节概要)、再用大模型写文章并输出文章内容。 建议未尝试过用 AI 写小说的同学先自行尝试,再与该工作流的成果进行对比,以获得更多学习和理解。 陈财猫提到的用 AI 写出好文字的技巧: 第一个技巧是“显式归纳与列出你想要的文本特征”,例如明确描述写小说所需的文风、文笔特点,如“几句话一换行”“以短句和对话为主,结构紧凑”“用词直白犀利”等,并在调试过程中适当增减描述,直至得到满意结果。 第二个常用方法是“通过 prompt 中的描述与词语映射到预训练数据中的特定类型的文本,从而得到想要的相似样本”,直接指出所需文本类型常出现的地方,如写充满张力的女性复仇文可指出可能出现在晋江文学城或起点中文网的古代言情分类中。 此外,还有关于 AI 与即兴戏剧工作坊的内容,其中提到现场用肢体语言摆出姿势并用 AI 绘画画出,最后表演即兴剧,使用的工具包括写短篇小说的 midreal.ai (以“即兴喜剧”开头)、AI 绘画的 GPT4/悠船/midjourney 以及 Canva 做的电影格式模板。
2025-03-31
ai写小说prompt
以下是为您提供的关于 AI 写小说 prompt 的相关内容: 1. 一位 17 岁高中生创作的神级 Prompt 强化了 Claude,使其写出了精彩的短篇小说。这篇小说以几封信串起故事,给人带来震撼,让人感受到了 AI 思考力量的强大。 2. 画小二团队在创作《李清照》AI 视频时,对于故事创作的 Prompt 包括:标题、设置、主角、反派角色、冲突、对话、主题、基调、节奏和其它等方面。按照特定模板生成穿越故事的 Prompt 并填充内容,分章节生成小说目录。 3. GPT4 + DALL E 驱动的修仙模拟器游戏的设计思路包括构建游戏故事主线、生成游戏场景 prompt 并调用 Dalle3 绘图,同时要注意与 Dalle 协调以及 prompt 的更新。目前正在进行的理想包括制作 galgame、小程序海龟汤以及梳理 AI 写小说的方法论。该游戏由 EmbraceAGI 开源社区管理,与 LangGPT 为姊妹项目。
2025-03-29
如何用ai创作一部小说,路径是怎样的,需要用到哪些工具
用 AI 创作一部小说通常包括以下路径和可能用到的工具: 路径: 1. 小说内容构思:明确小说的主题、情节、角色等核心要素。 2. 角色与场景设定:细致描绘角色的特点和故事发生的场景。 3. 情节推进与发展:合理安排故事的起承转合,增加冲突和悬念。 4. 语言表达与修饰:使文字生动、准确,富有感染力。 工具: 1. 文本生成工具:如 ChatGPT 等,可辅助生成小说的框架、情节、对话等内容。 2. 图像生成工具:如 Stable Diffusion 或 Midjourney,用于生成角色和场景的视觉描述,帮助激发创作灵感。 如果要将小说制作成视频,还需要以下步骤和工具: 步骤: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)提取关键场景、角色和情节。 2. 生成角色与场景描述:利用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:借助 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整。 9. 输出与分享:完成编辑后,输出最终视频,并在所需平台上分享。 工具及网址: 1. Stable Diffusion:一种 AI 图像生成模型,网址:https://github.com/StabilityAI 2. Midjourney:AI 图像生成工具,网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台,网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能,网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具,网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具,网址:https://www.aihub.cn/tools/video/gushiai/ 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-03-28
ai小说
以下是关于 AI 小说的相关内容: 1. Stuart 分享的用 coze 写起点爆款小说《夜无疆》的工作流: 工作流效果:以起点 Top1 的《夜无疆》为题创作小说,虽未达到小说家水平,但至少达到高中生中不错的水平,是从通常的 AI 写作水平到新级别的质的飞跃,其中思路值得学习。 工作流步骤: 用 bing 搜索标题相关内容。 用程序将搜索结果结构化(不熟悉程序可忽略或复制文中代码)。 用大模型草拟大纲,包括标题、主旨、世界观、主要角色、小说背景、情节概要。 再用大模型写文章。 输出文章内容。 2. AI x 即兴戏剧工作坊: 形式:现场用肢体语言摆出姿势,用 AI 绘画画出,最后表演出一个即兴剧。 使用工具:写短篇小说可用 midreal.ai 以“即兴喜剧”开头,AI 绘画可用 GPT4/悠船/midjourney,Canva 做电影格式模板用于编辑。 3. 全新 AI 整活第六期——DeepSeek 小说家: 要求:以 Deepseek 为工具,反转为主题,在 1000 字短篇小说内挥洒创意。 比赛周期: 开启时间:2025 年 2 月 9 日。 截止时间:2025 年 2 月 16 日晚 8 点。 评选时间:2025 年 2 月 16 日晚 8 点社区直播 AI 评选。 社区共学:时间为 2 月 9 日晚 8 点,地址在通往 AGI 之路视频号解锁 DeepSeek 写小说。 投递传送门:https://pd.qq.com/s/p9z7r8c0?businessType=9 。
2025-03-28