「AGIへの道」飛書ナレッジベースへ直行 →
ホーム/すべての質問
怎么制作科普视频
制作科普视频可以参考以下步骤和方法: 一、想出点子 1. 最佳免费选项: 2. 付费选项:4.0,但由于与互联网连接,必应可能更好 3. 尽管(或者事实上,由于)它所有的限制和怪异,人工智能是产生想法的完美选择。您通常需要有很多想法才能有好的想法,而人工智能擅长数量。有了正确的提示,您也可以强迫它非常有创意。在创意模式下让 Bing 查找您最喜欢的、不寻常的想法生成技术,如 Brian Eno 的倾斜策略或 Mashall McLuhan 的四种策略,并应用它们。或者要求一些奇怪的东西,比如受随机专利启发的想法,或者您最喜欢的超级英雄。 二、制作视频 1. 最佳动画工具:用于在视频中为人脸制作动画的 2. 最佳语音克隆: 3. 现在,生成一个完全由人工智能生成的角色的视频,阅读完全由人工智能编写的脚本,用人工智能制作的声音说话,由人工智能制作动画,这简直是微不足道的。但要注意深度伪造是一个巨大的问题,这些系统需要合乎道德地使用。 4. 最近还发布了第一个商用文本到视频工具 Runway v2。它创建了 4 秒的短剪辑,更像是对未来发展的展示,但如果您想了解这个领域的未来发展,值得一看。 三、创作科普内容 1. 该场景对应的关键词库(13 个):目标用户、科普内容、生活问题、医疗类型、科普文章、病情症状、通俗性、专业名词、背景资质、权威领域、执业范围、证言人、内容形式。 2. 提问模板(3 个): 第一步,分析不同目标用户对于科普内容的需求(具体解决生活中的什么问题) 第二步,针对某一类人群所偏好的科普内容主题,进行内容撰写。 第三步,根据平台和内容形式进行改写。 四、用 AI 把小说做成视频 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-02-18
怎么用AI画漫画
以下是使用 AI 画漫画的相关内容: 使用 Anifusion 画漫画 局限性:对特定艺术细节的控制有限,生成的艺术作品可能缺乏独特性,需要订阅才能使用高级功能,可能无法完全替代专业级工作的熟练人类艺术家。 定价:提供免费和高级订阅选项。免费层级提供 50 个免费信用点和一个工作空间,适合初学者体验;高级层级每月 20 欧元,包含 10,000 个信用点、无限工作空间、无限漫画生成、多种 LoRA 模型支持,以及新功能的早期访问权限。 步骤: 1. 注册账户:访问 anifusion.ai 并创建一个免费账户以开始使用。 2. 选择布局:从预设计的漫画预设中选择,或使用 Anifusion 的直观布局工具创建您自己的独特布局。 3. 描述页面内容:使用简单的文本提示来描述您漫画中每个页面或面板的内容。 4. 生成 AI 艺术:让 AI 根据您的文本描述生成动漫风格的艺术作品。 5. 优化结果:使用 Anifusion 强大的画布编辑器根据需要优化和调整 AI 生成的艺术作品。 6. 添加文本和效果:添加对话气泡、字幕和视觉效果以完成您的漫画页面。 7. 导出和分享:导出您完成的漫画并与世界分享。您对您的创作拥有完全的商业权利。 借鉴 Sarah Andersen 的风格 主题风格: 1. 通常使用简单的黑白线条作画,配以极富表现力的角色表情。 2. 简洁的线条和明确的轮廓。 3. 黑白色调,偶尔使用强调色。 4. 表情丰富的角色设计。 5. 包含幽默和讽刺元素。 技巧: 1. 在主要描述语后面加上“by Sarah Andersen”或者“style reference Sarah Andersen”。 2. 在提示中加入情感色彩的描述,比如使用“joyful,”“awkward,”或“anxious”等词。 3. 利用cref 命令保持人物的一致性。 应用: 1. 社交媒体上进行漫画创作。 2. 使故事更加生动有趣的插图。 3. 个性化礼物和商品设计(需注意版权问题)。 线稿上色 Midjourney + Stable Diffusion 在学习 AI 绘画这段时间,发现 AI 绘画并不会完全替代设计师,而是可以让出图质量更好,效率更高。比如上面是用 midjourney 生成线稿,PS 稍微做一些修正,再用 controlnet 控制,stable diffusion 上色,多套 AI 组合拳,可以快速生成效果惊艳的图。 1. 线稿产出:mj 关键词:Black and white line drawing illustration of a cute cat cartoon IP character,black line sketch,wearing a fortune hat,wearing a collar around the neck,Carrying a huge bag containing scrolls and ingots,matching rope and straps at his wrists,Chinese element style,popular toys,blind box toys,Disney style,white backgroundniji 5style expressive 2. PS 手动手动重绘错误的地方:有些图出来没有阴影容易飘,可以自己画一个出来。
2025-02-18
AI动画
以下是关于 AI 动画的相关内容: Runway 生成 AI 动画: 使用图片和文字描述功能,将 MJ 生成的图片增加对应的动态描述,输入 Runway,同时增加镜头变换的设置。具体教程可查看。 悦音 AI 配音: 旁白质感有磁性浑厚、大片质感、娓娓道来等。 小白参与制作 AI 动画短片的 SOP 流程: 1. 项目规划:确定短片主题和目标观众,制定详细的制作计划。 2. 剧本创作:编写故事脚本,设计角色和场景以及创意。剧本创作资料:https://waytoagi.feishu.cn/wiki/G11fwW8bmiVLe6kYLgYc2iGin6e ;捏剧本 Bot(捏剧本离谱村专用 https://www.coze.cn/store/bot/7367669913697239052?panel=1&bid=6cs144r404016 ) 3. 分镜头脚本:根据脚本制作分镜头脚本,确定每个镜头的画面和动作。 4. 资源准备:准备动画制作所需的素材,包括背景、角色和音效。 5. 画面图片制作:利用 AI 出图工具,比如通过 ChatGPT、MJ、SD 等工具快速生成高质量的图片。 6. 视频制作:利用 AI 工具制作动画,通过 RUNWAY、Luma、Dreamina 等平台快速生成高质量的动画。 7. 后期剪辑:添加音效、配音和字幕,进行最终的剪辑和合成。 8. 发布和推广:将完成的动画短片发布到各大平台,并进行推广和宣传。 大雷 2 天爆肝 3 分半 AI 动画短片的制作复盘: 在时间和金钱的双重压力下,找到了适合的制作捷径。AI 主要帮忙搞定图和片,其他部分靠人。分工上,大雍负责前期的内容构思和脚本编写,大雷主要负责图片、视频生成和视频剪辑。Midjourney 提示词主要围绕皮克斯、迪士尼、3D 风格来写,例如:"a small white Chiense dragon,anthropomorphic,Smile with surprise,wearing a school uniform,looking at a blurry gift box in the foreground,super closeup shot,camera focus on his face,3D render,Unreal Engine,Pixar 3D style,blurry classroom scene,bright sunshinear 16:9niji 6"。重点是"a small white Chiense dragon,anthropomorphic,3D render,Unreal Engine,Pixar 3D style",尺寸比例 16:9,模型选择 niji 6,其他根据需求调整。动画主要用的是 Runway,因为看中它的控制笔刷。
2025-02-18
agent训练
在人工智能领域中,AI Agent 的训练具有以下特点: 传统强化学习中,Agent 训练往往需大量样本和时间,且泛化能力不足。 为突破瓶颈,引入了迁移学习:通过促进不同任务间知识和经验迁移,减轻新任务学习负担,提升学习效率和性能,增强泛化能力,但当源任务与目标任务差异大时,可能无法发挥效果甚至出现负面迁移。 探索了元学习:核心是让 Agent 学会从少量样本中迅速掌握新任务最优策略,能利用已有知识和策略调整学习路径适应新任务,减少对大规模样本集依赖,但需要大量预训练和样本构建学习能力,使开发通用高效学习策略复杂艰巨。 时间:21 世纪初至今 特点:迁移学习是将一个任务学到的知识迁移到其他任务;元学习是学习如何学习,快速适应新任务。 技术:迁移学习如领域自适应;元学习如 MAML、MetaLearner LSTM。 优点:提高学习效率,适应新任务。 缺点:对源任务和目标任务的相似性有一定要求。 此外,智谱 AI 开源的语言模型中与 Agent 相关的有: AgentLM7B:提出了 AgentTuning 方法,开源了包含 1866 个高质量交互、6 个多样化真实场景任务的 Agent 数据集 AgentInstruct,基于上述利用 Llama2 微调而成,上下文 token 数为 4K。 AgentLM13B:上下文 token 数为 4K。 AgentLM70B:上下文 token 数为 8K。
2025-02-18
AI 动漫
以下是为您整理的关于 AI 动漫的相关内容: Anifusion: 网址:https://anifusion.ai/ ,Twitter 账号:https://x.com/anifusion_ai 特点:基于人工智能的在线工具,能帮助用户轻松创建专业质量的漫画和动漫作品,即使无绘画技能,输入文本描述即可转化为漫画页面或动漫图像。 主要功能: AI 文本生成漫画:根据输入的描述性提示生成漫画页面或面板。 直观的布局工具:提供预设模板,也可自定义漫画布局。 强大的画布编辑器:在浏览器中直接优化和完善生成的艺术作品。 多种 AI 模型支持:高级用户可访问多种 LoRA 模型实现不同风格和效果。 商业使用权:用户对创作作品拥有完整商业使用权。 使用案例:独立漫画创作、快速原型设计、教育内容创作、营销材料制作、粉丝艺术和同人志创作。 优点:非艺术家也能轻松创作漫画;基于浏览器的全方位解决方案,无需安装额外软件;快速迭代和原型设计能力;拥有创作的全部商业权利。 MewXAI: 网址:https://www.mewxai.cn/ 功能介绍: MX 绘画:拥有众多超火模型和上百种风格,支持文生图、图生图。 MX Cute:自研的可爱风动漫大模型,融合想象力和逻辑性。 MJ 绘画:创意度和想象力极高,适用于多种创作。 边缘检测:对草图上色,有多种渲染风格可选。 室内设计:上传空间图,完成多种不同风格的室内/建筑设计。 姿态检测:精准控制人物动作,可生成单人或多人姿势。 AI 艺术二维码:几秒内创建令人惊叹的下一代艺术二维码。 AI 艺术字:把光影文字、隐藏文字、艺术字融入艺术作品。 Niji V5: 相关文章:,原文地址:https://www.163.com/dy/article/I2A75HES05316KSS.html 特点:Midjourney 的动漫专用模型,擅长创建动态和动感十足的镜头,注重角色和构图,图像质量高,在动画方面表现出色。 提示制作:制作迷人的 Midjourney 提示对于制作出色的动画至关重要,了解相关流派关键词和艺术家姓名能提升体验。
2025-02-18
rag
RAG(RetrievalAugmented Generation,检索增强生成)是一种结合检索和生成能力的自然语言处理架构。 通用语言模型通过微调可完成常见任务,而更复杂和知识密集型任务可基于语言模型构建系统,访问外部知识源来实现。Meta AI 引入 RAG 来完成这类任务,它把信息检索组件和文本生成模型结合,可微调且内部知识修改高效,无需重新训练整个模型。 RAG 接受输入并检索相关支撑文档,给出来源,与原始提示词组合后送给文本生成器得到输出,能适应事实变化,让语言模型获取最新信息并生成可靠输出。 大语言模型(LLM)存在一些缺点,如无法记住所有知识尤其是长尾知识、知识易过时且不好更新、输出难以解释和验证、易泄露隐私训练数据、规模大导致训练和运行成本高。而 RAG 具有数据库存储和更新稳定、数据更新敏捷且不影响原有知识、降低大模型输出出错可能、便于管控用户隐私数据、降低大模型训练成本等优点。 在 RAG 系统开发中存在 12 大痛点及相应的解决方案,旨在帮助理解设计和实施 RAG 系统面临的复杂挑战,激发开发更强大且适用于生产环境的 RAG 应用。
2025-02-18
pytorch
PyTorch 是由 Facebook 的人工智能研究团队开发的深度学习库,以其灵活性和易用性而闻名,特别适合研究和快速原型开发。 在本地安装 ComfyUI 时,安装 PyTorch 有以下步骤: Windows 用户:建议在有 NVIDIA 显卡的电脑上使用。首先下载 Miniconda3,然后输入相应命令安装 Miniconda3,最后安装 PyTorch 的 nightly 版本。 Mac 用户:安装需要根据电脑的芯片不同输入不同的代码。首先下载 Miniconda3,然后输入相应命令安装 Miniconda3,最后不管是 M 芯片还是 x86 都复制相应代码到 Terminal 进行安装。 在 Python 的应用中,PyTorch 在深度学习方面发挥着重要作用。 从生成式 AI 季度数据报告 2024 年 1 3 月来看,2023 年 4 月 PyTorch 以 531.0 万的访问量位居第一,占赛道月总访问量的 27.8%;2024 年 3 月,PyTorch 以 379.0 万的访问量继续保持第一,占赛道月总访问量的 18.1%。近一年赛道单月访问量增加了 190.0 万,年增长率为 9.9%,但 PyTorch 的访问量减少了 152.0 万。
2025-02-18
现在大语言模型的跑分对比
对比不同大语言模型的性能需要考虑多个维度,包括但不限于以下方面: 1. 理解能力:评估对语言的语法、语义、上下文和隐含意义的理解程度。 2. 生成质量:检查生成文本的流畅性、相关性和准确性。 3. 知识广度和深度:掌握广泛主题的知识程度,以及对特定领域或话题的理解深度。 4. 泛化能力:处理未见过的任务或数据时的表现。 5. 鲁棒性:应对错误输入、对抗性输入或模糊不清指令的能力。 6. 偏见和伦理:生成文本时是否存在偏见,是否遵循伦理标准。 7. 交互性和适应性:在交互环境中的表现,包括对用户反馈的适应性和持续对话的能力。 8. 计算效率和资源消耗:考虑模型大小、训练和运行所需的计算资源。 9. 易用性和集成性:是否易于集成到不同应用和服务中,提供的 API 和工具的易用性。 为了进行有效的比较,可以采用以下方法: 1. 标准基准测试:使用如 GLUE、SuperGLUE、SQuAD 等标准的语言模型评估基准,它们提供统一的测试环境和评分标准。 2. 自定义任务:根据特定需求设计任务,评估模型在特定领域的表现。 3. 人类评估:结合人类评估者的主观评价,特别是在评估文本质量和伦理问题时。 4. A/B 测试:在实际应用场景中,通过 A/B 测试比较不同模型的表现。 5. 性能指标:使用准确率、召回率、F1 分数、BLEU 分数等性能指标来量化比较。 当前领先的大型语言模型的排行榜,例如聊天机器人竞技场,由伯克利的团队管理,根据 ELO 评级对不同语言模型进行排名,计算方式与国际象棋中的类似。在排行榜中,顶部多为专有模型,下方有开放权重的模型。 大语言模型的特点包括: 1. 架构:有 encoderonly、encoderdecoder、decoderonly 等,如 BERT 是 encoderonly 模型,google 的 T5 是 encoderdecoder 模型,众多 AI 助手多为 decoderonly 模型。 2. 数据和参数:预训练数据量大,往往来自互联网,包括论文、代码、公开网页等,参数多,如 OpenAI 在 2020 年发布的 GPT3 已达到 170B 的参数。
2025-02-18
现在大语言模型的跑分对比
对比不同大语言模型的性能需要考虑多个维度,包括但不限于以下方面: 1. 理解能力:评估对语言的语法、语义、上下文和隐含意义的理解程度。 2. 生成质量:检查生成文本的流畅性、相关性和准确性。 3. 知识广度和深度:掌握广泛主题的知识程度,以及对特定领域或话题的理解深度。 4. 泛化能力:处理未见过的任务或数据时的表现。 5. 鲁棒性:应对错误输入、对抗性输入或模糊不清指令的能力。 6. 偏见和伦理:生成文本时是否存在偏见,是否遵循伦理标准。 7. 交互性和适应性:在交互环境中的表现,包括对用户反馈的适应性和持续对话的能力。 8. 计算效率和资源消耗:考虑模型大小、训练和运行所需的计算资源。 9. 易用性和集成性:是否易于集成到不同应用和服务中,提供的 API 和工具的易用性。 为了进行有效的比较,可以采用以下方法: 1. 标准基准测试:使用如 GLUE、SuperGLUE、SQuAD 等标准的语言模型评估基准,它们提供统一的测试环境和评分标准。 2. 自定义任务:根据特定需求设计任务,评估模型在特定领域的表现。 3. 人类评估:结合人类评估者的主观评价,特别是在评估文本质量和伦理问题时。 4. A/B 测试:在实际应用场景中,通过 A/B 测试比较不同模型的表现。 5. 性能指标:使用准确率、召回率、F1 分数、BLEU 分数等性能指标来量化比较。 当前领先的大型语言模型的排行榜,例如聊天机器人竞技场,由伯克利的团队管理,根据 ELO 评级对不同语言模型进行排名,计算方式与国际象棋中的类似。在排行榜中,顶部多为专有模型,下方有开放权重的模型。 大语言模型的特点包括: 1. 架构:有 encoderonly、encoderdecoder、decoderonly 等,如 BERT 是 encoderonly 模型,google 的 T5 是 encoderdecoder 模型,众多 AI 助手多为 decoderonly 模型。 2. 数据和参数:预训练数据量大,往往来自互联网,包括论文、代码、公开网页等,参数多,如 OpenAI 在 2020 年发布的 GPT3 已达到 170B 的参数。
2025-02-18
deepseek
DeepSeek 是一家具有独特特点和影响力的公司: 1. 秘方是硅谷味儿的:将其比喻成“AI 界的拼多多”是偏颇的,其在 2024 年 5 月发布的 DeepSeekV2 以多头潜在注意力机制(MLA)架构创新在硅谷引发轰动,而在国内被描摹成“大模型价格战的发起者”,这体现了其与硅谷更有对话和交流的密码。 2. V3 可能是 DeepSeek 的 GPT3 时刻:若真是如此,未来充满未知,但 DeepSeek 作为中国最全球化的 AI 公司之一,赢得全球尊重的秘方也是硅谷味儿的。 3. 一个提示词能让 DeepSeek 能力更上一层楼:通过 Coze 做效果对比测试,使用方法包括搜索 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 DeepSeek 等。其设计思路包括将 Agent 封装成 Prompt 并储存、实现联网和深度思考功能、优化输出质量等,还采用 XML 进行规范设定。特别鸣谢李继刚和 Thinking Claude 等提供的帮助和灵感。
2025-02-18