直达「 通往AGI之路 」飞书知识库 →
首页/全部问答
怎么用AI生成视频
以下是使用 AI 生成视频的几种方法: 使用 Adobe 生成视频: 在 Advanced 部分,您可以使用 Seed 选项添加种子编号(https://helpx.adobe.com/firefly/generatevideo/generatevideoclips/generatevideofaq.htmlwhatisaseed),以帮助启动流程并控制 AI 创建的内容的随机性。如果使用相同的种子、提示和控制设置,则可以重新生成类似的视频剪辑。选择 Generate (生成)。 将小说做成视频的流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 使用 Runway 生成视频: 1. 网页:https://runwayml.com/ 2. 注册零门槛:右上角 Sign Up 注册,输入邮箱与基础信息,完成邮箱验证,即可完成注册。 3. 选择 Try For Free 模式:所有新注册用户会有 125 个积分进行免费创作(约为 100s 的基础 AI)。 4. 生成您的第一个视频: 选择左侧工具栏“生成视频”。 选择“文字/图片生成视频”。 将图片拖入框内。 选择一个动画系数。 点击生成 4 秒视频。 下载视频。 成品展示:(https://bytedance.feishu.cn/space/api/box/stream/download/all/ZIK5bRoUQocpQyxWSI4cqvQXnKh?allow_redirect=1)
2025-02-28
国产数字人软件那个好
以下是一些国产数字人软件: 1. UltralightDigitalHuman:超轻量级数字人模型,能实时在低功耗设备上流畅运行,只需 3 5 分钟的视频进行训练。优化的数据流和推理过程确保即时的数字人反应。详细介绍: 2. 腾讯发布的 MimicMotion 项目,支持面部特征和唇形同步,不仅用于跳舞视频,也可应用于数字人。相较阿里的方案,有基于置信度的姿态引导机制、基于姿态置信度的区域损失放大技术、创新的渐进式融合策略等优化。项目地址:
2025-02-28
数字人哪个软件好
以下是一些不错的数字人软件: 1. 剪映数字人“个性化”: 尽管剪映有很多公模数字人,但私模数字人更受欢迎。您可以通过以下步骤实现: 第一步:打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进入程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费。点击红框对应的 URL 打开操作界面。 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 第三步:等待专属数字人视频出炉。 有关数字人使用问题可在评论区留言交流,对数字人课程感兴趣可查看《克隆你自己》课程: ,在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0 。 2. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片,上传后效果在 My Avatar 处显示,点开大图后,点击 Create with AI Studio 进入数字人制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击 Submit 得到数字人视频。 3. DID: 优点:制作简单,人物灵活。 缺点:免费版下载后有水印。 使用方法:点击网址,点击右上角的 Create vedio,选择人物形象,可添加照片或使用给出的人物形象,配音时可选择提供文字选择音色或直接上传音频,最后点击 Generate vedio 生成视频,打开生成的视频可下载或分享。 4. KreadoAI: 优点:免费,功能齐全。 缺点:音色很 AI。 使用方法:点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮可添加背景图,最后点击生成视频。
2025-02-28
tts
语音合成(Text to Speech,TTS)是指将文本通过一系列的信号处理转换成“人造”语音。 技术原理: 1. 文本与韵律分析:先将文本分词,标明每个字的发音以及重音、停顿等韵律信息,然后提取文本的特征,生成特征向量。 2. 声学处理:通过声学模型将文本特征向量映射到声学特征向量。 3. 声音合成:使用声码器将声学特征向量通过反变换生成声音波形,然后依次拼接得到整个文本的合成语音。在反变换过程中,可以调整参数,从而改变合成语音的音色、语调、语速等。 参考资料: 出门问问的语音合成(TTS)API: 接口请求域名:https://open.mobvoi.com/api/tts/v1 接口请求频率限制:5 次/秒 应用场景:在视频 APP 中作为配音解说;小说 App 完成有声阅读,移动 App 语音播报新闻;智能设备语音提醒;车载导航语音合成的个性化语音播报等。 提供多种方言和风格:包括普通话、台湾腔、粤语、四川话、东北话等多种方言,数百个发音人,上千种风格,满足客户在不同场景的选择需求。实时合成支持 SSML,语法详见 SSML 标记语言。 请求参数: HTTP Method:支持 POST 请求 调用参数及说明: 字段名:text,必填,类型为 String,要合成的文本内容,限制为 1000 字符。支持 ssml 标记语言,使用说明见附录 3。 字段名:appkey,必填,类型为 String,开发者在 AI 开放平台上申请的 appkey。 字段名:signature,必填,类型为 String,签名,通过“appkey+secret+timestamp”进行 md5 加密,得到的 32 位 MD5 值。其中加号也参与 MD5 的计算。每次请求实时计算签名,签名有效期为 10 分钟。 字段名:timestamp,必填,类型为 Long,当前时间戳,单位为秒。 字段名:speaker,否,类型为 String,合成音频指定发音人,默认值:cissy_meet,其他发音人传值及计费价格请参考声音商店。 字段名:audio_type,否,类型为 String,合成音频的格式,默认值:mp3,可选值:pcm/mp3/speexwb10/wav,只支持这四种格式中的一种。 字段名:speed,否,类型为 Float,发音人合成的语速,支持小数点后两位,默认值:1.0,可选值:0.5 2.0。 Request Header 设置
2025-02-28
aI 智能体和大模型的区别是什么
AI 智能体和大模型的区别主要体现在以下几个方面: 1. 概念和定位:智能体简单理解就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。大模型是一种技术。 2. 服务对象:大模型是技术,面向用户提供服务的是基于大模型的产品,如智能体。 3. 功能特点:大模型具有强大的语言理解和生成能力,但存在局限性,如无法回答私有领域问题、无法及时获取最新信息、无法准确回答专业问题等。智能体通过集成特定的外部能力,能够弥补大模型的不足,例如实时信息获取、回答私有领域问题等。 4. 应用场景:智能体在 C 端有社交方向,用户注册后捏自己的 Agent 并让其与他人的 Agent 聊天;在 B 端可以帮助商家搭建 Agent。大模型适用于通用的语言处理任务。 5. 开发方式:有专门的智能体开发平台,如字节扣子、腾讯元器等。
2025-02-28
扣子和大模型的区别是什么
扣子是一个 AI 聊天机器人构建平台,如字节推出的 Coze 的国内版“扣子”,主要用于开发下一代 AI 聊天机器人。它具有强大的知识库功能,能帮助上传和存储知识内容,并提供多种查找知识的方法,解决大模型可能出现的幻觉或某些专业领域知识不足的问题。 而 AI 大模型是一种技术,面向用户提供服务的是基于大模型开发的产品。例如,智能体可以被视为基于大模型开发的应用。 在实际应用中,扣子这样的平台能让开发者更便捷地构建和优化智能体,以满足不同场景和用户的需求。
2025-02-28
角色指令设计入门
以下是关于角色指令设计入门的相关内容: SD 角色设计: 绘制一致性多角度头像: 大模型:majicmixRealistic_v6.safetensors 正向提示词:,auburn hair,eyes open,cinematic lighting,Hyperrealism,depth of field,photography,ultra highres,photorealistic,8k,hyperrealism,studio lighting,photography 负向提示词:EasyNegative,canvasframe,canvas frame,eyes shut,wink,blurry,hands,closed eyes,,lowres,sig,signature,watermark,username,bad,immature,cartoon,anime,3d,painting,b&w 参数设置:迭代步数 50,采样方法 DPM++2M Karras,尺寸 1328×800px MJ 手册·快速入门: 角色人物公式:人物姓名(命名)+描述词(重要描述词和人物特征描述词)+风格+官方命令词 3D 公式:主体+描述词(重要描述词和物体特征描述词)+风格+灯光+官方命令词 插画公式:主题描述词语+风格(风格名称或画家)+描述+颜色灯光+官方命令 特定公式: 连续场景变化公式: 1)角色/场景公式:上传图片(喂图)+人物描写(融入其他场景需要关键词 white background,结合场景后换成 walking in a futuristic cyberpunk city)+场景风格描写+官方命令 2)木偶公式:人物图片+场景+人物+动作+风格+官方命令 3)等距粘土公式: 1. 等距+物体+max emoji(表情符号),soft(柔和)lighting soft(柔和光线)pastel colors/pastel background(背景)+3Dicon+clay(粘土)+blender 3d+背景颜色=等距粘土物体 2. 安子布莱斯娃娃/也可以换成其他知道的娃娃名称+灯光/颜色/背景/材质+clay(粘土)+良奈吉友画风/或者其他名人风格=人 4)3D 图标公式(未测试,可用):喂图(1~3 张相似的风格)+描述的 icon(和喂图一致的关键词)+颜色(和喂图颜色一致的)+渲染词+官方命令 通用公式:角色/物体描述+背景描述+灯光风格+官方命令 Midjourney V6 更新角色一致性命令“cref”: 角色参考(或cref)将帮助您在不同图像中获得大致相同的角色,“角色”是指任何类人物形象。cref 参数允许我们根据我们通过 URL 提供的现有角色图像来创建大致相似的角色。 角色属性对于cref 参数效果良好的包括显著的标志性特征,如蓝绿色卷曲头发、粉红色太阳镜、及膝风衣、绿色背包;效果不佳的包括细小的细节,如一个银色吊坠项链,上面有八个小金字塔形宝石,一件左袖缺失的皮夹克,背后写着“ZOOM”,夹克是袖子缺失的设计,两侧夹克缘处有无限符号剃掉的发型。 准确的使用方法可参考频道说明,地址链接:https://discord.com/channels/662267976984297473/1216877089286787222
2025-02-27
比suno更好用的音乐创作工具
目前,Suno 是一款基于人工智能技术的音乐创作工具,其特点包括:无需专业音乐知识,任何人都可用其轻松创作音乐;通过自然语言描述生成旋律、和声、鼓点等音乐元素;支持多种流行音乐风格;提供创作过程的建议和指导;可导出常见音频格式。但它也存在一些不足,如提示词控制方面,除歌词部分外,音乐风格提示词只有 120 个字符,能描述和理解的关键词有限,创作丰富度有限,旋律相对单调。 除了 Suno 之外,还有一些其他的音乐创作工具或相关的人工智能音频初创公司,例如: :前身为‘Definite Technologies’,开发使用 AI 处理/生成声音的 VST/AU/AUv3 插件。 :自适应 AI 音乐平台,通过高质量音频样本进行实时细胞组成。 :基于 AI 的音乐助手,包括歌词写作助手。 :实时音乐、音频和视频创作平台。 :为创意媒体应用提供合成歌声。 :数字宇宙的音乐解决方案,Soundtracks、AI Studio、Music Maker JAM 的制作者。 :AI 音乐创作和制作。 :自由定制高质量免版权费音乐。 :云平台,让音乐人和粉丝在全球范围内创作音乐、协作和互动。 :使用嵌入式软件、信号处理和 AI 帮助艺术家录制、混音和母带处理他们的现场表演。 :开源音乐生成工具。 :旨在通过 AI 赋能真实艺术家的伦理音频 AI 插件、工具和社区,而非取代他们。
2025-02-27
清华大学的deepseek资料
以下是关于清华大学的 DeepSeek 相关资料: 清华大学沈少阳:《 北航&清华大学:《 清华大学新闻与传播学院新媒体研究中心出品的《》,详细阐述了 DeepSeek 的功能,包括智能对话、文本生成、代码生成、自然语言理解等,并探讨了如何使用 DeepSeek,包括推理模型与通用模型的区别、提示语设计策略以及如何从入门到精通。文章还介绍了提示语设计的核心技能、常见陷阱及应对方法,旨在帮助用户更好地掌握 AI 工具的使用,提升工作效率和创新能力。 此外,还有其他一些与 DeepSeek 相关的报告发布在,如: 智灵动力:《》 厦门大学:《》 国海证券:《》 全球数据资产理事会:《》 中泰证券:《》
2025-02-27
AI 提示词网站
以下是一些 AI 提示词网站: AIart 魔法生成器:中文版的艺术作品 Prompt 生成器,网址: IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器,网址: MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分,网址: Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT&Midjourney,网址: img2prompt:根据图片提取 Prompt,网址: PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板,网址: promptoMANIA:AI 艺术提示词生成器,网址: pictionAIry:玩游戏也能练习 Prompt 书写,网址: NovelAI tag 生成器:设计类 Prompt 提词生成器,网址: 魔咒百科词典:魔法导论必备工具,简单易用的 AI 绘画 tag 生成器,网址: KREA:设计 AI 的 Prompt 集合站,create better prompts,网址: Public Prompts:免费的 prompt 合集,收集高质量的提示词,网址: OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便你快速可视化生成自己的绘画提示词,网址: MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用,网址: OpenArt:AI 人工智能图像生成器,网址: AiTuts Prompt:AiTuts Prompt 是一个精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供你选择,网址: AcceleratorI Prompt:AI 词汇加速器,加速 Prompt 书写,通过按钮帮助优化和填充提示词,网址: MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库,网址:
2025-02-27