以下是关于根据文字和场景描述生成图文的方法:
对于儿童绘本制作:
描述故事场景:利用 ChatGPT 或者自行构思一段适合画绘本的故事,分为场景 1/2/3/...,用一句包含环境、人物、动作的话描述每个场景。例如,故事名《Lily 的奇妙之旅》,场景 1 是“Lily 来到一个阳光明媚的森林,跳过清澈的小溪,愉快玩耍。在路上结识了一只友善的棕熊,她们成为了旅伴。”
生成场景图片:确定 prompt,包括场景和风格(一套绘本中风格词语不要改变)。为了使得熊和人物有更好的互动感,生成场景时也包括人物主角。如场景 2 的 prompt 是“Walking in a mysterious cave with glittering gems,little girl Lily wearing a yellow floral skirt,her friend brown bear,dim,dreamlike,super high details,HDsmooth,by Jon Burgerman,s 400niji 5style expressivear 3:4”。抠图时,由于只需要得到一张场景图像,使用 mj 的 region vary 工具将小女孩完全框选,在提示词中完全删除 Lily 的描述词,依次得到各个场景的图像。
对于将小说做成视频:
小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。
生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。
图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。
视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。
音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。
视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。
后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。
审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。
输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。
此外,还有一些创意工具的操作指引:
文生图:仅需输入文本描述,即可一键生成图片素材。操作指引为输入文本描述(关键词或场景描述等)——选择模型(注意 FLUX 模型不可商用)————开始生成——下载。
AI 翻译:支持多语种文本翻译,翻译结果实时准确。操作指引为输入原始文本——选择翻译的目标语言——开始生成。
TikTok 风格数字人:适配 TikTok 媒体平台的数字人形象上线,100+数字人模板可供选择。操作指引为输入口播文案——选择数字人角色——点击开始生成,视频默认输出语言和输入文案语言保持一致,默认尺寸为 9:16 竖版。
多场景数字人口播配音:支持生成不同场景下(室内、户外、站姿、坐姿等)的数字人口播视频。操作指引为输入口播文案——选择数字人角色和场景——选择输出类型——点击开始生成,视频默认输出语言和输入文案语言保持一致。
音频驱动多场景数字人:支持音频和场景数字人一键合成,快速生成数字人口播视频。操作指引为上传音频链接——选择数字人角色和场景——选择输出类型——点击开始生成,音频文件支持 MP3 和 WAV 格式,文件大小上限 5M。
2025-02-10